Tesauros e Internet

É duro para mim, que escrevi meu TCC exatamente exaltando que o tesauro seria uma ferramenta importante para o desenvolvimento futuro da Web, admitir que o uso de tesauro é inviável para organizar documentos na Web (Web, não em bibliotecas).

Tenho que admitir o maior erro que fiz durante o trabalho: acreditar que o futuro seria linear, isto é, acreditar que o que surgisse de novo não atrapalharia o desenvolvimento que estava em curso. E o novo surgiu durante o trabalho e não depois… mas na época optei por não falar de folksonomias, e hoje reconheço o erro.

O lado bom de tudo isso é saber que apesar da inviabilidade atual, os princípios fundamentais dos tesauros como o estabelecimento de relações entre termos será algo muito importante. O tesauro então não morreu, apenas sofrerá mutações que o tornarão irreconhecível para os bibliotecários mais antigos, mas que o tornará uma ferramenta muito útil.

Como?

Imaginem em e-commerce: Vc quer comprar uma câmera digital. O fabricante poderia disponibilizar um arquivo com todas as especificações em formato legível por máquinas. Esse arquivo poderia ser relacionado com gateways (termos de tesauros), que devem estar descentralizados e conectados com outros gateways de descrição por meio de relacionamentos que devem estar em formato legível por máquinas, como por exemplo um gateway chamado “3.1 MP”. Assim, outras câmeras estariam relacionadas a esse gateway e vc poderia com um click, obter todas as informações, tabelas comparativas e outros dados sobre todas as câmeras digitais que tem a resolução de 3.1 MP, e ainda, como o 3.1 MP poderá estar relacionado com um maior, como 7.1 MP, seria possível comparar outros modelos melhores e perceber que compensa comprar uma melhor. Tudo isso sem ter que entrar em site por site de fabricante ou obter informações incompletas em sites de e-commerce. Fora as comparações de preços (em toda a web e não apenas em alguns sites)

Fora as aplicações em relação a web científica…

Para tanto, ainda falta flexibilizar as normas de tesauros (mesmo as já flexibilizadas como o SKOS) e ainda, desenvolver um sistema aberto para manipular todas as relações possíveis. Com certeza vai demorar muito, e quem sabe ainda pode aparecer alguma coisa nova e mudar tudo de novo.. hehehe

Os nomes de futuros bibliotecários mais bizarros conforme a lista do ENADE

Logicamente, eu não posso falar dos outros com um nome como o meu, mas talvez por isso mesmo, vamos nos divertir um pouco. (colegas citados não se sintam ofendidos, é apenas um levantamento de cunho biblioteconômico…)

ABELANDIA MARIA
ABSON SANY
ADEILDNA
AIRTIANE FRANCISCA
ALA DE JESUS SACRAMENTO
ANDRELINO DA SILVA
ARILMES
BAURILENE
BELIJANE
CAACI (Seria Centro Acadêmico de Arquivologia e CI?)
CÁLICA ANANIAS
CAUÊ MARURI DALLE MOLLE
CELANDRO
CHERLLS GARDENIA
CLAUDEVANE NERIS
COMLAN MARCELINO
CRISELEN JARABIZA
DEUSILENE
DEUSIMÁ
ESTELAMAR
ETCHEILE
GEDEÃO ESCÓSSIA
JOELKSON
JOHN KENEDY
LITYERSSE JESUINO
OGNA
OSMÉLIA OLINDA
RITCHELLY
ROXANA MARIA
SERVULO
ULANA MARIA
USTANA
WALGNEIA
WILLIAM HELMUT
YOHRRANNA KELLY
ZEANIEIDE MARIA
ZIZIL ARLEDI

Bibliotecas Digitais e a visualização das informações

Uma das principais barreiras para o acesso a Bibliotecas Digitais é o modelo adotado para a visualização das informações.

O modelo está baseado em recuperação das informações, através de texto completo ou por catálogo (metadados). Porque não funciona?
O Alain Jacquesson diz que o problema é que as Bibliotecas Digitais estão baseadas nos modelos dos já complicados cátalogos.
E além disso, as bibliotecas digitais são sistemas de informação limitados e normalmente frustarão qualquer usuário, pois fatalmente não possuem as respostas para tudo.

Qual a solução?

Não há uma solução, mas há idéias interessantes. O Figoblog, no post Il y a un livre dans mon moteur propoe a adoção de “ferramentas de consulta” para bibliotecas digitais ao invés de motores de busca.
Ele diz assim:

Pour moi un outil de consultation de bibliothèque numérique devrait se constituer de plusieurs couches qui, loin de s’opposer, se combinent. Parmi elles

  • une couche de butinage (par carte, par thème ou par facettes)
  • une couche qui exploite toute la richesse des données structurées
  • une couche de fouille au coeur du texte.
  • Fica bem complicada uma tradução, mas seria algo como no primeiro caso uma lugar para procura, outro para explorar a riqueza dos dados estruturados e outro para explorar o coração do texto.

    Pelo visto, cada vez mais as perspectivas estão se abrindo positivamente para o desenvolvimento de Bibliotecas Digitais efetivamente úteis.

    Mas ainda há a necessidade de muita pesquisa em relação a visualização de grandes quantidades de informações em bibliotecas digitais

    Referências

    JACQUESSON, Alain. De la difficulté à utiliser les bibliothèques numériques. Bulletin d’informations nº188, 3e trimestre 2000. Association des Bibliothécaires Français: Paris, 2000.

    ———————————————————–

    Acabei de ler uma matéria chamada: 18 razões por que as tecnologias falham e tem muitas que se aplicam a Bibliotecas Digitais como:

    1) Não funcionam (ou não funcionam bem)
    2) São vendidas em excesso
    3) Não são confiáveis
    4) Falham em atingir massa crítica
    5) São lançadas precocemente
    6) São lançadas tardiamente
    7) Demandam vastos investimentos
    8) Caem em desuso rapidamente
    9) São deficientes em sua visão comercial
    10) Falham em ganhar momento no mercado
    11) São superadas logo por outro produto
    12) Não são práticas
    13) Falham em estabelecer um padrão
    14) Falham em atender aos padrões emergentes
    15) Têm design fraco
    16) Arrastam legados
    17) Ficam famosas por seus problemas
    18) Não atendem a reais necessidades

    Organização da Informação: princípios e tendências

    A Editora Briquet de Lemos acaba de lançar a obra: Organização da Livro - Kuramotoinformação: princípios e tendências, organizado por Madalena Martins Lopes Naves e Hélio Kuramoto. Custa R$ 25,00 e contém:

    Os sentidos da leitura e a subjetividade, Lígia Maria Moreira Dumont

    Leitor-bibliotecário: interpretação, memória e as contradições da intersubjetividade em processos de representação informacional, Maria Aparecida Moura

    A importância de Ranganathan para a organização do conhecimento, Madalena Martins Lopes Naves

    Um olhar sobre representações no universo do conhecimento: o caso das micro e pequenas empresas, Maria Eugênia Albino Andrade

    Organização do conhecimento no contexto de bibliotecas tradicionais e digitais, Eduardo Wense Dias

    Organização da informação nas bibliotecas digitais, Lídia Alvarenga

    Organização da informação para sistemas de hipertextos, Gercina Ângela Borém Lima

    Sintagmas nominais: uma nova abordagem no processo de indexação, Hélio Kuramoto

    Mais informações sobre o livro e como comprar, no blog do Kuramoto.

    Eu já pedi o meu, espero que chegue rápido 😉

    A teoria da recuperação da informação utilizando Vocabulários Controlados

    Para quem se interessa por tesauros e vocabulários controlados, o Alistair Miles acaba de disponibilizar a sua dissertação “Retrieval and the Semantic Web” , cujo enfoque é a Recuperação da Informação utilizando Vocabulários Controlados.

    Além disso, há outras novas publicações sobre o tema como: a Revista DataGramaZero de Agosto, e a New Review of Hypermedia and Multimedia.

    Organização das informações em blogs – 2

    No post organização da informação em blogs , listamos e descrevemos os principais tipos de sistemas de organização utilizados em blogs. Agora o objetivo é fazer uma reflexão sobre a organização de informações em blogs.

    A organização de conteúdos em blogs não é feita naturalmente. O objetivo do blog é comunicar e seu principal atrativo é a qualidade de suas informações. Mas então, por que organizar?

  • Um blog organizado potencializa a divulgação de suas informações, pois se tornam mais facilmente encontráveis. (Alguém se lembra de “livros são para serem usados”? 😉 )
  • É uma forma de demonstrar que os leitores são pessoas importantes para o blog, e por isso há um trabalho em facilitar a vida deles. (“Poupe o tempo do leitor” 😉 )
  • O blog está em constante crescimento ( 😉 )
  • Parando de brincar com o Ranganathan , mas levando em consideração o que ele disse , podemos perceber que princípios do que ele disse não somem, mas as técnicas para isso sim. Como já dissemos, seria um erro muito grande aplicar as técnicas da biblioteconomia em blogs, mas os princípios da biblioteconomia podem ser bem úteis.

    Um bom método para o criar de um blog organizado é descrever características do publico alvo e criar um sujeito fictício com essas características, e fazer um pequeno teste de como o seu blog deveria funcionar para ele:

    O leitor que visita pela primeira vez o blog: Leitores só visitam blogs por indicação ou porque chegaram através de ferramentas de busca. Se ele chegou por indicação (posts ou links em outros blogs), ele está disposto a conhecer o que o blog tem a oferecer a ele. Além de posts interessantes, uma descrição (sobre) pode ser útil para ele identificar sobre o que fala o blog e para que tipo de pessoas ele foi criado (publico alvo, se houver), uma listagem dos últimos posts pode ser útil para ele saber “o que tá rolando…”, as categorias e a nuvem de tags podem ser úteis para demonstrar o conteúdo total do blog de forma condensada, e listagens de posts mais lidos ou mais comentados demonstra o Zeitgeist do blog. Para o leitor que chegou pela busca, as informações listadas acima servem para chamar a atenção para os outros conteúdos do blog (lembrem se, ele está visualizando somente um post). E além disso, é possível incluir ferramentas que possibilitam demonstrar posts relacionados ao tema que ele busca e também possibilitar ao leitor usar a sua tag como um ponto de acesso para outras tags idênticas através de serviços como o technorati.

    O leitor que visita constantemente: Leitor que visita constantemente tem o seu link direto. O interessante para ele é saber as novidades, o que ele perdeu desde a última visita. É isso que devemos oferecer, e algumas ferramentas interessantes é a listagem dos últimos posts e comentários. Além disso, para ele é interessante a caixa de busca dentro do site e as categorias e tags, pois as vezes ele está interessado em algo que ele leu aqui e não se lembra bem como era. E ter a preocupação de verificar o funcionamento da ferramenta de RSS e se possível oferecer a possibilidade dele receber os posts por e-mail (há sites que oferecem esse serviço como o FeedBurner e o FeedBlitz )

    O leitor blogueiro: Esse deve ser o leitor mais bajulado 😉 . Mas como facilitar a vida dele? Além das ferramentas anteriores, uma que ajuda bastante é a descrição de metadados do blog. Ela não auxilia muito para melhorar os resultados de busca, mas ajuda bastante pois essas informações são incluídas no RSS, que então o blogueiro importará esses dados de maneira mais simples. Além disso, ela ajuda na uniformização da descrição do seu blog publicados em outros blogs. Outra ferramenta é disponibilizar permalinks (links permanentes), a maioria dos softwares atuais permite isso, mas isso vale uma avaliação caso o seu software não permita. Além disso, não custa nada postar o link de outros blogs no seu (é claro que deve ser feita uma seleção em relação à qualidade)

    Além dos usuários, uma informação que ficou jogada lá em cima deve ser levada em consideração: O blog está em constante crescimento. Portanto, é fundamental prever o comportamento do blog em caso de muitos posts e também tomar cuidados em relação a organização em cada post, para que não se tenha que revisar a organização no futuro.

    Há a possibilidade também de utilizar técnicas complexas da biblioteconomia para auxiliar na organização dos blogs como a Classificações Decimais ou os Tesauros. É claro que podem ser úteis, mas só bibliotecários se disporiam a fazer isso e mais importante, é necessário avaliar se vale a pena a relação custo / benefício desse tipo de organização.

    Acho que essa é uma pequena tentativa de demonstrar como o conhecimento da biblioteconomia pode ajudar na organização de sistemas de comunicação.

    Leia também, um ótimo artigo sobre erros de usabilidade que devem ser evitados: Errores de usabilidad em Blogs

    E uma outra dica presente no Veaseademás:

    La web es un espacio social antes que tecnológico.

    Organização das informações em blogs

    A organização das informações em blogs é um caso particular devido a sua própria natureza. Os blogs são ferramentas de editoração de sites que utilizam como principal meio de informação os posts. Os posts são informações criadas pelos autores, mas utilizam uma forma de comunicação mais condensada, espontânea e informal. Portanto, não é possível utilizar os sistemas de organização que estamos acostumados a utilizar em bibliotecas. Então, quais são os sistemas de organização utilizados em blogs?

  • Ferramentas presentes em todos os blogs:
    • Ordenação cronológica: O sistema de ordenação mais fácil de identificar em um blog é a ordenação cronológica. Praticamente todos os principais blogs utilizam a ordem cronológica na tela principal para apresentar os seus posts.
    • Busca em texto completo por palavras: As principais ferramentas de publicação de blogs apresentam uma busca simples por palavras. Esse sistema utiliza os textos completos para encontrar as palavras similares dentro dos posts. Sinceramente, considero esse sistema pouco utilizado por visitantes, mas é um item essencial pois disponibiliza a possibilidade de criação de pontos de acesso para cada palavra dentro dos posts. E além disso, possibilita a utilização da lógica booleana.
    • Indexação em máquinas de busca: Os principais sistemas de blogs utilizam bases de dados que são facilmente indexadas por máquinas de busca. Esse normalmente é o principal ponto de acesso ao blog. O grande problema dele é que ele indexa por importância e não por ordem cronológica e o acesso é por similaridade de palavras. Isso pode dar problemas como: O autor do blog criou um post sobre um determinado assunto, mas recebeu alguns comentários ou novas informações e por isso criou um novo post, agora mais completo sobre o assunto. O usuário que acessar por meio de ferramentas de busca normalmente irá encontrar o post anterior, que está indexado a mais tempo e pode ter recebido comentários e links de outros blogs e por isso estar melhor rankeado e por isso não encontrar os posts mais recentes. A solução para esse caso é difícil, e ao meu ver, depende do autor fazer uma remissiva (link) no primeiro post para os posts mais recentes.
  • Outras ferramentas para organização da informação em blogs:
    • download Pulse 3

    • Categorização: Criação de categorias para os conteúdos dos posts. A diferença nesse caso entre a classificação de bibliotecas e a utilizada em blogs é que enquanto as bibliotecas utilizam uma classificação criada anteriormente, os blogs vão criando a estrutura de classificação conforme crescem. É claro que essa estrutura apresenta problemas como a não revisão dos posts anteriores a cada criação de categoria, pois pode acontecer de uma nova categoria abranger assuntos já abordados. E além disso, as categorias podem ser organizadas em ordem hierárquicas. E uma “novidade” e a visualização de nuvens de categorias por peso, salientando as categorias com mais posts das demais.
    • Folksonomia: A utilização de etiquetas (ou tags) para a descrição dos conteúdos dos posts é chamado de folksonomia. As tags são mais informais do que as categorias, mas apresentam o mesmo princípio. A vantagem das tags é a possibilidade de criação de um link automático para quaisquer posts de qualquer blog que utilizam as mesmas tags. Nesse caso, o sistema de tags funciona como um gateway (ponto de acesso ou porta de acesso). As tags possibilitam a visualização da totalidade do conteúdo descrito nessas palavras por meio de nuvem de tags. Elas podem ser ordenadas alfabeticamente (ascendente ou descendente), ou por peso (quantidade de vezes que aparecem) e ainda há um estudo interessante de como melhorar a visualização de nuvem de tags feito por Yusef Hassan Montero. Além disso, poderemos criar buscas específicas para tags, o que pode eliminar bastante ruído na busca. No blog Deakialli há um post interessante sobre a automatização de tags.
    • Outros tipos de ordenação: Outros tipos de ordenações podem ser utilizadas como um pontos de acesso a blogs como posts mais acessados, mais comentados, ou no nosso caso específico, estamos utilizando um sistema de rankeamento que permite aos leitores votarem nos posts e por isso dá para ordenar por maiores notas

    E como sempre: Alguém conhece mais alguns tipos de ferramentas para organização da informação em blogs?