A contribuição dos Tesauros na Organização do Conhecimento

Está disponível no RABCI

o interessante trabalho de José Batista Apolinário: A contribuição dos Tesauros na Organização do Conhecimento.

Resumo:

Pesquisa documental que aborda os tesauros e a sua importância na organização do conhecimento, por contribuírem no tratamento e recuperação da informação. Evidencia a importância de seu uso por indexadores em sistemas de informação. O trabalho está embasado na revisão de literatura. A pesquisa teve como objetivo enfatizar a importância dos tesauros na organização do conhecimento, sendo assim apresentou as linguagens documentárias, mostrando a importância da linguagem natural e da linguagem controlada, a contribuição dos sistemas de classificação no tratamento da informação e a contribuição da terminologia na construção de tesauros. Conclui evidenciando a importância dos tesauros na organização do conhecimento e finaliza com a apresentação de alguns tesauros eletrônicos nacionais.

Nova versão do TemaTres disponível: 0.96

Uma nova versão do TemaTres (software de gestão de linguagens documentárias) está disponível para download. A nova versão inclui funcionalidades estruturais importantes como:

1. Buscas expandidas (exemplo)

2. Funcionalides de armonização de vocabulários (exemplo)

Conheça mais sobre o TemaTres e faça o download aqui.

Software criado por Diego Ferreyra, responsável tb pelo R020 Bibliotecología y Ciencias de la información

Receita de Web Semântica para uso em Bibliotecas Nacionais

Por Figoblog:

Você vai precisar de:

– 2 kg de indentificadores permanentes (as URIs, de preferencia agradáveis, darão um sabor melhor)
– um bom bocado de vocabulários controlados (poderão ser usados vários)
– uma pitada de interfaces de busca.
– temperos : os FRBR, as notas bibliográficas, Dublin Core, RDF e outros a seu gosto.

Leia mais em “Recette du Web sémantique à l’usage des bibliothèques nationales”

O uso de vocabulários no RABCI

Complementando a discussão iniciada no post Overdose de Folksonomias. Vou descrever um pouco como foi a utilização de vocablários no RABCI.

Primeiro, devo admitir que utilizar o Drupal facilitou muito as coisas, pois ele é um CMS (Sistema de Gerenciamento de Conteúdos) totalmente integrado ao que eles chamam de taxonomias (um pouquinho diferente só do que a gente entende por taxonomia).

O Drupal permite criar vários tipos de conteúdos e vários tipos de vocabulários, combinar o uso entre eles e ainda criar diversos tipos de visualização para cada um deles.

Por exemplo, no caso dos trabalhos acadêmicos, que são cadastrados no tipo thesis (em inglês, porque já estava como tipo definido), a descrição é feita por dois tipos de vocabulários, um controlado (o JITA) e um não tão controlado assim (não ousaria chamar de folksonomia porque é um campo estruturado do conhecimento, mas que é definido pelo usuário.). O JITA (traduzido para o português) é um vocabulário criado para a descrição dos conteúdos do E-LIS e é controlado e de preenchimento obrigatório. O usuário também é obrigado a preencher o assunto como palavras-chave de descrição, mas de maneira não controlada, mas tentando eliminar algumas ambiguidades com a sugestão de termos já existentes para a descrição.

Com isso, incluimos dois tipos de sistemas para descrever um conteúdo, permitindo a quem consultar o RABCI, consultar das seguintes maneiras: um quase ABNT (quase pq ainda não está totalmente formatado), Tabelas (uma outra forma de visulizar os trabalhos, mas que só organiza por ano, autor e título), Tags (soma dos vocabulários, tanto o JITA como os assuntos), Vocabulário Controlado (só pelo JITA) e só por Assunto.

Ainda seria possível criar facetas para a descrição dos trabalhos, mas achei que dificultaria mais do que ajudaria.

A meu ver, pela quantidade de trabalhos no RABCI, acho que a descrição é suficiente para se chegar ao trabalho, e ainda por cima, é possível cadastrá-lo em Harvesters usando o protocolo OAI.

Mas ainda continuarei a testar novas possibilidades de organização, e assim que possível, trago os resultados para cá.

Ah, agradeço demais ao Bibliorandum do Bibliotecário 2.0, pois pelo RSS foi possível disponibilizar os trabalhos que estão sendo depositados em Repositórios de Acesso Livre.

E a todos os Blogs que estão listados no BiblioBlogs (lembrando que se não quiserem ser listados ou quiserem ser incluidos, entre em contato)

Overdose de folksonomias

Não sei se é só eu, mas já estou começando a achar que daqui a algum tempo, as folksonomias serão tão numerosas, que se tornarão tão bagunçadas quanto as informações que elas tentam agrupar.

Isso considerando ainda que as folksonomias ainda não foram totalmente adotadas por todos os criadores na web.

Isso me faz pensar que há um espaço legal para se trabalhar entre o que é folksonomia e o que é vocabulários (extremamente) controlados. Algo interessante pode surgir no meio termo…

Modelização

Eu ando lendo muito atualmente sobre a contrução de modelos para a automatização dos processos de criação da informação e conseqüentemente a organização automatizada dos recursos de informação.

Eu estou com uma dúvida tremenda em relação a validade disso, pois se de um lado seria uma das únicas possibilidades de se organizar a informação não bibliográfica adicionando quantativamente grande quantidade de informação aos sistemas de informação que não seriam recuperáveis, há em contraposição a isso a limitação da expressão e conseqüentemente da liberdade de expressão da informação, uma vez que ela deveria obedecer a regras na sua criação.

O livro é um caso interessante, uma vez que o seu suporte obriga a expressão linear do conteúdo, limitando outras formas de expressão.

Tesauros e Internet

É duro para mim, que escrevi meu TCC exatamente exaltando que o tesauro seria uma ferramenta importante para o desenvolvimento futuro da Web, admitir que o uso de tesauro é inviável para organizar documentos na Web (Web, não em bibliotecas).

Tenho que admitir o maior erro que fiz durante o trabalho: acreditar que o futuro seria linear, isto é, acreditar que o que surgisse de novo não atrapalharia o desenvolvimento que estava em curso. E o novo surgiu durante o trabalho e não depois… mas na época optei por não falar de folksonomias, e hoje reconheço o erro.

O lado bom de tudo isso é saber que apesar da inviabilidade atual, os princípios fundamentais dos tesauros como o estabelecimento de relações entre termos será algo muito importante. O tesauro então não morreu, apenas sofrerá mutações que o tornarão irreconhecível para os bibliotecários mais antigos, mas que o tornará uma ferramenta muito útil.

Como?

Imaginem em e-commerce: Vc quer comprar uma câmera digital. O fabricante poderia disponibilizar um arquivo com todas as especificações em formato legível por máquinas. Esse arquivo poderia ser relacionado com gateways (termos de tesauros), que devem estar descentralizados e conectados com outros gateways de descrição por meio de relacionamentos que devem estar em formato legível por máquinas, como por exemplo um gateway chamado “3.1 MP”. Assim, outras câmeras estariam relacionadas a esse gateway e vc poderia com um click, obter todas as informações, tabelas comparativas e outros dados sobre todas as câmeras digitais que tem a resolução de 3.1 MP, e ainda, como o 3.1 MP poderá estar relacionado com um maior, como 7.1 MP, seria possível comparar outros modelos melhores e perceber que compensa comprar uma melhor. Tudo isso sem ter que entrar em site por site de fabricante ou obter informações incompletas em sites de e-commerce. Fora as comparações de preços (em toda a web e não apenas em alguns sites)

Fora as aplicações em relação a web científica…

Para tanto, ainda falta flexibilizar as normas de tesauros (mesmo as já flexibilizadas como o SKOS) e ainda, desenvolver um sistema aberto para manipular todas as relações possíveis. Com certeza vai demorar muito, e quem sabe ainda pode aparecer alguma coisa nova e mudar tudo de novo.. hehehe

Os nomes de futuros bibliotecários mais bizarros conforme a lista do ENADE

Logicamente, eu não posso falar dos outros com um nome como o meu, mas talvez por isso mesmo, vamos nos divertir um pouco. (colegas citados não se sintam ofendidos, é apenas um levantamento de cunho biblioteconômico…)

ABELANDIA MARIA
ABSON SANY
ADEILDNA
AIRTIANE FRANCISCA
ALA DE JESUS SACRAMENTO
ANDRELINO DA SILVA
ARILMES
BAURILENE
BELIJANE
CAACI (Seria Centro Acadêmico de Arquivologia e CI?)
CÁLICA ANANIAS
CAUÊ MARURI DALLE MOLLE
CELANDRO
CHERLLS GARDENIA
CLAUDEVANE NERIS
COMLAN MARCELINO
CRISELEN JARABIZA
DEUSILENE
DEUSIMÁ
ESTELAMAR
ETCHEILE
GEDEÃO ESCÓSSIA
JOELKSON
JOHN KENEDY
LITYERSSE JESUINO
OGNA
OSMÉLIA OLINDA
RITCHELLY
ROXANA MARIA
SERVULO
ULANA MARIA
USTANA
WALGNEIA
WILLIAM HELMUT
YOHRRANNA KELLY
ZEANIEIDE MARIA
ZIZIL ARLEDI

A teoria da recuperação da informação utilizando Vocabulários Controlados

Para quem se interessa por tesauros e vocabulários controlados, o Alistair Miles acaba de disponibilizar a sua dissertação “Retrieval and the Semantic Web” , cujo enfoque é a Recuperação da Informação utilizando Vocabulários Controlados.

Além disso, há outras novas publicações sobre o tema como: a Revista DataGramaZero de Agosto, e a New Review of Hypermedia and Multimedia.