Folksonomias e recuperação da informação

Estou pirando sobre a função de recuperação da informação das folksonomias. Isso teoricamente parece simples, uma vez que o usuário visitou um site e criou um bookmark em algum site de bookmarks compartilhados para consegui-lo achar novamente. Essa é uma função de recuperar. Mas se pararmos para pensar, não é possível saber como o usuário conheceu esse site e como ele conseguiu chegar até ele. Por isso, é uma ferramenta que recuperação para outros e mas não serviu como recuperação para ele mesmo.

No ótimo texto do Hassan Montero, ele diz que as folksonomias são mais úteis para oferecer navegação do que busca.

Eu particularmente utilizo muito as folksonomias pelo seu valor implicito, a escolha dos outros usuários. Se esse site foi indicado por um grande número de usuários, ele não pode ser ruim. Principalmente em casos de busca que tem uma grande variedade de sites, como por exemplo templates de sites. Isso é um critério muito mais elaborado do que o PageRank do google, mas segue a idéia principal, mas com a vantagem dessa “votação” ser aberta a quem não tem sites.

Folksonomias pelo visto terão um longo futuro na longa vida da Web comercial.

Nova versão do TemaTres disponível: 0.96

Uma nova versão do TemaTres (software de gestão de linguagens documentárias) está disponível para download. A nova versão inclui funcionalidades estruturais importantes como:

1. Buscas expandidas (exemplo)

2. Funcionalides de armonização de vocabulários (exemplo)

Conheça mais sobre o TemaTres e faça o download aqui.

Software criado por Diego Ferreyra, responsável tb pelo R020 Bibliotecología y Ciencias de la información

Motivação na criação de folksonomias

Nem todas as tags (etiquetas) em uma folksonomia, ou classificação social descrevem assuntos. Esse é o tema do trabalho de Margaret Kipp que tem o título: @toread and cool: Tagging for Time, Task and Emotion , que está disponível no E-Lis.
Ela fez o estudo em três sistemas (Connotea, CiteULike e Del.icio.us), e constatou o uso freqüente de tags que tem como motivação Tempo ou tarefa (@para ler, não lida, para visitar) e tags afetivas (legal, engraçado, chato, etc…)

E chega a uma discussão interessante:

Uso de tempo e tarefa ou etiquetas afetivas mostram como a etiquetagem expressa um relacionamento dinâmico entre usuários e documentos, sugerindo possivelmente novas formas de modelagem do acesso à informação.

E como conclusão, apresenta perguntas sobre o uso social dessa informação. Como usar essa informação na coletividade?… um tema muito legal para estudo…

Receita de Web Semântica para uso em Bibliotecas Nacionais

Por Figoblog:

Você vai precisar de:

– 2 kg de indentificadores permanentes (as URIs, de preferencia agradáveis, darão um sabor melhor)
– um bom bocado de vocabulários controlados (poderão ser usados vários)
– uma pitada de interfaces de busca.
– temperos : os FRBR, as notas bibliográficas, Dublin Core, RDF e outros a seu gosto.

Leia mais em “Recette du Web sémantique à l’usage des bibliothèques nationales”

Folksonomia ou Etiquetagem??

Eu andei pesquisando sobre Folksonomia para um seminário que tenho que apresentar e estou achando coisas interessantes que valem a pena compartilhar. Só para situar, o texto básico que estou utilizando é Folksonomia:um novo conceito para a organização dos recursos digitais na Web de Maria Elisabete Catarino e Ana Alice Baptista. Para complementar, estou usando um texto interessante chamado Indización Social y Recuperación de Información de Yusef Hassan Montero.

Pelo que percebi, o termo Folksonomia se refere apenas as tags que os usuários da informação criam (essa afirmação aparece nos dois textos). Porém, a ferramenta de etiquetagem (tagging) é muito mais abrangente, uma vez que por se tratar de uma ferramenta e não um termo, pode ser utilizada em diversos contextos, alguns não imaginados ainda. O texto do Hassan Montero diz o seguinte:

Sólo podemos hablar de un nuevo modelo en aquellos sistemas que permiten la indización social agregada, es decir, donde varios usuarios indizan un mismo recurso. El tagging de autor, donde son los creadores de los recursos los que asignan los tags (fotos en flickr, tags en blogs…) no representa un modelo innovador.”

Então as tags que usamos aqui no BSF não são folksonomia, o que contraria tudo o que eu anteriormente achava.

Um dos principais erros que eu achei no texto da Catarino e Baptista é o fato delas encararem a folksonomia da mesma maneira que os sistemas de recuperação da informação, visando o controle e falando que a melhor maneira de melhorar as folksonomias é forçar um aprendizado do usuário. Ai eu fui pesquisar o que leva a um usuário etiquetar algo e achei um texto interessante: Tipologías y estilos en el etiquetado social

Motivação - Tagging

Então, as pessoas não etiquetam para as outras recuperarem como fazemos, mas sim, etiquetam para elas mesmas recuperarem e isso é extremamente justo. Porém, apesar disso, compartilham o resultado dessa etiquetagem com outros.

A vantagem nesse sistema é o tratamento de dados feito posteriormente, aproveitando essa massa de conhecimento. Por isso acho muito mais interessante o texto do Hassan Montero.

Ainda volto a falar de etiquetagem e folksonomias, tentando apontar como poderemos usar melhor essas ferramentas…

Oliver & Company movie

O uso de vocabulários no RABCI

Complementando a discussão iniciada no post Overdose de Folksonomias. Vou descrever um pouco como foi a utilização de vocablários no RABCI.

Primeiro, devo admitir que utilizar o Drupal facilitou muito as coisas, pois ele é um CMS (Sistema de Gerenciamento de Conteúdos) totalmente integrado ao que eles chamam de taxonomias (um pouquinho diferente só do que a gente entende por taxonomia).

O Drupal permite criar vários tipos de conteúdos e vários tipos de vocabulários, combinar o uso entre eles e ainda criar diversos tipos de visualização para cada um deles.

Por exemplo, no caso dos trabalhos acadêmicos, que são cadastrados no tipo thesis (em inglês, porque já estava como tipo definido), a descrição é feita por dois tipos de vocabulários, um controlado (o JITA) e um não tão controlado assim (não ousaria chamar de folksonomia porque é um campo estruturado do conhecimento, mas que é definido pelo usuário.). O JITA (traduzido para o português) é um vocabulário criado para a descrição dos conteúdos do E-LIS e é controlado e de preenchimento obrigatório. O usuário também é obrigado a preencher o assunto como palavras-chave de descrição, mas de maneira não controlada, mas tentando eliminar algumas ambiguidades com a sugestão de termos já existentes para a descrição.

Com isso, incluimos dois tipos de sistemas para descrever um conteúdo, permitindo a quem consultar o RABCI, consultar das seguintes maneiras: um quase ABNT (quase pq ainda não está totalmente formatado), Tabelas (uma outra forma de visulizar os trabalhos, mas que só organiza por ano, autor e título), Tags (soma dos vocabulários, tanto o JITA como os assuntos), Vocabulário Controlado (só pelo JITA) e só por Assunto.

Ainda seria possível criar facetas para a descrição dos trabalhos, mas achei que dificultaria mais do que ajudaria.

A meu ver, pela quantidade de trabalhos no RABCI, acho que a descrição é suficiente para se chegar ao trabalho, e ainda por cima, é possível cadastrá-lo em Harvesters usando o protocolo OAI.

Mas ainda continuarei a testar novas possibilidades de organização, e assim que possível, trago os resultados para cá.

Ah, agradeço demais ao Bibliorandum do Bibliotecário 2.0, pois pelo RSS foi possível disponibilizar os trabalhos que estão sendo depositados em Repositórios de Acesso Livre.

E a todos os Blogs que estão listados no BiblioBlogs (lembrando que se não quiserem ser listados ou quiserem ser incluidos, entre em contato)

Overdose de folksonomias

Não sei se é só eu, mas já estou começando a achar que daqui a algum tempo, as folksonomias serão tão numerosas, que se tornarão tão bagunçadas quanto as informações que elas tentam agrupar.

Isso considerando ainda que as folksonomias ainda não foram totalmente adotadas por todos os criadores na web.

Isso me faz pensar que há um espaço legal para se trabalhar entre o que é folksonomia e o que é vocabulários (extremamente) controlados. Algo interessante pode surgir no meio termo…

Paperlandia

Recebi o seguinte e-mail do Diego Ferreira, mesmo criador do Tematres, pela BibVirtual e preciso divulgar:

Holass, les escribo para dar a conocer Paperlandia, es un experimento orientado a resolver servicios documentales en base a esquemas de portabilidad.

Paperlandia trata de articular dos niveles de portabilidad: portabilidad de
estructuras de datos y portabilidad terminológica.

Para la portabilidad de estructuras de datos se utiliza el marco técnico provisto por la Iniciativa OAI-PMH, en particular, la aplicación de cosechado de metadatos PKP Open Archives Harvester.

Para la portabilidad terminológica se utiliza una versión beta de TemaTres que dispone de un módulo de armonización de vocabularios.

Actualmente Paperlandia procesa los datos provenientes de:
* Digital Library of Information Science and Technology (DLIST)
* E-prints in Librarianship, Information Science
* Temaria
Para el procesamiento de los mencionados repositorios se han realizado las equivalencias terminológicas necesarias.

URL: http://www.r020.com.ar/paperlandia/index.php

Espero les gusté y me gustaría conocer sus opiniones:-)

saludos

O sistema é simplesmente genial…

Modelização

Eu ando lendo muito atualmente sobre a contrução de modelos para a automatização dos processos de criação da informação e conseqüentemente a organização automatizada dos recursos de informação.

Eu estou com uma dúvida tremenda em relação a validade disso, pois se de um lado seria uma das únicas possibilidades de se organizar a informação não bibliográfica adicionando quantativamente grande quantidade de informação aos sistemas de informação que não seriam recuperáveis, há em contraposição a isso a limitação da expressão e conseqüentemente da liberdade de expressão da informação, uma vez que ela deveria obedecer a regras na sua criação.

O livro é um caso interessante, uma vez que o seu suporte obriga a expressão linear do conteúdo, limitando outras formas de expressão.