Recebi hoje do Caruso o link para o post “O samba do bibliotecário doido“, publicado no TodoProsa, blog do Sérgio Rodrigues. A gente já havia tratado do assunto internamente, mas a Teresa Rúbio levantou a bola de novo, então vou chutar.
O texto é esse:
O que os livros “A condição humana”, de André Malraux, “Killer in the rain”, de Raymond Chandler, “Christine”, de Stephen King, e “The complete shorter fiction”, de Virginia Woolf, têm em comum? Foram todos lançados no ano de 1899, segundo o Google Book Search. Onze anos depois de “A fogueira das vaidades”, de Tom Wolfe.
E o pior é que esse tipo de disparate está muito longe de ser raro na Biblioteca Universal do Google, que chega a extremos bibliográficos hilariantes como o de classificar uma edição de “Moby Dick” na rubrica Computação – informa Geoffrey Nunberg em artigo (em inglês) publicado pelo “Chronicle of Higher Education”.
Sim, em breve todo o conhecimento produzido pela humanidade estará online. Resta saber a que preço.
Eu compreendo o texto, é uma reação natural e comum de quem analisa a situação somente pelo seu referencial histórico sem entender mesmo o problema. Esses dias o Gmail ficou for do ar né. E o melhor tweet que eu li a respeito foi: @3df O GMail funciona 10 anos sem parar, falha meia horinha e vc diz que vai trocar??? Ah, vai, olha bem pro seu marido!!!!! @omdt
Eu sei que toda a história do Google Books é bastante complexa. E nenhuma afronta ao Sérgio, ao contrário, acho que se os problemas foram detectados, nada melhor do que expo-los e tentar resolve-los. Não tem nada aqui de #mimimi bibliotecário.
Mas de certo modo, fica mais fácil pegar um problema bem específico e questionar: ahá “em breve todo o conhecimento produzido pela humanidade estará online. Resta saber a que preço.”
Outra coisa que vi quando tava pesquisando twitter é que algum cara publicou um comentário no mashable indicando uma equação matemática que prova que se a produção de tweets é indiscriminada, então o valor tende a zero. Só que um matemático rebateu com a real interpretação da mesma equação, dizendo que o valor médio tende a zero, mas o valor geral é completamente distante de zero. E isso é o que a maioria das pessoas não compreende quando se trata de conteúdo web.
Eu tenho quase certeza que o “release date” (que é diferente de publishing date) 1899 tem a ver com as restrições constitucionais americanas, direitos autorais.
Mas isso tem ligação direta com outras coisas que eu já vinha falando nas internas. Pra que se preocupar com descrição bibliográfica? Who cares? Qual é o futuro dos catálogos, dos catalogadores?
A minha visão simplificada para um catálogo moderno de bibliotecas (qualquer biblioteca que recebe público) é bem simples: google appliance e aqua browser (ou algo tipo encore).
– catalogação: poucos bibliotecários fazendo a catalogação inicial; a catalogação deixa de ser vital já que a recuperação da informação agora é potente (todo a história da biblioteconomia foi baseada na organização para a recuperação. O que o google fez foi de maneira geral inverter a lógica, de melhorar a recuperação independente da organização – “a nova desordem digital“).
Voltando ao texto, qual é a probabilidade de um leitor de ficção querer ler livros publicados somente em um ano determinado? Para o caso das buscas científicas, a datação é importante, mas daí os próprios leitores podem se encarregar das correções necessárias, que comparadas ao volume total, tende a ser muito baixo.
Eu por exemplo sou pesquisador da área de blogs, eu sei que é improvável um artigo sobre blogs ter sido escrito em 1992, por exemplo, e conheço perfeitamente a história do advento das técnicas para reconhecer falhas. Bastaria eu entrar em contato ou ter a possibilidade de editar o conteúdo.
O acesso facilitado é uma ameaça para aqueles que gostam de se sentir privilegiados. Além disso, esse pensar sobre o conhecimento faz sentido na perspectiva de empilhador de livros. “Ohhhh meu deus, em qual prateleira esse aqui fica? 1800? 1900?”
Grande parcela das minhas citações em artigos de cunho científico não mudam NADA em seu significado caso as datas dos trabalhos estejam equivocadas. Ou seja, este erro afeta um número ínfimo de pesquisas.
Na dá pra subestimar a inteligência das máquinas e pior, das pesssoas.
Deixe uma resposta