Aposto com quem quiser R$2 que o Google é método número 1 de descobertas de fontes primárias na internet.
Aposto com quem quiser R$5 que os catálogo de bibliotecas e repositórios institucionais mal aparecem entre os primeiros 5 métodos de busca/descoberta de fontes primárias e secundárias na internet.
De todas as oportunidades que as bibliotecas perdem na oferta de melhores serviços e produtos online, essa é uma que nós somos perfeitamente capazes de não perder.
Que tal tornar nossos catálogos de biblioteca e registros bibliográficos rastreáveis pelo Google?
Pra que? Para que na próxima vez que alguém pesquisar por “Jogos Vorazes” no Google, que na primeira página de resultados ela seja capaz de ver não apenas sites de livrarias, mas também a biblioteca mais próxima de sua casa que possui esse título disponível para empréstimo.
Pra isso acontecer, basta pouco: permitir rastreamento dos web crawlers nas bases de dados bibliográficas (nenhuma biblioteca que eu conheço tem uma objeção legal convincente para impedir indexação dos robôs de busca); URLs persistentes (e abolir de uma vez por todas o uso de javascript em softwares de biblioteca); melhorar os metadados dos objetos digitais (porque é pra isso que os bibliotecários passam 8 horas por dia sentados na frente de um computador); começar cedendo os dados para a OCLC até a gente criar uma versão brasileira do WorldCat (porque é inadmissível estar em 2012 e ainda não termos um real catálogo coletivo nacional, não nos moldes do CCN, mas nos moldes da Estante Virtual e do próprio WorldCat).
Como o Diego disse esses dias no Facebook, no Brasil as bibliotecas são anti-internet 🙁
Se ainda não deu pra entender a minha súplica, talvez agora com legendas dê:
11 respostas para “Descobrindo os tesouros escondidos nas bibliotecas por meio de Search Engine Optimization”
Bibliotecas do Brasil: se abram pra internet!
Oi Moreno, já viu esse texto?
Addressing the low indexing ratios of IRs in Google Schoolar
http://www.emeraldinsight.com/journals.htm?articleid=17020806&show=html
Um abraço
Concordo plenamente! Mas a reposta que eu sempre obtenho é que não temos infraestrutura, pois o fluxo aumentaria muito (não entendo tão bem de suporte e servidores), mas pela fala do Moreno nem precisamos ficar presso a essa questão de servidor. A grande verdade é que por trás tem toda uma questão política… Enquanto isso vamos usando outros meios.
Olá, Moreno e leitores do BSF!
Muito bom o post, já li algo similar sobre a disponibilização de catálogos para os buscadores no Bibliotecno, se não me engano.
Atualmente onde trabalho instalei o PHL, mas na versão monousuário. Como não faz o menor sentido criar um catálogo apenas para o bibliotecário, lancei mão do WordPress e criei um blog (http://catalogobcsds.wordpress.com) como uma alternativa até a aquisição da licença (ainda sem previsão), já que não tenho conhecimento suficiente para configurar um software livre como Biblivre, etc. e também pelo fato da TI ser terceirizada.
Embora seja uma empresa privada, teve boa aceitação, apesar das limitações em relação a um software de biblioteca.
Só para ilustrar o que você disse e para que os leitores entendam, deixo um exemplo de dois links do mesmo registro, extraídos do PHL e do blog: http://127.0.0.1:2185/cgi-bin/wxis.exe?IsisScript=phl82/003.xis&opc=status_tit&tit=201231608531&acv=001&tmp=C:/Users/EDUARD~1.CSD/AppData/Local/Temp/TMP71.$$$ e http://catalogobcsds.wordpress.com/2012/03/14/substituicao-tributaria-antecipacao-ao-fato-gerador/
Bom texto Moreno. Vale lembrar que um conceito de SEO que tem bastante peso no Google também é o Link Building (Links de outros para o seu site). Em tese não adianta criar um blog com os livros da biblioteca sem que uma quantidade razoável de outros sites linkem o seu conteúdo, neste caso seu resultado tende a ir para outras páginas que não a primeira nos resultados do Google. Funciona mais ou menos como escrever um artigo e ninguém citar, isso diminui sua relevância para o Google. Abraços
Olá Eduardo, acabei de descobrir o vosso blog e estou a gostar muito do tom: é acessível, divertido, curto e com temas bem actuais. Também acabei de descobrir a atitude “anti-internet” das bibliotecas no Brasil, que ignorava de todo. Fiquei com uma dúvida do teu post. Quando dizes “e abolir de uma vez por todas o uso de javascript em softwares de biblioteca”, quais são as implicações técnicas que isso tem? O uso de javascript impede a indexação automática por motores de busca como o do Google? E porquê?
um abraço desta bibliotecária-a-ser portuguesa 🙂
Diana, não há problema no uso do Javascript, desde que não se use para esconder os links. Tem sites que usam um botão ou link em javascript que esconde de onde ele está baixando a página desejada e nem os mecanismos de busca conseguem fazer a devida indexação, nem os usuários conseguem salvar um link para o recursos que estavam acessando.
Enganei-me queria dizer Moreno e não Eduardo…
Moreno… O que vc disse sobre a url persistente do Aleph é uma meia verdade, o url do Aleph não é persistente propositalmente, pois o robo do Google come banda dos catálogos. Entretanto, o Aleph permite que vc gere páginas estáticas do catálogo pra ser “publicadas” pelo google, o que vc chamou de fac símile.
Vc conhece o Primo? É um produto da Ex-Libris muito interessante que vai de encontro a muita coisa que vc fala:
http://www.youtube.com/watch?v=fDc6kJo6SX8&feature=relmfu
http://www.youtube.com/watch?v=YDly9qPpPYQ&feature=plcp
fala Luiz
o Aleph permitir ou não, a universidade ter banda ou não, pro usuário não importa. Ou seja, se o Aleph permite, então que se utilize esse parâmetro. Se a universidade não tem banda, então que crie um data center compatível com as possibilidades do software.
O que eu mostrei foi que, mesmo com essas restrições políticas e orçamentárias, bastaria fazer um espelho de tudo isso em um blog no blogspot, remetendo aos registros do OPAC.
Se a universidade não tem banda, então a gente usa a banda grátis do blogspot, wordpress.com, liberando os dados, que bem ou mal, são públicos de qualquer forma.
Entendo, vc tem razão.