E-books e audiolivros a um clique

Desde que eu fiz o post sobre o Overdrive eu tinha vontade de fazer uma demonstração em vídeo. Até consegui filmar os vídeos no início do ano, mas só agora consegui editar e finalizar o vídeo pra compartilhar com vocês.

Esse é o serviço que muitas bibliotecas norte-americanas usam para emprestar e-books e audiolivros. Eu uso direto pra ouvir audiolivro quando estou na rua, andando de ônibus ou até mesmo dirigindo. Falando de audiolivro, no início a gente estranha um pouco, mas depois que pega o gosto pela coisa, é uma delícia! E tem audiolivros super bem produzidos, que realmente prendem a atenção do ouvinte.

E não preciso mais escrever muito, porque tudo que quero dizer está aí no vídeo. Aperte o play!

Como funciona o empréstimo de e-books e audiolivros digitais?

Os e-books estão ganhando um espaço cada vez maior em bibliotecas do mundo inteiro. Há duas formas de promover o acesso a coleções digitais em bibliotecas públicas: pelo empréstimo de e-readers, ou através de softwares que mediam o empréstimo dos arquivos digitais diretamente nos dispositivos eletrônicos dos usuários.

Eu não estou falando de disponibilizar uma lista de arquivos em PDF que você pode baixar gratuitamente, cujos direitos autorais são livres. Estou falando de conteúdo licenciado.

Software para empréstimo de e-books

Aqui no Canadá, muitas bibliotecas públicas usam o Overdrive como software para empréstimo de e-books e audiolivros em MP3.

No catálogo das bibliotecas, você encontra a obra com um link para baixar pelo Overdrive.

O usuário pode instalar o aplicativo do Overdrive no seu tablet,  celular (smartphone) ou no próprio computador. Uma vez instalado, você faz o login no Overdrive com o cadastro da sua biblioteca local (usando o número do cartão e a senha).

Eu uso duas coleções: a da biblioteca pública de Vancouver, e a do consórcio de bibliotecas de British Columbia (a província). Como o licenciamento dessas coleções é caro, muitas bibliotecas da província se juntaram para fazer um consórcio, onde compartilham recursos e coleções. A coleção digital da biblioteca pública da minha cidade (que fica na região da grande Vancouver) é disponível através do consórcio da província.

bsf-overdrive2

Você pode também navegar pelo próprio Overdrive e pesquisar o livro que quer ler ou ouvir.

A coleção é extensa, com títulos de diversos gêneros e categorias.

bsf-overdrive3

Tem até Harry Potter!

A interface de pesquisa é muito bem organizada, com diversos filtros.

bsf-overdrive4

Se o livro não estiver disponível, você pode fazer a reserva e entrar na fila de espera. Assim que o livro for liberado, você recebe um email notificando da disponibilidade do livro e com um prazo de dias para pegar emprestado.

Os e-books e audiolivros são emprestados por um período de 14 ou 21 dias, sem direito a renovação. Quando expira, o conteúdo simplesmente some do seu dispositivo, como mágica!

bsf-overdrive5

Nessa pesquisa, acabei encontrando um livro que queria ler, em formato áudio: Cadê você, Bernadette?, de Maria Semple. (Note que há livros super novos, lançamentos recentes). O livro estava disponível para empréstimo, então baixei.

bsf-overdrive6

Você clica na opção Download. Apesar do programa baixar o mp3 para o seu dispositivo, você não tem acesso ao arquivo em nenhum momento. Ele só é disponível através do Overdrive.

Uma vez baixado, você pode ouvir/ler offline, sem precisar estar conectado à internet. Não é streaming.

bsf-overdrive7

bsf-overdrive8

Os audiolivros são divididos em muitas partes, dependendo da extensão do livro. Esse aqui são 8 partes de 1 hora e pouco cada uma.

bsf-overdrive9

E quem paga essa conta?

As editoras ainda estão meio hesitantes em liberar seus livros para empréstimo por bibliotecas. Até dois anos atrás, algumas das grandes editoras internacionais não liberavam e-books para bibliotecas de jeito nenhum. Mas com a crescente demanda, tiveram que encontrar meios para viabilizar os contratos com bibliotecas públicas.

Uma das alternativas foi cobrar incrivelmente caro por cópias digitais para bibliotecas. Eu fiz um estágio em 2012 numa biblioteca pública da cidade e a gerente de aquisições me falou que, na época, um e-book poderia custar até 80 dólares para bibliotecas, enquanto custavam menos de 15 para leitores comuns.

Outra solução foi limitar o número de downloads por cópia. Uma das editoras (não lembro qual, acho que a Harper Collins, uma das gigantes) permitia apenas 26 leituras de cada e-book. Depois disso, a licença expirava e a biblioteca era obrigada a comprar outra licença.

No Brasil

A Biblioteca de São Paulo empresta e-readers a seus usuários, porém eles devem usar os dispositivos dentro da biblioteca.

Eu fico aqui, torcendo pelo progresso das bibliotecas públicas na nossa terrinha, pra que todo mundo um dia possa ter acesso a tecnologias como o Overdrive.

Demonstração

Editando o post pra inserir finalmente o vídeo de demonstração! (agosto de 2015)

VI Simpósio Internacional de Bibliotecas Digitais

Começou ontem o VI Simpósio Internacional de Bibliotecas Digitais, organizado pela PUCRS e pelo Consórcio Ibero-americano de Educação em Ciência e Tecnologia (ISTEC).

VI Simpósio Internacional de Bibliotecas Digitais

Confesso que a princípio não esperava muito do evento, pois acho que é complicado sair do discurso “olha como os bibliotecários são importantes na Era Digital”, mas o evento me surpreendeu positivamente.

Não que esse discurso não tenha ocorrido, mas houve palestras e debates que fizeram valer a pena.

Conferência de abertura

No primeiro dia, gostaria de destacar:

– Catherine Sohener reforçou a importância da educação continuada e da leitura para bibliotecários. Claro que à primeira vista parece óbvio, mas se refletirmos melhor, quantos bibliotecários que conhecemos estão parados no tempo? Quantos existem que não gostam de ler?

– A @raquelrecuero na palestra que iniciou a primeira mesa redonda do dia, cujo tema foi cibercultura e pensamento contemporâneo, trouxe à tona o fato de que não há compartilhamento desinteressado. As pessoas compartilham porque estão atrás de valores como reputação, visibilidade, popularidade, etc.

– Já o @trasel em resposta a perguntas ocorridas durante o debate da mesma mesa redonda, trouxe em seu discurso o fato de que muitos professores reclamam quando os alunos levam laptops para a sala de aula e utilizam para ver facebook, email, twitter… Ele lembrou que antigamente os alunos não usavam computadores em sala, mas já existia o jogo da forca…

(O que me lembra que as empresas que bloqueiam determinados sites alegando que eles podem baixar a produtividade, esquecem que sempre existiu o cafezinho. Quem não quer trabalhar vai tomar um café e leva duas horas. E aí?).

Houve também uma palestra com Janet McCue que destacou a importância das bibliotecas atuarem fora das bibliotecas, citando o exemplo da Cornell University Library e a mesa redonda com a participação de César da PUCRS e Maria Carmem Romcy de Carvalho.

Tenho somente duas ressalvas a fazer:

– Não há tradução simultânea, o que gerou reclamação por parte de muitos participantes. Ainda que se parta do princípio que a grande maioria fala inglês, acho que essa informação poderia ter sido divulgada no site do evento.

– Senti falta de tweets da @BibliotecaPUCRS sobre o Simpósio. =D

As atualizações no twitter ficaram por conta da @karolbraun majoritariamente.

Vou aguardar o segundo dia. O @trasel já disponibilizou seus slides. A organização informou que as apresentações estarão disponíveis ao final do evento.

(Foto via @danielbeltran )

reCAPTCHA ajuda a digitalizar milhões de textos antigos


O PROBLEMA: Spammers

Serviços de email grátis como Google, Yahoo! e Microsoft estavam sofrendo ataques de hackers/spammers que haviam criado programas capazes de obter milhões de contas de email todos os dias. Por que os spammers precisavam de tantos emails? Porque os serviços de email permitiam que usuários enviassem somente um número específico de emails por dia (Yahoo permitira 100 envios de email por dia), então para que a tática de spam pudesse funcionar efetivamente, os spammers precisavam de um número gigantesco de endereços de email.

A SOLUÇÃO: CAPTCHA
Desenvolver um programa que protege os websites contra os robôs por meio da aplicação de um teste que os humanos podem passar, mas os robôs não. Por exemplo, humanos podem ler textos distorcidos como estes abaixo, mas os programas de computador não.


um examplo típico de um CAPTCHA

Em 2000, Luis von Ahn e Manuel Blum conceberam o termo ‘CAPTCHA’. Eles inventaram múltiplos exemplos de CAPTCHAS, incluindo os primeiros CAPTCHAs que seriam usados amplamente, os que foram adotados pelo Yahoo.

A REVELAÇÃO
– Aproximadamente 200 milhões de CAPTCHAs são digitados todos os dias ao redor do mundo
– Cada CAPTCHA leva aproximadamente 10 segundos para o preenchimento;
– 500.000 horas de tempo humano perdidas todos os dias digitando CAPTCHAs

O DESAFIO
Existe alguma maneira de este esfoço humano ser utilizado para o bem da humanidade?

A SOLUÇÃO REAVALIADA: reCAPTCHA
– Digitalizar livros uma palavra de cada vez. reCAPTCHA é um serviço grátis do CAPTCHA que ajuda a digitalizar livros, jornais e shows de rádio antigos.

exemplo de recaptcha

Como isso funciona
Digitalizar livros consiste do processo de tirar fotos de páginas do livro e em seguida usar OCR (reconhecimento óptico de caracteres) para descobrir o que as palavras são. Entretanto, em textos antigos, o OCR é bastante impreciso – para os livros escritos antes de 1900, OCR perde cerca de 30% das palavras.

exemplo de problema com OCR

O reCAPTCHA melhora o processo de digitalização de livros enviando para a web palavras que os humanos são capazes de decifrar, mas que não conseguem ser lidas por computadores na forma de CAPTCHAs. Cada palavra que não pode ser lida corretamente por OCR é colocada em uma imagem e usada como CAPTCHA. Isso é possível porque a maioria dos programas emite um alerta quando uma palavra não pôde ser lida corretamente.

Mas se um computador não pode ler tal CAPTCHA, como o sistema é capaz de conhecer a resposta correta?

A resposta: o reCAPTCHA oferece aos usuários duas palavras distorcidas. O sistema sabe o que uma delas é – se você identificá-la corretamente, ele assume que você provavelmente está respondendo a segunda (a ordem é aleatória) usando o melhor da sua capacidade e supõe que a sua resposta seja correta também para a nova palavra. O sistema então oferece essa nova imagem para um grupo de outras pessoas para determinar, com maior precisão, se a resposta original estava correta. Quando este grupo identifica a palavra desconhecida da mesma forma, é muito provável que o reconhecimento seja exato.

As duas palavras do reCAPTCHAs são tão velozes quanto digitar seqüências aleatórias de 6-8 caracteres, de modo que von Ahn não está nos fazer trabalhar mais.

É assim que os textos digitalizados vão sendo corrigidos, palavra por palavra. A maior parte desses textos são provenientes dos arquivos do New York Times e do projeto de digitalização do Google. E o Google gostou da tecnologia que acabou comprando o reCAPTCHA.

A controvérsia do Google Book Search – os bibliotecários deram mole

Pra quem não viu, uma breve passagem sobre a questão do Google Book Search project. Afora as questões jurídicas, que é o que se discute no momento, os bibliotecários deram mole por ter pedido a chance de ter capitaneado o projeto da biblioteca mundial (não-comerical e não-monopolizada). Agora é correr atrás do prejuízo e fazer lobby pro lado que melhor lhe representar.

O samba do bibliotecário doido #2

Recebi hoje do Caruso o link para o post “O samba do bibliotecário doido“, publicado no TodoProsa, blog do Sérgio Rodrigues. A gente já havia tratado do assunto internamente, mas a Teresa Rúbio levantou a bola de novo, então vou chutar.

O texto é esse:

O que os livros “A condição humana”, de André Malraux, “Killer in the rain”, de Raymond Chandler, “Christine”, de Stephen King, e “The complete shorter fiction”, de Virginia Woolf, têm em comum? Foram todos lançados no ano de 1899, segundo o Google Book Search. Onze anos depois de “A fogueira das vaidades”, de Tom Wolfe.

E o pior é que esse tipo de disparate está muito longe de ser raro na Biblioteca Universal do Google, que chega a extremos bibliográficos hilariantes como o de classificar uma edição de “Moby Dick” na rubrica Computação – informa Geoffrey Nunberg em artigo (em inglês) publicado pelo “Chronicle of Higher Education”.

Sim, em breve todo o conhecimento produzido pela humanidade estará online. Resta saber a que preço.

Eu compreendo o texto, é uma reação natural e comum de quem analisa a situação somente pelo seu referencial histórico sem entender mesmo o problema. Esses dias o Gmail ficou for do ar né. E o melhor tweet que eu li a respeito foi: @3df O GMail funciona 10 anos sem parar, falha meia horinha e vc diz que vai trocar??? Ah, vai, olha bem pro seu marido!!!!! @omdt

Eu sei que toda a história do Google Books é bastante complexa. E nenhuma afronta ao Sérgio, ao contrário, acho que se os problemas foram detectados, nada melhor do que expo-los e tentar resolve-los. Não tem nada aqui de #mimimi bibliotecário.

Mas de certo modo, fica mais fácil pegar um problema bem específico e questionar: ahá “em breve todo o conhecimento produzido pela humanidade estará online. Resta saber a que preço.”

Outra coisa que vi quando tava pesquisando twitter é que algum cara publicou um comentário no mashable indicando uma equação matemática que prova que se a produção de tweets é indiscriminada, então o valor tende a zero. Só que um matemático rebateu com a real interpretação da mesma equação, dizendo que o valor médio tende a zero, mas o valor geral é completamente distante de zero. E isso é o que a maioria das pessoas não compreende quando se trata de conteúdo web.

Eu tenho quase certeza que o “release date” (que é diferente de publishing date) 1899 tem a ver com as restrições constitucionais americanas, direitos autorais.

Mas isso tem ligação direta com outras coisas que eu já vinha falando nas internas. Pra que se preocupar com descrição bibliográfica? Who cares? Qual é o futuro dos catálogos, dos catalogadores?

A minha visão simplificada para um catálogo moderno de bibliotecas (qualquer biblioteca que recebe público) é bem simples: google appliance e aqua browser (ou algo tipo encore).

– catalogação: poucos bibliotecários fazendo a catalogação inicial; a catalogação deixa de ser vital já que a recuperação da informação agora é potente (todo a história da biblioteconomia foi baseada na organização para a recuperação. O que o google fez foi de maneira geral inverter a lógica, de melhorar a recuperação independente da organização – “a nova desordem digital“).

Voltando ao texto, qual é a probabilidade de um leitor de ficção querer ler livros publicados somente em um ano determinado? Para o caso das buscas científicas, a datação é importante, mas daí os próprios leitores podem se encarregar das correções necessárias, que comparadas ao volume total, tende a ser muito baixo.

Eu por exemplo sou pesquisador da área de blogs, eu sei que é improvável um artigo sobre blogs ter sido escrito em 1992, por exemplo, e conheço perfeitamente a história do advento das técnicas para reconhecer falhas. Bastaria eu entrar em contato ou ter a possibilidade de editar o conteúdo.

O acesso facilitado é uma ameaça para aqueles que gostam de se sentir privilegiados. Além disso, esse pensar sobre o conhecimento faz sentido na perspectiva de empilhador de livros. “Ohhhh meu deus, em qual prateleira esse aqui fica? 1800? 1900?”

Grande parcela das minhas citações em artigos de cunho científico não mudam NADA em seu significado caso as datas dos trabalhos estejam equivocadas. Ou seja, este erro afeta um número ínfimo de pesquisas.

Na dá pra subestimar a inteligência das máquinas e pior, das pesssoas.