Como identificar uma pintura usando Google Images

Sobre os dois posts recentes que discutiram o futuro da biblioteconomia, o primeiro do Gustavo e o segundo da Dora, eu tendo a concordar mais com o primeiro do que o segundo, no sentido que, de fato, não há nada que uma máquina não possa fazer melhor do que um bibliotecário. Alguns poucos anos atrás a nossa semântica era superior ao de máquinas, hoje não mais.

Esse mimimi não se restringe à biblioteconomia, tenho certeza que muitas outras profissões discutem a mesma sentença. Neste ano saiu até mesmo aquele manifesto contra a inteligência artificial avançada, assinado por Hawking, Elon Musk, Wozniak, entre outros. Ou seja, a coisa já está mais para Ex Machina do que HAL 9000.

Tem dois exemplos que eu acho ilustram bem o processo de robotização substituindo o trabalho tradicional do bibliotecário. O primeiro é a logística de um dos galpões da Amazon:

A biblioteconomia tradicional pode ser entendida como mais do que organização para recuperação, mas neste quesito específico, que é o que melhor nos difere de outros profissionais, as máquinas já estão na frente. Eu acho que as classificações decimais são a tecnologia mais avançada que pudemos oferecer ao mundo, mas hoje elas já não oferecem um diferencial que um robô não possa emular.

CDD faz completo sentido no mundo físico, com restrição de espaço, mas ela se torna apenas um adereço se o seu catálogo e sistema de busca/recuperação é tão bom a ponto de diminuir o potencial da navegação por entre as estantes e oferecer diversas combinações possíveis para encontrar um determinado objeto.

Vejam o Stack Life que é um sistema de navegação visual das bibliotecas de Harvard e a estante virtual da Universidade de Virgínia, que exibe imagens em alta resolução dos livros como eles teriam aparecido nas prateleiras e usa informação bibliográfica do catálogo de 1828, para permitir pesquisa sobre a coleção dos livros históricos.

Claro que pra isso acontecer e chegarmos a este nível de recuperação da informação foram necessários anos de investimento em metadados e mais outros anos de adequação do algoritmo para oferecer melhores resultados de busca. Mas bem, já passamos dessa fase, os robôs hoje estão propensos a resolver alguns problemas sozinhos com base no acúmulo de informações coletadas a priori, junto de outro volume de informação coletado a posteriori, a partir do de buscas/atividades/intervenções realizadas pelos usuários do sistema. É exatamente assim que funciona todos os algoritmos essenciais que usamos, Google e Facebook especialmente.

Ou seja, novamente, a organização da informação se tornou apenas uma espécie de defesa corporativista: quando toda a área computacional está preocupada apenas em modelos organizacionais a posteriori, com base no input de usuários, a biblioteconomia permaneceu trancada nos modelo a priori, com base na inteligência dos bibliotecários. Ainda é importante para pequenas coisas, mas está na contramão da realidade pragmática do mundo moderno.

O segundo exemplo que eu quero mostrar é como é possível descobrir informações sobre uma obra de arte usando apenas inteligência artificial. Digamos que eu tenha visitado um museu e gostei de um quadro, ou tenha visto uma imagem na internet mas não tenho quaisquer informações sobre ela. Como descobrir o autor, a data, o tema retratado, sem dispor de outra informação além da própria imagem? Pois bem, é possível descobrir utilizando o Google Images e selecionar a pequena câmera no lado direito do botão de busca (conhecida como Pesquisar por imagens).

Esta imagem por exemplo foi rapidamente identificada pela busca reversa do Google, me remetendo a um blog que possuía a descrição completa da obra. Todo o procedimento é realizado artificialmente, sem qualquer necessidade de interpretação semântica, ontológica ou de indexação, apenas aplicando técnicas matemáticas como distância euclidiana e detecção de pontos salientes no objeto.

Uma segunda opção seria submeter a imagem à um sistema crowdsourced, como o Reddit, e deixar que outros humanos, especialistas ou não, pudessem contribuir com novas informações.

Em alguns anos acredito ser possível o mesmo tipo de busca para livros e textos digitais, descobrir informações relevantes e contextuais, sem necessariamente ter um conjunto a priori de descritores ou metadados ou árvores do conhecimento.

Tudo isso para reforçar a ideia de que a robotização sim é capaz de substituir o grosso do trabalho dos bibliotecários em médio ou longo prazo, mas como a Isadora disse, existem ainda várias maneiras de os bibliotecários permanecerem relevantes.

Eu continuo achando que a nossa maior contribuição ao mundo é cada vez mais converter as coleções físicas para o digital e deixar que o pessoal da computação faça o restante do trabalho. Nós somos os melhores profissionais em armazenar e salvaguardar a herança cultural humana e eles vem fazendo melhor trabalho do que nós em termos de recuperação, disseminação e contextualização, do que nós fomos capazes de fazer sozinhos. Ainda teremos uns bons 100 anos em coletar, organizar, definir os metadados elementares, de todos os materiais textuais, visuais e outras mídias que ainda existem fisicamente, e jogá-los na internet para que outros profissionais façam melhor sentido desses objetos.

Fazer exercício de futurologia é necessário, porque do contrário estaremos sempre correndo atrás do tempo perdido. Mas como disse a Marianna, o futuro é agora.

10 pensamentos em “Como identificar uma pintura usando Google Images”

  1. Tava no finalzinho da minha graduação quando escrevi um post tb sobre busca por imagem no Google. Estagiando como indexadora em uma editora de imagens, usei essa ferramenta pra alimentar uma pequena parte da base de dados. https://doraexlibris.wordpress.com/2011/08/30/busca-por-titulo-busca-por-autor-busca-por-palavra-chave-busca-por-imagem-sim-no-google/

    Entendo que, no futuro, vai existir essa questão de disputa por acervos, mas do jeito que você fala Moreno parece também que a “nossa maior contribuição para o mundo” vai acabar sendo a última.

    Não desprezo a existência da tecnologia sendo utilizada pra substituir trabalho braçal, só reconheço que isso ainda não é uma realidade tão próxima quanto eu gostaria que fosse, ainda mais em se tratando de bibliotecas brasileiras.

    Outra questão que pega aí é a seguinte: existe a diferenciação entre material físico, digitalizado e borndigital? Porque a impressão que eu tenho às vezes é que nas discussões essas três coisas se misturam direto. Ok, podemos botar tudo num balaio só e dizer que é “tudo informação”, como parece num primeiro momento. Mas o contexto dessas três coisas não só importa como também redefine o sentido da conversa.

    Meu contexto hoje é a informação digital e pelo que vejo, mesmo que seja pra desenvolver novos produtos/processos o que for, o framework dessas “áreas meio” (biblio incluso) é necessário porque se fiar apenas nas exatas não é negócio. O que acontece – ao menos a transição que percebo – é que estamos cada vez mais deixando de trabalhar com metadados pra trabalhar com dados de fato.

    Acredito que a defesa corporativista existe ao ponto em que existe esse apego desnecessário às coleções físicas como o único tipo de informação a ser tratado (interpretado, entendido, etc.) hoje em dia. Se os cursos de graduação fossem focados em projetos reais ao invés de trabalhos de conclusão, muito provavelmente o cenário seria diferente.

  2. Acho importante fazer o exercício de Futurologia como falado, e acho incrível, além de muito interessante, poder utilizar nossos conhecimentos e nossa lógica de organização em meios exclusivamente digitais. Mas acredito que enquanto houver usuário fazendo questão do livro ou documento físico, ainda precisaremos de bibliotecas tradicionais (existem outros motivos). Na área de artes, por exemplo o livro físico desempenha um papel indispensável que é a possibilidade de trabalhar com os sentidos. A textura, o tipo de papel utilizado, entre outros fazem parte das técnicas trabalhas pelos artistas, um tipo de informação sensorial que a tecnologia ainda não consegue reproduzir. Fora a importância história dada a preservação deste tipo de material físico, e um gosto pelo ‘estilo vintage’ de se pesquisar, muito comum na área de artes, mas que acontece em todas as áreas. Acredito hoje na Biblioteca ganhando força como espaço de convivência, um local ideal para estudo e trabalho, que disponibiliza informação de forma física e digital, dando poder de escolha ao pesquisador. E como um ambiente híbrido, esta biblioteca também precisa de profissionais híbridos, que não subestimem o que aprenderam na faculdade e que ao mesmo tempo aprendam a apreciar e refletir sobre o novo. O que não dá é para ter bibliotecário com medo de tecnologia, não reconhecendo a sua importância e achando que trabalhar somente com tecnologia é deixar de ser bibliotecário, isso sim tem que mudar e mudar agora! Aí também se encaixa o bibliotecário multidisciplinar que todo mundo fala mas que às vezes esquece de ser ou de se tornar. Por enquanto este é o cenário atual, mas pequenas mudanças acontecem todos os dias pode ser que a gente demore a sentir, ou pode ser que não. Sendo assim, cabe a nós reinventarmos a utilização de nosso conhecimento evoluindo junto com tudo isso, refletindo sobre as novas possibilidades e adequando a aplicabilidade deste conhecimento à um novo contexto e cenário.

  3. Acho fantástica a criação de sites e softwares tão bem elaborados e funcionais! O Google a cada dia nos surpreende com novas funcionalidades, excepcional!

Deixe uma resposta