Identificadores de fragmento e DOIs

Antes do conteúdo (ou quase tudo nessa vida) se tornar digital, nós utilizávamos números de página para descrever uma seção específica de um livro ou documentos longos (antes disso, os manuscritos antigos usavam o folio). Os números das páginas migraram para os livros eletrônicos, e leitores como o Kindle oferecem algum tipo de suporte à paginação e sequência de páginas.

folio

Para conteúdo na web, podemos usar o identificador de fragmento #, por exemplo, https://en.wikipedia.org/wiki/Fragment_identifier#Proposals para visualizar uma seção específica de uma página web. Como a ligação a este fragmento é tratada depende do tipo MIME do documento, e será, por exemplo, feita de formas diferentes para uma página de texto e um vídeo – YouTube entende minutos e segundos em um vídeo como identificador de fragmento, por exemplo, https://www.youtube.com/watch?v=0UNRZEsLxKc#t=54m52s. Identificadores de fragmento não são úteis apenas para linkar a uma subseção de um documento, mas, claro, também para a navegação dentro de um documento.

Tudo isso é, naturalmente, muito relevante para o conteúdo acadêmico, que normalmente é muito mais estruturado, com a maioria dos artigos de periódicos seguindo o formato IMRD – introdução, métodos, resultados e discussão – geralmente com seções adicionais, tais como resumo, referências, etc. Uma abordagem para a ligação de figuras e tabelas dentro de artigos acadêmicos é o uso de componentes DOIs, por exemplo, DOIs específicos para partes de um documento maior. A editora PLOS vêm utilizando-os por um longo tempo, o número de componentes DOIs está aumentando, mas a maioria dos artigos de periódicos acadêmicos ainda não utilizam componentes DOIs. E embora os componentes DOIs sejam um grande conceito para conteúdo como figuras (nos permitindo descrever o tipo MIME e outros metadados relevantes), eles provavelmente não são a melhor ferramenta de ligação para uma seção ou parágrafo de um documento acadêmico.

Acontece que já temos uma ferramenta para isso, visto que o servidor proxy DOI encaminha identificadores de fragmentos. Podemos, portanto, usar um DOI com um identificador de fragmento para:

Seção de resultados: http://dx.doi.org/10.1371/journal.pone.0103437#s2
Referências específicas: http://dx.doi.org/10.12688/f1000research.4263.1#ref-7
Decisão editorial: http://dx.doi.org/10.7554/eLife.00471#decision-letter

Obviamente, isso só funciona se o DOI é resolvido para o texto completo, e não uma página de destino. E a maneira como os identificadores de fragmentos são nomeados e implementados é uma decisão do editor, o resolvedor DOI não possui nenhuma informação sobre eles. Esses links específicos são particularmente úteis para as discussões de um artigo, seja no Twitter ou em um fórum de discussão. Parece que, pelo menos, o encurtador de links do Twitter mantém o identificador de fragmento (o link para a carta de decisão da eLife é encurtado para http://t.co/URWaYmGHnY). Esse tipo de vinculação funciona particularmente bem se o editor está usando um sistema refinado de identificadores de fragmentos. A editora PeerJ por exemplo, permite ligações a um parágrafo específico – por exemplo, http://dx.doi.org/10.7717/peerj.500#p-15 – e permite que os usuários façam perguntas ao lado daquela seção.

Todos exemplos acima usam o tipo MIME texto/html, pois esse é o que os DOIs de exemplo resolvem por padrão. Não sei se e como os editores têm implementado identificadores de fragmentos de outros formatos, como PDF ou ePub, e o que acontece se você combinar identificadores de fragmentos com negociação de conteúdo. O serviço shortDOI também trabalha com identificadores de fragmentos: http://doi.org/pxd#decision-letter. Outra questão interessante seria como identificadores de fragmentos são tratados pelos conjuntos de dados. Normalmente DOIs separados são atribuídos para vários conjuntos de dados relacionados, mas poderia também haver um lugar para identificadores de fragmentos, bem como, por exemplo, para especificar um subconjunto através de um intervalo de datas. A solução depende de novo sobre o tipo de conteúdo, e o popular texto/csv infelizmente não é bem adequado para isto, enquanto o JSON – usando JSON Pointer – funcionaria bem.

Além disso, manusear o identificador de fragmento é uma opção do cliente e o identificador de fragmento não é enviado para o servidor. O Acrobat Reader, por exemplo, suporta o identificador de fragmento #page=. Também há uma RFC7111 para identificadores de fragmento para o tipo de mídia texto/csv – browsers no futuro podem aceitar algo como http://example.com/data.csv#linha=5-7.

via Martin Fenner

Deixe uma resposta