Importação de metadados em lote no DSPACE

Este é um pequeno tutorial de como criar arquivos para serem importados no DSPACE pela ferramenta de importação de metadados:

O primeiro passo é criar um arquivo csv (texto separado por vírgulas – importante: apesar de existirem outros separadores, sempre optar por vírgulas) em codificação UTF-8. Recomendo usar o Notepad++ para a criação deste arquivo. Ou mesmo no excel, mas importante lembrar que o excel só exporta csv com o separador ; . Então depois precisará converter esse arquivo.

Este arquivo só tem 2 campos obrigatórios, o id e o collection. O id para ser adicionado ao DSPACE como um novo registro precisa ter um valor + e o collection o handle da coleção.

Por exemplo:

id,collection,dc.contributor.author[pt_BR]
+,102/1024,”Silva, José || Nascimento, Antônio”
+,102/3045,”Santos, Francisco”

Este é um arquivo exemplo que já seria importado, criando dois registros com informações somente de autor em duas coleções diferentes. Notem que para mais de um valor em um campo, use o separador ||. Agora é só adicionar o nome do seu metadado em uma nova coluna usando o padrão que tem que estar registrado no seu DSPACE e adicionar quantas colunas forem necessárias.

Se a fonte dos dados for um registro MARC, use a ferramenta de exportar texto delimitado do MarcEdit.

Para importar o arquivo no dspace:

cd /PASTA DO APP DO DSPACE/bin
./dspace metadata-import -f /CAMINHODOARQUIVO/arquivo.csv -e email@instituicao.com

Caso tenham definido o passo do workflow, use o -w para que os registros entrem no processo de submissão.

Ainda não testei, mas na versão 3.1, no menu tem uma interface gráfica para importar o arquivo diretamente por lá.

Fiquem a vontade para fazer perguntas nos comentários.

2 pensamentos em “Importação de metadados em lote no DSPACE”

  1. Montei o arquivo cvs como manda o figurino, mas no momento de fazer o upload do arquivo apresenta uma mensagem :
    java.lang.ArrayIndexOutOfBoundsException: 1
    Creio que diz que “O índice usado é maior do que o número de itens da matriz”.
    Não sei o que pode estar errado ou faltando.

Deixe uma resposta