Migração de registros de uma Tabela para o MARC21

Acabamos de passar por um processo de migração de registros de nosso sistema anterior para o Koha, que utiliza o formato MARC para importação e acho bacana compartilhar o processo.

1º Passo: Transformar o arquivo em uma tabela

Normalmente não é necessário executar esse passo. A grande maioria dos softwares de biblioteca exporta em algum formato de tabela ou é muito comum utilizar um software de planilha para gerenciar os primeiros registros de uma biblioteca. Mas é possivel que se depare com um arquivo texto com os registros. O primeiro passo então é transformar o arquivo em uma tabela, delimitando os campos por algum caractere específico. O mais comum é o ; (ponto e vírgula). Para tanto, é necessário é retirar todos os caractéres ; do arquivo, pois podem quebrar o texto no local errado. Depois disso, identificar padrões de quebra e substituir essas quebras por ; . O melhor software que encontrei para isso foi o Bless Hex Editor (Editor de texto hexadecimal que permite a edição rápida de uma grande quantidade de texto. Somente para Linux e pode ser baixado na Central de Programas do Ubuntu. Mas existem editores hexadecimais para Windows também). Salve como csv e abra em um editor de planilhas. Se seu arquivo tiver até 65000 registros, salve em xls (arquivo padrão do Excel), se tiver mais mantenha em csv.

2º Passo: Corrigir os registros

Os registros feitos manualmente ou em sistemas que não tenham controle de autoridades costumam ter muitas falhas e erros de digitação. Então vale a pena fazer uma correção antes de importá-los para o novo sistema. O caminho natural é utilizar os corretores ortográficos dos editores de planilhas. Mas é uma correção que se limita a corrigir erros ortográficos mais fáceis. Indico o Google Refine para uma correção mais completa. O Google Refine é uma ferramenta poderosa para o tratamento de grandes quantidades de dados. Ele permite alterar Maiusculas para minusculas, usar expressões regulares para realizar edições em diversas células e a opção que mais usei: Clusterização semântica. Há diversas regras pré-definidas de identificação de clusters, que permite achar diferenças e mesclar registros como:

Jorge, Flávio
Flávio, Jorge

ou

Freitas, Vera Lúcia de
Freitas, Vera Lúcia

Ele tem a opção de você digitar a alternativa correta e corrige todos os outros registros. Após realizar todas as correções, é possível exportar o arquivo em xls (Formato Excel)

3º Passo: Transformar Excel em MARC21.

Use o MarcEdit. É um software gratuito mantido pela Universidade de Oregon que entre outras coisas traduz o seu arquivo para o MARC. Para tanto, é necessário mapear todas as colunas de sua tabela e identificar em qual campo MARC ela será incluída usando o MarcEdit Delimited Text Translator.

Depois de traduzido para MARC, é necessário verificar a consistência de seus registros utilizando o validador de registros do MarcEdit. Ele irá identificar principalmente valores inválidos nos campos e falta de indicadores de campos. É possível corrigir os indicadores ou adicionar novos campos pelo editor. Vale a pena ler este texto do Fabrício Assumpção que explica a edição de registros MARC no MarcEdit.

E pronto. Você terá um arquivo MARC de seus registros que poderá ser importado em qualquer sistema de biblioteca que adote o padrão.

2 pensamentos em “Migração de registros de uma Tabela para o MARC21”

  1. Será possível ajudar-me dando-me algumas ideias de como passar um ficheiro ISO2709 para MARC21?

    Queria começar a usar o KOHA, mas esta incapacidade de fazer a migração de dados para MARC21 está-me a dificultar a vida…

    Obrigado.

    Cumprimentos,

Deixe uma resposta