Interpretando registros MARC

Este post é um breve guia sobre registros bibliográficos MARC, para aqueles que normalmente não os criam ou editam, mas gostariam de entender melhor como funciona nos bastidores o catálogo de uma biblioteca.

INTRODUÇÃO AO MARC

O formato MARC foi desenvolvido por Henriette Avram na Biblioteca do Congresso dos EUA no final dos anos 1960 para permitir a transferência e manipulação de dados de catálogo por computadores. Em vez de ter que redigitar a mesma informação várias vezes em fichas de papel 3 x 5 polegadas, os catalogadores poderiam reutilizar as informações já inseridas, adicionar o que precisavam e imprimir quantos cartões fossem necessários (para arquivamento sob autor, título, assuntos, etc). Até hoje os registros nos principais catálogos de bibliotecas e outros catálogos eletrônicos são muito simplificados, porque foram originalmente planejados para impressão nas fichas de índice remissivo ou copiados à mão a partir de fichas criadas na era pré-MARC.

Inicialmente, apenas os bibliotecários tinham acesso à informação eletrônica, mas nos anos 80 os terminais de computador para acesso público ao acervo de uma biblioteca começaram a se tornar comuns. Como esses terminais mostravam dados em rede, e não dados armazenados apenas naquela máquina ou em um CD-ROM, por exemplo, eles ficaram conhecidos como Catálogos de Acesso Público Online, ou OPACs. O termo ainda é usado por bibliotecários, embora a noção de um catálogo “offline” hoje não faça mais sentido.

O MARC foi projetado para lidar com registros de autoridade (tabelas de nomes e assuntos oficialmente estabelecidos), registros bibliográficos (descrições genéricas de livros e outros itens nas coleções de uma biblioteca) e registros de acervos (informações específicas sobre os materiais armazenados fisicamente, incluindo número de chamada). O MARC é para ser legível por máquina, mas a maioria dos campos pode ser formatada para ser legível também ao olho humano; no entanto, pode parecer informação demais até que a pessoa se acostume a visualizar um registro completo. Para ter uma noção do como é um registro MARC, se você não trabalhou com ele antes, abra um ficha nos catálogos online das principais bibliotecas e procure por um link de visualização do MARC. Você vai ver algo mais ou menos assim:


[ficha MARC para “Olhai os lírios do campo” no catálogo da UFRJ]

PARTES DE UM REGISTRO MARC

Um registro bibliográfico MARC divide seus dados (a descrição bibliográfica) em partes fáceis de serem digeridas pelos computadores, por meio de campos e subcampos. Alguns blocos são bem formatados e outros vêm em texto livre, mas como todos eles estão em locais designados, um computador pode interpretar quais são seus usos e como eles devem ser analisados. Cada registro MARC inclui vários tipos de informações, agrupadas próximas umas das outras (embora isso esteja muito longe de ser consistente ou regular); a maior parte das informações é sobre o item que está sendo catalogado, mas algumas são sobre o registro em si e sua estrutura – novamente, para garantir que o computador possa interpretar o registro corretamente.

Naturalmente, quando se diz “o computador pode interpretar…”, normalmente estamos nos referindo a um programa em um computador, tal como um ILS (sistema integrado de biblioteca ou software de automação de bibliotecas), que gerencia os registros de usuários e o catálogo de uma biblioteca, ou o MarcEdit, que é especificamente projetado para fazer alterações em massa nos registros MARC. Os registros MARC são armazenados principalmente com a extensão .mrc ou .mrk (o último sendo uma forma ligeiramente mais legível por humanos), que não são prontamente reconhecidos pela maioria dos computadores sem programas especializados. Registros MARC também podem ser armazenados como texto (por exemplo, ao baixar registros de um catálogo, você será levado a uma página de texto gerada dinamicamente e precisará especificar a extensão .mrc para salvar seus registros) ou como XML, usando a especificação MARCXML.

CAMPOS

Cada linha do registro MARC é referida como um campo, distinguida por um número de três dígitos que informa ao visualizador que tipo de informação entra nesse campo. Entre os bibliotecários são referidos simplesmente pelos seus números de três dígitos: isto é, “o campo duzentos e quarenta e cinco” e “o campo cem”. Quando os catalogadores desejam se referir a um grupo de campos, eles frequentemente substituem x por alguns dos dígitos: ou seja, “campos 6xx” ou “campos 33x”.

SUBCAMPOS

A maioria dos campos é dividida em subcampos, diferenciados por letras, que permitem informações mais específicas. Por exemplo, o campo 245, que fornece o título e o autor do livro, pode ser dividido nos seguintes subcampos:

‡ a Título principal
‡ b Sub-título ou títulos adicionais
‡ c Declaração de responsabilidade

(Em alguns registros, o campo 245 também têm subcampos ‡ e ‡ p, que fornecem informações sobre a numeração ou subparte do item, se ele faz parte de uma série ou conjunto de várias peças. Você encontra esse tipo em registros de partituras para designar partes instrumentais, por exemplo.)

Como cada campo tem um propósito específico, seus subcampos podem significar coisas diferentes, mesmo que sejam codificados pelas mesmas letras. Os subcampos possibilitam extrair informações específicas de um registro ou conjunto de registros, ajudando a isolá-lo (por exemplo, quase todas as datas de publicação serão encontradas no subcampo ‡ c dos campos 260 ou 264).

INDICADORES

Muitos campos também possuem indicadores. Essas são dois dígitos extras que aparecem entre o número de três dígitos principal e o restante do campo, referidos como primeiro e segundo indicadores. Seu significado varia por campo, mas eles sempre dão informações sobre o conteúdo dos próprios campos. Para usar o campo 245 como exemplo novamente:

Primeiro indicador – informa se o campo 245 é precedido por um campo 1xx (se o livro tem um autor principal ou criador)
Segundo indicador – informa se o título inclui um artigo inicial (o, a, os, as, uma, etc) e, em caso afirmativo, quantos caracteres ele contém.

No exemplo 245 abaixo, o primeiro dígito indicador “1” significa que o campo 245 é precedido por uma entrada principal (o campo 100), enquanto o segundo dígito indicador “2” significa que existem 2 caracteres iniciais antes da primeira palavra do título (A-[espaço]).

100 10 ‡a Shakespeare, William, ‡d 1564-1616, ‡e autor
245 12 ‡a A tempestade / ‡c William Shakespeare

O exemplo acima só se aplica ao campo 245, e os indicadores para outros campos terão significado diferente. Consulte a documentação de cada campo individualmente.

DOCUMENTAÇÃO MARC

A Biblioteca do Congresso Americano (LoC), que primeiro projetou e atualmente mantém o padrão MARC, fornece uma grande documentação para os campos MARC em registros bibliográficos. A OCLC, a empresa por trás de várias ferramentas importantes de bibliotecas, como o catálogo coletivo Worldcat, também fornece documentação para o formato bibliográfico MARC; é semelhante à orientação da Biblioteca do Congresso, mas voltada para os catalogadores que trabalham com o cliente Connexion da OCLC, uma interface de catalogação amplamente utilizada nos Estados Unidos. A documentação da LoC e da OCLC inclui guias completos para o uso e a implementação de cada campo e a importância de seus indicadores e subcampos.

MARC é um padrão de formato, por isso determina a estrutura das informações adicionadas aos registros; a informação em si é determinada de acordo com os principais padrões de catalogação AACR2 e RDA. AACR2 é a segunda edição das Regras de Catalogação Anglo-Americanas e foi o principal padrão usado pela comunidade de catalogação desde sua criação em 1967. AACR2 foi criada com o formato MARC em mente, mas assumiu que livros e periódicos seriam a principal preocupação de catalogadores. Nos últimos anos, os catalogadores têm feito a transição gradual do AACR2 para o seu sucessor, RDA (Resource Description and Access), que foi criado para trabalhar com o MARC, mas não está vinculado a ele, e para levar em conta a ampla gama de materiais em coleções modernas de bibliotecas – livros, DVDs, pôsteres, kits de atividades, bancos de dados eletrônicos e tudo mais.

TRABALHANDO COM MARC

Além de sua documentação, a OCLC também tem um projeto que examina como os campos MARC são utilizados ​​nos registros do Worldcat (existem cerca de 2,2 bilhões até o momento). Os dados resultantes do uso do MARC no Worldcat permitem que você selecione um campo e veja quantos registros no sistema o utilizam e/ou seus subcampos; é um bom método pra ter uma ideia de quais (sub)campos podem ser úteis ou ricos em conteúdo. (Lembre-se de que isso representa todos os registros adicionados à Worldcat, que distorce bastante as publicações recentes em bibliotecas públicas e acadêmicas, especialmente no Brasil).

Algumas bibliotecas oferecem dados do MARC em estado bruto. Se você deseja trabalhar com uma seleção maior de dados a partir do OPAC, tente entrar em contato os administradores de sistema da biblioteca em questão para mais informações. Eu mesmo já pedi alguns arquivos mrc para o Murakami e ele gentilmente me enviou.

Além disso o programa MarcEdit é gratuito para download e tem alta funcionalidade, mas uma curva de aprendizado bastante suave. Veja o screencast da Folger Library sobre como exportar registros MARC para planilhas por meio do MarcEdit.

A Biblioteca do Congresso também reuniu uma lista de ferramentas do MARC; muitas são pagas e destinadas a uso institucional, mas também há vários recursos gratuitos e de menor escala entre os oferecidos. O wiki Code4Lib também possui uma página de recursos MARC, incluindo aplicativos, bibliotecas de programação e conjuntos de dados.

CAMPOS MARC

Abaixo está um apanhado geral de alguns dos campos mais frequentemente utilizados em um catálogo tradicional. Esta seção é propositalmente pequena, muito distante de uma lista completa. Para todos os campos, consulte a documentação da LoC ou da OCLC para obter informações adicionais sobre o uso.

Campo fixo (campos Líder e 008)
“Campo fixo ” é um termo coletivo para o conjunto de campos de caracteres limitados no cabeçalho de um registro MARC. O campo fixo abrange o Líder MARC e os campos 008; juntos, os campos Líder e 008 fornecem informações codificadas sobre o registro, o conteúdo intelectual que ele descreve e as normas de catalogação utilizadas. “Campo fixo ” é um termo baseado na OCLC, mas entrou em uso popular devido à sua concisão e ao uso generalizado da interface Connexion da OCLC, que agrupa os campos fixos em conjunto acima do corpo do registro.


[captura de tela da seção de campo fixo na interface do Connexion da OCLC]

A documentação da Biblioteca do Congresso inclui um guia de byte por byte para o campo líder e a OCLC fez o mesmo para sua seção de campo fixo. Uma vez que as informações nos campos Líder e 008 são determinadas de forma posicional, pode referir-se a cada tipo de informação pelas suas posições de caracteres: ou seja, o LDR/17 (nível de codificação) informa o leitor o quanto o registo é completo, enquanto o 008/35-37 contém o código de idioma de três dígitos para o idioma primário da manifestação que foi catalogada. Como você pode notar nesses exemplos, o campo fixo contém informações sobre o próprio registro e sobre a manifestação que o registro descreve.

0XX
O grupo de campos começando com 0 em um registro MARC na verdade não tem um assunto comum. Esses campos contêm informações administrativas e codificadas, números de chamada e informações sobre o próprio registro, entre outras coisas. Alguns campos comumente usados são:

020: número do ISBN
035: número de controle da OCLC. Cada registro adicionado ao banco de dados da OCLC terá um número exclusivo.
040: fonte da catalogação. Fornece informações sobre qual biblioteca criou o registro, quais padrões de catalogação eles usaram e quais bibliotecas o editaram desde então.
041: idioma da obra (usando códigos de idioma de três letras). Se for uma tradução, também indica a língua original.
043: área geográfica (usando códigos de países de três letras). Inclui o país em que a obra transcorre (por exemplo, Itália, para Romeu e Julieta), ou um local que o registro é sobre.
046: datas codificadas especiais.
050: número de chamada (esquema de classificação da Biblioteca do Congresso)
090: número de chamada local (pode ser Biblioteca do Congresso ou um esquema de classificação local)

1xx
Os campos que começam com um 1 são referidos como campos de entrada principal, e deve haver somente um deles em cada registro MARC. Eles contêm o nome da pessoa ou entidade que é a principal responsável pela criação do trabalho descrito no registro. Esta pode ser uma única pessoa, uma corporação, ou mesmo uma conferência ou outro tipo de evento (como no caso de anais de uma conferência). Os nomes que podem ser usados nos campos 1xx geralmente também podem ser usados em seus campos 7xx correspondentes; ou seja, um nome que é usado no campo 100 como uma entrada principal em um registro também pode ser usado no campo 700 como uma entrada adicional em outro registro (os nomes também podem ser usados nos campos 6xx como sujeitos quando aplicável; ver abaixo.) Os dois campos 1xx mais frequentes são:

100: entrada principal (nome pessoal)
110: entrada principal (nome coletivo/jurídico)

2xx
Os campos que começam com um 2 fornecem o título da obra que está sendo catalogada, e informações sobre sua edição, publicação e manufatura. Alguns campos comuns são:

240: título uniforme (o título oficial de uma obra, ou o título que é mais conhecido por)
245: título e declaração de responsabilidade
246: forma variável do título
250: edição
260: publicação
264: publicação (também pode incluir informações sobre produção, manufatura, distribuição e direitos autorais de um item, dependendo do segundo indicador). O campo 264 é um campo baseado no RDA e acabará por substituir o campo 260.

3xx
Os campos que começam com 3 contêm informações sobre a forma física e as características da obra. Muitos campos 3xx são desenvolvidos especificamente para descrever materiais audiovisuais, digitais e outros materiais não-livros. Alguns campos comumente usados são:

300: descrição física (número de páginas/volumes, presença de ilustrações ou outro conteúdo especial e tamanho físico)
336, 337, 338: conteúdo, tipo de mídia e suporte. Estes são comumente referidos coletivamente como os campos 33x. Eles são adições recentes ao MARC, acompanhando o advento do RDA como um padrão de catalogação.

4xx
Há atualmente apenas um campo 4xx, o campo 490 (há vários campos 4xx obsoletos, que ocasionalmente você pode encontrar em registros mais antigos). Ele contém a instrução de série de um item, conforme aparece na obra que está sendo catalogada, que pode não corresponder exatamente ao formulário oficialmente estabelecido sobre as instruções relacionadas à série.

490: declaração da série (transcrita do item)

5xx
Os campos que começam com 5 são usados para uma variedade de notas diferentes sobre a obra que está sendo catalogada. Isto pode abranger uma vasta gama: notas sobre bibliografias e tabelas de conteúdos, restrições de acesso, especificações audiovisuais, resumos, históricos de exposições ou apenas notas gerais sobre algum aspecto da obra que não pode ser facilmente incluído em outro lugar. Devido à sua natureza, a maioria dos campos de nota são carregados de texto livre. Alguns dos campos 5xx comumente usados incluem:

500: Nota geral. Aceita informações que não possuem nenhum outro campo dedicado.
504: Nota bibliográfica. Indica presença de bibliografia e/ou índice.
505: Nota de conteúdo.
506: Nota de restrições de acesso.
510: Nota de citação/referências.
520: Nota de resumos.
530: Nota de exemplar físico adicional disponível.
546: Nota de idioma. Uma versão em texto livre dos campos 041 e 008/35-37.
585: Nota de exposições.

6xx
Os campos que começam com 6 contêm descrições do assunto(s) da obra, e às vezes seu gênero e/ou forma também. Os nomes pessoais e corporativos que são usados nos campos 1xx e 7xx também podem ser usados nos campos 6xx quando eles são o assunto de uma obra. Vocabulários controlados são usados extensivamente nos campos 6xx. Comumente:

600: nome pessoa física (assunto)
610: nome coletivo (assunto)
651: nome geográfico (assunto)
655: gênero/forma

7xx
Os campos que começam com 7 são usados para fornecer acesso adicional à obra que está sendo catalogada, como localizações geográficas relacionadas, entidades adicionais envolvidas na criação ou produção de um título, ou outros títulos relacionados (como em um livro que possui várias reproduções). O grupo de campos 77x são usados como “campos conectores” para associar o registro com outros registros relacionados; por exemplo, para vincular um fascículo especial à versão completa de um periódico ou vincular uma versão impressa à um recurso digital. Alguns campos 7xx comuns são:

700: entrada secundária (nome pessoal)
710: entrada secundária (nome coletivo)
740: entrada secundária (título não controlado – ou seja, um título que não é oficialmente estabelecido, mas que pode ser útil para usuários do catálogo)
751: entrada secundária (nome geográfico). Usado para a associação do lugar com o conteúdo da obra, por exemplo, localização de uma peça de teatro ou sermão. Não confunda com o campo 043.
752: entrada secundária (nome de local hierárquico). Usado para o lugar de publicação, impressão, etc.
776: forma física secundária.

8xx
Os campos que começam com 8 têm diversos usos: para fornecer acesso adicional através do título da série, da nota e/ou da ligação aos formatos adicionais da obra que estão sendo catalogados, ou especificar a informação local do título no acervo (aplicável somente a uma determinada instituição, não a todas as cópias). Alguns campos 8xx comumente usados são:

830: título de série uniforme (o título oficialmente estabelecido, ou controlado, para uma série)
852: localização do recurso (dentro da biblioteca). Isso é usado principalmente em registros locais para especificar qual estante da biblioteca um item está localizado e observar quaisquer recursos exclusivos do item. Também aparece no registro bibliográfico principal para garantir que seja pesquisável por palavras-chave.
856: acesso eletrônico. Se uma versão digitalizada de um item físico estiver disponível, ela será vinculada a aqui.

9xx
Os campos que começam com 9 são considerados obsoletos e não são mais utilizados em registros MARC, mas você pode encontrá-los usados em registros mais antigos para anotar informações locais e/ou administrativas.

[texto original Interpreting MARC records]


[registro MARC para os 24 sonetos de Shakespeare, catálogo da rede Pergamum]


Deixe uma resposta

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.