Les métadonnées descriptives : quelques formats spécialisés

Les métadonnées descriptives contiennent l’Information de description telle que définie dans le modèle OAIS. Elles comprennent  notamment le titre, les auteurs, le résumé, les mots-clés, le code de classement, des dates, l’identifiant des objets. De nombreux formats de métadonnées tels que  EAD, MARC ou MODS ont été développés pour répondre aux exigences rencontrées dans les métiers de l’archivage, des bibliothèques, de l’édition, des musées ou de la recherche. 

EAD (Encoded Archival Description)

EAD est utilisé en France par les archives nationales et départementales, par certaines bibliothèques dont la BNF et certains musées essentiellement pour décrire des objets physiques tels que des manuscrits, des livres, des films, des cartes, mais aussi  des objets numériques. C’est un format XML maintenu par la Bibliothèque du Congrès et par la SAA (Society of American Archivists) dont la dernière version date de 2002. Des éléments textuels des objets peuvent être incorporés aux métadonnées pour améliorer la description et faciliter les recherches.

Encoded Archival Description : Version 2002 Official Site http://www.loc.gov/ead/
Aux Archives de France : http://www.archivesdefrance.culture.gouv.fr/gerer/classement/normes-outils/ead/
BNF : http://www.bnf.fr/fr/professionnels/formats_catalogage/a.f_ead.html
Société des Archivistes Américains : http://www.archivists.org/saagroups/ead/

Les formats dérivés de MARC (MAchine Readable Cataloging)

MARC est utilisé par les bibliothèques pour encoder les métadonnées des objets physiques ou numériques qu’elles collectent, tels que les livres, les périodiques et les articles. Publié en 1968 par la Bibliothèque du Congrès, normalisé ISO 2709 en 1973, le format  nécessite l’utilisation d’un logiciel spécialisé pour être lu. Les champs et les sous-champs sont identifiés à l’aide d’un code à 3 chiffres suivi d’une lettre.

Le format MARC a donné naissance à un grand nombre de variantes nationales et internationales parmi lesquelles on peut citer INTERMARC utilisé par la BNF (Bibliothèque Nationale de France) depuis 1974, UNIMARC créé par l’IFLA (International Federation of Library Associations and Institutions) en 1977, MARC 21 publié en 1994 par la Bibliothèque du Congrès.

Ces formats ont ensuite été déclinés en schémas XML en vue de faciliter la lecture et les échanges. Créé en 1999 par le ministère de la Culture français, BiblioML retranscrit UNIMARC en XML. Publié en 2002 par la Bibliothèque du Congrès, le format MARCXML est une transcription en XML de MARC 21. Développé en 2002 par la bibliothèque du congrès également, le format MODS (Metadata Object Description Schema) intègre les principaux champs de MARC dans des balises explicites, ce qui facilite la lecture des métadonnées par des non-spécialistes du catalogage. Ce dernier format évolue régulièrement, la version 3.4 est publiée en 2010. Certaines archives exportent leurs métadonnées en MODS à l’aide de OAI-PMH.

Les formats MARC 21 : http://www.loc.gov/marc/marcdocz.html
Le format MARCXML : http://www.loc.gov/standards/marcxml/
Le format UNIMARC : http://www.ifla.org/unimarc
Le format INTERMARC :
http://www.bnf.fr/fr/professionnels/f_intermarc/s.format_intermarc_biblio.html
Le format MARCXML : http://www.loc.gov/standards/marcxml/
Exemple de fichier MARCXML – les champs MARC 21 sont transcrits dans l’attribut tag du champ controlfield, les sous-champs dans l’attribut code de subfield : http://www.loc.gov/standards/marcxml/xml/collection.xml
Le format MODS : http://www.loc.gov/standards/mods/
Exemple de fichier MODS : http://www.loc.gov/standards/mods/v3/mods99042030.xml

Autres formats de métadonnées descriptives

La diversité des objets et des usages a entraîné récemment l’émergence de nouveaux formats dont l’évolution est encore en cours; les changements de version sont fréquents. Sans prétendre à l’exhaustivité, voici des liens vers quelques formats classés par domaine d’application.

Description des autorités, personnes et organismes  :

Données démographiques et sociologiques :

Géo-localisation :

Livres,  périodiques, licences et droits de reproduction :

Ressource visuelle :

Sites archéologiques, monuments historiques :

Corpus oraux :

Données multimédias :

En conclusion :

Si les formats EAD et MARC sont employés depuis de nombreuses années pour décrire des centaines de millions d’objets physiques et numériques, de nombreux autres formats, parfois concurrents, sont apparus récemment, trouvant des applications dans de nombreux domaines. Seuls les formats adoptés par un grand nombre d’archives, supportés durablement par des institutions solides seront à même d’émerger.

, , , , , , , , , ,

  1. Poster un commentaire

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :