PREMIS (Data Dictionary for Preservation Metadata)

Les métadonnées administratives (ou de gestion) contiennent l’information de préservation (ou de pérennisation) décrite dans le modèle OAIS. PREMIS est un format de métadonnées largement utilisé dans le monde des bibliothèques et de l’édition numérique qui permet de contenir non seulement les métadonnées administratives mais aussi les métadonnées descriptives. 

Les métadonnées administratives décrivent les objets numériques au niveau physique : nom, format, empreinte, lieu de stockage, matériels et logiciels nécessaires pour la lecture, relations avec d’autres objets numériques. Elles décrivent les évènements de l’archivage tels que les dates de versement, de réplication, de suppression ou de migration des objets, de même que des actions visant à vérifier la validité des format, à tester l’absence de virus ou la fixité des objets dans le temps, de même que les droits d’utilisation et les licences associés aux objets, les personnes, organismes et logiciels jouant un rôle.

PREMIS fournit un cadre de travail, un modèle de données, un schéma XML extensible, ainsi qu’un glossaire et des recommandations d’implémentation. Publié à l’initiative de l’OCLC (Online Computer Library Center) et du RLG (Research Library Group), une première version voit le jour en 2003; la version courante date de Janvier 2011. Le site est hébergé par la Bibliothèque du Congrès.

5 entités correspondant à autant d’unités sémantiques sont définies. Le dictionnaire comprend pour chaque entité des éléments répartis par groupe, décrits avec des exemples et des notes d’application, des éléments cœurs dont l’emploi est obligatoire sont définis.

Entité Objet

3 types d’objets sont distingués :
–  Les objets « fichiers » correspondent aux objets qui font sens de manière isolée. Il s’agit par exemple d’un fichier PDF ou JPEG.
–  Les objets « représentation » sont des objets composites qui nécessitent la juxtaposition de plusieurs types de données pour prendre sens. Une page HTML par exemple peut nécessiter un fichier HTML, un fichier CSS, des données javascript et des images pour être lisible.
–  Les objets « bitstream » sont les composantes des objets composites. La bande son d’un film, l’image d’une page HTML par exemple.

L’entité « Objet » définit 95 éléments dont 8 sont obligatoires. Les principaux éléments sont l’identifiant de l’objet (objectIdentifier), le niveau de préservation souhaité (preservationLevel). Certains éléments concernent les caractéristiques physiques de l’objet, telles que la taille (size), le format (format), le nom initial (originalName), le lieu de stockage (storage), la fixité (fixity). La fixité, analysée à l’aide de l’empreinte, permet de vérifier la stabilité de constitution de l’objet entre deux dates. D’autres éléments concernent l’environnement de l’objet, en particulier les dépendances pour la lecture en matière logicielle ou matérielle, les relations avec d’autres objets.

Entité Evènement

Un évènement dans une archive consiste en une action aboutissant à la modification durable de un ou plusieurs objets. Des exemples sont la création, l’ingestion, la réplication ou la suppression d’un objet, la vérification de la fixité, la validation d’un format, la recherche de virus dans les objets.  Des noms d’agent – personne, organisme ou logiciel – et leur rôle dans l’évènement peuvent être spécifiés. L’entité contient 17 éléments répartis en 13 groupes. L’identifiant d’un évènement, son type et sa date sont obligatoires. Un index par type d’évènement fournit une liste des actions importantes de l’archive.

Entité Agent

5 éléments répartis en 3 groupes permettent de décrire les personnes, les organismes ou les logiciels qui jouent un rôle actif dans d’autres entités tels que Evènements ou Droits. L’identifiant de l’agent, son nom et son rôle sont obligatoires.

Entité Droits

18 éléments répartis en 2 groupes permettent de détailler les droits associés à l’objet incluant les licences, les restrictions d’usage, les agents impliqués et leur rôle, ainsi que le statut juridique de l’objet.

Entité Intellectuel

Contrairement aux autres entités, l’entité Intellectuel ne contient pas d’information administrative mais l’information de description. PREMIS préconise  l’emploi de Dublin Core, MARCXML ou MODS en extension de PREMIS. L’identifiant de l’objet est obligatoire pour cette entité.

En conclusion

Maintenu actuellement par la Bibliothèque du Congrès, le format de métadonnées administratives PREMIS comprend plus de 130 éléments nécessaires pour gérer la préservation sur le long terme des objets numériques. PREMIS est souvent utilisé en extension de METS (Metadata Encoding and Transmission Standard), un format conteneur qui sera présenté dans le post suivant. Des travaux en cours conduisent au développement d’une ontologie OWL de PREMIS, facilitant l’utilisation du format pour l’intégration au web sémantique.

Site web : http://www.loc.gov/standards/premis/
PREMIS :http://www.loc.gov/standards/premis/v2/premis-2-1.pdf
Version simplifiée : http://www.loc.gov/standards/premis/understanding-premis.pdf
Exemple : http://www.loc.gov/standards/premis/louis-2-1.xml
Survol en français : http://www.loc.gov/standards/mets/METSOverview.v2_fr.html
Ontologie OWL de PREMIS : http://duraspace.org/premis-loc-preservation-metadata-maintenance-activity-owl-ontology-available-review

, , , ,

  1. Poster un commentaire

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :