Le modèle de référence OAIS

Le Modèle de Référence OAIS (Reference model for an Open Archival Information System) est un document qui décrit l’organisation humaine et informatique à mettre en place dans le but d’archiver des objets numériques ainsi que leurs descriptions sur le long terme. Le long terme est défini de manière vague comme une période « suffisamment longue pour être concernée par les conséquences de changement technologiques, incluant la venue de nouveaux médias et de nouveaux formats de données, ou bien par un changement de la communauté des utilisateurs ». Un modèle de référence désigne en ingénierie un environnement de travail abstrait décrit par un groupe d’experts pour encourager une communication claire. Les concepts sont définis et reliés entre eux par des relations. Le modèle OAIS définit de manière générique les actions des archivistes, des informaticiens et des logiciels à mettre œuvre en vue d’atteindre une préservation pérenne des documents confiés à une archive numérique.

Promu par le Consultative Committee for Space Data Systems (CCSDS) (1), le modèle est publié dans une première version en 2002. Le CCSDS est spécialisé dans la promulgation de recommandations pour l’industrie aérospatiale et comprend parmi ses membres la NASA, l’ESA et le CNES. La recommandation devient normalisée ISO 14721 en 2003 (2). Une traduction française est publiée en 2005 (3), suivie d’une mise à jour datée de 2009 (4). Une nouvelle version en anglais est mise à disposition en juin 2012 (5) dont la traduction française se trouve finalisée en 2017 (6). Ces nouvelles versions intègrent notamment la notion d’interopérabilité entre archives de même que la question de l’ouverture du code source des logiciels.

Le modèle introduit des vocabulaires spécifiques notés dans ce billet en italique. Le terme “Open” du titre fait référence au fait que la norme est élaborée dans des forums ouverts et se trouve librement accessible. Les normes ISO se trouvent commercialisées par l’organisme du même nom. Le Modèle OAIS peut être respecté par tous types d’archives numériques, que celles-ci soient gouvernementales, privées ou dédiées à la recherche. Des audits réguliers de l’Archive sont prévus. Des normes supplémentaires créées en 2014 « ISO 16363 » (7) et « ISO 16919 » (8) décrivent l’organisation de ces audits et les types d’organismes à même de les réaliser.

Des Paquets d’information

Les données et métadonnées à diffuser et préserver sont nommées Paquet d’information / Information Package. Ces paquets rassemblent en un seul ensemble susceptible d’être préservé ou transmis les fichiers et les métadonnées liées à ceux-ci. 3 types de paquets sont distingués selon leur état et leur niveau de traitement dans le système d’archivage. On distingue le Submission Information Package (SIP) / Paquet d’information versé soumis par le Producteur à l’Archive. L’Archival Information Package (AIP) / Paquet d’Information archivé désigne les fichiers et les métadonnées stockés respectivement dans un système de fichier et dans une base de données. Le Diffusion Information Package (DIP) / Paquet d’Information Diffusé correspond au paquet de données distribué à l’Utilisateur. Le modèle détaille les différentes catégories de métadonnées associées aux objets numériques respectivement (a) information de représentation, (b) information de pérennisation, (c) information d’empaquetage et (d) information de description.

Des acteurs et des rôles

Les intervenants – les agents – voient leur rôles et responsabilités également définis. Les agents externes à l’Archive OAIS comprennent les Producteurs, les Utilisateurs et le Management. Le Producteur verse dans l’archive les objets numériques et les métadonnées  à préserver. L’Utilisateur accède aux données. Un groupe particulier d’utilisateurs constitue la Communauté cible des utilisateurs. Des interactions spéciales sont prévues entre les agents de l’Archive et les membres de ce groupe client du système d’archivage.

Le Management gère la gouvernance et veille au soutien financier sur le long terme. Les séries de tâches sont réalisées par des éléments nommés Entité. Les acteurs internes de l’Archive doivent réaliser des Fonctions. Celles-ci seront selon les cas typiquement réalisées par des professionnels de l’archivage ou bien par des logiciels. Certaines fonctions nécessitent la collaboration entre entités.

Des entités et des fonctions

Au final, le modèle OAIS définit 7 Entités qui doivent assurer 30 Fonctions. Des exemples de fonctions sont “Élaborer des standards et des règles” ou bien “Gérer la hiérarchie de stockage”. Certaines fonctions nécessitent le savoir faire de plusieurs spécialistes de l’archivage ou de l’informatique, d’autres seront typiquement réalisées par des machines correctement programmées et maintenues.

Figure 1 : Entités d’une archive OAIS et types d’informations

Les Entités du modèle OAIS sont les suivantes:

  • L’entité Entrées assure la réception et la validation du Paquet d’Information versé (SIP) en provenance du Producteur. Elle réalise l’extraction de l’Information de description et la fabrication du SIP. Le calcul de la somme de contrôle des fichiers est réalisé. Cette somme recalculée périodiquement permet de s’assurer que l’objet stocké ne subit pas d’altération au cours du temps.
  • L’entité Stockage assure l’archivage, la maintenance et la diffusion du Paquet d’Information Archivé (AIP). Le stockage est prévu dans un système de fichier sur des supports variés. Des actions régulières de maintenance des données sont programmées. Elles incluent le rafraîchissement ou le remplacement du support de stockage. Des migrations de formats de données peuvent également s’avérer nécessaires. Un contrôle d’intégrité physique s’applique à chaque fichier de l’objet. Le Plan de Reprise d’Activité consiste dans le cas de la maintenance d’archives électroniques à s’assurer principalement que les données sont dupliquées en un lieu physiquement éloigné. Elles se trouvent ainsi préservées en cas de sinistre majeur et peuvent être récupérées.
  • L’entité Gestion des données regroupe les fonctionnalités d’administration et d’utilisation de la base de données. La base de données contient les métadonnées des AIP transmises par les Entrées. L’entité gère les requêtes des Utilisateurs. Les fonctions de cette entité sont typiquement réalisées par une base de donnée relationnelle.
  • L’entité Administration typiquement humaine regroupe les fonctions de la vie courante des archives. L’Administration négocie avec le Producteur les protocoles de versement et contrôle la qualité des soumissions. Elle gère les droits d’accès des intervenants, adresse  les  facturations aux utilisateurs avec les informations en provenance de  l’Accès, répond aux demandes d’informations, émet des rapports statistiques concernant les documents archivés et consultés. Plus important pour la pérennité des données, l’administration élabore les standards et les règles de l’Archive, et assure les migrations de formats nécessaires.
  • L’entité Planification de la pérennisation assure des fonctions de veille technologique dans le domaine des formats et des standards. Elle interagit avec le Producteur et l’Utilisateur cible pour s’assurer de la qualité des services rendus et pour faire évoluer les formats supportés par l’archive. Elle élabore les plans de migration en collaboration avec l’Administration.
  • L’entité Accès met à disposition de l’Utilisateur des fonctionnalités de recherche et délivre le Paquet d’Information Diffusé (DIP). Celui-ci contient les fichiers et métadonnées rassemblées en un seul paquet. Cette diffusion tient compte des droits d’accès de l’utilisateur. L’entité coordonne les fonctionnalités de la Gestion de Données et du Stockage pour fournir à l’utilisateur le paquet souhaité. Elle s’occupe des relations avec l’Utilisateur et de la facturation en interaction avec l’Administration.
  • L’entité Service de base absente du schéma et typiquement assuré par l’informaticien comprend le Système d’exploitation, le Réseau, la Sécurité informatique et correspond aux fonctions du service informatique, à la maintenance matérielle et logicielle.
Figure 2 : Relations entre les fonctions des entités.
  1. Le Modèle OAIS (2002) : Lien, Wikipédia : Lien
  2. ISO 14721 (OAIS – un modèle de référence qui définit le fonctionnement d’une archive dans le but d’assurer la préservation à long terme de l’information numérique) (2003) : Lien
  3. Reference Model for an Open Archival Information System (OAIS)  en français (2005) : Lien
  4. Reference Model for an Open Archival Information System (OAIS) (2009) : Lien
  5. Reference Model for an Open Archival Information System (OAIS). Magenta Book. Issue 2. (2012) : Lien
  6. Traduction en français du modèle de 2012, (2017) : Lien
  7. ISO 16363 (Audit et certification des entrepôts numériques dignes de confiance – établissement de mesures complètes de ce que doit faire une archive, basé sur OAIS)
  8. ISO 16919 (Requis pour les organismes réalisant les audits et certifications des entrepôts numériques dignes de confiances – spécifie les compétences et les requis des organismes qui font les audits)
  9. Reference model : Lien

Autres liens

  • Archivage électronique : Lien
  • Plan de préservation numérique : Lien
  • Audit and certification of trustworphy digital repositories, Magenta book, 2011 : Lien
  • Data Seal of Approval : Lien
  • DRAMBORA : Lien
  • Who would you trust ? On standards and audits : Lien
  • La certification d’un système d’archivage électronique : normes, démarche, expérience, La Gazette des Archives, Béchard, 2013 : Lien

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s