Le modèle de référence OAIS

Le Modèle de Référence OAIS (Reference model for an Open Archival Information System) décrit l’organisation humaine et informatique à mettre en place dans le but d’archiver et de délivrer des objets numériques ainsi que leurs descriptions sur le long terme. Le long terme est défini de manière vague comme une période « suffisamment longue pour être concernée par les conséquences de changement technologiques, incluant la venue de nouveaux médias et de nouveaux formats de données, ou bien par un changement de la communauté des utilisateurs ». Globalement, un modèle de référence désigne en ingénierie un environnement de travail abstrait décrit par un groupe d’experts pour encourager une communication claire dans le cadre de projets complexes. Les concepts clés identifiés se trouvent définis extensivement et reliés entre eux par des relations. Le modèle OAIS précise de manière globale les actions que les archivistes et informaticiens doivent entreprendre de même que les fonctionnalités logicielles nécessaires à mettre en œuvre sur le long terme dans le but de préserver et diffuser les documents des archives numériques.

Financé par le Consultative Committee for Space Data Systems (CCSDS), une association rassemblant les principales agences spatiales mondiales dont la NASA, l’ESA et le CNES [1], le modèle est publié dans une première version en 2002. Une traduction française en est publiée en 2005[2], suivie d’une mise à jour datée de 2009[3]. Une nouvelle version est mise à disposition en juin 2012[4] dont la traduction française est finalisée en 2017[5]. Cette dernière version intègre la notion d’interopérabilité entre archives de même que la question de l’ouverture du code source des logiciels.

Le CCSDS publie également en 2011 le rapport dit magenta de la couleur de sa couverture « Trustworthy Repositories Audit & Certification (TRAC) »[6] relatif à l’audit et à la certification des entrepôts de fichiers numériques, prenant en compte le fait que les organismes conformes à OAIS doivent être évalués régulièrement (tous les 4 ans) par des organismes experts extérieurs. Mais TRAC n’est pas le seul système de certification possible.

Le modèle OAIS introduit un vocabulaire normalisé noté dans ce billet en italique. Le terme “Open” d’OAIS fait référence au fait que le modèle est élaboré par le CCSDS dans des forums ouverts et se trouve de nos jours librement accessible, non pas que le modèle concerne spécifiquement les archives ouvertes. Le Modèle OAIS peut servir de référence à tous types d’archives numériques, que celles-ci soient gouvernementales, privées ou ouvertes, dédiées à l’administration, la recherche ou l’industrie.

Le CCSDS entreprend en parallèle de ses travaux de publication ouverte des efforts de normalisation en partenariat avec l’ISO (International Standard Office) poursuivis sur le long terme. La recommandation devient normalisée au niveau international sous le nom ISO 14721 dans une première version en 2003[7]. Les normes ISO sont révisées régulièrement et une deuxième version de la même norme est publiée en 2012[8]. Des audits réguliers des Archives sont prévus. Les normes « ISO 16363″[9] dérivées de TRAC et « ISO 16919″[10] décrivent l’organisation des audits et les types d’organismes à même de les réaliser.

Le processus d’audit se montre particulièrement délicat et exigeant si bien que les professionnels de l’information ont élaboré souvent au niveau national d’autres modèles d’évaluation que TRAC. Ces systèmes incluent « Core Trust Seal » aux Pays-Bas, nestorSEAL en Allemagne, « Digital repository audit method based on risk assessment (DRAMBORA) » par le Digital Curation Centre (UK) et le DigitalPreservationEurope, « Digital Preservation Capability Maturity Model (DPCMM ) », « Levels of Preservation » par le National Digital Stewardship Allliance aux USA.

  1. Le Modèle OAIS (2002) : Lien, Wikipédia : Lien
  2. Reference Model for an Open Archival Information System (OAIS)  en français (2005) : Lien
  3. Reference Model for an Open Archival Information System (OAIS) (2009) : Lien
  4. Reference Model for an Open Archival Information System (OAIS). Magenta Book. Issue 2. (2012) : Lien
  5. Traduction en français du modèle de 2012, (2017) : Lien
  6. Audit and Certification of Trustworthy Digital Repositories (2011) : Lien
  7. ISO 14721:2003 (Système ouvert d’archivage d’information – Modèle de référence) : Lien
  8. ISO 14721:2012 (Système ouvert d’archivage d’information (SOAI) – Modèle de référence) : Lien
  9. ISO 16363:2012 (Audit et certification des entrepôts numériques dignes de confiance – basé sur OAIS) : Lien
  10. ISO 16919:2014 (Requis pour les organismes réalisant les audits et certifications des entrepôts numériques dignes de confiances – spécifie les compétences et les requis des organismes qui font les audits) : Lien
  11. Trustworthy Repositories Audit & Certification : Lien
  12. Digital repository audit method based on risk assessment : Lien
  13. DRAMBORA, un système d’autoévaluation : Lien
  14. Core Trust Seal : Lien
  15. La certification d’un système d’archivage électronique : normes, démarche, expérience, La Gazette des Archives, Béchard, 2013 : Lien

1. Des Paquets d’information

Les données et métadonnées à diffuser et préserver doivent être acquises, préservées et diffusées conjointement en ensembles de fichiers liés nommés Paquet d’information / Information Package. Ils rassemblent en un seul document composite les fichiers et les métadonnées liées à ceux-ci. Trois types de paquets d’information sont distingués selon leur état et leur niveau de traitement dans le système d’archivage. On distingue le Submission Information Package (SIP) / Paquet d’information versé soumis par le Producteur à l’Archive. L’Archival Information Package (AIP) / Paquet d’Information archivé désigne les fichiers et les métadonnées stockés respectivement dans un système de fichier et dans une base de données. Le Diffusion Information Package (DIP) / Paquet d’Information Diffusé correspond au paquet de données distribué à l’Utilisateur. Le modèle détaille les différentes catégories de métadonnées associées aux objets numériques respectivement (a) information de représentation, (b) information de pérennisation, (c) information d’empaquetage et (d) information de description.

2. Des acteurs et des rôles

Les intervenants – les agents – voient leur rôles et responsabilités définis par le modèle de référence. Les agents externes à l’Archive OAIS comprennent les Producteurs, les Utilisateurs et le Management. Le Producteur verse dans l’archive les objets numériques et les métadonnées  à préserver. L’Utilisateur accède aux données. Un groupe particulier d’utilisateurs constitue la Communauté cible / Targeted audience des utilisateurs. Des interactions spéciales sont prévues entre les agents de l’Archive et les membres de ce groupe en quelque sorte client du système d’archivage.

Le Management gère la gouvernance et veille au soutien financier sur le long terme. Les séries de tâches sont réalisées par des éléments nommés Entité. Les acteurs internes de l’Archive doivent réaliser des Fonctions. Celles-ci seront selon les cas typiquement réalisées par des professionnels de l’archivage ou bien par des logiciels éprouvés. Certaines fonctions nécessitent la collaboration entre entités.

3. Des entités et des fonctions

Au final, le modèle OAIS définit 7 Entités qui se doivent d’assurer 30 Fonctions. Des exemples de fonctions sont “Élaborer des standards et des règles” ou bien “Gérer la hiérarchie de stockage”. Certaines fonctions nécessitent le savoir faire de plusieurs spécialistes de l’archivage ou de l’informatique, d’autres seront typiquement réalisées par des logiciels correctement programmés et maintenus sur la durée.

Figure 1 : Entités d’une archive OAIS et types d’informations

Les Entités du modèle OAIS sont les suivantes:

  • L’entité Entrées assure la réception et la validation du Paquet d’Information versé (SIP) en provenance du Producteur. Elle réalise l’extraction de l’Information de description et la fabrication du SIP. Le calcul de la somme de contrôle des fichiers est réalisé. Cette somme recalculée périodiquement permet de s’assurer que l’objet stocké ne subit pas d’altération au cours du temps.
  • L’entité Stockage assure l’archivage, la maintenance et la diffusion du Paquet d’Information Archivé (AIP). Le stockage est prévu dans un système de fichier sur des supports variés. Des actions régulières de maintenance des données sont programmées. Elles incluent le rafraîchissement ou le remplacement du support de stockage. Des migrations de formats de données peuvent également s’avérer nécessaires. Un contrôle d’intégrité physique s’applique à chaque fichier de l’objet. Le Plan de Reprise d’Activité consiste dans le cas de la maintenance d’archives électroniques à s’assurer principalement que les données sont dupliquées en un lieu physiquement éloigné. Elles se trouvent ainsi préservées en cas de sinistre majeur et peuvent être récupérées.
  • L’entité Gestion des données regroupe les fonctionnalités d’administration et d’utilisation de la base de données. La base de données contient les métadonnées des AIP transmises par les Entrées. L’entité gère les requêtes des Utilisateurs. Les fonctions de cette entité sont typiquement réalisées par une base de donnée relationnelle.
  • L’entité Administration typiquement humaine regroupe les fonctions de la vie courante des archives. L’Administration négocie avec le Producteur les protocoles de versement et contrôle la qualité des soumissions. Elle gère les droits d’accès des intervenants, adresse  les  facturations aux utilisateurs avec les informations en provenance de  l’Accès, répond aux demandes d’informations, émet des rapports statistiques concernant les documents archivés et consultés. Plus important pour la pérennité des données, l’administration élabore les standards et les règles de l’Archive, et assure les migrations de formats nécessaires.
  • L’entité Planification de la pérennisation assure des fonctions de veille technologique dans le domaine des formats et des standards. Elle interagit avec le Producteur et l’Utilisateur cible pour s’assurer de la qualité des services rendus et pour faire évoluer les formats supportés par l’archive. Elle élabore les plans de migration en collaboration avec l’Administration.
  • L’entité Accès met à disposition de l’Utilisateur des fonctionnalités de recherche et délivre le Paquet d’Information Diffusé (DIP). Celui-ci contient les fichiers et métadonnées rassemblées en un seul paquet. Cette diffusion tient compte des droits d’accès de l’utilisateur. L’entité coordonne les fonctionnalités de la Gestion de Données et du Stockage pour fournir à l’utilisateur le paquet souhaité. Elle s’occupe des relations avec l’Utilisateur et de la facturation en interaction avec l’Administration.
  • L’entité Service de base absente du schéma et typiquement assuré par l’informaticien comprend le Système d’exploitation, le Réseau, la Sécurité informatique et correspond aux fonctions du service informatique, à la maintenance matérielle et logicielle.
Figure 2 : Relations entre les fonctions des entités.

Conclusion

Alors que les archives aspirent à une certain stabilité de leurs contraintes, celles-ci se montrent soumises à une évolution relativement rapide des législations et des normes, des données et métadonnées, des pratiques de la communauté des utilisateurs (messagerie électronique, CAO, numérisation) et les volumes à traiter. Un portrait plus nuancé des archives peut être donné. Celles-ci se montrent partiellement immobiles et partiellement en mouvement intense dans le but de préserver ces particulièrement mouvantes données numériques.

Autres liens

  • Le modèle de référence : l’OAIS, CINES : Lien
  • Archivage électronique : Lien
  • Reference model : Lien
  • Plan de préservation numérique : Lien

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s