Articles tagués Modèle OAIS

Les présentations des « Journées OAIS » organisées par le TGE Adonis

Le TGE-Adonis signale la mise en ligne des contributions présentées lors des «Journées OAIS» (Villeurbanne, 23 et 24 octobre 2012) sur le thème «Archives numériques en sciences humaines et sociales : la norme OAIS».

Les présentations des journées OAIS sont en ligne ! : http://www.tge-adonis.fr/article/les-presentations-des-journees-oais-sont-en-ligne

A lire aussi sur ce blog : « Le modèle de référence OAIS » : https://archivengines.wordpress.com/2011/12/07/le-modele-de-reference-oais/

Poster un commentaire

Le modèle de référence OAIS

Le Modèle OAIS (Reference model for an Open Archival Information System) est une spécification et une norme concernant l’archivage pérenne ou archivage à long terme des objets numériques. Le long terme est défini comme: “suffisamment long pour être concerné par les conséquences de changement technologiques, incluant la venue de nouveaux médias et de nouveaux formats de données, ou bien par un changement de la communauté des utilisateurs“. Le modèle définit de manière théorique les techniques (machines, supports, médias, formats) et l’organisation humaine à mettre en place pour atteindre l’objectif. Un vocabulaire est également introduit, qui est devenu la référence du domaine.

Le document est publié par le CCSDS (Consultative Committee for Space Data Systems) en 2002 (1). Cet organisme spécialisé dans la production de normes dans le domaine des technologies spatiales, comprend parmi ses membres la NASA (National Space Agency), l’ESA (European Space Agency) ou le CNES (Centre National d’Etudes Spatiales). Le modèle OAIS est normalisé ISO 14721 en 2003 (2). Une traduction française est publiée en 2005 (3), suivie d’une mise à jour datée de 2009 (4). Une dernière version date de Juin 2012 (5).

NB : Le vocabulaire spécifique du modèle est noté en italique. Le terme “ouvert” / “open” de l’expression OAIS indique que le texte est accessible librement et a été élaboré dans des forums ouverts – le modèle ne concerne pas spécifiquement les archives ouvertes.

Au final, en 2014, 3 normes complémentaires sont définies :

  • ISO 14721 (OAIS – un modèle de référence qui définit le fonctionnement d’une archive dans le but d’assurer la préservation à long terme de l’information numérique)
  • ISO 16363 (Audit et certification des entrepôts numériques dignes de confiance – établissement de mesures complètes de ce que doit faire une archive, basé sur OAIS)
  • ISO 16919 (Requis pour les organismes réalisant les audits et certifications des entrepôts numériques dignes de confiances – spécifie les compétences et les requis des organismes qui font les audits)

Des Paquets d’information

Les éléments à préserver sont nommés Paquets d’information; ils rassemblent fichiers à préserver et métadonnées. 3 types de paquets peuvent exister dépendant de leur localisation dans l’archive. On distingue le SIP (Submission Information Package) correspondant à un paquet versé par le Producteur, l’AIP (Archival Information Package) correspondant à des données archivées, et le DIP (Diffusion Information Package) pour des données diffusées. Le modèle détaille les types d’informations à préserver avec les objets : information de représentation, l’information de pérennisation, l’information d’empaquetage et information de description.

Des acteurs et des rôles

Le modèle précise les intervenants et leur rôles. Les acteurs externes comprennent les Producteurs, les Utilisateurs et le Management. Le Producteur verse dans l’archive les objets numériques et les métadonnées  à préserver. L’Utilisateur accède aux données, un groupe d’utilisateurs constitue la Communauté cible de l’archive avec lequel des interactions particulières sont prévues. Le Management est responsable de la politique de l’archive et du soutien financier sur le long terme. Les acteurs internes de l’archive participent au fonctionnement des Entités et à la réalisation des Fonctions.

Des entités et des fonctions

Le modèle OAIS définit 7 Entités comprenant 30 Fonctions. Des exemples de fonctions sont “Elaborer des standards et des règles” ou “Gérer la hiérarchie de stockage”. Certaines fonctions nécessitent le savoir faire de personnes spécialisées, alors que d’autres seront typiquement réalisées par des outils informatiques.

Figure 1 : Acteurs externes et entités d’une archive OAIS

Les entités sont les suivantes:

  • L’entité Entrées assure la réception et la validation des SIP en provenance des Producteurs. Elle réalise l’extraction de l’Information de description et la fabrication des AIP. Le calcul de la somme de contrôle des fichiers est réalisé. Cette somme recalculée périodiquement permet de s’assurer que l’objet stocké ne subit pas d’altération au cours du temps.
  • L’entité Stockage assure l’archivage, la maintenance et la diffusion des AIP. Le stockage est prévu dans un système de fichier sur des supports variés. Des actions régulières de maintenance des données sont programmées comprenant le rafraîchissement ou le remplacement du support de stockage. Des migrations de formats de données peuvent s’avérer nécessaires. Un contrôle d’intégrité s’appliquant à chaque fichier de l’objet doit être prévu. Un Plan de reprise d’activité consistant principalement à dupliquer les données en un lieu physiquement éloigné permet de préserver les données en cas de sinistre.
  • L’entité Gestion des données regroupe les fonctionnalités d’administration et d’utilisation de la base de données. La base contient les métadonnées des AIP transmises par les Entrées. L’entité gère les requêtes des Utilisateurs.
  • L’entité Administration regroupe les fonctions de la vie courante de l’archive. L’Administration négocie avec le Producteur les protocoles de versement et contrôle la qualité des soumissions. Elle gère les droits d’accès des intervenants, adresse  les  facturations aux utilisateurs avec les informations en provenance de  l’Accès, répond aux demandes d’informations, émet des rapports statistiques concernant les documents archivés et consultés. Plus important pour la pérennité des données, l’administration élabore les standards et les règles de l’archive, et assure les migrations de formats nécessaires.
  • L’entité Planification de la pérennisation assure des fonctions de veille technologique dans le domaine des formats et des standards. Elle interagit avec le Producteur et l’Utilisateur cible pour s’assurer de la qualité des services rendus et pour faire évoluer les formats supportés par l’archive. Elle élabore les plans de migration en collaboration avec l’Administration.
  • L’entité Accès met à disposition de l’Utilisateur des fonctionnalités de recherche et délivre les documents souhaités en tenant compte des droits. Elle coordonne les fonctionnalités  de la Gestion de Données et du Stockage pour fournir à l’utilisateur le document souhaité. Elle s’occupe des relations avec l’Utilisateur et de la facturation en interaction avec l’Administration.
  • L’entité Service de base absente du schéma comprend le Système d’exploitation, le Réseau, la Sécurité informatique et correspond aux fonctions du service informatique.


Figure 2 : Relations entre les fonctions des entités.

Le modèle OAIS trouve de nombreuses applications pratiques, lors de la mise en place, de la maintenance ou de l’évaluation d’un service d’archivage. Il est cité comme référence dans de nombreuses techniques, de nombreux logiciels et constitue une norme.

(1) : Le Modèle OAIS (2002) : http://public.ccsds.org/publications/archive/650x0b1.pdf
(2) : La norme ISO 14721 (2003) : http://www.iso.org/iso/fr/catalogue_detail.htm?csnumber=24683
(3) :  Reference Model for an Open Archival Information System (OAIS)  en français (2005) : http://public.ccsds.org/publications/archive/650x0b1(F).pdf
(4) :  Reference Model for an Open Archival Information System (OAIS) (2009) : http://public.ccsds.org/sites/cwe/rids/Lists/CCSDS%206500P11/Attachments/650x0p11.pdf
(5) : Reference Model for an Open Archival Information System (OAIS). Magenta Book. Issue 2. (2012) :
http://public.ccsds.org/publications/archive/650x0m2.pdf
(6) : Un autre résumé au CINES : http://www.cines.fr/spip.php?rubrique230

Meeting the challenges of digital preservation: The OAIS reference model : http://www.oclc.org/research/publications/archive/2000/lavoie/
Audit and certification of trustworphy digital repositories : http://public.ccsds.org/publications/archive/652x0m1.pdf
European Framework for Audit and Certification of Digital Repositories : http://www.trusteddigitalrepository.eu/Site/Trusted%20Digital%20Repository.html
Data Seal of Approval : http://www.datasealofapproval.org/
DRAMBORA : http://www.repositoryaudit.eu/
Who would you trust? On standards and audits : http://www.ncdd.nl/blog/?p=1952

,

Poster un commentaire

L’archivage pérenne des objets numériques

Les bibliothèques, les archives, les musées, les organismes publics (santé, justice, recherche), les entreprises comme les particuliers sont amenés à gérer un nombre croissant de documents nativement numériques ou résultant de travaux de numérisation. Les documents peuvent être du type texte, son, image, graphique, vidéo, objet 3D, page web ou autres documents composites.

L'explosion des donnéesEvolution des capacités de stockage en Exabytes prévue dans les prochaines années
(Source: IDC’s Digital Universe Study, sponsorisé par EMC, Juin 2011)

Pour des raisons patrimoniales, scientifiques, historiques, légales, commerciales ou techniques, certaines de ces données doivent être conservées sur le long terme, sur des périodes de plusieurs dizaines d’années. Sur de telles durées, les risques de pertes ou de dégradation s’avèrent non négligeables. Les causes incluent les sinistres, les attaques internes ou externes, le vieillissement des supports de stockage, les pannes, l’obsolescence des matériels, des logiciels, des formats de données, des changements affectant les personnes, les activités ou les organismes. Une préservation au-delà de 20 ans nécessite la mise en place de méthodes particulières.

Durée de préservation

Durée de préservation par secteur d’activité en années, d’après IBM
(Source : IBM System Storage, 2009)

Le stockage des données dans des salles informatiques sécurisées, dans des data centers ou chez des fournisseurs de cloud permet de pallier un certain nombre de risques physiques, mais cela s’avère insuffisant. L’organisation doit s’efforcer de répondre à un ensemble de critères formalisés dans des standards et des normes. Publié en 2002, le Modèle de référence pour un Système Ouvert d’Archivage d’Information ou Modèle OAIS (Open Archival Information System) est une norme fréquemment mise en avant par les organisations et les constructeurs de logiciels. Elle présente l’organisation à mettre en place et les fonctions nécessaires pour acquérir, archiver, préserver et diffuser des objets numériques sur le long terme. La validation du format d’origine, la duplication des objets numériques en des lieux physiquement éloignés, la vérification régulière de l’intégrité des fichiers, la réalisation de migrations, concernant le support de stockage ou le format des données en cas d’obsolescence doivent être entrepris. Une interaction régulière avec la communauté cible des utilisateurs s’avère nécessaire.

D’autres normes et recommandations concernent les logiciels, les aspects techniques, économiques ou juridiques, les formats de données et de métadonnées ou la qualité. Ainsi, les archives préservant sur le long terme doivent être régulièrement auditées afin de vérifier la qualité des services. L’objectif d’une certification est de générer la confiance des utilisateurs. Des réseaux d’archives publiques peuvent être créés aux échelles nationales, européennes et internationales. Des sociétés de services peuvent proposer leurs services à des entreprises privées.

Normes et rcommandations

Modèle OAIS

Version 1 (2002) http://public.ccsds.org/publications/archive/650x0b1.pdf
Traduction française de la version 1 (2005) : http://public.ccsds.org/publications/archive/650x0b1(F).pdf
Le modèle de référence OAIS sur ce blog

ISO 14721:2003

Archive de confiance

Trusted Digital Repositories: Attributes and Responsibilities (2002) : http://www.oclc.org/research/activities/past/rlg/trustedrep/repositories.pdf
Audit and Certification of Trustworthy Digital Repositories (2011) : http://public.ccsds.org/publications/archive/652x0m1.pdf

Livres

2010

Long-Term Preservation of Digital Documents: Principles and Practices, Springer, Uwe Borghoff, Peter Rödig, Jan Scheffczyk, Lothar Schmitz, 289p, 2010, 2ème édition, ISBN-13: 978-3642070174

2009

L’archivage numérique à long terme : les débuts de la maturité ? Françoise Banat-Berger, Laurent Duplouy, Claude Huc Paris, La Documentation française, 2009, 284 p., 24 cm Coll. Manuels et guides pratiques ISBN 978-2-11-006942-9

Bibliographies

Digital Curation and Preservation Bibliography, Charles W. Bailey, Jr. : http://digital-scholarship.org/dcpb/

Quelques initiatives

List of digital preservation initiatives : http://en.wikipedia.org/wiki/List_of_digital_preservation_initiatives
TGE Adonis (CNRS – Universités) : http://www.tge-adonis.fr/service/archivage-perenne
PIN, Pérennisation des Informations Numériques : http://pin.association-aristote.fr

Voir les liens de ce blog

, ,

Poster un commentaire