Une comparaison des plateformes d’archivage numérique DSpace et Omeka

De nombreux laboratoires, des organismes publics ou privés, des universités mettent à disposition des « archives ouvertes » contenant des données qui présentent un intérêt scientifique, historique, patrimonial. Les données peuvent résulter de numérisation ou être nativement numériques. Au final, de nombreux fichiers du type texte (article, thèse, rapport, livre), son, image, vidéo, données primaires de la recherche sont ingérées dans une plateforme en vue de permettre la diffusion. La mise en place d’un écosystème informatique s’avère alors nécessaire en vue  d’assurer l’archivage et la consultation des documents.

Une plateforme permet le stockage de fichiers, facilite la gestion des métadonnées (titre, résumé, auteur, date, droits, etc…), permet la recherche et la diffusion. On attend d’un tel logiciel qu’il soit évolutif et qu’il respecte des normes : le format Dublin Core simple au minimum pour les métadonnées, OAI-PMH pour les échanges avec des moteurs de recherche nationaux ou européens comme Isidore ou Europeana. EAD (Encoded Archival Description) constitue une alternative qui se justifie dans le monde des archives. Les solutions pour la mise en place sont multiples. Les organismes peuvent développer un logiciel spécifique, employer un logiciel libre ou propriétaire, ou bien mettre en ligne leurs données chez un prestataire de service.

Les fonctionnalités de deux plateformes de diffusion, DSpace et Omeka, sont testées et comparées. Après description, les fonctionnalités informatiques, d’administration, de consultation et avancées de chacun de ces logiciels sont évaluées (0, +, ++, +++). Les points communs et les différences sont soulignés avant de conclure par quelques conseils pour un emploi judicieux de l’un ou l’autre de ces deux logiciels.

A propos de DSpace

Initialement développé en 2002 par le MIT et les laboratoires HP à Cambridge, DSpace est une plateforme de diffusion des documents numériques développée pour les universités, les bibliothèques, les éditeurs ou les archives de grande taille qui souhaitent préserver sur le long terme et diffuser en accès libre des documents d’intérêt historique ou patrimonial. Les développements sont assurés depuis 2009 par Duraspace, une société américaine à but non lucratif résultant de la fusion de deux organismes, la DSpace Foundation et Fedora Commons. Une communauté internationale d’utilisateurs et d’informaticiens contribue à l’évolution du logiciel.

Le logiciel est fréquemment utilisé en tant que plateforme pour l’archivage des documents des universités. Il permet le stockage des articles de recherche, des thèses, des livres, des rapports, et aussi des photos, des enregistrements sonores ou des vidéos. Il peut servir également de plateforme pour l’édition de revues libres ou bien pour l’archivage de données de la recherche. DSpace est un logiciel Java, basé sur les SGBD PostGreSQL ou Oracle au choix. Deux types d’interfaces web sont disponibles : l’interface JSPUI utilisant JSP et l’API de Servlet Java et l’interface XMLUI basée sur Apache Cocoon et sur les standards XML et XSLT. L’utilisateur devra choisir sachant que les développements les plus récents portent sur l’interface la plus complexe XMLUI.

DSpace permet la création de collections et de sous-collections de documents, la gestion de communautés et de sous-communautés d’utilisateurs auxquelles des droits de consultation spéciaux peuvent être donnés. Différents workflows de publication sont possibles. Des processus de dépôt peuvent être définis pour chaque collection et des tâches assignées par des alertes mail. La plateforme permet l’auto-archivage des documents. Les métadonnées sont exposées au format OAI-PMH.

DSpace : http://www.dspace.org/
Documentation officielle : https://github.com/DSpace/DSpace/raw/dspace-1_8_x/dspace/docs/DSpace-Manual.pdf
https://wiki.duraspace.org/display/DSDOC18/DSpace+1.8+Documentation
Fiche Plume :https://www.projet-plume.org/fiche/dspace
Tutoriel installation :http://linuxhalwa.blogspot.fr/2013/06/installing-dspace-3x-on-ubuntu-1204.html

A propos d’Omeka

Omeka est un logiciel flexible et open source, conçu pour la publication sur le web de collections de documents numériques provenant de bibliothèques, de musées ou d’archives. Le logiciel est développé depuis 2006 en PHP/MySql par le “Roy Rosenzweig Center for History and New Media”. Il permet la gestion de corpus de petite taille (50 à 50000 documents) et offre toutes les fonctionnalités standards d’un gestionnaire de documents spécialisé : parcours de l’ensemble des items, filtrage par mot-clé, par collection, accès aux fichiers, diffusion OAI-PMH des métadonnées. Une recherche simple et avancée complètent les possibilités de navigation. Une quarantaine d’extensions complètent les fonctionnalités de base, facilitant notamment la création d’expositions virtuelles.

L’administration du site permet la gestion de collections, la création d’items (unité documentaire), l’ajout d’un ou de plusieurs fichiers pour chaque item. Le type des items peut être précisé : texte, image, son, vidéo, cours, histoire orale, email, site web, lien hypertexte, évènement ou personne, de même que l’accès – public ou privé, et la visibilité – normal ou mis en valeur sur la page d’accueil. Des métadonnées au format Dublin Core sont associées à chaque item et à chaque fichier. Les fichiers peuvent être du type texte (TXT, DOC, PDF, XML, JPG, TIFF), image (GIF, JPEG, PNG, TIFF), son (AIFF, MIDI, MP3, OGG, QT, RA, WAV) ou vidéo (AVI, MPEG, MP4, QT, SWF, WMV).

Omeka : http://omeka.org/
Documentation officielle : http://omeka.org/codex/Documentation
Fiche Plume : https://www.projet-plume.org/fiche/omeka
La plateforme d’archivage numérique Omeka sur ce blog : https://archivengines.wordpress.com/2012/05/10/plateforme-archivage-numerique-omeka/
Bibliothèque Numérique – Université de Rennes 2 : http://bibnum.univ-rennes2.fr
Expositions d’Europeana basées sur Omeka : http://exhibitions.europeana.eu/

Liste des fonctionnalités

Les fonctionnalités détaillées de ces deux logiciels sont comparées :

1.  Fonctionnalités informatiques

Elles concernent les informaticiens en charge de l’installation, des développements, de l’infographie et de la maintenance du logiciel, mais aussi les administrateurs amenés à gérer l’archive et à transférer par ftp plutôt que par upload des fichiers qui peuvent être nombreux ou volumineux.

  • Facilité de l’installation, de la personnalisation et des développements, langage (DSpace : Java, PostgreSql, Oracle, + | Omeka : LAMP, +++)
  • Documentation, communauté des utilisateurs, listes de discussion, évolution et pérennité du logiciel, support, sociétés de service (DSpace, +++ | Omeka, ++)
  • Personnalisation du graphisme à l’aide de thèmes (DSpace, + | Omeka, +++)
  • Architecture modulaire (DSpace, ++ | Omeka, +++) : Avec Omeka, une quarantaine d’extensions permettent  l’ajout de nouvelles fonctionnalités : la construction d’expositions virtuelles est possibles avec le module Exhibition Builder; l’extension Scripto facilite la transcription collaborative des textes de l’archive. Un gestionnaire de plugin permet d’enrichir les fonctionnalités de DSpace.
  • Compatibilité avec Annuaire LDAP ou Shibboleth pour la gestion des utilisateurs (DSpace, +++ | Omeka, 0 )
  • Scalabilité, capacité du logiciel à résister à des charges importantes de documents ou de visites (DSpace, ++ | Omeka, + )
  • Archivage de lots de documents (DSpace, +++ | Omeka, ++ )
  • Export de lots de documents (DSpace, ++ | Omeka, 0 )
  • Interopérabilité (DSpace, +++ | Omeka, ++ ) – Modalités pour le transfert de contenu entre logiciels (items, fichiers et métadonnées).

2.  Fonctionnalités administratives

Les personnes en charge de la gestion courante (les administrateurs et les chercheurs) doivent avoir à leur disposition des fonctions permettant de gérer et d’enrichir les contenus de l’archive.

Paramétrage de la plateforme :

  • Nom de l’archive, organisation du site, textes d’information (DSpace, ++ | Omeka, ++)
  • Formats de fichiers acceptés pour archivage (DSpace, ++ | Omeka, ++)
  • Personnalisation du schéma des métadonnées en fonction du type de document (DSpace, ++ | Omeka, ++)

Utilisateurs et communautés d’utilisateurs :

  • Gestion des personnes (administrateurs, utilisateurs) et distribution des rôles (DSpace, +++ | Omeka, ++)
  • Regroupement des personnes en communautés en vue d’attribuer des droits de consultation sur des collections ou des sous-collections en accès réservé (DSpace, +++ | Omeka, +)

Collections et sous-collections

  • Gestion des collections (DSpace, +++ | Omeka, +++)
  • Gestion de sous-collections (DSpace, +++ | Omeka, ++)
  • Gestion des droits associés à chaque collection (DSpace, +++ | Omeka, 0)
  • Gestion des embargos – les documents d’une collection ne sont pas accessible avant un temps fixé faisant suite à la date de dépôt (DSpace, +++ | Omeka, 0)

Gestion du contenu

  • Gestion des items (ou contenu, ou document) (DSpace, +++ | Omeka,+++)
  • Métadonnées associées à chaque item (DSpace, +++ | Omeka, +++)
  • Fichiers associés à chaque item (DSpace, +++ | Omeka, +++)
  • Métadonnées associées à chaque fichier d’un item (DSpace, +++ | Omeka, +++)
  • Métadonnées ajoutées sur dictionnaire (DSpace, 0 | Omeka, +++)
  • Ajout de lots de documents – fichiers et métadonnées (DSpace, +++ | Omeka, ++)
  • Ajout de mots clés en plus de Dublin Core (DSpace, ++ | Omeka, ++)
  • Statistiques de consultation (DSpace, +++ | Omeka, ++)
  • Gestion des droits de chaque contenu (DSpace, +++ | Omeka, +)
  • Réalisation d’une exposition virtuelle (DSpace, 0 | Omeka, +++)
  • Gestion de flux de soumission complexes, Auto-archivage (DSpace, +++ | Omeka, 0)
  • Gestion des droits de consultation d’un item ou d’un fichier (DSpace, +++ | Omeka, 0)

Outils intégrés d’étude et d’enrichissement du contenu (par les chercheurs)

  • Extensions pour la saisie de transcriptions, transcription en TEI (Text Encoding Initiative)  (DSpace, 0 | Omeka, +)

3.  Fonctionnalités de consultation

Les utilisateurs externes consultent l’archive via une interface web qui doit leur permettre la recherche et le téléchargement de fichiers. DSpace embarque un moteur de recherche SolR de manière standard, à la différence d’Omeka :

  • Recherche simple d’un item (DSpace, +++ | Omeka, +++)
  • Recherche avancée (DSpace, +++ | Omeka, +++)
  • Parcourir l’archive (DSpace, +++ | Omeka, +++)
  • Parcourir une collection ou une sous collection (DSpace, +++ | Omeka, +++)
  • Affichage de la liste des résultats de recherche et navigation (DSpace, +++ | Omeka, +++)
  • Visualisation des documents volumineux ou en haute résolution (carte) dans une visionneuse (DSpace, ++ | Omeka, ++)
  • Détail d’un item (DSpace, +++ | Omeka, +++)
  • Parcourir par mots clés (DSpace, ++ | Omeka, +++)
  • Rechercher dans une collection (DSpace, +++ | Omeka, ++)
  • Recherche le texte intégral des fichiers stockés dans l’archive (pdf, doc, xml, html) (DSpace, +++ | Omeka, 0)
  • Affichage en facette des résultats de recherche (DSpace, +++ | Omeka, 0)
  • Consultation depuis une tablette ou un iPhone (DSpace, + | Omeka, +)
  • Visite d’une exposition virtuelle (DSpace, 0 | Omeka, +++)
  • Avis sur un document de l’archive (DSpace, + | Omeka, ++)

4.  Fonctionnalités avancées

Ce sont des fonctionnalités associées à des protocoles qui permettent les échanges de données et de métadonnées entre machines. Les services informatiques et l’administration de l’archive sont concernés.

  • Exposition des métadonnées en OAI-PMH (DSpace, +++ | Omeka, +++)
  • Moissonneur OAI-PMH (DSpace, +++ | Omeka, +++)
  • Flux RSS (DSpace, +++ | Omeka, +++)
  • Echange de documents entre archives selon OAI-ORE (DSpace, +++ | Omeka, 0)
  • Exposition des métadonnées aux formats du web sémantique (RDF, RDFa, microdata) (DSpace, + | Omeka, +)
  • Internationalisation, l’interface supporte différentes langues (DSpace, +++ | Omeka, +)
  • Support du protocole COinS pour le référencement dans Zotero (DSpace, + | Omeka, +++)
  • Adaptation de l’interface aux tablettes et aux smartphones (DSpace, 0 | Omeka, ++)
  • Commentaires sur les documents (DSpace, 0 | Omeka, +++)
  • Système d’alerte par mail sur les nouveautés (DSpace, +++ | Omeka, 0)
  • Support du protocole OpenURL de SFX (DSpace, +++ | Omeka, 0)
  • Support du protocole Sword pour le dépôt simultané de documents dans plusieurs archives (DSpace, +++ | Omeka, 0)

Préservation des données sur le long terme

  • Vérification automatique de l’intégrité des fichiers de l’archive (DSpace, +++ | Omeka, 0)
  • Référencement des documents à l’aide d’un système d’URL persistante tel que le système des Handles, le DOI ou le protocole PURL (DSpace, +++ | Omeka, 0)
  • Réplication et synchronisation sur un site distant (DSpace, +++ | Omeka, 0)

En conclusion

Bien que partageant de nombreuses fonctionnalités, Omeka et DSpace s’adressent à des publics différents et ne doivent sans doute pas être employés l’un pour l’autre.

DSpace convient tout à fait pour des structures de taille importante, ou bien spécialisées et gérant un grand nombre de documents d’intérêt historique ou patrimonial. Le logiciel s’adresse en priorité aux universités pour l’archivage institutionnel, aux éditeurs et aux archives traditionnelles. Ces organismes doivent gérer des communautés d’utilisateurs importantes, de grands volumes de documents répartis en collections fortement structurées dont certaines sont en accès restreint. Un nombre relativement important de personnes spécialisées rend possible le fonctionnement de l’archive qui s’avère être un élément primordial de l’organisme.

Les fonctionnalités d’Omeka sont quant à elles plus simples et relativement plus faciles à mettre en œuvre. Le logiciel convient tout à fait pour une structure disposant d’un personnel limité et souhaitant gérer, diffuser et valoriser des contenus dont le volume ne dépasse pas 50 000 documents. Le logiciel s’adresse à des laboratoires publiant dans le cadre d’études historiques ou linguistiques des corpus textuels ou oraux, ou gérant de petites bases de données, d’images par exemple. La possibilité de créer des expositions à partir des documents de l’archive s’avère dans ce cadre une possibilité intéressante.

De nombreux autres logiciels libres ou commerciaux existent qu’il s’avère difficile de tous tester de manière extensive. On pourra lire quelque rares études comparatives sur le sujet.

What DSpace could learn from Omeka : http://www.facebook.com/notes/mire/what-dspace-could-learn-from-omeka/393758568767
Solutions logicielles pour bibliothèques numériques : http://www.bibliopedia.fr/index.php/Solutions_logicielles_pour_biblioth%C3%A8ques_num%C3%A9riques
Bibliothèques numériques : logiciels et plateformes : http://www.adbs.fr/bibliotheques-numeriques-logiciels-et-plateformes-114632.htm?RH=R1_GUIDESOUTILS

Digital Repositories infoKit : http://www.jiscinfonet.ac.uk/infokits/repositories/digital-repositories-infokit.pdf

Digitization of Cultural Heritage –Standards, Institutions, Initiatives : http://www.math.bas.bg/infres/book-ADCH/ADCH-ch1.pdf

,

  1. #1 par dj 54 le 14 juillet 2012 - 1:39

    Une unique recherche ma suffit pour comprendre que Une comparaison des plateformes d’archivage numérique DSpace et Omeka archivEngines parait être un immanquable du réseau web.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :