Une comparaison des gestionnaires de contenus DSpace et Omeka

De nombreux laboratoires, des organismes publics ou privés, des universités mettent à disposition des « archives ouvertes ». Des données d’intérêt scientifique, historique, patrimonial se trouvent ainsi exposées. Celles-ci peuvent résulter d’une action de numérisation ou bien être nativement numériques. Au final, de nombreux fichiers du type texte (article, thèse, rapport, livre), image, son, vidéo, données primaires de la recherche sont ingérés dans une plateforme en vue de permettre leur diffusion. La mise en place d’un écosystème informatique s’avère alors nécessaire en vue d’assurer l’archivage d’un côté et la valorisation de l’autre des documents ainsi numérisés. Plusieurs plateformes offrent des fonctionnalités de valorisation voisines parmi lesquelles DSpace (java) et Omeka (PHP). Lequel choisir ? Ces deux logiciels sont ils vraiment équivalents ?

Une plateforme de valorisation permet l’ingestion de lots de fichiers, facilite la gestion des métadonnées (titre, résumé, auteur, date, droits, etc…), permet la recherche et la diffusion. On attend d’un tel logiciel qu’il soit évolutif et qu’il respecte des normes : le format Dublin Core simple au minimum pour les métadonnées, OAI-PMH pour les échanges avec des moteurs de recherche nationaux ou européens comme Isidore ou Europeana. Le format EAD (Encoded Archival Description) constitue une alternative qui se justifie dans le monde des archives. Les solutions pour la mise en place d’une telle plateforme s’avèrent multiples. Les organismes peuvent choisir de développer un logiciel spécifique, employer un logiciel libre ou propriétaire, ou bien mettre en ligne leurs données chez un prestataire de service.

Les fonctionnalités de deux plateformes de diffusion, DSpace et Omeka Classic, sont ici testées et comparées. Après description, les fonctionnalités informatiques, d’administration et de consultation de chacun de ces logiciels sont évaluées (0, +, ++, +++). Les points communs et les différences sont soulignés avant de conclure par quelques conseils pour un emploi judicieux de l’un ou l’autre de ces deux logiciels.

1. À propos de DSpace

Initialement développé en 2002 par le MIT et les laboratoires Hewlett-Packard à Cambridge (Massachusetts), DSpace est une plateforme de diffusion des documents numériques s’adresse aux universités, aux bibliothèques ou aux éditeurs de grande taille qui souhaitent préserver sur le long terme et diffuser en accès libre des documents d’intérêt scientifique historique ou patrimonial. Les développements sont assurés depuis 2009 par Duraspace, une société américaine à but non lucratif résultant de la fusion de deux organismes, la DSpace Foundation et Fedora Commons. Une communauté internationale d’utilisateurs et d’informaticiens contribue à l’évolution du logiciel.

Le logiciel est fréquemment utilisé en tant que plateforme de diffusion des documents des universités. Il permet le stockage des articles de recherche, des thèses, des livres, des rapports, et aussi des photos, des enregistrements sonores ou des vidéos. Il peut servir également de plateforme pour l’édition de revues libres ou bien pour l’archivage des données de la recherche. DSpace est un logiciel Java, basé sur les SGBD PostGreSQL ou Oracle au choix. Deux types d’interfaces web sont disponibles : l’interface JSPUI utilise JSP et l’API de Servlet Java, l’interface XMLUI se base sur Apache Cocoon et sur les standards XML et XSLT. L’utilisateur devra choisir sachant que les développements les plus récents portent sur l’interface la plus complexe XMLUI.

DSpace permet la création de collections et de sous-collections de documents, la gestion de communautés et de sous-communautés d’utilisateurs auxquelles des droits de consultation spéciaux peuvent être donnés. Différents workflows de publication sont possibles. Des processus de dépôt peuvent être définis pour chaque collection et des tâches assignées à l’aide d’alertes mail. La plateforme permet l’auto-archivage des documents. Les métadonnées sont exposées au format OAI-PMH.

DSpace : http://www.dspace.org/
Documentation officielle : https://github.com/DSpace/DSpace/raw/dspace-1_8_x/dspace/docs/DSpace-Manual.pdf
https://wiki.duraspace.org/display/DSDOC18/DSpace+1.8+Documentation
Fiche Plume :https://www.projet-plume.org/fiche/dspace
Tutoriel installation :http://linuxhalwa.blogspot.fr/2013/06/installing-dspace-3x-on-ubuntu-1204.html

2. A propos d’Omeka

Omeka est un logiciel flexible et open source, conçu pour la publication sur le web de collections de documents numériques issus des bibliothèques, des musées, des archives et de la recherche. Le logiciel est développé depuis 2006 en PHP / MySql par le Roy Rosenzweig Center for History and New Media. Il permet la gestion de corpus et offre toutes les fonctionnalités standards d’un gestionnaire de documents spécialisé : parcours de l’ensemble des items, filtrage par mot-clé, par collection, accès aux fichiers, diffusion OAI-PMH des métadonnées. Une recherche simple et avancée complètent les possibilités de navigation. Une quarantaine d’extensions complètent les fonctionnalités de base. La création d’expositions virtuelles se trouve ainsi facilitée.

L’administration du site permet la gestion de collections, la création d’items (unité documentaire), l’ajout d’un ou de plusieurs fichiers pour chaque item. Le type des items peut être précisé. Les type texte, image, son, vidéo, cours, histoire orale, email, site web, lien hypertexte, événement ou personne sont prévus de manière standard. Des métadonnées spécifiques du type spécifié peuvent être alors ajoutées. L’accès – public ou privé, et la visibilité – normal ou mis en valeur, conditionnent l’affichage sur le web. Les formats de fichiers acceptés de manière standard concernent le texte (TXT, DOC, PDF, XML, JPG, TIFF), l’image (GIF, JPEG, PNG, TIFF), le son (AIFF, MIDI, MP3, OGG, QT, RA, WAV) ou la vidéo (AVI, MPEG, MP4, QT, SWF, WMV).

Omeka : http://omeka.org/
Documentation officielle : http://omeka.org/codex/Documentation
Fiche Plume : https://www.projet-plume.org/fiche/omeka
La plateforme d’archivage numérique Omeka sur ce blog : https://archivengines.wordpress.com/2012/05/10/plateforme-archivage-numerique-omeka/
Bibliothèque Numérique – Université de Rennes 2 : http://bibnum.univ-rennes2.fr
Expositions d’Europeana basées sur Omeka : http://exhibitions.europeana.eu/

3. Liste des fonctionnalités

Les fonctionnalités détaillées de ces deux logiciels sont comparées :

3.1  Fonctionnalités informatiques

Elles concernent les informaticiens en charge de l’installation, des développements, de l’infographie et de la maintenance du logiciel, mais aussi les administrateurs amenés à gérer l’archive et à transférer par ftp plutôt que par upload des fichiers qui peuvent être nombreux ou volumineux.

  • Facilité de l’installation, de la personnalisation et des développements, langage (DSpace : Java, PostgreSql, Oracle, + | Omeka : LAMP, +++)
  • Documentation, communauté des utilisateurs, listes de discussion, évolution et pérennité du logiciel, support, sociétés de service (DSpace, +++ | Omeka, ++)
  • Personnalisation du graphisme à l’aide de thèmes (DSpace, + | Omeka, +++)
  • Architecture modulaire (DSpace, ++ | Omeka, +++) : Avec Omeka, une quarantaine d’extensions permettent  l’ajout de nouvelles fonctionnalités : la construction d’expositions virtuelles est possibles avec le module Exhibition Builder; l’extension Scripto facilite la transcription collaborative des textes de l’archive. Un gestionnaire de plugin permet d’enrichir les fonctionnalités de DSpace.
  • Compatibilité avec Annuaire LDAP ou Shibboleth pour la gestion des utilisateurs (DSpace, +++ | Omeka, 0 )
  • Scalabilité, capacité du logiciel à résister à des charges importantes de documents ou de visites (DSpace, ++ | Omeka, + )
  • Archivage de lots de documents (DSpace, +++ | Omeka, ++ )
  • Export de lots de documents (DSpace, ++ | Omeka, 0 )
  • Interopérabilité (DSpace, +++ | Omeka, ++ ) – Modalités pour le transfert de contenu entre logiciels (items, fichiers et métadonnées).

3.2  Fonctionnalités administratives

Les personnes en charge de la gestion courante (les administrateurs et les chercheurs) doivent avoir à leur disposition des fonctions dédiées à la gestion (ajout, modification, suppression) des contenus de l’archive.

Paramétrage de la plateforme :

  • Nom de l’archive, organisation du site, textes d’information (DSpace, ++ | Omeka, ++)
  • Formats de fichiers acceptés pour archivage (DSpace, ++ | Omeka, ++)
  • Personnalisation du schéma des métadonnées en fonction du type de document (DSpace, ++ | Omeka, ++)

Utilisateurs et communautés d’utilisateurs :

  • Gestion des personnes (administrateurs, utilisateurs) et distribution des rôles (DSpace, +++ | Omeka, ++)
  • Regroupement des personnes en communautés en vue d’attribuer des droits de consultation sur des collections ou des sous-collections en accès réservé (DSpace, +++ | Omeka, +)

Collections et sous-collections

  • Gestion des collections (DSpace, +++ | Omeka, +++)
  • Gestion de sous-collections (DSpace, +++ | Omeka, ++)
  • Gestion des droits associés à chaque collection (DSpace, +++ | Omeka, 0)
  • Gestion des embargos – les documents d’une collection ne sont pas accessible avant un temps fixé faisant suite à la date de dépôt (DSpace, +++ | Omeka, 0)

Gestion du contenu

  • Gestion des items (ou contenu, ou document) (DSpace, +++ | Omeka,+++)
  • Métadonnées associées à chaque item (DSpace, +++ | Omeka, +++)
  • Fichiers associés à chaque item (DSpace, +++ | Omeka, +++)
  • Métadonnées associées à chaque fichier d’un item (DSpace, +++ | Omeka, +++)
  • Métadonnées ajoutées sur dictionnaire (DSpace, 0 | Omeka, +++)
  • Ajout de lots de documents – fichiers et métadonnées (DSpace, +++ | Omeka, ++)
  • Ajout de mots clés en plus de Dublin Core (DSpace, ++ | Omeka, ++)
  • Statistiques de consultation (DSpace, +++ | Omeka, ++)
  • Gestion des droits de chaque contenu (DSpace, +++ | Omeka, +)
  • Réalisation d’une exposition virtuelle (DSpace, 0 | Omeka, +++)
  • Gestion de flux de soumission complexes, Auto-archivage (DSpace, +++ | Omeka, 0)
  • Gestion des droits de consultation d’un item ou d’un fichier (DSpace, +++ | Omeka, 0)

Outils intégrés d’étude et d’enrichissement du contenu (par les chercheurs)

  • Extensions pour la saisie de transcriptions, transcription en TEI (Text Encoding Initiative)  (DSpace, 0 | Omeka, +)

3.3  Fonctionnalités de consultation

Les utilisateurs externes consultent l’archive via une interface web qui doit permettre la recherche dans les métadonnées et les contenus des fichiers, de même que le téléchargement de fichiers. DSpace embarque un moteur de recherche SolR de manière standard, à la différence d’Omeka :

  • Recherche simple d’un item (DSpace, +++ | Omeka, +++)
  • Recherche avancée (DSpace, +++ | Omeka, +++)
  • Parcourir l’archive (DSpace, +++ | Omeka, +++)
  • Parcourir une collection ou une sous collection (DSpace, +++ | Omeka, +++)
  • Affichage de la liste des résultats de recherche et navigation (DSpace, +++ | Omeka, +++)
  • Visualisation des documents volumineux ou en haute résolution (carte) dans une visionneuse (DSpace, ++ | Omeka, ++)
  • Détail d’un item (DSpace, +++ | Omeka, +++)
  • Parcourir par mots clés (DSpace, ++ | Omeka, +++)
  • Rechercher dans une collection (DSpace, +++ | Omeka, ++)
  • Recherche le texte intégral des fichiers stockés dans l’archive (pdf, doc, xml, html) (DSpace, +++ | Omeka, 0)
  • Affichage en facette des résultats de recherche (DSpace, +++ | Omeka, 0)
  • Consultation depuis une tablette ou un iPhone (DSpace, + | Omeka, +)
  • Visite d’une exposition virtuelle (DSpace, 0 | Omeka, +++)
  • Avis sur un document de l’archive (DSpace, + | Omeka, ++)

3.4  Fonctionnalités avancées

Ce sont des fonctionnalités associées à des protocoles qui permettent les échanges de données et de métadonnées entre machines. Les services informatiques et l’administration de l’archive sont concernés.

  • Exposition des métadonnées en OAI-PMH (DSpace, +++ | Omeka, +++)
  • Moissonneur OAI-PMH (DSpace, +++ | Omeka, +++)
  • Flux RSS (DSpace, +++ | Omeka, +++)
  • Échange de documents entre archives selon le protocole OAI-ORE (DSpace, +++ | Omeka, 0)
  • Exposition des métadonnées aux formats du web sémantique (RDF, RDFa, microdata) (DSpace, + | Omeka, +)
  • Internationalisation, l’interface supporte différentes langues (DSpace, +++ | Omeka, +)
  • Support du protocole COinS pour le référencement dans Zotero (DSpace, + | Omeka, +++)
  • Adaptation de l’interface aux tablettes et aux smartphones (DSpace, 0 | Omeka, ++)
  • Commentaires sur les documents (DSpace, 0 | Omeka, +++)
  • Système d’alerte par mail sur les nouveautés (DSpace, +++ | Omeka, 0)
  • Support du protocole OpenURL de SFX (DSpace, +++ | Omeka, 0)
  • Support du protocole Sword pour le dépôt simultané de documents dans plusieurs archives (DSpace, +++ | Omeka, 0)

Préservation des données sur le long terme

  • Vérification automatique de l’intégrité des fichiers de l’archive (DSpace, +++ | Omeka, 0)
  • Référencement des documents à l’aide d’un système d’URL persistante tel que le système des Handles, le DOI ou le protocole PURL (DSpace, +++ | Omeka, 0)
  • Réplication et synchronisation sur un site distant (DSpace, +++ | Omeka, 0)

En conclusion

Omeka et DSpace partagent de nombreuses fonctionnalités mais s’adressent à des publics différents.

DSpace convient tout à fait pour des structures de taille importante, ou bien spécialisées amenés à gérer un grand nombre de documents d’intérêt académique (thèses et rapports), historique ou patrimonial. Le logiciel s’adresse en priorité aux universités pour l’archivage institutionnel, aux éditeurs dans la perspective de l’édition électronique et aux archives préoccupées par la valorisation de leurs fonds. Ces organismes doivent gérer des communautés d’utilisateurs importantes et variées, de grands volumes de documents répartis en collections fortement structurées dont certaines sont en accès restreint. Un nombre relativement important de personnes spécialisées rend possible le fonctionnement de l’archive numérique.

Les fonctionnalités d’Omeka sont quant à elles plus simples et relativement faciles à mettre en œuvre. Le logiciel convient tout à fait pour une structure disposant d’un personnel limité et souhaitant gérer, diffuser et valoriser des corpus numériques. Le logiciel s’adresse à des laboratoires publiant dans le cadre d’études historiques ou linguistiques des documents textuels ou oraux, ou gérant de petites bases de données, de photos, de textes, de sons, de vidéos ou de cartes. La possibilité de créer des expositions à partir des documents ajoute une possibilité intéressante.

De nombreux autres logiciels libres ou commerciaux existent qu’il s’avère difficile de tous tester de manière extensive. On pourra lire quelque rares études comparatives sur le sujet.

Un commentaire

  1. Une unique recherche ma suffit pour comprendre que Une comparaison des plateformes d’archivage numérique DSpace et Omeka archivEngines parait être un immanquable du réseau web.

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s