PURL, handle, DOI, ARK et autres systèmes d’URL persistantes

404 not found

Vous connaissez bien sûr cette chaîne de caractères qui commence par http:// ou https:// suivi de blocs de lettres séparés par des points. Il se trouve que cet élément, – l’URL (Uniform Ressource Locator) – s’avère rarement constant sur le long terme. Si bien que des documents présents sur le web ou publiés sur un support papier conduisent souvent à l’affichage de la terrible erreur 404 Document not found, ou bien à un message indiquant que le document n’existe pas. Le problème peut être lié à la disparition d’un site, au changement de nom d’un organisme entraînant un changement d’URL. Un document peut changer de version ou de localisation, être supprimé, etc. L’URL est une métadonnée descriptive assez instable, ce qui pose des problèmes pour la « citabilité » des documents sur de longues périodes, notamment pour les éditions papier.

Les bibliothèques, les universités, les centres de recherche, les éditeurs, les archives s’avèrent particulièrement concernés et sont conscients du problème depuis l’avènement du web. Différentes techniques ont été mises au point pour pallier cette faiblesse d’internet, parmi lesquelles on peut citer Archival Resource Key (ARK),  Digital Object Identifiers (DOI), Extensible Resource Identifier (XRI), HANDLE, Life Science ID (LSID), Object Identifiers (OID), Persistent Uniform Resource Locators (PURL), URI et URN, Universally Unique Identifier  (UUID). Dans une série de billets à venir, les systèmes PURL, handle, DOI et ARK mis en place pour apporter une solution à la citabilité sont présentés.

Prenons par exemple le cas des URL ARKs. L’acronyme « ARK » (arche) signifie « Archival Resource Key » et est une référence à l’arche de Noé et au monde des archives. Une URL (URI) ARK présente la structure suivante :

 http://NMAH/ark:/NAAN/NAME/QUALIFIER

dans laquelle NMAH (Name Mapping Authority Host) est le nom de l’hôte, NAAN (Name Assigning Authority Number) est le numéro unique de l’autorité certifiante donné gratuitement par la California Digital Library à toute institution active. NAME est le nom de la ressource et QUALIFIER un nom de ressource.

Un point « . » dans le nom du qualifiant signifie que plusieurs variants du même fichier existent. On peut ainsi avoir les variants suivants :

http://example.org/ark:/12345/b6KN/2.original 
http://example.org/ark:/12345/b6KN/2.thumbnail 

La partie QUALIFIER peut être significative. Le logiciel NOID peut être utilisé pour créer des identifiants opaques, les lier à une URL et les gérer sur le long terme. Des exemples fonctionnels d’URI ARK sont :

Autres liens

Autres articles de ce blog sur les URL persistantes :

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s