Le système Handle pour le référencement des objets numériques

Développé par Bob Kahn, l’un des inventeur du protocole TCP/IP, le système Handle (la poignée) est mis en œuvre par des archives et des bibliothèques du monde entier pour identifier de manière persistante sur le web toutes sortes d’objets numériques du type texte, image, son, vidéo, etc. La maintenance et les développements sont gérés par le CNRI (Corporation for National Research Initiatives) – un organisme américain à but non lucratif. Le projet est initié en 1994 dans le cadre de l’initiative NCSTRL (Networked Computer Science Technical Reports Library) soutenue par la DARPA (Defense Advanced Research Projects Agency). Parfois appelé « permalien », un URI (Uniform Resource Identifier) de type handle reste valide et permet de localiser un document même si le nom de domaine de l’archive ou l’emplacement du document (URL) change. C’est donc un élément central pour la citation des documents numériques.

La syntaxe d’un Handle est la suivante :
<protocole (https)><adresse (hdl.handle.net)><préfixe (2268)><suffixe (126111)>

Un même handle peut être résolu et noté de différentes manières :
Avec le protocole https : https://hdl.handle.net/2268/126111
Avec le protocole Handle : hdl:2268/126111

L’adresse de base mise en place par le CNRI est http://hdl.handle.net. Le préfixe 2268 de l’exemple ci-dessus identifie l’archive DSpace de l’Université de Liège. Il est  attribué par le CNRI et consiste en un chiffre ou en des groupes de chiffres séparés par un point, reflétant la structure d’une archive ou d’un groupe d’archive. Dans l’exemple précédent, le suffixe  ou numéro de document 126111 est attribué de manière locale et automatiquement par le logiciel d’archivage. Lorsqu’un handle est résolu (cliquer sur le lien https://hdl.handle.net/2268/126111), le navigateur adresse une première requête à un serveur proxy qui donne en retour et de manière transparente pour l’utilisateur un ordre de redirection vers l’URL de destination https://orbi.ulg.ac.be/handle/2268/126111. La page s’affiche, contenant les métadonnées du document et les liens vers les fichiers à télécharger.

Fonctionnement du système

Le système Handle repose sur la présence d’un réseau de serveurs jouant des rôles différents. Un serveur central appelé “Registre de Handle Global” (RHG) reçoit les requêtes. Il est basé sur le logiciel libre HANDLE.NET développé par le CNRI et s’appuie pour la résolution sur la présence de “Services de Handles Locaux” (SHL) ou Serveurs de Handle. Ces derniers paramétrés localement renseignent le RHG sur le nom de domaine de l’archive. Un même SHL peut desservir une ou plusieurs archives.

Principe de fonctionnement d’un serveur résolveur de lien

Au final, le processus de redirection est invisible si les temps de réponse des serveurs sont satisfaisants. On clique sur un URI de type Handle et la page recherchée s’affiche automatiquement dans le navigateur. Il est possible de visualiser le flux des données généré au niveau du navigateur à l’aide de l’extension HTTPHeaderLive de Firefox par exemple. La première page provient du RHG. Elle contient l’en-tête 303 et fournit au navigateur les instructions de redirection vers l’URL résolue. Une page contenant le statut 200 OK s’affiche ensuite en provenance du SHL.

Mise en œuvre

Le SHL fonctionne à l’aide d’un logiciel libre java développé par le CNRI qu’il convient d’installer. Un SHL peut devenir fonctionnel et connecté au RHG après inscription auprès du CNRI. Un numéro de préfixe à paramétrer est fourni moyennant un droit d’inscription de 50$ et une cotisation annuelle de 50$. L’administrateur du SHL paramètre à l’aide d’une interface dédiée l’URL de l’archive.

Utilisateurs

On peut citer parmi les principaux utilisateurs du système Handle la Bibliothèque du Congrès, la Fondation internationale DOI (Document Object Identifier). Le logiciel d’archivage DSpace implémente également les fonctionnalités de handle en standard. Plutôt rarement mis en place en France, à part par l’INIST-CNRS (iRevues, OpenGrey, Lara), par l’archive Speech & Language Data Repository (plus de 260 000 données orales pour la recherche) par la bibliothèque de Sciences Po (Spire) et par l’INSERM (iPubli), le système Handle s’avère fréquemment utilisé dans d’autres pays européens, à l’Université de Liège par exemple, au Royaume-Uni, dans les pays nordiques, et de manière principale aux États-Unis. Les sites webs qui se servent de ce permalien sont généralement gérés par des archives, des bibliothèques gouvernementales et universitaires, des organismes de recherche, des laboratoires publics ou des éditeurs de revues numériques localisés dans 67 pays des 6 continents. En 2012, 200 000 préfixes étaient déjà attribués par le CNRI. Le système DOI fonctionne sur le même principe avec les mêmes applications et sert plus de 60 millions d’identifiants pérennes.

Conclusion

Cet article n’aborde, pour faciliter la compréhension, qu’une partie des possibilités du système. Celui-ci fait l’objet des spécifications RFC 3650, 3651 et 3652 de l’IETF. Handle et PURL sont tous les deux susceptibles de fournir des identifiants pérennes, mais le système Handle s’assure en plus du caractère unique de l’identifiant. Handle et  DOIs sont basés sur les mêmes logiciels développés par le CNRI. Une traduction en français de la page anglaise de Wikipedia “Handle System” est en cours. Cette initiative ne concerne pour l’instant qu’une partie du document d’origine. L’aide d’autres bénévoles sera la bienvenue pour finaliser cet effort de traduction.

Références

Autres articles de ce blog sur les URL persistantes

Un commentaire

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s