Articles tagués Données personnelles

Archives numériques personnelles : les fondamentaux de la numérisation

Une image numérique est constituée de dizaines de milliers de carrés minuscules appelés pixels.

Une image numérique est constituée de dizaines de milliers de carrés minuscules appelés pixels

Mike Ashenfelder (Bibliothèque du Congrès) expose les techniques que les particuliers peuvent employer pour numériser leurs photographies et documents anciens. Il nous guide en 3 étapes dans la manipulation du scanner, dans le choix des résolutions, des formats, des types de compression, ainsi que dans le nommage et la sauvegarde de nos fichiers numériques. Quelques informations supplémentaires et liens vers Wikipédia complètent ces recommandations traduites en français dans ce billet. Bonne numérisation !

Personal Digital Archiving: The Basics of Scanning, 2014, Mike Ashenfelder, The Signal : Digital Preservation, Library of Congress : http://blogs.loc.gov/digitalpreservation/2014/03/personal-digital-archiving-the-basics-of-scanning/

[…]

Lorsque vous scannez une photographie papier, l’appareil crée une version numérique de la photo constituée de dizaines de milliers de carrés minuscules appelés pixels. Ce processus de conversion du papier vers le numérique constitue la numérisation. Cette opération s’applique aux images, textes, documents vidéos ou audios. Ce billet s’intéresse surtout au scan et à la numérisation des photographies sur support papier.

Etape 1 : Préparer le scanner et les photos

La première étape du processus consiste à nettoyer le scanner et les photos. Les taches, la poussière et les cheveux sont numérisés en même temps que vos photos ce qui peut nuire à la qualité des documents. Essuyez la vitre du scanner avec un chiffon clair, non pelucheux humidifié avec de l’eau. Ne pas pulvériser d’eau directement sur le scanner, vaporisez le chiffon. Essuyez aussi l’intérieur du couvercle du scanner.

Ensuite, utilisez un chiffon anti-statique sec pour essuyer avec précaution la photographie. Vous pouvez trouver ces chiffons dans un magasin d’appareils photos. En plus de nettoyer la photo, ils empêchent l’attraction des poussières et des cheveux. Placez la photo nettoyée sur le scanner. Ne pas toucher le verre quand vous posez la photo. Si vos doigts tachent le verre, vous aurez à recommencer le nettoyage! Faites glisser la photo jusqu’au bord de la vitre du scanner et vers le haut jusqu’à l’angle de la réglette pour un meilleur alignement.

detect-separate-itemsCertains logiciels détectent les photos ou documents séparés et les numérisent sous forme de fichiers individuels. Laissez environ un centimètre entre les photos pour aider le logiciel à reconnaître les différents objets. Fermez le couvercle avec précaution pour que les photos restent alignées sur le rebord de la vitre.

Etape 2 : Régler les propriétés du scanner – résolution et profondeur des couleurs

Maintenant que votre scanner et vos photos sont prêts, procédez à quelques réglages. Depuis votre ordinateur, ouvrez le logiciel du scanner. Trois réglages sont importants :

  • la résolution de l’image numérique exprimée en points par pouce (dpi)
  • le type d’image (couleur ou niveaux de gris).
  • le format de fichier des images produites (TIFF, PNG, JPEG sont proposés) et parfois le type de compression associé au format.

Le point par pouce ou “dpi – dot per inch” est une mesure de la densité de pixels. Les spécialistes de l’image utilisent le terme plus précis de «pixels par pouce» ou “ppi”. Toutefois, les scanners commerciaux utilisent presque exclusivement “dpi” et nous nous en tiendrons ici à ce terme.

scan_300-400dpi_220jpgPlus il y a de pixels par aire de surface, plus l’image peut contenir de détails. Une image en 200 points par pouce contient potentiellement plus de détails que la même image en 75 points par pouce. Il existe des valeurs de dpi optimales dépendant des types et tailles de photos. Plus n’est pas toujours mieux. Il y a une limite ou un seuil au-delà duquel l’augmentation n’apporte rien. Cette limite dépend de la résolution de la photo d’origine.

  • 300 à 400 dpi conviennent pour des photographies personnelles standards. Cela rend possible des impressions en format d’origine ou légèrement agrandi.
  • Parce que les tirages de petite taille et les diapositives contiennent de nombreux détails localisés dans une petite zone, capturez plus de points par pouce, environ 1400 à 1500 dpi.
  • Les négatifs contiennent aussi beaucoup de détails. Sélectionnez dans ce cas un minimum de 1500 à 2000 dpi. Rappelez-vous qu’une augmentation des dpi entraîne la production de fichiers plus volumineux.

8-bit_onlyCertains logiciels permettent de régler la “profondeur des couleurs” exprimée en bits par pixel. Plus le nombre de bits par pixel est élevé, plus riche est la palette numérique. Le paramètre de numérisation le plus souvent utilisé est de 8 bits par pixel pour des photos en niveaux de gris (certains scanners proposent également 16 bits), et 24 bits par pixel pour la couleur (certains scanners vont jusqu’à 48 bits). Un nombre accru de bits par pixel permet une édition ultérieure de meilleure qualité. Mais pour une numérisation standard pour laquelle il n’y a pas d’édition prévue ou pour laquelle la qualité n’est pas un défi, sélectionnez  8 bits pour les niveaux de gris et 24 bits pour la couleur. Rappelez-vous qu’une augmentation des bits par pixel entraîne un volume de données accru et des fichiers plus volumineux. Si la photo que vous souhaitez numériser est en noir et blanc, sélectionnez « niveaux de gris ». Si le papier photo est en couleur, sélectionnez “couleur”.

Etape 3 : Format de fichier et Compression

tiff-lzw-compression_smallLe logiciel du scanner enregistre votre scan sous forme de fichier numérique dans les formats courants TIFF ou JPEG . Le format TIFF, préféré pour la préservation des données numériques, contient l’ensemble des informations en provenance du scanneur. Enregistrez si possible votre fichier maître au format TIFF. Si l’espace de stockage est limité, vous pouvez compresser et réduire la taille de ces fichiers. Certains logiciels offrent l’option de compression LZW qui permettra de réduire la taille des TIFF sans perte d’informations. C’est ce qu’on appelle la compression « sans perte ».

jpeg_max-quality_200En revanche , l’enregistrement d’une image au format JPEG entraine une compression “avec perte”. Un fichier JPEG est par nature comprimé. Une partie des données numériques capturées par le scanner est perdue lors de l’enregistrement au format JPEG. Vous pouvez sélectionner des niveaux variables de qualité, impliquant différents niveaux de compression allant de « compression faible » – avec une perte de données faible et une qualité d’image élevée – à « compression élevée » – avec une quantité élevée de données perdues et une qualité d’image moindre.

Nous recommandons qu’en cas d’intention de modification ou d’édition d’une photo numérique, vous enregistriez deux versions: une version maître et une copie de travail. Le fichier TIFF sera le fichier maître qui pourra être stocké en toute sécurité avec vos autres archives numériques personnelles. Utilisez une version JPEG comme copie de travail. Le fichier JPEG sera plus petit et plus facile à envoyer par email ou à adresser aux médias sociaux. Éditez, modifiez et travaillez avec ce JPEG. Vous pourrez toujours faire une nouvelle copie JPEG à partir du TIFF maître.

Une fois le type de fichier sélectionné, une fois défini la profondeur de couleur et réglé la résolution, vous êtes prêt à numériser. Prévisualisez le scan si vous disposez de cette option, regardez la vue pour vous assurer qu’il n’y a pas de poussière, de cheveux ou d’effet indésirable. Vérifiez que la photo est correctement alignée. Ensuite, appuyez sur « Scan ».

Renommer un fichier n'affectera pas le contenu du fichier.

Renommer un fichier n’affectera pas le contenu du fichier.

Après numérisation, certains logiciels vous demanderont de donner un nom de fichier, d’autres le nommeront automatiquement. Si un nom alphanumérique du style « DC2148793.jpg » est donné à votre fichier, vous pouvez le conserver ou bien en changer. Pour renommer, faites un clic droit – si vous êtes sur PC – et sélectionnez « Renommer ».  Sur Mac, faites un contrôle-clic et sélectionnez “Renommer”. Nous vous recommandons de renommer le fichier pour vous aider à le retrouver plus tard. Si le nom de fichier commence par la date suivie éventuellement du mois et du jour, auquel on ajoute un ou deux mots significatifs, cela permet l’affichage automatique des fichiers avec classement par ordre chronologique.

Retirez chaque photo du scanner en glissant dessous un morceau de papier et en le soulevant pour éviter ainsi de toucher le verre avec les doigts.

Dupliquez et sauvegardez vos données en plusieurs endroits différents dès que possible. Tous les cinq ans ou plus, faites migrer vos archives numériques personnelles sur un nouveau support de stockage afin d’éviter d’avoir votre collection coincée sur des supports obsolètes.

Vous trouverez d’autres articles en anglais de Mike Ashenfelder sur : http://publiclibrariesonline.org/author/michaelashenfelder/

[Note additionnelle du traducteur] Il est recommandé d’utiliser un plan pour nommer ses fichiers. Les caractères sous-ligné underscore (_) et tiret (-) peuvent servir de séparateur. Les majuscules, accents, espaces et caractères spéciaux sont à éviter. Un exemple de nom incluant la date du document, un identifiant et un numéro pourrait être « 20140618_toureiffel-12.jpg ». Si votre scan est destiné à être diffusé sur le web, pensez à optimiser (diminuer) la résolution pour le confort des usagers et la performance des serveurs.

Thanks Mike for your article and agreement for translation !

Publicités

, ,

Poster un commentaire

L’archivage pérenne des données numériques personnelles

LostLaptop1Les particuliers sont amenés à créer et à manipuler de nombreuses données numériques du type texte, son, image, vidéo, logiciel, document multimédia. Certains de ces documents s’avèrent uniques et constituent un véritable patrimoine personnel, professionnel ou familial qu’il convient de rendre accessible et préserver parfois sur plusieurs dizaines d’années. Mais sur de telles périodes, des négligences ou des incidents peuvent survenir, conduisant à une perte partielle ou totale des données. Des précautions particulières doivent être prises incluant des sauvegardes régulières et des changements de formats. Des services récents du web (le cloud) apportent de nouvelles possibilités pour la duplication et la sauvegarde mais aussi quelques nouvelles contraintes.

C’est vraiment tous les jours que nous utilisons toute une gamme d’appareils numériques parmi lesquels on peut citer ordinateurs fixes et portables, tablettes, téléphones mobiles, appareils photos, caméras, scanneurs, consoles de jeux, lecteurs audio, disques durs externes, disques multimédias, NAS, cartes mémoires, clés USB, etc. Ces appareils produisent, lisent ou stockent des données numériques dont certaines s’avèrent irremplaçables, résultant d’un travail important (élaboration de produits, écriture d’articles, créations artistiques, programmation informatique, photos et films familiaux numérisés). Il peut s’agir aussi d’informations pratiques (contacts téléphoniques d’un portable, papiers numérisés tels que papiers d’identité, titres de diplômes, feuilles de salaires, etc) ou de données achetées (musique, vidéos). La valeur personnelle ou financière n’est finalement bien souvent perçue que lorsqu’un incident survient, conduisant à une disparition partielle, voire totale des données.

Un rapide tour d’horizon permet de dégager les principales informations à préserver, les risques encourus, et les méthodes et stratégies à mettre en œuvre en fonction de critères tels que la nature ou le volume des données, la durée de préservation souhaitée. Différents outils peuvent également vous aider.

Association Française pour la Protection des Archives Privées
Druaux, Christophe : Constituer une archive photographique familiale
Huc, Claude : Préserver son patrimoine numérique
Classer, archiver et sauvegarder ses e-mails, photos et vidéo, contacts, documents administratifs – Guide à l’usage des particuliers et des entrepreneurs individuels, 344 pages Lee, Christopher A. :  I, Digital: Personal Collection in the Digital Era, 2011, ed. Chicago, IL: Society of American Archivists, 384 pages Library of  Congress : Personal archiving
Bass, Jordan Leslie : Getting personal : Confronting the challenges of archiving personal records in the digital age, Thèse en anglais, 2012, 154 pages Digital Preservation (Library of Congress) – vidéos en anglais : http://www.youtube.com/playlist?list=PLEA69BE43AA9F7E68
Personal Digital Archiving 2013 http://mith.umd.edu/pda2013/

Les données à préserver

Une liste non exhaustive des données personnelles à préserver comprend :

  • Contacts, répertoires téléphoniques, adresses mail, annuaires
  • Photos et vidéos personnelles
  • Documents bureautiques (CV ou articles, diaporamas, tableaux de données)
  • Documents multimédias (créations artistiques, blogs personnels, sites webs, données sociales)
  • Données professionnelles
  • Sites favoris, listes de flux RSS, bibliographie scientifique
  • Mails et messagerie
  • Sauvegardes numérique de documents administratifs (papiers et permis, photos du patrimoine mobilier, objets de valeur, patrimoine immobilier, feuilles de salaire, factures…)
  • Livres numériques, documents audios et vidéos achetés

Le caractère original des fichiers, commercial, partagé ou confidentiel voire sensible, la fréquence des modifications, le caractère juridique des données (droit de copie), le volume et la nature des données (texte, photo, vidéo…) sont autant de paramètres à prendre en compte.

ToutPratique : Ranger et classer les papiers S.I.Lex : Le cadre juridique de la Copy Party en dix questions

Une batterie de risques

Ces données encourent en effet des risques dont la prise en considération est d’autant plus nécessaire que la durée de préservation souhaitée est longue et que les données sont personnelles. On peut noter :

  • Perte ponctuelle de fichiers (effacement dû à une erreur de manipulation, défaut de classement, oubli, défection d’un service en ligne)
  • Problèmes logiciels (panne et bugs d’un logiciel ou du système d’exploitation)
  • Problèmes matériels (crash de disque dur, perte de l’intégrité des fichiers due à l’altération du support – CD-ROM ou disque dur)
  • Perte de matériel (CD-ROM, carte mémoire, perte d’un ordinateur portable ou d’un mobile lors d’un déplacement)
  • Sinistres (vol de matériel, incendie, inondation, tremblement de terre…)
  • Dégradations volontaires de la part d’un tiers (virus informatique, dégradation intentionnelle, interception de mot de passe)
  • Obsolescence des supports et des formats de données (support obsolète comme la disquette, format ancien non supporté par des logiciels récents)
  • Défection de services de sauvegarde sur internet (fermeture d’un fournisseur de services comme MegaUpload)
  • Défaillances de confidentialité de services du web (contenu espionné, mot de passe dérobé)
  • Changements liés à la santé des personnes (accident, maladie, décès) empêchant l’accès aux données ou la transmission d’autres personnes

Certaines précautions permettent d’éviter le recours à des pratiques de manipulation de disque endommagé ou d’archéologie numérique.

CASES-LU : Perte de données (dans un contexte professionnel) Barry M. Lunt : How Long Is Long-Term Data Storage? (en anglais) Récupération de données perdues : Le guide egoblog.net : Archéologie numérique : retrouver mes traces sur 10 ans de présence online Internet Archive : Wayback Machine

De bonnes pratiques informatiques

L’expérience montre que préserver des données numériques sur le long terme pour un usage personnel ou en vue de transmettre des informations nécessite le respect de quelques règles :

  • Protection des matériels et des logiciels : La protection physique des matériels (stockage dans des lieux appropriés et sécurisés, changement du matériel tous les 5 ans), la protection des accès (utilisation de mots de passe solides, gestion des droits et des sessions, chiffrement et verrouillage en cas de données confidentielles), protection de l’espace de stockage (mise à jour du système et des logiciels, utilisation d’un antivirus, d’un pare-feu, vérification des fichiers téléchargés), protection de la messagerie (utilisation de filtres anti-spam, gestion des indésirables, précautions concernant l’usage des fichiers attachés) sont autant de précautions nécessaires.
  • Organisation : Un travail important concerne le rangement et le classement des fichiers. Les noms de répertoires et de fichiers doivent comprendre un mot clé significatif et incorporer une date pour faciliter les recherches. Les accents, majuscule et caractères spéciaux à part « – » et « _ » sont proscrits des noms de fichier. Le classement en dossiers et sous-dossiers tient compte de la nature des données – personnelles ou professionnelles, texte, logiciel, photo, vidéo…
  • Sauvegarde : Une sauvegarde régulière doit être entreprise. Des supports adaptés au volume des données doivent être choisis :  clef USB, disque dur externe, NAS ou service de stockage sur internet si le débit de la connexion et les moyens financiers le permettent. Les disques de sauvegarde sont stockés de manière idéale dans un lieu autre que l’ordinateur principal. L’historique des sauvegardes est conservé et la restauration est régulièrement testée. Des logiciels facilitent ou automatisent ces opérations.
  • Migration et émulation : Sur le long terme, les formats de données évoluent, certains apparaissent, d’autres disparaissent. Il convient d’être vigilant sur les format d’archivage. On aura intérêt à sélectionner des formats largement utilisés et non propriétaires. Des migrations de format doivent être organisées en cas de perte d’usage ou disparition d’un format. Les données sont alors transcodées dans un nouveau format compatible, tout en veillant à la faible dénaturation de l’objet numérique. Des données analogiques gagneront à être numérisées. L’émulation est également citée comme solution de recours. Cela concerne surtout les particuliers passionnées de logiciels et de jeux vidéos.

Aidewindows.net : La sauvegarde tom’s GUIDE : Comment sauvegarder toutes vos données

Supports de stockage

Le temps de conservation des données dépend de la nature des supports de mémoire :

  • Disque dur : Utilisé dans la plupart des ordinateurs fixes et portables, pour les disques externes et les NAS, il offre de bonnes capacité de stockage (250 Mo à 4 To) pour un prix raisonnable. La durée de vie  moyenne d’un disque dur dépend de l’usage et de la fabrication. Elle est évalué en moyenne à 5 ans. Il est aussi possible d’automatiser les sauvegardes sur un ordinateur fixe en utilisant la technologie RAID (Redundant Array of Independent Disks). La configuration RAID 1 permet notamment de se protéger d’une panne de disque en installant au moins deux disques durs (Sur wikipedia : RAID (informatique)).
  • Mémoire flash : Peu encombrante et réputée plus résistante les mémoires flash qu’on trouve dans les clés USB, les cartes mémoires et les disques SSD sont adaptées au stockage pendant 5 ans de données dont le volume se limite à 256 Go.
  • Disques optiques CD, DVD et Blu-ray : L’utilisation de disques optiques représente un inconvénient en termes de temps de gravure et de gestion des supports. Une durée de vie de 10 ans est avancée dans des conditions de stockage satisfaisante pour les DVD. Ce support s’avère particulièrement avantageux si des gros volumes de données doivent être gérés, pour les vidéos par exemple.
  • Cloud : Malgré une faible vitesse de transfert et un coût élevé pour les volumes importants, le cloud s’avère particulièrement pratique. Il est à privilégier pour un faible volume de données partagé entre personnes et appareils. Les données confidentielles devront être préalablement cryptées.

Bocquet, Pierre-Yves : Sauvegarde informatique : Sachez préserver votre patrimoine numérique; Science & Vie; 2012, n°1142

Logiciels de sauvegarde

Différents logiciels permettent une sauvegarde automatisée et programmée sur des supports variés, disque dur, clé USB, disque optique (CD, DVD, Blu-ray), ou sur des réseaux (autre PC, FTP, http,…). On peut citer :

D’autres logiciels permettent de récupérer des données qui auraient été effacées par erreur :

Valent, Cyril : Comment ne jamais perdre les données de votre ordi; L’Ordinateur Individuel, 2012, n°254

Les services sur internet

Boostés par le récent développement des connexions à haut débit, des savoirs faire technologiques et des appareil mobiles (ordinateurs, smartphones, tablettes), de multiples services accessibles via le web sont apparus depuis les années 2000, posant de nouveau la question de la pérennité et de la confidentialité des informations. Quelques services d’usage courant sont les suivants :

On peut accéder aux données depuis n’importe quelle machine et de n’importe quel lieu pourvu que l’on dispose d’une connexion internet. Des documents peuvent être créés, modifiés, partagés, commentés par plusieurs personnes, conduisant à des pratiques sociales ou collaboratives dont Wikipedia, Facebook ou le développement collaboratif des logiciels sont des exemples.

L’emploi de ces services supprime certains risques et en crée une batterie de nouveaux, concernant la sécurité des réseaux et la sécurité des données. Des aspects juridiques et commerciaux entrent en jeu. La sauvegarde des données est confiée au fournisseur de service avec une garantie contractuelle faible. Un exemple récent est la fermeture du site de stockage et de partage de fichiers Megaupload. Des abonnés ont perdu leurs fichiers et leur argent lors de la fermeture des serveurs de cette société dont l’activité a été déclarée illégale. Des risques d’interception des données par des tiers sont encore présents.

Le Journal du Net : Les traitements de texte en ligne ZDNet.fr : A quel point Google Drive est-il propriétaire de vos données ? Clubic : Web 2.0 : Le point sur les risques de sécurité Wikipedia : Web 2.0

Cependant, certaines entreprises comme google mettent en place des services qui permettent de sauvegarder vos données sur le disque dur, laissant ouverte la porte à une récupération des données en cas de changement d’opérateur par exemple.

https://takeout.google.com/settings/takeout/downloads

Stratégie de préservation

Au final, une véritable stratégie de préservation doit être élaborée et poursuivie sur le long terme, tenant compte de la nature des données, des supports de stockage et des connaissances techniques de l’utilisateur. Un point important et souvent négligé concerne l’organisation des données. Les données confidentielles peuvent être stockées localement sur un disque dur crypté. Les données volumineuses, qui changent rarement gagnent à rester sur l’ordinateur principal moyennant une sauvegarde régulière facilitée ou automatisée à l’aide d’un logiciel. Les données fréquemment mises à jour (messagerie, la bureautique, l’agenda, les signets, les contacts, les fichiers partagés, textes, photos, code informatique), ou partagées entre machines et entre utilisateurs peuvent être localisées sur internet, chez des fournisseurs de service soigneusement sélectionnés. Ces données devraient aussi être régulièrement sauvegardées sur des supports tels que ordinateur, disque dur externe, NAS, clef USB, autre système de stockage sur internet, ou autre service d’internet comme SocialSafe. Les formats des données sont surveillés. Des travaux de numérisation ou de migration coûteux en temps peuvent s’avérer nécessaires.

L’archivage pérenne des données numériques personnelles nécessite la mise en place de bonnes pratiques maintenues sur le long terme. Si les tâches nécessaires sont réalisées au fil de la création des données, le travail supplémentaire reste raisonnable. Des services internet souvent non dénués de coûts et de risques apportent de nouvelles possibilités et nécessitent aussi des précautions particulières.

Références

http://blog.witness.org/2013/02/personal-digital-archiving/

, ,

Poster un commentaire