Home / Recommandations Memoriav / All / 10.1 Archivage numérique des photographies


Retour à la page principale
< page précédentepage suivante >

10.1 Archivage numérique des photographies

10.1 Archivage numérique des photographies

OAIS (Open Archival Information System) ISO 14721h

Conserver les photos numériques sous une forme utilisable : le modèle OAIS

Pouvoir utiliser des photos numériques longtemps implique de consentir quelques efforts. Ceci vaut également pour les informations contextuelles dans d’autres formats de fichiers qui sont tout aussi importantes que les photos elles-mêmes et qui font souvent partie intégrante des fonds photographiques. Que l’institution patrimoniale soit petite ou grande, la procédure internationale utilisée pour conserver les photos sous une forme utilisable est l’OAIS. L’abréviation signifie Open Archival Information System, soit Système ouvert d’archivage d’information. L’OAIS est enregistré comme norme ISO depuis 2003 et la version actuelle est ISO 14721:2012 (NESTOR 2013). L’OAIS n’est pas un logiciel, mais un modèle fonctionnel qui offre un concept et une terminologie normalisée. C’est pour cette raison que le modèle convient aux institutions de toute taille et qu’il est mondialement reconnu et répandu.

Chaque institution conçoit et met en œuvre un système ouvert d’archivage d’information en tenant compte de ses propres besoins et en fonction du niveau requis. Les paragraphes suivants présentent un aperçu pratique de la manière de procéder pour trois tailles d’institutions patrimoniales.

L’OAIS dans une petite institution

Une petite institution détient généralement peu de fonds volumineux, reçoit un public restreint et n’a pas beaucoup de ressources humaines et financières. On peut imaginer une commune ou un musée local qui gère une collection de photos relatives à l’histoire locale ou les fonds de photographes ayant exercé leur activité dans la région. Une petite institution devrait procéder comme suit :

  1. Prouver l’intégrité des photos.

  2. Ne pas sauvegarder les photos sur des supports amovibles, mais sur des serveurs ou un environnement comparable à des serveurs, sur lesquels il est possible d’instaurer des processus de sauvegarde automatisés.

  3. Cataloguer et contextualiser les photos.

  4. Établir la documentation des mesures de conservation. 

Prouver l’intégrité des photos

Des fichiers photographiques peuvent être endommagés par une procédure quelconque et les photos peuvent être modifiées dans des programmes de traitement d’images. C’est pour cette raison qu’il est nécessaire de prouver qu’une photo est restée inchangée depuis son archivage. On appelle somme de contrôle ou valeurs de hachage les procédés courants pour prouver l’intégrité. Une somme de contrôle consiste en une chaîne de signes qui est générée à partir d’un fichier avec un certain algorithme. Elle peut être sauvegardée avec le fichier photo (par exemple en format TXT ou XML) ou être gérée dans le système de catalogage. L’intégrité de l’image peut être vérifiée ultérieurement avec ce même algorithme. La moindre modification du fichier génère une tout autre somme de contrôle. Si la chaîne de signes est identique, cela signifie que le fichier est intact et qu’il n’a pas été modifié. La somme de contrôle ne peut pas sauvegarder l’intégrité, mais uniquement la prouver.

Il faut choisir un procédé très répandu dans le monde et qui sera de ce fait disponible à long terme comme SHA (Secure Hash Algorithm) ou le plus ancien MD5 (Message Digest Algorithm). On trouve sur internet des outils légers et gratuits pour générer ou vérifier des sommes de contrôle.

Sauvegarder les photos dans un environnement serveur

Tout support de stockage peut rendre l’âme ou devenir techniquement obsolète. C’est pour cette raison qu’il est vivement déconseillé d’utiliser un quelconque support amovible pour une sauvegarde à long terme. Le contrôle de ces supports exige des ressources démesurées.

Les mémoires enregistrées sur des systèmes de serveur peuvent également à tout moment être victimes d’une défaillance. Ces systèmes peuvent cependant être contrôlés automatiquement, si bien qu’en cas d’incident une alarme est déclenchée. Les environnements serveur offrent des solutions de stockage qui travaillent au moyen de la redondance. Cela garantit de pouvoir remplacer les éléments de stockage isolés (disques durs) en cas de défaillance, sans risque de perdre des données.

La technique du serveur de stockage en réseau Network Attached Storage (NAS) constitue un environnement serveur typique pour une petite institution. Il s’agit de systèmes de stockage qui sont reliés avec le réseau, d’où leur nom. L’équipement minimal comprend un NAS avec deux disques durs qui sauvegardent les données de manière redondante. Ainsi un disque dur défectueux peut être remplacé sans pertes de données. La condition toutefois est que l’appareil soit surveillé en continu et qu’on puisse agir dans les meilleurs délais.

Un NAS, même avec disques durs redondants, ne dispense pas d’avoir un concept de sauvegarde et de duplication. En cas d’enchaînement de circonstances malheureuses, par exemple si les deux disques durs lâchent, ou de force majeure, il faut pouvoir recourir à une copie des données qui sont séparées du stockage principal. Cette sauvegarde est actuelle et ne peut en aucun cas être endommagée ni devenir obsolète sans que cela ne se remarque. Le processus de restitution des données doit être vérifié en l’exécutant périodiquement et en le documentant.

Cataloguer et contextualiser

La valeur culturelle des photographies n’est préservée que si des données descriptives leur sont adjointes et restent accessibles. Plus les données cataloguées sont riches mieux le contenu des photos et le contexte dans lequel elles ont été prises seront transmis à la postérité. Pour le catalogage (voir : Chapitre 7 | Catalogage, inventoriage) => Link zu entspr. Kapitel, il convient de noter que les photos numériques  contiennent des métadonnées qui sont inscrites directement dans le fichier par l’appareil qui a procédé à la numérisation ou par les programmes de traitement d’image. Ces informations se trouvent dans l’en-tête (header), une zone au début du fichier d’image, encore avant les informations sur l’image à proprement parler. Il existe, dans ce domaine, différents formats standards tels que EXIF, IPTC ou XMP. Tant qu’un format de fichier d’image peut être affiché par un logiciel, les métadonnées qu’il contient sont lisibles. Elles peuvent compléter les données du catalogage. Elles peuvent cependant également être lues depuis les fichiers d’image et être transférées dans le système de catalogage.

Établir la documentation des mesures de conservation

Une petite institution consigne également toutes les mesures qui ont été prises à des fins de conservation. Quels formats de fichier sont autorisés pour l’archivage ? Comment s’effectue le lien entre le catalogue et les données utiles ? Quand et avec quels moyens a été effectuée la numérisation ou les fichiers ont-ils été migrés dans un nouveau format ? Les images ont-elles été retravaillées ou sont-elles demeurées à l’état brut ? Documenter les mesures de conservation correspond à une longue tradition pour les objets physiques, cette opération est tout aussi importante pour comprendre les objets numériques et l’histoire de leur archivage.

L’OAIS dans une institution moyenne

Par institution moyenne, on entend une institution patrimoniale municipale, cantonale ou suprarégionale ayant des ambitions professionnelles et disposant de ressources à la hauteur.

Une institution moyenne procède comme une petite, mais effectue les tâches supplémentaires suivantes :

  1. Mettre en place un système référentiel.

  2. Vérifier périodiquement l’intégrité et assurer une veille technologique pour les fichiers et le système d’archivage.

  3. Mettre en réseau le catalogue et le système référentiel.

  4. Automatiser les processus de travail pour l’intégration des photos dans les archives.

  5. Assurer l’accès numérique. 

Mettre en place un système référentiel

Un système référentiel est un logiciel spécialisé qui gère des mémoires d’archivage numériques. Il commande l’accès à la mémoire et la rend ainsi plus sûre qu’avec des interventions manuelles impliquant des risques liés à la manipulation. La fonction principale d’un référentiel est de rendre les ressources numériques clairement identifiables à l’aide d’identifiants permanents (persistent identifiers PID). Ces derniers sont des identificateurs uniques permettant de retrouver et de citer les documents numériques de manière pérenne. Un référentiel offre d’autres interfaces pour le stockage et l’utilisation des données et des métadonnées et prend en charge la gestion de l’utilisateur. Il permet de vérifier l’intégrité de manière automatisée et sait à tout moment quels formats de fichiers se trouvent dans la mémoire et en quelle quantité. Des fonctionnalités supplémentaires du système référentiel concernent les actions de conservation. Les formats de fichiers obsolètes contenus dans la mémoire peuvent être transférés dans des formats d’archivage actuels par le biais de processus contrôlés. Il ne s’agit pas d’activités quotidiennes, mais d’actions liées à une planification minutieuse souvent accompagnée d’essais.

Vérifier l’intégrité et assurer une veille technologique

Une fois par an, il faut vérifier à l’aide de listes de contrôle si tous les éléments de l’équipement, des logiciels et des formats de fichiers sont actuels. L’OAIS nomme cette fonction planification de la pérennisation. C’est une fonction d’organisation qu’un logiciel ne peut remplacer, mais qu’il peut soutenir. Pour ce faire, les responsables s’en tiennent aux recommandations de tiers qui observent l’obsolescence menaçant les éléments technologiques ou les formats de fichiers, comme le Centre de coordination pour l’archivage à long terme de documents électroniques (CECO), qui publie un Catalogue des formats de données d'archivage [8.9.2021].

Un système référentiel qui vérifie périodiquement l’intégrité des données utilisées garantit qu’on puisse réagir en cas d’irrégularités. Sinon il faut faire ces vérifications avec d’autres moyens.

Mettre en réseau le catalogue et le système référentiel – Automatiser les processus

Plus le nombre de données numériques gérées par une institution est grand, plus il est important de disposer d’une infrastructure en réseau cohérente et de processus automatisés. Les composantes du système et les besoins de l’exploitation pouvant être très différents, les mesures appropriées sont donc très individuelles.

Assurer l’accès numérique

Les utilisateurs et utilisatrices veulent une excellente ergonomie pour la recherche et le visionnement de matériel photographique, habitués qu’ils sont avec les moteurs de recherche tels que Google, les portails d’images comme Flickr ou simplement avec leur propre smartphone. Plus les photos d’une institution sont utilisées, plus il vaut la peine d’investir dans l’ergonomie de la consultation numérique.

L’OAIS dans une grande institution

Les grandes institutions cantonales ou nationales aspirent à un haut degré de professionnalisme dans la gestion de leurs fonds. Outre les points déjà mentionnés, elles sont attentives aux aspects suivants :

  • Les infrastructures de stockage spécialisées veillent à fournir une grande capacité et un haut degré de sécurité contre les défaillances. Les supports de stockage utilisés répondent à des normes internationales et sont largement répandus sur le marché. L’infrastructure de stockage bénéficie de contrats de maintenance.

  • Les référentiels de grandes organisations ne se contentent pas d’établir des identifiants permanents valables uniquement au sein de leur organisation, mais les enregistrent auprès d’agences d’enregistrement accessibles au public. Des exemples de ce genre de systèmes sont les identifiants DOI (Digital Object Identifier) surtout répandus dans les milieux bibliothécaires, et ARK (Archival Resource Key).

  • Les sauvegardes sont géographiquement séparées du lieu de stockage.

  • Il existe des processus intégrés à haut débit de données entre le centre de numérisation et le lieu où les archives sont stockées à long terme.

  • L’accès automatisé se fait au moyen d’un système avec panier d’achats et éventuellement la possibilité de payer avec une carte de crédit.

  • Il existe éventuellement une infrastructure pour récolter des informations supplémentaires par le biais du crowdsourcing. Ce genre d’action participative donne l’occasion à des bénévoles externes (utilisateurs et utilisatrices) d’enrichir les informations sur les images. Cette infrastructure permet de réaliser des projets et de reporter leurs résultats dans le catalogue.

Formats de données

 Un format de données définit comment la séquence d’octets enregistrée doit être interprétée afin de créer un objet lisible et intelligible pour l’humain. Le choix du format approprié représente donc un problème central de l’archivage numérique. À cet égard, il faut tenir compte de différentes exigences qui peuvent s’avérer contradictoires :

  • Conservation de l’information : dans la mesure du possible, il faut renoncer à la compression avec perte. Le choix de formats durables réduit le nombre de migrations nécessaires et potentiellement avec perte.

  • Maintien de la lisibilité : les institutions d’archivage se fondent sur plusieurs critères pour émettre des prévisions concernant la longévité et la lisibilité d’un format de données. L’essentiel réside dans la diffusion (mesurée sur la base du nombre de fichiers et du nombre de produits logiciels compatibles avec le format). Autres éléments importants : l’ouverture et, si possible, la normalisation de la spécification de format ainsi que, en fonction du catalogue de formats, des critères supplémentaires qui peuvent également être pondérés.

  • Utilisation facile : établir certains formats de données comme adaptés pour l’archivage permet à une institution d’archivage de se concentrer sur une palette claire de spécifications, d’outils et de connaissances.

  • Coûts : les photographies sont particulièrement sujettes à des coûts non négligeables dans le domaine des espaces de stockage. Les formats de données peu encombrants sont avantageux en la matière, mais impliquent généralement une compression.

En principe, les formats suivants entrent en ligne de compte pour l’archivage photographique :

  • RAW : les formats de données brutes enregistrent les données du capteur de l’appareil photo sans autre traitement, d’où leur comparaison fréquente au négatif analogique. Dépendants du type d’appareil, ils sont majoritairement propriétaires, c’est-à-dire uniquement lisibles et traitables par le logiciel du fabricant correspondant. Les formats RAW sont presque exclusivement utilisés dans le domaine de la photographie professionnelle.

  • DNG, le Digital Negative Format, a été mis au point par Adobe en tant que format de données brutes générique appelé à remplacer les différents formats RAW propriétaires. Certaines caméras peuvent directement enregistrer au format DNG. Les autres nécessitent une conversion.

  • TIFF, le Tagged Image File Format, est très répandu en tant que format standard pour l’archivage d’images, en particulier pour les documents numérisés. Étant donné que le TIFF permet une multitude de compressions, d’espaces de couleur, de profondeurs de couleurs, etc., il faut impérativement tenir compte de l’utilisation d’une version TIFF adaptée à l’archivage.

  • Le format JPEG2000 est une alternative au format TIFF. Il peut être compressé ou non, avec ou sans perte. Une compression modérée permet de réaliser des économies significatives en termes d’espace de stockage. En particulier, l’intégration de JPEG2000 dans PDF/A-2 est aussi envisageable pour la numérisation d’originaux basés sur les pages.

  • JPEG est le format d’image le plus répandu, en particulier en tant que format standard pour la photographie numérique non professionnelle. Compte tenu de la compression utilisée, il n’est généralement pas considéré comme un format d’archivage. L’ouverture de la spécification ainsi que la diffusion du format offrent toutefois des prévisions très favorables pour la lisibilité des fichiers JPEG.

D’autres formats d’images tels que PNG ou GIF n’entrent pas en ligne de compte pour l’archivage photographique, au même titre que tous les formats vectoriels.

Le choix d’un format d’archivage dépend essentiellement du format d’origine.

Exemples :

  • Il peut être indiqué d’archiver les données brutes pour l’archivage de photos d’origine numérique issues de l’environnement professionnel. Étant donné que les formats RAW propriétaires sont peu adaptés aux archives, le format DNG est plutôt indiqué. L’archivage supplémentaire d’un format usuel tel que JPEG est recommandé.

  • Si les photos sont disponibles dans un format compressé (par exemple photos d’origine numérique d’un appareil photo amateur ou photos numérisées issues d’un processus de numérisation configuré en conséquence), la conversion dans un format non compressé n’a aucun sens étant donné que la perte d’information correspondante est irréversible. Dans un tel cas, l’archivage au format original est indiqué.

  • Le TIFF est considéré comme le format de prédilection dans les processus de numérisation. Dans de tels cas, il ne faut toutefois pas négliger la perte d’information par rapport à l’original analogique. Des études ont révélé que cette perte peut être supérieure à celle provoquée par une compression modérée. Une telle « compression modérée » peut se traduire par une économie d’espace de stockage décuplée. L’enregistrement des numérisations au format JPEG2000 doit donc être vérifié au cas par cas, en particulier concernant les coûts d’enregistrement.

Produire des catalogues et des recommandations de formats pour un usage concret livre des informations précieuses, elles doivent être cependant interprétées et appliquées à la lumière du contexte. Une compréhension de base du fonctionnement des formats d'archives potentiels est essentielle pour les archives.

Bibliographie et liens:

  • ARK (Archival Resource Key). Online, consulté le 14.12.2022

  • DOI (Digital Object Identifier). Online, consulté le 14.12.2022

  • EXIF (Exchangeable Image File Format), Online Wikipedia, consulté le 14.12.2022

  • IPTC Standard, Online Wikipedia, consulté le 14.12.2022

  • ISO-Standard 14721:2012. Online, consulté le 14.12.2022

  • KOST-CECO: Catalogue des formats de fichiers pour l’archivage. Online, consulté le 4.1.2023

  • MD5 (Message-Digest Algorithm), Online Wikipedia, consulté le 14.12.2022

  • Nestor-Arbeitsgruppe OAIS-Übersetzung/Terminologie: Referenzmodell für ein Offenes Archiv-Informations-System - Version allemande 2.0, 2013, Online, consulté le 14.12.2022

  • OAIS Version 2012: CCSDS Magenta Book: Reference Model for an Open Archival Information System (OAIS). Online, consulté le 14.12.2022

  • OAIS Community Forum (DPC). Online, consulté le 14.12.2022

  • SHA (Secure Hash Algorithm), Online Wikipedia, consulté le 14.12.2022

  • XMP (Extensible Metadat Platform), Online Wikipedia, consulté le 14.12.2022 

Dernières modifications: octobre 2017


Retour à la page principale
< page précédentepage suivante >




Recherche


Index



WordPress Themes