Home / Recommandations Memoriav / All / 9.2 Numérisation des documents sonores


Retour à la page principale
< page précédentepage suivante >

9.2 Numérisation des documents sonores

9.2 Numérisation des documents sonores

L ’Archeophone avec vitesse de lecture variable et des pièces de rechange pour plusieurs types de tailles de cylindres en cire. Photo: Phonothèque nationale suisse, Lugano

Il est nécessaire de faire des copies de sauvegarde des supports, non seulement parce qu’ils se détériorent, mais aussi parce que les appareils pour les lire sont obsolescents. Selon le format, les logiciels pour fichiers audio sont soumis à des licences et offrent peu de garanties pour l’avenir. En outre, l’information audio des formats avec réduction de données peut subir des modifications lors du transfert vers les formats d’archivage, de sorte que de nouvelles « informations », même parasites, sont ajoutées (appelées artefacts). La question est de savoir quel format est le plus approprié pour la conservation des documents.

Se pose alors le problème du choix du format le plus adapté à la conservation des documents. Le format analogique n’est pas une solution car il y a une perte de génération entre l’original et la copie. Cette perte se manifeste par une récupération de bruit (du souffle). Ainsi les copies de copies de copies … deviennent inaudibles.

Le format numérique semble donc plus approprié à une sauvegarde des archives. Les principaux avantages du numérique sont:

  • Qu’il n’y a pas de perte en terme de qualité lors d’une recopie (pour autant qu’on reste dans le domaine numérique).

  • Qu’un signal numérique peut-être régénéré.

En effet, aussi longtemps que deux états (0 ou 1) peuvent être distinctement différenciés, on peut reconstruire un signal numérique (du fait du codage binaire) même s’il est altéré. C’est un argument décisif dans le choix de sauvegarder des archives sous forme numérique.

Lors du report, les considérations suivantes sont à prendre en compte:

Si on dispose de plusieurs copies, il convient de choisir la meilleure. La qualité sonore varie considérablement selon les conditions de stockage et de manipulation des supports. Aussi, il est intéressant de chercher des copies sur le plan national et international afin d’en comparer la qualité. En règle générale, il faut privilégier les supports vierges de toutes écoutes car chaque lecture altère la qualité sonore des supports.

Selon l’état des supports, un nettoyage et une restauration physique s’imposent. Durant ces opérations délicates, il faut veiller à

  • ne pas détériorer le support plus qu’il ne l’est déjà (l’emploi de produits appropriés pour le nettoyage des supports est essentiel. C.F.: IASA TC-04).

  • manipuler le support le moins possible.

Dans le cas de supports rendus illisibles par leur lecture même, il faut les copier d’un jet. 

Une extraction optimale du signal des fonds d’archive

Une des considérations la plus importante dans la sauvegarde d’archives est le fait que le signal d’origine doive être reproduit (c’est-à-dire, dans ce contexte, que l’on pratique à la lecture d’un support dans le but de le copier) dans les meilleures conditions possibles. Il faut donc attacher une grande importance aux appareils de lecture qui doivent être récents et révisés régulièrement. Aucun traitement ne doit être appliqué lors du transfert afin de récupérer la totalité du signal.

Évolution des technologies de transfert

Les techniques de transfert des supports originaux évoluent constamment. A l’heure actuelle, il n’est pas possible de récupérer toutes les informations contenues sur les supports analogiques lors d’un transfert utilisant des appareils de lecture classique.

De nouvelles technologies rendent envisageable la reproduction d’autres informations contenues sur les originaux. Ce qui permettrait, entre autres, de pouvoir appliquer certains traitements au son afin d’en améliorer la compréhension. C’est pourquoi il faut toujours conserver les originaux et ne pas les détruire après copie.

Cependant, il vaut mieux copier le support en ayant à l’esprit que l’on est peut-être en train de le reproduire pour la dernière fois. Soit parce que le support sera trop endommagé lors de la prochaine tentative ou que les appareils de lectures ne seront plus en état de lire le support, soit parce que, pour des raisons économiques, l’institution détentrice des fonds décidera de ne pas investir dans une nouvelle sauvegarde trop coûteuse à ses yeux.

Il est donc important de choisir le standard le plus haut au moment de la copie. (IASA TC-03, chapitre 9)

Transfert – Ethique et principes

Il est très important que la numérisation du support analogique se fasse sans filtrage et que l’on n’intervienne pas sur le niveau sonore lors de l’enregistrement de ce que l’on pourra appeler le master numérique. En effet, ce fac-similé numérique devra être le plus proche de l’original possible. Il s’agit non seulement d’un des principes éthiques fondamentaux dans le domaine des archives, mais aussi d’une évidence d’un point de vue purement technique. Outre le fait que pour de multiples raisons, aussi bien historiques que techniques, on ne doit pas corriger une copie de sauvegarde, les technologies qui permettent «d’améliorer» le signal original évoluent rapidement. Aussi, qui peut garantir qu’un meilleur traitement ne pourra être appliqué sur un document dans le futur? Dans cette optique, le transfert se ferra après avoir estimé le niveau sonore maximum afin de déterminer le niveau d’entrée du signal analogique dans le convertisseur. Ce niveau ne devra plus changer durant tout le temps de l’acquisition.

Le convertisseur, appareil qui transforme le signal analogique en signal numérique, doit être d’excellente qualité. La IASA préconise l’utilisation d’un convertisseur externe de bonne facture car des interférences liées aux composants des ordinateurs perturbent la conversion. Les cartes son des ordinateurs de bureau sont donc à bannir pour ce type de tâches. Il faut tout de même s’assurer qu’une bonne carte son équipe la station de travail car l’écoute du document numérisé par l’opérateur se ferra par ce biais.

En ce qui concerne le format des sauvegardes numériques, outre les recommandations de la IASA qui suivent, il faut insister sur le fait qu’il ne doit pas être réduit ou dégradé, ni propriétaire. C’est pourquoi on parle de format PCM linéaire, ouvert et même de standard.

Le master numérique, ou fichier issu de la numérisation d’un document analogique, devra être envoyé sur un serveur sécurisé, c’estàdire où personne ne pourra le modifier. Des copies de ce fichier original seront faites pour toutes utilisations: copies de sauvegarde, copies de consultation, copies de diffusion, copies de travail … Le fichier source peut alors être considéré comme un fichier de conservation. N.B.: Pour l’instant, le temps de transfert d’un document analogique est identique à la durée d’enregistrement de l’original. Ce qui signifie qu’une bande magnétique de 49 minutes sera copiée en 49 minutes (temps de copie uniquement). Memoriav envisage des tests avec un système permettant la copie parallèle de plusieurs documents analogiques. Pour le moment la copie «high-speed» n’est pas recommandée.

IASA TC-03

Sauvegarde du Patrimoine sonore: Ethique, Principes et Stratégies de Conservation

Version 4, 2017 : Chapitre 10. Formats cibles de codages numériques et résolution – Remarques:

Ces dernières années, les documents sonores sont stockés surtout sous forme de fichiers aux formats .wav ou BWF, devenus de facto des standards. Ces formats sont officiellement recommandés par le Comité Technique (cf. IASA-TC 04, 6.1.1.1 et 6.6.2.2).

Les convertisseurs A/N d’échantillonnage 192 kHz et de résolution d’amplitude 24 bits sont les standards actuels. En ce qui concerne le transfert des signaux analogiques, l’IASA recommande une résolution numérique minimale de taux d’échantillonnage à 48 kHz et une longueur de mot de 24 bits. Pour les institutions en charge de documents patrimoniaux, une résolution de 96 kHz / 24 bits s’est largement répandue. Les composantes sonores non souhaitées étant transférées dans de telles conditions, l’élimination des artefacts au moyen de traitements numériques du signal s’effectuera plus facilement à partir de copies ainsi réalisées. Les enregistrements de parole, par le caractère transitoire des consonnes qu’ils comportent, doivent être traités comme les enregistrements musicaux.

Des copies du fichier original doivent être réalisées pour toutes les autres utilisations : copies de sauvegarde, de consultation, de diffusion, de travail, etc. Le fichier source peut être considéré comme fichier de conservation. Les noms de fichiers doivent être interprétables par l’homme, explicites, pouvoir être recherchés, regroupés (album, versions) et triés, et surtout ils doivent être cohérents sur l’ensemble du fonds. Ils ne doivent toutefois pas être utilisés pour emballer d’autres informations sur les différents documents. Les bases de données dans lesquelles les fichiers audio sont gérés sont prévues à cet effet. Vous trouverez de plus amples informations sur l’attribution de noms de fichiers dans l’ouvrage suivant : ARSC Guide to Audio Preservation, 2015, p. 138. Les métadonnées attribuées par le système d’exploitation ne sont pas stables (date de création/modification, type de fichier, etc.), elles doivent donc être cataloguées avec les autres métadonnées.

Migration / transcodage des enregistrements audio sur cassettes audio et vidéo et sur supports optiques dans des fichiers

Sur demande du client les cassettes analogiques vides étaient souvent confectionnéesavec une durée déterminée et avec des boîtes produites en couleur. Les paramètres adoptés correspondaient aux standards usuels des fabricants. Photo: Ruedi Müller

Cassettes audio (MC)

La cassette audio (également appelée musicassette ou MC) était largement répandue des années 60 à 90, du domaine amateur aux applications (semi-)professionnelles. Si elle est rare aujourd’hui, elle n’a pas encore complètement disparu du marché. Il arrive que des enregistrements sur cassette soient d’une qualité relativement élevée car à partir des années 80, on trouve des appareils d’enregistrement à la norme Hi-Fi. De même, le système Dolby d’atténuation du bruit de fond était souvent utilisé, ce qui est important pour une lecture correcte. Pour la planification des projets de conservation, il faut établir une distinction entre les enregistrements à caractère commercial, souvent distribués parallèlement aux disques, et les pièces uniques, c’est-à-dire des enregistrements dont il n’existe qu’un exemplaire. De nombreuses archives possèdent encore des stocks volumineux de ce type d’enregistrement, notamment dans le domaine radiophonique. Étant donné qu’il s’agissait d’un format amateur, diffusé via le marché de masse, les caractéristiques techniques des matériaux et des propriétés mécaniques diffèrent fortement. Sur les cassettes de fabricants de produits bas de gamme, la bande a parfois tendance à frotter contre le boîtier, ce qui provoque une détérioration. Par ailleurs, l’industrie proposait également des conditionnements spéciaux pour les enregistrements radiophoniques. Tous ces facteurs influent sur la stabilité à long terme.

  1. La durée de lecture dépend généralement de l’épaisseur des couches. En règle générale, les cassettes de plus courte durée possèdent une couche de support plus épaisse et sont donc moins sensibles à l’effet de magnétisation (effet écho ou print-through signal).

  2. La composition du matériau, en particulier de la couche magnétisable, varie fortement en fonction du fabricant et de l’année de production.

  3. Certains types de support (p. ex. AGFA Chromdioxid II) ont tendance à l’hydrolyse, ce qui se traduit par la libération de flocons blancs qui adhèrent rapidement aux têtes de lecture et atténuent le signal sonore.

  4. En cas de rembobinage avec un arrêt brusque à la fin, les bandes se détachent parfois de la bande amorce sur la bobine d’enroulement. D’où la nécessité d’ouvrir le boîtier pour recoller la bande, une opération chronophage.

Recommandations

L’avance rapide et le rembobinage des MC peuvent réduire considérablement la magnétisation ou l’effet d’écho (print-through signal). Il ne faudrait travailler qu’avec des magnétophones haut de gamme dotés d’un frein automatique, afin d’éviter tout détachement en fin de bande. Les cassettes qui présentent des particules blanches doivent être nettoyées à la main au moyen de chiffons spéciaux (p. ex. RTI cleaning tissue pour bandes vidéo). En règle générale, seules des machines bien entretenues et de bonne qualité doivent être utilisées pour la lecture. Lors de la reproduction du signal sonore, il faut prêter attention au type de bande (métal, chrome, normal, ferrichrome, etc.) et à l’utilisation ou non d’un système d’atténuation du bruit (Dolby B, C, etc.) lors de l’enregistrement initial. Il convient de régler le magnétophone en conséquence. En cas de doute sur l’utilisation ou non d’un système d’atténuation du bruit, il faut procéder à des tests.  

MiniDisc

Annoncé par Sony en 1991 et commercialisé dès 1992, le MiniDisc était destiné à remplacer les cassettes audio (MC). Jusqu’à l’apparition du téléchargement de fichiers musicaux en ligne, il était largement répandu pour l’usage privé de copies musicales sur des lecteurs compacts. Un algorithme de réduction des données (ATRAC) propriétaire spécialement développé par Sony permettait d’enregistrer un volume de données relativement élevé pour l’époque, sur un espace restreint (facteur de réduction 5). Le MiniDisc était certes peu approprié pour une utilisation professionnelle à la radio ou pour la sonorisation de films, mais pendant un certain temps, il a souvent été utilisé pour les prises de sons de reportages radio. Ce format a été évincé par la propagation rapide de plateformes en ligne de téléchargement et de partage de musique. La compacité des appareils et des supports, la possibilité d’enregistrer des données lisibles par ordinateur (MD Data, 140 Mo; MD-Data2, 650 Mo; Hi-MD, 1 Go), ainsi que l’absence initiale de possibilités d’enregistrement purement numériques sur le marché grand public ont permis à ce format de se maintenir pendant un certain temps. Des efforts ont été déployés pour l’ancrer sur le marché, tels que le développement de différents modes Long-Play plus puissants de réduction des données, ainsi que l’introduction d’appareils permettant également l’enregistrement de contenus audio PCM linéaires. Cependant, le public lui a progressivement tourné le dos, notamment en raison du caractère propriétaire des programmes informatiques connexes. En revanche, le MiniDisc était encore utilisé occasionnellement à cette époque pour l’enregistrement de voix dans des projets d’histoire orale, c’est-à-dire dans le cadre de la science et de la recherche. Le MiniDisc est devenu définitivement obsolète en 2007. La production d’appareils a complètement cessé depuis 2010. En 2012, seules des fins de séries de MiniDiscs étaient encore en vente. Les enregistreurs à cartes SD et les possibilités offertes par l’enregistrement informatisé ont eu raison du MiniDisc, qui fait aujourd’hui partie du passé.

Recommandations

Pour les archives, le format MiniDisc demeure un défi de taille: la conservation à long terme de documents enregistrés sur MiniDisc dépend en effet d’une combinaison matérielle et logicielle spécifique qui ne peut être intégrée facilement dans tous les environnements informatiques. Il n’existe aucun logiciel standard permettant de convertir le signal numérique de l’appareil en fichiers lisibles par ordinateur sans occasionner de pertes. Seul le logiciel «SonicStage» fourni par Sony à l’époque et aujourd’hui obsolète, est en mesure de recevoir le signal numérique via la connexion USB et de le convertir en un WAV linéaire. Et ce uniquement si les disques sont lus à l’aide d’un appareil Hi-MD (également obsolète). On ignore pendant combien de temps le programme d’installation du logiciel sera encore disponible. Pour toutes ces raisons, les documents sur MiniDisc devraient être copiés avec une certaine urgence.

À défaut du lecteur Hi-MD précité ou du logiciel SonicStage, la seule solution possible consiste à lire le signal audio en temps réel via la sortie analogique d’un appareil et de l’enregistrer par voie numérique. Si aucune sortie numérique n’est disponible, il ne reste plus qu’à lire le signal de manière analogique et à le numériser à nouveau via un convertisseur A/N. Cette solution de secours est certes loin d’être optimale, mais elle est toujours préférable à la perte de l’ensemble du document. Les métadonnées intégrées dans le flux audio (titre de la piste, compositeur/compositrice, etc.) sont perdues aussi bien lors du transfert numérique en temps réel que lors du transfert analogique et doivent être saisies manuellement, si elles existent.

Pour plus d’informations en ligne sur le MiniDisc voir: http://www.minidisc.org/index.php  

R-DAT

À l’instar du CD-R, la cassette audio numérique R-DAT (Rotary Head Digital Audiotape) est issue de la première phase de l’industrie des supports sonores dans le domaine du numérique. En principe, la bande intégrée dans une cassette est fabriquée dans le même matériau que les bandes de cassettes analogiques et est relativement stable moyennant un stockage correct. Par conséquent, le défi pour l’archivage ne réside pas tellement dans la dégradation du matériau, mais plutôt dans l’obsolescence du format. L’entreprise Sony, qui possède les brevets sur le mécanisme, a décidé en 2004 de ne plus fabriquer de machines et de ne plus livrer d’entreprises tierces en pièces détachées, faute de demande suffisante. Ce dispositif est jugé obsolète dans les cercles spécialisés depuis 2005.1 Il n’était plus en mesure de concurrencer les nouveaux formats de fichiers lisibles sur ordinateur. Plutôt répandue dans le domaine professionnel, la cassette R-DAT a souvent été utilisée comme support pour les copies de sécurité d’enregistrements historiques des radios et pour la sauvegarde de productions sonores précieuses. En Europe, de nombreuses archives radio ont ainsi emmagasiné des stocks importants de copies de disques acétate 78 tours ou de productions musicales importantes. La cassette R-DAT pouvait être indexée, ce qui avait pour avantage que les différents segments pouvaient être pilotés individuellement et que l’indexation pouvait être reprise par de nombreux appareils lors de la copie sur des formats CD-R. Étant donné que la cassette R-DAT était synchronisable avec certaines caméras vidéo, il faut aussi tabler sur la présence de fonds correspondants dans l’industrie cinématographique. La petite taille des composants mécaniques, conjointement avec l’enregistrement miniaturisé des différents signaux (signal audio, signaux de commande pour la lecture, signaux d’indexation, correction des erreurs, etc.) a porté préjudice à la durée de vie des appareils d’enregistrement. Ils étaient tellement fragiles que la réparation valait rarement la peine en cas de dérèglement de la position de la tête de lecture rotative.

Un collaborateur de Radio X en train de préparer un enregistrement pour un transfert sur un système de stockage de masse. Les enregistrements sonores sur supports numériques comme le MiniDisc ou le DAT doivent, eux aussi, être contrôlés et correctement indexés avant leur transfert. Photo : Ruedi Müller

Recommandations

Le recopiage de cassettes R-DAT est indiqué pour les raisons précitées. Les priorités quant au déroulement dans le temps des travaux de copie pourraient être établies en fonction de la disponibilité de copies ou d’originaux analogiques. Le retour aux disques acétate 78 tours est rarement adapté en raison de leur dégradation progressive et des coûts connexes élevés. En présence de copies au format CD-R à partir de cassettes R-DAT, il faut toujours partir de la cassette R-DAT, dans la mesure du possible (selection of best copy conformément à l’IASA).2 Lors du transfert du signal audio vers des fichiers audio, il faut veiller à sélectionner exactement les mêmes taux d’échantillonnage (fréquence d’échantillonnage en Hertz) et les mêmes longueurs de mots (résolution en bits) que sur la cassette R-DAT, afin d’empêcher toute détérioration inutile du signal sonore pendant la conversion. En présence d’enregistrements en mode Long-Play (32 kHz), le signal original doit être récupéré et enregistré dans le mode correspondant (en l’espèce 32 kHz) aux fins d’archivage. Toutefois, étant donné que l’utilisation est dans certains cas complexe, un «deuxième» fichier peut être créé avec d’autres paramètres, si nécessaire. Dans ce cas, il faut veiller à utiliser un dispositif de qualité élevée afin d’éviter toute dégradation audible du signal sonore, voire l’apparition d’artéfacts. En principe, la récupération des pistes établies sur les cassettes R-DAT est possible et recommandée. En fonction de la technique d’enregistrement employée ou des machines utilisées pour la lecture, la transmission correcte de ces informations n’est toutefois pas toujours garantie.3 Pour les projets de copie de plus grande ampleur de fonds R-DAT, il est dès lors recommandé de définir minutieusement un cahier des charges et de se procurer des offres de différents fournisseurs, ainsi que de mener un contrôle qualité des résultats.

Video8

S’ils sont plus rares, on rencontre parfois des fonds volumineux sur cassettes Video8. Ils ont par exemple été utilisés en raison des avantages qu’ils présentent pour l’enregistrement d’émissions radio complètes. Ils offraient en effet un espace relativement élevé. Les enregistreurs Video8 avaient la possibilité d’enregistrer six pistes audio stéréo au lieu de la piste vidéo d’une cassette Video8. Il s’agit d’un format numérique propriétaire de Sony. Les machines étaient en fait des produits de consommation améliorés dotés de composants semi-professionnels. Étant donné la très faible disponibilité des lecteurs à l’heure actuelle, même sur le marché de l’occasion, les collections correspondantes sont fortement menacées d’obsolescence et doivent être recopiées en urgence. Ce format n’a été commercialisé que pendant très peu d’années et il n’existe pratiquement plus aucune documentation fiable à ce sujet. Les cassettes pouvaient être lues avec une modulation de fréquence (cf. glossaire) analogique (Audio Frequence Modulation / AFM) ou numérique, depuis la fin des années 80, en 12 bits/32,25 kHz PCM. Étant donné que les machines étaient toutefois dépourvues de sortie numérique malgré leur capacité à réaliser des enregistrements numériques, l’enregistrement du signal sonore numérique original n’est possible qu’au moyen d’un investissement élevé (machines de substitution ou shunt). Dans ces conditions, il est difficile de formuler des recommandations précises.

Recommandations

Dans la mesure du possible, le signal numérique devrait être capté sans changements directement au niveau de l’appareil, puis être archivé. Il sera toujours possible d’en faire une copie de meilleure résolution ultérieurement. Si la récupération directe du signal est impossible en raison de l’absence de sorties correspondantes sur l’appareil, il n’est plus possible de conserver le signal numérique. La seule possibilité réside alors dans la numérisation du signal analogique. Dans ce cas, il est fortement recommandé de ne pas utiliser le convertisseur analogique / numérique interne, mais un convertisseur externe de qualité élevée et de créer des fichiers haute résolution d’au moins 96 kHz/24 bits.

VHS Hi-Fi et Beta Hi-Fi

Contrairement à la VHS et Betacam classique où les pistes vidéo et sons sont enregistrés séparément, l’enregistrement du signal audio se fait «dans» ou «derrière» le signal vidéo en modulation defréquence. Le format vidéo reste inchangé, seul le son – qui reste analogique – diffère. Ce format était utilisé en radiodiffusion et dans l’industrie. Les appareils de lecture sont difficiles à trouver.

Recommandations

L’extraction du son se fait via le panneau arrière du magnétoscope en analogique. Le signal sera ensuite numérisé à l’aide d’un convertisseur.

Transfert et sauvegarde des formats numériques multipistes

Ces formats développés dans les années 1980 sont devenus obsolètes après quelques années déjà à la faveur du passage à une production basée sur des fichiers. Ils sont la plupart du temps propriétaires et peu stables sur la durée, leur lisibilité étant fortement dépendante de la disponibilité d’appareils et de logiciels spécifiques. De plus, il existe relativement peu de connaissances sûres en matière de conservation dans ce domaine.

Pour conserver des fonds, il faut transférer toutes les pistes (simultanément) de manière numérique. Tous les enregistreurs de cette époque disposent d’interfaces numériques qui restent standard aujourd’hui (AES/EBU, ADAT, S/PDIF). Comme les enregistrements numériques sont beaucoup plus sujets aux effets du vieillissement en raison de l’altération des bandes et de la sensibilité de la mécanique des appareils, ils doivent être prioritaires par rapport aux enregistrements analogiques réalisés durant la même période, ne serait-ce que pour des raisons techniques. Même les codecs multicanaux comme le Dolby Digital doivent être linéarisés pour l’archivage en tant que pistes individuelles. Il en va de même pour les pistes individuelles des productions DAW actuelles (Protools, Logic, Cubase, etc.), qui ne peuvent déjà plus être reconstruites après quelques années en raison des mises à jour logicielles. En ce qui concerne les interfaces numériques, il faut également mentionner en particulier les appareils multipistes DASH qui étaient dotés de sorties analogiques et numériques. Ces derniers étaient toutefois équipés d’une interface MADI (« Multichannel Audio Digital Interface » qui pose aujourd’hui un certain nombre de problèmes de connexion.

Repiquage (récupération du son) depuis des CD/DVD

CD RIP

En 1982 Philips et Sony lancent sur le marché le compact disc (CD), un support qui par sa solidité, sa facilité d’emploi et sa limpidité du son, dépassera toutes les ventes des supports traditionnels.

CD Audio: il est composé d’une piste stéréo au format PCM (Pulse Code Modulation) d’une résolution de 16 bits et d’une fréquence d’échantillonnage de 44,1 kHz. Les spécifications de départ autorisaient une capacité maximum de 74 minutes soit 650 Mo. Par la suite, on s’est écarté des spécifications et on a augmenté la densité des CD pour atteindre 80 minutes soit environ 700 Mo.

CD-R: il a les mêmes caractéristiques techniques que le CD mais physiquement, il est composé, en plus, d’une couche de colorant organique. Il est donc très fragile et ne vieillit pas bien. Ce n’est pas un support de conservation.

Recommandations

Aujourd’hui, il existe une base de données en ligne permettant de vérifier si l’extraction du son est correcte.4 Pour les données ou les disques non répertoriés dans cette base, il convient de vérifier l’intégrité des données comme pour les DVD (voir les recommandations pour les DVD).

DVD RIP

Les DVD (Digital Versatile Disc) peuvent contenir du son sous différentes formes selon qu’il s’agit de DVD vidéo, DVD Audio ou DVD Rom.

DVD Vidéo: apparu en 1997. La capacité peut être de 4.7 Go (simpleface, simple-couche – support le plus commun); 8.5–8.7 Go (simple-face, double-couche); 9.4Go (double-face, simple- couche); 17.08 Go (double-face, double-couche – support très rare). L’audio est contenu dans les fichiers VOB. Les formats les plus répandus sont l’AC3 (format multicanal de Dolby Laboratories), le MP2 (ancien format de son VCD et SVCD – Stéréo), PCM (format de son aussi utilisé pour les DVD audio. Format linéaire) et le DTS (Digital Theater System. Son multicanal). DVD Audio: Peu répandu. Format de fichiers AOB. Ce type de support n’est pas compatible avec tous les lecteurs DVD. Le son est enregistré sur le support au format PCM linéaire ou réduit par MLP (Meridian Lossless Packing). Le débit total maximum est de 9.6 Mb/sec. Si la combinaison nombre de canaux/résolution dépasse cette valeur, le flux de données doit être réduit. En mode linéaire, on peut aller jusqu’à 96 kHz/16 bits ou 48 kHz/24 bits en 5.1, et 192 kHz/24 bits en stéréo. Pour stocker les pistes 5.1 dans une fréquence d’échantillonnage/résolution de 88.2 kHz/20 bits, 88.2 kHz/24 bits, 96 kHz/20 bits ou 96 kHz/24 bits l’encodage MLP est obligatoire. DVD-R: On peut stocker n’importe quel type de données sur un DVD-R. Tous les formats audio peuvent être inscrits sur ce support sous forme de fichiers, il faut faire attention à recopier les données sur un autre support le plus vite possible car, comme le CD-R, le DVD-R n’est pas un support de conservation à long terme, il est bien trop fragile.

Recommandations

Pour le DVD Vidéo ou Audio la récupération du son peut se faire comme pour le CD Audio avec des logiciels dédiés, on doit s’approcher le plus possible d’une extraction exacte du son (Accurate audio extraction) comme elle peut être pratiquée avec le CD Audio. Malheureusement de telles techniques ne semblent pas avoir été développées pour le DVD. Pour les DVD contenant des données, une simple copie de fichier (avec vérification) suffit. Il faut veiller à l’intégrité des données avant et après le transfert / la copie. Cette vérification peut être faite en calculant la somme de contrôle MD5 (cf. glossaire) des fichiers et en la comparant. Il convient aussi de faire un historique afin de savoir ce qui a été fait et comment on l’a fait.

Faire face à la protection contre la copie des CD et DVD

CD/DVD Copy protection

Les systèmes de protection contre la copie mis en place sur les CD et DVD commerciaux empêchent l’extraction du son sur ce type de support. Cependant, ils sont facilement contournable. De nombreux logiciels légaux ou non, permettent d’extraire les données («Ripper») des CD et des DVD.

Il existe différents types de limitations comme le cryptage CSS, la protection Macrovision ou la limitation de zone. Une fois la copie sans protection effectuée, il suffit de procéder comme avec un CD ou un DVD non protégé.

En lieu et place d’extraire des fichiers, il est également possible de créer une image ISO du CD ou du DVD. Cette opération inclut également dans la copie des fichiers cachés puisqu’elle réalise une représentation 1:1 de l’ensemble du système de fichiers et pas seulement un nouvel enregistrement de données individuelles.

Documents nés numériques

Le terme quelque peu imprécis de « né numérique » (de l’anglais born digital) désigne dans notre cas les documents sonores numériques qui n’ont pas été enregistrés sur des supports spécifiques tels que des CD-R, R-DAT, etc., mais ceux qui, lors de la prise de son, ont été créés directement sous forme de fichiers audio lisibles à l’ordinateur et qui sont stockés sur des supports non spécifiques.

De nos jours, la plupart des enregistrements audio actuels sont produits et stockés directement sous forme de fichiers (files). Dans l’idéal, cela s’effectue déjà dans un format plus ou moins adapté à l’archivage, en MIC (PCM) linéaire. Les fichiers qui ont été produits dans des formats non linéaires ou dont la transmission ne s’est faite que sous cette forme doivent, le cas échéant, faire l’objet d’une conversion en vue de leur archivage à long terme. Cela concerne notamment les documents dans des formats propriétaires ou à réduction de données ainsi que les formats particulièrement « exotiques », donc rares. Un format d’archivage ne remplace cependant jamais un document original, mais lui est toujours associé. Lorsque des formats à réduction de données ou propriétaires sont convertis en MIC linéaire (WAVE), il convient de veiller à conserver la fréquence d’échantillonnage (sample rate) d’origine afin de préserver l’intégrité du signal.

Lors de toute conversion, il faut garantir de ne perdre aucune métadonnée (ou le moins possible). En effet, même si seul le conteneur change, par exemple lors de l’enregistrement de fichiers Wave sous forme de fichiers Broadcast Wave, la date originale de création et de modification est perdue et doit être documentée. De même, convertir du MP3 en fichiers WAVE occasionne la perte de la plupart des méta-informations. Toutes ces informations peuvent toutefois être extraites au moyen d’outils tels que MediaInfo de MediaArea (voir lien ci-après) avant la conversion de sorte qu’elles restent ensuite disponibles pour un catalogage dans les règles. L’extraction et la représentation structurée des méta-informations à partir de l’en-tête des fichiers audio sont une chose essentielle, car cela permet d’épargner beaucoup de temps de catalogage. C’est un moyen de préserver la date de création, le titre, etc. Ces efforts consacrés à l’extraction et au traitement supplémentaire valent en tout cas la peine et les progrès rapides en la matière devraient continuer à réduire leur ampleur.

Étant donné que pour la plupart des formats de fichiers à réduction de données (par ex. AAC, WMA, MP3) il est impossible de garantir que les logiciels de décodages correspondants seront disponibles à l’avenir, ces fichiers doivent être convertis dans un format qui convient à l’archivage à long terme, si possible en MIC. Pour autant que cela soit possible, il faut veiller à ce que les fichiers originaux ne soient pas créés dans un format réduit.

Le format AAC et MP3 n’est certes pas adapté pour l’archivage à long terme, mais, en raison de la grande diffusion de ce format, les fonds importants ne doivent malgré tout pas être obligatoirement décodés et « gonflés » en .wav par une conversion ; du moins, pas dans l’immédiat. Cela présuppose toutefois de disposer des décodeurs (logiciels) correspondants, et il faut garantir de pouvoir décoder les fichiers au moyen de l’infrastructure informatique actuelle. Il faut également veiller au cours de ce processus à disposer de plus d’espace de stockage et d’un bon concept de migration si un transcodage en MIC linéaire devait s’avérer nécessaire ultérieurement. Dans ce cas il est aussi important de garder le fichier généré à l’origine en réduction de données étant donné qu’il s’agit de l’original.

En revanche, les fichiers MP3 peuvent absolument être proposés en plus comme copies de consultation ou de travail étant donné qu’ils sont optimisés à des fins de diffusion en continu (streaming) que leur taille réduite permet une copie rapide. Les fichiers stéréo à 44,1 kHz et avec un débit binaire de 128 kbit/s sont le standard recommandé à cet effet. Les fichiers MP3 avec d’autres débits binaires doivent être transcodés dans le format standard pour copies de travail afin de garantir un format de consultation uniforme dans l’ensemble des archives.

Les fichiers MIC linéaires peuvent rester dans leur fréquence d’échantillonnage d’origine pour l’archivage, même si celle-ci est inférieure à la valeur minimale recommandée de 48 kHz. Si la fréquence d’échantillonnage fait l’objet d’une modification, il convient de privilégier des multiples de la fréquence originale (transcoder les fichiers 44,1 kHz par ex. en fichiers 88,2 kHz et non en 48 kHz ; les fichiers 32 kHz en 96 kHz et, si nécessaire, seulement ensuite en 48 kHz ; ne pas passer directement de 32 kHz à 48 kHz). Les modifications de la fréquence d’échantillonnage devraient être effectuées uniquement à l’aide de logiciels de qualité au risque de voir des artefacts se « glisser » dans le signal sonore d’origine.

Bibliographie und liens

  • ARSC Guide to Audio Preservation. Sam Brylawski, Maya Lerman, Robin Pike, Kathlin Smith, editors. 2015. Online, consulté le 4.1.2023

  • IASA TC 03. IASA Technical Committee, The Safeguarding of the Audiovisual Heritage: Ethics, Principles and Preservation Strategy, Co-Edited by Will Prentice and Lars Gaustad. Version 4, 2017 (= Standards, Recommended Practices and Strategies, IASA-TC 03). Online, consulté le 13.9.2022

  • IASA TC 04. IASA Technical Committee, Guidelines on the Production and Preservation of Digital Audio Objects, ed. by Kevin Bradley. Second edition 2009. (= Standards, Recommended Practices and
    Strategies, IASA-TC 04). Online, consulté le 13.9.2022

  • IASA Task Force to establish Selection Criteria of Analogue and Digital Audio Contents for Transfer to Data Formats for Preservation Purposes, Chap.3, Technical Selection Criteria, Online, consulté le 13.9.2022

  • AccurateRip™ est la seule technologie d’extraction de CD Audio capable de vérifier que les fichiers audio extraits sont complètement exempts d’erreurs. Online, consulté le 13.9.2022

  • Mediainfo de MediaArea, Online, consulté le 13.9.2022

Dernières modifications: juillet 2021


Retour à la page principale
< page précédentepage suivante >




Recherche


Index



WordPress Themes