Evaluation des supports et formats de fichiers vidéo les plus courants
Le format de fichier et le support de données sont très importants pour assurer aux documents la plus longue durée de vie possible. L’évaluation qui va suivre des formats de fichiers vidéo et des formats des supports a été menée par le groupe de travail interdisciplinaire de Memoriav et soumise à l’examen du Réseau de compétences vidéo/TV de Memoriav. Les formats ont été sélectionnés en fonction de leur ‹ archivabilité › respectivement de leur disposition pour une conservation à long terme. Ils ne concernent donc que des copies destinées à l’archivage, et non les copies d’utilisation ou pour un autre usage. Ces dernières ne doivent en effet pas répondre aux mêmes exigences que les copies d’archive.
L’évaluation se base sur les critères que le réseau de compétence NESTOR pour l’archivage et la mise à disposition à long terme des ressources numériques a publié dans son manuel, « Eine kleine Enzyklopädie der digitalen Langzeitarchivierung ». (Neuroth et al., S. 147f) Les exigences indiquées dans ce manuel ne valent pas seulement pour les copies numériques mais aussi pour les documentations numériques ou numérisées et pour les métadonnées.
Les codecs mentionnés dans le tableau sont déjà utilisés dans des institutions patrimoniales. Nous n’entrons pas en matière sur d’autres codecs (par ex. HuffYUV, Lagarith, etc.), qui permettent aussi une compression sans perte, mais qui sont dans notre pays (CH) peu voire pas du tout utilisés. L’évaluation est faite sur trois niveaux, à savoir :
Recommandé : sur la base des critères de NESTOR, le codec se prête sans restriction à une utilisation future et peut être conservé à long terme.
Recommandé sous conditions : le codec empêche certaines possibilités futures d’utilisation mais peut néanmoins être recommandé sous réserve des conditions mentionnées.
Pas recommandé : le codec empêche d’importantes possibilités futures d’utilisation et de migration. En clair : compressé avec perte, propriétaire, non normalisé, risque d’obsolescence, support inapproprié.
Catégorie: Images fixes (film uniquement) |
|||
Format de fichier (lin : linéaire log : logarithmique |
Domaine d’application du format |
Archivabilité |
Commentaire |
TIFF non-compressé (8/16 bit lin) |
Enregistrement, post-production, archivage |
Recommandé (sans Layer) |
Très répandu, normalisé, non compressé; TIFF 8 lin n’offre pas de résolution suffisante de la chrominance. Au vu des capacités de traitement et de stockage actuelles, ce format n’est plus un compromis recommandable (comme lors de notre 1ère édition). |
TIFF avec compression LZW |
Enregistrement, post-production |
Recommandé sous conditions |
Compressé, problèmes de compatibilité possibles entre différentes versions software |
DPX (10bit, 12bit, 16bit) |
Enregistrement, post-production, archivage |
Recommandé |
Très répandu, non compressé, standard de l’industrie (SMPTE 268M2003); différentes souscatégories existent |
JPEG 2000 |
Post-production, distribution, archivage |
Recommandé sous conditions |
Demande une puissance de calcul importante; diffusion pas encore garantie; pas exempt de coûts de licences |
JPEG (compression intraframe modulable) |
Enregistrement, post-production |
Pas recommandé |
Compression avec perte |
Catégorie: Codecs vidéo |
|||
Format de fichier / débit |
Domaine d’application du format |
Archivabilité |
Commentaire |
DV (SD seulement) / 25 Mbit/s |
Enregistrement, post-production |
Recommandé sous conditions |
Sa grande diffusion comme format de production dans le domaine amateur et semiprofessionnel permet de le recommander sous conditions |
MPEG IMX, (MPEG-2, SD seulement) / 50 Mbit/s |
Enregistrement, post-production |
Recommandé sous conditions |
Sa grande diffusion dans le domaine télévisuel permet de le recommander sous conditions |
DVCPro50 (SD seulement) / 50 Mbit/s |
Enregistrement, post-production |
Recommandé sous conditions |
Diffusion limitée, format propriétaire (supporté seulement par Panasonic) |
DVCPro100 (HD seulement) / 100 Mbit/s |
Enregistrement, post-production |
Recommandé sous conditions |
Diffusion limitée, format propriétaire (supporté seulement par Panasonic) |
10 bit-4:2:2, non-compressé (p.ex. v210) / SD: 207 Mbit/s / HD: 1,04 Gbit/s |
Post-production, distribution (rarement), archivage |
Recommandé |
Influence minime sur la qualité visuelle au moyen d’un sous-échantillonnage malgré la réduction considérable des données; diffusion principalement dans les musées, v210 est un Apple-Codec |
10 bit-4:4:4, non compressé (z. B. v410, HD seulement) / 1,56 Gbit/s |
Post-produktion, distribution (rarement), archivage |
Recommandé |
Cf. HDCam SR (voir cidessous) |
8 bit-4:2:2, non-compressé (p.ex. YUY2 oder 2yuy) / SD: 165 Mbit/s HD: 830 Mbit/s |
Post-production, distribution rarement), archivage |
Recommandé |
Influence minime sur la qualité visuelle au moyen d’un sous-échantillonnage malgré la réduction considérable des données; peu diffusé |
H.264 / AVC (Advanced Video Coding) / débit variable |
Production, distribution |
Non recommandé |
Pas de standard unique; voir les indications complémentaires ci-dessous |
H.265 / HEVC (High Efficiency Video Coding) / débit variable |
Distribution |
Non recommandé |
Le standard existe, la compression est bien plus efficiente qu’avec H.264 |
Apple ProRes / SD: 30–62 Mbit/s / HD: 100–250 Mbit/s |
Post-production |
Recommandé sous conditions |
Variantes citées dans l’ordre décroissant de leur qualité (4444 XQ, 4444, 422 HQ, 422 Standard, 422 LT et 422 Proxy); format propriétaire Appole, bitstream et décodage publié par SMPTE; recommandé sous condition pour des fichiers ProRes natifs |
Apple ProRes RAW / débit variable |
Enregistrement |
Recommandé sous conditions |
Utilisé dans les caméras et scanners de film; recommandé sous condition pour des fichiers ProRes natifs |
CineForm RAW / débit variable |
Enregistrement |
Recommandé sous conditions |
Utilisé dans les caméras et scanners de film; recommandé sous condition pour des fichiers ProRes natifs |
XDCam HD (MPEG-2) / 50 Mbit/s |
Enregistrement, post-production |
Recommandé sous conditions |
Recommandé sous conditions car il s’agit d’un format standard ’enregistrement dans les stations de télévision |
FFV1 (dès la version 3) / débit variable |
Archivage |
Recommandé |
Format non compressé, sans perte, développé explicitement pour l’archivage |
Codecs Avid (DNxHD) / SD: 146–186 Mbit/s / HD: 36-440 Mbit/s |
Post-production |
Non recommandé |
Standard pas uniforme, existence de différents codecs Avid, format propriétaire de l’entreprise Avid |
Famille de formats REDCODE RAW, étroitement liée à JPEG 2000 (HD seulement) |
Enregistrement |
Non recommandé |
Compatibilité à long terme incertaine |
Catégorie: Container (Vidéo) |
|||
Format de fichier |
Domaine d’application du format |
Archivabilité |
Commentaire |
Motion JPEG 2000 |
Archivage |
Non recommandé |
Développé explicitement pour l’archivage mais toutefois très peu utilisé; peu d’implémentations ou sinon très chères; en partie propriétaire, ce format demande une puissance de calcul très élevée pour créer et lire le codec obligatoire JPEG 2000 |
MP4 |
Distribution |
Recommandé sous conditions |
Usage très répandu; conçu pour enregistrer le codec H.264 mais accepte aussi d’autres codecs vidéo et audio (AAC, MP3, MP2, MP1); standard ISO |
IMF (Interoperable Master Format) |
Post-production, distribution |
Recommandé sous conditions |
Conteneur très flexible et prometteur mais peu utilisé dans les archives, la médiation et la production de films; potentiel certain si l’industrie le supporte et qu’une variante pour archivage est définie et normalisée |
MKV (Matroska) |
Archivage |
Recommandé |
Open Source, développé expressément pour l’archivage; très utilisé et développé dans le monde par les professionnels en combinaison avec FFV1; standardisation en cours |
MOV (QuickTime File Format) |
Post-production, distribution |
Recommandé sous conditions |
Conteneur propriétaire Apple, très répandu, peut enregistrer plusieurs codecs; prudence requise car Apple a plusieurs fois et beaucoup modifié le format (les versions les plus récentes sont proches de MP4); le Quicktime Player pour OS Windows n’est plus soutenu |
AVI (Audio Video Interleave) |
Post-production, distribution |
Recommandé sous conditions |
Conteneur propriétaire Microsoft, très répandu, peut enregistrer plusieurs codecs; prudence requise car le Rewrapping d’autres conteneurs dans AVI peut faire perdre des métadonnées, p. ex. date de création originelle, Time cod |
MXF (Material Exchange Format) |
Post-production, distribution, archivage |
Recommandé |
Standard flexible dans le domaine de la diffusion; peut aussi empaqueter des fichiers textes, XML (y.c. métadonneés) mais d’utilisation complexe et difficile; la spécification AS-7, développée par des services d’archives publics états-uniens est lourde, nécessite des logiciels coûteux mais reste utile comme unique spécification existante pour archives en combinaison avec JPEG 2000 |
DCP (Digital Cinema Package) |
Post-production, distribution |
Recommandé sous conditions |
Pas un vrai conteneur ! Structure définie de répertoires, qui contient les medias dans un conteneur MXF; compression préalable élevée, avec pertes et cryptée, ce qui rend la manipulation pendant l’archivage difficile |
Catégorie: Formats Streaming |
|||
Format / débit |
Domaine d’application du format |
Archivabilité |
Commentaire |
|
|
|
Purs formats de distribution, fonctionnant avec des compressions propriétaires, avec pertes (par ex. Flash, WebM). Ne se prêtent pas à l’utilisation comme copies d’archivage |
Catégorie: Cassettes vidéo Les bandes vidéo matérielles peuvent être considérées comme obsolètes. Ces supports ne sont plus recommandés pour l’archivage. En cas d’exceptions, dues aux processus existants et à l’infrastructure disponible, les formats ci-dessous peuvent encore être utilisés. D’ici 10 ans au plus tard, l’archivage sur bande devra être abandonné. |
|||
Format / débit |
Domaine d’application du format |
Archivabilité |
Commentaire |
DVCam / 25 Mbit/s |
Enregistrement, post-production |
Voir ci-dessus |
Recommandé sous conditions du fait de sa grande diffusion comme format de production pour le film amateur et semiprofessionnel; il doit être préféré à DV et DVCPro |
Digital Betacam (SD seulement) / 126 Mbit/s |
Enregistrement, post-production, archivage |
Voir plus haut |
Recommandé comme solution temporaire en lieu et place des fichiers SD 10bit4:2:2 non compressés, lorsqu’infrastructure et savoir-faire font défaut; encore très répandu mais le fabricant Sony a annoncé arrêter le support après 2023 |
HDCam SR (HD seulement) / 440/880 Mbit/s |
Distribution |
Voir plus haut |
Recommandé comme solution temporaire d’enregistrement lorsqu’infrastructure et savoir-faire font défaut, pour les fichiers HD non compressés 10bit 4:2:2; encore très répandu mais le fabricant Sony a annoncé arrêter le support après 2023 |
Supports optiques vidéo |
|||
Format / Débit |
Domaine d’application du format |
Archivabilité |
Commentaire |
DVD / 4–9 Mbit/s |
Distribution |
Non recommandé |
Les supports ne sont pas appropriés pour l’archivage |
BluRay / environ 36 Mbit/s |
Distribution |
Non recommandé |
Les supports ne sont pas appropriés pour l’archivage |
XDCam
|
Enregistrement |
Non recommandé |
Les supports ne sont pas appropriés pour l’archivage |
Supports média non spécifiques |
|||
Format |
Domaine d’application du format |
Archivabilité |
Commentaire |
M-DISC |
Archivage |
Non recommandé |
Ne convient pas pour l’audiovisuel (densité des données, volume de stockage); incertitudes quant à la production future d’appareils de lecture |
ODA |
Archivage |
Non recommandé |
Format propriétaire Sony; retours expérience des archives inconnus |
HDD |
Archivage |
Recommandé sous conditions |
Conditions préalables: plusieurs copies stockées à différents endroits, sélection des interfaces appropriées, durée de vie estimée à 3 ans |
RAID |
|
Recommandé |
Condition préalable: garder d’autres copies de sécurité sur d’autres système |
SSD |
|
Non recommandé |
Pas approprié pour l’archivage car il vieillit mal; support dépendant d’éléments matériels trop petits pour résister correctement à l’usure et à des facteurs externes |
LTO (7 und 8) |
|
Recommandé |
Format soutenu par le consortium; possible utilisation comme standard de description dès la génération LTO-5 LTFS. LT=–1 à 4: migration immédiate; LTO-5 et -6: migration recommandée |
DLT |
|
Non recommandé |
Vieilli et plus de support; migration immédiate |
MPEG-4: indications complémentaires
Le format conteneur MP4 et le codec H.264 sont souvent mentionnés en relation avec des fichiers à forte compression (et risque de perte), qui sont optimisés pour Internet. Ces formats, MPEG4 ou H.264, peuvent cependant, en plus des données compressées avec des pertes invisibles à l’œil nu, et des données compressées avec perte, qui sont les plus couramment utilisées, contenir aussi un échantillonnage Y′CBCR 4:2:2 non compressé. Cette configuration, bien que rarement présentée, pourrait fort bien servir de format d’archivage.
JPEG 2000, Motion JPEG 2000 et FFV1 : indications complémentaires
Le JPEG 2000 (J2K), qui est dans son essence un format Open Source, a été introduit en 2000 et conçu pour les images fixes. Il s’agit d’un format compressé de fichier, avec une compression Intraframe, basée sur la technique de « compression par ondelettes » (dite « wawelet compression » en anglais, soit la décomposition de l’image numérique en ondelettes). La compression par ondelettes donne de meilleurs résultats visuels que la compression spatiale courante JPEG, et ce pour la même réduction du volume de données. Cette technique permet une compression sans perte ou avec perte. La compression sans perte diminue en moyenne les fichiers d’environ la moitié de leur taille, ce qui représente une réduction modérée. De façon concomitante, la puissance de calcul nécessaire pour l’exécution de la compression et pour la lecture des fichiers compressés est très élevée. S’ajoute un autre désavantage, l’absence d’applications orientées utilisateurs. Ces deux raisons ont empêché la diffusion du codec jusqu’à présent. Même l’implémentation standardisée (et avec elle la compatibilité entre différentes applications) est remise, à tout le moins, en question. Il n’est jusqu’à présent pas clair si ce format de fichier peut vraiment s’imposer dans des institutions patrimoniales (voir Ill. 1).
Le codec J2K est cependant employé en conformité avec le standard ISO/IEC 15444-1 pour la fabrication d’éléments de projection cinématographiques. Les éléments de projection sont délivrés sous forme d’un ensemble de fichiers, nommé Digital Cinema Package (DCP). Ces éléments étant de nos jours souvent les seuls à être proposés comme versement aux services d’archives, une évaluation du codec se fait nécessairement sous cette forme. L’important est de retenir que les DCPs ne conviennent normalement pas pour l’archivage. La compression J2K employée dans ce cadre est une compression avec perte ; des métadonnées importantes manquent. Les DCPs sont généralement aussi pourvus d’une clé de sécurité numérique, dans le but de contrôler es droits d’auteur et les droits d’utilisation (DRM, Digital Rights Management ; en français GDM). Si l’on ne dispose pas de la clé ou si celle-ci est devenue caduque après un certain laps de temps, les données ne sont plus utilisables, quand bien même leur état serait irréprochable. Des services d’archives importants utilisent aujourd’hui le format J2K compressé sans perte en combinaison avec un conteneur MXF pour l’archivage numérique de leurs images fixes (par exemple celles résultant de la numérisation des films): la Librairie du Congrès recourt à MXF AS-07 selon les spécifications FADGI (p.ex. Library of Congress, FADGI). Sa variante, le format de fichier comprimé avec perte, est utilisée pour le format de distribution cinématographique DCP.
Le format Motion JPEG 2000 a été défini lors de l’introduction de la partie 3 des spécifications ISO. C’est un format conteneur qui enregistre des séries de fichiers de format J2K complétés de leur fichier son, puis les met à disposition sous forme d’images animées. La création et la lecture de fichiers Motion JPEG 2000 exige un procédé de calcul extrêmement long et donc coûteux, qui s’est avéré être le principal obstacle à l’implémentation et à la diffusion du format. Il n’existe jusqu’à présent toujours aucun logiciel, ou presque, qui puisse produire et restituer le format du fichier. En conséquence, ce format n’est quasiment pas attesté au sein des institutions patrimoniales.
Après le format JPEG 2000, c’est avant tout le codec FFV1 qui offre une solution pour une compression sans perte et l’archivage d’images animées. FFV1 est l’exemple d’un codec développé pour l’archivage et de plus en plus utilisé dans des institutions patrimoniales ; c’est également un produit Open Source des mieux adaptés pour l’archivage de fichiers vidéo, l’ingestion de données issues des formats de cassettes numériques et de fichiers numériques natifs.
Les vidéos sont généralement sauvegardées sous forme de gros fichiers distincts, qui contiennent le stream des images. Les films, souvent numérisés sous forme de séries d’images fixes peuvent aussi être recodés sans perte d’information dans un stream de format FFV1, et empaquetés dans un conteneur Matroska avec le son, les sous-titres etc. Cela donne un fichier MKV, avec un stream vidéo et des sommes de contrôles généralement intégrées, lequel rend possible un contrôle automatisé de l’intégrité de chaque image, respectivement d’échantillons de l’image, dits « slices »). Ce type de stockage (FFV1 et MVK), en comparaison avec le stockage d’images fixes, simplifie l’utilisation des bandes LTO et de tout autre procédé de copie et de transferts.
Le recours à FFV1 et MKV peut aussi s’avérer particulièrement intéressant pour les services d’archives, car il permet d’archiver numériquement et de la même manière et les films et les vidéos. Ce procédé facilite de plus aussi la production de copies d’utilisation des documents filmés. En effet, un stream existe déjà, qui peut être converti plus rapidement dans les formats d’utilisation appropriés que les images fixes elles-mêmes.
L’emploi de FFV1 et MKV pour l’archivage des films permet d’ailleurs de réduire le volume des données d’un à deux tiers. Seule une infime partie des fichiers doit être l’objet de soins, et cela représente, un gain de temps considérable lors de la lecture et de l’écriture (ouverture et sauvegarde des fichiers), ce qui n’est pas le cas de la conservation des images fixes.
Le format FFV1/MKV peut s’avérer d’un traitement difficile dans les étapes suivantes, car son import natif n’a jusqu’à présent pas été supporté dans les logiciels de post-production commerciaux et professionnels. Les fichiers destinés à être traités par un logiciel commercial doivent d’abord être convertis, pour pouvoir ensuite traiter le stream vidéo. Il existe en revanche des outils Open Source qui permettent de poursuivre directement le travail sur les fichiers dans le format FFV1/MKV.
Certains défauts de FFV1, pertinents pour l’archivage numérique, ont déjà été portés à la connaissance de la communauté de développeurs et celle-ci travaille à programmer une version FFV1 corrigée des lacunes signalées. Comme cela concerne le développement Open Source, il est possible de faire part, sous forme d’une requête à la communauté, d’exigences spécifiques.
Le manque d’implémentations conviviales empêche souvent la diffusion plus large de ce type de codec – ce qui, à nouveau, limite la portée d’une recommandation de son utilisation pour l’archivage. Ce sont souvent des connaissances approfondies en informatique qui s’avèrent nécessaires pour les utiliser, sauf si l’industrie ajoute ces codecs et formats à sa palette de produits.
La percée définitive des formats développés pour l’archivage dépendra beaucoup de la décision de les utiliser par un assez grand nombre d’institutions patrimoniales importantes.
Le format J2K dans le conteneur MXF est utilisé dans les éminentes institutions patrimoniales suivantes : la Bibliothèque du Congrès à Washington ; la Cinémathèque royale de Belgique, à Bruxelles ; l’Institut national français de l’audiovisuel (INA), à Bry-sur-Marne.
Les institutions suivantes, patrimoniales ou autres, se sont décidées pour le format FFV1 : Cinémathèque Française, Paris ; Österreichische Mediathek, Vienne ; les Archives de la Ville de Lausanne ; Archiv für Zeitgeschichte, Zurich ; Swiss Archive for the Performing Arts (SAPA), Zurich ; Museum für Kommunikation, Berne ; autres institutions dans le monde, voir la liste (Wikipedia, FFV1).
Des institutions travaillent avec des formats de fichier non compressés, comme la Tate à Londres.
Cette liste n’a qu’une valeur d’exemple et n’est de loin pas exhaustive.
Stockage sous forme de séries d’images isolées
Les films d’une largeur de 35 mm sont divisés en plusieurs unités, regroupées en dossiers, du fait de la longueur disponible limitée pour les bobines de film. La longueur maximale d’une galette destinée à la projection pouvait, au début de l’industrie cinématographique, aller jusqu’à 305 mètres, ce qui correspondait à une projection d’environ 10 minutes et d’environ 16 000 images pour une vitesse de lecture de 24 images par seconde. Dès le début des années 1930, de plus grands rouleaux firent leur apparition, qui mesuraient jusqu’à 610 mètres, ce qui correspondait à environ 32 000 images.
La subdivision existante en dossiers est en principe conservée après la numérisation sous forme de séries d’images isolées dans des répertoires de fichiers : on obtient par film et en fonction de sa longueur totale une série de répertoires de fichiers, qui correspond aux dossiers et galettes de films originels.
Des sommes de contrôle peuvent être établies, soit par répertoire, soit par images isolées. Dans les deux cas, une procédure automatisée est recommandée.
Le stockage d’images animées sous forme de séries d’images isolées offre certains avantages, mais présente également des désavantages par rapport au stockage sous forme d’un seul fichier. Il est donc généralement employé pour les formats à haute définition et les formats spéciaux. Une lecture immédiate n’est pas possible lors de l’accès aux images isolées. Mais ce désavantage existe aussi pour les fichiers média, selon le volume du fichier ou sa compression. On a affaire à de très nombreux petits fichiers au lieu d’un petit nombre de très gros fichiers. Si un seul fichier est définitivement endommagé, la perte de données, mieux circonscrite, reste bien plus limitée et peut être réparée plus facilement. Les données sont plus aisément reconstituées que lors d’un défaut touchant un très gros fichier vidéo. La manipulation (en particulier la sélection et le transfert des données, par exemple pour un stockage sur LTO) est par contre considérablement plus aisée ; son coût en temps et en puissance de calcul, ainsi que le risque d’erreurs de transmission sont considérablement réduits.
Les recommandations suivantes sont faites pour le stockage de séries d’images isolées :
-
Il faut garantir que l’information sur la vitesse de lecture ne soit pas perdue.
-
Le son doit être stocké séparément et sans compression ou avec compression sans perte (et calé sur la vitesse de lecture). Des marqueurs visuels et audio aux fins de synchronisation doivent être disponibles.
-
Il faut éviter que le grand nombre d’images isolées provoque un chaos. Les conventions de nommage ont un rôle particulièrement important et selon leur nombre, les images doivent être réparties dans des répertoires.
Bibliographie et liens
-
FFV1, Wikipedia-Artikel (anglais). Online, consulté le 14.12.2022
-
Neuroth, H.; Oßwald, A.; Scheffel, R.; Strathmann; K. Huth, K. (Hg.): nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung. Online, consulté le 14.12.2022
-
Library of Congress FADGI MXF AS-07. Online, consulté le 14.12.2022
Dernières modifications: novembre 2019