Metadaten entstehen während des gesamten Lebenszyklus eines Objekts: angefangen bei der Produktion bis hin zur Erstellung von archivtauglichen Dateien. Daher sollten Metadaten gut strukturiert werden, um die für eine bestimmte Anwendung relevanten Bestandteile einfach und zuverlässig nutzen zu können. Die relevanten für eine inhaltliche Recherche erforderlichen Metadaten unterscheiden sich z. B. von denen für eine geplante Ausstrahlung oder Edition. Erschliessungsinformationen, Dokumentation bzw. eben Metadaten sind insbesondere für die (langfristige) Erhaltung essentiell. Ohne solide Metadaten lassen sich Archivgut allgemein und digitale Dateien besonders schlecht (oder gar nicht) nutzen und verwalten.
Grundsätzlich kann nach ihrer jeweiligen Funktion zwischen technischen, beschreibenden, strukturellen und administrativen Metadaten unterschieden werden, wobei die Grenzen teilweise fliessend sind (Gregorio; Stepanovic 2008, S. 13f).
Die technischen und bei komplexeren Dateien auch strukturellen Metadaten beinhalten Informationen, die zum Abspielen des Dateiinhalts erforderlich sind, sowie Informationen zur Erstellung und Bearbeitung der Datei. Der Umfang technischer Metadaten variiert je nach verwendeter Infrastruktur sowie je nach Dateiformat und ist nicht explizit definiert. Die technischen Metadaten sind oft im sog. Header einer Datei untergebracht, können aber v. a. bei Containern auch an anderen Stellen innerhalb der jeweiligen Dateistruktur gespeichert sein. Der Header ist ein Bereich im Dateicode, in dem Informationen in Textform untergebracht werden können. In diesem Zusammenhang sind z. B. EXIF (Exchangeable Image File Format)-Daten zu erwähnen; diese werden direkt in den Header von Dateien, beispielsweise der Bildformate JFIF (JPEG) oder TIFF, geschrieben. Viele technische Metadaten, wie das Erstellungs- und das Änderungsdatum eines digitalen Dokuments, werden automatisch erstellt und können von Bildbearbeitungsprogrammen angezeigt werden. Einige lassen sich nicht mehr ändern, andere können einzeln oder als Batch (Stapelprozess) für mehrere Dateien erstellt oder geändert werden. Dies wird vom jeweiligen Dateiformat bestimmt und für das Editieren sind spezielle Softwareapplikationen notwendig. Sollen darüber hinausgehende (z. B. deskriptive) Metadaten eingebunden werden, braucht es ein dafür geeignetes Containerformat, in dem die AV-Datei mit den zugehörigen Metadaten zusammen verpackt wird.
Deskriptive Metadaten können jegliche Information zum Kontext (z. B. Autor, Erstellungsdatum) und Inhalt (z. B. Bildbeschreibungen, Schlagworte) enthalten und dienen hauptsächlich dem Auffinden, dem Identifizieren und dem Verständnis des Inhalts von Dateien. Sie werden in der Regel in einer Erschliessungsdatenbank (Katalog, Inventar, o. Ä.) erfasst und ausserhalb der AV-Datei gespeichert und verwaltet. Die deskriptiven Metadaten können aber wie erwähnt auch in eine Containerdatei integriert werden, um die Verbindung zwischen Metadaten und Dokumenten für die langfristige Erhaltung zu stärken. Idealerweise erfolgt die Erfassung von deskriptiven Metadaten nach systematischen Regeln und standardisiert, d. h. unter Verwendung von Metadatenstandards wie Dublin Core, EBUCore, PBCore o. Ä.
Administrative Metadaten dienen dem Verwalten von Dokumenten und können Informationen enthalten zu Bearbeitungen, zum Status des Dokuments und damit verbundener Elemente, zu Rechten, Bewertungs- und Selektionsentscheiden. Im Zusammenhang mit der Erhaltung besonders zu erwähnen ist der Standard PREMIS, mit dem in strukturierter Weise Informationen bezüglich der Erhaltung (Zustand, Restaurierungen, Digitalisierungen usw.) dokumentiert werden können. PREMIS ist in den in der Schweiz entwickelten Standard Matterhorn-METS integriert, der in verschiedenen Schweizer Gedächtnisinstitutionen im Einsatz ist.
Dokumentation und Metadaten
Die Metadaten für die Langzeiterhaltung müssen alle Informationen enthalten, die zum Auffinden, Verwalten, Abspielen, zur Identifikation der Datei und für deren Erhaltung erforderlich sind. Zur Kategorisierung und zu den verschiedenen Funktionen von Metadaten.
Es gibt eine Reihe von Normen und Metadatenstandards, welche die Dokumentation und die Erfassung von Metadaten in systematischer Weise für die verschiedenen Funktionen unterstützen. Es ist empfehlenswert, sich an einen oder eine Kombination mehrerer Standards anzulehnen bzw. solche auf die eigenen Bedürfnisse angepasst umzusetzen.
Für die Strukturierung und Ablage der Metadaten existieren verschiedene Lösungsstrategien: Die Metadaten können im Container beinhaltet sein oder aber extern in der Datenbank, mit der die Dokumente verwaltet werden. Beide Möglichkeiten bieten Vor- und Nachteile. Sind die Metadaten Teil des Archivpakets, so bieten sie eine geschlossene Einheit, die bei Migrationen eher verbunden bleibt. Werden sie extern abgelegt, ist eine Aktualisierung der Metadaten (wie z. B. Vorführungen) einfacher möglich, da das Archivpaket nicht jedes Mal ergänzt und neu geschnürt werden muss.
Eine wichtige Voraussetzung für die Langzeiterhaltung ist, dass auch das Findmittel bzw. die Informationen in der Datenbank und die extern abgelegten Metadaten zuverlässig gesichert werden.
Dies gilt speziell für die deskriptiven Metadaten, die in Umfang und Inhalt sehr unterschiedlich sein können. Es ist Teil der Archivstrategie, diese Struktur auszuarbeiten.
Beispiele für Metadatenstandards
Im Folgenden ein paar Beispiele (nicht abschliessend) von in der Archivierung gebräuchlichen Normen und Standards für die Erschliessung mit einer ganz kurzen Erläuterung. Für Referenzen siehe Bibliographie am Ende des Kapitels.
ISAD (G): «Der internationale Erschliessungsstandard ISAD(G) bildet – wie es im Vorwort zur zweiten Auflage 2000 heisst – eine generelle Leitlinie für die Vorbereitung der archivischen Beschreibung. Sie muss in Verbindung mit bereits existierenden nationalen Standards oder als Basis für deren Entwicklung benutzt werden. Die nun vorliegende Schweizerische Richtlinie für die Umsetzung von ISAD(G) ist demgemäss eine nationale Richtlinie auf der Grundlage internationaler Normierung im Bereich der Erschliessung von Unterlagen. Sie berücksichtigt die nationalen Besonderheiten der schweizerischen Archivlandschaft und ihren Regelungsstand im Erschliessungsbereich.»
PREMIS: «The PREMIS (PREservation Metadata: Implementation Strategies) Data Dictionary for Preservation Metadata is the international standard for metadata to support the preservation of digital objects and ensure their long-term usability. Developed by an international team of experts, PREMIS is implemented in digital preservation projects around the world, and support for PREMIS is incorporated into a number of commercial and open-source digital preservation tools and systems. The PREMIS Editorial Committee coordinates revisions and implementation of the standard, which consists of the Data Dictionary, an XML schema, and supporting documentation.»
METS: «The METS schema is a standard for encoding descriptive, administrative, and structural metadata regarding objects within a digital library, expressed using the XML schema language of the World Wide Web Consortium. The standard is maintained in the Network Development and MARC Standards Office of the Library of Congress, and is being developed as an initiative of the Digital Library Federation. » «The Matterhorn METS Profile, developed in cooperation with Docuteam and the Archives de l’Etat du Valais in Switzerland, is now registered. It describes the core of the digital object model used by the Docuteam software tools to support digital archiving. This may be the first profile that describes the use of EAD within METS in any detail.»
Dublin Core (DC): «The Dublin Core Metadata Element Set is a vocabulary of fifteen properties for use in resource description. The name ‹Dublin› is due to its origin at a 1995 invitational workshop in Dublin, Ohio; ‹core› because its elements are broad and generic, usable for describing a wide range of resources. The fifteen element ‹Dublin Core› described in this standard is part of a larger set of metadata vocabularies and technical specifications maintained by the Dublin Core Metadata Initiative (DCMI). The full set of vocabularies, DCMI Metadata Terms [DCMI-TERMS], also includes sets of resource classes (including the DCMI Type Vocabulary [DCMI-TYPE]), vocabulary encoding schemes, and syntax encoding schemes.» DC wurde von verschiedenen Standardisierungsorganisationen als Standard definiert (ISO Standard 15836:2009; ANSI/NISO Standard Z39.85-2012; IETF RFC 5013). Auf dessen Grundlage wurde verschiedene Weiterentwicklungen spezifisch für den audiovisuellen Bereich vorgenommen (siehe PBCore und EBUCore).
PBCore: «PBCore is a metadata standard designed to describe media, both digital and analog. The PBCore XML Schema Definition (XSD) defines the structure and content of PBCore.»
EBUCore: «EBU Tech 3293 (EBUCore) is the flagship of EBU’s metadata specifications. In 2000, the original goal was to refine the semantics of the Dublin Core elements for audio archives. Today, the domain of use of the EBUCore specification is much broader and is no longer limited to audio or archives.»
MPEG-7 Multimedia Content Description Interface: Ein internationaler Standard für die Beschreibung von Multimediadaten, Bildern, Videos, Tönen usw. Braucht XML zur Darstellung des Inhalts, unterstützt Beschreibung auf Niveau Sequenz bzw. Shot, kann auch mit nicht auf Text basierten Metadaten umgehen (z. B. Indexierung von Kamerabewegungen, Bildtexturen).
Werkzeuge
Datenbank (Verwaltung und Findmittel)
Bisher existieren kaum auf AV-Archivalien ausgerichtete Datenbanksysteme. Dies hat zur Konsequenz, dass es schwierig werden kann, die spezifischen Eigenschaften von AV-Dateien sinnvoll in einer bestehenden Datenbank unterzubringen; entsprechend gibt es heute eine Vielzahl von Lösungen, die individuell entwickelt wurden.
Werkzeuge zum Auslesen der Metadaten
In Editierprogrammen sowie in gewissen Abspielprogrammen können sogenannte EXIF-Daten mit vorwiegend technischen Informationen zu einer Datei abgerufen werden. Weitere Applikationen gestatten den Zugriff auf die Metadaten, die im Header der Mediadatei untergebracht sind. Leider lesen nicht alle Programme die Headerinformationen vollständig aus. Beispiele: Mediainfo, ffprobe, avprobe, libav, QCTools, DROID, BitCurator
Werkzeuge zum Schreiben von Metadatensätzen
Mit Hilfe dieser Werkzeuge können zusätzliche Metadaten im Header einer Mediadatei ergänzt werden: BWF MetaEdit
Bibliographie und Links (Referenzen zu Metadatenstandards)
-
Gregorio, Sergio; Stepanovic, Anja-Elenea: Metadaten bei stehenden digitalen Bildern / Directives de la PBC concernant les métadonnées des images fixes numériques. BABS, KGS 2008: Guidelines Nr. 3/2008. Online, Stand: 23.2.2022
-
Dublin Core: Dublin Core Specifications, Online, Stand: 23.2.2022
-
EBU Core Specifications, Online, Stand: 23.2.2022
-
ISAD(G): VSA-AAS, Schweizerische Richtlinie für die Umsetzung von ISAD(G) – International Standard Archival Description (General). Online, Stand: 23.2.2022
-
METS-Website (Library of Congress), Online, Stand: 23.2.2022
-
METS Matterhorn Profile, Online, Stand: 23.2.2022
-
MPEG-7 Homepage, Online, Stand: 23.2.2022
-
PB Core Homepage, Online, Stand: 23.2.2022
-
PREMIS: Caplan, Priscilla, PREMIS verstehen, 2009, Online, Stand: 23.2.2022
-
PREMIS Data Dictionary, Online, Stand: 23.2.2022
-
PREMIS-Website, Online, Stand: 23.2.2022
Letzte Anpassungen: November 2019