Home / Empfehlungen Memoriav / All / 10.1 Digitale Archivierung von Fotografien


Zurück zur Hauptübersicht
< vorherige Seitenächste Seite >

10.1 Digitale Archivierung von Fotografien

10.1 Digitale Archivierung von Fotografien

OAIS (Open Archival Information System) ISO1472

AIP: Archival Information Package

DIP: Dissemination Information Package

SIP: Submission Information Package

Digitale Fotos nutzbar halten: das OAIS Modell

Will man digitale Fotografien über lange Zeiträume nutzen, muss man etwas dafür tun, dass sie nutzbar bleiben. Das gilt selbstverständlich auch für Kontextinformationen in anderen Dateiformaten, die gleichbedeutend wie die Fotografien und oftmals Teil von Fotobeständen sind. Egal, ob eine Gedächtnisinstitution klein oder gross ist: das international verwendete Vorgehen bei der Nutzbarhaltung ist jenes des OAIS. Die Abkürzung steht für Open Archival Information System oder Offenes Archiv-Informations-System. OAIS ist seit 2003 ein ISO-Standard, gegenwärtig ist die Version ISO 14721:2012 aktuell (NESTOR 2013). OAIS ist keine Software, sondern ein funktionales Modell, das einen Denkrahmen und eine standardisierte Terminologie bietet. Darum ist das Modell für Institutionen jeder Grösse geeignet, und darum ist es weltweit anerkannt und verbreitet.

Ein Offenes Archiv-Informations-System muss von jeder Institution für ihre Bedürfnisse konzipiert und stufengerecht umgesetzt werden. Um einen praktischen Vorschlag zu geben, wie dies geschehen könnte, werden hier drei Grössen von Gedächtnisinstitutionen unterschieden.

OAIS in einer kleinen Institution

Eine kleine Institution hat in der Regel wenig umfangreiche Bestände, wenig Publikumsverkehr und wenig personelle und finanzielle Ressourcen. Man könnte sich darunter eine Gemeinde oder ein Lokalmuseum vorstellen, die eine Sammlung an lokalhistorischen Fotografien oder Nachlässe von lokal tätigen Fotografen führt.

Eine kleine Institution sollte Folgendes tun:

  1. Die Integrität der Fotografien nachweisen.

  2. Die Fotografien nicht auf transportablen Medien speichern, sondern auf Servern oder Server-ähnlichen Speicherumgebungen, auf denen sich Backupprozesse automatisieren lassen.

  3. Die Fotografien katalogisieren und kontextualisieren.

  4. Eine Dokumentation der konservatorischen Massnahmen führen. 

Integrität der Fotos nachweisen

Fotodateien können durch irgendwelche Vorgänge korrupt werden, und Fotografien können in Bildbearbeitungsprogrammen verändert werden. Darum ist es nötig, nachzuweisen, dass eine Fotografie seit der Archivierung unverändert geblieben ist.

Das gängige Verfahren, um Integrität nachzuweisen, sind Checksummen, auch Prüfsummen oder Hashwerte genannt. Eine Checksumme ist eine Zeichenkette, die mit einem bestimmten Algorithmus aus einer Datei erzeugt wird. Sie kann zusammen mit der Fotodatei abgespeichert (zum Beispiel im TXT-oder XML-Format) oder im Katalogsystem verwaltet werden. Zu einem späteren Zeitpunkt kann die Integrität des Bildes mit dem gleichen Algorithmus überprüft werden. Bereits die kleinste Änderung der Datei erzeugt eine gänzlich andere Checksumme. Ist die Zeichenkette aber gleich, so ist die Datei einwandfrei und wurde nicht verändert. Die Checksumme kann die Integrität nicht sichern, sondern nur nachweisen.

Es sollte ein Verfahren gewählt werden, das weltweit stark verbreitet ist und daher auf lange Frist verfügbar bleiben wird. SHA (Secure Hash Algorithm) oder der ältere MD5 (Message-Digest Algorithm) sind solche Verfahren. Im Internet findet man schlanke und kostenlose Werkzeuge, um Checksummen erzeugen oder überprüfen zu können.

Fotografien auf Serverumgebung speichern

Alle Speichermedien können kaputtgehen oder technisch obsolet werden. Darum ist dringend davon abzuraten, für die langfristige Speicherung auf transportable Medien aller Art zu setzen. Solche Medien können nicht mit sinnvollem Aufwand überwacht werden.

Auch Speicher auf Serversystemen können jederzeit einen Defekt erleiden. Aber solche Systeme können automatisiert überwacht werden, sodass bei einem Vorfall eine Alarmierung abgesetzt wird. Serverumgebungen bieten Speicherlösungen an, die mit Redundanz arbeiten. Damit ist sichergestellt, dass einzelne Speicherbausteine (Festplatten) nach einem Defekt ausgetauscht werden können, ohne dass ein Datenverlust droht.

Eine typische Speicherumgebung für eine kleine Institution ist die Technik eines NAS (Network Attached Storage). Das sind Speichersysteme, die mit dem Netzwerk verbunden werden; daher der Name. Die Kleinstausstattung ist ein NAS mit zwei Festplatten, die die Daten redundant speichern, sodass eine defekte Festplatte ohne Datenverlust ausgetauscht werden kann. Voraussetzung ist allerdings, dass das Gerät laufend überwacht wird und innerhalb nützlicher Frist gehandelt werden kann. Ein NAS, auch wenn es über redundante Festplatten verfügt, entbindet nicht davon, über ein Backup- und Replikationskonzept zu verfügen. Bei einer Verkettung unglücklicher Umstände – beide Festplatten steigen aus – oder bei höherer Gewalt muss man auf eine Kopie der Daten zurückgreifen können, die vom Hauptspeicher getrennt ist. Dieses Backup muss aktuell sein und darf nicht unbemerkt kaputtgehen oder obsolet werden. Der Vorgang der Wiederherstellung von Daten muss überprüft werden, indem man ihn periodisch durchspielt und dokumentiert.

Katalogisieren und kontextualisieren

Der kulturelle Wert von Fotografien bleibt nur erhalten, wenn beschreibende Daten angelegt werden und verfügbar bleiben. Je reicher diese Katalogdaten sind, desto besser wird der Inhalt der Fotografien und der Kontext, in dem sie entstanden sind, in die Zukunft transportiert.

Zur Katalogisierung siehe das entsprechende Kapitel [s.a. Kapitel Katalogisierung und Inventarisierung]. Es sei darauf hingewiesen, dass Digitalfotografien Metadaten enthalten, die von der Kamera, vom Scanner oder von Bildbearbeitungsprogrammen direkt in die Datei geschrieben werden. Diese Informationen befinden sich im sogenannten Header, einem Bereich am Anfang der Bilddatei, noch vor den eigentlichen Bildinformationen. Hierfür gibt es verschiedene Standardformate wie EXIF , IPTC oder XMP. Solange ein Bilddateiformat durch Software angezeigt werden kann, sind auch die darin enthaltenen Metadaten lesbar. Sie können Katalogdaten ergänzen. Sie können aber auch aus den Bilddateien ausgelesen und ins Katalogsystem überführt werden.

Konservatorische Massnahmen dokumentieren

Auch eine kleine Institution sollte alle Massnahmen dokumentieren, die in konservatorischer Hinsicht getroffen wurden. Welche Dateiformate werden für die Archivierung zugelassen? Wie geschieht die Verbindung zwischen dem Katalog und den Nutzdaten? Wann und mit welchen Mitteln wurde digitalisiert oder wurden Dateien in ein neues Format migriert? Wurden die Bilder bearbeitet oder in einem rohen Zustand belassen? Die Dokumentation von bestandeserhaltenden Massnahmen hat bei Restaurierungsarbeiten an physischen Objekten lange Tradition und ist bei digitalen Objekten nicht weniger wichtig zum Verständnis des Objekts und seiner Archivgeschichte.

OAIS in einer mittleren Institution

Unter einer mittleren Institution könnte man sich eine städtische, kantonale oder überregionale Gedächtnisinstitution vorstellen, die einen professionellen Anspruch und entsprechende Ressourcen hat. Eine mittlere Institution sollte gleich vorgehen wie eine kleine, aber zusätzlich Folgendes tun:

  1. Ein Repository-System einrichten.

  2. Integrität und technische Aktualität von Dateien und Archivsystem periodisch prüfen.

  3. Das Katalog- und das Repository-System vernetzen.

  4. Abläufe (Workflows) für die Integration von Fotografien ins Archiv automatisieren.

  5. Die digitale Vermittlung sicherstellen.

Repository-System einrichten

Ein Repository-System ist eine spezialisierte Software, die digitale Archivspeicher verwaltet. Sie steuert den Zugriff auf den Speicher und macht ihn dadurch sicherer als ein Eingreifen von Hand, das mit Manipulationsrisiken verbunden ist. Hauptfunktion eines Repositories ist es, digitale Ressourcen eindeutig identifizierbar zu machen, dies geschieht mit Hilfe sogenannter PID (Persistent Identifiers). Dies sind eindeutige Identifikatoren, mit welchen die digitalen Unterlagen auffindbar und zitierbar bleiben. Ein Repository bietet weiter Schnittstellen für die Speicherung und die Nutzung von Daten und Metadaten und übernimmt das Benutzermanagement. Es ermöglicht eine automatisierte Überprüfung der Integrität und weiss jederzeit, welche Dateiformate in welcher Anzahl sich im Speicher befinden. Zusätzliche Funktionalitäten des Repository-Systems betreffen die Preservation Actions. Obsolete Dateiformate im Speicher sollen über kontrollierte Prozesse in aktuelle Archivformate überführt werden können. Dies sind keine alltäglichen Vorgänge, sondern sie sind mit sorgfältiger Planung und oft mit Testläufen verbunden.

Integrität und technische Aktualität prüfen

Einmal jährlich sollten nach einer Checkliste alle Hardware- und Software-Elemente sowie die Dateiformate auf ihre Aktualität überprüft werden. Diese Funktion wird im OAIS Preservation Planning genannt. Sie ist eine organisatorische Funktion und kann durch Software nicht ersetzt, wohl aber unterstützt werden. Die zuständigen Personen sollten sich dafür an Empfehlungen Dritter halten, die die drohende Obsoleszenz von technischen Elementen oder Dateiformaten beobachten wie beispielsweise die Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen (KOST), die einen Katalog archivischer Dateiformate veröffentlicht.

Überprüft das Repository-System die Integrität der Nutzdaten periodisch, so ist sicherzustellen, dass reagiert werden kann, wenn sich Unregelmässigkeiten zeigen. Ansonsten muss die Integrität mit anderen Mitteln periodisch überprüft werden.

Katalog- und Repository-System vernetzen, Abläufe automatisieren

Je mehr digitale Daten eine Institution verwaltet, desto wichtiger sind für sie eine kohärente, vernetzte Infrastruktur und automatisierte Abläufe. Da die Systemkomponenten und die betrieblichen Bedürfnisse sehr unterschiedlich sein können, sind die entsprechenden Massnahmen sehr individuell.

Digitale Vermittlung sicherstellen

Benutzerinnen und Benutzer verlangen höchsten Komfort bei der Suche und Sichtung von Bildmaterial, wie sie ihn von Suchplattformen wie Google, Bildplattformen wie Flickr oder schlicht vom eigenen Smartphone gewohnt sind. Je mehr die Fotos einer Institution benützt werden, desto mehr lohnt sich eine Investition in den Komfort der digitalen Benutzung.

OAIS in einer grossen Institution

Grosse Institutionen auf kantonalem oder nationalem Niveau streben nach hoher Professionalität in der Bewirtschaftung ihrer Bestände. Sie werden zusätzlich zum bereits Genannten auf folgende Aspekte Wert legen:

  • Spezialisierte Speicherinfrastrukturen sorgen für hohe Kapazität und eine hohe Ausfallsicherheit. Die verwendeten Speichermedien sollten internationalen Standards entsprechen und auf dem Markt eine weite Verbreitung aufweisen. Für die Speicherinfrastruktur müssen Wartungsverträge existieren.

  • Repositories grosser Organisationen beschränken sich bei der Vergabe von Persistent Identifiers nicht einfach auf eine Gültigkeit innerhalb ihrer Organisation, sondern registrieren diese bei öffentlich zugänglichen Registrierungsstellen. Beispiele von solchen Systemen sind die vor allem im Bibliotheksbereich verbreiteten DOI (Digital Object Identifier), bei Archiven sind es die ARK (Archival Resource Key) Identifier.

  • Backups sind geografisch vom Standort getrennt.

  • Zwischen dem Digitalisierungszentrum und dem Langzeitarchiv bestehen integrierte Prozesse für einen hohen Durchsatz an Daten.

  • Für die automatisierte Vermittlung existiert ein System mit Warenkorb und gegebenenfalls Kreditkartenschalter.

  • Eventuell besteht gar eine Infrastruktur, um über Crowd Sourcing zu zusätzlichen Informationen über die eigenen Bildbestände zu kommen. Beim Crowd Sourcing tragen freiwillige Externe (Benutzerinnen und Benutzer) zur Anreicherung von Bildinformationen bei. Die Infrastruktur erlaubt es, entsprechende Projekte durchzuführen und die Resultate in den Katalog zu überführen.

Dateiformate

Ein Dateiformat definiert, wie der gespeicherte Bitstrom interpretiert werden muss, damit ein für den Menschen les- und verstehbares Objekt entsteht. Die Wahl des richtigen Formats ist deshalb ein zentrales Problem der digitalen Archivierung. Dabei sind verschiedene Anforderungen zu berücksichtigen, die sich gegenseitig widersprechen können:

  • Beibehaltung der Information: Auf verlustbehaftete Kompression ist möglichst zu verzichten. Die Wahl langlebiger Formate vermindert die Anzahl notwendiger und potentiell verlustbehafteter Migrationen.

  • Erhaltung der Lesbarkeit: Um Prognosen für die Langlebigkeit und damit der Lesbarkeit eines Dateiformats abgeben zu können, greifen archivierende Institutionen auf verschiedene Kriterien zurück. Deren wichtigstes ist wohl die Verbreitung (gemessen sowohl an der Anzahl Dateien als auch an der Anzahl Softwareprodukte, die mit dem Format umgehen können). Von Bedeutung sind daneben die Offenheit und wenn möglich die Standardisierung der Formatspezifikation sowie je nach Formatkatalog weitere Kriterien, die auch gewichtet werden können.

  • Leichte Handhabung: Die Festsetzung gewisser Dateiformate als archivtauglich ermöglicht einer archivierenden Institution die Konzentration auf ein übersichtliches Set von Spezifikationen, Tools und Kenntnissen.

  • Kosten: Gerade bei Fotografien sind Speicherplatzkosten nicht zu vernachlässigen. Platzsparende Dateiformate bieten hier einen Vorteil, beinhalten jedoch in der Regel Komprimierung.

 

Für die Fotoarchivierung kommen grundsätzlich die folgenden wichtigen Formate in Betracht:

  • RAW: Rohdatenformate speichern die Daten des Kamerasensors ohne weitere Bearbeitung und werden deshalb oft mit dem analogen Negativ verglichen. Sie sind vom Kameratyp abhängig und mehrheitlich proprietär, d.h. nur von der Software des entsprechenden Herstellers les- und bearbeitbar. RAW-Formate werden praktisch ausschliesslich im Bereich der professionellen Fotografie verwendet.

  • DNG, das Digital Negative Format, wurde von Adobe als generisches Rohdatenformat entwickelt, welches die verschiedenen proprietären RAW-Formate ablösen soll. Gewisse Kameras können direkt im DNG-Format speichern, bei anderen ist eine Konvertierung notwendig.

  • TIFF, das Tagged Image File Format, ist weit verbreitet als Standardformat für Bildarchivierung, insbesondere bei Digitalisaten. Da TIFF eine Vielzahl von Komprimierungen, Farbräumen, Farbtiefen etc. zulässt, ist unbedingt auf die Verwendung einer archivtauglichen TIFF-Version zu achten.

  • JPEG2000 steht als Alternative zu TIFF zur Verfügung. Es kann sowohl unkomprimiert als auch verlustfrei oder verlustbehaftet komprimiert sein. Mit einer massvollen Komprimierung können signifikante Speicherplatzersparnisse realisiert werden. Insbesondere für Digitalisate von seitenbasierten Originalen ist auch das Einbetten von JPEG2000 in PDF/A-2 eine Variante.–JPEG ist das am weitesten verbreitete Bildformat, insbesondere als Standardformat für die nicht-professionelle digitale Fotografie. Wegen der verwendeten Komprimierung gilt es gemeinhin nicht als Archivformat. Die Offenheit der Spezifikation sowie die Verbreitung des Formats erlauben jedoch sehr günstige Prognosen für die Lesbarkeit von JPEG-Dateien.

Andere Bildformate wie PNG oder GIF fallen für die Fotoarchivierung ausser Betracht, wie auch sämtliche Vektorformate.

Die Wahl eines Archivierungsformats hängt wesentlich vom vorliegenden Ausgangsformat ab. Dazu im Folgenden einige Beispiele:

  • Bei der Archivierung von originär digitalen Fotos aus dem professionellen Umfeld kann es angezeigt sein, die Rohdaten zu archivieren. Da die proprietären RAW-Formate kaum archivtauglich sind, ist dafür eher das DNG-Format angebracht. Die zusätzliche Archivierung eines Gebrauchsformats wie JPEG wird empfohlen.

  • Wenn die Fotos in einem komprimierten Format vorliegen (z.B. originär digitale Fotos aus einer Amateurkamera oder Digitalisate aus einem entsprechend konfigurierten Scanningprozess), ergibt eine Konvertierung in ein unkomprimiertes Format keinerlei Sinn, da der entsprechende Informationsverlust irreversibel ist. In einem solchen Fall ist die Archivierung im Originalformat angezeigt.

  • Bei Digitalisierungsprozessen gilt TIFF als bevorzugtes Format. Nicht zu übersehen ist dabei aber, dass in solchen Fällen auf jeden Fall ein Informationsverlust gegenüber dem analogen Original auftritt. Studien haben gezeigt, dass dieser Verlust grösser sein kann als der Verlust durch eine massvolle Komprimierung. Wobei eine solche massvolle Komprimierung eine Speicherplatzersparnis um den Faktor Zehn bedeuten kann. Eine Speicherung der Digitalisate als JPEG2000-Dateien ist deshalb im Einzelfall zu prüfen, gerade mit Blick auf die Speicherkosten. 

So geben Formatkataloge und -empfehlungen im konkreten Anwendungsfall zwar wertvolle Hinweise, müssen aber im Licht der jeweiligen Rahmenbedingungen interpretiert und angewendet werden. Ein mindestens grundlegendes Verständnis der Funktionsweise potentieller Archivformate ist für ein Archiv unerlässlich.

Letzte Anpassung: Oktober 2017


Zurück zur Hauptübersicht
< vorherige Seitenächste Seite >




Suchen


Index



WordPress Themes