Mittwoch, den 17. Oktober 2007

Wie sicher sind digitale Daten? / Wie können Digitale Daten gesichert werden?

Wenn wir heute unsere Dias aus den 60er Jahren aus der Kiste holen, so sind die Farben vielleicht nicht mehr ganz frisch, aber das Motiv lässt sich noch gut erkennen. Haben wir aber 1980 unsere Daten auf eine 10“ Diskette gesichert, so finden sich heute fast keine Laufwerke und Computer mehr, um diese auszulesen.

Haltbarkeit von Datenträgern
Diese Aussagen sind zwar richtig, aber inzwischen hat sich diesbezüglich einiges geändert. So sind meine CDs, die ich Mitte der 80er gekauft habe, heute noch auf jedem CD Spieler abspielbar, sofern sie nicht mechanisch beschädigt wurden. Auch meine selbst gebrannten Scheiben von 1995 lassen sich noch problemlos lesen, wobei es zum Zeitpunkt der Erstellung auch Rohlinge von niederer Qualität gab, die sich vielleicht nicht mehr lesen lassen.

Wie dem auch sei, es wird der Tag kommen, wo CDs mit neueren Technologien nicht mehr kompatibel sind und auf andere Datenträger umkopiert werden müssen. Unter Fachleuten wird ein Zeitrahmen von 15 – 20 Jahren genannt, nachdem die Daten auf Datenträgern gleich welcher Art auf neuere Medien umkopiert werden müssen, um die Lesbarkeit für die Zukunft sicherzustellen. Dieser Vorgang des Umkopierens - in der Regel auf Datenträger mit größerer Speicherkapazität - wird im Fachjargon als Migration bezeichnet. Es ist also müssig zu diskutieren, ob eine CD 50, 70 oder 100 Jahre oder vielleicht sogar noch länger hält, weil sie dann sowieso keiner mehr lesen kann. Sie sollte aber in jedem Fall die 15 – 20 Jahre Migrationszeit überstehen, wovon heute bei Marken CDs und DVDs unter guten Lagerungsbedingungen ausgegangen werden kann.

Man kann sich also leicht ausmalen, was mit Papas digitaler Bildersammlung passiert, wenn die 50 Jahre auf dem Speicher steht und nicht gepflegt wird. Auf der anderen Seite kann ein gepflegtes digitales Archiv theoretisch unendlich lange aufbewahrt werden, weil dass Umkopieren der Daten verlustfrei von statten geht. Ein digitales Bild wird – im Gegensatz zum Dia – über die Zeit und auch beim Kopieren nicht schlechter. Es gibt hier nur zwei Zustände, entweder die Bilddatei ist in Ordnung oder sie ist defekt, wobei sich defekte Dateien in vielen Fällen reparieren lassen.

Was kann einen solchen defekt hervorrufen?
Natürlich die mechanische Beschädigung der Datenträger. Aber auch ein Produktionsfehler auf dem Datenträger oder ein Fehler in der Datenübertragung während des Kopiervorgangs. Zu guter Letzt noch ein Materialfehler auf dem Datenträger, der ihn vorzeitig altern lässt oder eine Veränderung, die durch Umwelteinflüsse wie z.B. falsche Temperatur oder Lagerungsbedingungen hervorgerufen wird.

Die mechanische Beschädigung und die Umwelteinflüsse lassen sich durch optimierte Lagerungsbedingungen minimieren. Die Produktions- und Übertragungsfehler werden durch eine Kontrolle des Datenträgers nach dem Brennen, die in allen gängigen Brennprogrammen aktiviert werden kann, erkannt und können durch erneutes brennen der Daten auf einen anderen Datenträger behoben werden. Was bleibt ist die Unsicherheit durch die Materialfehler, die durch die Wahl von Markenprodukten und ggf. solche mit ausgewiesen langer Haltbarkeit minimiert werden kann. Zusätzlich sollten digitale Daten in jedem Fall mindestens 2- besser 3-fach gesichert werden, um bei eventueller Beschädigung es Trägers, noch einen weiteren zur Verfügung zu haben.

Welches Dateiformat sollte verwendet werden?
Es gibt eigentlich nur 2 Anforderungen an das verwendete Dateiformat. Die erste ist, dass das Format ein Standardformat sein sollte, dass auch von vielen Programmen in der Zukunft noch lesbar ist. Und die zweite ist die Forderung, das sich die Datei im Falle eines auftretenden Fehlers mit einfachen Mitteln reparieren lässt.

Natürlich spielt auch der Erhalt der Bildqualität eine Rolle und die Dateigröße, also der notwendige Speicherplatz. Jedoch sind diese Anforderungen generelle Anforderungen, die an das Bild gestellt werden und nicht spezifisch für die Lagzeitarchivierung.

In der digitalen Fotografie kommen nur 2 ggf. 3 Dateiformate für die Langzeitarchivierung in Frage. Das eine ist das Tiff Format. Es besteht als Standard schon seit Mitte der 80er Jahre und wird sicherlich auch zukünftig von den gängigen Programmen unterstützt. Tiff-Dateien für die Archivierung sollten ohne Ebenen und ohne Kompression gespeichert werden. Sie lassen sich im Falle eines auftretenden Fehlers mit einfachen Werkzeugen reparieren, benötigen jedoch viel Speicherplatz. Deutlich weniger Platz benötigen die JPEG Dateien. Sie lassen sich im Falle eines Schreibfehlers aber leider nicht so leicht, in vielen Fällen sogar gar nicht reparieren. JPEG Dateien können aber mit jedem Bildbearbeitungsprogramm gelesen werden. Das 3. Dateiformat ist bisher noch nicht so weit verbreitet, es vereint aber die positiven Eigenschaften von JPEG und Tiff miteinander. Die Rede ist von JPEG 2000. Es ist in einer ISO Norm (ISO 15444) standardisiert, benötigt je nach Einstellung bei der Speicherung wenig Speicherplatz und ist so designed, dass es sich im Falle eines Fehlers leicht reparieren lässt. JPEG 2000 ermöglicht auch eine verlustfreie Kompression der Bilddaten.
JPEG 2000 ist übrigens auch in Photoshop CS integriert, wird aber aus mir bisher nicht bekannten Gründen standardmäßig nicht mit installiert. Das entsprechende Plugin befindet ich auf der CD unter Goodies/Photoshop only/File Format/.

Welcher Datenträger ist für die Speicherung der beste?
Die Beantwortung dieser Frage hängt von verschiedenen Faktoren ab, die je nach Anwendung eine unterschiedliche Priorität erhalten.

Die drei wichtigsten Faktoren sind:
1)Speicherkapazität
2)Zugriffszeit
3)Haltbarkeit

Für die Speicherung digitaler Bilddaten kommen derzeit 4 verschiedene Datenträger in Frage:
1)CD
2)DVD
3)Festplatte
4)Bandlaufwerke (streamer)

Der sicherste der genannten Datenträger ist zweifellos die CD. Sie bietet mit 700 MB jedoch den geringsten Speicherplatz. Bei einem hohen Datenaufkommen sammelt sich deshalb eine entsprechende Menge an Datenträgern an, die verwaltet und gelagert werden will.

Etwas mehr Speicherplatz bietet die DVD mit 4,7 GB. Sie dürfte aufgrund der Zusammensetzung in Punkto Haltbarkeit der CD sehr nahe kommen. Aber auch die DVD steht im Schrank und will für jedes gesicherte Bild in den Rechner eingelegt werden.
Den langsamsten Zugriff, eine mittlere Kapazität und die schlechteste Haltbarkeit bieten die Bandlaufwerke. Dafür können die Bänder mehrfach überschrieben werden und eignen sich deshalb für die kurzzeitige Sicherung.
Größere Institutionen, die ihre Bilder häufig verwenden, worunter z.B. Bildagenturen oder größere Zeitschriften fallen, setzen deshalb nur Festplatten oder komplette so genannte „Storage Solutions“ ein, die aus einem Festplatten Array und Bandsicherungslaufwerken bestehen. Bei letzteren wird zur Beschleunigung der Zugriffszeiten Buch geführt, welche Datei wie oft verwendet wird und entsprechend werden die oft benutzten Dateien auf den Festplatten gelagert und die selten benutzten auf den Bandlaufwerken. Da eine Festplatte nur ein paar Jahre hält, weil sie sich mit hoher Geschwindigkeit dreht und häufig benutzt wird, werden alle Daten mehrfach auf verschiedenen Datenträgern verteilt. Geht eine Festplatte kaputt, so kann diese im laufenden Betrieb aus dem Rechner herausgezogen und eine neue eingesteckt werden, ohne, dass Daten verloren gehen. Für die Verwaltung der mehrfachen Verteilung sorgt ein so genannter „Raid Controller“ (Redundant Array of Independent Disks) [1] [2] [3].

Strategie
Es gilt nun, die richtige Strategie für die Datensicherung aus Speicherkapazität, Zugriffsgeschwindigkeit, und Haltbarkeit auf Basis der genannten Datenträger zu entwickeln.

Dabei sollten wir noch einen kurzen Blick auf die Möglichen Ursachen eines Datenverlustes oder einer Beschädigung werfen:
1)eine Festplatte, DVD oder CD geht kaputt
2)Eine Festplatte enthält fehlerhafte Sektoren
3)ein Brand oder Diebstahl zerstört den kompletten Rechner
4)eine Datei, ganze Verzeichnisse oder sogar die Festplatte wird versehentlich gelöscht
5)ein Virus befällt den Computer
6)eine Software enthält einen Bug, der Daten unbeabsichtigt löscht

Für unsere Strategie gehen wir von mehreren Sicherungen aus, die in jedem Fall benötigt werden. Aufgrund der Viren- und Software Problematik benötigen wir eine zeitliche Entkopplung der Sicherungen und aufgrund der Brand- und Diebstahlgefahr benötigen wir eine örtliche Entkopplung.

Inkrementelle Backups
Zum besseren Verständnis der nachfolgend beschriebenen idealen Strategie ist noch der Begriff des inkrementellen Backups zu erläutern. Das bedeutet, dass in regelmäßigen Abständen die Daten, die neu hinzugekommen sind und die Daten, die gegenüber dem letzten Stand verändert wurden, auf eine externe Festplatte kopiert werden. Dabei unterscheidet man zwei Arten: zum einen ein wirkliches Backup, das bei veränderten Daten die alte Version erhält und die neue hinzu abspeichert und zum anderen ein reines Kopieren der veränderten Daten, das in einem Überschreiben der alten Version resultiert.

Ersteres setzt ein Backup Programm wie z.B. Retrospect voraus und führt dazu, dass man auf die Daten nicht direkt z.B. über einen Explorer o.ä. Zugreifen kann. Das einfache Synchronisieren führt zu einem Überschreiben der alten Version. Hierfür gibt es viele kleine Helfer wie FileSync oder Mr Mirror auf Windows oder You Synchronize für den Mac. Das einfache Synchronisieren ermöglicht einen direkten Zugriff auf die Daten über Finder oder Explorer.

Die ideale Speicherstrategie
Die ideale Strategie sieht damit so aus, dass zum schnellen Zugriff alle Daten auf der Festplatte im Computer liegen. Damit ein Ausfall der Festplatte abgesichert wird, enthält der Computer eine zweite, gleich große Festplatte, die mit der ersten gespiegelt wird (RAID 1, bietet Windows und auch Linux schon Betriebsystemseitig). Alle Daten sind also nahezu zeitgleich zweimal vorhanden und somit gegen Festplattendefekt geschützt. Zur räumlichen Entkoppelung werden die Daten z.B. jeden Abend inkrementell auf eine externe Festplatte (USB 2.0 oder FireWire) kopiert. Diese wird anschließend vom Computer getrennt und an einem anderen Ort gelagert. Daten, die langzeitarchiviert werden, werden in 2 facher Ausfertigung auf DVD gebrannt und in Regale an unterschiedlichen Orten gelagert, wobei auf die Verwendung von Markenprodukten und möglichst ideale Lagerbedingungen (kühl und nicht zu feucht, nicht zu trocken) zu achten ist. Damit die Datenmenge überschaubar bleibt, sollten Sie alle Bilder, die Sie sicher nicht mehr brauchen frühzeitig löschen.
In wie weit die Zeit oder der Geldbeutel diese Idealbedingungen beeinflussen, muss jedem Anwender und seinem Einsatzzweck überlassen werden. Aber Datensicherung ist wichtig!!! Keine zu haben, kann die Existenz des Fotografen gefährden.

Literatur und Links
[1] Datenmassen im Griff, Harald Bögeholz, c’t 03/2005
[2] http://www.speicherguide.de/magazin/special0903.asp?theID=121
[3] http://www.zdnet.de/enterprise/server/0,39023275,39119381-4,00.htm