Archive und Datenbanken: Unterschied zwischen den Versionen

Aus Survival Wiki
Wechseln zu: Navigation, Suche
(digitale Datenhaltung und Erhaltung)
(Archive & Datenbanken)
Zeile 1: Zeile 1:
====Archive & Datenbanken====
+
===Archive & Datenbanken===
  
 
====Vorwort====
 
====Vorwort====

Version vom 24. März 2009, 14:22 Uhr

Archive & Datenbanken

Vorwort

Archive sind Wichtig! Archive stellen das „Gedächtnis“ einer Hochkultur dar. Auf Archive wird zurückgegriffen wenn Fragen wie „wie haben die Menschen damals gelebt“ auftauchen. Viele Wissenschaftler nicht nur Historiker führen umfangreiche recherchen in Archiven durch.

Ich arbeitete in einem genialen Archiv. Viele Bilder, Dokumente, mussten eingesehen und abgelegt werden. Die Ablage ist nicht schwer das Auffinden des gewünschten Dokumentes dagegen gestaltete sich etwas schwieriger. Dies hat etwas mit dem jeweiligen Ablagesystem zu tun. Dokumente können nach Alphabet, Datum oder Thema abgelegt werden. Oder nach einem selbst erdachten Ablagesystem das den Charakter eines Inhaltsverzeichnisses eines Buches ähnelt (Thesaurus).

“Analoge“ Verwaltung

Dazu werden alle relevanten Informationen auf Karteikarten geschrieben um das Auffinden des gewünschten Dokumentes zu erleichtern.

Über die arbeit eines guten Archivars wurden ganze Bücher geschrieben (Über den Umgang mit Historischen Büchern, Bildern & Dokumenten). Die ich an dieser Stelle nicht wiederholen möchte da es den Rahmen dieses Artikels sprengen würde.

Das Ärgernis eines Archivars ist immer wieder das Dokumente immer und immer wieder eingesehen und mit einem einfachen Kopierer vervielfältigt werden. Das dies dem Dokument nicht „gut tut“ liegt auf der Hand. Die harte Strahlung des Kopiergerätes lässt die Druckfarbe ausbleichen. Die mechanische Belastung des Papiers ist auch nicht unerheblich und lässt die Qualität schon alten Dokumente und Bücher nicht besser werden.

Digitalisierung

In „meinem“ Archiv wo ich tätig war, ging man dazu über alle wertvollen Bilder & Texte zu digitalisieren. Dies eine sehr lobenswerte Maßnahme die meine volle Unterstützung bekam.

Der einigste Kritikpunkt lag darin begründet das man ein einem Ordnersystem eines Rechneres reich herachisch aufgebaut ist. Von A bis Z von 001 bis 999 usw. und Verzeichnis & Unterverzeichnisse (Verzeichnis = Ordner). Wenn man nur ein Dokument sucht und nicht genau weiß wo man suchen muss wird es Zeitaufwändig. Entweder durchsucht man die Festplatte manuell oder man nutzt die interne Suchfunktion des Rechners.

Die Erfahrung hat gezeigt das dass Durchsuchen einer Festplatte oft länger gedauert hat als das Durchsuchen des richtigen Archies.

Datenbank

Darauf hin wurde angedacht eine Datenbank zu stellen. Eine Datenbankstruktur hat den Vorteil schnell Informationen aufzufinden. Im lokalen Netzwerk (Intranet) nicht zu verwechseln mit dem Internet. Ein Datenbankserver verwaltet die Informationen und viele Benutzer können gleichzeitig auf abgespeicherte Datensätze zurückgreifen.

Der große Vorteil liegt darin das viele auf digitalisierte Dokumente zurückgreifen können. Die Suche und das Auffinden des gewünschten Dokuments gehen sehr schnell. Wissenschaftler & Historiker kommen so schneller an die gewünschten Informationen und beenden schneller ihrer Recherche.

Die originalen Dokumente liegen sicher im Archiv und werden nicht mehr unnötigen mechanischen Belastungen ausgesetzt.

Ein weiterer interessante Begebenheit: scannt man z.B.: ein Foto, Bild oder Dokument mit z.B.: 600 bis 1000 dpi (man kann auch schreiben mit einer Vergrößerung von 600%) kann man mehr Details wahrnehmen als es beim Original möglich ist. Durch digitale Bildbearbeitung (höchst umstritten) können Kontraste, Helligkeit und Farbwerte manipuliert werden. Dadurch kann die Qualität und die Lesbarkeit eines Dokumentes verbessert werden.

Die Qualität der Kopie ist besser als beim Original

Ich hatte seiner Zeit den Auftrag bekommen nach einer passenden Datenbank „Ausschau“ zuhalten die allen Ansprüchen des Archivs gerecht wird.

Angefangen von einer „einfachen“ MS Access Datenbank über einer Freeware Datenbank die das Deutsche Museum (Berlin) verwendet, verschiedene PHP Bild Verwaltungsprogramme.

Das Problem bei vielen dieser Datenbanken ist der Schulungsaufwands des Archivpersonals. Wenn externe Wissenschaftler & Studenten Zugriff auf die DB des Archivs erhalten sollen müssen sie erst an der verwendeten Datenbank eingewiesen werden.

MediaWIKI Wissensdatenbank

Auf der Suche nach der passenden Datenbank kam ich zur MediaWIKI Wissensdatenbank. Die MediaWiki ist ein CMS Content Management System. Auf Deutsch: Inhalt Verwaltungssystem. Ergo ein System das Inhalte (Texte & Bilder) verwaltet. Da dieses System auf einer Datenbank aufsetzt ist die Suche nach dem gewünschten Dokument kein Problem. Die Inhalte werden ansprechend als Webseite dargestellt und Bilder können als kleine Vorschaubilder oder in Galerien dargestellt werden. Einzellbilder können in vorgefertigten Bildmasken (Vorlagen) präsentiert werden.

Jeder der sich in der in der Wikipedia nachgeschlagen hat wird sich in einem lokalen Archiv mediawiki sofort zu recht finden und benötigt keine Einweisung in das System. Junge Studenten werden sich freuen mit solch einem System arbeiten zu können.

Kosten

Die Kosten solch eines Systems sind minimal. Der benötigte Datenbank & Webserver ist Freeware das Mediawiki ist ebenfalls Freeware und verursacht keinerlei Lizenzgebühren. Vergleichbare Systeme, die von Firmen geschrieben werden kosten ab 10 000 Euro Aufwärts. Interessant ist es zu beobachten, das Softwareschmieden auf Programmteile zurückgreifen die ohnehin frei sind und mit offenem Quelltext angeboten werden. Dies ist allerdings das gute recht des Softwareentwickler da viele Softwaremodule die für kommerzielle Zwecke geschrieben wurden dem „Internet“ zurückgegeben werden.

Die kosten eines leistungsstarken Rechners (ein Handelsüblicher Personalcomputer) der als Server dienen kann, sinken von Jahr zu Jahr.


Kritik

““Ich kenne die WIKIPEDIA und jeder kann darin schreiben und Inhalte verändern!““ ““Die Qualität der WIKIPEDIA lässt zu wünschen übrig, deshalb nehme ich die WIKIPEDIA nicht ernst“““

Solche und noch viele anderen Einwände schlagen mit immer wieder entgegen wenn ich über die Mediawiki schreibe.

Zum ersten Kritikpunkt: die Wikipedia ist nicht zu verwechseln mit der mediawiki Software. Jedes CMSystem bringt eine Benutzerverwaltung mit. Ich halte entgegen in dem ich dem geneigten Leser anbiete diesen Artikel zu verändern. Erstens wurde der Artikel geschützt: kein unangemeldeter Benutzer kann diesen Artikel verändern. Man kann sich zwar den Quelltext einsehen, Das war es auch schon. Auf „normalen“ Webseiten kann man sich den Quelltext ebenfalls anschauen man klickt man auf die rechte Maustaste (innerhalb der Webseite) und klickt denn auf Quelltext anzeigen.

Zweites versuchen sie sich auf diesem Themen Wiki anzumelden. Dies wird ihnen nicht gelingen da ich dies unterbunden habe.

Ein MediaWiki kann man also gegen ungebetene Gäste und „Späm“ absichern.

Zum zweiten Kritikpunkt: ersten ist eine Datenbank im Intranet keine WIKIPEDIA und zweites wenn ihnen einige Artikel nicht gefällt, ändern sie diese soweit ab bis sie ihren Qualitätsanspruch genügt. Davon lebt die Wikipedia die ich vollkommen unterstütze.

Archive ins Netz

Bislang habe ich nur von einer Wissensdatenbank im Intranet eines Archies bzw. im Museum geschrieben. Ein lokales Netzwerk auf das nur autorisiertes Personal zugriff hat. Eine Schlagzeile in der Presse lautete vor Jahren: Archive ins Netz. Eine geniale Idee die nur unzureichend bis gar nicht realisiert wurde. Das empfinde ich als sehr schade, da interessieren Laien der zugriff auf das Material das in Archiven und Lagerräumen schlummert verwehrt beleibt. Viele Unterlagen, Bild und Tondokumente verstauben und bleiben ungenutzt liegen. Auch hier kann „mein“ Wiki System genutzt werden. Ausgesuchte Dokumente können aus leicht aus dem Lokalem Wiki ins Netz exportiert (Markieren Kopieren Einfügen) werden.

Umso mehr Dokumente für das Internet freigegeben werden umso bekannter wird das Quellarchiv. Dies zieht wiederum viele Studenten und Wissenschaftler an.

Und was ist mit dem digitalen Loch?

Die es nicht wissen: Das digitale Loch bezeichnet ein Informationsverlust der durch defekte in IT Systemen verursacht wird. Diese Gefahr ist natürlich immer gegeben. Im Archiv in dem ich tätig war lagern viele Disketten und Daten CDs. Vor allem Disketten können in den nächsten Jahren nicht mehr gelesen werden, da moderne PCs ohne Floppylaufwerk ausgeliefert werden. Allerdings ist Gefahr des Datenverlustes durch „Auflösungserscheinungen der Magnetschicht“ auf diesen Datenträgern wesendlich gefährlicher. Man sagt ca. 5 Jahre halten Daten auf einer Diskette. Dies kann durch kopieren auf Festplatten vermieden werden! Auch CDs sind nicht die erste Wahl beim speichern von Informationen. Ich plädiere also alle Informationen die schon über Jahre angehäuft wurden gleich in eine DB einzupflegen! Ein Raid System in dem gleichzeitig mehrer Festplatten innerhalb eines PCs beschrieben werden erhöhen die Datensicherheit ins unermessliche. Tägliche, Wöchentliche oder Monatliche Backups auf externe Festplatten (z.B.: USB Festplatten) die in einem Stahlschrank oder besser in einem Tresor aufbewahrt werden geben zusätzliche Sicherheit.

Das Analogen Loch

Sprechen wir einmal vom Analogen Loch. Schon heute ist es schwierig alte VHS Bänder anzuschauen. Von der guten alten Magnetkassette oder von Magnetbändern sprechen wir erst gar nicht. Hier wird es in den nächsten Jahren „kriminell“. Ersten entmagnetisieren sich diese Datenträger über die Jahre die Qualität wird immer schlechter und zum zweiten wird es schwierig und sehr teuer an geeignete Abspielgeräte zu kommen.

Selbst Dokumente auf Papier oder Fotos sowie Microfilm verliert über die Jahre an Qualität. Ein Unglück wie Brände, Wassereinbrüche und vieles mehr können wertvolle Dokumente für immer vernichten! Die Kosten für eine Restauration von nur einem Dokument sind beträchtlich.

Ich kann nur jeden Museumsleiter und Archivar eine Kopie in welcher Form auch immer von Dokumenten anzufertigen ans Herz legen.

digitale Datenhaltung und Erhaltung

Warum soll digitale Datenhaltung und Erhaltung besser sein als alles andere. Selbst ich als IT Spezialist bin dafür, um alle umstände das Original zu erhalten! Allein das Papier auf dem das Dokument verfasst wurde sagt viel über die damalige Zeit aus, und kann nicht durch eine digitale Reproduktion ersetzt werden.

Allerdings steht auch die Frage der Wirtschaftlichkeit im Raum. Wie teuer ist es ein halbverbranntes Dokument zu retten das nicht unbedingt von großer historischer Bedeutung ist? Ich weiß viele Professoren für Geschichte wollen am liebsten jeden noch so kleinen Papierfetzen aufbewahren. Aber was ist mit den Dokumenten die vollständig und unwiederbringlich zerstört wurden? Eine Hochaufgelöstes Digitale Kopie kann man für die Ewigkeit aufbewahren und das auffinden stellt in der heutigen Zeit ebenfalls kein Problem dar. Wenn sich Archive untereinander einig sind können Festplatten von einem Archiv beim nächsten Archiv gelagert werden.

Ein Beispiel von nur 5 Archiven die im Verbund arbeiten

Jedes Archiv hat seinen größten und wichtigsten Teil seiner Dokumente auf einer Festplatte zusammengefasst. Es werden 5 Kopien dieser Festplatte erstellt jedes Archiv bekommt eine Kopie des jeweiligen Archivs. Jedes Archiv besitzt eine Kopie (einschließlich der eigenen) 5 Festplatten. Sollte nun eines der Archive durch ein Unglück (Brand) vollständig zerstört werden liegen immer noch 4 Kopien sicher in den anderen Archiven. Auch wenn 3 Festplatten über die Zeit def. Geworden sein sollte existiert noch eine vollständige und Funktionstüchtige Festplatte. Allein mit diesem System entsteht kein Digitales Loch.