Verwendung internationaler Standards beim Aufbau

Commentaren

Transcriptie

Verwendung internationaler Standards beim Aufbau
Verwendung internationaler Standards beim Aufbau eines
Verbundfindmittels für Archive in Deutschland. Betrachtung der
Interoperabilität zwischen Bibliotheken und Archiven
Andres Imhof, Bundesarchiv 2008
Preprint
Bemerkung: Bei diesem Preprint handelt es sich um die deutsche Übersetzung
des folgenden englischsprachigen Artikels im D-Lib-Magazin:
Andres Imhof: Using International Standards to Develop a Union Catalogue for
Archives in Germany: Aspects to Consider Regarding Interoperability between
Libraries and Archives. In: D-Lib Magazine, September/October 2008, Vol. 14,
No. 9/10, doi:10.1045/dlib.magazine, ISSN: 1082-9873,
Volltext unter: http://www.dlib.org/dlib/september08/imhof/09imhof.html,
doi:10.1045/september2008-imhof.
Bitte verweisen Sie bei Zitaten auf den Artikel im D-Lib-Magazin.
Download des Preprints unter:
http://www.bundesarchiv.de/imperia/md/content/archivportald/dlib_dt_imhof.pdf
Abstract
Dieser Artikel stellt ein aktuelles, von der DFG gefördertes Projekt des deutschen
Bundesarchivs vor, das die in den fünf ostdeutschen Landeshaupt- und Staatsarchiven
vorliegenden Findmittel zu SED-/FDGB-Archivgut in einem Verbundportal vereinen wird.
Hierfür werden die lokal vorliegenden, heterogenen Datenformate in ein gemeinsames Profil
des internationalen Standardformats für Findbücher überführt: Encoded Archival Description
(EAD). Neben EAD werden Encoded Archival Context (EAC) für die Darstellung der
Provenienz des Archivguts und Encoded Archival Guide (EAG) für die Informationen zu den
Archiven selbst eingesetzt. Trotz der Verwendung von Standards wie EAD, EAC und EAG
müssen zahlreiche Aspekte bezüglich der Interoperabilität mit den Inhalten anderer
Kulturerbe-Organisationen wie Bibliotheken und Museum berücksichtigt werden. Wenn
archivische Findbücher mit Katalogdaten aus Bibliotheken zusammengeführt werden,
bleiben die Inhalte der Archive doch vorerst zu denen der Bibliotheken inhomogen. Ein
Grund ist u.a. die Unterschiedlichkeit der behandelten Objekte selbst. Während es sich bei
Publikationen um Einzelobjekte handelt, ähneln Findbücher Sammlungen. Sie fassen
Beschreibungen von zuvor von Archivaren definierten Einzelobjekten zusammen. Ein
besonderer Aspekt dieser Heterogenität ist, dass die in Findbüchern verbundenen
Einzelobjekte nicht ohne ihren Kontext bestehen können. Des Weiteren bedingen die jeweils
verschiedenen Anforderungen und Traditionen in Bibliotheken und Archiven eine
fortbestehende Verschiedenartigkeit. Doch trotz dieser Heterogenität wäre es nutzbringend
für die Anwender, wenn diese mit einem gemeinsamen Sucheinstige arbeiten könnten, der
die Unterschiede in den verschiedenen Wissensinstitutionen berücksichtigt.
1. Das Projekt des Bundesarchivs
Im September 2007 startete im Bundesarchiv das von der Deutschen
Forschungsgemeinschaft (DFG) geförderte Projekt „Ausbau des Portals ‚Netzwerk SED/FDGB-Archivgut‘ zu einer Referenzanwendung für ein Archivportal Deutschland“. Das
Projekt wird in Zusammenarbeit mit den Staats- und Landeshauptarchiven in Berlin,
Brandenburg, Mecklenburg-Vorpommern, Sachsen, Sachsen-Anhalt und Thüringen über
einen Zeitraum von zwei Jahren durchgeführt. Ziel und Aufgabe ist die Zusammenführung
der in den Archiven vorliegenden, heterogenen Informationen in ein gemeinsam genutztes
Profil eines internationalen Standardformats, auf dem die Präsentation im Portal und ein
zukünftig angedachter Austausch mit anderen Informationsprovidern basieren wird. Dieser
Artikel stellt das Projekt vor und erörtert anschließend, welche Faktoren die Interoperabilität
von Archivgut mit anderen Kultur- und Wissensinstitutionen beeinflussen (Ausführlichere
Berichte befinden sich auf der Projekt-Website des Bundesarchivs <http://www.archivgut-
online.de/>). Nach Ablauf der Projektzeit wird die DFG entscheiden, ob der so
eingeschlagene Weg bis zu einem Ausbau zum Archivportal Deutschland weiter gefördert
oder ob ein anderes Projekt mit dieser Ausrichtung Unterstützung erhalten wird.
1.1 Die Arbeit der Archive
Für ein besseres Verständnis des Projektinhaltes soll kurz auf die Kerntätigkeit von Archiven
eingegangen werden. Vereinfacht dargestellt besteht die archivische Arbeit darin,
eingehende Archivbestände zunächst zu sichten und darin enthaltene Duplikate sowie für
unwichtig erachtete Bestandteile zu kassieren. Anschließend wird vom verbliebenen Rest ein
Findbuch erstellt, in dem jede einzelne Akteneinheit mehr oder weniger ausführlich
verzeichnet wird. Ein derartig betrachteter Bestand setzt sich in der Regel nach dem
Provenienzsprinzip zusammen, d.h. die Gliederung des Archivmaterials richtet sich nach der
Struktur, die ihr bei der Herkunftsstelle gegeben wurde. In diesen Findbüchern werden in der
jeweiligen Bestandsgliederung die Titel der Gliederung sowie in den Titeln der
Verzeichnungseinheiten ihre Entstehungszwecke oder Gegenstände erschlossen und ihre
Laufzeit festgehalten. In Ergänzung zum Titel können Präzisierungen oder Anmerkungen
auch zu Ereignissen, Vorgängen, Materialien, Personen in so genannten Enthält-Vermerken
erfasst werden. Ein Findbuch bietet also eine Beschreibung zum Bestand eines Archivs und
ist damit für Nutzer der elementare Einstiegspunkt in die Archivrecherche. Die gedruckten
Findbücher werden bislang vor Ort in den Lesesälen angeboten, zum großen Teil publizieren
Archive ihre Findbücher auch online. In manchen Bundesländern Deutschlands werden
bereits Verbundfindmittel auf Basis von Datenbankrecherchen aufgebaut (z.B. [ARIADNE];
[Archive in NRW] etc.). Nunmehr werden vom Bundesarchiv in diesem Projekt die in
mehreren Archiven verteilt vorliegenden Findmittel zum Archivgut aus der SED und dem
FDGB zu einem breiten Spektrum an Themen in einem zentralen Verbundfindmittel
zusammengeführt.
1.2 Das Verbundfindmittel
Das Verbundfindmittel nutzt Lucene, eine Open-Source-Suchmaschinentechnologie, die Teil
des Apache Software Foundation-Projekts ist. Lucene ist für seine hohe Performanz und
Skalierbarkeit bekannt und ist bereits Bestandteil zahlreicher Software-Anwendungen
[Lucene]. Die Lucene-Technologie kann Content in zahlreichen Formaten indizieren, wobei
im Verbundfindmittel XML-Dokumente (eXtensible Markup Language) verarbeitet werden.
Für das Archivgut des SED-/FDGB-Netzwerks wird als Beschreibungsformat EAD (Encoded
Archival Description) eingesetzt, das in der XML-Syntax kodiert ist. Verwendet wird das
EAD-Schema in der letzten Version von 2008. Bei EAD in der aktuellen Version 2002
handelt es sich um einen internationalen Standard, der in den USA entwickelt wurde und der
sich nunmehr auch in Europa etabliert [EAD, 2007]. EAD 2002 bemüht sich, stärker mit den
Vorschriften der General International Standard Archival Description (ISAD(G)) kompatibel
zu sein, die wiederum vom Internationalen Archivrat (International Council on Archives, ICA)
im Jahr 2000 verabschiedet worden sind [ISAD(G), 2000]. Insgesamt ist EAD 2002 jedoch
erheblich umfangreicher an beschreibenden Elementen als ISAD(G).
Des Weiteren wird das Format EAC (Encoded Archival Context) zur Beschreibung der
Herkunftsstellen verwendet [Cover, 2007]. (Provenienzen können Personen, Körperschaften
und Familien sein.) Bei EAC handelt es sich um noch nicht um einen beschlossenen
Standard. Er liegt als Arbeitsentwurf von 2004 vor und richtet sich nach dem ICA-Standard
für Normdateien in Archiven, dem International Standard Archival Authority Record for
Corporate Bodies, Persons, and Families [ISAAR(CPF), 2004]. Unterstützt wurde die EACWorking-Group bei ihrer Arbeit vom LEAF-Projekt (Linking and Exploring Authority Files),
das von der Staatsbibliothek zu Berlin koordiniert wird und in dem u.a. zahlreiche
europäische Bibliotheken und Archive zusammenarbeiten [LEAF, 2004]. Inzwischen wird
EAC von der EAC-Working-Group der Society of American Archivists betreut [SAA, 2003].
Was in der Auflistung archivischer Standards bislang fehlt sind die Informationen über
Archive, die wiederum mit EAG (Encoded Archival Guide) abgebildet werden. Das EAGFormat liegt in der Alpha Version 0.2 aus dem Jahr 2002 im Status eines Vorschlags vor, der
von einer Arbeitsgruppe des Spanischen Staatsarchivs entwickelt wurde [EAG, 2002]. Es ist
bereits im Portal Censo Guía de Archivos Españoles e Iberoamericanos, einem weltweiten
Verbund mit über 40.000 spanischsprachigen Archiven, erfolgreich umgesetzt [Censo Guia,
2008]. EAG wird sich im endgültigen Entwurf an ISDIAH (International Standards for
Describing Institutions with Archival Holdings) orientieren, einem von der ICA im Mai 2008
vorgelegten Richtlinienentwurf zur Darstellung von Archivinformationen. Auf dem 16. ICA
Kongress im Juli 2008 in Kuala Lumpur wurde über EAG beraten werden [ICA, 2008].
Ergänzend zu EAD, EAC und EAG werden im Verbundfindmittel mit Hilfe des Metadata
Encoding & Transmission Standard (METS) Digitalisate des Archivguts mit in die Findbücher
eingebunden [METS, 2008]. Das METS-Dokument bildet dabei sozusagen den Container, in
dem die Bilder mit administrativen und beschreibenden Metadaten strukturiert
zusammengefügt sind und so der inhaltliche Zusammenhang aller Bilder dargestellt werden
kann. Die jeweiligen METS-Dateien werden anschließend im EAD-Findbuch verlinkt.
Am Ende des aktuellen Projektes werden sich im Verbundfindmittel neben den
zusammengeführten, elektronischen Findbüchern ebenso Informationen zu den
bereitstellenden Archiven und Informationen zu den Herkunftsstellen des Archivguts
(Provenienz) sowie im Idealfall das Archivgut in digitalisierter Form selbst befinden. Wichtig
für die Suche und Präsentation im Verbundfindmittel ist, dass neben der Trefferanzeige nach
einer Volltextsuche immer auch der Zusammenhang der Resultate im Findbuch erkennbar
bleibt, so dass einerseits von Treffer zu Treffer gesprungen, aber andererseits auch
innerhalb des Kontextes der Treffer navigiert werden kann. Dadurch unterscheidet sich
dieses Projekt von der Präsentationsweise anderer Verbundfindmittel, die nach einer
Datenbankrecherche nur die jeweiligen Treffer und nicht deren Kontext anzeigen [Archives
Hub].
1.3 Werkzeuge für die Zusammenarbeit
EAD-Findbücher können bereits jetzt bedienungsfreundlich mit Hilfe des Programms MEX
erstellt werden, inklusive der Erstellung von EAC-Daten und der Einbindung von Digitalisaten
über METS. Das neue Werkzeug ist Ergebnis des <daofind+>-Projektes, das das
Bundesarchiv im Jahr 2007 mit Unterstützung der Andrew W. Mellon-Stiftung, New York,
durchgeführt hat [Daofind, 2007]. Die unter Open-Source-Lizenz freigegebene Software ist in
englischer und deutscher Sprache für die Betriebssysteme Windows XP und Vista sowie
Mac OS X auf der Plattform sourceforge.net verfügbar [Sourceforge.net, 2008]. Ein in MEX
bearbeitetes EAD-Findbuch kann direkt als HTML-Präsentation mit Volltextsuchfunktion
innerhalb des Bestandes exportiert werden. Als Beispiele für allein stehende
Onlinefindbücher mit digitalisierten Akteneinheiten sind die Bestände NVR Nationaler
Verteidigungsrat der DDR [BArch, DVW 1/39458-39539, 2007] und NS 8 Kanzlei Rosenberg
[BArch, NS8, 2007] zu nennen. Drei weitere Beispiele sind auf der Projekt-Website von
daofind zu finden [Daofind, 2007].
Als Vorarbeiten für die Zusammenführung aller Findmittel zu den SED-/FDGB-Beständen
wurden umfangreiche Einzelgespräche mit Verantwortlichen aus allen Partnerarchiven
geführt, um die jeweilige Datenstruktur und Arbeitsweise zu erfahren und anschließend das
lokale Datenformat über eine gemeinsam erarbeitete Konkordanz in das EAD-Format zu
überführen. Alle Konkordanzen gehen schließlich in einen Datenkonverter ein, der eigens für
dieses Projekt programmiert wird. Dieser Datenkonverter umfasst nicht nur die Mappings der
Formate, er bietet auch gleichzeitig die Editionsfunktionen innerhalb der EAD-Struktur, wie
sie bereits vom MEX bekannt sind, damit die Findbücher gegebenenfalls um einzelne
Datenfelder ergänzt und darüber hinaus mit Digitalisaten des Archivguts über METS
angereichert werden können. Die Editionsfunktion wird allerdings noch um das EAG-Format
erweitert.
Am Ende stehen dem deutschen Verbundfindmittel Findbücher zur Verfügung, die mit EAD,
EAC und EAG zunächst einheitliche und internationale Erschließungsformate aufweisen und
damit erstmals auch einen internationalen Datenaustausch in Betracht ziehen lassen.
2. Aspekte zur Interoperabilität zwischen Archiv- und Bibliotheksdaten
An dieser Stelle wird nun die Frage gestellt, wie es um die Interoperabilität dieser
zusammengeführten Findbücher aus Deutschland mit anderen nationalen und
internationalen Anwendungen steht. Können die in EAD abgebildeten Informationen in
sinnvoller Weise an andere Informationsportale weitergeleitet werden? Die Antwort auf diese
Frage fällt je nach zielgerichtetem Einsatz schwer. Da Bibliotheken über sehr viele
Erfahrungen im Aufbau von übergreifenden Informationsportalen verfügen, soll dieser Artikel
ausschließlich die Interoperabilität der Inhalte von Archiven und Bibliotheken betrachten. Für
eine erfolgreiche Zusammenarbeit zwischen Bibliotheken und Archiven sind verschiedene
Aspekte zu berücksichtigen. Diese Aspekte werden nun in den folgenden Unterkapiteln 2.1
bis 2.8 erörtert.
2.1 Verwendung eines Einheitsformates im Archivwesen
Die Verwendung eines strukturierten Einheitsformats in XML-Syntax ist nur der erste
grundlegende Aspekt für die Zusammenführung unterschiedlichen Contents. Ein homogenes
und maschinenlesbares Format, das von einer Gruppe von Informationsprovidern
gemeinsam unterstützt wird, ist Grundvoraussetzung für den Aufbau eines kooperativen
Informationsportalen. Diese Voraussetzung erfüllt das Bundesarchiv in einem ersten Schritt,
indem es die unterschiedlichen Datenstrukturen der verschiedenen Archiven in das EADFormat überführt.
2.2 Einzelobjekt vs. Sammlung
Ein zweiter zu beachtender Aspekt ist der unterschiedliche Objekttyp, der in den
Informationsportalen verschiedener Kultur- und Wissenseinrichtungen behandelt wird.
Objekte wie Publikationen einerseits und Beschreibungen von Originalquellen andererseits
weisen verschiedene Charaktereigenschaften auf, die sich schon allein in den
unterschiedlichen Beschreibungsformaten ausdrücken. Ein Findbuch ist kein Einzelobjekt
wie
eine
Publikation,
sondern
eine
Sammlung
von
Beschreibungen
zu
Verzeichnungseinheiten. Einerseits sind die jeweiligen Einzelbeschreibungen inhaltlich
wichtig. Die jeweiligen Verzeichnungseinheiten sind während zahlreicher Arbeitsabläufe in
einer Herkunftsstelle sukzessive angewachsen. Nach Ablauf einer Frist sind sie schließlich
im Archiv in der vormals zu Grunde liegenden Ordnung als kleinste Einheit eines Bestandes
zur Archivierung eingeteilt worden. Diese Beschreibungen werden von den Nutzern nach
thematisch relevantem Material durchforstet.
Andererseits stehen alle einzelnen Verzeichnungseinheiten eines Bestandes in einem
Kommunikationszusammenhang. Würden sie in einem Informationsportal einzeln betrachtet
werden, wären sie aus ihrem Kontext gerissen. Bei einem Findbuch handelt es sich letztlich
um einen Katalog, der auf eng miteinander verbundene Einzelobjekte verweist. Aus diesem
Grund ist ein Findbuch weder als Einzelobjekt zufrieden stellend zu betrachten, noch als
Sammlung, in der erneut Einzelobjekte für sich alleine stehen können. Für eine integrierte
Präsentation in einem Informationsportal, in dem sowohl Einzelobjekte als auch gewachsene
Bestände, die von außen wie Sammlungen aussehen, zusammengeführt werden, muss für
archivische Findbücher als Mischung von beidem noch ein geeigneter Weg gefunden
werden.
2.3 Abgeschlossene vs. fortlaufende Publikation
Eine Charaktereigenschaft von Online-Findbüchern ist weiterhin, dass sie Bestände von
Archivmaterialien beschreiben, die mehr oder weniger fortwährenden Änderungen
ausgesetzt sein können, indem z.B. Teilbestände nachträglich hinzugefügt werden. Es ist
wichtig zu erkennen, dass das Veröffentlichungsdatum in Findbücher immer nur den
Zeitpunkt der letzten Änderung wiedergibt. Anders als im Bibliothekswesen, wo ein
überarbeiteter Aufsatz grundsätzlich als neue, eigenständige Publikation behandelt wird und
die vorherige Version erhalten bleibt, überschreiben Archive ein bestehendes Findbuch mit
dem neuen Datum. Die Veränderungen werden dabei in der Regel nicht dokumentiert. Vor
einer Zusammenführung von Bibliothekskatalogen und Onlinefindbüchern sollte dieser
Unterschied zwischen abgeschlossenen und fortlaufenden Publikationen bedacht werden.
2.4 Verwendung von Persistent Identifiern
Ein weiterer Umstand ist, dass Bibliotheken Persistent Identifier für Publikationen vergeben
und Archive nicht. Für Publikationen werden nicht nur Signaturen vergeben, die nur für die
jeweilige Bibliothek gelten, sondern zusätzliche eindeutige Identifier, die jede
Veröffentlichung weltweit als einmalig identifizieren lassen. Für elektronische Publikationen
in Deutschland koordiniert beispielsweise die Deutsche Nationalbibliothek (DNB) die
Vergabe von so genannten Unified Resource Names (URN), damit nach den Regeln der
Langzeitarchivierung ein Titel jederzeit gefunden werden kann und somit zitierfähig ist.
Veränderungen des Zugriffortes werden dabei kontinuierlich dokumentiert. Bei
Veränderungen am publizierten Text wird eine neue URN mit dem Verweis auf die URN des
vorherigen Textes vergeben [DNB, 2008]. Hingegen liefern Archive keinen Persistent
Identifier (PI) neben den lokal vergebenen Bestands- und Bestellsignaturen. Ein System der
URN-Vergabe hat sich im Archivwesen bislang nicht etablieren können, da das Angebot der
DNB auf Einzelobjekt fokussiert und nicht für relativ dynamisch veränderbare Sammelobjekte
konzipiert ist. Da Änderungen an Findbüchern häufiger als bei Publikationen auftreten, würde
der mit der Aktualisierung verbundene Verwaltungsaufwand bezüglich einer URN von den
Archiven nicht akzeptiert werden.
2.5 Flache Struktur vs. hierarchische Struktur
Die Tatsache, dass es sich beim Findbuch um einen gewachsenen Bestand handelt und
nicht um ein Einzelobjekt, hat darüber hinaus den Unterschied in der Vielschichtigkeit der
Darstellung zur Folge. Im EAD-Format werden bis zu zwölf ineinander verschachtelte
Gliederungsstufen angeboten, um die hierarchische Struktur eines Bestandes abbilden zu
können. Im Gegensatz dazu werden Publikationen auf einer einzigen Beschreibungsebene
erfasst. Das Datenmodell einer Publikation und das eines Findbuchs sind nur in wenigen
Datenfeldern zueinander kongruent. Sollen die strukturierten, umfangreichen und in die Tiefe
gehenden Erschließungsinformationen der Archive in Form von Findbüchern auf die 15
Core-Elemente der Dublin Core Metadata Initiative übertragen werden [DCMI, 1998], kann
nur die oberste Ebene des jeweiligen Findbuchs als Gesamtpublikation abgebildet werden.
Der größte Teil an Informationen in Findbüchern, und zwar der im Detail erschlossene
Bestand, wird mit Dublin Core unterschlagen.
Auch wenn man die oberste Ebene des Findbuchs in Dublin Core betrachtet, wäre sie nur
unzureichend dargestellt. Die Schwierigkeiten, die in Bezug auf das Datum und den Identifier
auftreten, wurden bereits oben genannt. Die technischen Daten wie Format, Typ und
Sprache sind noch relativ einfach zu generieren. Eine inhaltliche Beschreibung begrenzt sich
jedoch auf Titel, Publisher und zeitlicher Umfang des Archivguts. Deutsche Archive erfassen
jedoch in der Regel nicht das Thema, eine Beschreibung, einen Autor oder einen
Unterstützer in den bibliographischen Angaben.
2.6 Unterschiede in den Traditionen
Ferner sind offenkundige Unterschiede zwischen den Traditionen in der Arbeitsweise von
Bibliotheken und Archiven und außerdem zwischen Archiven untereinander identifizierbar.
Beides gilt gleichermaßen national wie international. Eine Folge ist, dass zwar ein
einheitliches, internationales Format für die Beschreibung von Archivgut als Rahmen
verwendet werden kann, das für viele mögliche Informationen entsprechende Elemente
bietet. Es ist jedoch ungewiss, in welchem Ausmaß auch auf der regionalen Ebene diese
Informationen bedient werden wollen oder können.
Bibliotheken
haben
weit
früher
als
Archive
an
der
Normierung
von
Erschließungsinformationen gearbeitet und daraus einheitliche Beschreibungsformate wie
[MARC21, 2006], [MAB2, 2006] etc. entwickelt. Mit Einsatz dieser Standards können Daten
zwischen Bibliotheken ausgetauscht bzw. zum Aufbau eines regionsübergreifenden
Gesamtkataloges genutzt werden. Dagegen war aufgrund der Einmaligkeit des Materials in
Archiven eine Normierung bisher nicht zwingend. Publizierte Erschließungsrichtlinien [OVG,
1964; Papritz, 1983] und die gemeinsame zentrale Ausbildung lassen zwar durchaus das
Archivmanagement von Archiv zu Archiv vergleichbar erscheinen, insgesamt weichen jedoch
die Erschließungen je nach dem im Archiv vorhandenen Material, seinen Strukturformen,
den lokalen Regeln eines Archivs sowie den bearbeitenden Personen voneinander ab. Auch
Softwarehersteller verwenden heute noch für ihre Archivsysteme jeweils ein proprietäres
Format. Erst in jüngster Zeit wird in Deutschland auch der EAD-Standard etabliert. Außer
dem EAD-Format wird noch das in Deutschland entwickelte SAFT-XML-Format als
Austauschformat für die Retrokonversion alter Findbücher eingesetzt [Schieber, 2007]. Die
Erfahrungen mit Standardformaten und Normierungen sind demnach im Archivwesen noch
jung und nicht so weit gediehen wie im Bibliothekswesen. Ein wichtiger Faktor der Motivation
für die Nutzung der Standards ist jetzt der Aufbau von archivübergreifenden Portalen und
Verbundfindmitteln, die Informationen aus vielen verschiedenen Archiven zusammenführen.
Die Auswirkung dessen ist, dass nicht alle sinnvollen Datenfelder auch mit jedem Findbuch
geliefert werden. Mitunter handelt es sich dabei um sehr wichtige Daten, die für eine
Zusammenführung verschiedener Recherchewerkzeug unerlässlich sind. Beispielsweise
setzen Bibliotheken seit langem Normierungen für Klassifikationen [LCC, 2008; DDC, 2008;
RVK, 2007], Schlagworte [LCSH; SWD, 2008], sowie Körperschaften und Personen [LCNAF;
GKD, 2007; PND, 2008] an. In Findbüchern werden dagegen Klassifikationen, die den
Bestand als solchen thematisch eingrenzen sollen, nicht vergeben. Dort ist die Klassifikation
die jeweilige Gliederungsstruktur, sozusagen das Inhaltsverzeichnis des Bestandes, dessen
Benennungen sich aus den Titeln der einzelnen Gliederungsstufen ergeben. Eine
Klassifikation eines Findbuchs ist also mit der Klassifikation im Bibliothekswesen keinesfalls
vergleichbar. Sie zeigt eher ein Abbild von der immanenten Struktur des Materials.
Bibliotheken und Archive gehen auch unterschiedlich bei der Schlagwortvergabe vor.
Manche, nicht alle Archive vergeben zum Gesamtbestand und zu einzelnen
Verzeichnungseinheiten Index-Begriffe. Dies geschieht sporadisch, nicht für jede
Verzeichnungseinheit und nicht für jeden Bestand. Die Indexierung bezieht sich dabei immer
auf das Findbuch, nicht auf die dort beschriebenen, archivierten Unterlagen. Diejenigen
Archive, die Indizes erstellen, verwenden zumeist eigene Schreibweisen für Personen, Orte,
Sachen u.a. ohne Normierungsansätze. Eine Übernahme von Werten aus der PND, GKD
und SWD geschieht in aller Regel nicht. Im deutschen Archivwesen spricht man sich bislang
gegen eine Einführung von Normdaten aus. Bezüglich dieser Entscheidung ist zu
berücksichtigen, dass die Erschließung von Normdaten als zusätzlicher Aufwand betrachtet
wird. Angesichts des Kostendrucks in Archiven und angesichts von großen, nicht
erschlossenen und damit unzugänglichen Beständen entspricht dies aus Sicht der Archive
keiner günstigen Kosten-Leistungs-Rechnung. In dieser Betrachtungsweise unterscheidet
sich das deutsche Archivwesen übrigens vom amerikanischen, wo Authority Files (LCNAF)
und Subject Headings (LCSH) der Library of Congress (LoC) in den einzelnen
Verzeichnungseinheiten vergeben werden.
2.7 Informationen zur Sprache des Findbuchs und des Materials
Wenn Archivgut jüngst nicht mehr nur regional, sondern auch international zugänglich
gemacht wird, ist es wesentlich, die Sprache der archivischen Ressourcen zu erfahren.
Früher wurde schlicht deutsches Archivgut in deutsch erwartete, obwohl die Quellen
gelegentlich in einer anderen Sprachen wie französisch, englisch, schwedisch oder russisch
Quellen verfasst sein konnten. Um Archivgut nutzen zu können, ist es jedoch nicht
unerheblich zu wissen, in welcher Sprache das Findbuch verfasst ist. Darüber hinaus ist die
Sprache des Quellmaterials von Bedeutung. Auch die wird nicht überall durchgehend erfasst.
Erst in einem Europäischen Archivportal wird deutlich, wie wichtig das Kriterium Sprache für
die Recherche ist. Aus diesem Grund werden bereits im Projekt des Bundesarchivs die
Angaben der Sprache des Findbuchs und des Materials neben weiteren Daten automatisch
hinzugefügt, um die Onlinefindbücher später auch in einen internationalen Kontext einstellen
zu können.
2.8. Rechtswirksame Aspekte in Archiven
Als letzter Aspekt sollen in diesem Artikel die rechtswirksamen Beschränkungen in Archiven
erörtert werden. Archive haben rechtliche Rahmenbedingungen bezüglich ihres Archivguts
zu beachten, die in Bibliotheken in dieser Form nicht existieren. Z.B. haben Archive die
gesetzlich vorgeschriebenen 30 Jahre Schutzfrist nach Erstellung der Akte einzuhalten, in
denen Archivgut noch nicht für eine allgemeine Benutzung zugänglich gemacht werden darf.
Vorher wird kein Findbuch veröffentlicht. Darüber hinaus werden personenbezogene
Informationen erst 30 Jahre nach dem Tod der Betreffenden freigegeben. Die auf
Nutzungsrechte bezogenen Metadaten werden zum Teil in den Archivsystemen gepflegt.
Bestände bzw. Verzeichnungseinheiten, die davon betroffen sind, werden mit einem
Sperrvermerk versehen. Darum wird von einigen der am Verbundfindmittel beteiligten
Archive gewünscht, während der Konvertierung in das EAD-Format die Enthält-Vermerke
und Index-Begriffe von gesperrten Verzeichnungseinheiten zu entfernen und nur den Titel zu
nennen. Stattdessen werden Ersatzanzeigen mit Hinweisen auf Möglichkeiten zur
Aufhebung von Sperrungen eingefügt. Auf diese Weise muss nicht das gesamte Findbuch
gesperrt werden. Die Nutzer erfahren von der Existenz der Verzeichnungseinheit und
können zumindest einen Antrag auf Aufhebung des Sperrvermerks stellen.
Bevor ein Findbuch eines Archivs also in einem nationalen oder internationalen
Zusammenhang präsentiert wird, muss eine Selektion der rechtlich nicht freigegebenen
Bestände vorgenommen werden. Jedes Informationsportal – ob regional, national oder
international –, das Informationen zu diesem Material übernimmt, muss gewährleisten, dass
die Datenhoheit über ein einmal eingestelltes Findbuch zu jedem Zeitpunkt beim jeweiligen
Archiv verbleibt. Infolgedessen kann ein Onlinefindbuch jederzeit und kurzfristig wieder
entfernt werden, sollten sich Änderungen zum Material ergeben haben.
Zusammenfassung
Auch wenn ein strukturiertes, internationales Standardformat wie EAD für die Erstellung von
Onlinefindbüchern eingesetzt wird, so bleiben doch die Inhalte der Archive zu denen der
Bibliotheken heterogen. Gründe sind die Unterschiedlichkeit der Materialien in den
Bibliotheken und Archiven sowie deren verschiedene Anforderungen und Traditionen. Wenn
in einem Informationsportal ein Einzelobjekt mit flacher Beschreibungsstruktur auf eine
Bestandsbeschreibung mit hierarchisch aufgebauten Erschließungsdaten trifft, muss dies
konzeptionell in der Suche und der Navigation berücksichtigt werden und den Eigenschaften
von Publikationen und Onlinefindbüchern gleichermaßen gerecht werden.
Wie im Artikel erörtert, um Materialien in ein Europäisches Archivportal einzubinden, sollten
sie mit EAD, EAC und EAG aufbereitet sein. Aber auch wenn diese Standards verwendet
werden, gibt es – wie oben umrissen – noch Absprachebedarf zu einzelnen Aspekten. Indes
fehlen für die Einbindung in eine Europäische Digitale Bibliothek [EDLproject] wichtige
deckungsgleiche Datenstrukturen in Bezug auf all jene Katalog- und Bestandsinformationen
aus Bibliotheken, Archiven und Museen.
Es wird ein gemeinsamer Rechercheeinstieg benötigt, der über eine Volltextsuche sowohl
auf Findbüchern als auch auf Einzelobjekten wie Publikationen zugreifen kann und darüber
hinaus eine Navigation über ein auf Schlagworten basierendes Faceted Browsing oder Drill-
down anbietet, das die Ergebnisse sukzessive einzugrenzen hilft. Dies ist jedoch ohne
normierte Schlagworte kaum nutzbringend umzusetzen [Imhof, 2006]. Bibliotheken verfügen
zu diesem Zweck über Normdateien, Archive nicht. Eine Lösung dieses Problems kann sich
allerdings nur aus der Archivarbeit selbst ergeben und nicht von außen herangetragen
werden.
Allein durch den Einsatz internationaler Standards ist keine Interoperabilität zwischen
Bibliotheken und Archiven gewährleistet. Es ist zweckmäßiger, die Heterogenität dieser
Institutionen zu akzeptieren und entsprechend unter Berücksichtigung der in diesem Artikel
diskutierten Aspekte in einer gemeinsamen Präsentation umzusetzen. Nach einer
Volltextsuche benötigen die Nutzer weiterhin eine Orientierung im jeweiligen Kontext der
Ressource. Nur so werden letztlich die Suchergebnisse vollständig verstanden.
Literatur
[Archives Hub]. A national gateway to descriptions of archives in UK universities and
colleges. http://www.archiveshub.ac.uk/ (Zugriff: 11.08.2008)
[Archive in NRW]. Das Informationssystem der Archive in Nordrhein-Westfalen.
http://www.archive.nrw.de/ (Zugriff: 11.08.2008)
[ARIADNE]. Archivverbund Mecklenburg-Vorpommern. http://ariadne.uni-greifswald.de/
(Zugriff: 11.08.2008)
[BArch, DVW 1/39458-39539]. (2007). Bestand DVW 1/39458-39539. Nationaler
Verteidigungsrat der DDR: Sitzungsprotokolle 1960-1989.
http://www.bundesarchiv.de/fb_daofind/Zdaofind_DVW1_NVR/ (Zugriff: 11.08.2008)
[BArch, NS8]. (2007). Bestand NS8. Kanzlei Rosenberg: 1918-1945.
http://www.bundesarchiv.de/fb_daofind/Zdaofind_NS8/ (Zugriff: 11.08.2008)
[Censo Guia]. (2008). Portal Censo Guía de Archivos Españoles e Iberoamericanos.
http://aer.mcu.es/sgae/index_censo_guia.jsp (Zugriff: 11.08.2008)
[Cover, Robin]. (2004). Beta Release of Encoded Archival Context (EAC) for Name Authority
Control. Volltext unter: http://xml.coverpages.org/ni2004-08-24-a.html (Zugriff: 11.08.2008)
[DCMI]. (1998). Dublin Core Metadata Element Set, version 1.0: Reference description.
Volltext unter: http://www.dublincore.org/documents/1998/09/dces/ (Zugriff: 11.08.2008)
[DDC]. (2008). Dewey Decimal Classification. Offizielle Website: http://www.oclc.org/dewey/
(Zugriff: 11.08.2008)
[Daofind]. (2007). Offizielle Website: http://www.daofind.de/ (Zugriff: 11.08.2008)
[DNB]. (2008). Persistent Identifier. Offizielle Website:
(Zugriff: 11.08.2008)
http://www.persistent-identifier.de
[EAD]. (2007). Encoded Archival Description, version 2002. Offizielle Website:
http://www.loc.gov/ead/ (Zugriff: 11.08.2008)
[EAG]. (2002). Encoded Archival Guide Document Type Definition. v. alpha 0.2.
http://aer.mcu.es/sgae/jsp/censo_guia/Documentos/EAG.DTD.txt (Zugriff: 11.08.2008)
[EDLproject]. EDLprojekt. Offizielle Website: http://www.edlproject.eu/ (Zugriff: 11.08.2008)
[GKD]. (2007). Gemeinsame Körperschaftsdatei. Offizielle Website: http://staatsbibliothekberlin.de/deutsch/abteilungen/ ueberregionale_bibliographische_dienste/gkd/
(Zugriff: 11.08.2008)
[Imhof, Andres]. (2006). RSWK/SWD und Faceted Browsing: neue Möglichkeiten einer
inhaltlich-intuitiven Navigation. Bibliotheksdienst 40. Jg. (2006) 8/9, p. 1015 - 1025. Volltext
unter:
http://www.zlb.de/aktivitaeten/bd_neu/heftinhalte2006/Erschliessung01080906.pdf
(Zugriff: 11.08.2008)
[ICA]. (2008). International Council on Archives: Congress 2008 in Kuala Lumpur. Offizielle
Website: http://www.kualalumpur2008.ica.org/ (Zugriff: 11.08.2008)
[ISAAR(CPF)]. (2004). International Standard Archival Authority Record for Corporate
Bodies, Persons, and Families, Second edition. Volltext unter:
http://www.ica.org/en/node/30230 (Zugriff: 11.08.2008)
[ISAD(G)]. (2000). General International Standard Archival Description, Second edition.
Volltext unter: http://www.ica.org/en/node/30000 (Zugriff: 11.08.2008)
[ISDIAH]. (2007). International Standards for Describing Institutions with Archival Holdings,
Call for comments. Volltext unter: http://www.ica.org/en/2007/10/24/cbps-internationalstandards-institutions-archival-holdings-isiah-call-comments (Zugriff: 11.08.2008)
[LCC]. (2008). Library of Congress Classification. Offizielle Website:
http://www.loc.gov/cds/classif.html (Zugriff: 11.08.2008)
[LCNAF]. Library of Congress Name Authority Files. Offizielle Website:
http://authorities.loc.gov/cgi-bin/Pwebrecon.cgi?DB=local&PAGE=First (Zugriff: 11.08.2008)
[LCSH]. Library of Congress Subject Headings, Offizielle Website:
http://classificationweb.net/ (Zugriff: 11.08.2008)
[LEAF]. (2004). Linking and Exploring Authority Files: Offizielle Website:
http://www.crxnet.com/leaf/ (Zugriff: 11.08.2008)
[Lucene]. Offizielle Website: http://lucene.apache.org/ (Zugriff: 11.08.2008)
[MAB2]. (2006). Maschinelles Austauschformat für Bibliotheken. Offizielle Website:
http://www.d-nb.de/standardisierung/formate/mab.htm (Zugriff: 11.08.2008)
[MARC21]. (2006). MAchine-Readable Cataloging, Concise Format of Bibliographic Data.
2006 Concise Edition. Volltext unter: http://www.loc.gov/marc/bibliographic/
(Zugriff: 11.08.2008)
[METS]. (2008). Metadata Encoding & Transmission Standard, version 1.6.
Offizielle Website: http://www.loc.gov/standards/mets/ (Zugriff: 11.08.2008)
[OVG]. (1964). Ordnungs- und Verzeichnungsgrundsätze für die staatlichen Archive der
Deutschen Demokratischen Republik. Herausgegeben von der Staatlichen Archivverwaltung
im Ministerium des Innern der Deutschen Demokratischen Republik 1964. Digitalisiert 2005.
Volltext unter: http://www.staatsarchive.de/publikationen/OVG.pdf (Zugriff: 11.08.2008)
[Papritz, Johannes]. (1983). Archivwissenschaft. Vol. 1 – 4. 2. Überarbeitete Auflage,
Marburg 1983.
[PND]. (2008). Personennormdatei. Offizielle Website:
http://www.d-nb.de/standardisierung/normdateien/pnd.htm (Zugriff: 11.08.2008)
[RVK]. (2007). Regensburger Verbundklassifikation. Offizielle Website:
http://www.bibliothek.uni-regensburg.de/Systematik/systemat.html.
[Schieber, Siegrid]. (2007). Vorstudien des Landesarchivs NRW. Volltext unter:
http://www.archivschule.de/content/462.html (Zugriff: 11.08.2008)
[SAA]. (2003). Society of American Archivists. Offizielle Website: http://www.archivists.org/
[Sourceforge.net]. (2008). Download unter:
http://sourceforge.net/project/showfiles.php?group_id=212526 (Zugriff: 11.08.2008)
[SWD]. (2008). Schlagwortnormdatei. Offizielle Website:
http://www.d-nb.de/standardisierung/normdateien/swd.htm (Zugriff: 11.08.2008)