Aus Salomon Ludwig Steinheim-Institut für deutsch-jüdische Geschichte an der Universität Duisburg-Essen

Inhaltsverzeichnis

Workshop Retrodigitalisierung (2008)

Tagungsbericht

Porta Hebraicorum

Einer der bedeutendsten Hebraica-Bestände der Welt befindet sich in der Bayerischen Staatsbibliothek. Dr. Ittai Joseph Tamari referierte über Erschließung und Digitalisierung der Sammlung aus Sicht der Buchwissenschaft.

Das hebräische Buch kennen wir seit Jahrtausenden, es spielt eine wichtige Rolle im jüdischen Leben. Obwohl die hebräische Buchgesellschaft in Deutschland begründet wurde, ist sie heute nicht mehr Bestandteil der jüdischen Studien. Moritz Steinschneider befasste sich mit der jüdischen Bibliographie und verfasste die erste Abhandlung über die hebräisch-schriftliche Buchkunde, die er Jüdische Typographie und jüdischer Buchhandel nannte. Seine Arbeit wurde von den Brüdern Alexander und Moses Marx fortgesetzt, die aber nach Amerika auswanderten, und mit ihnen die Forscher und das Fach Jüdische Buchwissenschaft. Die Sammlung der Bayerischen Staatsbibliothek geht auf Herzog Albrecht V. zurück, der Bestände Widmannstetters und Fuggers kaufte. Durch Ankäufe, Schenkungen und die Säkularisierung, die die Eingliederung geistlicher Bibliotheken zur Folge hatte, wuchs der Bestand. Während des Nationalsozialismus wurde etwa die Hälfte der europäischen Hebraica-Bestände vernichtet, die Münchner Bibliothek hingegen überstand den zweiten Weltkrieg und das NS-Regime. Sie beherbergt heute geschätzt 4.700 frühe Titel und 29.000 Bände. Die Sammlung ist eine hervorragende Basis für die buchwissenschaftliche Forschung, da sie Drucke der verschiedensten Druckereien enthält. Bemerkenswert ist, dass erst im 17. Jh. jüdischen Druckern in Deutschland überhaupt erlaubt war, eigene Buchdruckereien zu eröffnen. Doch sie mussten oft umherziehen, so dass es bis zum 18. Jahrhundert keine zentralen Druckorte gab. Wir sehen anhand des Bestands die Etablierung einer neuen Druckschrift, der aschkenasischen, die dann von der sefardischen verdrängt wurde. Wir erfahren ferner, dass es auch christliche Drucker gab, denen es wichtig war, hebräische Schriften zu drucken. In einem Pilotprojekt werden nun 133 hebräische Bücher der Staatsbibliothek digitalisiert und nicht nur formal, sondern auch sachlich erschlossen.


Dr. Tamari ist wissenschaftlicher Mitarbeiter beim historischen Seminar der Ludwig-Maximilians-Universität in München. Seine Hauptaufgabe dort ist die Erschließung und Digitalisierung der Bestände der bayrischen Landesbibliothek. Nähere Informationen zu seinen Publikationen und eine Beschreibung des Forschungsprojektes finden sie hier.


Wissensraum

Der Kooperationspartner des Projekts Porta Hebraicorum, Prof. Dr. Heiner Klocke, widmete sich in seinem Vortrag dem virtuellen Wissensraum aus der Sicht der Informatik. Ziel des Forschungsprojekts ist es, das Wissen hebräischer Drucke, die sich in der Bayerischen Staatsbibliothek befinden, zu erschließen und mittels der Digitalisierung zu präsentieren. Einführend betrachtete Klocke einige Definitionen und Formen des Wissens und unterschied implizites und explizites Wissen.

In den Büchern und in den Buchkundigen jedenfalls ist stilles, implizites Wissen verborgen, möglichst viel davon aber soll mit Hilfe der Digitalisierung gespeichert werden. Die Digitalisierung soll also insbesondere auch die Tiefenerschließung ermöglichen, Zustand, Inhalt, Herkunft und die geschichtliche Bedeutung der Bücher berücksichtigen. Deswegen wird nicht nur mit Bibliothekaren, sondern auch mit Historikern und Restauratoren kooperiert. Mit Hilfe der Digitalisierung soll über das Internet ein virtueller Wissensraum entstehen. Die hochwertige Digitalisierung von Druckwerken verspricht, dass wertvolle Bücher zukünftig geschont werden können. Dabei sollen wichtige Attribute nicht außer Acht gelassen werden: Wasserzeichen, Randnotizen und auch die Papierstruktur werden erfasst und virtuell und visuell zugänglich gemacht. Somit wird auch der Vergleich verschiedener Exemplare ein und desselben Buches möglich. Klocke zeigte dazu einige Software-Module. In einer virtuellen Werkstatt wird das Digitalisat erschlossen und zu einem virtuellen Buch ‚gebunden‘. Im Studio kann man das virtuelle Buch dann lesen. Das Buch wird in Leserichtung dargestellt und ermöglicht das Blättern wie im realen Exemplar. Mit dieser Art der Präsentation, so Klocke, bewegen wir uns im semantischen Netz des Wissensraumes.

Hier eine Abbildung des verborgenen/impliziten Wissens:


Links sehen Sie wie die digitalisierten Bücher später dargestellt werden.

Klocke ist Professor für Informatik an der Fachhochschule Köln. Sein Schwerpunkt ist die Mensch-Computer-Interaktion. Genauere Informationen über seine Arbeit und seine Publikationen finden Sie hier.


Epidat

Den EDV-Einsatz in epigraphischen Projekten des Steinheim-Instituts skizzierte Thomas Kollatz mit seinem Beitrag Digitale Edition epigraphischer Korpora: epidat – Datenbank zur jüdischen Grabsteinepigraphik.

Bereits seit 2002 kommt hier die mit TUSTEP programmierte Datenbank „epidat“ zum Einsatz. Damit sind 64 jüdische Friedhöfe, mehr als 14.000 Inschriften und 20.000 Fotos online inventarisiert und dokumentiert (November 2008). Im Arbeits - und Editionsformat geschieht die Eingabe und sachgemäße Kommentierung der meist hebräischen Inschriften effizient, strukturiert und kontrolliert über ein Browserinterface mit anschließender programmgestützter Rohübersetzung. Im Lauf der Jahre ist es gelungen, auch bereits erfasste Bestände zu konvertieren und retrodigitalisiert in die Datenbank zu integrieren. Das Präsentationsformat (x)html bereitet die epigraphischen Daten transparent und vielfältig für ein breites Publikum auf: Inschriften sind chronologisch, durch Indizes (Namen, Symbole, Quellen, Lemmata), teilweise auch topographisch über einen Lageplan erschlossen, Recherche im Volltext ist auch korpusübergreifend möglich. Archivformate gewährleisten open-access (freien Zugang) und programmunabhängige Langzeitarchivierung. Neben PDF wird auch das TEI-konforme Format für epigraphische Daten EPIDOC sowie flach strukturierter „plain-text“ angeboten.

Thomas Kollatz studierte Theologie und semitische Sprachen in Heidelberg und Amsterdam. Seit 1997 ist er wissenschaftlicher Mitarbeiter am Salomon Ludwig Steinheim-Institut. Seine Forschungsschwerpunkte dort sind die jüdische Presse, Othodoxie vor 1871, deutsche Literatur in hebräischen Lettern um 1800 und die Epigraphik, die in seinem Vortrag auch thematisiert wurde.


Annotationen

Prof. Dr.-Ing. Norbert Fuhr thematisierte AnnotationsbasiertesInformation Retrieval und gab einführend einige Beispiele. Collaboratives Markieren, Kommentieren und Diskutieren von Textpassagen, das ermöglichte schon vor Jahren das für Historiker entwickelte Annotationssystem COLLATE; einfacher, aber geläufiger sind heutige Webangebote wie Heise news, Spiegel online oder Blogs, bei denen die Leser Kommentare und Wertungen hinzufügen können. Annotationen können vielfältige Eigenschaften aufweisen, als zugefügte Inhalte, als Wertungen auf der Metaebene, nicht selten sind sie widersprüchlich, beziehen sich auf das ganze Dokument oder nur ein Fragment. Sie sind deshalb eine besondere Herausforderung für die Entwicklung geeigneter Suchfunktionen (Retrieval) für solche Dokumente. Für die Modellierung der komplexen Anforderungen wurde das POLAR Framework entwickelt. Tests zeigen, dass die Relevanz der Suchergebnisse steigen kann, wenn bei der Recherche Annotationen berücksichtigt werden. Die Weiterentwicklung des Systems sieht Fuhr in der beseren Modellierung ganz unterschiedlicher Informationsbedürfnisse der Nutzer, und betont den Bedarf an weiteren Testkorpora. Die verblüffende Analogie zu den klassischen, jüdischen Quellen, die in hohem Maße intertextuell verknüpft sind, oft klar erkennbar schon durch die Anordnung im Druck, häufiger aber noch durch feinere, weniger offensichtliche Verbindungslinien, sprach Michael Brocke in der Diskussion an. Eine Zusammenführung der beiden so unterschiedlichen Bereiche könnte deshalb fruchtbar sein.

Fuhr ist seit 2002 Inhaber des Lehrstuhls Informationssysteme der Universität Duisburg-Essen. Nähere Informationen zu seiner Person finden sie hier.


Arche Noah der Erinnerung

Eine Sektion widmete sich den Digitalisierungsprojekten, die aus der Kooperation der Frankfurter Universitätsbibliothek und der Abteilung deutsch-jüdische Literatur- und Kulturgeschichte der RWTH Aachen hervorgehen.

Wie schwierig es zu seiner Habilitationszeit war, historische jüdische Zeitschriften zu beschaffen,

daran erinnerte Prof. Dr. Hans-Otto Horch. Später unternahm er mit dem Projekt compactmemory die Digitalisierung dieser Zeitschriften, gemeinsam mit der Judaica-Bibliothek Frankfurt und der Germania Judaica Köln. Während der sechsjährigen Förderung übernahm Aachen die technische und philologische Betreuung, die bibliothekarische Hilfe erhielt man aus Frankfurt und Köln. Das als Weltkulturerbe ausgezeichnete Projekt findet weltweit Nutzer. Die historischen Zeitschriften enthalten auch Todesanzeigen oder Hochzeitsglückwünsche und stoßen also auch auf das Interesse von Genealogen und Ahnenforschern, die dadurch Angehörige ausfindig machen können. Das Nachfolgeprojekt, die digitale Erschließung der von Aron Freimann zusammengestellten und katalogisierten Judaicasammlung, wird wie bisher von der Firma Semantics durchgeführt. Seit dem zweiten Weltkrieg ist die Sammlung als Buchbibliothek nicht mehr vollständig, durch Digitalisierung und Online-Präsentation wird das Ziel angestrebt, den Gesamtbestand virtuell wiederherzustellen.

Wie sich aus den Ergebnissen der abgeschlossenen und aktuellen Digitalisierungsprojekte das Wissenschaftsportal Jüdische Studien aufbaut, zeigte Dr. Rachel Heuberger. Die UB Frankfurt besitzt eine der größten Sammlungen zu Judentum und Israel weltweit. Sie enthält auch ca. 750 jiddische Drucke vom 16. bis 20. Jahrhundert, Sachund Geschichtsbücher, Märchen, Liturgie, aus Deutschland, dem Fränkischen Raum, Schlesien dem Rhein-Main Gebiet, Ost- und Westeuropa.

Die Sammlung, betont die Referentin, ist in ihrem Umfang einzigartig. Der älteste Druck, ein Pentateuch,stammt aus dem Jahr 1560/61. Die Zeitschriften, der zweite Bereich des Fachportals, sind eine wichtige Quelle für die Jüdischen Studien.

Nur wenige Bibliotheken bieten ein vollständiges Angebot an Zeitschriften. Daher bietet das Digitalisieren der jüdischen Zeitschriften einen enormen Vorteil für die Wissenschaft weltweit. Die Katalogisierung ist zwar aufwendig, ermöglicht aber eine bessere Suchfunktion. Die DFG hat das Projekt nur bis 2006 gefördert, so dass die virtuelle Zeitschriftenbibliothek trotz angebotener weiterer Exemplare derzeit nicht wachsen kann. Die Digitalisierung gewährleistet die Optimierung der Literaturversorgung – der Nutzer kann von überall auf die Texte zugreifen – und gleichzeitig die Erhaltung des jüdischen Kulturerbes durch Schonung der originalen Bestände. Das Projekt soll in zwei Jahren abgeschlossen werden.


Im Anschluss erläuterte Kay Heiligenhaus den Digitalisierungsprozess am Beispiel der Freimann-Sammlung, dem dritten Bereich des Fachportals. Das Material wird ausgehoben, gesichtet und von einem Dienstleister gescannt. Parallel erfolgt die Katalogisierung gemäss nationaler und internationaler Regelwerke. Wert gelegt wird sowohl auf automatische als auch manuelle Qualitätssicherung, Fehler werden in der Nachbearbeitungsphase behoben. Das Werk wird freigegeben, automatisch bei der Deutschen Nationalbibliothek registriert und an andere Suchportale gemeldet. Der Nutzer gelangt so auf ganz unterschiedlichen Wegen zu den digitalisierten Volltexten der Freimann-Sammlung (Opac, Hebis, zvdd, google), und der Webkatalog ist automatisch verknüpft mit Einträgen in der Wikipedia. Die Verfügbarkeit der digitalen Kopie wird über die Vergabe eines eindeutigen Namens (urn) und nicht etwa einer Web-Adresse auf lange Zeit gesichert.

Dies Verfahren ist über die Nationalbibliotheken organisiert und verhindert, dass die Digitalisate vielleicht schon in wenigen Jahren nicht mehr erreichbar sind, denn jährlich verschwinden, so Heiligenhaus, 20% der wissenschaftlichen Quellen im Web. Abschließend wies er auf die bemerkenswerte Möglichkeit hin, mittels Google Analytics die Nutzung des Webangebots auszuwerten, InformatiInformationen zu gewinnen über Anzahl und geografische Herkunft der online-Leser, über die durchschnittliche Verweildauer, ob sie über einen Link oder eine Suchmaschine kamen.

Links zu sehen ist der standardisierte DFG-Viewer, rechts davon eine binär gescannte Buchseite.


Horch habilitierte in Aachen mit einer Arbeit über deutsch-jüdische Literatur im 19. Jahrhundert. Seit 1992 ist er Professor für deutsch-jüdische Literatur an der Hochschule in Aachen. mehr...

Rachel Heuberger ist die Leiterin der Hebraica und Judaica Sammlungen der Stadt - und Universitätsbibliothek Frankfurt a.M. Sie ist Mirglied in verschiedenen Vorständen und setzt sich sehr für die jüdische Gemeinde ein mehr...

Kay Heiligenhaus ist ein Absolvent der germanistischen Instituts der RWTH Aachen. Er ist Mitarbeiter der Firma Semantics, die an der Digitalisierung der Judaica-Sammlung mitarbeitet.


Jonas Cohn-Archiv

Dr. Margret Heitmann berichtete über die Digitalisierung des handschriftlichen Nachlasses des Philosophen und Pädagogen Jonas Cohn. Cohn, am 2.12.1869 in Görlitz geboren, studierte 1888–1892 in Leipzig, Heidelberg und Berlin. 1897 habilitierte er bei Wilhelm Windelband. Bis zur Zwangsbeurlaubung 1933 arbeitete er am Psychologischen Institut der Universität Freiburg. 1939 emigrierte Cohn nach England. Er stirbt am 14.1.1947 in Birmingham. Der Nachlass, Tagebücher, Buchmanuskripte, persönliche Dokumente, Briefe und Aufsätze, die zwischen 1890 und 1947 entstanden, wird seit 2001 im Steinheim-Institut aufbewahrt und als DFG-Projekt digitalisiert. Der stark gefährdete Nachlass, so Heitmann, mache die Erhaltung und Sicherung dringend notwendig. Tintenfraß, trockenes und brüchiges Papier sowie Säureschäden hätten dem Material schon sehr geschadet. Der Nachlass soll als Online-Katalog erscheinen, außerdem dient die Digitalisierung der Vorbereitung einer kritischen, kommentierten Edition einzelner Handschriften und ausgewählter Werke.

Zu den technischen Details referierte Crispen Mugabe.

Die Digitalisierung des Archivs erfolgt in vier Stufen nach DFG-Vorgaben: Erschliessung, Scannen, Verfilmen und Online-Präsentation. Die Erschliessung erfolgt mittels einer Allegro-HANS Datenbank. Dabei werden die Regeln für Nachlässe und Autographen (RNA) beachtet sowie das Maschinelle Austauschformat für Bibliotheken (MAB2) als Schnittstelle für die Übertragung der Archivdaten in das Kalliope-Portal. Die Entscheidung für HANS stützt sich auf dessen Vorteile gegenüber konventionellen relationalen Datenbanken und der leistungstarken Import- und Exportsprache. Strukturiert ist die Datenbank in 11 Register, die eine Indexsuche ermöglichen. Die Online-Präsentation erfolgt über die Methoden des Allegro-Pakets, die Verfilmung übernimmt ein externer Anbieter. Die Scans werden in 300 dpi Auflösung online gestellt.

Dr. Margret Heitmann ist seit 1988 wissenschaftliche Mitarbeiterin des Steinheim-Institutes und mit der Archivleitung, Projektplanung/leitung und der Organisation von Tagungen und Kolloquien befasst.

Crispen Mugabe studierte Informationstechnik an der Universität Duisburg-Essen und ist seit 2006 wissenschaftlicher Mitarbeiter des Insituts.


Suchverfahren

Mit seinem Vortrag Thuembbröbst, Thombbrobst oder Dompropst: von der Verarbeitung historischer Textdokumente gab Thomas Pilz einen Einblick in ein DFG-gefördertes Projekt zur Regelbasierten Suche in Textdatenbanken mit nichtstandardiserter Rechtschreibung. Um Bücher wirklich verfügbar zu machen, muss auch ihr Volltext erschlossen werden. Aufgrund schlecht erhaltener Vorlagen und der Vielzahl unterschiedlicher Drucktypen leiden jedoch automatisch erfasste Textseiten an Zeichenerkennungsfehlern. Aber auch die vielfältigen historischen Schreibvarianten aus der Zeit vor der Vereinheitlichung der deutschen Orthographie reduzieren die Recherchequalität. So etwa das Wort „König“, von dem Pilz nach kurzer Suche in wenigen Korpora bereits 46 Variationen gefunden hatte. Weitere Fehlerquellen, die bei der Digitalisierung von alten Beständen auftreten, sind abweichende Transkriptionen, Zeichenkodierungen sowie die schwierige Beschaffenheit der Originalquelle. Das zentrale Problem ist nun, wie man in einem Volltext nach einem Wort suchen kann, dessen genaue Schreibweise nicht bekannt ist. Das Projekt versucht, für diese Problembereiche effiziente Suchverfahren bereitzustellen. Pilz stellte dar, dass eine regelbasierte Lösung nicht möglich ist und setzte lernfähige stochastische Strategien dagegen. Bereits entwickelt wurde ein entsprechendes Suchmodul, das als Erweiterung für den populären Browser Mozilla Firefox vorliegt. Mittels Analyseverfahren auf Basis Bayes'scher Klassifizierer soll sich das Suchmodul in einer kommenden Version semiautomatisch an die jeweiligen Daten anpassen und die Retrievalqualität weiter steigern.

Thomas Pilz ist wissenschaftlicher Mitarbeiter der Universität Duisburg-Essen im Bereich Informatik.

Jüdische Publizistik

Ein gemeinsames Projekt des DISS und des StI widmet sich seit 2005 der Erforschung der Jüdischen Publizistik des 19. Jahrhunderts. Die lange vernachlässigten Texte, orientiert an „Staat, Nation und Gesellschaft“, spiegeln das damalige Deutschland aus jüdischer Perspektive und sind wichtige Ergänzung der kulturellen Überlieferung. Der Frage, wie diese Quellen als Digitalisate gesichert und wie dabei kulturwissenschaftliche und informationstechnische Ansätze miteinander verbunden werden können, ging Dr. Jobst Paul in seinem Vortrag nach.

Aufgrund der bis ins 20. Jahrhundert in Deutschland verbreiteten Frakturschrift müsse das erste Anliegen sein, die Frakturtexte in elektronische Volltexte in Antiqua umzuwandeln, um sie dann im XML-Format nach unterschiedlichen Kriterien zu „taggen“. Textseiten, -spalten oder -abschnitte enthalten verschiedene Informationsschwerpunkte, daher sollte der Bearbeiter von Anfang

an den Text in sinnvolle Abschnitte gliedern und die darin enthaltenen Informationen markieren, standardisieren und einer logisch höheren Information zuordnen. Diese Hierarchisierung ermöglicht dann z.B., alle Personen, die mit einer bestimmten Institution genannt werden, hervorzuheben. Diese Vernetzung könnte, betont der Referent, über die im Text enthaltenen Informationen hinaus gehen. Möglich wäre zudem, eine Quelle nach Aussagen oder Themen auszuzeichnen. All das bedürfe aber, nicht nur einer längerfristigen Finanzierung, sondern auch der Beratung und Anregung seitens der Informatiker.

Exemplarische Verarbeitungsschritte der Digitalisierung:


Dr. Jobst Paul ist Wiss. Mitarbeiter des Duisburger Instituts für Sprach- und Sozialforschung (DISS) und Projektmitarbeiter Jüdische Publizistik des 19. Jahrhunderts. Seine Arbeitsschwerpunkte sind die ideologischen Grundlagen von Ausgrenzung, Rassismus, Antisemitismus, Ausgrenzungskonstrukte und eine Didaktik gegen Ausgrenzung. Weitere Informationen dazu finden Sie hier.

XML-Arbeitsumgebung

Am Beispiel des Editionprojekts Werke und Briefe von Karl Gutzkow

stellte Susanne Schütz die gemeinsam mit Dr. Jörg Ritter entwickelte TEI-konforme Arbeitsumgebung zur Edition literarischer Texte vor. Für die zugleich als kommentierte digitalisierte Gesamtausgabe und als Druckausgabe in Buchform mit geplanten 60 Bänden war von Beginn an vorgesehen, aus einer Quelldatei zugleich Druckvorlage und HTML-Datei erzeugen zu können. Am Anfang des Projekts dienten Office-Dokumente als kleinster gemeinsamer Nenner einer Gruppe von 30 über Europa verteilten Mitarbeitern, die die html-tags als versteckten Text eingaben. Nachdem sich das als fehlerträchtig erwiesen hatte, wurde gemeinsam mit der Informatik ein passenderes Werkzeug für die Texterfassung und Textauszeichnung entwickelt. Die Eigenschaften dieser Arbeitsumgebung sind: Eingaben erfolgen nicht mittels XML-Tags, sondern formularbasiert, die Formulare sind exakt auf den Editionszweck zugeschnitten und dennoch erweiterbar. Es sind verschiedene Publikationsformate, u.a. LATEX, HTML und PDF wählbar und Layouts lassen sich flexibel anpassen. Nachdem sich dieses Tool bei der Gutzkow-Edition bewährt hat, ist nun das Ziel der Kooperation an der Universität Halle die Entwicklung eines Werkzeugs für philologische Editionsvorhaben jeder Art.

Frau Schütz ist wissenschaftliche Mitarbeiterin der Universität Halle-Wittenberg, ihr Schwerpunkt ist die Literatur - und Kulturwissenschaft Lateinamerikas. Genauere Informationen zu ihrer Person und ihren Publikationen sind hier zu finden.

Praxisprojekt ReDi 1.0

Dr. Eva Dyllong stellte die für die Arbeit mit retrodigitalisierten Dokumenten entwickelte Software Re- Di vor. Sie war Ergebnis eines Praxisprojekts 2007 der Informatik der Universität Duisburg-Essen, in dem 15 StudentInnen im Hauptstudium durch Teamarbeit sich die Anforderungen an eine solche Software erarbeiteten und ihre Erkenntnisse mittels Java in Programme umsetzten. Leitlinie dabei war die Orientierung an Standards und Zukunftssicherheit von Dokumentenformaten sowie die Einbeziehung von Open Source Software. Durch die Kooperation mit dem Steinheim-Institut (H. Lordick) und durch den Textkorpus eines abgeschlossenen Duisburger Forschungsprojekts (Deutsch-jüdische Publizistik, StI/ DISS) war Praxisnähe hergestellt. Die StudentInnen organisierten Arbeitsgruppen für die Bereiche Dokumente, Datenbanken und Toolkits. Es entstand ein Archivsystem mit entsprechenden Grundfunktionen: Dokumentenverwaltung mittels XML-Datenbank und Metadateneditor (Dublin Core) für Dokumente im TEI-Format, Lucene-basierte Volltextsuche, Datenbankanfragen durch XQuery. Besondere Aufmerksamkeit ist auch dem Bereich Visualisierung gewidmet, die mehrere Sichten auf das Archiv bietet, durch Listen, selektive Auflistung anhand der Auszeichnungen in den Dokumenten, gemeinsame Ansicht von Volltext und den dazu gehörenden Seitenabbildern, Export in die Formate PDF/XHTML und DocBook. Schwierig bleibt es aber, reich ausgezeichnete TEIDokumente herzustellen.

Hameasef und Horodisch

In den

Mittelpunkt seiner Ausführungen stellte Harald Lordick XML als Daten(verarbeitungs)format für Digitalisierungsprojekte. Seine Einführung erläuterte grundlegende Eigenschaften und wies auf einfache Zugänglichkeit, hohe Kompatibilität und vermutliche Zukunftssicherheit des Formats hin. Dass in digitalisierten Volltexten Bestandteile wie Absätze, Zitate, Fußnoten etc. eigene Elemente bilden, erlaubt, kontextabhängige Recherchen bzw. Suchanfragen auf solche Elemente (und ihre Kombinationen) einzuschränken. Die konsequente Trennung von Struktur und Layout (CSS) illustrierte er an einem Text von Horodisch zur jüdischen Bibliophilie. Abfragetechniken wie XQUERY sowie die Möglichkeit, mittels XSLT verschiedene Ausgabeformate wie PDFs oder Webseiten zu erzeugen, würde zudem auf die große Präzision und Flexibilität verweisen, mit der Digitalisate weiterverarbeitet werden könnten.

Wenn Digitalisate und ihre Metadaten nicht nur als manuell bedienbare Onlineportale angeboten werden, sondern in einem XML-Format, wie es etwa für den zur Zeit entstehenden DFG-Viewer geeignet ist, lassen sich wirklich virtuelle Fachbibliotheken aus dem Nichts heraus für den Wissenschaftler zusammenzustellen. Solche Techniken erlauben auch die Perspektive, verschiedene Dokumente und ihre Ressourcen miteinander zu verknüpfen, indem etwa bei einem Zitat das passende Seitenabbild des zitierten Textes eingeblendet wird. XML hat weiter dort Vorteile, wo es gilt, große Datenmengen zu visualisieren oder aber ganz unterschiedliche Textsorten, wie Inschriften, bibliografische Daten, Volltexte etc. in eine Gesamtschau zusammenzubringen, für eine übergreifende Suche, wie sie die Webseite des Steinheim-Instituts anbietet. Am Beispiel einer Recherche nach „Hameasef“ zeigte Lordick, wie die XML-fähige Variante von Lucene mittels unscharfer Suche trotz unterschiedlicher Transliterationen gute Ergebnisse bringt. Angesichts des beträchtlichen Aufwands, reich strukturierte Volltexte herzustellen, schloss der Referent: jüdische Autoren und jüdische Quellen sind so oft auf Ignoranz, Ablehnung, Ausgrenzung und Schlimmeres gestoßen. Warum nicht heute Technik nutzen, um damit jüdische Texte einmal in besonderer Weise zugänglich und präsent zu machen?

Dipl.-Soz. Harald Lordick ist wissenschaftlicher Mitarbeiter am Salomon Ludwig-Steinheim Institut. Er ist verantwortlich für die Webseiten und die Datenbankpflege sowie für die Herausgabe der Institutszeitschrift Kalonymos.

Germania Judaica

Den Grundlagen aller Digitalisierungsbemühungen, den Büchern in den Bibliotheken, widmete Dr. Annette Haller ihre Aufmerksamkeit.

Die Kölner Bibliothek Germania Judaica wurde 1959 von einer Bürgerinitiative gegründet, der u.a. Heinrich Böll und Wilhelm Unger angehörten. Ihr Anfangsbestand lag bei nur ca. 180 Bänden, mittlerweile ist er auf 90.000 bis 100.000 Bücher angewachsen. Das Bestreben der Bibliothek war stets, für Aufklärung und gegen Missverständnisse und Vorurteile zu arbeiten. Als in den 60er Jahren das Martin-Buber-Institut für Judaistik ebenfalls in Köln gegründet wurde, traf man die Übereinkunft, dass das Martin-Buber-Institut Hebraica und Judaica aus Mittelalter, Antike und Füher Neuzeit sammelt. So finden sich dort, neben deutschen, auch hebräische und arabische Bücher. Die Germania Judaica besitzt dagegen nur Schriften zum deutschsprachigen Judentum ab dem 18. Jahrhundert. Die Bibliothek finanziert sich mittlerweile größtenteils über die Unterstützung der Stadt Köln, was aber nicht immer so war. Seit den 1970er Jahren war sie institutionell zur Hälfte von Land und Stadt gefördert und in der Stadtbibliothek Köln untergebracht. Die jähe Zäsur erfolgte 2004, als das Land NRW sich aus der Finanzierung zurückzog. Die Rettung der Germania Judaica war, dass die Stadt Köln einsprang und seitdem die Bibliothek finanziert. Frau Haller skizzierte noch die nähere Fortentwicklung. Da endlich wieder eine Bibliotheksstelle eingerichtet wird, können die Katalogisierungsarbeiten intensiviert werden. Weiter ist geplant, den noch gestückelten Katalog der Bibliothek zusammenzuführen und in den OPAC (Online Public Access Catalogue) der Stadt Köln einzuspeisen.

Frau Haller studierte Judaistik, Anglistik und Geschichte an der Universität zu Köln. Seit 1993 leitet sie die Bibliothek Germania Judaica in Köln. Für ihre Verdienste um die Bewahrung und die Erinnerung an jüdisches Leben erhielt sie 2007 den Hermann-Münzel-Preis des Trier-Forums. Mehr zur Germania Judaica hier.

Workflow

Über die Erschließung und Präsentation von Digitalisaten mittels der Workflow-Software

Goobi berichtete Ralf Stockmann. Das Göttinger Digitalisierungszentrum hat diese Software entwickelt, damit Bibliotheken ihre Bestände arbeitsteilig digitalisieren können, ohne dass dafür ein räumlicher Zusammenhang nötig wäre. Die Zielsetzung des Projektes ist, qualitativ hochwertige Digitalisate zu produzieren, die sich an den Praxisregeln der DFG orientieren und daher von ihr gefördert werden. Die Software ist webbasiert und wird auf Open Source Basis angeboten, so dass jede Bibliothek sie kostenfrei einsetzen kann. Goobi besteht aus Software-Modulen, was Entwicklung und Auswertung vereinfacht und die Arbeitsteilung erleichtert. Da die üblichen OCR-Verfahren (Optical Character Recognition) für groß angelegte Digitalisierung zu langsam sind, wurde eine OCR-Renderfarm entwickelt, mit der es möglich ist, ca. 120 Seiten pro Minute als Volltext automatisch zu erfassen. Die Renderfarm ist als vollautomatischer Workflow-Schritt in Goobi integriert und die Speicherung des Digitalisats erfolgt als TEI-Volltext. Goobi enthält Module zur Präsentation der Digitalisate. Es integriert das Content Management System Typo 3, so dass die Benutzer ihre Seiten selbst gestalten und entscheiden können, wie weit sie vom vorgegebenen Grundgerüst abweichen wollen. Goobi führt für jedes Buch ein digitales Inhaltsverzeichnis mit Seitenzahlen, das den Unterschied zwischen der Anzahl der gescannten Seiten und der Originalpaginierung berücksichtigt. Schließlich erwähnte Stockmann noch die Seite DigiWunschBuch.de , die auch Goobi nutzt. Hier kann man die Digitalisierung eines Buches, bei Übernahme der Kosten, individuell beauftragen und so die Patenschaft für die Digitalisierung übernehmen.

Links zu sehen ist die modulare Arbeitsoberfläche von Goobi. Daneben ist ein Screenshot der Seite DigiWunschBuch abgebildet.





Stockmann leitet seit Januar 2005 das Göttinger Digitalisierungszentrum. Seine Schwerpunkte dort sind Multimediales Lernen und Lehren, eLearning, statistische Datenanalyse(SPSS)und neue Medien (Internet).

Content Repository

Frank Lützenkirchen gab einen Einblick in Funktionalität und Leistungsumfang

von My Content Repository. Die Idee zu MyCoRe entwickelte sich aus dem Projekt Duisburg Essen Publications Online, dem Dokumenten- und Publikationsserver der Universität. DuEPublico hat sich zu einem wichtigen Element des Online-Angebots der Universität entwickelt. So können Professoren hier ihre Vorlesungsunterlagen hochladen, die dann von den Studierenden eingesehen und heruntergeladen werden können. Der Server erspart somit viel organisatorischen Aufwand, der stets mit den traditionellen Semesterapparaten in der Bibliothek verbunden war. Nachdem auch andere Universitäten die Software nutzten, entwickelte sich das Open Source Projekt MyCoRe zur Entwicklung eines Systems für Dokumenten-, Publikations- und Archivserver. Ähnlich einem Content Management System verfügt das Content Repository über bestimmte „Bausteine“, die für die jeweilige Anwendung benötigt werden. Außerdem kann man Dateien und auch Videos mit Hilfe eines Java-Applets hochladen und seine Daten sicher speichern, so dass eine umfassende Datenbank entstehen kann. Ebenso wie bei dem Projekt Goobi ist eine umfassende Suchfunktion mit Lucene in das System integriert.

Screenshots des Servers DuEPublico:

Frank Lützenkirchen ist wissenschaflticher Mitarbeiter der Universitätsbibliothek Duisburg. Ihm obliegt die Leitung des Projekts Duisburg-Essen Publications Online.

Anmelden