Wie recherchiert man in Bibliothekskatalogen oder SLUBsemantics ist gestartet

Das Auffinden relevanter Informationen ist kein Wunsch, der erst im digitalen Zeitalter aufgekommen ist, sondern besteht schon seit dem Anbeginn des Sammelns, Aufbereitens und Verbreitens von Informationen. Hier sei an dieser Stelle auf die verschiedenen Kataloge in Bibliotheken und Findmitteln in Archiven hingewiesen, mit denen der Nutzer im Bestand nach relevanten Büchern oder Akten suchen kann. Jedoch ist die Recherche nicht immer einfach. Jeder Studienanfänger kann davon ein Lied singen.

Zwar kann man durch die Online-Kataloge bequem von zuhause oder vom Institut aus im Bibliothekskatalog recherchieren, nur stellt sich in den ersten Wochen eines Studiums oft die Frage, wie man geeignete Literatur findet. Abhilfe gibt es hier in den Einführungsveranstaltungen der Universitätsbibliotheken. Dennoch muß man als Nutzer sich mit dem Recherchieren in Bibliothekskatalogen beschäftigen und gewisse Regeln kennen. Wie schön wäre da zum leichteren Auffinden eine Suche, die sinnvolle Suchergebnisse mit den eingegebenen Schlagwörtern verknüpft – also eine semantische Suche.

Die Bereitstellung einer semantischen Suche in Online-Katalogen von Archiven und Bibliotheken ist nicht so einfach. Selbst Google als großer Player im Suchmaschinenbereich steckt erst in den Anfängen der semantischen Suche. Man benötigt u. a. eine Unmenge verschiedener Daten und Datenformate, um annähernd in Richtung semantische Suche gehen zu können. Da horchte ich natürlich bei der Nachricht der SLUB (Dresden) auf, die in den letzten Tagen ihre SLUBsemantics für die allgemeine Nutzung aktivierte.

Was ist SLUBsemantics und wie funktioniert sie?

SLUBsemantics ist – zur Zeit im Beta-Status – eine Recherche-Variante im Online-Katalog der SLUB. Auf Basis der Wikipedia (sic!) werden dem Nutzer bei einer freien, thematischen Suche die Literaturrechercheergebnisse als Facettenbaum oder graphische Suche angezeigt. Die Ergebnisse werden also thematisch sinnvoll zusammengefaßt und dem Nutzer benutzerfreundlich präsentiert. Ein kleiner Videofilm erklärt perfekt, wie die Suche funktioniert:

SLUBsemantics kann zusätzlich bei einer Recherche im Online-Katalog aktiviert werden und eignet sich nicht für konkretes Suchen nach Autoren, Titel, Werke etc. Hier ist es besser, auf die altbewährte Art und Weise im Bibliothekskatalog zu recherchieren.

Mein erster Eindruck von SLUBsemantics

Schön aufbereitet zeigt die graphische Suche das Ergebnis an. Mit dieser bin ich besser als mit dem Facettenbaum zurecht gekommen, da dort die Zuordnung der Bücher zu den einzelnen Kategorien nicht unbedingt meinem thematischen Verständnis entspricht. Vorteilhaft ist die multilinguale Suche in Deutsch, Englisch und Polnisch. Bald sollen weitere Sprachen folgen. Generell möchte ich diesen eingeschlagenen Weg, dieses Experiment loben und hoffe, daß weitere Bibliotheken und Archive dem folgen werden.

FAQ zu SLUBsemantics
Ausführliche Erklärung zu SLUBsemantics

Verbesserte Formeldarstellung im Polytechnischen Journal

Die TeX-Notation ermöglicht eine überzeugende Umsetzung selbst komplexer mathematischer Formeln

Formelbeispiel TeaserDie TeX-Notation ermöglicht eine überzeugende Umsetzung selbst komplexer mathematischer Formeln

Für die Kodierung und Darstellung von Formeln in TEI haben wir – gemeinsam mit den Projektpartnern von der Humboldt-Universität zu Berlin – in der II. Projektphase des Digitalsierungsprojektes »Dingler’s Polytechnisches Journal« eine elegante Lösung gefunden. In den späteren Erscheinungsjahren des Polytechnischen Journals kommen Formeln immer zahlreicher vor, und die bisherige Darstellung als eingebundenes Bild, das dem Scan der Vorlage entnommen wurde, war unbefriedigend.

Dadurch, dass Formeln als Bilder in den TEI-Quellcode eingebunden waren, war die Formel an sich im TEI nicht mehr erkennbar. Mit der neuen Lösung wird die Formel direkt im TEI in Textform notiert – ein weiterer Schritt in Richtung Volltext.

Korrekte Formeldarstellung, elegant im Textfluss

Nun werden Formeln über das TEI-Element <formula/> ausgezeichnet und in TeX notiert. Für die Ansicht im Webbrowser wird der TEI-Quellcode mittels einer XSL-Transformation in HTML umgewandelt. Dabei werden diese Formeln zu speziellen Bildern.

In HTML wird ein Bild durch das Element img kodiert, dessen src-Attribut die Quelle des Bildes in Form einer URL angibt. Stößt der Webbrowser beim Laden einer HTML-Seite auf solch ein img-Element, so sendet er eine Anfrage an die im „src“-Attribut angegebene Adresse und erwartet Bilddaten zurück. Üblicherweise liegen jene Bilddaten bzw. -dateien bereits fertig auf dem Server vor und brauchen bei einer Anfrage nur an den Browser zurück geschickt werden.

Für das Polytechnische Journal wurde allerdings ein von Frank Wiegand (HU/BBAW) entwickelter Webservice benutzt, den man über eine Basis-URL aufruft, wobei man die URL aber um die jeweilige Formel in der TeX-Notation erweitert. Diese erweitere URL muss dann noch speziell kodiert werden (URL-Encoding).
So wird aus der TEI-Notation:

 im HTML

Dadurch können beliebige Formeln von dem Webservice als Bild angefordert werden. Der Webservice kann einmal erzeugte Formeln cachen, sodass bei erneuten Anfragen dieser Formeln das entsprechende Bild nicht komplett neu generiert, sondern aus dem Cache entnommen werden kann.

Das Ergebnis überzeugt: Die Textformeln unterscheiden sich optisch nicht mehr so stark vom restlichen Text und fließen mit. Selbst komplexe Formelkonstruktionen mit Klammerungen, Brüchen und Summenzeichen werden korrekt angezeigt.

Am Beispiel: Formeln im Faksimile

Formelbeispiel Faksimile

Am Beispiel: Die Formelauszeichnung im TEI-XML

Formelbeispiel XML

Am Beispiel: Das Ergebnis in der HTML-Ansicht

Formelbeispiel HTML

Weiterführende Links

P.S.: Ich möchte mich herzlich bei Christian Kirchhoff bedanken, der die technischen Details zu diesem Artikel beigesteuert hat.

Karlsruher Adreßbücher digitalisiert

Adressbuch Karlsruhe im Webauftritt der BLB (Screenshot)

Die Tage erreichte mich eine Nachricht, die nicht nur Historikerherzen, sondern auch die Herzen aller Digitalisierungsfreunde höher schlagen läßt. Die Badische Landesbibliothek hat die Adreßbücher der Stadt Karlsruhe für den Zeitraum von 1818 bis 1949 digitalisieren lassen. Mit Hilfe von insgesamt rund 54.000 Seiten kann man sich nun intensiv mit der Geschichte Karlsruhes auseinandersetzen. 1818 erschien unter dem Titel „Wegweiser für die Großherzogliche Residenzstadt Karlsruhe“ im Verlag Gottlieb Braun das erste Adreßbuch. Der Endpunkt 1949 wurde laut Pressemitteilung der Badischen Landesbibliothek aus Kostengründen gesetzt, jedoch auch so gewählt, daß die Änderungen in der urbanen Bevölkerungsgeschichte im Zuge des Zweiten Weltkrieges noch nachvollzogen werden können.

Warum sind Adreßbücher so wichtige historische Quellenbestände?

Adreßbücher sind zwar in gewisser Weise mit heutigen Telefonbüchern zu vergleichen, aber in ihnen steckt noch wesentlich mehr. In ihnen werden straßenzugweise für jedes Haus die Bewohner samt ihrer Tätigkeit/Beruf genannt. Sie sind also wertvolle historische Quellen zur Erschließung von Stadtgeschichts-, Bevölkerungsgeschichts- und wirtschaftsgeschichtlichen Fragen. Mit ihnen kann man beispielsweise Zuzüge oder Stadtfluchten, Fragen nach ausgeübten Berufen (damit einhergehend des wirtschaftlichen Schwerpunktes einer Stadt) oder sozialgeschichtliche Fragen (wo wohnten bestimmte Berufsgruppen?) beantworten.

Daher ist es eine freudige Nachricht, daß die Karlsruher Adreßbücher nun jedem Interessierten als Digitalisate zur freien Verfügung stehen. Schnell sind sie auf der Webseite der Badischen Landesbibliothek unter Digitale Sammlungen > Drucke > Adreßbücher > Karlsruhe bequem von jedem Ort weltweit zu finden. Benutzerfreundlich ist die Zeitleiste, an der der Nutzer ohne Probleme genau sein gewünschtes Jahr bzw. das dafür entsprechende Digitalisat findet. Besonders lobenswert ist, daß die Kapitel der einzelnen Adreßbücher jeweils als PDF frei herunterladbar sind.

Das Durchblättern der Adreßbücher funktioniert ohne Probleme. Die Qualität der Digitalisate ist – nach stichprobenartigem Testen – gut fürs Arbeiten geeignet. Jedoch mußte ich einen großen Nachteil bei den Digitalisaten feststellen. Sie sind ausschließlich als Bilder angelegt, ein hinterlegter Volltext fehlt. Somit ist ein D

urchsuchen nicht möglich, was natürlich einer intensiven Bearbeitung durch Wissenschaftler im Wege steht. Letztlich können zwar Forscher die Digitalisate nutzen, für eine weitergehende Analyse müssen die Daten aber extra manuell extrahiert werden. Die fehlende Durchsuchbarkeit betrifft nicht nur die herunterladbaren PDFs, sondern auch die Webseite der Badischen Landesbibliothek. Aber genau dieser letzte Schritt wäre ein wesentlicher Vorteil eines Digitalisats gegenüber der Nutzung der Originalquellen (wenn man jetzt vom Vorteil des weltweiten Zugriffs absieht). Doch trotz dieses Kritikpunktes ist die Badische Landesbibliothek für dieses Projekt „Digitalisierte Adreßbücher der Stadt Karlsruhe“ ausdrücklich zu loben, da wir bisher in Deutschland insgesamt mit Digitalisierungsprojekten erst noch am Anfang stehen.

Link zu den digitalisierten Karlsruher Adreßbüchern (1818-1949) in der Badischen Landesbibliothek