TERMINI - Vernetzter Wortschatz lateinischer Wissensliteratur der Frühen Neuzeit

Lehrstuhl für Neuere Deutsche Literatur am Germanistischen Seminar der Universität Heidelberg
Prof. Dr. Wilhelm Kühlmann

in Kooperation mit Rechenzentrum und Bibliothek der Universität Mannheim

Gefördert von der Deutschen Forschungsgemeinschaft


english version

Das von der DFG im Rahmen ihres Programms Kulturelle Überlieferung geförderte Projekt TERMINI war von 2004 bis 2006 am Lehrstuhl ‚Alte Geschichte und Wirkungsgeschichte der Antike‘ (Prof. Dr. Kai Brodersen) der Universität Mannheim angesiedelt; danach wurde die Arbeit im Rahmen des Projektes CERA-TERMINI (2006-2008) am Lehrstuhl Prof. Dr. Wilhelm Kühlmann, Germanistisches Seminar der Universität Heidelberg, fortgesetzt. TERMINI sammelt den erschließungsrelevanten Wortschatz (einschließlich Eigennamen) lateinischer Wissensliteratur der Frühen Neuzeit und reichert ihn mit lexikalischen und semantischen Daten an, um ihn für die lexikalische und thematische Suche in den maschinenlesbaren Texten von CAMENA verfügbar zu machen.

Zunächst hat TERMINI den von CAMENA aufgebauten THESAURUS ERUDITIONIS durch Handbücher der Länderkunde, der Naturgeschichte, der mathematischen Disziplinen, der Medizin und Rechtswissenschaft so erweitert, dass er nunmehr weite Bereiche akademischen Wissens der Epoche abdeckt. Über die Fachsprachen hinaus wurde der Wortschatz der gelehrten Literatur auch mittels umfassender Sprach- und Sachwörterbücher (Hofmann, Estienne/Gesner, Kirsch, DuCange, Nolte) dokumentiert.

Aufgrund von vollständig oder im Auszug erfassten Texten des THESAURUS ERUDITIONIS identifiziert TERMINI die Stichwörter, die Wissensobjekte repräsentieren. Sie sind in lexikalisch organisierten Werken als Lemmata greifbar. Allein das Lexicon universale von J. J. Hofmann (1698) enthält rund 100.000 Artikel, wovon der größere Teil auf Eigennamen entfällt. Der Thesaurus linguae et eruditionis Romanae von R. Estienne in J. M. Gesners Bearbeitung (1749) bietet rund 60.000 Artikel, davon nicht wenige zu Personen der antiken Geschichte und Mythologie. Lehr- und Handbücher des THESAURUS ERUDITIONIS werden anhand ihrer inhaltserschließenden Texte - Personen- und Sachregister, Inhaltsverzeichnisse und Resümees - ausgewertet. Weitere Stichwörter liefert die von CAMENA in der Sammlung POEMATA durchgeführte Codierung von Namen.

Die gesammelten Stichwörter werden durch Flexionsformen und Schreibvarianten sowie durch Daten aus ihrem Kontext (alternative Bezeichnung, Definition bzw. Klassenzuordnung, Kapitelüberschrift, Orts- und Zeitangabe) angereichert. Neben der intellektuellen Annotierung werden hierbei Methoden des 'text mining' verwendet. Aufgrund von Kooperationen können wir auch Fremddaten einbeziehen, so die von der Deutschen Bibliothek (DDB) zur Verfügung gestellten Normdateien (Personennamendatei und Schlagwortnormdatei). Zur Erfassung lateinischer Flexionsformen hat uns das Perseus Project sein Werkzeug Morpheus zur Verfügung gestellt.

Durch die erfassten Ordnungsmerkmale ergeben sich 'ontologisch' bestimmte Stichwortgruppen, die Gegenstandsklassen oder thematische Felder repräsentieren. So können die Nutzer vom Detail aus größere Zusammenhänge in den Blick nehmen oder vom Allgemeinen aus die zugehörigen Teilfelder entdecken.

Dieser pragmatische Ansatz vermeidet die Festlegung auf eine einzige Systematik, die der Vielfalt frühneuzeitlicher Ordungskonzepte (vgl. Wilhelm Schmidt-Biggemann: Topica universalis. Hamburg 1983) und heute geläufiger Klassifikationen nicht gerecht würde. Er erspart es uns auch, die bei der Auswertung der Quellen entstandenen Stichwortgruppen nach Maßgabe einer gewählten Systematik zu reorganisieren und das Wortmaterial neu zu verteilen. Das in der ersten Projektphase konzipierte Datenformular finden Sie hier.

Laufzeit des Projekts: Oktober 2004 bis 30. September 2008.


Die im Rahmen der Projekte CAMENA und TERMINI aufgebaute Datenbank LEMMATA sammelt Stichwörter, die frühneuzeitliche Wissensobjekte repräsentieren. Sie sind an erster Stelle greifbar in den lexikalisch organisierten Werken des THESAURUS ERUDITIONIS. Die Stichwörter werden durch weitere Kontextdaten angereichert (Schreibvarianten, alternative Bezeichnungen, morphologische Daten, Bedeutungsangaben, Querverweise usw.). Von 2008 bis 2011 wird die Arbeit fortgesetzt im Rahmen von EVRECA innerhalb des Projekts eAQUA, gefördert vom Bundesministerium für Bildung und Forschung (BMBF).

 

Zuletzt geändert am 12. Januar 2012