Regeln für die Abschrift und Auszeichnung der CAMENA-Texte

 

Vorbemerkungen


Mit * sind all jene Regeln gekennzeichnet, die in den Jahren 2001-2005 uneingeschränkt zur Anwendung kamen, danach jedoch im Rahmen einer Revision modifiziert bzw. auch gänzlich außer Kraft gesetzt wurden. Diese Revision beinhaltet:

(a) die Reduktion des anfallenden Arbeitsaufwandes zumal bei Erstellung des (vielfach manuell einzufügenden) semantischen Markup zur notwendig gewordenen Entlastung der CAMENA-Redaktion;

(b) die weitgehende Reduktion der Maßnahmen zur orthographischen Standardisierung bzw. Normalisierung (weiterhin durchgeführt werden die Anbindung der Enklitika sowie die Auflösung einer Reihe häufiger Ligaturen und Abkürzungen);

(c) die stärkere Berücksichtigung des Layouts der Textvorlagen (zumal des Kursivdruckes, der Verseinteilung, aber auch z.B. von Marginalien und Tabellen),

(d) die hier und dort notwendig gewordene Überarbeitung der tag library.


* 0.1 Bei der Abschrift (transcription) wird die Schreibung der Texte standardisiert. Näheres s.u. 9. Editorial Interventions.

* 0.2 Durch "Auszeichnung" (Mark-up, Encoding) erhalten die CAMENA-Texte eine für Layout und Recherche nutzbare Struktur. Wir folgen den Richtlinien der Text Encoding Initiative (TEI): (URL http://www.tei-c.org) Guidelines for Electronic Text Encoding and Interchange (TEI P3). Auf der Basis von TEILITE, der für literarische Texte bestimmten Anwendung, haben wir eine auf die Besonderheiten unseres Materials abgestimmte Auswahl von 50 Markierungen (tags) getroffen. Die tags werden aus einer tag library durch Mausklick in den Volltext eingefügt. Sie können mit weiteren Attributen auf den jeweiligen Kontext abgestimmt werden. Markierungen können auch ineinander verschachtelt werden. Für die Form der tags und ihre Syntax ist die Version TEIXLITE.DTD maßgebend, die dem neuen WWW-Standard XML (= Extended Markup Language) folgt.

0.3 Für das Projekt gibt es eine tag library. Die Sprache der Markierung ist Englisch. Auch die in die tags von Fall zu Fall einzufügenden Spezifikationen werden auf Englisch formuliert.

0.4 Die folgenden knapp gehaltenen Regeln für die Texterfassung in CAMENA sind im allgemeinen entsprechend der 'Einführung in TEI-Lite' (gemäß TEI P3) von Burnard und Sperberg-McQueen gegliedert. Dort findet man ausführlichere Erläuterungen. Da die Gestaltung der "elektronischen Titelseite" (TEI Header) vorerst außer Betracht bleibt, beziehen wir uns nur auf die Gliederungspunkte 4 bis 19 der Introduction. Die Ausdrücke mit Winkelklammern (<...>) sind die tags; an der Stelle des von dem tag eingerahmten Textteils stehen in den "Regeln" knappe Angaben über die Art des markierten Teils (in eckigen Klammern [...]), in der tag Liste aber nur ein "+".

 

Regeln für die Texterfassung in CAMENA

4 Encoding the Body:

4.1 Die transkribierten Texte werden als hierarchisch gegliederte Strukturen markiert:

<text>[der Text der vorliegenden Ausgabe insgesamt]</text>

<group>[Gruppe von Texten, z.B. mehrbändige Ausgabe]</group>

<body>[der Haupttext]</body> (Zu Präliminarien und Anhängen siehe 19.)

<div1 id='?' n='?' type='?'>[Abteilung 1. Stufe des Haupttextes]</div1>

<div2 id='?' n='?' type='?'>[Abteilung 2. Stufe des Haupttextes]</div2>

<div3 id='?' n='?' type='?'>[Abteilung 3. Stufe des Haupttextes]</div3>

<head>[Überschrift]</head>

<opener>[Vorspann einer Abteilung]</opener>

<epigraph>[Motto]</epigraph>

<argument>[Inhaltsresümee]</argument>

<trailer>[Schlußformel, Entstehungsvermerk, Unterschrift u. dgl.]</trailer>

<p>[Absatz im Prosatext]</p> (Erscheint nicht innerhalb der Markierungen head und trailer .)

<lg><l>[Metrischer Text von mehr als einem Vers Umfang, Gedicht, episches Buch, Szene]</l></lg>

<l>[Metrischer Text vom Umfang eines Verses oder eines Versteils]</l>.

4.2 Die obigen Markierungen (sog. block level elements) stehen jeweils in einer eigenen Zeile; eine Leerzeile tritt nur zwischen divisions (Abteilungen) ein. Dagegen werden in einen fortlaufenden Text eingefügte Markierungen (sog. inline elements) nicht durch Zeilenbruch abgesetzt. Ein tag umschließt den markierten Text ohne Spatium. Treffen mehrere tags aufeinander (nested tags = eingeschachtelte Markierungen), so steht kein Spatium zwischen ihnen. Wird ein Satzzeichen markiert, so steht zwischen dem tag und dem vorangehenden Wort kein Spatium.

4.3 Einzelgedichte, epische Bücher und Szenen von Versdramen bilden divisions, die nicht weiter zu gliedern sind.

* Abweichend von TEIXLITE.DTD markieren wir hier nicht jeden Vers (<l>+</l>) und jede Strophe (<lg>+</lg>), was sehr zeitaufwendig wäre, sondern jedes Gedicht, jedes epische Buch und jede Szene im Versdrama als Ganzes mit <lg><l>+</l></lg>. Der Wechsel der Verszeilen wird allein durch Eingabe (hard return) markiert. Einrückungen (z.B. des Pentameters im elegischen Maß, der Kurzverse in lyrischen Strophen) werden durch Tabstops wiedergegeben (ggf. auch abgestuft mit einem und zwei Tabstops). Strophen müssen nicht durch Leerzeilen getrennt werden.

4.4 Wo jedoch Verse bzw. Versgruppen in anderem Kontext vorkommen (als Motto oder als Bestandteil einer Illustration oder als Zitat in einen Prosatext eingefügt), werden sie mit <lg> und <l> markiert, wie in TEIXLITE.DTD vorgesehen. Der unmittelbar umgebende Prosatext ist vor dem Einschub mit </p> abzuschließen und danach mit <p> wieder zu eröffnen.

4.5 Das Attribut "id" beim tag "division" besteht aus einer eindeutigen, codierten Bezeichnung. Sie setzt sich zusammen aus zwei Buchstaben für den Verfassernamen, einem Buchstaben für den Titel der Ausgabe, einem Buchstaben für ihren Verlags- bzw. Druckort und einem Nummernschlüssel, der die Zählung der Gliederungselemente enthält. Z.B.: <div1 id='OpSF.1' n='1' type='book'> für Buch 1 der in Frankfurt erschienenen Silvae von Martin Opitz; <div2 id='OpSF.1.01' n='1' type='poem'> für das erste Gedicht dieses Buchs. Beim Attribut "n" ist die laufende Nummer der Texteinheit einzutragen.

* 4.6 Innerhalb einer Abteilung (<div...) wird für einleitenden Text, z.B. Widmung oder Vorwort, das 'tag' <opener> verwendet. Da <opener> nur durch allgemeine Attribute (id, n, lang, rend) ergänzt werden darf, muß die Textgattung, um die es sich bei dem einleitenden Text handelt, in Verbindung mit dem 'tag' <seg> angegeben werden, also z.B.: <opener><seg type='dedication'>[Widmungsbrief]</seg></opener>. Besteht der einleitende Text aus verschiedenen Texttypen, werden diese jeweils als <seg type='?'> markiert. Zu <seg> siehe 6.4.

* 4.7 Kommen in einer Gedichtsammlung neben Buch (liber) und Einzelgedicht noch andere Gliederungen vor (wie z.B. bei: Opera poetica omnia, quibus continentur Elegiarum libri 3, Odarum libri 4), so wird das Attribut 'group' verwendet: Z.B. <div1 id='?' n='1' type='group'>[Abteilung 1. Stufe des Haupttextes, durch die Gedichtgattung bzw. metrische Form bestimmt]</div1>; darauf folgt: <div2 id='?' n='1' type='book'>[Elegien Buch 1]</div2>.

* 4.8 Direkte Rede wird mit dem tag <sp who='?'>+</sp> markiert. Die Zusammenstellung der handelnden Personen zu Beginn eines Dramas (dramatis personae), einer Szene oder eines Dialogs wird wie eine Bühnenanweisung mit <stage> markiert. Die aufgeführten Namen erhalten einzeln die üblichen tags (z.B. <name type='myth'>Hercules</name>). Die Abschrift des in der Vorlage gewöhnlich vor jedem Gesprächsteil aufgeführten Sprechernamens entfällt. Dafür wird der Sprecher in dem tag <sp who='?'> durch die ersten vier Buchstaben seines Namens identifiziert. (Sofern es zur Unterscheidung nötig ist, wird die vierstellige Chiffre anders zusammengesetzt.) Bühnenanweisungen werden so markiert: <stage>[Regiebemerkung]</stage>.

5 Page and Line Numbers:

5.1 Die Markierung für den Seitenwechsel (page break) <pb id='?' n='?'/> steht am Beginn jeder neuen Seite. Sie wird vom vorangehenden und folgenden Text durch je eine Leerzeile abgesetzt. Das Attribut "id" verknüpft den Volltext mit der entsprechenden Bildseite, indem es den verkürzten Dateinamen der Bilddatei angibt. So wird z.B. für http://mateo.uni-mannheim.de/camena/bald1/jpg/bald002.jpg bei 'id=' eingefügt 'B1bald002', wobei B1 für die erste Baldeausgabe von CAMENA '/bald1/' steht und bald002 die 2. Bilddatei dieser Ausgabe meint. Umfaßt eine Bilddatei zwei Druckseiten, so entfällt bei der zweiten Seite das Attribut "id". Das Attribut "n"gibt die vorliegende Zählung der Seiten bzw. Blätter an, z.B. '51' oder '25b' (bei der Foliierung wird die Vorderseite des Blattes mit a und die Rückseite mit b bezeichnet). Seiten ohne Paginierung oder Foliierung werden nach der Bogensignatur bezeichnet (z.B. A7a, **2b).

5.2 Die Markierung Seitenwechsel wird als empty element nicht mit </pb> abgeschlossen. Ein auf zwei Seiten verteiltes Wort wird stillschweigend der ersten Seite zugeschlagen, um eine Worttrennung zu vermeiden; dabei sind Kustoden (d.h. unten rechts stehende Vorwegnahmen der zu Anfang der nächsten Seite folgenden Schriftzeichen) nicht zu berücksichtigen.

5.3 Die Markierung Seitenwechsel muß immer innerhalb einer Abteilung (division) stehen. Fallen z.B. das Ende eines Gedichts und der Seitenwechsel zusammen, muß das div-tag, das den Beginn des folgenden Gedichts markiert, noch vor dem tag Seitenwechsel stehen, also sozusagen noch auf der vorangehenden Seite! Kommen an einem Seitenwechsel tags mehrerer Gliederungsebenen zusammen, so wird das Element page break nach dem ersten div-tag eingefügt.

5.4 Prosa wird ohne Rücksicht auf die Zeilenlänge der Druckvorlage fortlaufend geschrieben, auch in Titeln und Überschriften. Dabei sind durch Zeilenwechsel veranlaßte Worttrennungen rückgängig zu machen. Ist ein Prosatext in Absätze gegliedert, so werden diese markiert (mit <p>+</p>, wie auch ein ungegliedertes Prosastück als Ganzes). Das gilt jedoch nicht für Titel, Überschriften und Schlußformeln (s.o. 4.).

5.5 Verszeilen werden nicht gezählt, auch wenn die Vorlage eine Zählung bietet.

6 Marking Highlighted Phrases:

* 6.1 Formatierungen (z.B. fett, kursiv, unterstrichen), Schriftart (Fraktur, Antiqua usw.) und Schriftgröße (Punktzahl) bleiben unberücksichtigt. (Das Layout wird in der WWW-Darstellung allein durch die strukturelle Markierung gesteuert, also unabhängig von der Vorlage gestaltet.) Kapitälchen - sie haben die Form von Großbuchstaben (= Versalien = Majuskeln), sind aber kleiner als diese - gelten als kleine Buchstaben. Majuskeln werden als solche wiedergegeben, auch wenn sie fortlaufend gesetzt sind.

6.2 Durch Markierung gekennzeichnet werden folgende i.d.R. typographisch hervorgehobene Textteile: Titel genannter Werke bzw. Ausgaben (s.u. 13.) sowie Überschriften (s.o. 4.); nichtlateinische Textteile (s. auch unten 10.);

* Textteile, die aus einem anderen Kontext übernommen und deshalb von ihrer Umgebung (z.B. durch Anführungsstriche oder Kursivierung) abgehoben, jedoch nicht mit Quellenangabe versehen sind; Zitate mit Quellenangabe:

<q>[angeführter Text]</q> NB: Direkte Rede bezeichnen wir mit <sp>, nicht mit <q>.

<cit><q>Zitat</q> <bibl>[Quellenangabe]</bibl></cit>

6.3 Die Sprachbezeichnungen folgen im allgemeinen der Norm ISO 639-1, ergänzend/abweichend: GR = Altgriechisch; GE = Deutsch; DU = Niederländisch.

<foreign lang='GR'>[griechischer Textteil]</foreign>

* 6.4 Findet man für einen Textteil, der markiert werden soll, in der tag library kein passendes Element, so verwende man vorläufig: <seg>[Textteil innerhalb eines Absatzes o.ä.]</seg>.

7 Notes:

7.1 Fußnoten und Endnoten der Vorlage werden unmittelbar hinter dem Wort (bzw. Textteil), auf das (den) sie sich beziehen, eingefügt.

* Ein dementsprechend aufgelöster Anmerkungsteil wird wie folgt markiert: <gap desc='notes' resp='sampling'/>.

'sampling' meint diese Regeln für die Texterfassung.

7.2 Marginalien werden ihrer Funktion entsprechend entweder als Anmerkungen behandelt oder als Überschriften vor den betreffenden Textteil (z.B. Abschnitt) gesetzt.

* Wiederholen sie aber lediglich Stichwörter des Textes, werden sie stillschweigend weggelassen.

* 7.3 Erscheinen in der Vorlage Quellenangaben von Zitaten in der Form der Anmerkung (bzw. Marginalie), so sind sie dennoch in das Element "Zitat" einzufügen: <cit><bibl>+</bibl> <q>+</q></cit>. Eine Anmerkung entfällt dann.

7.4 Alle als solche übernommenen Anmerkungen der Vorlage werden ohne Unterscheidung wie folgt markiert: <note>[Anmerkung]</note>.

7.5 Bemerkungen des Bearbeiters werden durch das Attribut responsible gekennzeichnet; also: <note resp='transcriber'>[Bemerkung]</note>.

(8 Cross References and Links: Die Möglichkeit der Querverbindung innerhalb des Textes und der Verknüpfung mit anderen Dokumenten wird bei der Texterfasssung noch nicht genutzt.)

9 Editorial Interventions:

* 9.1 Die Texterfassung geht mit einer orthographischen Standardisierung der Vorlage einher. Jedes Wort (ausgenommen Namen) wird unabhängig von der vorliegenden Graphie in der Form wiedergegeben, die der aktuellen Norm von Schul- und Studienausgaben (in Deutschland) entspricht. Diese Umsetzung erleichtert die Lektüre und die automatische Recherche. Zum Zeichensatz siehe Nr. 18.

* 9.2 Als leicht verfügbare Richtschnur dient das Pons Globalwörterbuch Lateinisch-Deutsch. Bearb. Rita Hau, Sabine Grebe u.a. - Stuttgart: Klett. XVII, 1155 S. (2. Aufl. 1986 u.ö.). Gleichberechtigte Varianten (z.B. nihil / nil, queis / quibus) sind zugelassen, Nebenformen aber (z.B. unquam, adsuetus, lubet) werden in die Standardform (umquam, assuetus, libet) umgesetzt. Dieser Eingriff kann mit dem tag Standardform / Variante dokumentiert werden, z.B.: <reg orig='lubet'>libet</reg>. Auch Flexionsformen werden i.a. so geschrieben, wie sie im Anhang des Pons-Wörterbuchs aufgeführt sind.

* 9.3 Die vorliegende Form ist jedoch beizubehalten, wenn eine Standardisierung das Erfassen des Textes in metrischer, grammatischer oder semantischer Hinsicht erschweren würde, wenn eine Stildifferenz eingeebnet oder der Rhythmus verändert würde (z.B. queis / quîs / quibus, labos / labor, aliàs (Adv.) / alias (Adj.), hîc (Adv.) / hic (Nom. Masc.), minimè (Adv.) / minime (Vok.), superûm (Gen. Pl.) / superum (Acc. Sing.), probastis / probavistis). Die Standardform sollte, sofern sie nicht nur durch Wegfall des Akzentes von der Vorlageform abweicht, als Attribut vermerkt werden: <orig reg='labor'>labos</orig>.

* 9.4 Wörter, die im Pons-Wörterbuch nicht aufgeführt sind, werden, wo nötig, anhand eines anderen Wörterbuchs verifiziert und ggf. in ihrer Schreibung den Regeln des Pons-Wörterbuchs angepaßt.

9.5 Groß- und Kleinschreibung der Vorlage bleiben erhalten. (Eine Abweichung von der Normalform erschwert die Textrecherche nicht.) Das gilt nicht nur für Anfangsbuchstaben. (Kapitälchen s.o. Nr. 6.1.)

9.6 Wortgrenzen werden durch Leertaste (Spatium) angezeigt. Auch hier gilt die moderne orthographische Norm. Enklitika sind mit dem vorangehenden Wort zusammenzuschreiben (z.B. vis'ne > visne, monet'que > monetque, homines've > hominesve).

9.7 Die Interpunktion wird in der Regel unverändert übernommen. (Ihre Standardisierung wäre ohne Klärung der Aussagestruktur bzw. Textsyntax nicht zu leisten.) Virgeln, Klammern und Anführungsstriche werden im Rahmen des ASCII-Zeichensatzes (s.u. 18) der Vorlage entsprechend oder ihr ähnlich wiedergegeben. Interpunktionsfehler der Vorlage, die das Textverständnis wesentlich erschweren, sollen korrigiert werden.

*Ein Punkt wird z.B. so getilgt: [Wort]<corr sic='.' resp='transcriber'></corr> und so eingefügt: [Wort]<corr sic='' resp='transcriber'>.</corr>.

In der Frühen Neuzeit übliche Interpunktionsweisen sollen jedoch nicht "modernisiert" werden. So ist z.B. die Verwendung des Kommas zur Markierung von Sprechpausen und die des Doppelpunkts zur Gliederung von Perioden (ungefähr unserem Strichpunkt entsprechend) zu erhalten. NB: Bei Satzzeichen ist der Farbauftrag oft sehr schwach; manchmal ist bei genauem Hinsehen der Abdruck des vermißten Satzzeichens doch noch zu entdecken.

* 9.8 Die auf Errata-Blättern vermerkten Korrekturen werden eingearbeitet. Der korrigierte Text erscheint als Haupttext, die fehlerhafte Version wird als Attribut (sic='?') wiedergegeben; z.B. <corr sic='emin' resp=' printer'>enim</corr>. Die Errata-Liste als solche wird übergangen: <gap desc='errata' resp='sampling'/>.

9.9 Korrekturen, die der Bearbeiter für nötig und plausibel hält, in der Vorlage jedoch nicht vorfindet, werden in gleicher Weise eingefügt und durch das Attribut resp='transcriber' gekennzeichnet; also z.B. <corr sic='emin' resp='transcriber'>enim</corr>.

* Ebenso werden plausible Korrekturen von der Hand eines Vorbesitzers übernommen (resp='owner').

Hält der Bearbeiter den vorliegenden Text für fehlerhaft, ohne eine Korrektur vorschlagen zu können, so markiert er den suspekten Textteil wie folgt: <sic>[korrupter Text]</sic >.

10 Omissions, Deletions and Additions:

10.1 Vor allem längere griechische Texte werden in der Regel weggelassen. Die Markierung der Lücke (gap) enthält neben der Sprachbezeichnung lang='GR' zuweilen das Attribut description, das den ausgelassenen Text nach Länge und ggf. auch Inhalt knapp beschreibt: <gap lang='GR' desc='letter of 20 lines'/>.

Sofern eingestreute griechische Wörter bzw. Textpassagen erfaßt werden, erfolgt die Texteingabe nach den Regeln des BetaCode mit folgender Markierung: <foreign lang='GR'>[Transliteration]</foreign>.

Einzelworte und Textpassagen in neueren europäischen Sprachen lateinischer Schrift werden in der Regel gemäß der vorliegenden Graphie abgeschrieben, längere Texte zuweilen auch weggelassen, wobei die Lücke wie oben beschrieben markiert wird.

Wörter und Texte in anderen Schriften werden übergangen; die Lücke wird markiert. Ähnlich werden Textteile markiert, die infolge äußerer Einwirkung unleserlich sind; z.B. <gap reason='crossed out'/>. Andere mögliche Werte dieses Attributs sind z.B.: 'soiled', 'faded', 'erased'. Ist ein Textteil nur vermutungsweise zu entziffern, so wird er mit <unclear> markiert.

10.2 Handschriftliche Annotationen und Beigaben von Vorbesitzern werden nicht berücksichtigt, ausgenommen Korrekturen am gedruckten Text (s.o. 9.9.).

11 Names, Dates, Numbers and Abbreviations:

11.1 Eigennamen werden im allgemeinen in der vorliegenden Schreibung wiedergegeben.

* Typographische Besonderheiten (z.B. V V für W) werden dabei normalisiert (s.u. 18).

* 11.2 Eigennamen werden als Element name markiert. Das Attribut type klassifiziert das Bezeichnete:
='myth': Entität der antiken Mythologie; neben Göttern, Halbgöttern und Menschen auch Orte mythischen Geschehens, z.B. der Parnaß als Wohnsitz der Musen; doch sollten Appellativnomina (wie z.B. Oceanus für das Meer, ohne merkliche Personifikation) nicht markiert werden;
='rel': Entität der (jüdisch-)christlichen Religion, neben biblischen Personen auch Orte biblischen Ge-schehens und Heilige der Kirche, nicht aber kirchliche Würdenträger; "Deus" und "Spiritus Sanctus" sollten als Personen der Trinität nur dann wie Eigennamen markiert werden, wenn sie im Kontext eine Wendung ins christlich Religiöse signalisieren (also nicht repetitiv);
='person': historische und fiktive Personen (ausgenommen die zu Mythos und Religion gehörigen!);
='org': Institution (ausgenommen die zu Mythos und Religion gehörigen!);
='nation': Bevölkerung eines Orts, Gebiets, Landes, Erdteils sowie ihre Sprache (ausgenommen die zu Mythos und Religion gehörigen!);
='place': Ort, Gebiet, Land, Erdteil, auch Berge und Gewässer (ausgenommen die zu Mythos und Religion gehörigen!).

Beispiele: <name type='person'>Erasmo</name>, <name type='place'>Basileae</name>, <name type='nation'>Germani</name>.

11.3 Nähere Angaben (z.B. Ansetzungsform des Namens, Lebensdaten und Berufsbezeichnung einer Person) werden bei der Texterfassung noch nicht hinzugefügt.

* 11.4 Setzt sich eine Bezeichnung aus einem Eigennamen und einem Appellativum (Gattungsbezeichnung) zusammen, so wird sie als Element reference string (etwa = Zeichenfolge mit Referenzfunktion) markiert. Innerhalb dieses Elements wird der Eigenname als solcher ausgezeichnet. Zum Beispiel:
Iovis coniunx: <rs type='myth' n='Iuno'><name>Iovis</name> coniunx</rs>
Elector Palatinus: <rs type='person' n='Friedrich IV. von der Pfalz'>Elector <name type='place'>Palatinus</name></rs>
Cirrhae latices: <rs type='myth' n='Castalia'><name type='place'>Cirrhae</name> latices</rs>. (Cirrha = Kirra, das homerische Krisa, Hafenstadt bei Delphi, steht für dieses als Ort der Musenquelle.)

* 11.5 Kennzeichnungen sollen vom Bearbeiter nur dann durch Nennung des Eigennamens aufgelöst werden, wenn dafür kein besonderer Aufwand benötigt wird. Sonst verfahre man nach folgendem Beispiel: (Gedichtüberschrift AD PRINCIPEM TRANSILVANIAE. Der persönliche Name des Fürsten wird in dem Gedicht nicht genannt und ist nicht ohne weiteres zu ermitteln.) <head>AD <rs type='person' n='?'>PRINCIPEM <name type='place'>TRANSILVANIAE</name></rs></head>.

* Pronomina (z.B. ille) und Gattungsbezeichnungen (z.B. dux, pater), die auf ein Individuum hinweisen, ohne seinen Namen zu nennen, werden nicht markiert, ausgenommen, sie vertreten in Überschriften einen zuvor erwähnten Eigennamen, z.B. <head>AD <rs type='person' n='Friedrich IV. von der Pfalz>EUNDEM</rs></head>.

* 11.7 Ortsbezeichnungen in Personalangaben werden als place markiert, z.B. <rs type = 'person'><name type='person'>Johannes Maier</name> Canonicus <name type='place'>Spirensis</name></rs> (= Domherr zu Speyer).

* 11.8 Literarische Fachausdrücke, also Termini technici der Poetik und Rhetorik, werden wie folgt markiert: <term type='literary'>[literarischer Fachausdruck]</term>. Das gilt auch für metrische bzw. Gattungsbezeichnungen in Überschriften (von Einzelgedichten, Gedichtbüchern usw.). Zusammengesetzte Kennzeichnungen werden mit einer Schachtelung markiert, z.B. Syracosio versu: <term type='literary' n='bucolic'><name type='place'>Syracosio</name> versu</term>. (Theokrit, der Begründer der Hirtenpoesie, stammte aus Syrakus.)

* 11.9 Zahlen werden entsprechend der Vorlage mit arabischen, römischen oder auch (transliterierten) griechischen Zahlzeichen wiedergegeben. Bezeichnen sie ein Datum, wird die standardisierte Zeitangabe eingefügt, z.B. <date value='1640-04-30'>prid. Kal. Maias MDCXL</date>. Zur Umsetzung des römischen Kalenders ist die beigefügte Tabelle zu nutzen. Schwer "übersetzbare" Datumsangaben (z.B. Heiligenfeste, griechischer Kalender) werden später von der CAMENA-Redaktion bearbeitet.

* 11.10 Abkürzungen werden bei der Texteingabe übernommen und als solche markiert: <abbr expan='?'>s.d.p.</abbr>. Die ausgeschriebene Fassung (expansion) kann hinzugefügt werden, sofern sich der Bearbeiter der Ergänzung sicher ist: <abbr expan='salutem dicit plurimam'>s.d.p.</abbr>.

* 11.11 Innerhalb der Elemente <bibl> und <titlePage> werden keine weiteren Markierungen vorgenommen. In unser tag Titelseite (<titlePage><titlePart>+</titlePart></titlePage>) ist das tag Titelbestandteil (<titlePart>) nur aus datentechnischen Gründen eingefügt.

(12 Lists: Listen werden bei der Ersterfassung nicht als solche markiert.)

13 Bibliographic Citations:

Titel von Werken bzw. Ausgaben werden bei der Ersterfassung pauschal markiert: <bibl>[Titel]</bibl>. Die einzelnen Bestandteile des Titels (wie Hauptsachtitel, Verfasserangabe, Ausgabenbezeichnung, Impressum) werden vorerst nicht klassifiziert.

14. Tables:

* Tabellen sind in den Ausgaben von CAMENA kaum zu erwarten. Falls doch eine begegnen sollte, ist sie vorerst zu übergehen: <gap desc='table' responsible='sampling'/>.

15 Figures and Graphics:

* 15.1 Gedruckte graphische Darstellungen (Illustrationen) werden bei der Texteingabe nach folgendem Beispiel markiert: <figure><head>[vorliegende Bezeichnung der Illustration]</head> <figdesc>The author receives the crown of the poet laureate</figdesc></figure>. Ist Text in die Illustration integriert, so wird er übernommen: <p>[Prosa]</p>, <l>[ein Vers]</l>, <lg><l>[mehrere Verse]</l></lg>.

15.2 Dekoratives Beiwerk (Zierleisten, Vignetten u. dgl.) bleibt unberücksichtigt.

(16 Interpretation and Analysis: Die Möglichkeit der Textanalyse und Interpretation wird bei der Ersterfassung noch nicht genutzt.)

17 Technical Documentation:

17.1 Ein Inhaltsverzeichnis (table of content = 'toc') wird von der CAMENA-Redaktion aus den Überschriften generiert, die durch Markierung (<head>) aus dem Textkontinuum herausgehoben sind. Ein im Druck vorliegendes Inhaltsverzeichnis wird im allgemeinen nicht abgeschrieben.

17.2 Auch Register werden im allgemeinen nicht abgeschrieben.

18 Character Sets, Diacritics, etc.:

18.1 Folgende Zeichen bleiben bei der Datenübertragung so gut wie immer unverändert erhalten: Aa Bb Cc Dd Ee Ff Gg Hh Ii Jj Kk Ll Mm Nn Oo Pp Qq Rr Ss Tt Uu Vv Ww Xx Yy Zz 0 1 2 3 4 5 6 7 8 9 " ' ( ) * + , - . / : ; < = > ? (Spatium) . Die darüber hinaus benötigten Zeichen der gängigen Tastaturen können nach Maßgabe von Nr. 9 verwendet werden.

* Sie werden später von der CAMENA-Redaktion SGML-konform kodiert (z.B. à > agrave, ä > auml, ß > szlig).

18.2 Ligaturen (auch: &) und Abbreviaturen (z.B. û > um, nicht zu verwechseln mit "Abkürzung", s. Nr. 11.10.) werden stillschweigend aufgelöst.

* In Zweifelsfällen wird markiert: <unclear reason='lig'>[tentative Auflösung]</unclear>.

18.3 Sonderzeichen, z.B. Akzent, Trema, Zeichen für die Vokalquantität, können in begründeten Fällen wiedergegeben werden; s.o. Nr. 9.3.

* e caudata, ß, Schaft-s, vv und andere typographische Varianten werden stillschweigend durch die Normalform (z.B. ae, ss, s, w u.a.) ersetzt.

19 Front and Back Matter:

19.1 <front>[der Vorspann mit Titelseite, Privileg, Widmung, Vorwort, Inhaltsverzeichnis u. dgl.]</front>

<back>[der Anhang mit Beigaben, Errata-Blatt, Registern u. dgl.]</back>

19.2 Die Titelseite wird vorerst nur pauschal markiert: <titlePage><titlePart>[Abschrift der Angaben ohne Klassifizierung der Bestandteile]</titlePart></titlePage>.

* Bei einem Vortitel wird als Attribut type='partTitle' eingefügt, bei einem Bildtitel (Holzschnitt oder Kupferstich) das Attribut type='figure'.

19.3 Die sonstigen Präliminarien und die Anhänge werden, sofern sie nicht zu übergehen sind (s.o. 17), als "divisions" markiert: <div type='frontispiece'>, <div type='privilege'>, <div type='dedication'>, <div type='preface' >, <div type='appendix'>.

 

Tag library

NB: In dieser Liste von 50 tags steht + für den markierten Text; cl (= core library) kennzeichnet die Auswahl von 24 häufig gebrauchten tags. Die auf die deutsche Benennung folgende Ziffer gibt den Gliederungspunkt der Regeln (und der Introduction) an, unter dem Näheres ausgeführt ist.

1. Alphabetisch nach deutschen Bezeichnungen:

Abkürzung (11.10) <abbr expan='?'>+</abbr> cl

Absatz eines Prosatextes (4.1) <p>+</p> cl

Abteilung 1. Stufe (4.1, 4.5) <div1 id='?' n='?' type='?'>+</div1>

Abteilung 2. Stufe (4.1, 4.5) <div2 id='?' n='?' type='?'>+</div2> cl

Abteilung 3. Stufe (4.1, 4.5) <div3 id='?' n='?' type='?'>+</div3> cl

Angeführter Text (6,2) <q>+</q> cl

Anhang (19.1) <back><div type='?'>+</div></back>

Anmerkung der Ausgabe (7) <note>+</note> cl

Bemerkung des Bearbeiters (7.5) <note resp='transcriber'>+</note> cl

Bevölkerung, Sprache (Name) (11.2) <name type='nation'>+</name> cl

Bevölkerung, Sprache (Referenz) (11.4) <rs type='nation' n='?'>+</rs>

Bibliographische Angaben (13) <bibl>+</bibl> cl

Bühnenanweisung, Dramatis personae (4.8) <stage>+</stage>

Datum (11.9) <date value='yyyy-mm-dd'>+</date> cl

Direkte Rede (4.8) <sp who='?'>+</sp> cl

Fehlerhafter Text übernommen (9.9) <sic corr='?'>+</sic>]

Fremde Sprache übernommen (6.2, 10.1) <foreign lang='?'>+</foreign> cl

Haupttext (4.1) <body>+</body>

Illustration (15.1) <figure><head>+</head> <figdesc>+</figdesc></figure>

Inhaltsresümee (4.1) <argument>+</argument>

Institution (Name) (11.2) <name type='org'>+</name> cl

Institution (Referenz) (11.4) <rs type='org' n='?'>+</rs>

Korrektur durch Texterfasser (9.9) <corr sic='?' resp='transcriber'>+</corr>

Korrektur gemäß Errata-Liste (9.8) <corr sic='?' resp='printer'>+</corr>

Literarischer Fachausdruck (11.8) <term type='literary'>+</term>

Motto (4.1) <epigraph>+</epigraph>

Mythologisches (Name) (11.2) <name type='myth'>+</name> cl

Mythologisches (Referenz) (11.4) <rs type='myth' n='?'>+</rs>

Originalform / Standardform (9.3) <orig reg='?'>+</orig> cl

Ort, Gebiet, Berg, Gewässer (Name) (11.2) <name type='place'>+</name> cl

Ort, Gebiet, Berg, Gewässer (Referenz) (11.4) <rs type='place' n='?'>+</rs>

Person (Name) (11.2) <name type='person'>+</name> cl

Person (Referenz) (11.4) <rs type='person' n='?'>+</rs>

Religiöses (Name) (11.2) <name type='religion'>+</name> cl

Religiöses (Referenz) (11.4) <rs type='religion' n='?'>+</rs>

Schlußformel (4.1) <trailer>+</trailer> cl

Segment (6.4) <seg>+</seg>

Seitenwechsel (5) <pb id='?' n='?'/> cl

Standardform / Variante (9.2) <reg orig='?'>+</reg> cl

Text der ganzen Ausgabe (4.1) <text>+</text>

Textgruppe (z.B. mehrbänd. Ausg.) (4.1) <group>+</group>

Titelseite (19.2) <titlePage><titlePart>+</titlePart></titlePage>

Übergehung (10.1, 14, 17) <gap desc='?' resp='sampling'/>

Überschrift (4.1) <head>+</head> cl

Unsicher entziffert (10.1) <unclear reason='?'>+</unclear>

Vers vereinzelt (4.4) <l>+</l>

Verse fortlaufend, Strophe (4.3) <lg><l>+</l></lg> cl

Vorspann (Präliminarien) (19) <front><div type='?'>+</div></front>

Vorspann einer Abteilung (4.6) <opener>+</opener>

Zitat (6.2) <cit><bibl>+</bibl> <q>+</q></cit> cl

2. Alphabetisch nach Zeichenfolge der tags:

Abkürzung (11.10) <abbr expan='?'>+</abbr> cl

Inhaltsresümee (4.1) <argument>+</argument>

Anhang (19.1) <back><div type='?'>+</div></back>

Bibliographische Angaben (13) <bibl>+</bibl> cl

Haupttext (4.1) <body>+</body>

Zitat (6.2) <cit><bibl>+</bibl> <q>+</q></cit> cl

Korrektur durch Texterfasser (9.9) <corr sic='?' resp='transcriber'>+</corr>

Korrektur gemäß Errata-Liste (9.8) <corr sic='?' resp='printer'>+</corr>

Datum (11.9) <date value='yyyy-mm-dd'>+</date> cl

Abteilung 1. Stufe (4.1, 4.5) <div1 id='?' n='?' type='?'>+</div1>

Abteilung 2. Stufe (4.1, 4.5) <div2 id='?' n='?' type='?'>+</div2> cl

Abteilung 3. Stufe (4.1, 4.5) <div3 id='?' n='?' type='?'>+</div3> cl

Motto (4.1) <epigraph>+</epigraph>

Illustration (15.1) <figure><head>+</head> <figdesc>+</figdesc></figure>

Fremde Sprache übernommen (6.2, 10.1) <foreign lang='?'>+</foreign> cl

Vorspann (Präliminarien) (19) <front><div type='?'>+</div></front>

Übergehung (10.1, 14, 17) <gap desc='?' resp='sampling'/>

Textgruppe (z.B. mehrbänd. Ausg.) (4.1) <group>+</group>

Überschrift (4.1) <head>+</head> cl

Vers vereinzelt (4.4) <l>+</l>

Verse fortlaufend, Strophe (4.3) <lg><l>+</l></lg> cl

Mythologisches (Name) (11.2) <name type='myth'>+</name> cl

Bevölkerung, Sprache (Name) (11.2) <name type='nation'>+</name> cl

Institution (Name) (11.2) <name type='org'>+</name> cl

Person (Name) (11.2) <name type='person'>+</name> cl

Ort, Gebiet, Berg, Gewässer (Name) (11.2) <name type='place'>+</name> cl

Religiöses (Name) (11.2) <name type='religion'>+</name> cl

Anmerkung der Ausgabe (7) <note>+</note> cl

Bemerkung des Bearbeiters (7.5) <note resp='transcriber'>+</note> cl

Vorspann einer Abteilung (4.6) <opener>+</opener>

Originalform / Standardform (9.3) <orig reg='?'>+</orig> cl

Absatz eines Prosatextes (4.1) <p>+</p> cl

Seitenwechsel (5) <pb id='?' n='?'/> cl

Angeführter Text (6.2) <q>+</q> cl

Standardform / Variante (9.2) <reg orig='?'>+</reg> cl

Bevölkerung, Sprache (Referenz) (11.4) <rs type='nation' n='?'>+</rs>

Institution (Referenz) (11.4) <rs type='org' n='?'>+</rs>

Mythologisches (Referenz) (11.4) <rs type='myth' n='?'>+</rs>

Person (Referenz) (11.4) <rs type='person' n='?'>+</rs>

Ort, Gebiet, Berg, Gewässer (Referenz) (11.4)<rs type='place' n='?'>+</rs>

Religiöses (Referenz) (11.4) <rs type='religion' n='?'>+</rs>

Segment (6.4) <seg>+</seg>

Fehlerhafter Text übernommen (9.9) <sic corr='?'>+</sic>]

Direkte Rede (4.8) <sp who='?'>+</sp> cl

Bühnenanweisung, Dramatis personae (4.8) <stage>+</stage>

Literarischer Fachausdruck (11.8) <term type='literary'>+</term>

Text der ganzen Ausgabe (4.1) <text>+</text>

Titelseite (19.2) <titlePage><titlePart>+</titlePart></titlePage>

Schlußformel (4.1) <trailer>+</trailer> cl

Unsicher entziffert (10.1) <unclear reason='?'>+</unclear>

3. Systematisch nach Gliederungspunkten der Introduction:

Text der ganzen Ausgabe (4.1) <text>+</text>

Textgruppe (z.B. mehrbänd. Ausg.) (4.1) <group>+</group>

Haupttext (4.1) <body>+</body>

Abteilung 1. Stufe (4.1, 4.5) <div1 id='?' n='?' type='?'>+</div1>

Abteilung 2. Stufe (4.1, 4.5) <div2 id='?' n='?' type='?'>+</div2> cl

Abteilung 3. Stufe (4.1, 4.5) <div3 id='?' n='?' type='?'>+</div3> cl

Überschrift (4.1) <head>+</head> cl

Motto (4.1) <epigraph>+</epigraph>

Inhaltsresümee (4.1) <argument>+</argument>

Schlußformel (4.1) <trailer>+</trailer> cl

Absatz eines Prosatextes (4.1) <p>+</p> cl

Verse fortlaufend, Strophe (4.3) <lg><l>+</l></lg> cl

Vers vereinzelt (4.4) <l>+</l>

Vorspann einer Abteilung (4.6) <opener>+</opener>

Direkte Rede (4.8) <sp who='?'>+</sp> cl

Bühnenanweisung, Dramatis personae (4.8) <stage>+</stage>

Seitenwechsel (5) <pb id='?' n='?'/> cl

Fremde Sprache übernommen (6.2, 10.1) <foreign lang='?'>+</foreign> cl

Angeführter Text (6.2) <q>+</q> cl

Zitat (6.2) <cit><bibl>+</bibl> <q>+</q></cit> cl

Segment (6.4) <seg>+</seg>

Anmerkung der Ausgabe (7) <note>+</note> cl

Bemerkung des Bearbeiters (7.5) <note resp='transcriber'>+</note> cl

Standardform / Variante (9.2) <reg orig='?'>+</reg> cl

Originalform / Standardform (9.3) <orig reg='?'>+</orig> cl

Korrektur durch Texterfasser (9.9) <corr sic='?' resp='transcriber'>+</corr>

Korrektur gemäß Errata-Liste (9.8) <corr sic='?' resp='printer'>+</corr>

Fehlerhafter Text übernommen (9.9) <sic corr='?'>+</sic>]

Übergehung (10.1, 14, 17) <gap desc='?' resp='sampling'/>

Unsicher entziffert (10.1) <unclear reason='?'>+</unclear>

Mythologisches (Name) (11.2) <name type='myth'>+</name> cl

Religiöses (Name) (11.2) <name type='religion'>+</name> cl

Person (Name) (11.2) <name type='person'>+</name> cl

Institution (Name) (11.2) <name type='org'>+</name> cl

Bevölkerung, Sprache (Name) (11.2) <name type='nation'>+</name> cl

Ort, Gebiet, Berg, Gewässer (Name) (11.2) <name type='place'>+</name> cl

Mythologisches (Referenz) (11.4) <rs type='myth' n='?'>+</rs>

Religiöses (Referenz) (11.4) <rs type='religion' n='?'>+</rs>

Person (Referenz) (11.4) <rs type='person' n='?'>+</rs>

Institution (Referenz) (11.4) <rs type='org' n='?'>+</rs>

Bevölkerung, Sprache (Referenz) (11.4) <rs type='nation' n='?'>+</rs>

Ort, Gebiet, Berg, Gewässer (Referenz) (11.4)<rs type='place' n='?'>+</rs>

Literarischer Fachausdruck (11.8) <term type='literary'>+</term>

Datum (11.9) <date value='yyyy-mm-dd'>+</date> cl

Abkürzung (11.10) <abbr expan='?'>+</abbr> cl

Bibliographische Angaben (13) <bibl>+</bibl> cl

Illustration (15.1) <figure><head>+</head> <figdesc>+</figdesc></figure>

Vorspann (Präliminarien) (19) <front><div type='?'>+</div></front>

Anhang (19) <back><div type='?'>+</div></back>

Titelseite (19.2) <titlePage><titlePart>+</titlePart></titlePage>

 

(20.02.2001; zuletzt geändert am 15.01.2010)