Wie man Dokumente mit Transkribus transkribiert - Einführung

Wie man Dokumente mit Transkribus transkribiert - Einführung

Grundlegende Übersicht
Transkribus Expert Client
Letzte Aktualisierung Vor 3 Wochen
Über Transkribus

Transkribus ist eine umfassende Lösung für die Digitalisierung, KI-gestützte Texterkennung, Transkription und Suche von historischen Dokumenten. Erfahren Sie mehr über Transkribus hier erläutert

Transkribus ist eine umfassende Lösung für die Digitalisierung, KI-gestützte Texterkennung, Transkription und Suche von historischen Dokumenten. Erfahren Sie mehr über Transkribus hier erläutert

Inhaltsverzeichnis

Inhaltsverzeichnis

Diese Anleitung erklärt, wie man mit Transkribus Dokumente transkribiert

  • zum Trainieren von Handwritten-Text-Recognition-Technologie
  • für wissenschaftliche Editionen

Wenn Sie sich einen allgemeinen Überblick verschaffen wollen, gehen Sie zu unserer 10-Schritte-Anleitung.

Transkribus ist eine Plattform für die automatische Erkennung, Transkription und Suche von historischen Dokumenten, die auf der Technologie der Handschriftenerkennung (HTR) basiert.

Mit Transkribus erstellte Transkripte können:

  • verwendet werden, um ein neuronales Netzwerk ("Modell") zu trainieren, das in der Lage ist, gedruckte oder handschriftliche Dokumente automatisch zu erkennen.
  • angereichert und mit Tags versehen werden, um als Grundlage für digitale Editionen von Dokumenten zu dienen.

Diese Einführung ermöglicht es Ihnen, entweder schnell Trainingsdaten für die automatische Erkennung Ihrer spezifischen Dokumente zu erstellen oder eine Transkription für eine wissenschaftliche Edition zu erstellen.

Wenn Sie bereits über transkribierte Dokumente verfügen und diese als Trainingsdaten für HTR verwenden möchten, konsultieren Sie bitte unsere Anleitung zur Verwendung vorhandener Transkriptionen .

Einführung

Diese Anleitung erklärt den Prozess der Transkription von Dokumenten in Transkribus.

Die Transkripte können verwendet werden:

  • als Trainingsdaten für ein Handwritten Text Recognition (HTR) Modell (HTR+), das in der Lage ist, Ihre Dokumente automatisch zu transkribieren.
  • als Basis für eine digitale wissenschaftliche Edition.

Es gibt einen einfachen dreistufigen Prozess, um ein Dokument in Transkribus zu transkribieren:

Schritt 1: Hochladen

  • Laden Sie Ihre Dokumente auf die Transkribus-Plattform hoch.

Schritt 2: Segmentierung

  • Wenden Sie das Tool zur automatischen Segmentierung an, um Baselines für Ihr Dokument zu erstellen.

Schritt 3: Transkription

  • Transkribieren Sie den Text in den segmentierten Zeilen.

Diese Form der einfachen Transkription ist für das Training der HTR-Technologie ausreichend. Hinweis: HTR kann sowohl mit handschriftlichen als auch mit gedruckten Dokumenten arbeiten. Die Effizienz eines Modells hängt von der Qualität des Trainingsmaterials (Ihrer manuellen Transkription), der Qualität der Bilder und davon, wie ordentlich oder unordentlich die Schrift ist ab.

Es gibt auch erweiterte Transkriptionsoptionen für diejenigen, die an wissenschaftlichen Editionen arbeiten. Sie können die Lesereihenfolge des Textes anpassen, historische Zeichen verwenden, Tags und Metadaten hinzufügen, Abkürzungen erweitern und mehr.

Dokumente auf Transkribus hochladen

  • Um die notwendigen Tools auf Ihre Dokumente anwenden zu können, müssen diese auf dem Transkribus-Server liegen. Das bedeutet, dass Sie sie auf Transkribus hochladen müssen.
    • Hinweis: Alle Sammlungen und Dokumente in Transkribus sind privat. Nur von Ihnen autorisierte Benutzer*innen können Ihre Dokumente sehen. Sie werden nicht der Öffentlichkeit zugänglich gemacht.
  • Zum Hochladen klicken Sie im Hauptmenü auf die Schaltfläche "Import Documents".

Abbildung 1 Dateien in Ihre persönliche Sammlung laden

Abbildung 2 Wählen Sie "Upload single document" für Dokumente bis zu 500 MB

  • Sie haben vier Möglichkeiten, Dokumente hochzuladen:
    • Einzeldokument hochladen aus einem lokalen Ordner:
      • Mit dieser Option können Sie Dokumente bis zu 500 MB hochladen.
      • Wählen Sie für diese Option "Upload Single Document".
      • Bitte stellen Sie sicher, dass sich die hochzuladenden Dateien in einem extra Ordner befinden. Bei der Auswahl der Dateien für den Upload werden Sie die Dateien im Ordner nicht sehen können. Das ist in diesem Fall normal. Markieren Sie einfach den Ordner und bestätigen Sie mit "OK".
    • Hochladen über FTP
      • Diese Option bietet sich an, wenn Sie mehrere große Dokumente hochladen möchten.
      • Sie können sowohl Bilddateien als auch PDF-Dokumente mit dieser Option hochladen.
      • Bitte stellen Sie sicher, dass sich die PDF-Dateien beim FTP-Upload nicht in einem Ordner befinden.
    • Hochladen über URL von DFG-Viewer METS
      • Damit können Sie Dokumente direkt aus Repositorien hochladen, die den DFG (Deutsche Forschungsgemeinschaft) Viewer unterstützen.
    • Bilder aus PDF extrahieren und hochladen
      • Diese Option ist für Bilder geeignet, die Sie hochladen möchten und sich in einem PDF-Dokument befinden.
      • Wenn die PDF-Dokumente sehr groß sind, verwenden Sie bitte den FTP-Upload.
      • Auch wenn Sie JP2000-Bilder in Ihren PDFs haben, ist es sinnvoll, die FTP-Option zu wählen.

 

  • Hinzufügen von Seiten zu einem bereits bestehenden Dokument in Transkribus:
    • Laden Sie das Dokument, dem Sie Seiten hinzufügen möchten, in Transkribus.
    • Öffnen Sie den Dokumentenmanager.
    • Wählen Sie das Dokument erneut aus, indem Sie im "Document Manager"-Fenster auf seinen Namen klicken.
    • Klicken Sie auf das grüne Kreissymbol neben "Add new page(s)".
    • Suchen Sie die neuen Seiten über das Verzeichnis und fügen Sie sie hinzu.
  • Dokumente aus Ihrer Sammlung löschen:
    • Wählen Sie das Dokument in der Collection-Übersicht im "Server"-Register aus.
    • Klicken Sie auf das Ordnersymbol mit dem kleinen roten Kreis "Delete the selected documents from Transkribus".
    • Das/die gelöschte(n) Dokument(e) verbleiben für zwei Wochen im Papierkorb (Symbol "contains deleted documents"). Wenn Sie ein Dokument versehentlich gelöscht haben, können Sie sich an uns wenden (info@readcoop.eu) und wir können das Dokument innerhalb dieser zwei Wochen reaktivieren. Danach wird das Dokument endgültig gelöscht.

Segmentierung - Layout-Analyse

  • Sobald Sie Ihre Dokumente in Transkribus hochgeladen haben, können Sie mit der Segmentierung beginnen.
  • Um Ihre Dokumente in Transkribus transkribieren zu können, müssen diese in Textregionen, Zeilen und Baselines segmentiert werden.
  • Damit die HTR funktionieren kann, müssen Text und Bild verbunden werden..
  • Alle segmentierten Elemente, wie z. B. Printspace, Textregion, Zeilenregion oder Baseline, werden mit ihren Koordinaten in der PAGE-Datei gespeichert.

Ansichtsprofile

  • Zur Unterstützung bei der Segmentierung und Transkription stehen Ansichtsprofile zur Verfügung.
  • Sie können wählen zwischen der Anzeige von Profilen für "Segmentierung" und "Transkription", indem Sie im Hauptmenü auf die Schaltfläche "Profiles" klicken.
  • Im Profil "Segmentation" werden die Baselines rot dargestellt, sodass Fehler, die durch die automatische Segmentierung entstehen, leichter zu erkennen sind.
  • Im Profil "Transcription" wird das Texteditor-Feld angezeigt, mit dem Sie Ihr Dokument transkribieren können.
  • Natürlich können Sie einfach das "default"-Profil verwenden, um beide Aufgaben zu erfüllen.

Abbildung 3 Ansichtsprofile für Segmentierungs- und Transkriptionsaufgaben

Automatisches Erkennen von Textregionen, Zeilen und Baselines

  • Wählen Sie im Hauptmenü das Ansichtsprofil "Segmentierung".
  • Wählen Sie auf der linken Seite des Bildschirms die Registerkarte "Tools" und gehen Sie zum Abschnitt "Layout Analysis".
  • Wählen Sie unter "Method:" "CITlab Advanced" (bereits ausgewählt).
  • Wählen Sie aus, ob Sie die Layoutanalyse nur für die aktuelle Seite, für einzelne Seiten oder für das gesamte Dokument durchführen möchten.
  • Stellen Sie sicher, dass "Find Text Regions" ausgewählt ist.
  • Klicken Sie auf die Schaltfläche "Run".

Abbildung 4 Automatische Segmentierung im Register "Tools" durchführen

  • Wenn Sie die Textregionen von Hand einzeichnen und dann in diesen Regionen nach den Baselines suchen möchten, deaktivieren Sie die Option "Find Text Regions", bevor Sie die Layoutanalyse starten. Wie Sie Textregionen einzeichnen, wird weiter unten im Text erklärt.

Korrigieren der Ergebnisse der automatischen Segmentierung

  • Hinweis: Wenn Sie ein HTR-Modell trainieren, muss die Position der Textregionen nicht ganz exakt sein und die Lesereihenfolge des Textes ist nicht relevant.
  • Wenn Sie an einer wissenschaftlichen Edition arbeiten, bei der ein höherer Grad an Genauigkeit erforderlich ist, ist es möglich, den Text manuell zu korrigieren, wie in den unten stehenden Beispielen.
  • Alle Werkzeuge für Korrekturen an der Layoutanalyse finden Sie im "Canvas"-Menü links neben dem Bild. Sie können ihre Funktion überprüfen, indem Sie mit dem Mauszeiger über das Symbol fahren.

Eine Zeile wurde vergessen oder versehentlich hinzugefügt

Abbildung 5 Hinzufügen einer Zeile zu einer bestehenden Textregion

  • Im obigen Beispiel wurde die erste Zeile vom Programm übersehen. Wenn Sie sie in die vorhandene Textregion einfügen möchten,
    • klicken Sie in die Region, sodass sie hervorgehoben wird.
    • verschieben Sie den Rand der Textregion nach Bedarf.

Eine Randnotiz muss in eine separate Textregion aufgeteilt werden

Abbildung 6 Aufteilen einer Textregion

  • Wenn Sie eine Region in zwei Regionen aufteilen müssen, können Sie dies mit den Schaltflächen im Menü "Canvas" tun.
  • Wie in Abbildung 6 gezeigt, teilt die "H-Taste" eine Textregion horizontal auf.
  • Mit der Schaltfläche "V" wird eine Textregion vertikal geteilt.
  • Mit der "L-Taste" können Sie eine Textregion mit einer einstellbaren Linie aufteilen.

Entfernen einer nicht benötigten Region

Abbildung 7 Region entfernen

    • Im obigen Beispiel überschneiden sich zwei Regionen, sodass eine davon gelöscht werden kann.
    • Klicken Sie auf die Textregion, die Sie löschen möchten, und klicken Sie auf die rote Schaltfläche "Remove a shape".

Zwei Regionen zusammenführen

  • Manchmal erzeugt das Programm zwei Textregionen, wo nur eine benötigt wird. In diesem Fall können Sie die beiden einfach zusammenführen.
    • Halten Sie die Taste "STRG" auf Ihrer Tastatur gedrückt und klicken Sie auf beide Textregionen.
    • Klicken Sie im Canvas-Menü auf die Schaltfläche "Merge the selected shapes".

Abbildung 8 Zwei Textregionen zusammenführen

Baselines korrigieren

  • Natürlich ist es auch möglich, die Baselines in Ihrem Dokument zu korrigieren.
  • Wie bei den Textregionen klicken Sie auf eine Baseline und können dann entweder die Teile der Linie verschieben, eine Linie in zwei teilen oder zwei Linien zusammenführen.
  • Sie können eine Baseline auch löschen und eine von Grund auf neue Baseline zeichnen. Klicken Sie im Canvas-Menü auf die Schaltfläche "+BL". Klicken Sie einmal, um mit dem Zeichnen Ihrer Baseline zu beginnen, und doppelklicken Sie, um die Linie zu beenden.
  • Hinweis: Baselines sind für die HTR am wichtigsten; Zeilenregionen müssen nicht korrigiert werden.

Einfache Transkription - für die HTR-Ausbildung

  • Wählen Sie im Hauptmenü das "Transcription"-Ansichtsprofil .
  • Unter dem Bild sehen Sie das Texteditor-Feld: Für jede Zeile/Baseline im Bild finden Sie eine entsprechende Zeile im Texteditor. Das Bild und der Text sind auf diese Weise verbunden.

Abbildung 9 Transkribieren Sie Ihr Dokument

  • Transkribieren Sie den Text entsprechend der Sprache Ihres Ausgangsdokuments. Verwenden Sie die Zeichen Ihrer Tastatur.
  • Sie können mehr als eine Person an einem Dokument arbeiten lassen, aber sie sollten nicht gleichzeitig an derselben Seite arbeiten. Sie können anderen Transkribus-Benutzer*innen Ihre Dokumente zugänglich machen, indem Sie im Reiter "Server" auf die Schaltfläche "User Manager" klicken.

Trainieren eines HTR-Modells

  • Wenn Sie ein HTR-Modell zur Erkennung Ihrer Dokumente trainieren wollen, reicht diese einfache Transkription aus.
  • Wir empfehlen, den Trainingsprozess mit 5.000 bis 15.000 Wörtern (ca. 25-75 Seiten) transkribiertem Material zu beginnen. Wenn Sie mit gedrucktem und nicht mit handschriftlichem Text arbeiten, ist in der Regel eine geringere Menge an Trainingsdaten erforderlich.
  • Auch die Verwendung eines Basismodells kann das benötigte Trainingsmaterial reduzieren. Als Basismodell können Sie eines der öffentlich verfügbaren Modelle in Transkribus verwenden (bitte achten Sie darauf, dass die Schrift zumindest ähnlich ist wie die in Ihren Dokumenten [z.B. ähnliche Datierung, gleiche Sprache und/oder gleicher Stil]) oder eines Ihrer zuvor trainierten Modelle - sofern es gut genug ist, um als Basismodell zu dienen.

Erweiterte Transkription - für eine wissenschaftliche Edition

Lesereihenfolge

  • Nachdem ein Dokument in Textregionen, Zeilen und Baselines segmentiert wurde, müssen Sie sich eventuell Gedanken über die Lesereihenfolge des Textes machen (dies ist nicht relevant, wenn die Transkription nur als Trainingsmaterial dienen soll).
  • Viele handschriftliche Dokumente enthalten Korrekturen und Ergänzungen, die durch den*die Autor*in oder eine andere Person hinzugefügt wurden.
  • In einer wissenschaftlichen Edition sollten Sie die Lesereihenfolge beibehalten und vielleicht auch zum Ausdruck bringen, dass dieser Text eine Ergänzung war.
  • Zu diesem Zweck können alle Segmentierungselemente nach einer benutzerdefinierte Reihenfolge angeordnet werden.
  • Die Standard-Lesereihenfolge folgt der Topologie der Text- oder Zeilenregionen. Alle Formen sind nach den Koordinaten der linken oberen Ecke einer Text- oder Zeilenregion geordnet.

Abbildung 10 Lesereihenfolge der Textregionen - Zahlen können neu sortiert werden

  • Diese automatische Lesereihenfolge kann geändert werden:
    • Klicken Sie im Hauptmenü auf die Schaltfläche "item visibility", und wählen Sie dann, ob Sie die Lesereihenfolge von Textregionen, Zeilen, Baselines (oder Wörtern) anzeigen möchten.

Abbildung 11 Die Schaltfläche "item visibility" zeigt die logische Anordnung der Segmentierungselemente an

    • Wenn Sie sich dafür entscheiden, die Lesereihenfolge von Textregionen oder Zeilen anzuzeigen, werden Zahlen im Bild Ihres Dokuments angezeigt.
    • Durch Klicken auf eine der Zahlen, die die Lesereihenfolge markieren, ist es möglich, eine neue Zahl einzugeben und die Lesereihenfolge entsprechend zu ändern. Das Gleiche kann durch Verschieben der Segmentierungselemente im Register "Layout" erfolgen.

Abbildung 12 Bearbeiten der Lesereihenfolge durch Anklicken der Ziffer und Eingabe einer neuen Zahl

  • In Fällen, in denen die Lesereihenfolge einer Seite völlig falsch ist, ist es möglich, den Text neu anzuordnen.
    • Machen Sie die Zeilenlesereihenfolge wie oben beschrieben sichtbar.
    • Klicken Sie auf die Registerkarte "Layout" auf der linken Seite des Bildschirms.
    • Wählen Sie die Seite oder die Textregion, die Sie neu anordnen möchten.
    • Klicken Sie auf die "R"-Schaltfläche.
    • Die Lesereihenfolge wird entsprechend den Koordinaten der linken oberen Ecke einer Text- oder Zeilenregion neu geordnet. Danach sollten die Zeilen in der richtigen Reihenfolge sein.
    • Es kann zu Problemen mit der Lesereihenfolge von Zeitungsspalten und ähnlichen Dokumenten kommen. Das Programm weist z. B. eine Lesereihenfolge zu, die auf dem horizontalen Layout der Zeilen auf einer Seite basiert, anstatt die Zeilen nach Spalten zu ordnen. Um dieses Problem zu beheben, verwenden Sie die Schaltfläche "V" im Canvas-Menü, um die Textregion auf der Seite in separate Regionen für jede Spalte aufzuteilen. Sobald es für jede Spalte eine separate Textregion gibt, sollte die Lesereihenfolge automatisch aktualisiert werden und korrekt sein.

Abbildung 13 Lesereihenfolge nach Koordinaten einstellen

Lesereihenfolge: Ergänzungen zwischen den Zeilen

  • Ergänzungen zwischen den Zeilen werden häufig verwendet, um Text zu einem Dokument hinzuzufügen.
  • Um die korrekte Lesereihenfolge zu erzeugen, müssen die folgenden Schritte manuell durchgeführt werden:
    • Klicken Sie im Hauptmenü auf die Schaltfläche "item visibility".
    • Wählen Sie "Show lines reading order".

Abbildung 14 Klicken Sie auf die Schaltfläche "Shape Visibility" (Sichtbarkeit der Form) und wählen Sie dann aus, dass Baselines und die Lesereihenfolge der Zeilen angezeigt werden sollen.

    • Wählen Sie die Baseline unterhalb der Ergänzung (, wenn die Ergänzung oberhalb der Zeile liegt).
    • Teilen Sie die Zeilenregion mit der Schaltfläche "V" im Canvas-Menü genau dort, wo die Ergänzung logisch platziert werden soll.

Abbildung 15 Schaltfläche "V" anwenden, um die Zeilenregion zu teilen

  • Bearbeiten Sie die Lesereihenfolge so, dass sie korrekt ist. Klicken Sie auf die Nummer, die mit jeder Zeilenregion verbunden ist, und geben Sie dann die richtige Nummer ein.

Abbildung 16 Richtige Lesereihenfolge hinzufügen: 4 (=erster Teil der Zeile)
wird 3, 3 (=Ergänzung zwischen den Zeilen) wird 4 und 5 (=zweiter Teil der Zeile) bleibt 5.

Abbildung 17 Korrekte Lesereihenfolge nach manueller Bearbeitung

Lesereihenfolge: Ergänzungen als zusätzliche Anmerkungen

  • Ergänzungen, die erscheinen als zusätzliche Anmerkungen (z. B. an den Rändern einer Seite) sollten ähnlich wie Ergänzungen zwischen Zeilen behandelt werden.
    • Hinweis: Oft sind solche zusätzlichen Notizen (oder Marginalien) nicht Teil der Lesereihenfolge, sondern sind "Kommentare" und befinden sich als solche auf einer anderen Ebene als die primäre Lesereihenfolge.
    • Es reicht daher aus, sie im Register "Metadata" als Marginalien zu markieren. Eine Anleitung zum Markup von Text finden Sie im Kapitel Anreicherung transkribierter Dokumente mit Markup .
  • Wenn die zusätzliche Notiz jedoch wirklich eine Ergänzung zum laufenden Text ist und in der Lesereihenfolge hinzugefügt werden muss, kann dies auf folgende Weise geschehen:
    • Option 1: Der Textbereich kann so erweitert werden, dass alle Baselines der Ergänzung auch Teil der jeweiligen Textregion sind.
      • Hinweis: Sie können entweder relativ große Textregionen oder polygonale Textregionen verwenden. Wählen Sie dazu die Schaltfläche "Add point to selected shape"" aus dem Canvas-Menü.

Abbildung 18 Punkt zur ausgewählten Form hinzufügen

      • Der Bewegung des Mauszeigers folgend, können Sie der ursprünglichen Textregion Punkte hinzufügen und die Form so erweitern, dass sie auch die Ergänzung umfasst.
      • Anschließend können die zusätzlichen Zeilen/Baselines entsprechend ihrer korrekten Lesereihenfolge neu nummeriert werden.
    • Option 2: Sie können nur eine große Textregion für die gesamte Seite erzeugen und die Zeilen-/Baseline-Segmentierung manuell in der richtigen Reihenfolge vornehmen. Auf diese Weise erhalten Sie von Anfang an die richtige Lesereihenfolge.
      • Hinweis: Dies kann die beste Option sein, wenn Sie es mit einem Dokument zu tun haben, das ein komplexes Layout mit vielen Ergänzungen, Notizen und Löschungen aufweist.
    • Option 3: Sie können die zusätzliche Textregion, die die Ergänzung enthält, mit der Zeile verbinden, zu der die Ergänzung gehört. Markieren Sie dazu beide Textregionen und klicken Sie dann auf die Schaltfläche "Link two shapes" in der Registerkarte "Structural", innerhalb der Registerkarte "Metadata".
      • Hinweis: Die Verlinkung wird Teil der XML-Datei sein, wird aber derzeit in den Exportformaten nicht unterstützt.

Abbildung 19 Zwei Formen verbinden

Transkription und virtuelle Tastatur

Abbildung 20 Virtuelle Tastatur

  • Eine Transkription, die als Grundlage für eine wissenschaftliche Edition dient, sollte dem*r Benutzer*in mehr Daten explizit machen und mehr Kontextdaten anbieten als eine einfache Transkription. In diesem Fall spielt nicht nur Maschinenlesbarkeit (d. h. Trainingsdaten für die HTR-Engine), sondern auch menschliche Lesbarkeit des Textes eine wichtige Rolle.
  • Sie können Sonderzeichen und Unicode-Symbole mit dem "Virtual keyboards"-Button im Texteditor-Feld hinzufügen.
  • Mit der Schaltfläche "Edit..." ist es möglich, Abkürzungen für häufig verwendete Zeichen hinzuzufügen und neue Unicode-Zeichen hinzuzufügen.
  • Um einen Tastaturbefehl zu erstellen, müssen Sie ihn nur in die Spalte "Shortcut" eingeben.
  • Um neue Unicode-Zeichen hinzuzufügen, verwenden Sie die grüne Plustaste.
  • Im Texteditor können Sie mit "Backspace" den Text eine Zeile nach oben und mit "Strg" + "Enter" eine Zeile nach unten verschieben.

Abbildung 21 Hinzufügen von Unicode-Zeichen und Tastenkombinationen

Diakritische Zeichen und Ligaturen

  • Die korrekte Transkription von Diakritika und Ligaturen erfordert einiges an Fachwissen. Es gibt zwei Hauptoptionen für die Handhabung der korrekten Transkription dieser Zeichen:
  • Option 1: Leichte Normalisierung laut Wörterbuch
    • Die Hauptregel, die hier anzuwenden ist, ist die folgende: Solange Sie das Basiszeichen einer Glyphe deutlich sehen können und solange das Basiszeichen auch dasjenige ist, das im Wörterbuch verwendet wird, um diese Glyphe auszudrücken, halten Sie sich an das Basiszeichen.
    • Beispiel 1: LATEINISCHER KLEINBUCHSTABE Y erscheint in vielen Dokumenten mit einem zusätzlichen diakritischen Zeichen, das auf die Herkunft dieses Zeichens von ii oder ij hinweist. Daher finden Sie zwei Punkte oder etwas ähnlich aussehendes über dem "y".

Abbildung 22 Deutsche Kurrentschrift: "bey". Hinweis: y wird als LATEINISCHER KLEINBUCHSTABE Y geschrieben, da das Basiszeichen noch deutlich sichtbar ist

    • In einfachen Abschriften werden Sie dies als LATEINISCHER KLEINBUCHSTABE Y transkribieren, da das Basiszeichen deutlich sichtbar ist.
    • Beispiel 2: LATEINISCHER KLEINBUCHSTABE S wird in den meisten europäischen historischen Schriften mit zwei Graphemen ausgedrückt. Es besteht also ein klarer Unterschied zwischen LATEINISCHER KLEINBUCHSTABE S und LATEINISCHER KLEINBUCHSTABE LANG-S.

Abbildung 23 "Thatbestand." vs. "Kammergerichts": LATEINISCHER KLEINBUCHSTABE LANG-S vs. LATEINISCHER KLEINBUCHSTABE S

    • Aber obwohl es eine klare Unterscheidung gibt, würde in einer einfachen Transkription in beiden Fällen LATEINISCHER KLEINBUCHSTABE S verwendet werden.
  • Option 2: Paläographische Transkription
    • Philolog*innen oder Paläograph*innen sind nicht nur an einer korrekten Transkription interessiert, sondern auch am historischen Erscheinungsbild und an der Entwicklung der Grapheme. Daher könnte es auch interessant sein, die obigen Beispiele mit voller Unterstützung des Unicode-Zeichensatzes oder sogar mit Hilfe der "Private Area" von Unicode zu transkribieren.

Abbildung 24 Paläographische Transkription: Thatbeſtand vs. Kammergerichts

    • Hinweis: Bitte beachten Sie, dass dies eine wichtige Entscheidung ist, die die Verwendbarkeit des Textes in vielerlei Hinsicht beeinträchtigen wird. Wenn Sie sich für eine paläografische Transkription entscheiden, verursacht dies viel mehr Arbeit als bei einer leicht normalisierten Transkription.
  • Hinweis: In gedruckten Texten (, die auch in Transkribus transkribiert werden können) kann die Transkription von Ligaturen eine Rolle spielen. Auch hier kann die gleiche Regel angewendet werden: Obwohl bestimmte Buchstabenkombinationen, wie z. B. "ft", mit einem bestimmten Graphem ausgedrückt werden, bei dem zwei Grapheme zusammengefügt werden, und obwohl solche Ligaturen auch mit bestimmten Unicode-Buchstaben ausgedrückt werden können, empfehlen wir, sie gemäß dem Wörterbuch zu transkribieren.

Satzzeichen

  • Satzzeichen werden auf die gleiche Weise transkribiert wie Zeichen. Verwenden Sie das entsprechende Zeichen auf Ihrer Tastatur, normalisieren Sie diese nicht und fügen Sie keine Satzzeichen hinzu. Typische Satzzeichen sind:
    • moderne Zeichen wie Punkt, Komma, Strichpunkt, Doppelpunkt: “.”, “,”, “;”:”
    • historische Zeichen wie Virgeln (Schrägstrich) oder Zeilenfüller usw.
    • Hinweis: Doppelpunkte werden in historischen Texten oft verwendet, um abgekürzte Wörter zu markieren. Diese sollten mit einem Doppelpunkt transkribiert werden.
  • Im Gegensatz zu vielen Transkriptionsregeln, bei denen Satzzeichen nach modernem Verständnis hinzugefügt und weggelassen werden, empfehlen wir, sich an die Originalsatzzeichen zu halten.
  • Wenn Sie Satzzeichen hinzufügen möchten, die im Originaldokument nicht vorkommen, können Sie im Register "Metadata" auf der Registerkarte "Tagging" den Tag "supplied" verwenden, um anzugeben, dass das Satzzeichen von Ihnen selbst hinzugefügt wurde.

Arbeiten im Team - Hinzufügen anderer Benutzer*innen zu Ihrer Sammlung

In Transkribus ist es auch möglich, Sammlungen und Dokumente gemeinsam mit anderen Transkribus-Nutzer*innen zu bearbeiten. Über den "User Manager", den Sie im "Server Tab" finden, können Sie andere Personen zu Ihrer Sammlung hinzufügen. Zuerst müssen Sie den*die andere*n Benutzer*in über E-Mail oder Name unten rechts suchen, dann die rechte Zeile oben auswählen, dann unten links "Add user" wählen und schließlich die mit der Benutzerrolle verbundenen Berechtigungen hinzufügen. In der folgenden Abbildung können Sie die Rechte der einzelnen Benutzerrollen überprüfen:

Abbildung 25 Benutzerrollen

Referenzen

Um einen Überblick über die Schriftsysteme von Unicode zu erhalten: http://www.unicode.org/charts/

Für historische Transkriptionen sind die folgenden Erweiterungen von Interesse:

Lateinisch, erweitert B: http://www.unicode.org/charts/PDF/U0180.pdf

  • Enthält z. B.:
    • Außereuropäisches und historisches Latein
    • Phonetische und historische Buchstaben
    • Zusätze für Slowenisch und Kroatisch
    • usw.

Lateinisch, erweitert C: http://www.unicode.org/charts/PDF/U2C60.pdf

  • Enthält z. B.:
    • Orthographische lateinische Ergänzungen
    • usw.

Lateinisch, erweitert D: http://www.unicode.org/charts/PDF/UA720.pdf

  • Enthält z. B.:
    • Mediävistische Ergänzungen
    • Insulare und keltische Buchstaben
    • Altrömische epigraphische Buchstaben
    • usw.

MUFI (Medieval Unicode Font Initiative)

Danksagung

Wir möchten uns bei den vielen Anwender*innen bedanken, die mit ihrem Feedback zur Verbesserung der Transkribus-Software beigetragen haben.