>

Baseline

Baseline

Die Baseline ist der wichtigste Referenzpunkt für die Texterkennung und beschreibt eine Polylinie, die entlang der Unterseite der handschriftlichen Textzeile verläuft. Die Segmentierung eines Textes in Linien und Grundlinien kann mit Hilfe von CITlab Advanced LA automatisch durchgeführt werden. Bei komplexen Layouts kann es jedoch vorkommen, dass Sie einige manuelle Korrekturen vornehmen müssen. Die Grundlinie sollte am unteren Rand der Textzeile verlaufen, die Buchstaben sollten auf ihr sitzen und die Unterlängen darunter liegen. Die Grundlinie besteht aus einzelnen Punkten, die Sie beim manuellen Einfügen selbst setzen; das Setzen wird mit einem Doppelklick oder Enter auf dem letzten Punkt abgeschlossen. Baselines können auch vertikal gezeichnet werden. In einem Bild und sogar in einem Textbereich können Sie auch verschiedene Linienrichtungen kombinieren (z. B. das typische "Postkartenlayout").

Wenn Sie Änderungen an Zeilen vornehmen, ist es wichtig, dass Sie dies immer an den Grundlinien tun. Das ist wichtig zu wissen, denn für jede Zeile in Ihrem Dokument gibt es auch eine Linienbereich im Hintergrund. Sie können sich diese ansehen, indem Sie sie mit der Schaltfläche Elementsichtbarkeit einblenden. Diese Zeilenbereiche dürfen nicht verändert werden, sie werden automatisch angepasst, wenn Sie etwas auf Basislinienebene ändern. Es erscheint ein Pop-up mit der Frage, ob Sie auch die übergeordnete Linie ändern möchten, bitte bestätigen Sie dies.

Hinweis: Wenn vertikale Grundlinien manuell gezeichnet werden, muss die Zeichenrichtung immer in Leserichtung sein, sonst funktioniert der HTR später nicht an diesem Baseline.

Abbildung 1 Textregionen suchen
Abbildung 2 Baselines manuell hinzufügen
Abbildung 3 Layout-Struktur
Abbildung 4 Baseline unter Textzeile

Starten Sie mit Transkribus

Machen Sie Ihre historischen Dokumente zugänglich