×

Text2Image

Die Text2Image (Text-to-Image) Werkzeug versucht vorhandene Transkriptionen auf Seitenebene mit einer Zeilensegmentierung abgleichen.
Derzeit müssen Sie einen 2-stufigen Ansatz mit dem Expert Client von Transkribus verfolgen:

1Hochladen von Textdateien:
Vorhandene Transkriptionen können derzeit beim Hochladen des Dokuments als separate txt-Dateien in einem Unterordner namens 'txt' angegeben werden. Beachten Sie, dass jede txt-Datei den gleichen Basisnamen wie die entsprechende Bilddatei haben muss.
Diese Transkriptionen werden dann in "Dummy-Zeilen" gespeichert, d.h. Zeilen mit der Größe des Bildes.
Um Textdateien für bestehende Dokumente hochzuladen, wählen Sie im Experten-Client "Menü -> Dokument -> Lokale Textdateien mit Dokument synchronisieren...".

2 - Starten Sie den Abgleichprozess:
Um Text2Image im Expert Client zu verwenden, gehen Sie zu "Werkzeuge -> Andere Werkzeuge -> Text2Image...". Das Dialogfeld bietet die folgenden Optionen:

  • BasismodellDer daraus resultierende Text wird dann mit dem Eingabetext verglichen, um eine Übereinstimmung zu finden.
  • Layout-Analyse durchführen: ob vor dem HTR eine Basislinienerkennung durchgeführt werden soll (wenn nicht ausgewählt, werden die vorhandenen Basislinien verwendet)
  • Ungepaarte Linien beibehaltenob der Text aus den Zeilen des HTR, die nicht abgeglichen werden konnten, beibehalten werden soll
  • Zeilenanordnung beibehaltenob die Zeilenreihenfolge des Eingabetextes beim Abgleich beibehalten werden soll
  • Ähnlichkeits-Tag schreibenob ein Ähnlichkeits-Tag mit einem Genauigkeitswert in das benutzerdefinierte Tag jeder übereinstimmenden Zeile geschrieben werden soll
  • Regionale SchwelleSchwellenwert für blockbasiertes Matching (zwischen 0 und 1) - in einem ersten Schritt wird der gesamte Text einer Seite anhand dieses Schwellenwerts einer Region zugeordnet - setzen Sie diesen Wert auf 0, um zu versuchen, den eingegebenen Text jeder Region zuzuordnen (was zu höheren Rechenkosten führt)
  • Schwellenwert der LinieSchwellenwert für den Zeilenabgleich (zwischen 0 und 1) - nachdem der Text einer Region zugeordnet wurde, werden die Eingabezeilen mit Hilfe dieses Schwellenwerts an die Zeilen dieser Region angepasst - 0,45 ist in der Regel ein guter Wert für längere Zeilen, für kürzere Zeilen sollten Sie einen höheren Wert verwenden, z. B. 0,7 oder sogar 0,9, um eine bessere Übereinstimmung zu erzielen