>

Tag Ausbildung

Tag Ausbildung

Das Tag-Training ist eine Option für das normale Texttraining, um annotierte Tags und Eigenschaften in das Training einzubeziehen. Das trainierte Modell wird dann die trainierten Tags bei der Erkennung berücksichtigen. Bitte beachten Sie, dass es nicht möglich ist, eine Texterkennung ohne Tag-Erkennung oder nur eine Erkennung der Tags im Nachhinein durchzuführen. Sie müssten also ein zusätzliches Modell für die reine Texterkennung trainieren. Dies liegt an der Art und Weise, wie die Tags trainiert werden. Tags und Attribute werden im Text kodiert. So lernt das Modell neben den Zeichen im Bild auch einige Metadaten dazu. Aus diesem Grund funktioniert diese Methode am besten, wenn die Anzahl der verwendeten Eigenschaften auf ein oder zwei beschränkt ist - aber es bleibt Raum für eigene Experimente. Einer der Hauptanwendungsfälle ist das Trainieren von Abkürzungen und deren Erweiterung. Auch Textstile können recht gut gelernt werden. Für andere Tags wie Personen, Orte usw. ist der Nutzen unserer Meinung nach begrenzt. Es kann zwar die annotierten Personen lernen, wird aber andere Personen oder Orte, die nicht in der Trainingsmenge enthalten waren, nicht kennen und erkennen. Für diesen Zweck ist die "Named Entity Recognition" (NER) viel nützlicher. Die gute Nachricht ist, dass NER in Zukunft als separates Tool verfügbar sein wird. Den Nutzen des Tag-Trainings können Sie am besten selbst ausprobieren.

  • Das funktioniert folgendermaßen:
    • Wählen Sie "Tags trainieren", um Tags in das Training einzubeziehen. Mit der Plus-Schaltfläche auf der rechten Seite werden die Tags ausgewählt, die einbezogen werden sollen.
    • Wählen Sie "Eigenschaften einbeziehen", um die Eigenschaften in das Training aufzunehmen. Wenn also für eine Person Vor- und Nachname festgelegt sind, lernt das Modell auch dies. Ist dies nicht der Fall, wird die Erkennung nur sagen, dass es sich um eine Person handelt, aber den Namen nicht kennen. Wie bereits oben erwähnt, wird die Erkennung wahrscheinlich nicht sehr gut sein, wenn viele Eigenschaften zugewiesen wurden.
    • Bitte beschreiben Sie die trainierten Tags in der Modellbeschreibung, so dass dies bei der Auswahl des Modells ersichtlich ist. Diese Informationen können zur Zeit nicht automatisch ausgelesen und hinzugefügt werden.

Bitte probieren Sie die Funktion aus und teilen Sie uns Ihre Erfahrungen mit.

Starten Sie mit Transkribus

Machen Sie Ihre historischen Dokumente zugänglich