Das Tag-Training ermöglicht es, annotierte Tags und Eigenschaften in das normale Texttraining einzubeziehen. Das trainierte Modell wird dann die trainierten Tags bei der Erkennung berücksichtigen. Bitte beachten Sie, dass es nicht möglich ist, eine Texterkennung ohne Tag-Erkennung oder nur eine Erkennung der Tags im Nachhinein durchzuführen. Sie müssten also ein zusätzliches Modell für die reine Texterkennung trainieren. Dies liegt an der Art und Weise, wie die Tags trainiert werden. Tags und Attribute werden im Text kodiert. So lernt das Modell neben den Zeichen im Bild auch einige Metadaten dazu. Aus diesem Grund funktioniert diese Methode am besten, wenn die Anzahl der verwendeten Eigenschaften auf ein oder zwei beschränkt ist - aber es bleibt Raum für eigene Experimente. Einer der Hauptanwendungsfälle ist das Trainieren von Abkürzungen und deren Langform. Auch Textstile können recht gut gelernt werden. Für andere Tags wie Personen, Orte usw. ist der Nutzen unserer Meinung nach begrenzt. Es kann zwar die annotierten Personen lernen, wird aber andere Personen oder Orte, die nicht im Trainingsset enthalten waren, nicht kennen und erkennen. Für diesen Zweck ist die "Named Entity Recognition" (NER) viel nützlicher. Die gute Nachricht ist, dass NER in Zukunft als separates Tool verfügbar sein wird. Den Nutzen des Tag-Trainings können Sie am besten selbst testen.
- Das funktioniert folgendermaßen:
- Wählen Sie "Train tags", um Tags in das Training einzubeziehen. Mit der Plus-Schaltfläche auf der rechten Seite werden die Tags ausgewählt, die einbezogen werden sollen.
- Wählen Sie "Include Properties", um die Eigenschaften in das Training aufzunehmen. Wenn also für eine Person Vor- und Nachname festgelegt sind, lernt das Modell auch dies. Ist dies nicht der Fall, wird die Erkennung nur sagen, dass es sich um eine Person handelt, aber den Namen nicht kennen. Wie bereits oben erwähnt, wird die Erkennung wahrscheinlich nicht sehr gut sein, wenn viele Eigenschaften zugewiesen wurden.
- Bitte beschreiben Sie die trainierten Tags in der Modellbeschreibung, so dass dies bei der Auswahl des Modells ersichtlich ist. Diese Informationen können zur Zeit nicht automatisch gelesen und hinzugefügt werden.
Bitte probieren Sie die Funktion aus und teilen Sie uns Ihre Erfahrungen mit.