In dieser Anleitung erfahren Sie, wie Sie die Funktion "Handwritten Text Recognition" in Transkribus Lite nutzen können. Mit HTR können Sie automatisch Text auf Bildern erkennen und mithilfe von künstlicher Intelligenz eine Transkription des Textes erstellen.
Übersicht
Die Registerkarte "Erkennung" befindet sich auf der Collection-Seite in Transkribus Lite. Wenn Sie in der Collectionübersicht auf eine Collection klicken (mehr über die Verwaltung von Collections) öffnet sich die jeweilige Collection. Oben rechts auf der Seite sehen Sie die Registerkarte "Erkennung". Um die Erkennung zu starten, müssen Sie einen 3-stufigen Prozess durchlaufen, der in den folgenden Abschnitten erläutert wird.
Schritt 1: Auswählen des Dokuments
Als ersten Schritt müssen Sie das Dokument auswählen, für das Sie die Handschrift-Erkennung durchführen möchten. Dazu müssen Sie einfach auf das gewünschte Dokument in der Liste klicken, um es auszuwählen. Wenn Sie viele Dokumente in Ihrer Collection haben, können Sie auch die Filter verwenden, um nach dem Dokument zu suchen.
Schritt 2: Auswählen des Modells
Nachdem Sie das gewünschte Dokument ausgewählt haben, müssen Sie das HTR-Modell auswählen, das Sie für die Erkennung verwenden möchten. Es kann entweder eines der Modelle sein, die Sie selbst trainiert haben, oder eines der freien und öffentlich verfügbaren Modelle.
Alle Modelle
Unter der Registerkarte "Alle Modelle" finden Sie alle Modelle, die Sie verwenden können. Die Modelle, die Sie trainiert haben oder auf die Sie Zugriff haben, sowie die öffentlichen Modelle sind hier aufgeführt. Sie sehen den Namen, die Sprache und den Anbieter (d. h. die Erkennungs-Engine, die mit diesem Modell verwendet wird). Zusätzlich können Sie nach der ID des Modells, dem Benutzernamen des Erstellers sowie nach der Anzahl der Ground-Truth-Seiten, die zum Trainieren des Modells verwendet wurden, filtern.
Hinweis: Das Modelltraining ist in Transkribus Lite noch nicht verfügbar, daher müssen Sie den Transkribus Expert Client verwenden, wenn Sie Ihr eigenes Modell trainieren möchten. Mehr über das Modelltraining können Sie hier lesen.
Öffentliche Modelle
Auf der Registerkarte "Öffentliche Modelle" finden Sie alle öffentlichen Modelle, die für jedermann zugänglich sind. Viele dieser Modelle sind dank einiger sehr spannender Projekte von unserer großartigen Community erstellt worden. Wenn Sie auf ein Modell klicken, erhalten Sie mehr Informationen über das jeweilige Modell und bei vielen Modellen können Sie auch einen Vorschauschnipsel des für das Training verwendeten Materials sehen. So können Sie nach einem Modell suchen, das am besten zu Ihren Bedürfnissen passt. Manchmal ist es auch hilfreich, mehrere Modelle zu testen und die Ergebnisse zu vergleichen, um ein Modell zu finden, das für Sie funktioniert. Sie müssen jedoch bedenken, dass historisches Material, insbesondere die unzähligen unterschiedlichen Handschriften, sehr heterogen sein können und wir daher (noch 😉 ) kein öffentliches Modell anbieten können, das für alle funktioniert. Sie können sich auch alle öffentlichen Modelle ansehen hier erläutert.
Wenn Sie ein Modell identifiziert haben, das Sie verwenden möchten, klicken Sie einfach auf die Schaltfläche "Auswählen", um das Modell auszuwählen.
Schritt 3: Starten der Erkennung
Im letzten Schritt müssen Sie die Seiten festlegen, die Sie mit HTR erkennen wollen. Sie können entweder einen Seitenstring mit der Nummer der Anfangsseite und der Nummer der Endseite eingeben oder die Seiten manuell mit der Schaltfläche "Select Pages" auswählen. Nachdem Sie die Seiten ausgewählt haben, können Sie auf "Start" klicken.
Bevor der Erkennungsauftrag schließlich startet, sehen Sie ein Popup, das Ihnen anzeigt, wie viel Guthaben durch den gestarteten Auftrag verbraucht werden wird. Zusätzlich sehen Sie Ihren aktuellen Guthabenstand und den Guthabenstand nach der Erkennung. Durch erneutes Klicken auf "Start" wird der Erkennungsauftrag schließlich gestartet.
Ergebnisse
Sobald Sie den Erkennungsvorgang gestartet haben, werden Sie zur Jobs-Seiteweitergeleitet. Hier sehen Sie Ihren neu angelegten Erkennungsauftrag. In der Statusspalte können Sie jederzeit den aktuellen Status Ihres Erkennungsauftrags sowie weitere Informationen zum Auftrag einsehen. Durch Klicken auf den Auftrag in der Liste gelangen Sie zu dem Dokument, das sich auf den Auftrag bezieht. Nachdem die Erkennung abgeschlossen ist, können Sie sich die Ergebnisse ansehen, indem Sie die Seiten des Dokuments aufrufen.