Die Zukunft der Informationsextraktion - Nehmen Sie teil an TUC 2024! 15. und 16. Februar, persönlich und online. Holen Sie sich Ihr Ticket >>

Status

Sie können den einzelnen Seiten Ihres Dokuments unterschiedliche Status zuweisen, je nachdem, wie weit sie bereits bearbeitet wurden. Sie können zwischen den folgenden Status wählen: 

Status: Neu

Neu gilt für neu hochgeladene Dokumente, die noch nicht manuell bearbeitet worden sind.

Status: In Bearbeitung

Sobald Sie mit der Bearbeitung einer Seite beginnen und diese später speichern, springt der Status automatisch auf "In Bearbeitung". Dieser Status beschreibt alle Seiten, die zwar von einem Menschen angesehen wurden, aber noch nicht vollständig fertiggestellt sind.

Status: Erledigt:

Der Status Erledigt bedeutet, dass die Seiten transkribiert wurden.

Status: Final

Transkribierte Seiten, die überprüft wurden, erhalten den Status "endgültig".

Für die Arbeit mit Transkribus benötigen Sie sogenannte Testsets, mit denen die KI trainiert wird. Solche Testsets können bei der Erstellung der Ground Truth ausgewählt werden. Die ausgewählten Dokumente erhalten einen speziellen Bearbeitungsstatus, nämlich "final" und werden später in separaten Dokumenten gesammelt. Für jedes Projekt sollte ein extra Testset angelegt werden. 

Status: Ground Truth

Ground Truth ist die Grundlage für die Erstellung der HTR-Modelle. Es ist eine maschinengeschriebene Kopie eines Dokuments, die 100 % korrekt ist. Sie wird zum Trainieren der KI verwendet. Jeder Fehler in der Ground Truth führt dazu, dass Transkribus etwas Falsches lernt. Daher ist es wichtig, dass der Ground Truth ein Dokument ist, das dem Originaltext so nahe wie möglich kommt.

Abbildung 1 Unterschiedliche Zustände in Transkribus

Starten Sie mit Transkribus

Machen Sie Ihre historischen Dokumente zugänglich