Sie können den einzelnen Seiten Ihres Dokuments unterschiedliche Status zuweisen, je nachdem, wie weit sie bereits bearbeitet wurden. Sie können zwischen den folgenden Status wählen:
Status: Neu
Neu gilt für neu hochgeladene Dokumente, die noch nicht manuell bearbeitet worden sind.
Status: In Bearbeitung
Sobald Sie mit der Bearbeitung einer Seite beginnen und diese später speichern, springt der Status automatisch auf "In Bearbeitung". Dieser Status beschreibt alle Seiten, die zwar von einem Menschen angesehen wurden, aber noch nicht vollständig fertiggestellt sind.
Status: Erledigt:
Der Status Erledigt bedeutet, dass die Seiten transkribiert wurden.
Status: Final
Transkribierte Seiten, die überprüft wurden, erhalten den Status "endgültig".
Für die Arbeit mit Transkribus benötigen Sie sogenannte Testsets, mit denen die KI trainiert wird. Solche Testsets können bei der Erstellung der Ground Truth ausgewählt werden. Die ausgewählten Dokumente erhalten einen speziellen Bearbeitungsstatus, nämlich "final" und werden später in separaten Dokumenten gesammelt. Für jedes Projekt sollte ein extra Testset angelegt werden.
Status: Ground Truth
Ground Truth ist die Grundlage für die Erstellung der HTR-Modelle. Es ist eine maschinengeschriebene Kopie eines Dokuments, die 100 % korrekt ist. Sie wird zum Trainieren der KI verwendet. Jeder Fehler in der Ground Truth führt dazu, dass Transkribus etwas Falsches lernt. Daher ist es wichtig, dass der Ground Truth ein Dokument ist, das dem Originaltext so nahe wie möglich kommt.