Wenn Sie neu bei Transkribus sind, haben Sie wahrscheinlich eine Menge Fragen zur Plattform. Wie kann ich Dokumente transkribieren? Was ist ein Modell? Wie melde ich mich überhaupt an?
Viele dieser Fragen lassen sich durch einen Besuch in unserer Hilfe-Centerdie Informationen zu allen Funktionen von Transkribus enthält. Um Ihnen aber noch weiter zu helfen, haben wir für Sie die fünf häufigsten Fragen von Transkribus-Neulingen zusammengestellt und mit einer Schritt-für-Schritt-Anleitung versehen, um sie zu lösen.
- Wie lade ich Dateien auf Transkribus hoch?
- Wie kann ich Dateien aus Transkribus exportieren?
- Wie kann ich den Status eines Auftrags überprüfen?
- Welches öffentliche Modell eignet sich am besten für mein Material?
- Was ist ein CER und wie kann ich den CER-Wert meines Modells verbessern?
1) Wie kann ich Dateien auf Transkribus hochladen?
Der erste Schritt im Texterkennungsprozess besteht darin, ein Bild des Dokuments hochzuladen, das Sie transkribieren möchten. Dies kann im JPEG-, PNG- oder PDF-Format erfolgen.
Um ein Dokument hochzuladen, navigieren Sie zur Seite Schreibtisch und wählen Sie Dateien hochladen. Wählen Sie die Sammlung aus, in die Sie Dateien hochladen möchten, und wählen Sie dann die Dateien selbst aus.
Die meisten hochgeladenen Dokumente bestehen aus mehr als einer Seite. Sie müssen jedoch nicht jede Seite einzeln hochladen.
Wenn Sie JPEGs oder PNGs hochladen, werden alle in einem Upload ausgewählten Bilder als ein Dokument hochgeladen, und jedes Bild wird dann zu einer Seite des Dokuments. Wenn Sie PDFs hochladen, wird jede Seite des PDFs extrahiert und als eine Seite des Dokuments hochgeladen.
Weitere Informationen zum Hochladen von Dokumenten in Transkribus finden Sie auf unserer Hilfe-Center.
2) Wie kann ich Dateien aus Transkribus exportieren?
Sie können Ihre Dokumentenbilder und Transkriptionen aus Transkribus herunterladen oder exportieren, um sie außerhalb der Plattform zu bearbeiten.
Um Dokumente zu exportieren, wählen Sie die Sammlung, die Dokumente oder die Seiten aus, die Sie herunterladen möchten. Klicken Sie auf die drei Punkte im oberen Menü und wählen Sie Exportieren. Wählen Sie ein Exportformat aus der Liste und wählen Sie Export starten.
Für weitere Informationen über die verschiedenen Exportformate, die mit Transkribus möglich sind, besuchen Sie bitte unsere Hilfe-Center.
3) Wie kann ich den Status eines Auftrags überprüfen?
Ein Transkribus-"Job" ist jede Aufgabe, die Sie der Plattform übertragen, z. B. das Hochladen von Dokumenten, die Durchführung einer Texterkennung oder das Training eines Modells. Je nach Umfang des Auftrags müssen Sie unter Umständen eine kurze Zeit warten, bis der Auftrag abgeschlossen ist. In dieser Zeit können Sie mit der Plattform weiterarbeiten und sie sogar ganz schließen, wobei die nicht abgeschlossenen Aufträge im Hintergrund weiterlaufen.
Sie können den Status Ihrer Aufträge jederzeit überprüfen, indem Sie auf Jobs in der oberen rechten Ecke des Bildschirms. Hier sehen Sie eine vollständige Liste aller Ihrer aktuellen und früheren Aufträge, unabhängig davon, ob sie in Desk oder Sites erledigt wurden. Jeder Auftrag ist mit einer Bezeichnung versehen, z. B. Erstellt, Laufen, Fertige, oder Gescheitert.
Wenn Ihr Job mit dem Label Erstellt oder Laufenist sie noch nicht vollständig. Sie können sehen unter Beschreibung wie viele Aufträge vor Ihnen in der Warteschlange stehen. Dies sollte Ihnen einen Hinweis darauf geben, wie lange Sie warten müssen.
Wenn Ihr Job mit dem Label Gescheitertsollten Sie zunächst versuchen, den Auftrag erneut auszuführen. Wenn er immer wieder fehlschlägt, können Sie ein Support-Ticket erstellen und wählen Sie Auftrag gescheitert im Thema Feld. Dadurch wird das Transkribus-Team auf das Problem aufmerksam gemacht.
Sie können einen Auftrag jederzeit abbrechen, indem Sie auf die drei Punkte unter Aktion und die Auswahl Abbrechen.
4) Welches öffentliche Modell eignet sich am besten für mein Material?
Um Text in Transkribus zu transkribieren, benötigen Sie ein Texterkennungsmodell. Das Modell teilt der Plattform mit, wie der Text in Ihrem Dokument zu transkribieren ist.
Der einfachste Weg, dies zu tun, ist die Auswahl eines öffentlichen Modells. Dies sind Modelle, die von der Transkribus-Gemeinschaft trainiert und für jedermann zugänglich gemacht wurden. Sie können alle öffentlichen Modelle einsehen auf dieser Seite oder in der Galerie der Modelle Abschnitt von Transkribus.
Jedes Modell ist mit einer Sprache (z. B. Deutsch), einer Schrift (z. B. lateinisches Alphabet), einem Zeitraum (z. B. 17. Jahrhundert) und der Angabe versehen, ob es für handschriftlichen oder gedruckten Text geeignet ist. Bei der Auswahl eines öffentlichen Modells für Ihre Dokumente ist es wichtig, dass Sie ein Modell wählen, das die gleiche oder eine ähnliche Sprache, Schrift, Zeitspanne und Textart wie Ihre Dokumente aufweist. So erhalten Sie die genauesten Transkriptionen. Es kann sich auch lohnen, verschiedene Modelle auszuprobieren, um zu sehen, welches für Ihre Dokumente am besten geeignet ist.
Wir haben auch zwei Supermodelle, den Text Titan I und den niederländischen Demeter I, und weitere werden derzeit ausgebildet. Bei den Supermodellen handelt es sich um leistungsfähigere transformatorbasierte Modelle, die in der Lage sind, viele verschiedene Arten von Materialien gleichzeitig zu transkribieren. Sie eignen sich daher hervorragend für Sammlungen, die eine Reihe von Sprachen, Schriften oder eine Mischung aus handschriftlichen und gedruckten Dokumenten enthalten.
Weitere Informationen zur Auswahl eines Modells finden Sie auf unserer Hilfe-Center.
5) Was ist ein CER und wie kann ich den CER-Wert meines Modells verbessern?
Jedem Modell ist auch eine Zeichenfehlerrate (CER) zugeordnet. Dies ist eine Zahl zwischen 0% und 100%, die angibt, wie genau das Modell ist. Ein Modell mit einer CER von 100% liefert eine sehr ungenaue Transkription, während ein Modell mit einer CER von 0% eine perfekte, fehlerfreie Transkription liefert. Um optimale Ergebnisse zu erzielen, sollten Sie Modelle mit einem CER von 10% oder weniger verwenden.
Mit Transkribus ist es auch möglich, Ihr eigenes Texterkennungsmodell zu trainieren, das auf die Handschrift oder den Druck in Ihren spezifischen Dokumenten zugeschnitten ist. Wenn Sie noch keine Erfahrung mit dem Trainieren von Modellen haben, wird es Ihnen vielleicht schwer fallen, ein Modell mit einem CER von unter 10% zu erstellen. Mit ein paar hilfreichen Tipps können Sie jedoch den CER Ihres eigenen Modells schnell verbessern.
Weitere Informationen zur Verbesserung der CER Ihres Modells finden Sie hier, Besuchen Sie unseren Blog.
Haben Sie eine weitere Transkribus-Frage?
Unser Hilfe-Center ist eine Fundgrube für alle Informationen rund um Transkribus. Von der Erstellung eines Kontos über die Ausbildung eines Modells bis hin zur Verwendung des ScanTent finden Sie hier Schritt-für-Schritt-Anleitungen für alle verschiedenen Funktionen von Transkribus.
Wir haben auch eine Tutorials-Wiedergabeliste auf YouTube, wo Teammitglieder Sie durch alle Aufgaben führen, die Sie mit der Plattform erledigen können. So können Sie in Echtzeit mitverfolgen, wie die Plattform optimal genutzt wird.