Stefan KarcherEin Doktorand an der Universität Heidelberg hat einen faszinierenden Blog-Beitrag geschrieben, in dem er erklärt, wie er Transkribus benutzt hat, um deutsche Predigten aus dem 19.
Karcher nutzte die Gelegenheit, um seine eigenen Modelle für die automatische Texterkennung zu trainieren. Er verwendete etwa 30.000 transkribierte Wörter an Trainingsdaten, um ein Modell zu generieren, das Transkripte seiner Dokumente mit einer Zeichenfehlerrate von 8-10% erzeugen kann. Der Blog-Beitrag merkt an, dass diese Transkripte eine nützliche und effiziente Basis für seine Forschung sind und enthält eine Beschreibung, wie diese automatisierten Transkripte mit Voyant Werkzeuge.
Möchten Sie Ihr eigenes Modell für die automatische Texterkennung trainieren?
- Wie Sie loslegen können, erfahren Sie in unserem Anleitungen.