+ Transkribus erkennt die frühneuzeitliche deutsche Korrespondenz

Die Forschungsgruppe Geschlechtergeschichte an der Universität Jena (Thüringen, Deutschland) experimentiert mit Transkribus als Teil eines Digitales Editionsprojekt zur Korrespondenz der Regentin des 18. Jahrhunderts, Erdmuthe Benigna von Reuß-Ebersdorf (1670-1732).

Die frühneuzeitlichen Schriften sind für die Technologie der automatischen Texterkennung sehr herausfordernd, da die Buchstaben meist eng miteinander verwoben sind, Abkürzungen recht häufig vorkommen und die Schreibweise der Wörter nicht standardisiert ist. Wie das folgende Beispiel zeigt, ist Erdmuthes Schrift nicht einfach zu folgen! Sie hatte einen einzigartigen Schreibstil und brach Wörter oft in einzelne Teile auf.

Musterseite eines Briefes (Quelle: Landesarchiv Thüringen - Staatsarchiv Greiz, Paragiatsherrschaft Köstritz, Von IV 15, fol. 56r ., Alle Rechte vorbehalten)

Um ein Modell zur Erkennung von Erdmuthes Schrift zu trainieren, nutzte das Gender History-Forschungsteam etwa 250 Seiten vorhandener Transkripte, die im Zuge der Arbeit an der digitalen Edition entstanden waren. Mit denselben Transkripten erstellten sie auch ein Wörterbuch von Erdmuthes Wortschatz, das in den Erkennungsprozess integriert werden kann.

Das resultierende Modell ist in der Lage, automatisierte Transkripte von Erdmuthes Schrift mit einer Zeichenfehlerrate (CER) von unter 9% zu erzeugen. Wenn ein Wörterbuch in den Erkennungsprozess einbezogen wird, werden die Fehler noch weiter reduziert.

Martin Prell aus dem Projektteam hat dieses Experiment in einem Bericht ausgearbeitet (in Deutsch). Er berichtet über die Erfahrungen bei der Aufbereitung der Trainingsdaten für die Texterkennung und die direkte Arbeit mit Transkribus. Wenn Sie darüber nachdenken, Transkribus für Ihr eigenes Projekt zu nutzen, könnte dieser sehr lehrreiche Beitrag helfen!

Bericht:

Andere Links:

DIESEN ARTIKEL TEILEN

Neueste Beiträge

19. September 2023
Transkribus
Wir freuen uns, die Veröffentlichung der Transkribus-Web-App im September 2023 bekannt geben zu können. Nach der erfolgreichen Umstellung auf die ...
30. August 2023
News, Transkribus
Heute ist die neue Transkribus Web-App offiziell gestartet! Transkribus hat schon immer daran gearbeitet, die Digitalisierung und Transkription von ...
21. August 2023
Transkribus Anwenderkonferenz
Die Transkribus User Conference 24 (15. und 16. Februar 2024, Innsbruck) lädt Interessierte, Nutzer, Wissenschaftler und Enthusiasten ein, sich mit dem ...