+ HTR+ liest alte slawische Dokumente mit 3-5 % Zeichenfehlerrate

Kürzlich wurde unser neues HTR+ von Achim Rabus, dem Inhaber des Lehrstuhls für Slawische Sprachwissenschaft an der Universität Freiburg, an verschiedenen kirchenslawischen Handschriften getestet. Mit der Technologie von Transkribus sanken die Fehlerquoten auf 3 bis 5 Prozent. Hochgestellte Buchstaben, Abkürzungen und Worttrennung sind die Herausforderungen, mit denen der HTR+ zu kämpfen hatte.

Eine Arbeit zum Thema Erkennung von Handschriften in slawischen Manuskripten mit Transkribus wird demnächst von Achim Rabus veröffentlicht. Im Rahmen dieses Projekts entdeckte er das Potenzial von Transkribus, wenn es um die Digitalisierung kirchenslawischer Handschriften geht: Die Möglichkeit, in großen Dokumenten zu suchen, ohne überhaupt ein spezielles Modell für die individuelle Handschrift zu haben, und die Chance, eine vollständige manuelle Transkription zu vermeiden und stattdessen nur die Fehler der automatisierten Transkription zu korrigieren, erleichtert das "Digitalisierungs-Leben" erheblich.

Ein Teil der Modelle, die Achim Rabus trainiert hat, enthalten bereits unterschiedliche Handschriften und liefern brauchbare automatische Transkripte. Dennoch arbeitet das READ-Team daran, Transkribus weiter so zu verbessern, dass auch für Dokumente mit gemischten Handschriften automatische Transkripte mit geringer Zeichenfehlerrate erzeugt werden können.

Kooperation ist der Schlüssel, um den größten Nutzen für alle herauszuholen. Davon ist auch Achim Rabus überzeugt und deshalb teilt er sein Modell gerne mit Interessierten. Sie können mit ihm per E-Mail in Kontakt treten: achim.rabus@slavistik.uni-freiburg.de

Sie können einen Blick auf den Entwurf des Papiers werfen Erkennung von handschriftlichem Text in slawischen Manuskripten: Ein Neuronennetz-Ansatz mit Transkribus unter dem folgenden Link: https://www.academia.edu/38835297/Recognizing_handwritten_text_in_Slavic_manuscripts_A_neural-network_approach_using_Transkribus_1_Achim_Rabus

Quelle: Rabus, Achim: Erkennung von handschriftlichem Text in slawischen Manuskripten: Ein Neuronal-Netz-Ansatz mit Transkribus

 

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Juli 3, 2024
News, Transkribus
Einige Transkribus-Projekte enden mit einer vollständig digitalisierten Sammlung in Transkribus. Andere nehmen diese digitalisierte Quelle und verwenden sie ...
Juni 12, 2024
News, Transkribus
Wenn man an karolingische (oder karolingische) Minuskeln denkt, kommen einem wahrscheinlich Karl der Große und sein riesiges karolingisches Reich in den Sinn. Während die ...
Mai 14, 2024
Uncategorized
Das Verstehen historischer Dokumente ist der Schlüssel zum Verständnis der Geschichte. Das Verstehen historischer Dokumente auf Polnisch kann jedoch eine Herausforderung sein. Nicht nur ...