+ HTR+ liest alte slawische Dokumente mit 3-5 % Zeichenfehlerrate

Kürzlich wurde unser neues HTR+ von Achim Rabus, dem Inhaber des Lehrstuhls für Slawische Sprachwissenschaft an der Universität Freiburg, an verschiedenen kirchenslawischen Handschriften getestet. Mit der Technologie von Transkribus sanken die Fehlerquoten auf 3 bis 5 Prozent. Hochgestellte Buchstaben, Abkürzungen und Worttrennung sind die Herausforderungen, mit denen der HTR+ zu kämpfen hatte.

Eine Arbeit zum Thema Erkennung von Handschriften in slawischen Manuskripten mit Transkribus wird demnächst von Achim Rabus veröffentlicht. Im Rahmen dieses Projekts entdeckte er das Potenzial von Transkribus, wenn es um die Digitalisierung kirchenslawischer Handschriften geht: Die Möglichkeit, in großen Dokumenten zu suchen, ohne überhaupt ein spezielles Modell für die individuelle Handschrift zu haben, und die Chance, eine vollständige manuelle Transkription zu vermeiden und stattdessen nur die Fehler der automatisierten Transkription zu korrigieren, erleichtert das "Digitalisierungs-Leben" erheblich.

Ein Teil der Modelle, die Achim Rabus trainiert hat, enthalten bereits unterschiedliche Handschriften und liefern brauchbare automatische Transkripte. Dennoch arbeitet das READ-Team daran, Transkribus weiter so zu verbessern, dass auch für Dokumente mit gemischten Handschriften automatische Transkripte mit geringer Zeichenfehlerrate erzeugt werden können.

Kooperation ist der Schlüssel, um den größten Nutzen für alle herauszuholen. Davon ist auch Achim Rabus überzeugt und deshalb teilt er sein Modell gerne mit Interessierten. Sie können mit ihm per E-Mail in Kontakt treten: achim.rabus@slavistik.uni-freiburg.de

Sie können einen Blick auf den Entwurf des Papiers werfen Erkennung von handschriftlichem Text in slawischen Manuskripten: Ein Neuronennetz-Ansatz mit Transkribus unter dem folgenden Link: https://www.academia.edu/38835297/Recognizing_handwritten_text_in_Slavic_manuscripts_A_neural-network_approach_using_Transkribus_1_Achim_Rabus

Quelle: Rabus, Achim: Erkennung von handschriftlichem Text in slawischen Manuskripten: Ein Neuronal-Netz-Ansatz mit Transkribus

 

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Mai 14, 2024
Uncategorized
Das Verstehen historischer Dokumente ist der Schlüssel zum Verständnis der Geschichte. Das Verstehen historischer Dokumente auf Polnisch kann jedoch eine Herausforderung sein. Nicht nur ...
Mai 2, 2024
News, Transkribus, Uncategorized
Wenn Sie neu bei Transkribus sind, haben Sie wahrscheinlich eine Menge Fragen zur Plattform. Wie kann ich Dokumente transkribieren? Was ist ...
25. April 2024
News, Transkribus
Im Januar haben wir unsere neuen Abonnementpläne angekündigt: Einzelpersonen, Stipendiaten und Organisationen. Jeder Plan ist auf eine bestimmte ...