Kürzlich wurde unser neues HTR+ von Achim Rabus, dem Inhaber des Lehrstuhls für Slawische Sprachwissenschaft an der Universität Freiburg, an verschiedenen kirchenslawischen Handschriften getestet. Mit der Technologie von Transkribus sanken die Fehlerquoten auf 3 bis 5 Prozent. Hochgestellte Buchstaben, Abkürzungen und Worttrennung sind die Herausforderungen, mit denen der HTR+ zu kämpfen hatte.
Eine Arbeit zum Thema Erkennung von Handschriften in slawischen Manuskripten mit Transkribus wird demnächst von Achim Rabus veröffentlicht. Im Rahmen dieses Projekts entdeckte er das Potenzial von Transkribus, wenn es um die Digitalisierung kirchenslawischer Handschriften geht: Die Möglichkeit, in großen Dokumenten zu suchen, ohne überhaupt ein spezielles Modell für die individuelle Handschrift zu haben, und die Chance, eine vollständige manuelle Transkription zu vermeiden und stattdessen nur die Fehler der automatisierten Transkription zu korrigieren, erleichtert das "Digitalisierungs-Leben" erheblich.
Ein Teil der Modelle, die Achim Rabus trainiert hat, enthalten bereits unterschiedliche Handschriften und liefern brauchbare automatische Transkripte. Dennoch arbeitet das READ-Team daran, Transkribus weiter so zu verbessern, dass auch für Dokumente mit gemischten Handschriften automatische Transkripte mit geringer Zeichenfehlerrate erzeugt werden können.
Kooperation ist der Schlüssel, um den größten Nutzen für alle herauszuholen. Davon ist auch Achim Rabus überzeugt und deshalb teilt er sein Modell gerne mit Interessierten. Sie können mit ihm per E-Mail in Kontakt treten: achim.rabus@slavistik.uni-freiburg.de
Sie können einen Blick auf den Entwurf des Papiers werfen Erkennung von handschriftlichem Text in slawischen Manuskripten: Ein Neuronennetz-Ansatz mit Transkribus unter dem folgenden Link: https://www.academia.edu/38835297/Recognizing_handwritten_text_in_Slavic_manuscripts_A_neural-network_approach_using_Transkribus_1_Achim_Rabus
Quelle: Rabus, Achim: Erkennung von handschriftlichem Text in slawischen Manuskripten: Ein Neuronal-Netz-Ansatz mit Transkribus