+ HTR+ liest alte slawische Dokumente mit 3-5 % Zeichenfehlerrate

Kürzlich wurde unser neues HTR+ von Achim Rabus, dem Inhaber des Lehrstuhls für Slawische Sprachwissenschaft an der Universität Freiburg, an verschiedenen kirchenslawischen Handschriften getestet. Mit der Technologie von Transkribus sanken die Fehlerquoten auf 3 bis 5 Prozent. Hochgestellte Buchstaben, Abkürzungen und Worttrennung sind die Herausforderungen, mit denen der HTR+ zu kämpfen hatte.

Eine Arbeit zum Thema Erkennung von Handschriften in slawischen Manuskripten mit Transkribus wird demnächst von Achim Rabus veröffentlicht. Im Rahmen dieses Projekts entdeckte er das Potenzial von Transkribus, wenn es um die Digitalisierung kirchenslawischer Handschriften geht: Die Möglichkeit, in großen Dokumenten zu suchen, ohne überhaupt ein spezielles Modell für die individuelle Handschrift zu haben, und die Chance, eine vollständige manuelle Transkription zu vermeiden und stattdessen nur die Fehler der automatisierten Transkription zu korrigieren, erleichtert das "Digitalisierungs-Leben" erheblich.

Ein Teil der Modelle, die Achim Rabus trainiert hat, enthalten bereits unterschiedliche Handschriften und liefern brauchbare automatische Transkripte. Dennoch arbeitet das READ-Team daran, Transkribus weiter so zu verbessern, dass auch für Dokumente mit gemischten Handschriften automatische Transkripte mit geringer Zeichenfehlerrate erzeugt werden können.

Kooperation ist der Schlüssel, um den größten Nutzen für alle herauszuholen. Davon ist auch Achim Rabus überzeugt und deshalb teilt er sein Modell gerne mit Interessierten. Sie können mit ihm per E-Mail in Kontakt treten: achim.rabus@slavistik.uni-freiburg.de

Sie können einen Blick auf den Entwurf des Papiers werfen Erkennung von handschriftlichem Text in slawischen Manuskripten: Ein Neuronennetz-Ansatz mit Transkribus unter dem folgenden Link: https://www.academia.edu/38835297/Recognizing_handwritten_text_in_Slavic_manuscripts_A_neural-network_approach_using_Transkribus_1_Achim_Rabus

Quelle: Rabus, Achim: Erkennung von handschriftlichem Text in slawischen Manuskripten: Ein Neuronal-Netz-Ansatz mit Transkribus

 

DIESEN ARTIKEL TEILEN

Neueste Beiträge

April 17, 2024
News, Transkribus
Einer der größten Vorteile von Transkribus ist die Möglichkeit, benutzerdefinierte Modelle zur Erkennung von handschriftlichem Text zu trainieren. Diese einzigartige Funktion ...
4. April 2024
News
Der Frühling hat begonnen und damit auch die Veröffentlichung von Transkribus im April 2024. Hier ist ein kurzer Überblick über alle ...
3. April 2024
News
Man kann viel über die französische Geschichte lernen, wenn man Bücher liest oder Dokumentarfilme sieht. Diese Arten von Quellen sind gut für ...