Die Zukunft der Informationsextraktion - Nehmen Sie teil an TUC 2024! 15. und 16. Februar, persönlich und online. Holen Sie sich Ihr Ticket >>

+ Spezielle Modelle zur slawischen Handschrift freigegeben

Prof. Achim Rabus von der Universität Freiburg hat zwei spezialisierte Modelle veröffentlicht, die in der Lage sind, russisches Kirchenslawisch zu lesen. Das erste Modell heißt VMC_Test_4+: Die Trainingsdaten bestehen aus Teilen der russischen kirchenslawischen Großen Lesemenologie (16. Jahrhundert). Das Modell ist auf die Transkription der kyrillischen Halbunzialschrift aus dem 16. Jahrhundert zugeschnitten. Die Zeichenfehlerraten für die Trainingsdaten sind 3.72% und für das Validierungsset 3.92% und für das Validierungsset 3.82%.

Das zweite Modell wird genannt: Combined_Full_VKS_2: Die Trainingsdaten bestehen aus Teilen der russischen kirchenslawischen Großen Lesemenologie (16. Jahrhundert), dem altkirchenslawischen Codex Suprasliensis (11. Jahrhundert) und dem Manuskript der Katechesen des Kyrill von Jerusalem aus dem 11. Dies ist ein generisches Modell, das für die Transkription einer Vielzahl von altkyrillischen Schriftstilen geeignet ist, einschließlich Unziale und Halbunziale. Die Zeichenfehlerrate für die Trainingsdaten beträgt 4,42% und für den Validierungssatz 3,92%.

Achim hat ein Buch geschrieben ausführlicher Bericht  über seine Verwendung von Transkribus, die ein hervorragendes Beispiel dafür ist, wie ein solches allgemeines Modell erstellt werden kann. Herzlichen Dank!

 

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Jänner 31, 2024
News
Wir freuen uns, die neuesten Aktualisierungen unseres Dokumenten-Editors anzukündigen, die Ihnen eine intuitivere und übersichtlichere Benutzeroberfläche bieten. Unser ...
Jänner 17, 2024
News, Transkribus
Muss ich handgeschriebenen Text transkribieren oder übersetzen, um mit ihm arbeiten zu können? Nun, das hängt davon ab ...
Jänner 11, 2024
News, Transkribus
Die Verwaltung und Veröffentlichung historischer Dokumente war noch nie so einfach! Erstellen Sie eine Website, die Ihr transkribiertes Material präsentiert ...