Alte okzitanische Handschrift

Kostenloses öffentliches KI-Modell für die Erkennung von handgeschriebenem Text mit Transkribus

Alte okzitanische Handschrift

Das Modell wurde mit altokzitanischen Texten, hauptsächlich aus dem 13. und 14. Jahrhundert aus dem Languedoc oder der Provence, trainiert. Insgesamt wurden dafür 7 Texte mit insgesamt etwa 830 Seiten und etwa 190.000 Token verwendet.

Die folgenden Texte wurden verwendet:

Las Leys d'amors (= Bibliothèque municipale de Toulouse, cote 2883/-4),
Der Roman von Flamenca (=Bibliothèque municipale de Carcassonne, cote 34),

und von der Bibliothèque nationale de France (BnF):
La vida de sant Enimia (= Arsenal 6355), NAF 11180, NAF 1050, Latin 1139 und Français 846.

Das Modell nimmt unabhängige Wortsegmentierungen vor und ist in der Lage, die üblichen Abkürzungen aufzulösen. Die Interpunktion wird so belassen, wie sie im Manuskript steht (d.h. weggelassene Vokale, z.B. im Artikel, werden nicht durch Apostrophe ersetzt). Der CER für die Trainingsmenge beträgt 2,6%, für die Validierungsmenge 3,51%.

Modell-Übersicht

Name:
OldOccitanHandwriting
Ersteller:
Marinus Wiedner
Modell-ID:
52822
Jahrhundert:
14., 13.
Sprachen:
Alt-Okzitanisch, Alt-Provenzalisch
Schrift:
Lateinisches Alphabet
Engine:
PyLaia
Material:
Handschrift
CER auf Validierungssatz:
3.51 %
Einfach ein Bild hochladen und dieses Modell testen

Mit dem Hochladen eines Bildes akzeptieren Sie unsere Allgemeinen Geschäftsbedingungen und unsere Datenschutzpolitik

OldOccitanHandwriting ist für jeden frei verfügbar

Starten Sie mit Transkribus und nutzen Sie es für Ihr eigenes Material
Sie können dieses Modell zur automatischen Transkription von handschriftlichen Dokumenten mit Handwritten Text Recognition in Transkribus verwenden. Die Verwendung dieses Modells ist sowohl mit dem Transkribus Expert Client möglich als auch mit Transkribus Lite.
Dieses KI-Modell wurde trainiert, um Text aus Bildern historischer Dokumente mit lateinischem Alphabet automatisch in editierbaren und durchsuchbaren Text zu konvertieren.