Generisches Modell 15.-16. Jahrhundert Deutsch (Prototyp)

Kostenloses öffentliches KI-Modell für die Erkennung von handgeschriebenem Text mit Transkribus

Generisches Modell 15.-16. Jahrhundert Deutsch (Prototyp)

Das Modell basiert auf einer Auswahl spätmittelalterlicher deutscher Handschriften aus dem fünfzehnten und sechzehnten Jahrhundert. Mit einem geographischen Schwerpunkt auf Österreich und dem hanseatischen Ostseeraum sind sowohl mittelniederdeutsche als auch frühneuhochdeutsche Texte im Übungsmaterial vertreten. Unter den verwendeten Schriftarten sind die gotische Kursive, die Bastarda und die frühe Kurrent am häufigsten vertreten.

Der Trainingsdatensatz besteht aus etwa 77.000 Wörtern. Die Basisdaten wurden aus mehreren Projekten zusammengestellt, die derzeit in verschiedenen Einrichtungen durchgeführt werden. Das Ziel ist es, diesen Datensatz in Zukunft erheblich zu erweitern und zu diversifizieren, um ein generisches Modell zu trainieren. Das derzeitige Modell hat daher den Status eines Prototyps, mit einem CER von 3,79% auf einem Validierungsset.

Kontakt: j.helmchen@fu-berlin.de

Abbildung: WStLA 2.1.2.1.B1.6b.2 - Gewährbuch C, fol. 292r (1420)

Modell-Übersicht

Name:
Generic Model 15th-16th century German (prototype)
Ersteller:
Julian Helmchen
Modell-ID:
44629
Jahrhundert:
15., 16.
Sprachen:
Deutsch
Schrift:
Lateinisches Alphabet
Engine:
HTR+
Material:
Handschrift
CER auf Validierungssatz:
3.79 %
Einfach ein Bild hochladen und dieses Modell testen

Mit dem Hochladen eines Bildes akzeptieren Sie unsere Allgemeinen Geschäftsbedingungen und unsere Datenschutzpolitik

Generic Model 15th-16th century German (prototype) ist für jeden frei verfügbar

Starten Sie mit Transkribus und nutzen Sie es für Ihr eigenes Material
Sie können dieses Modell zur automatischen Transkription von handschriftlichen Dokumenten mit Handwritten Text Recognition in Transkribus verwenden. Die Verwendung dieses Modells ist sowohl mit dem Transkribus Expert Client möglich als auch mit Transkribus Lite.
Dieses KI-Modell wurde trainiert, um Text aus Bildern historischer Dokumente mit lateinischem Alphabet automatisch in editierbaren und durchsuchbaren Text zu konvertieren.