Die Zukunft der Informationsextraktion - Nehmen Sie teil an TUC 2024! 15. und 16. Februar, persönlich und online. Holen Sie sich Ihr Ticket >>

NIOD_WarLet_1935-1950_NoBasemodel

Kostenloses öffentliches KI-Modell für die Erkennung von handgeschriebenem Text mit Transkribus

NIOD_WarLet_1935-1950_NoBasemodel

Das HTR-Modell "NIOD_WarLet_1935-1950_NoBasemodel" wurde anhand von 968 "Ground Truth"-Transkriptionen von hochauflösenden Scans verschiedener handschriftlicher Briefe trainiert. Diese Briefe sind alle in Niederländisch verfasst und stammen aus dem Zeitraum 1935-1950. Der Trainingssatz enthält persönliche Korrespondenz von einer Vielzahl von Briefschreibern (z. B. Kinder, Soldaten, jüdische Versteckte). Diese persönliche Korrespondenz ist Teil der als "247 Correspondentie" bekannten Archivsammlung des NIOD-Instituts für Kriegs-, Holocaust- und Völkermordstudien in Amsterdam.

Dieses Modell wurde im Rahmen des Projekts "First-Hand Accounts of War: War letters (1935-1950) from NIOD digitised" erstellt. Alle für die Schulung und Validierung verwendeten Dokumente wurden im Rahmen dieses Projekts gescannt und transkribiert. Dieses Projekt lief von 2020 bis 2023 und wurde vom Mondriaan-Fonds, dem niederländischen Ministerium für Gesundheit, Wohlfahrt und Sport und dem NIOD-Institut für Kriegs-, Holocaust- und Genozidstudien in Amsterdam finanziert.

Das Trainingsset "Ground Truth" wurde von den Projektmitgliedern Annelies van Nispen, Carlijn Keijzer und Milan van Lange erstellt. Die zusätzliche Transkription und Korrektur der "Ground Truth"-Transkriptionen wurde unter der Aufsicht von Muriël Bouman von den Bürgerwissenschaftlern Hillebrand Verkroost, Bart Cohen, Evelien Bachrach, Marjo Janssens und Cocky Sietses durchgeführt.
Der Validierungssatz enthält eine Stichprobe von 17 "Ground Truth"-Transkriptionen von verschiedenen Autoren und Untersammlungen.

Das Modell wird mit PyLaia HTR trainiert, max. 500 Epochen (321 Epochen trainiert), Lernrate 0,0003. Es wurde kein Basismodell verwendet.

Modell-Übersicht

Name:
NIOD_WarLet_1935-1950_NoBasemodel
Ersteller:
NIOD-Institut für Kriegs-, Holocaust- und Völkermordforschung
Modell-ID:
50053
Jahrhundert:
20.
Sprachen:
Niederländisch, Flämisch
Schrift:
Lateinisches Alphabet
Engine:
PyLaia
Material:
Handschrift
CER auf Validierungssatz:
5.40 %
Einfach ein Bild hochladen und dieses Modell testen

Mit dem Hochladen eines Bildes akzeptieren Sie unsere Allgemeinen Geschäftsbedingungen und unsere Datenschutzpolitik

NIOD_WarLet_1935-1950_NoBasemodel ist für jeden frei verfügbar

Starten Sie mit Transkribus und nutzen Sie es für Ihr eigenes Material
Sie können dieses Modell zur automatischen Transkription von handschriftlichen Dokumenten mit Handwritten Text Recognition in Transkribus verwenden. Die Verwendung dieses Modells ist sowohl mit dem Transkribus Expert Client möglich als auch mit Transkribus Lite.
Dieses KI-Modell wurde trainiert, um Text aus Bildern historischer Dokumente mit lateinischem Alphabet automatisch in editierbaren und durchsuchbaren Text zu konvertieren.