Das HTR-Modell 'NIOD_WarLet_1935-1950' wurde auf handschriftliche Korrespondenz in niederländischer Sprache trainiert, die aus dem Zeitraum 1935-1950 stammt.
Der Trainingssatz besteht aus 1087 "Ground Truth"-Transkriptionen von hochauflösenden Scans.
Alle enthaltenen Dokumente sind Teil der Archivsammlung "247 Correspondentie" des NIOD-Instituts für Kriegs-, Holocaust- und Völkermordstudien in Amsterdam.
Der Trainingssatz enthält persönliche Korrespondenz von einer Vielzahl von Briefschreibern (z. B. Kinder, Soldaten, jüdische Versteckte).
Dieses Modell wurde im Rahmen des Projekts "First-Hand Accounts of War: War letters (1935-1950) from NIOD digitised" erstellt, das von 2020 bis 2023 läuft.
Alle für die Schulung und Validierung verwendeten Dokumente wurden im Rahmen dieses Projekts eingescannt und transkribiert.
Dieses Projekt wurde vom Mondriaan-Fonds, dem niederländischen Ministerium für Gesundheit, Wohlfahrt und Sport und dem NIOD-Institut für Kriegs-, Holocaust- und Genozidstudien in Amsterdam finanziert.
Das Trainingsset "Ground Truth" wurde von den Projektmitgliedern Annelies van Nispen, Carlijn Keijzer und Milan van Lange erstellt. Die zusätzliche Transkription und Korrektur der "Ground Truth"-Transkriptionen wurde unter der Aufsicht von Muriël Bouman von den Bürgerwissenschaftlern Hillebrand Verkroost, Bart Cohen, Evelien Bachrach, Marjo Janssens und Cocky Sietses durchgeführt.
Der Validierungssatz enthält eine Stichprobe von 17 "Ground Truth"-Transkriptionen von verschiedenen Autoren und Untersammlungen.
Das Modell wurde mit der PyLaia HTR-Engine trainiert, 250 Epochen wurden mit einer Lernrate von 0,0003 trainiert.
Das HTR-Modell 'IJsberg_PyLaia' (id: 38769) wurde als Basismodell verwendet.