+ Das Nationalarchiv veröffentlicht die erste Version eines niederländischen Handschriftenmodells

Das Digitalisierungs-Team um Liesbeth Keyser von der Nationalarchiv in den Niederlanden arbeitet intensiv an der Erstellung von Trainingsdaten für ihre Sammlungen, um die HTR-Verarbeitung im großen Maßstab vorzubereiten. Als erstes Ergebnis wird nun ein Modell auf Basis von 475.769 Wörtern für Transkribus-Nutzer zur Verfügung gestellt. Das Modell zeigt eine Zeichenfehlerrate von 7,48% auf dem Trainingsset und 6,15% auf dem Validierungsset. Es basiert auf der sorgfältigen Transkription von Dutzenden verschiedener Handschriften und umfasst Scans aus den Eingehenden Dokumenten der Niederländischen Ostindien-Kompanie (Overgekomen Brieven en Papieren van de VOC) des Nationalarchivs der Niederlande und von Notariatsurkunden des 19. Jahrhunderts aus dem Noord-Hollands archief.  Das Modell hat den Namen: NAN/NHA_GT_M3+ Viel Spaß!

 

 

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Mai 2, 2024
News, Transkribus, Uncategorized
Wenn Sie neu bei Transkribus sind, haben Sie wahrscheinlich eine Menge Fragen zur Plattform. Wie kann ich Dokumente transkribieren? Was ist ...
25. April 2024
News, Transkribus
Im Januar haben wir unsere neuen Abonnementpläne angekündigt: Einzelpersonen, Stipendiaten und Organisationen. Jeder Plan ist auf eine bestimmte ...
April 17, 2024
News, Transkribus
Einer der größten Vorteile von Transkribus ist die Möglichkeit, benutzerdefinierte Modelle zur Erkennung von handschriftlichem Text zu trainieren. Diese einzigartige Funktion ...