+ Das Nationalarchiv veröffentlicht die erste Version eines niederländischen Handschriftenmodells

Das Digitalisierungs-Team um Liesbeth Keyser von der Nationalarchiv in den Niederlanden arbeitet intensiv an der Erstellung von Trainingsdaten für ihre Sammlungen, um die HTR-Verarbeitung im großen Maßstab vorzubereiten. Als erstes Ergebnis wird nun ein Modell auf Basis von 475.769 Wörtern für Transkribus-Nutzer zur Verfügung gestellt. Das Modell zeigt eine Zeichenfehlerrate von 7,48% auf dem Trainingsset und 6,15% auf dem Validierungsset. Es basiert auf der sorgfältigen Transkription von Dutzenden verschiedener Handschriften und umfasst Scans aus den Eingehenden Dokumenten der Niederländischen Ostindien-Kompanie (Overgekomen Brieven en Papieren van de VOC) des Nationalarchivs der Niederlande und von Notariatsurkunden des 19. Jahrhunderts aus dem Noord-Hollands archief.  Das Modell hat den Namen: NAN/NHA_GT_M3+ Viel Spaß!

 

 

DIESEN ARTIKEL TEILEN

Neueste Beiträge

November 17, 2022
Transkribus
Wir freuen uns sehr, Ihnen mitteilen zu können, dass wir gestern 100.000 Nutzer auf der Transkribus-Plattform erreicht haben! Trotz unserer jahrelangen, sehr ...
August 12, 2022
Erkennung von handgeschriebenem Text
Hatten Sie schon einmal Probleme, die Handschrift einer anderen Person zu lesen? Vielleicht beruhigt es Sie zu wissen, dass es nicht nur Menschen sind, die ...
22. Juli 2022
Uncategorized
Die neueste Version von Transkribus Lite ist da und bringt eine Reihe von neuen Funktionen. Hier sind die wichtigsten ...