+ Das Nationalarchiv veröffentlicht die erste Version eines niederländischen Handschriftenmodells

Das Digitalisierungs-Team um Liesbeth Keyser von der Nationalarchiv in den Niederlanden arbeitet intensiv an der Erstellung von Trainingsdaten für ihre Sammlungen, um die HTR-Verarbeitung im großen Maßstab vorzubereiten. Als erstes Ergebnis wird nun ein Modell auf Basis von 475.769 Wörtern für Transkribus-Nutzer zur Verfügung gestellt. Das Modell zeigt eine Zeichenfehlerrate von 7,48% auf dem Trainingsset und 6,15% auf dem Validierungsset. Es basiert auf der sorgfältigen Transkription von Dutzenden verschiedener Handschriften und umfasst Scans aus den Eingehenden Dokumenten der Niederländischen Ostindien-Kompanie (Overgekomen Brieven en Papieren van de VOC) des Nationalarchivs der Niederlande und von Notariatsurkunden des 19. Jahrhunderts aus dem Noord-Hollands archief.  Das Modell hat den Namen: NAN/NHA_GT_M3+ Viel Spaß!

 

 

DIESEN ARTIKEL TEILEN

Neueste Beiträge

April 17, 2024
News, Transkribus
Einer der größten Vorteile von Transkribus ist die Möglichkeit, benutzerdefinierte Modelle zur Erkennung von handschriftlichem Text zu trainieren. Diese einzigartige Funktion ...
4. April 2024
News
Der Frühling hat begonnen und damit auch die Veröffentlichung von Transkribus im April 2024. Hier ist ein kurzer Überblick über alle ...
3. April 2024
News
Man kann viel über die französische Geschichte lernen, wenn man Bücher liest oder Dokumentarfilme sieht. Diese Arten von Quellen sind gut für ...