+ Das Nationalarchiv veröffentlicht die erste Version eines niederländischen Handschriftenmodells

Das Digitalisierungs-Team um Liesbeth Keyser von der Nationalarchiv in den Niederlanden arbeitet intensiv an der Erstellung von Trainingsdaten für ihre Sammlungen, um die HTR-Verarbeitung im großen Maßstab vorzubereiten. Als erstes Ergebnis wird nun ein Modell auf Basis von 475.769 Wörtern für Transkribus-Nutzer zur Verfügung gestellt. Das Modell zeigt eine Zeichenfehlerrate von 7,48% auf dem Trainingsset und 6,15% auf dem Validierungsset. Es basiert auf der sorgfältigen Transkription von Dutzenden verschiedener Handschriften und umfasst Scans aus den Eingehenden Dokumenten der Niederländischen Ostindien-Kompanie (Overgekomen Brieven en Papieren van de VOC) des Nationalarchivs der Niederlande und von Notariatsurkunden des 19. Jahrhunderts aus dem Noord-Hollands archief.  Das Modell hat den Namen: NAN/NHA_GT_M3+ Viel Spaß!

 

 

DIESEN ARTIKEL TEILEN

Neueste Beiträge

März 23, 2023
Transkribus
Gehen Sie in ein beliebiges Geschichtsmuseum oder lesen Sie ein Geschichtsbuch, und Sie werden feststellen, dass viele der Geschichten und Ereignisse ...
März 15, 2023
Uncategorized
Von Fiona Park Nicht jeder, der sich mit Geschichte beschäftigt, ist ein professioneller Historiker. Von Hobby-Genealogen bis hin zu Freiwilligen in lokalen ...
März 7, 2023
Transkribus
Die Herstellung von Büchern im Mittelalter war eine Herausforderung. Vor der Einführung des Buchdrucks wurden alle Bücher in mühsamer Kleinarbeit ...