+ Das Nationalarchiv veröffentlicht die erste Version eines niederländischen Handschriftenmodells

Das Digitalisierungs-Team um Liesbeth Keyser von der Nationalarchiv in den Niederlanden arbeitet intensiv an der Erstellung von Trainingsdaten für ihre Sammlungen, um die HTR-Verarbeitung im großen Maßstab vorzubereiten. Als erstes Ergebnis wird nun ein Modell auf Basis von 475.769 Wörtern für Transkribus-Nutzer zur Verfügung gestellt. Das Modell zeigt eine Zeichenfehlerrate von 7,48% auf dem Trainingsset und 6,15% auf dem Validierungsset. Es basiert auf der sorgfältigen Transkription von Dutzenden verschiedener Handschriften und umfasst Scans aus den Eingehenden Dokumenten der Niederländischen Ostindien-Kompanie (Overgekomen Brieven en Papieren van de VOC) des Nationalarchivs der Niederlande und von Notariatsurkunden des 19. Jahrhunderts aus dem Noord-Hollands archief.  Das Modell hat den Namen: NAN/NHA_GT_M3+ Viel Spaß!

 

 

DIESEN ARTIKEL TEILEN

Neueste Beiträge

19. September 2023
Transkribus
Wir freuen uns, die Veröffentlichung der Transkribus-Web-App im September 2023 bekannt geben zu können. Nach der erfolgreichen Umstellung auf die ...
30. August 2023
News, Transkribus
Heute ist die neue Transkribus Web-App offiziell gestartet! Transkribus hat schon immer daran gearbeitet, die Digitalisierung und Transkription von ...
21. August 2023
Transkribus Anwenderkonferenz
Die Transkribus User Conference 24 (15. und 16. Februar 2024, Innsbruck) lädt Interessierte, Nutzer, Wissenschaftler und Enthusiasten ein, sich mit dem ...