+ Allgemeines Modell für "Fraktur" freigegeben

Dank der Bibliothek Labore der Österreichische Nationalbibliothek und das NewsEye Projekt freuen wir uns, die Veröffentlichung eines freien Modells bekannt zu geben, das in der Lage ist, deutsche Frakturdokumente insbesondere aus dem 19. und 20. Jahrhundert in einer überzeugenden Qualität zu lesen, die die meisten Standard-OCR-Engines übertrifft. Das Modell basiert auf Trainingsdaten, die aus dem ANNO-Kollektion der Österreichischen Nationalbibliothek und umfasst 442.141 Wörter. Es zeigt einen CER von 1.55% auf dem Trainingsset und 1.65% auf dem Testset ohne jegliche Wörterbuchunterstützung. Hinweis: Das Modell wurde auf deutschsprachigen Dokumenten trainiert. Es wird weniger überzeugende Ergebnisse für andere Sprachen liefern, wie z. B. Schwedisch oder Finnisch Fraktur. Modelle für diese Sprachen sind jedoch ebenfalls in Vorbereitung und können in den kommenden Monaten veröffentlicht werden. Das Frakturmodell ist für jeden registrierten Benutzer in Transkribus verfügbar und heißt: ONB _Newseye_GT_M1+. Wir wünschen Ihnen viel Spaß!

DIESEN ARTIKEL TEILEN

Neueste Beiträge

März 29, 2023
Uncategorized
Die meisten Transkribus-Modelle sind außerdem darauf trainiert, nur eine Sprache zu lesen - schließlich sind die meisten historischen Dokumente ...
März 23, 2023
Transkribus
Gehen Sie in ein beliebiges Geschichtsmuseum oder lesen Sie ein Geschichtsbuch, und Sie werden feststellen, dass viele der Geschichten und Ereignisse ...
März 15, 2023
Uncategorized
Von Fiona Park Nicht jeder, der sich mit Geschichte beschäftigt, ist ein professioneller Historiker. Von Hobby-Genealogen bis hin zu Freiwilligen in lokalen ...