+ Allgemeines Modell für "Fraktur" freigegeben

Dank der Bibliothek Labore der Österreichische Nationalbibliothek und das NewsEye Projekt freuen wir uns, die Veröffentlichung eines freien Modells bekannt zu geben, das in der Lage ist, deutsche Frakturdokumente insbesondere aus dem 19. und 20. Jahrhundert in einer überzeugenden Qualität zu lesen, die die meisten Standard-OCR-Engines übertrifft. Das Modell basiert auf Trainingsdaten, die aus dem ANNO-Kollektion der Österreichischen Nationalbibliothek und umfasst 442.141 Wörter. Es zeigt einen CER von 1.55% auf dem Trainingsset und 1.65% auf dem Testset ohne jegliche Wörterbuchunterstützung. Hinweis: Das Modell wurde auf deutschsprachigen Dokumenten trainiert. Es wird weniger überzeugende Ergebnisse für andere Sprachen liefern, wie z. B. Schwedisch oder Finnisch Fraktur. Modelle für diese Sprachen sind jedoch ebenfalls in Vorbereitung und können in den kommenden Monaten veröffentlicht werden. Das Frakturmodell ist für jeden registrierten Benutzer in Transkribus verfügbar und heißt: ONB _Newseye_GT_M1+. Wir wünschen Ihnen viel Spaß!

DIESEN ARTIKEL TEILEN

Neueste Beiträge

November 17, 2022
Transkribus
Wir freuen uns sehr, Ihnen mitteilen zu können, dass wir gestern 100.000 Nutzer auf der Transkribus-Plattform erreicht haben! Trotz unserer jahrelangen, sehr ...
August 12, 2022
Erkennung von handgeschriebenem Text
Hatten Sie schon einmal Probleme, die Handschrift einer anderen Person zu lesen? Vielleicht beruhigt es Sie zu wissen, dass es nicht nur Menschen sind, die ...
22. Juli 2022
Uncategorized
Die neueste Version von Transkribus Lite ist da und bringt eine Reihe von neuen Funktionen. Hier sind die wichtigsten ...