+ Allgemeines Modell für "Fraktur" freigegeben

Dank der Bibliothek Labore der Österreichische Nationalbibliothek und das NewsEye Projekt freuen wir uns, die Veröffentlichung eines freien Modells bekannt zu geben, das in der Lage ist, deutsche Frakturdokumente insbesondere aus dem 19. und 20. Jahrhundert in einer überzeugenden Qualität zu lesen, die die meisten Standard-OCR-Engines übertrifft. Das Modell basiert auf Trainingsdaten, die aus dem ANNO-Kollektion der Österreichischen Nationalbibliothek und umfasst 442.141 Wörter. Es zeigt einen CER von 1.55% auf dem Trainingsset und 1.65% auf dem Testset ohne jegliche Wörterbuchunterstützung. Hinweis: Das Modell wurde auf deutschsprachigen Dokumenten trainiert. Es wird weniger überzeugende Ergebnisse für andere Sprachen liefern, wie z. B. Schwedisch oder Finnisch Fraktur. Modelle für diese Sprachen sind jedoch ebenfalls in Vorbereitung und können in den kommenden Monaten veröffentlicht werden. Das Frakturmodell ist für jeden registrierten Benutzer in Transkribus verfügbar und heißt: ONB _Newseye_GT_M1+. Wir wünschen Ihnen viel Spaß!

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Juli 3, 2024
News, Transkribus
Einige Transkribus-Projekte enden mit einer vollständig digitalisierten Sammlung in Transkribus. Andere nehmen diese digitalisierte Quelle und verwenden sie ...
Juni 12, 2024
News, Transkribus
Wenn man an karolingische (oder karolingische) Minuskeln denkt, kommen einem wahrscheinlich Karl der Große und sein riesiges karolingisches Reich in den Sinn. Während die ...
Mai 14, 2024
Uncategorized
Das Verstehen historischer Dokumente ist der Schlüssel zum Verständnis der Geschichte. Das Verstehen historischer Dokumente auf Polnisch kann jedoch eine Herausforderung sein. Nicht nur ...