+ Allgemeines Modell für "Fraktur" freigegeben

Dank der Bibliothek Labore der Österreichische Nationalbibliothek und das NewsEye Projekt freuen wir uns, die Veröffentlichung eines freien Modells bekannt zu geben, das in der Lage ist, deutsche Frakturdokumente insbesondere aus dem 19. und 20. Jahrhundert in einer überzeugenden Qualität zu lesen, die die meisten Standard-OCR-Engines übertrifft. Das Modell basiert auf Trainingsdaten, die aus dem ANNO-Kollektion der Österreichischen Nationalbibliothek und umfasst 442.141 Wörter. Es zeigt einen CER von 1.55% auf dem Trainingsset und 1.65% auf dem Testset ohne jegliche Wörterbuchunterstützung. Hinweis: Das Modell wurde auf deutschsprachigen Dokumenten trainiert. Es wird weniger überzeugende Ergebnisse für andere Sprachen liefern, wie z. B. Schwedisch oder Finnisch Fraktur. Modelle für diese Sprachen sind jedoch ebenfalls in Vorbereitung und können in den kommenden Monaten veröffentlicht werden. Das Frakturmodell ist für jeden registrierten Benutzer in Transkribus verfügbar und heißt: ONB _Newseye_GT_M1+. Wir wünschen Ihnen viel Spaß!

DIESEN ARTIKEL TEILEN

Neueste Beiträge

April 17, 2024
News, Transkribus
Einer der größten Vorteile von Transkribus ist die Möglichkeit, benutzerdefinierte Modelle zur Erkennung von handschriftlichem Text zu trainieren. Diese einzigartige Funktion ...
4. April 2024
News
Der Frühling hat begonnen und damit auch die Veröffentlichung von Transkribus im April 2024. Hier ist ein kurzer Überblick über alle ...
3. April 2024
News
Man kann viel über die französische Geschichte lernen, wenn man Bücher liest oder Dokumentarfilme sieht. Diese Arten von Quellen sind gut für ...