+ Allgemeines Modell für "Fraktur" freigegeben

Dank der Bibliothek Labore der Österreichische Nationalbibliothek und das NewsEye Projekt freuen wir uns, die Veröffentlichung eines freien Modells bekannt zu geben, das in der Lage ist, deutsche Frakturdokumente insbesondere aus dem 19. und 20. Jahrhundert in einer überzeugenden Qualität zu lesen, die die meisten Standard-OCR-Engines übertrifft. Das Modell basiert auf Trainingsdaten, die aus dem ANNO-Kollektion der Österreichischen Nationalbibliothek und umfasst 442.141 Wörter. Es zeigt einen CER von 1.55% auf dem Trainingsset und 1.65% auf dem Testset ohne jegliche Wörterbuchunterstützung. Hinweis: Das Modell wurde auf deutschsprachigen Dokumenten trainiert. Es wird weniger überzeugende Ergebnisse für andere Sprachen liefern, wie z. B. Schwedisch oder Finnisch Fraktur. Modelle für diese Sprachen sind jedoch ebenfalls in Vorbereitung und können in den kommenden Monaten veröffentlicht werden. Das Frakturmodell ist für jeden registrierten Benutzer in Transkribus verfügbar und heißt: ONB _Newseye_GT_M1+. Wir wünschen Ihnen viel Spaß!

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Mai 2, 2024
News, Transkribus, Uncategorized
Wenn Sie neu bei Transkribus sind, haben Sie wahrscheinlich eine Menge Fragen zur Plattform. Wie kann ich Dokumente transkribieren? Was ist ...
25. April 2024
News, Transkribus
Im Januar haben wir unsere neuen Abonnementpläne angekündigt: Einzelpersonen, Stipendiaten und Organisationen. Jeder Plan ist auf eine bestimmte ...
April 17, 2024
News, Transkribus
Einer der größten Vorteile von Transkribus ist die Möglichkeit, benutzerdefinierte Modelle zur Erkennung von handschriftlichem Text zu trainieren. Diese einzigartige Funktion ...