+ Transkribus HTR im OCR-Test der Universität Zürich

Mitglieder der Universität Zürich verglichen zwei Versionen des ABBYY FineReader (FineReader XIX und FineReader Server 11) OCR (Optical Character Recognition) und die Transkribus HTR (Handwritten Text Recognition), um herauszufinden, welche die effektivste ist, wenn es um die Erkennungsergebnisse auf schwarzen Buchstaben in historischen Zeitungen geht. Für den Test verwendeten sie PDFs mit Bildern mittlerer Auflösung der deutschsprachigen Neue Zürcher Zeitung.

Die Erkennung von Schwarzschrift in historischen Zeitungen kann eine besondere Herausforderung sein, da die Unterscheidungskraft der Zeichen oft gering ist, die Papierqualität schlecht sein kann und in vielen Fällen kleine Schriftgrößen verwendet werden. Systeme wie ABBYY FineReader und Transkribus arbeiten an der Bewältigung solcher Probleme. Wir freuen uns, dass das Experiment der Universität Zürich zeigt, dass Transkribus deutlich bessere Ergebnisse liefert als das kommerzielle System ABBYY FineReader.

Der Artikel erläutert die Effektivität des HTR, da nur ein bescheidener manueller Aufwand für die Erstellung der Ground Truth erforderlich ist, was die Anwendung des HTR auf Dokumente ermöglicht. Gerade bei gedruckten Texten in Zeitungen sind die Fehlerraten in Transkribus meist gering. Außerdem zeigt der Test, dass das Modell, das für die Neue Zürcher Zeitunglieferte auch für andere Zeitungen der gleichen Epoche gute Ergebnisse, wie die Bundesblatt und das Neue Zuger Zeitung. Die gute Nachricht ist, dass das Modell des Neue Zürcher Zeitung wird im Laufe des Jahres 2019 veröffentlicht werden.

Wenn Sie sich das Experiment genauer ansehen möchten, finden Sie den ganzen Artikel hier: https://dev.clariah.nl/files/dh2019/boa/0694.html

Quelle: https://dev.clariah.nl/files/dh2019/boa/0694.html

DIESEN ARTIKEL TEILEN

Neueste Beiträge

4. April 2024
News
Der Frühling hat begonnen und damit auch die Veröffentlichung von Transkribus im April 2024. Hier ist ein kurzer Überblick über alle ...
3. April 2024
News
Man kann viel über die französische Geschichte lernen, wenn man Bücher liest oder Dokumentarfilme sieht. Diese Arten von Quellen sind gut für ...
Feber 28, 2024
News, Transkribus
Mit über 80 Referenten aus rund 40 Ländern, spannenden Vorträgen und nachdenklichen Diskussionen hat uns die Transkribus 2024 User Conference ...