+ Neuer Artikel über die automatische Transkription und Suche von Dokumenten aus dem siebzehnten Jahrhundert

Die Mustererkennung und menschliche Sprachtechnologie Forschungsgruppe an der Universitat Politècnica de València (einer der READ-Projektpartner) haben veröffentlicht ein Artikel, der ihre Arbeit bei der Verarbeitung botanischer Dokumente aus dem siebzehnten Jahrhundert untersucht in der neuesten Ausgabe von Digital Scholarship in den Geisteswissenschaften.

Der Artikel erklärt, wie das Team Techniken der Layoutanalyse, Textzeilenerkennung und automatischen Transkription auf ein handgeschriebenes Buch des spanischen Botanikers Bernardo de Cienfuegos anwandte.

Das 1000-seitige Werk ist nun vollständig transkribiert und durchsuchbar. Neben diesem beeindruckenden Ergebnis weist der Artikel auch darauf hin, dass das Experiment nützliches Feedback zur Interaktion zwischen menschlichen Transkribierern und automatischer Texterkennungstechnologie generiert hat.

  • Alejandro H Toselli, Luis A Leiva, Isabel Bordes-Cabrera, Celio Hernández-Tornero, Vicent Bosch, Enrique Vidal, 'Transcribing a 17th-century botanical manuscript: Longitudinal evaluation of document layout detection and interactive transcription', Digital Scholarship in den Geisteswissenschaften, 33, 1, April 2018, 173-202 https://doi.org/10.1093/llc/fqw064
DIESEN ARTIKEL TEILEN

Neueste Beiträge

April 17, 2024
News, Transkribus
Einer der größten Vorteile von Transkribus ist die Möglichkeit, benutzerdefinierte Modelle zur Erkennung von handschriftlichem Text zu trainieren. Diese einzigartige Funktion ...
4. April 2024
News
Der Frühling hat begonnen und damit auch die Veröffentlichung von Transkribus im April 2024. Hier ist ein kurzer Überblick über alle ...
3. April 2024
News
Man kann viel über die französische Geschichte lernen, wenn man Bücher liest oder Dokumentarfilme sieht. Diese Arten von Quellen sind gut für ...