+ Neuer Artikel über die automatische Transkription und Suche von Dokumenten aus dem siebzehnten Jahrhundert

Die Mustererkennung und menschliche Sprachtechnologie Forschungsgruppe an der Universitat Politècnica de València (einer der READ-Projektpartner) haben veröffentlicht ein Artikel, der ihre Arbeit bei der Verarbeitung botanischer Dokumente aus dem siebzehnten Jahrhundert untersucht in der neuesten Ausgabe von Digital Scholarship in den Geisteswissenschaften.

Der Artikel erklärt, wie das Team Techniken der Layoutanalyse, Textzeilenerkennung und automatischen Transkription auf ein handgeschriebenes Buch des spanischen Botanikers Bernardo de Cienfuegos anwandte.

Das 1000-seitige Werk ist nun vollständig transkribiert und durchsuchbar. Neben diesem beeindruckenden Ergebnis weist der Artikel auch darauf hin, dass das Experiment nützliches Feedback zur Interaktion zwischen menschlichen Transkribierern und automatischer Texterkennungstechnologie generiert hat.

  • Alejandro H Toselli, Luis A Leiva, Isabel Bordes-Cabrera, Celio Hernández-Tornero, Vicent Bosch, Enrique Vidal, 'Transcribing a 17th-century botanical manuscript: Longitudinal evaluation of document layout detection and interactive transcription', Digital Scholarship in den Geisteswissenschaften, 33, 1, April 2018, 173-202 https://doi.org/10.1093/llc/fqw064
DIESEN ARTIKEL TEILEN

Neueste Beiträge

Juli 3, 2024
News, Transkribus
Einige Transkribus-Projekte enden mit einer vollständig digitalisierten Sammlung in Transkribus. Andere nehmen diese digitalisierte Quelle und verwenden sie ...
Juni 12, 2024
News, Transkribus
Wenn man an karolingische (oder karolingische) Minuskeln denkt, kommen einem wahrscheinlich Karl der Große und sein riesiges karolingisches Reich in den Sinn. Während die ...
Mai 14, 2024
Uncategorized
Das Verstehen historischer Dokumente ist der Schlüssel zum Verständnis der Geschichte. Das Verstehen historischer Dokumente auf Polnisch kann jedoch eine Herausforderung sein. Nicht nur ...