Lo strumento Riconoscimento dei modelli e tecnologia del linguaggio umano gruppo di ricerca dell'Universitat Politècnica de València (uno dei LEGGI i partner del progetto) hanno pubblicato un articolo che esplora il loro lavoro di elaborazione di documenti botanici del XVII secolo nell'ultimo numero di Borsa di studio digitale nelle scienze umane.
L'articolo spiega come il team ha applicato tecniche di analisi del layout, rilevamento delle linee di testo e trascrizione automatica a un libro scritto a mano dal botanico spagnolo Bernardo de Cienfuegos.
Il lavoro di 1000 pagine è ora completamente trascritto e ricercabile. Oltre a questo risultato impressionante, l'articolo sottolinea anche che l'esperimento ha generato un utile feedback sull'interazione tra trascrittori umani e tecnologia di riconoscimento automatico del testo.
- Alejandro H Toselli, Luis A Leiva, Isabel Bordes-Cabrera, Celio Hernández-Tornero, Vicent Bosch, Enrique Vidal, 'Transcribing a 17th-century botanical manuscript: Valutazione longitudinale del rilevamento del layout del documento e della trascrizione interattiva', Borsa di studio digitale nelle scienze umane, 33, 1, aprile 2018, 173-202 https://doi.org/10.1093/llc/fqw064