+ Blog post from The British Library - Handwritten Text Recognition of India Office Records

La Biblioteca Britannica, uno dei progetti READ Partner del memorandum d'intesaha lavorato con Transkribus per elaborare i record dal Ufficio India. Questa collezione si riferisce in gran parte all'amministrazione londinese della Compagnia delle Indie Orientali e al governo dell'India prima del 1947.

La British Library ha iniziato a sperimentare la tecnologia Transkribus nel 2015. Il layout complesso di alcuni documenti e il numero di mani diverse significa che questa collezione rappresenta una sfida per l'elaborazione automatica. Ma gli ultimi risultati mostrano che un modello di Automated Text Recognition può trascrivere le pagine con un soddisfacente Character Error Rate (CER) di 15%.

Alex Hailey, curatore degli archivi moderni e dei manoscritti, spiega meglio i progressi e le lezioni apprese nel suo post sul blog della British Library Borsa di studio digitale blog.

CONDIVIDI QUESTO ARTICOLO

Messaggi recenti

20 giugno 2022
Transkribus
Di Joe Nockels, Università di Edimburgo Nell'ambito della sua ricerca di dottorato presso l'Università di Edimburgo e la National Library ...
15 giugno 2022
Transkribus, Webinar
Siamo entusiasti di lanciare la nostra nuova serie di webinar "Ask Us Anything", in cui i partecipanti possono chiederci qualsiasi cosa ...
Giugno 9, 2022
Uncategorized
La nuova funzione di condivisione potrebbe essere un piccolo pulsante per una schermata, ma è una grande funzione per ...