+ Blog post from The British Library - Handwritten Text Recognition of India Office Records

La Biblioteca Britannica, uno dei progetti READ Partner del memorandum d'intesaha lavorato con Transkribus per elaborare i record dal Ufficio India. Questa collezione si riferisce in gran parte all'amministrazione londinese della Compagnia delle Indie Orientali e al governo dell'India prima del 1947.

La British Library ha iniziato a sperimentare la tecnologia Transkribus nel 2015. Il layout complesso di alcuni documenti e il numero di mani diverse significa che questa collezione rappresenta una sfida per l'elaborazione automatica. Ma gli ultimi risultati mostrano che un modello di Automated Text Recognition può trascrivere le pagine con un soddisfacente Character Error Rate (CER) di 15%.

Alex Hailey, curatore degli archivi moderni e dei manoscritti, spiega meglio i progressi e le lezioni apprese nel suo post sul blog della British Library Borsa di studio digitale blog.

CONDIVIDI QUESTO ARTICOLO

Post recenti

3 luglio 2024
News, Transkribus
Alcuni progetti Transkribus terminano con una collezione completa digitalizzata in Transkribus. Alcuni prendono la fonte digitalizzata e la usano per ...
12 giugno 2024
News, Transkribus
Quando si pensa alla minuscola carolingia (o carolina), probabilmente vengono in mente Carlo Magno e il suo vasto impero carolingio. Mentre il ...
14 maggio 2024
Uncategorized
La comprensione dei documenti storici è fondamentale per capire la storia. Ma capire i documenti storici in polacco può essere una sfida. Non solo ...