+ Blog post from The British Library - Handwritten Text Recognition of India Office Records

La Biblioteca Britannica, uno dei progetti READ Partner del memorandum d'intesaha lavorato con Transkribus per elaborare i record dal Ufficio India. Questa collezione si riferisce in gran parte all'amministrazione londinese della Compagnia delle Indie Orientali e al governo dell'India prima del 1947.

La British Library ha iniziato a sperimentare la tecnologia Transkribus nel 2015. Il layout complesso di alcuni documenti e il numero di mani diverse significa che questa collezione rappresenta una sfida per l'elaborazione automatica. Ma gli ultimi risultati mostrano che un modello di Automated Text Recognition può trascrivere le pagine con un soddisfacente Character Error Rate (CER) di 15%.

Alex Hailey, curatore degli archivi moderni e dei manoscritti, spiega meglio i progressi e le lezioni apprese nel suo post sul blog della British Library Borsa di studio digitale blog.

CONDIVIDI QUESTO ARTICOLO

Post recenti

17 novembre 2022
Transkribus
Siamo entusiasti di annunciare che ieri abbiamo raggiunto i 100.000 utenti sulla piattaforma Transkribus! Anche con i nostri anni di grande ...
12 agosto 2022
Riconoscimento del testo scritto a mano
Avete mai avuto problemi a leggere la scrittura di qualcun altro? Beh, potrebbe rassicurarvi sapere che non sono solo gli esseri umani a ...
22 luglio 2022
Uncategorized
L'ultima versione di Transkribus Lite è arrivata e porta con sé una serie di nuove funzioni. Ecco le più importanti ...