Il futuro dell'estrazione delle informazioni - Partecipa al progetto TUC 2024! ✨ 15-16 febbraio, di persona e online. Ottieni il tuo biglietto >>

+ Blog post from The British Library - Handwritten Text Recognition of India Office Records

La Biblioteca Britannica, uno dei progetti READ Partner del memorandum d'intesaha lavorato con Transkribus per elaborare i record dal Ufficio India. Questa collezione si riferisce in gran parte all'amministrazione londinese della Compagnia delle Indie Orientali e al governo dell'India prima del 1947.

La British Library ha iniziato a sperimentare la tecnologia Transkribus nel 2015. Il layout complesso di alcuni documenti e il numero di mani diverse significa che questa collezione rappresenta una sfida per l'elaborazione automatica. Ma gli ultimi risultati mostrano che un modello di Automated Text Recognition può trascrivere le pagine con un soddisfacente Character Error Rate (CER) di 15%.

Alex Hailey, curatore degli archivi moderni e dei manoscritti, spiega meglio i progressi e le lezioni apprese nel suo post sul blog della British Library Borsa di studio digitale blog.

CONDIVIDI QUESTO ARTICOLO

Post recenti

31 gennaio 2024
News
Siamo lieti di annunciare gli ultimi aggiornamenti del nostro editor di documenti, con un'interfaccia più intuitiva e pulita. Il nostro ...
17 gennaio 2024
News, Transkribus
È necessario trascrivere o tradurre un testo scritto a mano per poter lavorare con esso? Beh, dipende da ...
11 gennaio 2024
News, Transkribus
Il processo di gestione e pubblicazione dei documenti storici non è mai stato così semplice! Creare un sito web che presenti il vostro materiale trascritto ...