La Biblioteca Britannica, uno dei progetti READ Partner del memorandum d'intesaha lavorato con Transkribus per elaborare i record dal Ufficio India. Questa collezione si riferisce in gran parte all'amministrazione londinese della Compagnia delle Indie Orientali e al governo dell'India prima del 1947.
La British Library ha iniziato a sperimentare la tecnologia Transkribus nel 2015. Il layout complesso di alcuni documenti e il numero di mani diverse significa che questa collezione rappresenta una sfida per l'elaborazione automatica. Ma gli ultimi risultati mostrano che un modello di Automated Text Recognition può trascrivere le pagine con un soddisfacente Character Error Rate (CER) di 15%.
Alex Hailey, curatore degli archivi moderni e dei manoscritti, spiega meglio i progressi e le lezioni apprese nel suo post sul blog della British Library Borsa di studio digitale blog.