Alcune persone sono inorridite dal pensiero di scrivere note sulle pagine dei libri. Ma per il filosofo inglese John Stuart Mill (1806 - 1873), le note marginali erano un modo utile per registrare i suoi pensieri e osservazioni mentre leggeva.
La collezione di libri di Mill è ora in possesso di Somerville College dell'Università di Oxford. Il John Stuart Mill Collection detiene più di 1500 libri che un tempo appartenevano a Mill. Molti di questi testi contengono annotazioni e segni fatti da Mill.
Il Somerville College, in collaborazione con l'Università dell'Alabama, sta attualmente intraprendendo un progetto di digitalizzazione e categorizzazione di questi marginalia. Questi partner hanno ora iniziato a lavorare con Transkribus, al fine di applicare il riconoscimento del testo scritto a mano agli scarabocchi di Mill.
I partner READ dello Xerox Research Centre Europe e il Computer Vision Lab della Vienna Technical University stanno lavorando con centinaia di immagini della collezione Mill. Il loro obiettivo è quello di usare la comprensione del documento per distinguere tra il testo stampato e quello scritto a mano sulle pagine di questi libri e anche usare il riconoscimento del testo scritto a mano per trascrivere i commenti che Mill ha scritto nei margini. Le trascrizioni dei margini di Mill sarebbero una risorsa inestimabile per gli studiosi e completerebbero l'imminente Banca dati dei marginalia del mulino.
Questo è un esperimento eccitante per il progetto READ, poiché i metodi e i risultati di questo sforzo potrebbero essere applicabili ad altre collezioni in cui appaiono annotazioni marginali su testi stampati. Molti altri scrittori, tra cui Oscar Wilde e Mark Twain, erano annotatori abituali e la tecnologia del progetto READ potrebbe aiutarci a capire come hanno letto, elaborato e compreso libri e articoli.