Manche Menschen sind entsetzt von dem Gedanken, Notizen auf die Seiten eines Buches zu schreiben. Doch für den englischen Philosophen John Stuart Mill (1806 - 1873) waren Randnotizen ein nützliches Mittel, um seine Gedanken und Beobachtungen beim Lesen festzuhalten.
Mills Büchersammlung befindet sich heute im Besitz von Somerville College an der Universität von Oxford. Die Sammlung John Stuart Mill besitzt mehr als 1500 Bücher, die einst im Besitz von Mill waren. Viele dieser Texte enthalten von Mill angefertigte Anmerkungen und Markierungen.
Das Somerville College führt derzeit in Zusammenarbeit mit der University of Alabama ein Projekt zur Digitalisierung und Kategorisierung dieser Marginalien. Diese Partner haben nun begonnen, mit Transkribus zusammenzuarbeiten, um die Handschrifterkennung auf Mills Kritzeleien anzuwenden.
READ-Partner vom Xerox Research Centre Europe und dem Computer Vision Lab der Technischen Universität Wien arbeiten mit Hunderten von Bildern aus der Mill-Sammlung. Ihr Ziel ist es, mit Hilfe von Document Understanding zwischen dem gedruckten und dem handschriftlichen Text auf den Seiten dieser Bücher zu unterscheiden und auch die handschriftliche Texterkennung zu nutzen, um die Kommentare zu transkribieren, die Mill in die Marginalien schrieb. Transkripte der Mill-Randbemerkungen wären eine unschätzbare Ressource für Wissenschaftler und würden die bevorstehende Mühlenranddatenbank.
Dies ist ein spannendes Experiment für das READ-Projekt, da die Methoden und Ergebnisse dieses Unterfangens auf andere Sammlungen anwendbar sein könnten, in denen Randbemerkungen auf gedruckten Texten erscheinen. Viele andere Schriftsteller, darunter Oscar Wilde und Mark Twain, waren gewohnheitsmäßige Annotatoren und die Technologie des READ-Projekts könnte uns helfen zu verstehen, wie sie Bücher und Artikel gelesen, verarbeitet und verstanden haben.