+ Was steht da am Rand geschrieben? Handschriftliche Texterkennung, Marginalien und John Stuart Mill

Manche Menschen sind entsetzt von dem Gedanken, Notizen auf die Seiten eines Buches zu schreiben. Doch für den englischen Philosophen John Stuart Mill (1806 - 1873) waren Randnotizen ein nützliches Mittel, um seine Gedanken und Beobachtungen beim Lesen festzuhalten.

Mills Büchersammlung befindet sich heute im Besitz von Somerville College an der Universität von Oxford. Die Sammlung John Stuart Mill besitzt mehr als 1500 Bücher, die einst im Besitz von Mill waren. Viele dieser Texte enthalten von Mill angefertigte Anmerkungen und Markierungen.

Die John Stuart Mill Collection, Somerville College, University of Oxford [Bild von Louise Seaward]
Die John Stuart Mill Collection, Somerville College, University of Oxford [Bild von Louise Seaward]

Das Somerville College führt derzeit in Zusammenarbeit mit der University of Alabama ein Projekt zur Digitalisierung und Kategorisierung dieser Marginalien. Diese Partner haben nun begonnen, mit Transkribus zusammenzuarbeiten, um die Handschrifterkennung auf Mills Kritzeleien anzuwenden.

READ-Partner vom Xerox Research Centre Europe und dem Computer Vision Lab der Technischen Universität Wien arbeiten mit Hunderten von Bildern aus der Mill-Sammlung. Ihr Ziel ist es, mit Hilfe von Document Understanding zwischen dem gedruckten und dem handschriftlichen Text auf den Seiten dieser Bücher zu unterscheiden und auch die handschriftliche Texterkennung zu nutzen, um die Kommentare zu transkribieren, die Mill in die Marginalien schrieb. Transkripte der Mill-Randbemerkungen wären eine unschätzbare Ressource für Wissenschaftler und würden die bevorstehende Mühlenranddatenbank.

Dies ist ein spannendes Experiment für das READ-Projekt, da die Methoden und Ergebnisse dieses Unterfangens auf andere Sammlungen anwendbar sein könnten, in denen Randbemerkungen auf gedruckten Texten erscheinen. Viele andere Schriftsteller, darunter Oscar Wilde und Mark Twain, waren gewohnheitsmäßige Annotatoren und die Technologie des READ-Projekts könnte uns helfen zu verstehen, wie sie Bücher und Artikel gelesen, verarbeitet und verstanden haben.

DIESEN ARTIKEL TEILEN

Neueste Beiträge

25. April 2024
News, Transkribus
Im Januar haben wir unsere neuen Abonnementpläne angekündigt: Einzelpersonen, Stipendiaten und Organisationen. Jeder Plan ist auf eine bestimmte ...
April 17, 2024
News, Transkribus
Einer der größten Vorteile von Transkribus ist die Möglichkeit, benutzerdefinierte Modelle zur Erkennung von handschriftlichem Text zu trainieren. Diese einzigartige Funktion ...
4. April 2024
News
Der Frühling hat begonnen und damit auch die Veröffentlichung von Transkribus im April 2024. Hier ist ein kurzer Überblick über alle ...