+ Was steht da am Rand geschrieben? Handschriftliche Texterkennung, Marginalien und John Stuart Mill

Manche Menschen sind entsetzt von dem Gedanken, Notizen auf die Seiten eines Buches zu schreiben. Doch für den englischen Philosophen John Stuart Mill (1806 - 1873) waren Randnotizen ein nützliches Mittel, um seine Gedanken und Beobachtungen beim Lesen festzuhalten.

Mills Büchersammlung befindet sich heute im Besitz von Somerville College an der Universität von Oxford. Die Sammlung John Stuart Mill besitzt mehr als 1500 Bücher, die einst im Besitz von Mill waren. Viele dieser Texte enthalten von Mill angefertigte Anmerkungen und Markierungen.

Die John Stuart Mill Collection, Somerville College, University of Oxford [Bild von Louise Seaward]
Die John Stuart Mill Collection, Somerville College, University of Oxford [Bild von Louise Seaward]

Das Somerville College führt derzeit in Zusammenarbeit mit der University of Alabama ein Projekt zur Digitalisierung und Kategorisierung dieser Marginalien. Diese Partner haben nun begonnen, mit Transkribus zusammenzuarbeiten, um die Handschrifterkennung auf Mills Kritzeleien anzuwenden.

READ-Partner vom Xerox Research Centre Europe und dem Computer Vision Lab der Technischen Universität Wien arbeiten mit Hunderten von Bildern aus der Mill-Sammlung. Ihr Ziel ist es, mit Hilfe von Document Understanding zwischen dem gedruckten und dem handschriftlichen Text auf den Seiten dieser Bücher zu unterscheiden und auch die handschriftliche Texterkennung zu nutzen, um die Kommentare zu transkribieren, die Mill in die Marginalien schrieb. Transkripte der Mill-Randbemerkungen wären eine unschätzbare Ressource für Wissenschaftler und würden die bevorstehende Mühlenranddatenbank.

Dies ist ein spannendes Experiment für das READ-Projekt, da die Methoden und Ergebnisse dieses Unterfangens auf andere Sammlungen anwendbar sein könnten, in denen Randbemerkungen auf gedruckten Texten erscheinen. Viele andere Schriftsteller, darunter Oscar Wilde und Mark Twain, waren gewohnheitsmäßige Annotatoren und die Technologie des READ-Projekts könnte uns helfen zu verstehen, wie sie Bücher und Artikel gelesen, verarbeitet und verstanden haben.

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Juli 3, 2024
News, Transkribus
Einige Transkribus-Projekte enden mit einer vollständig digitalisierten Sammlung in Transkribus. Andere nehmen diese digitalisierte Quelle und verwenden sie ...
Juni 12, 2024
News, Transkribus
Wenn man an karolingische (oder karolingische) Minuskeln denkt, kommen einem wahrscheinlich Karl der Große und sein riesiges karolingisches Reich in den Sinn. Während die ...
Mai 14, 2024
Uncategorized
Das Verstehen historischer Dokumente ist der Schlüssel zum Verständnis der Geschichte. Das Verstehen historischer Dokumente auf Polnisch kann jedoch eine Herausforderung sein. Nicht nur ...