Die Projekt Bentham am University College London, das an der wissenschaftlichen Edition der Schriften des britischen Philosophen Jeremy Bentham arbeitet, hat sich in den letzten zehn Jahren zunehmend mit digitalen Geisteswissenschaften beschäftigt. Das Projekt hat die Digitalisierung von Tausenden von Bentham-Manuskripten vorgenommen und 2010 eine der ersten akademischen Crowdsourcing-Initiativen gestartet, Bentham umschreiben. Spannende Experimente mit der Handwritten Text Recognition (HTR) wurden in den letzten Jahren ebenfalls durchgeführt.
Mit rund 900 Seiten Bentham-Material wurde ein erstes HTR-Modell mit sehr guten Ergebnissen trainiert. Das Modell 'English Writing M1' kann Seiten, die von Bentham und seinen Sekretären in einer relativ sauberen Handschrift geschrieben wurden, mit einer beeindruckenden Zeichenfehlerrate (CER) von 5-10% erkennen. Dieses Modell ist öffentlich verfügbar in Transkribus und kann auf englische Handschriften aus den 1800er und 1900er Jahren mit schönen Ergebnissen angewendet werden.
Das Bentham-Projekt arbeitet nun an der Verbesserung der automatischen Erkennung von Benthams schwierigster Handschrift - geschrieben zu einer Zeit, als der Philosoph in seinen Achtzigern war und sein Augenlicht verlor. Erste Ergebnisse zeigen eine vielversprechende CER von 26%, die eine sehr gute Basis für Schlüsselwort-Spotting als Forschungsinstrument für Wissenschaftler, die sich für Benthams Ideen interessieren.
Erfahren Sie mehr auf der Bentham-Blog umschreiben!