Es war ein sonniger Dienstagmorgen, als das READ-Projekt in der Centre for Research in the Arts, Social Sciences and Humanities (CRASSH) im Universität von Cambridge für unseren neuesten Workshop. Louise Seaward (Bentham-Projekt, University College London) und Sebastian Colutto (Universität Innsbruck) hielt einen Vortrag und Workshop zur automatischen Texterkennung für handgeschriebenen und gedruckten Text.
Während Sebastian einen technischen Überblick darüber gab, wie unser Transkribus-Plattform für die automatische Texterkennung genutzt werden kann, erläuterte Louise die potenziellen Vorteile der automatischen Transkription und Suche von Dokumenten aus der Perspektive eines Historikers. Anschließend führte das Team einen praktischen Workshop durch, bei dem Mitarbeiter und Studenten der Universität Transkribus in die Hand nehmen konnten. Die Teilnehmer erfuhren, wie Computer auf die Erkennung von Handschriften trainiert werden können und wie genau diese Erkennung sein kann. Großes Interesse bestand auch an neuen Methoden zur automatischen Erkennung von gedrucktem Text, die noch bessere Ergebnisse als die Optical Character Recognition (OCR) liefern können!
Die Veranstaltung war Teil von 'Maschine liest das Archiv', ein Trainings- und Entwicklungsprogramm für digitale Methoden, das von Cambridge Digital Humanities Network, Cambridge Big Data und dem Cambridge Digital History Programme organisiert wird. Das READ-Projekt freut sich darauf, in Zukunft wieder zu diesem Programm beizutragen!