+ Englische Radtagebücher von der University of Warwick anerkannt

Wir haben ein paar tolle Ergebnisse zu einer interessanten Dokumentensammlung zu berichten, die im Modernes Aufzeichnungszentrum an der Universität von Warwick.

Die Archivarin Elizabeth Wood und ihr Team haben kürzlich ein Modell zur Erkennung von handgeschriebenem Text (Handwritten Text Recognition, HTR) trainiert, um die Schrift in einer Sammlung von Radtagebüchern zu erkennen, die von David Allan Hamilton im frühen 20.

Die Seiten aus Hamiltons Tagebuch sind klein und häufig mit Fotos, Karten und Skizzen vom Leben auf der Straße unterbrochen. Das bedeutete, dass das Team in Warwick beschloss, eine größere Anzahl von transkribierten Seiten einzureichen, um ihr Modell zu trainieren.

Das Hamilton-Modell wurde auf etwa 200 transkribierten Seiten (mit fast 20.000 Wörtern) aus einem Band von Hamiltons Tagebüchern trainiert.

Die mit diesem Modell erstellten automatischen Transkripte haben eine sehr beeindruckende Zeichenfehlerrate von nur 5% - das bedeutet, dass durchschnittlich 95% Zeichen vom Computer korrekt transkribiert werden.

Screenshot der automatischen Transkription in Transkribus. Seite aus dem Tagebuch von David Allan Hamilton, 1916-1923, aus dem National Cycle Archive, Modern Records Centre, University of Warwick [Aktenzeichen: MSS.328/N93/1].
Das Team des Modern Records Centre arbeitet derzeit mit den automatisierten Transkripten und prüft auch die Möglichkeit, neue Modelle für die Verarbeitung anderer Tagebücher in ihren Beständen zu trainieren.

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Mai 2, 2024
News, Transkribus, Uncategorized
Wenn Sie neu bei Transkribus sind, haben Sie wahrscheinlich eine Menge Fragen zur Plattform. Wie kann ich Dokumente transkribieren? Was ist ...
25. April 2024
News, Transkribus
Im Januar haben wir unsere neuen Abonnementpläne angekündigt: Einzelpersonen, Stipendiaten und Organisationen. Jeder Plan ist auf eine bestimmte ...
April 17, 2024
News, Transkribus
Einer der größten Vorteile von Transkribus ist die Möglichkeit, benutzerdefinierte Modelle zur Erkennung von handschriftlichem Text zu trainieren. Diese einzigartige Funktion ...