+ Transkribieren von Foucaults Handschrift mit Transkribus

Eine spannende Neuigkeit ist, dass Transkribus begonnen hat, sich mit den Schriften des bahnbrechenden französischen Philosophen Michel Foucault auseinanderzusetzen.

Das Team der Foucault fiches de lecture (Foucault's Reading Notes) haben ein Modell trainiert, das die Schrift des Philosophen mit einer Genauigkeit von etwa 90% erkennt. Die automatisierten Transkripte werden für das Ziel des Projekts von entscheidender Bedeutung sein: die Analyse und den Online-Zugang zu der großen Sammlung von Foucaults Vorlesungsverzeichnisse (organisierte Zitate, Referenzen und Kommentare) in der Bibliothèque nationale de France.

Mitglieder des Projektteams, Marie-Laure Massot, Arianna Sforzini und Vincent Ventresque, haben einen ausführlicher Bericht (auf Französisch) die ihre Experimente mit Transkribus zusammenfassen und erklären, wie sie planen, diese automatisierten Transkripte Forschern zur Verfügung zu stellen.

In einem ersten Test trainierte das Team ein automatisches Texterkennungsmodell, indem es Transkribus zur Segmentierung und Transkription von 200 digitalisierten Bildern von Foucaults Handschrift verwendete. Dieses erste Modell war in der Lage, Transkripte mit einer Zeichenfehlerrate von 15% zu erzeugen (d.h. 85% der von Transkribus korrekt transkribierten Zeichen).

Dann erweiterten sie ihr Trainingsset auf 600 Bilder von Foucaults Schriften, die Notizen zu folgenden Themen enthielten  La volonté de savoir, Teil von Foucaults vierbändigem Werk über die Geschichte der Sexualität. Dieser größere Satz von Ground Truth führte zu deutlich besseren Ergebnissen und sie haben jetzt ein Texterkennungsmodell, das Foucaults Handschrift mit einer Zeichenfehlerrate von nur 8% transkribieren kann.

Automatisierte Transkription von Foucaults Schrift, Box 51, Notizen zu Venel, Essai sur la santé et l'éducation médicinale des filles (1776).

Der Bericht des Teams ist nützlich, um einen Einblick in die Praxis der Erstellung von Trainingsdaten für die automatisierte Texterkennung zu geben. Das Team geht auf die Herausforderungen bei der Entschlüsselung von Foucaults Handschrift ein, in der Abkürzungen und einzelne Zeichen oft mehrdeutig ausgedrückt sind. Sie beschreiben auch die Lernkurve bei der Arbeit mit Transkribus: Sie brauchten einige Stunden intensiver Arbeit, um zu lernen, wie man auf der Plattform navigiert, und etwa 30-40 Minuten, um jede einzelne von Foucaults Schriften zu segmentieren und zu transkribieren. fiches (1-2 Bilder).

Dank Transkribus, dem Foucault fiches de lecture Projekt wird nun in der Lage sein, den Zugang zu einer breiten Auswahl von Foucault-Transkripten zu erleichtern. Sie planen die Entwicklung einer kollaborativen Plattform unter Verwendung der Software Omeka, auf der Foucault-Spezialisten die Transkripte dieses komplexen und historisch bedeutsamen Materials konsultieren, durchsuchen, verbessern und annotieren können.

Erfahren Sie mehr:

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Dezember 7, 2022
Community
Der November 2022 war ein Meilenstein in der Geschichte von Transkribus. Nach drei Jahren als Teil einer europäischen Genossenschaft wird die Plattform ...
November 17, 2022
Transkribus
Wir freuen uns sehr, Ihnen mitteilen zu können, dass wir gestern 100.000 Nutzer auf der Transkribus-Plattform erreicht haben! Trotz unserer jahrelangen, sehr ...
August 12, 2022
Erkennung von handgeschriebenem Text
Hatten Sie schon einmal Probleme, die Handschrift einer anderen Person zu lesen? Vielleicht beruhigt es Sie zu wissen, dass es nicht nur Menschen sind, die ...