+ Transkribieren von Foucaults Handschrift mit Transkribus

Eine spannende Neuigkeit ist, dass Transkribus begonnen hat, sich mit den Schriften des bahnbrechenden französischen Philosophen Michel Foucault auseinanderzusetzen.

Das Team der Foucault fiches de lecture (Foucault's Reading Notes) haben ein Modell trainiert, das die Schrift des Philosophen mit einer Genauigkeit von etwa 90% erkennt. Die automatisierten Transkripte werden für das Ziel des Projekts von entscheidender Bedeutung sein: die Analyse und den Online-Zugang zu der großen Sammlung von Foucaults Vorlesungsverzeichnisse (organisierte Zitate, Referenzen und Kommentare) in der Bibliothèque nationale de France.

Mitglieder des Projektteams, Marie-Laure Massot, Arianna Sforzini und Vincent Ventresque, haben einen ausführlicher Bericht (auf Französisch) die ihre Experimente mit Transkribus zusammenfassen und erklären, wie sie planen, diese automatisierten Transkripte Forschern zur Verfügung zu stellen.

In einem ersten Test trainierte das Team ein automatisches Texterkennungsmodell, indem es Transkribus zur Segmentierung und Transkription von 200 digitalisierten Bildern von Foucaults Handschrift verwendete. Dieses erste Modell war in der Lage, Transkripte mit einer Zeichenfehlerrate von 15% zu erzeugen (d.h. 85% der von Transkribus korrekt transkribierten Zeichen).

Dann erweiterten sie ihr Trainingsset auf 600 Bilder von Foucaults Schriften, die Notizen zu folgenden Themen enthielten  La volonté de savoir, Teil von Foucaults vierbändigem Werk über die Geschichte der Sexualität. Dieser größere Satz von Ground Truth führte zu deutlich besseren Ergebnissen und sie haben jetzt ein Texterkennungsmodell, das Foucaults Handschrift mit einer Zeichenfehlerrate von nur 8% transkribieren kann.

Automatisierte Transkription von Foucaults Schrift, Box 51, Notizen zu Venel, Essai sur la santé et l'éducation médicinale des filles (1776).

Der Bericht des Teams ist nützlich, um einen Einblick in die Praxis der Erstellung von Trainingsdaten für die automatisierte Texterkennung zu geben. Das Team geht auf die Herausforderungen bei der Entschlüsselung von Foucaults Handschrift ein, in der Abkürzungen und einzelne Zeichen oft mehrdeutig ausgedrückt sind. Sie beschreiben auch die Lernkurve bei der Arbeit mit Transkribus: Sie brauchten einige Stunden intensiver Arbeit, um zu lernen, wie man auf der Plattform navigiert, und etwa 30-40 Minuten, um jede einzelne von Foucaults Schriften zu segmentieren und zu transkribieren. fiches (1-2 Bilder).

Dank Transkribus, dem Foucault fiches de lecture Projekt wird nun in der Lage sein, den Zugang zu einer breiten Auswahl von Foucault-Transkripten zu erleichtern. Sie planen die Entwicklung einer kollaborativen Plattform unter Verwendung der Software Omeka, auf der Foucault-Spezialisten die Transkripte dieses komplexen und historisch bedeutsamen Materials konsultieren, durchsuchen, verbessern und annotieren können.

Erfahren Sie mehr:

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Feber 28, 2024
News, Transkribus
Mit über 80 Referenten aus rund 40 Ländern, spannenden Vorträgen und nachdenklichen Diskussionen hat uns die Transkribus 2024 User Conference ...
Feber 22, 2024
Uncategorized
Spannende Neuigkeiten für Liebhaber und Forscher der niederländischen Geschichte! Nach der Ankündigung auf der Transkribus-Nutzerkonferenz 24 in der vergangenen Woche, wird die neue ...
Jänner 31, 2024
News
Wir freuen uns, die neuesten Aktualisierungen unseres Dokumenten-Editors anzukündigen, die Ihnen eine intuitivere und übersichtlichere Benutzeroberfläche bieten. Unser ...