+ Transkribieren von Foucaults Handschrift mit Transkribus

Eine spannende Neuigkeit ist, dass Transkribus begonnen hat, sich mit den Schriften des bahnbrechenden französischen Philosophen Michel Foucault auseinanderzusetzen.

Das Team der Foucault fiches de lecture (Foucault's Reading Notes) haben ein Modell trainiert, das die Schrift des Philosophen mit einer Genauigkeit von etwa 90% erkennt. Die automatisierten Transkripte werden für das Ziel des Projekts von entscheidender Bedeutung sein: die Analyse und den Online-Zugang zu der großen Sammlung von Foucaults Vorlesungsverzeichnisse (organisierte Zitate, Referenzen und Kommentare) in der Bibliothèque nationale de France.

Mitglieder des Projektteams, Marie-Laure Massot, Arianna Sforzini und Vincent Ventresque, haben einen ausführlicher Bericht (auf Französisch) die ihre Experimente mit Transkribus zusammenfassen und erklären, wie sie planen, diese automatisierten Transkripte Forschern zur Verfügung zu stellen.

In einem ersten Test trainierte das Team ein automatisches Texterkennungsmodell, indem es Transkribus zur Segmentierung und Transkription von 200 digitalisierten Bildern von Foucaults Handschrift verwendete. Dieses erste Modell war in der Lage, Transkripte mit einer Zeichenfehlerrate von 15% zu erzeugen (d.h. 85% der von Transkribus korrekt transkribierten Zeichen).

Dann erweiterten sie ihr Trainingsset auf 600 Bilder von Foucaults Schriften, die Notizen zu folgenden Themen enthielten  La volonté de savoir, Teil von Foucaults vierbändigem Werk über die Geschichte der Sexualität. Dieser größere Satz von Ground Truth führte zu deutlich besseren Ergebnissen und sie haben jetzt ein Texterkennungsmodell, das Foucaults Handschrift mit einer Zeichenfehlerrate von nur 8% transkribieren kann.

Automatisierte Transkription von Foucaults Schrift, Box 51, Notizen zu Venel, Essai sur la santé et l'éducation médicinale des filles (1776).

Der Bericht des Teams ist nützlich, um einen Einblick in die Praxis der Erstellung von Trainingsdaten für die automatisierte Texterkennung zu geben. Das Team geht auf die Herausforderungen bei der Entschlüsselung von Foucaults Handschrift ein, in der Abkürzungen und einzelne Zeichen oft mehrdeutig ausgedrückt sind. Sie beschreiben auch die Lernkurve bei der Arbeit mit Transkribus: Sie brauchten einige Stunden intensiver Arbeit, um zu lernen, wie man auf der Plattform navigiert, und etwa 30-40 Minuten, um jede einzelne von Foucaults Schriften zu segmentieren und zu transkribieren. fiches (1-2 Bilder).

Dank Transkribus, dem Foucault fiches de lecture Projekt wird nun in der Lage sein, den Zugang zu einer breiten Auswahl von Foucault-Transkripten zu erleichtern. Sie planen die Entwicklung einer kollaborativen Plattform unter Verwendung der Software Omeka, auf der Foucault-Spezialisten die Transkripte dieses komplexen und historisch bedeutsamen Materials konsultieren, durchsuchen, verbessern und annotieren können.

Erfahren Sie mehr:

DIESEN ARTIKEL TEILEN

Neueste Beiträge

25. April 2024
News, Transkribus
Im Januar haben wir unsere neuen Abonnementpläne angekündigt: Einzelpersonen, Stipendiaten und Organisationen. Jeder Plan ist auf eine bestimmte ...
April 17, 2024
News, Transkribus
Einer der größten Vorteile von Transkribus ist die Möglichkeit, benutzerdefinierte Modelle zur Erkennung von handschriftlichem Text zu trainieren. Diese einzigartige Funktion ...
4. April 2024
News
Der Frühling hat begonnen und damit auch die Veröffentlichung von Transkribus im April 2024. Hier ist ein kurzer Überblick über alle ...