+ Trascrivere la scrittura di Foucault con Transkribus

In una notizia eccitante, Transkribus ha iniziato ad affrontare le carte del seminale filosofo francese Michel Foucault.

Il team del Foucault fiches de lecture (Foucault's Reading Notes), hanno addestrato un modello per riconoscere la scrittura del filosofo con circa 90% di precisione. Le trascrizioni automatizzate saranno vitali per l'obiettivo del progetto: analizzare e fornire accesso online alla grande collezione di appunti di Foucault. schede di lettura (citazioni, riferimenti e commenti organizzati) conservati presso la Bibliothèque nationale de France.

I membri del team del progetto, Marie-Laure Massot, Arianna Sforzini e Vincent Ventresque, hanno scritto un rapporto dettagliato (in francese) riassumendo i loro esperimenti con Transkribus e spiegando come hanno intenzione di rendere queste trascrizioni automatizzate disponibili ai ricercatori.

In un primo test, il team ha addestrato un modello di riconoscimento automatico del testo utilizzando Transkribus per segmentare e trascrivere 200 immagini digitalizzate della scrittura di Foucault. Questo primo modello è stato in grado di generare trascrizioni con un tasso di errore di 15% (cioè 85% di caratteri trascritti correttamente da Transkribus).

Hanno poi esteso il loro set di allenamento a 600 immagini degli scritti di Foucault, che includevano note relative a  La volontà di sapere, parte dell'opera in quattro volumi di Foucault sulla storia della sessualità. Questo più ampio insieme di verità di base ha portato a risultati significativamente migliori e ora hanno un modello di riconoscimento del testo che può trascrivere la scrittura di Foucault con un tasso di errore del carattere di appena 8%.

Trascrizione automatica degli scritti di Foucault, scatola 51, note su Venel, Saggio sulla salute e l'educazione medica delle ragazze (1776).

Il rapporto del team è utile nel fornire una visione degli aspetti pratici della creazione di dati di allenamento per il riconoscimento automatico del testo. Il team elabora le sfide della decifrazione della scrittura di Foucault, dove le abbreviazioni e i singoli caratteri sono spesso espressi in modo ambiguo. Descrivono anche la curva di apprendimento del lavoro con Transkribus: ci sono volute alcune ore di lavoro intenso per imparare a navigare nella piattaforma e circa 30-40 minuti per segmentare e trascrivere ognuno dei testi di Foucault fiches (1-2 immagini).

Grazie a Transkribus, il Foucault fiches de lecture Il progetto sarà ora in grado di facilitare l'accesso a un'ampia selezione di trascrizioni di Foucault. Hanno intenzione di sviluppare una piattaforma collaborativa utilizzando il software Omeka, dove gli specialisti di Foucault possono consultare, cercare, migliorare e annotare le trascrizioni di questo materiale complesso e storicamente significativo.

Per saperne di più:

CONDIVIDI QUESTO ARTICOLO

Post recenti

25 aprile 2024
News, Transkribus
A gennaio abbiamo annunciato i nostri nuovi piani di abbonamento: Individuale, Studente e Organizzazione. Ciascun piano è adattato a un particolare ...
17 aprile 2024
News, Transkribus
Uno dei maggiori vantaggi di Transkribus è la possibilità di addestrare modelli personalizzati di riconoscimento del testo scritto a mano. Questa caratteristica unica ...
4 aprile 2024
News
La primavera è arrivata e così anche l'uscita di aprile 2024 di Transkribus. Ecco una rapida panoramica di tutte le ...