+ Lettura del diario dell'ammiraglio de Ruyter - usando trascrizioni esistenti per addestrare il riconoscimento automatico del testo

Nicoline van der Sijs fa parte di un team di ricercatori che lavorano al Istituto Meertens nei Paesi Bassi (uno dei LEGGI I partner del MOU). Il team ha addestrato un modello di riconoscimento automatico del testo per elaborare la scrittura di Michiel de Ruyter, un ammiraglio olandese del XVII secolo.

Il modello è stato addestrato con circa 20.000 parole di materiale trascritto esistente dai diari di de Ruyter (vedi sotto per un esempio della sua difficile grafia!) Queste trascrizioni sono state abbinate automaticamente alle corrispondenti immagini digitalizzate della grafia di de Ruyter usando la tecnologia di abbinamento Text2Img sviluppata dal CITlab all'Università di Rostock (una delle LEGGI i partner del progetto).

Il modello risultante è in grado di riconoscere la scrittura di De Ruyter con un tasso di errore dei caratteri (CER) di circa 10%, che è un risultato notevole per una mano così complessa.

Immagine dalla collezione De Ruyter dell'Archivio Nazionale dei Paesi Bassi, NL HaNA 1.10.72 20 0004

La professoressa van der Sijs e i suoi colleghi stanno progettando di usare queste trascrizioni per compilare un corpus online degli scritti di de Ruyter per l'accesso generale e l'analisi linguistica accademica.

I ricercatori dell'Istituto Meertens sono anche interessati a replicare questi risultati entusiasmanti con altre collezioni dove sono già disponibili trascrizioni esistenti, grazie al duro lavoro di trascrittori volontari. Il sito Fondazione Vrijwilligersnet Nederlandse Taal (SVNT) è una rete di circa 100 volontari che trascrivono Bibbie storiche da più di dieci anni. Altro materiale trascritto dai volontari include lettere di navigazione del XVII e XVIII secolo e giornali stampati del XVII secolo. Le trascrizioni che questi volontari hanno prodotto possono essere inserite nella nostra tecnologia all'avanguardia e utilizzate come dati di allenamento per il riconoscimento automatico del testo.

  • Avete trascrizioni esistenti che avete prodotto o raccolto come parte di un progetto di ricerca?
  • Mandateceli e noi possiamo elaborarli e addestrare un modello per riconoscere la scrittura nei vostri documenti!
  • Per saperne di più su come lavorare con le trascrizioni esistenti, consulta il nostro Come guidarecontattaci.
CONDIVIDI QUESTO ARTICOLO

Post recenti

3 luglio 2024
News, Transkribus
Alcuni progetti Transkribus terminano con una collezione completa digitalizzata in Transkribus. Alcuni prendono la fonte digitalizzata e la usano per ...
12 giugno 2024
News, Transkribus
Quando si pensa alla minuscola carolingia (o carolina), probabilmente vengono in mente Carlo Magno e il suo vasto impero carolingio. Mentre il ...
14 maggio 2024
Uncategorized
La comprensione dei documenti storici è fondamentale per capire la storia. Ma capire i documenti storici in polacco può essere una sfida. Non solo ...