+ Lettura del diario dell'ammiraglio de Ruyter - usando trascrizioni esistenti per addestrare il riconoscimento automatico del testo

Nicoline van der Sijs fa parte di un team di ricercatori che lavorano al Istituto Meertens nei Paesi Bassi (uno dei LEGGI I partner del MOU). Il team ha addestrato un modello di riconoscimento automatico del testo per elaborare la scrittura di Michiel de Ruyter, un ammiraglio olandese del XVII secolo.

Il modello è stato addestrato con circa 20.000 parole di materiale trascritto esistente dai diari di de Ruyter (vedi sotto per un esempio della sua difficile grafia!) Queste trascrizioni sono state abbinate automaticamente alle corrispondenti immagini digitalizzate della grafia di de Ruyter usando la tecnologia di abbinamento Text2Img sviluppata dal CITlab all'Università di Rostock (una delle LEGGI i partner del progetto).

Il modello risultante è in grado di riconoscere la scrittura di De Ruyter con un tasso di errore dei caratteri (CER) di circa 10%, che è un risultato notevole per una mano così complessa.

Immagine dalla collezione De Ruyter dell'Archivio Nazionale dei Paesi Bassi, NL HaNA 1.10.72 20 0004

La professoressa van der Sijs e i suoi colleghi stanno progettando di usare queste trascrizioni per compilare un corpus online degli scritti di de Ruyter per l'accesso generale e l'analisi linguistica accademica.

I ricercatori dell'Istituto Meertens sono anche interessati a replicare questi risultati entusiasmanti con altre collezioni dove sono già disponibili trascrizioni esistenti, grazie al duro lavoro di trascrittori volontari. Il sito Fondazione Vrijwilligersnet Nederlandse Taal (SVNT) è una rete di circa 100 volontari che trascrivono Bibbie storiche da più di dieci anni. Altro materiale trascritto dai volontari include lettere di navigazione del XVII e XVIII secolo e giornali stampati del XVII secolo. Le trascrizioni che questi volontari hanno prodotto possono essere inserite nella nostra tecnologia all'avanguardia e utilizzate come dati di allenamento per il riconoscimento automatico del testo.

  • Avete trascrizioni esistenti che avete prodotto o raccolto come parte di un progetto di ricerca?
  • Mandateceli e noi possiamo elaborarli e addestrare un modello per riconoscere la scrittura nei vostri documenti!
  • Per saperne di più su come lavorare con le trascrizioni esistenti, consulta il nostro Come guidarecontattaci.
CONDIVIDI QUESTO ARTICOLO

Post recenti

29 marzo 2023
Uncategorized
La maggior parte dei modelli Transkribus è addestrata a leggere una sola lingua - dopo tutto, la maggior parte dei documenti storici sono ...
23 marzo 2023
Transkribus
Andate in un qualsiasi museo di storia o leggete un qualsiasi libro di storia e scoprirete che molte delle storie e degli eventi ...
15 marzo 2023
Uncategorized
Di Fiona Park Non tutti coloro che lavorano con la storia sono storici professionisti. Dai genealogisti per hobby ai volontari delle ...