+ Lettura del diario dell'ammiraglio de Ruyter - usando trascrizioni esistenti per addestrare il riconoscimento automatico del testo

Nicoline van der Sijs fa parte di un team di ricercatori che lavorano al Istituto Meertens nei Paesi Bassi (uno dei LEGGI I partner del MOU). Il team ha addestrato un modello di riconoscimento automatico del testo per elaborare la scrittura di Michiel de Ruyter, un ammiraglio olandese del XVII secolo.

Il modello è stato addestrato con circa 20.000 parole di materiale trascritto esistente dai diari di de Ruyter (vedi sotto per un esempio della sua difficile grafia!) Queste trascrizioni sono state abbinate automaticamente alle corrispondenti immagini digitalizzate della grafia di de Ruyter usando la tecnologia di abbinamento Text2Img sviluppata dal CITlab all'Università di Rostock (una delle LEGGI i partner del progetto).

Il modello risultante è in grado di riconoscere la scrittura di De Ruyter con un tasso di errore dei caratteri (CER) di circa 10%, che è un risultato notevole per una mano così complessa.

Immagine dalla collezione De Ruyter dell'Archivio Nazionale dei Paesi Bassi, NL HaNA 1.10.72 20 0004

La professoressa van der Sijs e i suoi colleghi stanno progettando di usare queste trascrizioni per compilare un corpus online degli scritti di de Ruyter per l'accesso generale e l'analisi linguistica accademica.

I ricercatori dell'Istituto Meertens sono anche interessati a replicare questi risultati entusiasmanti con altre collezioni dove sono già disponibili trascrizioni esistenti, grazie al duro lavoro di trascrittori volontari. Il sito Fondazione Vrijwilligersnet Nederlandse Taal (SVNT) è una rete di circa 100 volontari che trascrivono Bibbie storiche da più di dieci anni. Altro materiale trascritto dai volontari include lettere di navigazione del XVII e XVIII secolo e giornali stampati del XVII secolo. Le trascrizioni che questi volontari hanno prodotto possono essere inserite nella nostra tecnologia all'avanguardia e utilizzate come dati di allenamento per il riconoscimento automatico del testo.

  • Avete trascrizioni esistenti che avete prodotto o raccolto come parte di un progetto di ricerca?
  • Mandateceli e noi possiamo elaborarli e addestrare un modello per riconoscere la scrittura nei vostri documenti!
  • Per saperne di più su come lavorare con le trascrizioni esistenti, consulta il nostro Come guidarecontattaci.
CONDIVIDI QUESTO ARTICOLO

Post recenti

7 dicembre 2022
Community
Il novembre 2022 è stato un mese fondamentale nella storia di Transkribus. Dopo tre anni come parte di una cooperativa europea, la piattaforma ...
17 novembre 2022
Transkribus
Siamo entusiasti di annunciare che ieri abbiamo raggiunto i 100.000 utenti sulla piattaforma Transkribus! Anche con i nostri anni di grande ...
12 agosto 2022
Riconoscimento del testo scritto a mano
Avete mai avuto problemi a leggere la scrittura di qualcun altro? Beh, potrebbe rassicurarvi sapere che non sono solo gli esseri umani a ...