+ Lettura del diario dell'ammiraglio de Ruyter - usando trascrizioni esistenti per addestrare il riconoscimento automatico del testo

Nicoline van der Sijs fa parte di un team di ricercatori che lavorano al Istituto Meertens nei Paesi Bassi (uno dei LEGGI I partner del MOU). Il team ha addestrato un modello di riconoscimento automatico del testo per elaborare la scrittura di Michiel de Ruyter, un ammiraglio olandese del XVII secolo.

Il modello è stato addestrato con circa 20.000 parole di materiale trascritto esistente dai diari di de Ruyter (vedi sotto per un esempio della sua difficile grafia!) Queste trascrizioni sono state abbinate automaticamente alle corrispondenti immagini digitalizzate della grafia di de Ruyter usando la tecnologia di abbinamento Text2Img sviluppata dal CITlab all'Università di Rostock (una delle LEGGI i partner del progetto).

Il modello risultante è in grado di riconoscere la scrittura di De Ruyter con un tasso di errore dei caratteri (CER) di circa 10%, che è un risultato notevole per una mano così complessa.

Immagine dalla collezione De Ruyter dell'Archivio Nazionale dei Paesi Bassi, NL HaNA 1.10.72 20 0004

La professoressa van der Sijs e i suoi colleghi stanno progettando di usare queste trascrizioni per compilare un corpus online degli scritti di de Ruyter per l'accesso generale e l'analisi linguistica accademica.

I ricercatori dell'Istituto Meertens sono anche interessati a replicare questi risultati entusiasmanti con altre collezioni dove sono già disponibili trascrizioni esistenti, grazie al duro lavoro di trascrittori volontari. Il sito Fondazione Vrijwilligersnet Nederlandse Taal (SVNT) è una rete di circa 100 volontari che trascrivono Bibbie storiche da più di dieci anni. Altro materiale trascritto dai volontari include lettere di navigazione del XVII e XVIII secolo e giornali stampati del XVII secolo. Le trascrizioni che questi volontari hanno prodotto possono essere inserite nella nostra tecnologia all'avanguardia e utilizzate come dati di allenamento per il riconoscimento automatico del testo.

  • Avete trascrizioni esistenti che avete prodotto o raccolto come parte di un progetto di ricerca?
  • Mandateceli e noi possiamo elaborarli e addestrare un modello per riconoscere la scrittura nei vostri documenti!
  • Per saperne di più su come lavorare con le trascrizioni esistenti, consulta il nostro Come guidarecontattaci.
CONDIVIDI QUESTO ARTICOLO

Post recenti

19 settembre 2023
Transkribus
Siamo entusiasti di annunciare la versione di settembre 2023 dell'applicazione web di Transkribus. Dopo il successo del passaggio alla ...
30 agosto 2023
News, Transkribus
Oggi viene lanciata ufficialmente la nuova web app di Transkribus! Transkribus ha sempre lavorato per semplificare la digitazione e la trascrizione di ...
21 agosto 2023
Conferenza degli utenti Transkribus
La Transkribus User Conference 24 (15 e 16 febbraio 2024, Innsbruck) invita le parti interessate, gli utenti, gli studiosi e gli appassionati a esplorare ...