+ L'Archivio Nazionale rilascia la prima versione di un modello di scrittura olandese

Il team di digitalizzazione intorno a Liesbeth Keyser del Archivio Nazionale nei Paesi Bassi sta lavorando duramente sulla creazione di dati di allenamento per le loro collezioni al fine di preparare l'elaborazione HTR su larga scala. Come primo risultato un modello basato su 475.769 parole è ora disponibile per gli utenti di Transkribus. Il modello mostra un Character Error Rate di 7.48% sul set di training e di 6.15% sul set di validazione. Si basa sulla trascrizione accurata di decine di scritture diverse e comprende scansioni dei documenti in arrivo dalla Compagnia Olandese delle Indie Orientali (Overgekomen Brieven en Papieren van de VOC) dell'Archivio Nazionale dei Paesi Bassi e degli atti notarili del 19° secolo dell'archief Noord-Hollands.  Il modello si chiama: NAN/NHA_GT_M3+ Buon divertimento!

 

 

CONDIVIDI QUESTO ARTICOLO

Post recenti

19 settembre 2023
Transkribus
Siamo entusiasti di annunciare la versione di settembre 2023 dell'applicazione web di Transkribus. Dopo il successo del passaggio alla ...
30 agosto 2023
News, Transkribus
Oggi viene lanciata ufficialmente la nuova web app di Transkribus! Transkribus ha sempre lavorato per semplificare la digitazione e la trascrizione di ...
21 agosto 2023
Conferenza degli utenti Transkribus
La Transkribus User Conference 24 (15 e 16 febbraio 2024, Innsbruck) invita le parti interessate, gli utenti, gli studiosi e gli appassionati a esplorare ...