+ L'Archivio Nazionale rilascia la prima versione di un modello di scrittura olandese

Il team di digitalizzazione intorno a Liesbeth Keyser del Archivio Nazionale nei Paesi Bassi sta lavorando duramente sulla creazione di dati di allenamento per le loro collezioni al fine di preparare l'elaborazione HTR su larga scala. Come primo risultato un modello basato su 475.769 parole è ora disponibile per gli utenti di Transkribus. Il modello mostra un Character Error Rate di 7.48% sul set di training e di 6.15% sul set di validazione. Si basa sulla trascrizione accurata di decine di scritture diverse e comprende scansioni dei documenti in arrivo dalla Compagnia Olandese delle Indie Orientali (Overgekomen Brieven en Papieren van de VOC) dell'Archivio Nazionale dei Paesi Bassi e degli atti notarili del 19° secolo dell'archief Noord-Hollands.  Il modello si chiama: NAN/NHA_GT_M3+ Buon divertimento!

 

 

CONDIVIDI QUESTO ARTICOLO

Post recenti

28 febbraio 2024
News, Transkribus
Con oltre 80 relatori provenienti da circa 40 paesi, presentazioni coinvolgenti e discussioni ponderate, la Conferenza degli utenti di Transkribus 2024 ci ha ...
22 febbraio 2024
Uncategorized
Notizie entusiasmanti per gli appassionati e i ricercatori di storia olandese! Dopo l'annuncio della scorsa settimana alla Transkribus Users Conference 24, il nuovo ...
31 gennaio 2024
News
Siamo lieti di annunciare gli ultimi aggiornamenti del nostro editor di documenti, con un'interfaccia più intuitiva e pulita. Il nostro ...