Lo strumento Archivio nazionale della Finlandia è impegnata a promuovere l'accesso ai documenti relativi al patrimonio culturale della Finlandia. La tecnologia HTR (Handwritten Text Recognition) è ora parte della sua missione.
L'Archivio Nazionale di Finlandia ha digitalizzato milioni di documenti, la maggior parte dei quali sono scritti a mano. Come primo passo, 500 di queste pagine digitalizzate sono state caricate e trascritte nel Transkribus piattaforma. Questi documenti vanno dal sedicesimo al diciannovesimo secolo e includono inventari di proprietà della nobiltà finlandese, libri di corte e registri di tasse fondiarie. Queste 500 pagine rappresentano dati di allenamento e giocheranno un ruolo vitale nel permettere ai motori HTR di riconoscere la grafia svedese (che era usata nei documenti ufficiali in Finlandia in questo periodo).
Pagina manoscritta dai registri della Corte d'Appello di Turku, 1828-1829 (Immagine per gentile concessione di Archivio digitale, Archivio Nazionale Finlandia)
I ricercatori di READ useranno queste pagine per generare un modello HTR che può essere applicato ad altri documenti conservati nell'Archivio Nazionale di Finlandia. Questo modello renderà possibile la trascrizione automatica e la ricerca di immagini di manoscritti storici, garantendo così un accesso più facile ai documenti della storia finlandese.
500 pagine sono solo l'inizio! L'Archivio Nazionale di Finlandia continuerà a contribuire con dati di formazione man mano che ci muoviamo nel progetto READ e questi dati aiuteranno a migliorare l'accuratezza della tecnologia HTR.