+ Trolls e spiriti dell'acqua - trascrivere documenti del folklore svedese con il riconoscimento del testo scritto a mano

È il momento di sentire alcuni nuovi risultati notevoli con la tecnologia di riconoscimento del testo scritto a mano (HTR) - questa volta dal Istituto per la lingua e il folklore in Svezia.

L'Istituto possiede una collezione di più di 30.000 pagine di documenti folcloristici scritti dal folclorista svedese Carl-Martin Bergstrand tra gli anni '20 e '60. Il dottor Fredrik Skott, professore associato e archivista di ricerca all'Istituto, ha aiutato ad addestrare un modello HTR per trascrivere automaticamente questi documenti.

Il dottor Skott ha usato il nostro Transkribus piattaforma per trascrivere circa 20.000 parole da pagine che furono scritte da Bergstrand nei primi anni '30. Un paio di pagine di esempio possono essere viste qui sotto, che contengono le registrazioni di Bergstrand di un'intervista con August Svensson (nato nel 1842) dove Svensson parla di spiriti dell'acqua e troll.

Le trascrizioni e le immagini di questi documenti sono state elaborate da CITlab HTR - una forma di tecnologia HTR che utilizza reti neurali per riconoscere la scrittura. Il modello HTR risultante può produrre automaticamente trascrizioni di pagine scritte da Bergstrand con un tasso di errore medio dei caratteri (CER) di 7,0%. Quando un dizionario è integrato nel processo di riconoscimento, il CER può essere basso come 5.5%.

Il dottor Skott è entusiasta delle possibilità: Prima, ho sempre pensato che le generazioni future avrebbero avuto difficoltà a leggere le collezioni di folklore. Ora so che troveranno più facile leggere il testo rispetto alla generazione attuale. In breve, i risultati dei nostri test con Transkribus sono sorprendenti. Dopo aver trascritto manualmente solo 150 pagine, il nostro modello HTR ora legge i documenti del folklore meglio di molti dei nostri visitatori".

L'Institute for Language and Folklore sta ora lavorando con queste trascrizioni per produrre una mappa digitale di miti e leggende che prevede di lanciare nell'autunno 2017.

CONDIVIDI QUESTO ARTICOLO

Post recenti

17 novembre 2022
Transkribus
Siamo entusiasti di annunciare che ieri abbiamo raggiunto i 100.000 utenti sulla piattaforma Transkribus! Anche con i nostri anni di grande ...
12 agosto 2022
Riconoscimento del testo scritto a mano
Avete mai avuto problemi a leggere la scrittura di qualcun altro? Beh, potrebbe rassicurarvi sapere che non sono solo gli esseri umani a ...
22 luglio 2022
Uncategorized
L'ultima versione di Transkribus Lite è arrivata e porta con sé una serie di nuove funzioni. Ecco le più importanti ...