Che cos'è il riconoscimento della scrittura e come funziona?

Avete mai avuto problemi a leggere la calligrafia di qualcun altro? 

Può rassicurarvi sapere che non sono solo gli esseri umani ad avere questo problema, ma anche i computer. Mentre i computer sono in grado di riconoscere e trascrivere il testo stampato da decenni, il riconoscimento dei testi scritti a mano è stato possibile solo negli ultimi anni. La tecnologia che permette di farlo è nota come riconoscimento del testo scritto a mano o HTR ed è alla base del software Transkribus. 

Il riconoscimento della scrittura è una tecnologia affascinante, ma all'inizio può essere un po' complessa da capire. Se siete nuovi a questa nuova e unica tecnologia, ecco una rapida introduzione a cos'è e a cosa fa l'HTR.

Che cos'è il riconoscimento della scrittura o HTR?

Il riconoscimento della scrittura è un tipo di tecnologia che può essere utilizzata per "leggere" la scrittura nelle immagini di documenti scritti a mano. Supponiamo che abbiate scritto un saggio a mano quando eravate a scuola e che ora vogliate avere quel saggio come testo digitale sul vostro computer. Con il giusto software HTR, potete scattare una foto del saggio, passarla attraverso il software e ottenere lo stesso saggio come file di testo digitale, che può essere scaricato e condiviso se necessario. Questo è il principio di base del riconoscimento della scrittura.

Riconoscimento della scrittura a mano

Occorre anche fare chiarezza sulla terminologia. Il tipo di riconoscimento della scrittura descritto sopra è noto come "riconoscimento della scrittura offline". Questo perché si tratta di immagini di testo già scritte. Esiste anche il "riconoscimento della scrittura online". Si tratta di un software che genera testo digitale dalla scrittura a mano. come lo scrivete, di solito con una tavoletta e uno stilo. Poiché Transkribus è stato creato per riconoscere la scrittura a mano in documenti storici già scritti, può essere utilizzato solo per il riconoscimento della scrittura offline.

Perché i computer trovano il testo scritto a mano più difficile da riconoscere rispetto al testo stampato?

Per i testi stampati, c'è un numero finito di font che possono essere utilizzati - 200.000, in fatto. Sebbene possa sembrare un numero elevato, questo significa almeno che è possibile programmare un software per leggerli tutti.

La scrittura a mano è un gioco diverso. I 6,5 miliardi di persone che sanno scrivere su questo pianeta hanno ciascuno il proprio stile di scrittura e non esistono due stili esattamente uguali. Per complicare le cose, il modo in cui una persona scrive su un modulo ufficiale potrebbe essere molto diverso da quello in cui scrive nel proprio diario, ad esempio. Il numero infinito di possibilità rende anche impossibile programmare un software che le legga tutte. Per saperne di più sulla differenza tra il riconoscimento ottico dei caratteri (OCR) e il riconoscimento della scrittura a mano, leggete il nostro articolo blog di approfondimento.

La varietà di grafie

Come funziona il riconoscimento della scrittura?

Come fa la tecnologia HTR a riconoscere la scrittura, se non è possibile programmarla? Risposta: Il software HTR non riconosce la scrittura a mano, bensì impara per riconoscere la scrittura a mano. Nel tempo, un software come Transkribus utilizza l'intelligenza artificiale e l'apprendimento profondo per imparare a leggere e trascrivere diversi tipi di scrittura, proprio come farebbe un essere umano. Per farlo, è necessario un modello di intelligenza artificiale. Si tratta di una gigantesca mente digitale che ha imparato le forme e le caratteristiche di migliaia di parole, lettere e anche semplici simboli scritti a mano. Soprattutto, il modello è in grado di formulare ipotesi istruite su caratteri che non ha mai visto prima. Il software riconosce la scrittura a mano nell'immagine e poi utilizza le conoscenze del modello per trascriverla in testo digitale. Con il modello giusto, è possibile ottenere una trascrizione quasi perfetta con un semplice clic. 

Ci sono molti modelli pubblici già disponibili per Transkribus, che coprono diverse lingue e tipi di scrittura, come la Kurrent tedesca o la scrittura inglese del XVIII e XIX secolo. Ma è anche possibile creare il proprio modello. Ciò avviene trascrivendo manualmente un certo numero di documenti, per addestrare la "mente digitale" a riconoscere la grafia specifica dei vostri documenti. È quindi possibile utilizzare questo modello personalizzato per trascrivere automaticamente il resto dei documenti.

Per cosa si usa la tecnologia HTR?

Sono molti i lavori che richiedono la capacità di leggere rapidamente i documenti scritti a mano. Ad esempio, gli storici e altri ricercatori utilizzano documenti storici scritti a mano per conoscere il passato. Spesso desiderano creare versioni digitali dei documenti, in modo da poterli analizzare più facilmente e cercare determinate parole o termini nell'intera raccolta. La tecnologia HTR è perfetta per questo scopo.

Le raccolte scritte a mano sono spesso condivise online tramite il sito web read&search piattaforma

Anche gli archivi e le biblioteche sono luoghi in cui la tecnologia HTR può essere utile. Oggi gli archivisti e i bibliotecari mirano a offrire versioni digitali del maggior numero possibile di libri e documenti. Ma trascrivere manualmente le centinaia e migliaia di volumi di un archivio standard richiederebbe un'eternità. La trascrizione automatica con HTR è un'alternativa molto più rapida e facilita la pubblicazione di tutti i documenti anche online.

Ma ci sono molte altre persone che utilizzano la tecnologia HTR per semplificarsi la vita: aziende che vogliono digitalizzare i loro vecchi file, sviluppatori che vogliono incorporare il riconoscimento della scrittura in software personalizzati, genealogisti per hobby che vogliono leggere i vecchi documenti della loro famiglia, l'elenco è infinito!

Posso vedere un esempio di riconoscimento della scrittura in azione?

Se volete vedere come funziona il riconoscimento della scrittura, caricate semplicemente un'immagine scannerizzata di un testo scritto a mano nel widget sottostante e vedrete la tecnologia in azione.

CONDIVIDI QUESTO ARTICOLO

Post recenti

3 luglio 2024
News, Transkribus
Alcuni progetti Transkribus terminano con una collezione completa digitalizzata in Transkribus. Alcuni prendono la fonte digitalizzata e la usano per ...
12 giugno 2024
News, Transkribus
Quando si pensa alla minuscola carolingia (o carolina), probabilmente vengono in mente Carlo Magno e il suo vasto impero carolingio. Mentre il ...
14 maggio 2024
Uncategorized
La comprensione dei documenti storici è fondamentale per capire la storia. Ma capire i documenti storici in polacco può essere una sfida. Non solo ...