+ Concorsi e premi vincenti! La tecnologia READ è all'avanguardia

Dicembre 21, 2017
Concorsi, Set di dati, Eventi, Modelli HTR, News, Storie di successo

Abbiamo voluto concludere il 2017 celebrando alcuni fantastici progressi nel riconoscimento del testo scritto a mano (HTR) e nell'analisi del layout dei documenti storici.

Nel campo dell'informatica, i concorsi ufficiali danno ai ricercatori la possibilità di perfezionare le nuove tecnologie e garantire che le migliori tecniche salgano alla ribalta. Infatti, il progetto READ ha una propria piattaforma per i concorsi di ricerca (ScriptNet), dove gli informatici possono partecipare o organizzare concorsi.

Negli ultimi mesi, i partner del progetto READ di CITlab all'Università di Rostock e l' Centro di ricerca PRHLT dell'Universitat Politècnica de València hanno generato risultati impressionanti, degni dei premi del concorso e dei riconoscimenti della conferenza.

Lo strumento Conferenza internazionale sull'analisi e il riconoscimento dei documenti (ICDAR), che quest'anno ha avuto luogo a Tokyo, è una delle più grandi conferenze del settore ed è stato il luogo di due successi significativi per il progetto READ.

Joan Puigcerver (PRHLT Research Centre, Universitat Politècnica de València) ha vinto il premio della conferenza per Migliore documento dello studente che si intitolava "Are Multidimensional Recurrent Layers Really Necessary for Handwritten Text Recognition?". Le unità multidimensionali di memoria a breve termine (MLSTM) sono state ampiamente utilizzate per HTR negli ultimi anni. LSTM multidimensionale è una forma potente di apprendimento automatico che è in grado di elaborare immagini di qualsiasi dimensione. Tuttavia, queste unità sono molto più lente di altre architetture e richiedono una grande quantità di memoria. L'articolo ha sostenuto che le unità MLSTM potrebbero non essere necessarie per HTR dopo tutto, e ha proposto un'architettura più economica che è in grado di superare il modello MDLSTM allo stato dell'arte e ridurre significativamente la quantità di tempo necessaria per addestrare un modello per leggere ed elaborare un insieme di documenti scritti a mano.

Un altro risultato all'ICDAR 2017 è venuto da Tobias Grüning (CITlab, Universität Rostock) che ha vinto il Concorso sull'analisi dell'impaginazione di manoscritti medievali impegnativi. L'analisi del layout è una parte importante di HTR poiché quest'ultima tecnologia richiede che le linee di testo in un'immagine siano accuratamente abbinate alle linee di testo trascritte. Questo concorso è stato organizzato dal Analisi di documenti, immagini e voce (DIVA) gruppo di ricerca dell'Università di Friburgo. La competizione richiedeva ai partecipanti di analizzare l'impaginazione e trovare le linee di testo in un impegnativo set di dati di manoscritti medievali con impaginazioni complesse che includevano aggiunte e correzioni marginali e interlineari. Grüning e il suo team si sono concentrati sul rilevamento delle linee di testo e hanno vinto due compiti su tre in questa competizione. La loro efficace tecnologia di analisi del layout è ora disponibile nel nostro Transkribus (scegliere "CITlab advanced" nella sezione "Layout Analysis" della scheda "Tools"). Come mostra l'immagine qui sotto, questa tecnologia può affrontare bene le complicazioni comuni nei documenti medievali!

Documento segmentato in linee utilizzando la premiata tecnologia CITlab. Cologny, Fondation Martin Bodmer, Cod. Bodmer 28, f. 1r - Bibbia latina (disponibile via e-codices: http://www.e-codices.unifr.ch/en/list/one/fmb/cb-0028) [Immagine rilasciata sotto licenza CC-BY-NC].

Tobias Grüning (CITlab, Universität Rostock) si congratula per il suo lavoro sulla segmentazione delle linee di testo [Immagine di Mathias Seuret ]

Il nostro ultimo risultato da menzionare viene da Tobias Strauss (CITlab, Universität Rostock). Ha portato la sua squadra a vincere una competizione su Estrazione di informazioni in documenti storici scritti a mano. Il compito era quello di estrarre informazioni dalle licenze di matrimonio scritte a mano come nomi, luoghi e occupazioni e poi assegnare queste informazioni alle persone corrispondenti, che fossero marito, moglie o padre della sposa. Il team ha lavorato per estrarre e abbinare queste informazioni da intere righe di testo. Questo lavoro è stato fatto con la stessa funzionalità che ora è integrata in Transkribus come parte del nostro nuovo strumento Keyword Spotting. Keyword Spotting è una potente forma di ricerca di parole chiave in cui la tecnologia analizza le immagini della scrittura, piuttosto che cercare attraverso le trascrizioni di queste parole generate da umani o computer. Questo strumento potrebbe quindi facilitare la ricerca di enormi collezioni che non sono ancora state trascritte.

Questi risultati dimostrano che il progetto READ è all'avanguardia nel campo in via di sviluppo dell'HTR. Siamo orgogliosi di rendere tali innovazioni disponibili in Transkribus, permettendo ai nostri utenti di trascrivere automaticamente e cercare tutti i tipi di documenti storici scritti a mano.

CONDIVIDI QUESTO ARTICOLO

Post recenti

3 luglio 2024

News, Transkribus

Mappatura dei concerti di Beethoven e Haydn: il progetto "Vita concertistica a Vienna".

Alcuni progetti Transkribus terminano con una collezione completa digitalizzata in Transkribus. Alcuni prendono la fonte digitalizzata e la usano per ...

12 giugno 2024

News, Transkribus

Che cos'è la minuscola carolingia?

Quando si pensa alla minuscola carolingia (o carolina), probabilmente vengono in mente Carlo Magno e il suo vasto impero carolingio. Mentre il ...

14 maggio 2024

Uncategorized

Modelli di intelligenza artificiale per la lettura di testi polacchi corsivi e stampati

La comprensione dei documenti storici è fondamentale per capire la storia. Ma capire i documenti storici in polacco può essere una sfida. Non solo ...

Cookie	Descrizione	Durata
politica dei cookie visualizzati	Il cookie è impostato dal plugin GDPR Cookie Consent e viene utilizzato per memorizzare se l'utente ha acconsentito o meno all'uso dei cookie. Non memorizza alcun dato personale.	1 ora
PHPSESSID	Questo cookie è nativo delle applicazioni PHP. Il cookie viene utilizzato per memorizzare e identificare l'ID di sessione unico di un utente allo scopo di gestire la sessione dell'utente sul sito web. Il cookie è un cookie di sessione e viene cancellato quando tutte le finestre del browser vengono chiuse.	1 anno

Cookie	Descrizione	Durata
VISITATORE_INFO1_LIVE	Questo cookie è impostato da Youtube. Utilizzato per tracciare le informazioni dei video di YouTube incorporati in un sito web.	5 mesi
IDE	Utilizzato da Google DoubleClick e memorizza le informazioni su come l'utente utilizza il sito web e qualsiasi altra pubblicità prima di visitare il sito. Questo viene utilizzato per presentare agli utenti gli annunci che sono rilevanti per loro in base al profilo dell'utente.	2 anni

Cookie	Descrizione	Durata
GPS	Questo cookie è impostato da Youtube e registra un ID unico per tracciare gli utenti in base alla loro posizione geografica	30 minuti
tk_or	Questo cookie è impostato dal plugin JetPack sui siti che utilizzano WooCommerce. Questo è un cookie di riferimento utilizzato per analizzare il comportamento dei referrer per Jetpack	5 anni
tk_r3d	Il cookie è installato da JetPack. Utilizzato per le metriche interne delle attività dell'utente per migliorare l'esperienza dell'utente	3 giorni
tk_lr	Questo cookie è impostato dal plugin JetPack sui siti che utilizzano WooCommerce. Questo è un cookie di riferimento utilizzato per analizzare il comportamento dei referrer per Jetpack	1 anno
{\an8}Che cosa?	Questo cookie è installato da Google Analytics. Il cookie viene utilizzato per calcolare i dati del visitatore, della sessione, del camapign e per tenere traccia dell'utilizzo del sito per il rapporto di analisi del sito. Il cookie memorizza le informazioni in modo anonimo e assegna un numero generato randoly per identificare i visitatori unici.	2 anni
_gid	Questo cookie è installato da Google Analytics. Il cookie viene utilizzato per memorizzare informazioni su come i visitatori utilizzano un sito web e aiuta a creare un rapporto analitico su come sta andando il sito web. I dati raccolti includono il numero di visitatori, la fonte da cui provengono e le pagine visitate in forma anonima.	1 giorno
matomo	Per l'analisi statistica, usiamo "Matomo" su questo sito web. Si tratta di uno strumento open source per l'analisi del web. Matomo non trasmette dati a server al di fuori del controllo di READ-COOP. Matomo viene disattivato quando si visita il nostro sito web. Solo se lei acconsente attivamente, il suo comportamento d'uso viene registrato in modo anonimo.	1 anno

Cookie	Descrizione	Durata
YSC	Questo cookie è impostato da Youtube e viene utilizzato per monitorare le visualizzazioni dei video incorporati.	1 anno
_gat	Questo cookie è installato da Google Universal Analytics per strozzare il tasso di richiesta per limitare la raccolta di dati su siti ad alto traffico.	1 minuto

+ Concorsi e premi vincenti! La tecnologia READ è all'avanguardia

Post recenti

Mappatura dei concerti di Beethoven e Haydn: il progetto "Vita concertistica a Vienna".

Che cos'è la minuscola carolingia?

Modelli di intelligenza artificiale per la lettura di testi polacchi corsivi e stampati

La COOP

Prodotti e servizi

Informazioni utili

Risorse utili

Community