+ Concorsi e premi vincenti! La tecnologia READ è all'avanguardia

Abbiamo voluto concludere il 2017 celebrando alcuni fantastici progressi nel riconoscimento del testo scritto a mano (HTR) e nell'analisi del layout dei documenti storici.

Nel campo dell'informatica, i concorsi ufficiali danno ai ricercatori la possibilità di perfezionare le nuove tecnologie e garantire che le migliori tecniche salgano alla ribalta. Infatti, il progetto READ ha una propria piattaforma per i concorsi di ricerca (ScriptNet), dove gli informatici possono partecipare o organizzare concorsi.

Negli ultimi mesi, i partner del progetto READ di CITlab all'Università di Rostock e l' Centro di ricerca PRHLT dell'Universitat Politècnica de València hanno generato risultati impressionanti, degni dei premi del concorso e dei riconoscimenti della conferenza.

Lo strumento Conferenza internazionale sull'analisi e il riconoscimento dei documenti (ICDAR), che quest'anno ha avuto luogo a Tokyo, è una delle più grandi conferenze del settore ed è stato il luogo di due successi significativi per il progetto READ.

Joan Puigcerver (PRHLT Research Centre, Universitat Politècnica de València) ha vinto il premio della conferenza per Migliore documento dello studente che si intitolava "Are Multidimensional Recurrent Layers Really Necessary for Handwritten Text Recognition?". Le unità multidimensionali di memoria a breve termine (MLSTM) sono state ampiamente utilizzate per HTR negli ultimi anni. LSTM multidimensionale è una forma potente di apprendimento automatico che è in grado di elaborare immagini di qualsiasi dimensione. Tuttavia, queste unità sono molto più lente di altre architetture e richiedono una grande quantità di memoria. L'articolo ha sostenuto che le unità MLSTM potrebbero non essere necessarie per HTR dopo tutto, e ha proposto un'architettura più economica che è in grado di superare il modello MDLSTM allo stato dell'arte e ridurre significativamente la quantità di tempo necessaria per addestrare un modello per leggere ed elaborare un insieme di documenti scritti a mano.

Un altro risultato all'ICDAR 2017 è venuto da Tobias Grüning (CITlab, Universität Rostock) che ha vinto il Concorso sull'analisi dell'impaginazione di manoscritti medievali impegnativi. L'analisi del layout è una parte importante di HTR poiché quest'ultima tecnologia richiede che le linee di testo in un'immagine siano accuratamente abbinate alle linee di testo trascritte. Questo concorso è stato organizzato dal Analisi di documenti, immagini e voce (DIVA) gruppo di ricerca dell'Università di Friburgo. La competizione richiedeva ai partecipanti di analizzare l'impaginazione e trovare le linee di testo in un impegnativo set di dati di manoscritti medievali con impaginazioni complesse che includevano aggiunte e correzioni marginali e interlineari. Grüning e il suo team si sono concentrati sul rilevamento delle linee di testo e hanno vinto due compiti su tre in questa competizione. La loro efficace tecnologia di analisi del layout è ora disponibile nel nostro Transkribus (scegliere "CITlab advanced" nella sezione "Layout Analysis" della scheda "Tools"). Come mostra l'immagine qui sotto, questa tecnologia può affrontare bene le complicazioni comuni nei documenti medievali!

Documento segmentato in linee utilizzando la premiata tecnologia CITlab. Cologny, Fondation Martin Bodmer, Cod. Bodmer 28, f. 1r - Bibbia latina (disponibile via e-codices: http://www.e-codices.unifr.ch/en/list/one/fmb/cb-0028) [Immagine rilasciata sotto licenza CC-BY-NC].

Tobias Grüning (CITlab, Universität Rostock) si congratula per il suo lavoro sulla segmentazione delle linee di testo [Immagine di Mathias Seuret ]
Il nostro ultimo risultato da menzionare viene da Tobias Strauss (CITlab, Universität Rostock). Ha portato la sua squadra a vincere una competizione su Estrazione di informazioni in documenti storici scritti a mano. Il compito era quello di estrarre informazioni dalle licenze di matrimonio scritte a mano come nomi, luoghi e occupazioni e poi assegnare queste informazioni alle persone corrispondenti, che fossero marito, moglie o padre della sposa. Il team ha lavorato per estrarre e abbinare queste informazioni da intere righe di testo. Questo lavoro è stato fatto con la stessa funzionalità che ora è integrata in Transkribus come parte del nostro nuovo strumento Keyword Spotting. Keyword Spotting è una potente forma di ricerca di parole chiave in cui la tecnologia analizza le immagini della scrittura, piuttosto che cercare attraverso le trascrizioni di queste parole generate da umani o computer. Questo strumento potrebbe quindi facilitare la ricerca di enormi collezioni che non sono ancora state trascritte.

Questi risultati dimostrano che il progetto READ è all'avanguardia nel campo in via di sviluppo dell'HTR. Siamo orgogliosi di rendere tali innovazioni disponibili in Transkribus, permettendo ai nostri utenti di trascrivere automaticamente e cercare tutti i tipi di documenti storici scritti a mano.

CONDIVIDI QUESTO ARTICOLO

Post recenti

25 aprile 2024
News, Transkribus
A gennaio abbiamo annunciato i nostri nuovi piani di abbonamento: Individuale, Studente e Organizzazione. Ciascun piano è adattato a un particolare ...
17 aprile 2024
News, Transkribus
Uno dei maggiori vantaggi di Transkribus è la possibilità di addestrare modelli personalizzati di riconoscimento del testo scritto a mano. Questa caratteristica unica ...
4 aprile 2024
News
La primavera è arrivata e così anche l'uscita di aprile 2024 di Transkribus. Ecco una rapida panoramica di tutte le ...