+ Aggiornamento sull'elaborazione della tabella

In aprile abbiamo ha fatto appello all'aiuto nel generare un nuovo set di dati che potrebbe essere utilizzato per migliorare l'analisi automatica del layout di documenti storici disposti in tabelle. Noi lo abbiamo chiesto e voi avete risposto!

Grazie ai contributi della nostra rete, i ricercatori di READ al Laboratorio di visione artificiale all'Università Tecnica di Vienna, Naver Labs Europe e l' Archivio diocesano di Passau hanno compilato una notevole collezione di immagini di documenti storici contenenti tabelle.

Ora abbiamo un totale di circa 1.500 immagini da 25 collaboratori in tutto il mondo. Le fonti consegnate mostrano una grande varietà di tabelle, dai libri contabili disegnati a mano alle liste di borsa e agli orari dei treni, dai registri alle liste dei prigionieri, semplici stampe tabellari in libri, censimenti della produzione e molto, molto altro.

I ricercatori di READ stanno preparando il set di dati come base per una competizione di ricerca informatica all'inizio del 2019 (maggiori dettagli in arrivo!). Questa raccolta sarà utilizzata per valutare diversi approcci al riconoscimento automatico delle tabelle.

C'è ancora molto da imparare su ciò che costituisce una tabella. Lavorare con questi dati eterogenei dovrebbe aiutarci a superare le specificità e a trovare alcune linee guida e tecniche generiche per elaborare questo tipo di pagine.

Siamo molto grati alla nostra rete per aver fornito una tale varietà di dati tabellari e non vediamo l'ora di condividere il nostro prossimo rapporto sui progressi!

Screenshot del censimento irlandese del 1937 in Transkribus. Immagine per gentile concessione della National University of Ireland, Galway.
CONDIVIDI QUESTO ARTICOLO

Post recenti

17 aprile 2024
News, Transkribus
Uno dei maggiori vantaggi di Transkribus è la possibilità di addestrare modelli personalizzati di riconoscimento del testo scritto a mano. Questa caratteristica unica ...
4 aprile 2024
News
La primavera è arrivata e così anche l'uscita di aprile 2024 di Transkribus. Ecco una rapida panoramica di tutte le ...
3 aprile 2024
News
Si può imparare molto sulla storia francese leggendo libri e guardando documentari. Questo tipo di fonti è ottimo per ...