+ 2017 - un buon anno per il progetto READ!

È difficile da credere, ma siamo entrati nel terzo anno del progetto READ! Come la maggior parte del mondo, stiamo usando gennaio come un momento appropriato per guardare indietro ad alcuni dei nostri risultati dell'anno passato e pensare a dove saremo diretti nei prossimi mesi.

Ricerca

La ricerca è parte integrante del progetto READ e i nostri team di ricerca rendono possibile Transkribus utenti di applicare l'apprendimento automatico per ottenere il riconoscimento automatico, la trascrizione e la ricerca di documenti storici. Le tecniche di riconoscimento del testo scritto a mano, il miglioramento dell'immagine, l'analisi del layout, la comprensione del documento e l'identificazione dello scrittore sono state tutte perfezionate in READ e i risultati di questa ricerca sono stati integrati nel flusso di lavoro di Transkribus. Per saperne di più sulla ricerca alla base della tecnologia del progetto READ, dai un'occhiata al nostro Risultati (relazioni presentate alla Commissione europea) nell'ambito dei pacchetti di lavoro 6 e 7. La competizione è anche una parte importante della vita per i nostri informatici; i concorsi ufficiali forniscono uno dei mezzi più efficaci per testare e migliorare le ultime innovazioni tecnologiche. I ricercatori READ sono all'avanguardia nel settore e hanno goduto di successi in competizioni degne di nota. Il progetto READ ha anche lanciato ScriptNet, una nuova piattaforma dove gli scienziati informatici possono partecipare a competizioni esistenti o organizzarne di proprie.

ScriptNet

Servizi

La piattaforma Transkribus è il cuore del progetto READ e fornisce un flusso di lavoro completo e affidabile per l'addestramento di modelli di riconoscimento del testo scritto a mano e la trascrizione e la ricerca automatizzata di documenti storici. Gli sviluppatori di Transkribus all'Università di Innsbruck stanno continuamente perfezionando lo strumento, aggiungendo nuove funzionalità, correggendo i bug e rispondendo alle richieste degli utenti. Bravo!

Archivi, biblioteche, singoli studiosi e gruppi di ricerca di tutto il mondo hanno lavorato con Transkribus per riconoscere e trascrivere diverse collezioni, incluso materiale impegnativo come testi medievali o scritture arabe. Nei casi migliori, Transkribus può produrre una trascrizione automatica con un Character Error Rate di 5% (il che significa che 95% dei caratteri in una data trascrizione sarebbero generati correttamente dal computer). Guarda il nostro ultimo storie di successo per saperne di più sui nostri risultati più significativi! Gli utenti di Transkribus possono ora accedere a modelli pubblicamente disponibili in grado di trascrivere documenti del XVIII-XIX secolo scritti in tedesco o in inglese con livelli di precisione rispettabili. Nel 2018, speriamo di rendere più modelli pubblicamente aperti in modo che gli utenti possano facilmente provare la tecnologia su diversi script e lingue.

Due nuove entusiasmanti caratteristiche sono state recentemente rese disponibili in Transkribus - sulla base della tecnologia sviluppata dal CITlab all'Università di Rostock. L'analisi automatica del layout è ora più accurata, il che significa che anche pagine complicate come quella qui sotto possono essere divise in righe automaticamente con notevole precisione. Keyword Spotting è uno strumento di ricerca completamente nuovo in Transkribus. Si tratta di una forma sofisticata di ricerca di parole chiave in cui la tecnologia analizza le immagini della scrittura, piuttosto che cercare attraverso le trascrizioni di queste parole generate da umani o computer. Questo strumento ha il potenziale per facilitare la ricerca di vaste collezioni di documenti che non sono ancora stati trascritti.

Documento segmentato in linee utilizzando la premiata tecnologia CITlab. Cologny, Fondation Martin Bodmer, Cod. Bodmer 28, f. 1r - Bibbia latina (disponibile via e-codices: http://www.e-codices.unifr.ch/en/list/one/fmb/cb-0028) [Immagine rilasciata sotto licenza CC-BY-NC].
Oltre al cliente esperto Transkribus, READ sta costruendo un assortimento di nuovi strumenti di ricerca che fanno uso della stessa tecnologia. Gli sviluppatori di READ hanno creato una versione beta di Transkribus web, una versione lite di Transkribus che permette agli utenti di trascrivere documenti online. Il Laboratorio di visione artificiale dell'Università Tecnica di Vienna hanno costruito strumenti funzionali per la digitalizzazione di documenti con un telefono cellulare. Disponibile ora, DocScan è un'applicazione mobile gratuita per Android per scattare foto di alta qualità di documenti utilizzando un telefono cellulare. Il Computer Vision Lab ha anche creato prototipi di un ScanTentun pezzo di equipaggiamento progettato per tenere un telefono cellulare in posizione sopra un documento. Con DocScan e l'ScanTent, gli utenti saranno in grado di digitalizzare i documenti su richiesta e utilizzare queste immagini in Transkribus per l'elaborazione automatica o ulteriori ricerche. Un altro test-run di ScanTent sarà prodotto nel 2018 - puoi registrare il tuo interesse al Sito web ScanTent.

Markus Diem (Computer Vision Lab, Technical University Vienna) dimostra l'ScanTent al sottosegretario di stato dell'Austria (Muna Duzdar) e al membro del comitato esecutivo del Public Service Union Austria (GÖD) (Dr. Norbert Schnedl).

Abbiamo anche nuovi siti web per mostrare la nostra tecnologia sotto forma di Transkribus Impara e FamousHands. Il primo è un'applicazione di e-learning dove gli utenti possono esercitarsi a trascrivere documenti e affinare le loro abilità di paleografia. Il secondo è una collezione pubblica di immagini della calligrafia di individui famosi (tra cui Hans Christian Andersen, Nikola Tesla e Diana Principessa del Galles). Queste immagini possono essere utilizzate come punto di partenza per la tecnologia Writer Identification.

Rete

La collaborazione è uno degli aspetti più gratificanti del progetto READ e stiamo costruendo una rete globale di utenti. Più di 8000 persone si sono registrate per un account Transkribus, 64 istituzioni e progetti hanno firmato un memorandum d'intesa con noi e 80 utenti altamente impegnati si sono riuniti al primo Conferenza degli utenti Transkribus, che si è tenuto a Vienna nel novembre 2017. Il nostro ampio gruppo di utenti ci fornisce una grande varietà di documenti, tra cui Folclore svedeseMusica italiana, carte medievali e Registri dell'università. I nostri algoritmi di apprendimento automatico si rafforzano con ogni pezzo di dati di allenamento che viene presentato alla nostra piattaforma. In parole povere - più utenti, migliore è la tecnologia!

Continuiamo a diffondere la parola sul progetto READ dentro e fuori, in workshop regolari e grandi conferenze come il Congresso Internazionale Medievale a Leeds e Umanità digitali 2017 (l'anno scorso a Montreal), così come attraverso il nostro blog, pagina wiki, Account Twitter e Canale YouTube. Dateci un like e un follow se potete 🙂 Anche i media tradizionali stanno iniziando a prendere nota del progetto READ - siamo stati recentemente su TV nazionale in Finlandia e radio nazionale in Serbia.

Maria Kallio parla al Congresso Internazionale Medievale sull'uso di Transkribus per fare un'edizione digitale dei documenti di un monastero brigitano

In termini di risultati della nostra ricerca, stiamo lavorando per assicurare che, dove possibile, le pubblicazioni dei nostri progetti siano ad accesso aperto, i nostri strumenti di ricerca siano Open Source tramite Github e i nostri dati di ricerca pubblicati vengono resi disponibili in Zenodo.

Cosa c'è dopo?

I nostri team di ricerca continueranno a lavorare all'avanguardia nel campo del riconoscimento automatico dei testi. La piattaforma Transkribus sarà mantenuta e aggiornata, così come i nuovi strumenti come ScanTent e Transkribus Learn. Non vediamo l'ora di vedere come le tecnologie del progetto READ affrontano i documenti impegnativi che interessano sia i nuovi che gli attuali utenti di Transkribus e siamo fiduciosi che le nostre innovazioni possano facilitare la scoperta e la ricerca su larga scala. E non vediamo l'ora di vedervi alla seconda Transkribus User Conference che si terrà più avanti nel 2018 - annuncio in arrivo!

Vuoi saperne di più?

Potete trovare riassunti più dettagliati del lavoro che READ ha completato in queste diverse aree dando un'occhiata al ultimi rapporti (deliverable) che abbiamo presentato alla Commissione europea.

CONDIVIDI QUESTO ARTICOLO

Post recenti

25 aprile 2024
News, Transkribus
A gennaio abbiamo annunciato i nostri nuovi piani di abbonamento: Individuale, Studente e Organizzazione. Ciascun piano è adattato a un particolare ...
17 aprile 2024
News, Transkribus
Uno dei maggiori vantaggi di Transkribus è la possibilità di addestrare modelli personalizzati di riconoscimento del testo scritto a mano. Questa caratteristica unica ...
4 aprile 2024
News
La primavera è arrivata e così anche l'uscita di aprile 2024 di Transkribus. Ecco una rapida panoramica di tutte le ...