La mia storia READ/Transkribus: Tobias Hodel

Nel 2016 mi sono unito al progetto READ per l'archivio di stato di Zurigo. All'interno del grande progetto, sono diventato parte del gruppo di lavoro di diffusione e responsabile dell'allineamento di più di 100'000 pagine di verbali scritti a mano dagli esecutivi di Zurigo del 19^° secolo. Grazie a READ, non solo ho potuto viaggiare in Europa e negli Stati Uniti per più di 50 workshop e conferenze relative a Transkribus. Inoltre, sono entrato in contatto con numerosi studiosi, archivisti, bibliotecari e scienziati che cercano di ottenere il massimo dall' HTR, KWS, analisi del layout (migliorato semanticamente), e molto altro. Ho avuto il privilegio di vedere il patrimonio culturale scritto nella sua incredibile varietà e di discutere della sua specificità con esperti.

Una delle conseguenze di usare, pensare e parlare quotidianamente di machine learning è stata quella di scoprire questo approccio e i suoi vantaggi e problemi in profondità e modellare la mia ricerca di conseguenza. Il risultato del mio uso di Transkribus non sono stati quindi solo i centinaia di modelli HTR+ e PyLAIA e la preparazione di migliaia di pagine di Ground Truth (vedi, per esempio, il modello pubblico StAZH_RRB_German_Kurrent_XIX basato su 26 milioni di parole). È piuttosto l'intuizione, che è nostro dovere come studiosi usare, e l' analizzare criticamente il deep learning, non solo per rendere accessibile il patrimonio culturale ma per aiutare a capire la tecnologia e le sue insidie per il nostro futuro beneficio.

Per quanto riguarda Transkribus, ho capito che la piattaforma è pronta per l'uso se vengono elaborate diverse centinaia di immagini e per farlo è essenziale un ambiente stabile. Per un progetto di edizione accademica (koenigsfelden.uzh.ch), abbiamo usato Transkribus come hub per le trascrizioni, ottenendo come sottoprodotto alcuni modelli HTR. Alla fine del mio mandato all'archivio statale di Zurigo, abbiamo iniziato una varietà di progetti basati su HTR+ e p2pala per preparare grandi quantità di testo premoderno e usare annotazioni semantiche per accelerare l'indicizzazione archivistica. Per l'intero campo GLAM, credo che questa sia la strada da seguire.

Nel 2019 - in gran parte grazie al successo di READ - mi è stata offerta una posizione di ruolo all'Università di Berna con il compito di fornire alla facoltà approcci alle digital humanities. Da allora, uso Transkribus nell'insegnamento e attualmente penso ai prossimi passi per l'annotazione del testo, incluso il Named Entity Recognition (esp. per le lingue storiche) e l'estrazione del contenuto (ad esempio, usando il Topic Modeling).

Vuoi saperne di più? Ho pubblicato documenti in tedesco e in inglese su Transkribus, HTR, e sulle conseguenze dell'uso del machine learning nelle scienze umane (oltre a qualche cosa sul Medioevo 😉

Vedi la mia pagina all'Università di Berna quie il mio Profilo ORCiD, o seguimi su Twitter.

Cookie	Descrizione	Durata
politica dei cookie visualizzati	Il cookie è impostato dal plugin GDPR Cookie Consent e viene utilizzato per memorizzare se l'utente ha acconsentito o meno all'uso dei cookie. Non memorizza alcun dato personale.	1 ora
PHPSESSID	Questo cookie è nativo delle applicazioni PHP. Il cookie viene utilizzato per memorizzare e identificare l'ID di sessione unico di un utente allo scopo di gestire la sessione dell'utente sul sito web. Il cookie è un cookie di sessione e viene cancellato quando tutte le finestre del browser vengono chiuse.	1 anno

Cookie	Descrizione	Durata
VISITATORE_INFO1_LIVE	Questo cookie è impostato da Youtube. Utilizzato per tracciare le informazioni dei video di YouTube incorporati in un sito web.	5 mesi
IDE	Utilizzato da Google DoubleClick e memorizza le informazioni su come l'utente utilizza il sito web e qualsiasi altra pubblicità prima di visitare il sito. Questo viene utilizzato per presentare agli utenti gli annunci che sono rilevanti per loro in base al profilo dell'utente.	2 anni

Cookie	Descrizione	Durata
GPS	Questo cookie è impostato da Youtube e registra un ID unico per tracciare gli utenti in base alla loro posizione geografica	30 minuti
tk_or	Questo cookie è impostato dal plugin JetPack sui siti che utilizzano WooCommerce. Questo è un cookie di riferimento utilizzato per analizzare il comportamento dei referrer per Jetpack	5 anni
tk_r3d	Il cookie è installato da JetPack. Utilizzato per le metriche interne delle attività dell'utente per migliorare l'esperienza dell'utente	3 giorni
tk_lr	Questo cookie è impostato dal plugin JetPack sui siti che utilizzano WooCommerce. Questo è un cookie di riferimento utilizzato per analizzare il comportamento dei referrer per Jetpack	1 anno
{\an8}Che cosa?	Questo cookie è installato da Google Analytics. Il cookie viene utilizzato per calcolare i dati del visitatore, della sessione, del camapign e per tenere traccia dell'utilizzo del sito per il rapporto di analisi del sito. Il cookie memorizza le informazioni in modo anonimo e assegna un numero generato randoly per identificare i visitatori unici.	2 anni
_gid	Questo cookie è installato da Google Analytics. Il cookie viene utilizzato per memorizzare informazioni su come i visitatori utilizzano un sito web e aiuta a creare un rapporto analitico su come sta andando il sito web. I dati raccolti includono il numero di visitatori, la fonte da cui provengono e le pagine visitate in forma anonima.	1 giorno
matomo	Per l'analisi statistica, usiamo "Matomo" su questo sito web. Si tratta di uno strumento open source per l'analisi del web. Matomo non trasmette dati a server al di fuori del controllo di READ-COOP. Matomo viene disattivato quando si visita il nostro sito web. Solo se lei acconsente attivamente, il suo comportamento d'uso viene registrato in modo anonimo.	1 anno

Cookie	Descrizione	Durata
YSC	Questo cookie è impostato da Youtube e viene utilizzato per monitorare le visualizzazioni dei video incorporati.	1 anno
_gat	Questo cookie è installato da Google Universal Analytics per strozzare il tasso di richiesta per limitare la raccolta di dati su siti ad alto traffico.	1 minuto

La mia storia READ/Transkribus: Tobias Hodel

La COOP

Prodotti e servizi

Informazioni utili

Risorse utili

Community