Comprendere l'impiego di Transkribus nella ricerca

Di Joe Nockels, Università di Edimburgo

Nell'ambito della sua ricerca di dottorato presso l'Università di Edimburgo e la National Library of Scotland (NLS), Joe Nockels ha analizzato sistematicamente come Trankribus sia stato citato nelle ricerche del periodo 2015-2020. Sono stati raccolti 381 articoli da Google Scholar, Scopus e Web of Science. Ecco alcuni dei risultati:

Le ricerche pubblicate su Transkribus provengono da tutto il mondo e sono in crescita.

Tra il 2017 e il 2018 le ricerche su Transkribus sono aumentate del 235%, registrando rispettivamente 39 e 92 studi. Nel 2019 è stato registrato un ulteriore aumento del materiale che menziona Transkribus, salito a 112 progetti. Poiché l'analisi si è conclusa nell'ottobre del 2020, è comprensibile che i progetti siano stati meno numerosi, anche se la quantità di ricerche è stata comunque considerevole, con 99 studi. L'aumento delle menzioni di Transkribus indica un cambiamento nel panorama delle collezioni e dei curatori, con le istituzioni della memoria che optano per il riconoscimento dei loro materiali e la digitalizzazione di massa (Chassanoff 2013; Duff et al. 2004). È ragionevole pensare che questa situazione sia aumentata durante e dopo la pandemia da Covid-19, che ha inavvertitamente fornito agli archivi e alle biblioteche una finestra per dare priorità ai progetti digitali, fornendo servizi attraverso molteplici canali per coloro che non hanno accesso agli edifici.

L'inglese è stata la lingua più usata nella ricerca su Transkribus (67,98%, n = 259). La ricerca di Transkribus appare più multilingue rispetto al contenuto generale di Scopus, in cui nel 2013 l'88,4% dei risultati, di cui 77% di materiali artistici e umanistici, sono stati pubblicati in inglese (Van Weijen 2013). Studi più recenti hanno dimostrato che nella ricerca accademica la prevalenza dell'inglese standard è in aumento, indipendentemente dal settore. Si stima che il 98% delle pubblicazioni in campo scientifico vengono scritte in inglese. Questo porta i ricercatori provenienti da paesi in cui l'inglese è una lingua straniera (EFL) a lanciare l'allarme sul fatto che i loro contributi vengono ostacolati (Flowerdew 2013; Ramirez-Castaneda 2020). Dobbiamo tenere presente questa tendenza, anche se i materiali in inglese, che parlano di Transkribus, sono collegati a pubblicazioni in olandese, spagnolo, svedese, bosniaco, russo, norvegese, polacco, italiano, croato, ungherese, ceco e persino maori. Questo dimostra la diversità di chi fa ricerca su Transkribus, nonché l'ampia gamma delle loro ricerche.

Ricerca Transkribus (2015-2020) tracciata utilizzando la funzione roam di Digimap. I marcatori di posizione identificano l'affiliazione dei ricercatori principali. Il server di Innsbruck è contrassegnato da uno spillo giallo.

Tracciando una mappa geografica dei lavori restituiti, possiamo notare che i materiali che menzionano Transkribus gravitano intorno ai server di Innsbruck, con le istituzioni tedesche più rappresentate. Detto questo, si sono aperte strade di ricerca soprattutto in Asia occidentale.

I membri di READ-COOP svolgono un ruolo importante nella pubblicazione di ricerche che utilizzano e citano Transkribus.

118 lavori (30,97%) provengono da istituzioni READ-COOP. Ciò evidenzia che la COOP sta diventando uno spazio importante per le istituzioni che condividono la stessa idea di Transkribus presentando i risultati e migliorando le sue capacità come strumento.

Grafico che evidenzia le pubblicazioni dei membri istituzionali di READ-COOP per numero di pubblicazioni.

Transkribus viene citato principalmente in articoli di riviste (42,87%, n = 163), documenti di conferenze (21,00%, n = 80) e documenti politici (8,14%, n = 31). Nonostante ciò, la ricerca che utilizza e cita il software è apparsa soprattutto nella letteratura grigia come in sezioni di libri, tesi di laurea e post-laurea, relazioni, presentazioni, post di blog, riviste e registrazioni video. Dell'intero set di dati, il 71,13% dei lavori erano accessibili online con una licenza di copyright aperta (n= 271), riproducendo in un certo senso l'atmosfera di collegialità e cooperazione instauratasi con il modello di condivisione di READ-COOP. Si tratta di un segnale positivo, che consente di fare più ricerca attraverso la condivisione di pubblicazioni, modelli e metodologie.

Transkribus è presente soprattutto nelle pubblicazioni di archivistica e biblioteconomia,mentre un'ampia gamma di discipline, quali la storia, l'informatica, la citizen science, la legge e le scienze della formazione utilizza l'HTR in misura minore. Ciò dimostra l'ampio impiego dello strumento HTR, che mette a disposizione dei ricercatori una serie di strumenti utili per migliorare le descrizioni delle collezioni, il recupero delle informazioni e il riconoscimento dei documenti storici. Transkribus è utile indipendentemente dalla concezione che gli utenti hanno dei metodi basati sui dati. Un bibliotecario potrebbe voler utilizzare l'HTR non per produrre trascrizioni complete, ma per inserire parole chiave nei metadati delle collezioni, migliorando l'accesso ai materiali storici. Al contrario, i singoli ricercatori tendono a utilizzare Transkribus per produrre dati ricchi e "sufficientemente specifici da poterli rendere operativi nel perseguimento dei loro obiettivi di ricerca". In termini di informatica la ricerca su Transkribus dipende soprattutto dall'ottenimento di risultati prevedibili e regolarizzati (come un certo livello di tasso di errore di caratteri/parole) (Lincoln 2017, p 30). Transkribus è abbastanza flessibile da soddisfare tutte queste esigenze specifiche.

Soprattutto dal 2017, la ricerca su Transkribus è stata intrapresa in diversi campi. Sebbene l'archivistica, l'informatica e la scienza dell'informazione rimangano le discipline dominanti, abbiamo potuto notare che sono stati pubblicati lavori in tutte le arti, le scienze umane e le scienze sociali. Tra i settori rappresentati nel nostro corpus figurano gli studi religiosi, l'editoria, la storia, gli studi teatrali, la filosofia, le scienze gestionali e gli studi medievali.

Tenendo conto di tutti questi risultati, Transkribus sembra essere, come descrive Thylstrup (2019), un movimento di digitalizzazione di massa "dal basso verso l'alto", costituito da centinaia di progetti simultanei guidati da ricercatori motivati. Questo fornisce una solida base per la READ-COOP, aumentando l'accuratezza di Transkribus fornendo dati di Ground Truth e modelli addestrati. Con la crescita di Transkribus, inevitabilmente si svolgeranno altre ricerche ed emergeranno nuovi ritmi negli approcci dei ricercatori. Svolgere ulteriori analisi della letteratura consentirà di seguire e comprendere questo fenomeno. Attraverso questa struttura, può essere raccolto e sfruttato il valore evidente delle esperienze degli utenti con l'HTR, aiutando a sviluppare Transkribus in modo sostenibile e utile.

Per il documento completo vedere: https://link.springer.com/article/10.1007/s10502-022-09397-0

Chassanof A (2013) Gli storici e l'uso di materiali di fonte primaria nell'era digitale. Am Arch 76:458-480. https://doi.org/10.17723/aarc.76.2.lh76217m2m376n28

Duff W, Craig B, Cherry J (2004) L'uso delle fonti archivistiche da parte degli storici: promesse e insidie dell'era digitale. Public Hist 26:1-10

Flowerdew J (2013) Some thoughts on English for Research Publication Purposes (ERPP) and related issues. Cambridge University Press, Cambridge

Lincoln M (2017) Modi di dimenticare: il bibliotecario, lo storico e la macchina. In: Padilla T, Allen L, Frost H, Potvin S, Russey RE, Varner S (eds) Always already computational: library collections as data. Institute of Memory and Library Services, National Forum Positional Statements, pp 20-30. https://collectionsasdata.github.io. Consultato il 20 novembre 2020

Ramirez-Castaneda V (2020) Svantaggi nella preparazione e pubblicazione di articoli scientifici causati dalla dominanza della lingua inglese nella scienza: il caso dei ricercatori colombiani in scienze biologiche. Documento presentato a PLoS One, Kyoto, 16 settembre 2020. https://doi.org/10.1371/journal.pone. 0238372

Thylstrup NB (2019) La politica della digitalizzazione di massa. MIT Press, Cambridge

van Weijen D (2013) I linguaggi di pubblicazione nelle arti e nelle scienze umane. Res Trends 32:1-10

CONDIVIDI QUESTO ARTICOLO

Post recenti

25 aprile 2024
News, Transkribus
A gennaio abbiamo annunciato i nostri nuovi piani di abbonamento: Individuale, Studente e Organizzazione. Ciascun piano è adattato a un particolare ...
17 aprile 2024
News, Transkribus
Uno dei maggiori vantaggi di Transkribus è la possibilità di addestrare modelli personalizzati di riconoscimento del testo scritto a mano. Questa caratteristica unica ...
4 aprile 2024
News
La primavera è arrivata e così anche l'uscita di aprile 2024 di Transkribus. Ecco una rapida panoramica di tutte le ...