Comprendere l'applicazione di Transkribus nella ricerca

Di Joe Nockels, Università di Edimburgo

Nell'ambito della sua ricerca di dottorato presso l'Università di Edimburgo e la National Library of Scotland (NLS), Joe Nockels ha effettuato una revisione sistematica di come Trankribus sia stato citato nelle ricerche del periodo 2015-2020. Sono stati raccolti 381 articoli da Google Scholar, Scopus e Web of Science. Ecco alcuni dei risultati:

Le ricerche pubblicate su Transkribus sono internazionali e in crescita.

Tra il 2017 e il 2018 si è registrato un aumento di 235% nelle ricerche su Transkribus, che hanno restituito rispettivamente 39 e 92 lavori. Il 2019 ha visto un ulteriore aumento dei materiali che menzionano Transkribus, saliti a 112. Poiché l'analisi si è conclusa nell'ottobre del 2020, è comprensibile che i lavori siano stati meno numerosi, anche se la quantità di ricerche è stata comunque considerevole, con 99 materiali. L'aumento delle menzioni di Transkribus indica un cambiamento nel panorama delle collezioni e dei curatori, con le istituzioni della memoria che optano per la digitalizzazione e il riconoscimento dei loro materiali. in massa (Chassanoff 2013; Duff et al. 2004). È ragionevole pensare che questa situazione sia aumentata durante e dopo la pandemia di Covid-19, che ha inavvertitamente fornito agli archivi e alle biblioteche una finestra per dare priorità ai progetti digitali, fornendo servizi attraverso molteplici canali per coloro che non hanno accesso agli edifici.

L'inglese è stata la lingua più comune della ricerca Transkribus (67,98%, n = 259). La ricerca di Transkribus appare più multilingue rispetto al contenuto generale di Scopus, dove l'88,4% dei risultati, 77% di materiali artistici e umanistici, sono apparsi in inglese nel 2013 (Van Weijen 2013). Studi più recenti hanno dimostrato che la prevalenza dell'inglese standard è in aumento nella ricerca accademica, indipendentemente dal settore, stimando che 98% delle pubblicazioni in campo scientifico sono scritte in inglese, inducendo i ricercatori provenienti da Paesi in cui l'inglese è una lingua straniera (EFL) a lanciare l'allarme sul fatto che i loro contributi sono inibiti (Flowerdew 2013; Ramirez-Castaneda 2020). Dobbiamo tenere presente questa tendenza, anche se i materiali in inglese che parlano del Transkribus si trovano accanto a lavori in olandese, spagnolo, svedese, bosniaco, russo, norvegese, polacco, italiano, croato, ungherese, ceco e persino maori, mostrando la diversità di coloro che fanno ricerca sul Transkribus, nonché l'ampia gamma delle loro ricerche.

Ricerca Transkribus (2015-2020) tracciata utilizzando la funzione roam di Digimap. I marcatori di posizione identificano l'affiliazione dei ricercatori principali. Il server di Innsbruck è contrassegnato da uno spillo giallo.

Tracciando una mappa geografica delle opere restituite, possiamo notare che i materiali che menzionano Transkribus gravitano intorno ai server di Innsbruck, con le istituzioni tedesche più rappresentate. Detto questo, si sono aperte strade di ricerca soprattutto in Asia occidentale.

I membri del READ-COOP svolgono un ruolo importante nella pubblicazione di ricerche che utilizzano e citano Transkribus..

118 lavori (30.97%) provengono da istituzioni READ-COOP. Ciò evidenzia che il COOP sta diventando uno spazio forte per le istituzioni che condividono la stessa idea di Transkribus, presentando i risultati e aumentando le sue capacità come strumento.

Grafico che evidenzia la produzione di ricerca dei membri istituzionali di READ-COOP per numero di pubblicazioni.

Transkribus è citato principalmente in articoli di giornale (42.87%, n = 163), documenti di conferenze (21.00%, n = 80) e documenti politici (8.14%, n = 31). Anche se la ricerca che utilizza e cita il software è apparsa in materiali più grigi come sezioni di libri, tesi di laurea e post-laurea, relazioni, presentazioni, post di blog, riviste e registrazioni video. Dell'intero set di dati, 71,13% di lavori erano accessibili online con una licenza di copyright aperta (n= 271), replicando in una certa misura l'atmosfera di collegialità e cooperazione vista con l'istituzione del modello di condivisione del READ-COOP. Si tratta di un segnale positivo, che consente di fare più ricerca attraverso la condivisione di pubblicazioni, modelli e metodologie.

Transkribus è presente soprattutto nelle pubblicazioni di archivistica e biblioteconomia.mentre un'ampia gamma di discipline utilizza l'HTR in misura minore, come la storia, l'informatica, la citizen science, la legge e l'istruzione. Ciò dimostra l'ampia applicabilità dello strumento HTR, che mette a disposizione dei ricercatori una serie di strumenti utili per migliorare le descrizioni delle collezioni, il recupero delle informazioni e il riconoscimento dei documenti storici. Transkribus è utile indipendentemente dalla concezione che gli utenti hanno dei metodi data-driven. Un bibliotecario potrebbe voler utilizzare HTR non per produrre trascrizioni complete, ma per inserire parole chiave nei metadati delle collezioni, migliorando l'accesso ai materiali storici. Al contrario, i singoli ricercatori tendono a utilizzare Transkribus per produrre dati ricchi e "sufficientemente specifici da poterli rendere operativi nel perseguimento dei loro obiettivi di ricerca". In termini di dominio dell'informatica, la ricerca in Transkribus dipende maggiormente dall'ottenimento di risultati prevedibili e regolarizzati (come un certo livello di tasso di errore di caratteri/parole) (Lincoln 2017, p 30). Transkribus è abbastanza flessibile da soddisfare tutte queste esigenze specifiche.

Soprattutto dal 2017, la ricerca su Transkribus è stata intrapresa in diversi campi. Sebbene l'archivistica, l'informatica e la scienza dell'informazione rimangano le discipline dominanti, abbiamo riscontrato che sono stati pubblicati lavori in tutte le arti, le scienze umane e le scienze sociali (AHSS). Tra i settori rappresentati nel nostro corpus figurano gli studi religiosi, l'editoria, la storia, gli studi teatrali, la filosofia, le scienze gestionali e gli studi medievali.

Tenendo conto di tutti questi risultati, Transkribus sembra essere, come Thylstrup (2019) descrive, un movimento di digitalizzazione di massa "dal basso verso l'alto", costituito da centinaia di progetti simultanei guidati da ricercatori motivati. Questo fornisce una solida base per il READ-COOP, aumentando l'accuratezza di Transkribus fornendo dati di verità e modelli addestrati. Con la crescita di Transkribus, inevitabilmente si produrranno altre ricerche e emergeranno nuovi ritmi negli approcci dei ricercatori. La realizzazione di analisi successive della letteratura consentirà di seguire e comprendere questo fenomeno. Attraverso questa struttura, il valore probatorio delle esperienze degli utenti con HTR può essere sfruttato e raccolto, aiutando a sviluppare Transkribus in modo sostenibile e utile.

Per il documento completo vedere: https://link.springer.com/article/10.1007/s10502-022-09397-0

Chassanof A (2013) Gli storici e l'uso di materiali di fonte primaria nell'era digitale. Am Arch 76:458-480. https://doi.org/10.17723/aarc.76.2.lh76217m2m376n28

Duff W, Craig B, Cherry J (2004) L'uso delle fonti archivistiche da parte degli storici: promesse e insidie dell'era digitale. Public Hist 26:1-10

Flowerdew J (2013) Some thoughts on English for Research Publication Purposes (ERPP) and related issues. Cambridge University Press, Cambridge

Lincoln M (2017) Modi di dimenticare: il bibliotecario, lo storico e la macchina. In: Padilla T, Allen L, Frost H, Potvin S, Russey RE, Varner S (eds) Always already computational: library collections as data. Institute of Memory and Library Services, National Forum Positional Statements, pp 20-30. https://collectionsasdata.github.io. Consultato il 20 novembre 2020

Ramirez-Castaneda V (2020) Svantaggi nella preparazione e pubblicazione di articoli scientifici causati dalla dominanza della lingua inglese nella scienza: il caso dei ricercatori colombiani in scienze biologiche. Documento presentato a PLoS One, Kyoto, 16 settembre 2020. https://doi.org/10.1371/journal.pone. 0238372

Thylstrup NB (2019) La politica della digitalizzazione di massa. MIT Press, Cambridge

van Weijen D (2013) I linguaggi di pubblicazione nelle arti e nelle scienze umane. Res Trends 32:1-10

CONDIVIDI QUESTO ARTICOLO

Messaggi recenti

20 giugno 2022
Transkribus
Di Joe Nockels, Università di Edimburgo Nell'ambito della sua ricerca di dottorato presso l'Università di Edimburgo e la National Library ...
15 giugno 2022
Transkribus, Webinar
Siamo entusiasti di lanciare la nostra nuova serie di webinar "Ask Us Anything", in cui i partecipanti possono chiederci qualsiasi cosa ...
Giugno 9, 2022
Uncategorized
La nuova funzione di condivisione potrebbe essere un piccolo pulsante per una schermata, ma è una grande funzione per ...