Storia di successo
Pubblicato: 2 mesi fa

Creazione di un'edizione digitale accademica dei documenti di Lovelace con Jessica Cook

Creazione di un'edizione digitale accademica dei documenti di Lovelace con Jessica Cook

Matematica, informatica, musica, poesia: Ada Lovelace era una persona dai molti talenti. La matematica del XIX secolo, figlia del famoso poeta romantico Lord Byron, è considerata uno dei pionieri dell'informatica moderna grazie al suo lavoro sulla "macchina analitica" di Charles Babbage. Una delle idee più innovative di Lovelace era che la macchina potesse essere utilizzata non solo per l'aritmetica: un'idea che, nel mondo odierno degli smartphone e dei server, si è rivelata molto vera.

Tuttavia, nonostante i risultati tecnici di Lovelace, sappiamo sorprendentemente poco della sua vita. Sebbene l'archivio Lovelace sia ricco di carte e documenti, gran parte di essi sono inaccessibili, rendendo difficile la ricerca scientifica sulle fonti. Ma le cose stanno per cambiare.

Jessica Cook, dottoranda presso il dipartimento di inglese di UCLAsta trascrivendo l'intero archivio di Ada Lovelace per scoprire di più sulla vita di questa straordinaria matematica. Spera che, rendendo più facile l'accesso agli scritti personali di Lovelace, si possa avere una migliore visione del pensiero di Lovelace e di come la sua poesia abbia influenzato le sue idee rivoluzionarie sull'informatica. Abbiamo fatto una chiacchierata con Jessica per saperne di più su questo progetto di ricerca unico e sulla sua esperienza con Transkribus.

Accesso all'Archivio Ada Lovelace

La vita e il lavoro di Ada Lovelace non hanno sempre suscitato tanto interesse. In passato, l'attenzione era rivolta soprattutto al suo collaboratore maschile, Charles Babbage, e la Lovelace era vista come una semplice assistente. "Molti resoconti ritraevano Lovelace come una giovane donna ingenua e un po' stellare, priva di conoscenze matematiche avanzate e con scarse capacità visionarie", ha spiegato Jessica. "Ma a partire dalla fine degli anni '70, una serie di studi ha iniziato ad approfondire l'eredità intellettuale di Lovelace. L'insieme di questi studi dimostra in modo convincente che Lovelace possedeva effettivamente le conoscenze tecniche necessarie per plasmare in modo significativo la concettualizzazione del Motore Analitico".

La Bodleian Library dell'Università di Oxford è responsabile della conservazione dell'intera collezione Lovelace. @ subherwal, distribuito sotto un Licenza CC-BY 2.0

Tuttavia, nonostante il crescente interesse per l'opera di Lovelace, gli studiosi fanno ancora fatica a farsi un'idea completa della sua vita. Ciò non è dovuto alla mancanza di fonti storiche. Al Biblioteca Bodleiana a Oxford, esiste un'ampia collezione di lettere, appunti e altri documenti scritti da e per la straordinaria matematica, che forniscono una grande quantità di informazioni sulla sua vita. Ma l'accesso a questa ricca collezione rimane una sfida. Poiché l'archivio Lovelace non è mai stato pubblicato in un'edizione scientifica completa, i ricercatori hanno difficoltà a condurre ricerche efficaci. "La maggior parte degli studiosi che si occupano di Lovelace oggi ha accesso solo a un ritratto incompleto e spesso fuorviante della sua vita", ha spiegato Jessica. "Finché questa lacuna non sarà colmata, la nostra conoscenza di questa donna straordinaria sarà sempre necessariamente incompleta". Convinta del potenziale dell'archivio Lovelace, Jessica ha deciso coraggiosamente di colmare lei stessa questa lacuna e di creare una versione digitale completamente trascritta dell'archivio Lovelace.

Come trascrivere 14.000 pagine

Naturalmente, la digitalizzazione di un archivio di questa portata non è un'impresa da poco. L'archivio Lovelace contiene circa 14.000 pagine, che un ricercatore solitario come Jessica avrebbe impiegato anni per trascrivere manualmente. Pertanto, ha iniziato a cercare un metodo più efficace in termini di tempo e ha scoperto di avere due opzioni principali. "La prima è stata quella di ricorrere al crowd-sourcing, che è stato utilizzato con successo da progetti di digital humanities come il progetto Progetto Codice Dickens ", ha spiegato Jessica. "Ci sono alcuni incredibili vantaggi che possono derivare da questo tipo di modello rivolto al pubblico, ma anche alcune insidie significative". 

Il crowd-sourcing è un metodo che richiede molte risorse. Richiede la digitalizzazione professionale dei materiali, implica un'intensa attività di sensibilizzazione e di formazione e richiede la collaborazione di molti membri del team con diversi livelli di coinvolgimento e di competenza. "Tutti questi compiti costano tempo e denaro. Per questo motivo, questo tipo di modello potrebbe non essere il più adatto per i laureati, gli studenti post-dottorato o altri che operano al di fuori degli auspici del mondo accademico di ruolo".

La seconda opzione di Jessica era quella di utilizzare un software per la trascrizione automatica. Dopo una lunga ricerca su blog e forum accademici, si è imbattuta nel software Transkribus software di riconoscimento della scrittura. Tranksribus utilizza modelli di intelligenza artificiale per trasformare il testo dei documenti scritti a mano in testo digitale, che può essere archiviato in un database e reso ricercabile attraverso tag e metadati. "Addestrando i modelli di intelligenza artificiale a svolgere gran parte del lavoro di trascrizione, posso utilizzare la funzione di ricerca per parole chiave per trovare materiale specifico per i miei obiettivi immediati di ricerca per la tesi, invece di affidarmi a congetture per individuare il materiale pertinente." 

Il fatto che Transkribus sia stato sviluppato da un team di accademici che conoscevano il processo di ricerca negli archivi storici è stato un altro fattore chiave per Jessica, così come le opzioni di borsa di studio a sua disposizione. Il Programma borsa di studio Transkribus La Fondazione assegna crediti gratuiti ai giovani ricercatori che desiderano utilizzare Transkribus per i loro progetti e, data l'importanza accademica del progetto di Jessica, le è stato concesso un numero di crediti sufficiente a coprire la trascrizione di tutte le pagine. "Grazie alla borsa di studio, potrò usare Transkribus per trascrivere l'intera collezione".

Creazione del modello di intelligenza artificiale Lovelace con Transkribus

Il primo passo di Jessica nel processo di trascrizione è stato quello di imparare esattamente cosa è possibile fare con Transkribus. "Invito tutti coloro che iniziano un progetto con Transkribus a leggere attentamente il sito web e ad ascoltare tutte le domande e risposte registrate su YouTube", ha consigliato. Le informazioni disponibili erano così tante che Jessica ha iniziato a raccogliere tutto ciò che leggeva in un manuale di formazione personale per riferimenti futuri. "E, cosa più importante, ho contattato spesso il team di READ-COOP per porre delle domande, e loro sono stati molto disponibili nel rispondere alle mie richieste".  

Armata delle sue nuove conoscenze, Jessica ha quindi iniziato ad addestrare il suo modello AI con Transkribus. Finora ha trascritto circa un decimo della raccolta ed è molto soddisfatta dei risultati iniziali. Ma per certi versi, lavorare con il software è stato diverso da come si aspettava. "All'inizio volevo che il modello Lovelace funzionasse quasi quanto me, in termini di lettura e trascrizione. Con il progredire del mio lavoro, la mia visione di questa operazione congiunta è cambiata. Mentre il modello Lovelace a volte sbaglia parole o lettere che sembrano relativamente facili all'occhio umano, molte volte ha riconosciuto parole che sia io che gli studiosi precedenti avevamo decifrato in modo errato. Questo processo è stato davvero una collaborazione, in cui l'uomo e la macchina apportano competenze diverse".

La corretta formazione del modello Lovelace è particolarmente importante in questa fase del progetto, in quanto pone le basi per le fasi future del progetto. L'archivio Lovelace contiene non solo documenti della stessa Lovelace, ma anche di suo marito, William King, e di sua madre, Lady Noel Byron, che devono essere trascritti. "Utilizzerò il modello Lovelace come modello di base per addestrare altri modelli sulla calligrafia di altri importanti collaboratori", ha spiegato Jessica, una strategia che le farà risparmiare tempo e fatica nella trascrizione nei mesi a venire e che pone le basi per ulteriori ricerche sulla collezione dopo il dottorato.

Un progetto significativo

C'è una bella simmetria in questo progetto. Ada Lovelace è stata una delle prime persone a suggerire che i computer del futuro sarebbero stati in grado di fare molto di più che calcolare numeri. Quasi 200 anni dopo, Jessica Cook sta usando i computer per trascrivere documenti, arricchirli, pubblicarli e, così facendo, scoprire di più sulla vita di questa donna straordinaria. 

La matematica Ada Lovelace è stata una delle pioniere dell'informatica moderna. @ Alfred Edward Chalon, distribuito sotto un Licenza CC-BY 2.0

"Senza sopravvalutare il contributo di Lovelace all'informatica, ritengo opportuno dire che la sua apertura intellettuale e la sua creatività hanno aperto una piccola finestra sul mondo delle miracolose possibilità digitali in cui ci troviamo ora. Sto ancora elaborando tutte le implicazioni concettuali di questa domanda, ma a livello personale mi piace pensare che questo progetto Transkribus sia un orgoglioso compimento delle prime intuizioni di Lovelace".   

Il consiglio di Jessica per il Transkribus

A chiunque stia pensando di intraprendere un progetto simile: fatelo. Non lasciatevi scoraggiare da coloro che liquidano i progetti digitali su larga scala come sforzi troppo impegnativi per essere intrapresi da studenti laureati. È importante conoscere i propri limiti, ma credo anche che il futuro della ricerca digitale dipenda dagli studiosi che si concentrano su approcci alle sfide orientati alla soluzione.   

Panoramica