Storia di successo
Pubblicato: 2 mesi fa

Come l'Archivio di Stato di Zurigo ha pubblicato 50.000 pagine con read&search

Lo strumento Archivio di Stato di Zurigo è l'archivio centrale del Cantone di Zurigo, in Svizzera. È responsabile dell'archiviazione e della conservazione dei documenti dei consigli, dei tribunali, delle amministrazioni e di molti altri enti pubblici del Cantone, offrendo una ricca panoramica degli ultimi 1150 anni di storia di Zurigo. 

L'Archivio di Stato di Zurigo è uno dei più grandi archivi della Svizzera. © Staatsarchiv Zürich

Ma naturalmente è possibile accedere a questi approfondimenti solo se si può accedere ai documenti stessi. E a causa dell'enorme numero di documenti presenti nell'archivio, questo non è sempre facile da fare. In passato, non c'era modo di cercare rapidamente i documenti rilevanti in intere collezioni premoderne, il che significava dover cercare tra scaffali e scatole, cercando di trovare le carte di cui si aveva bisogno. 

Per risolvere questo problema e rendere più facile l'accesso ai documenti premoderni, l'archivio sta attualmente utilizzando Transkribus e read&search per creare versioni digitali delle loro collezioni. Abbiamo parlato con Christian Sieber, che dirige il team di digitalizzazione dell'archivio di Zurigo, del loro primo progetto Transkribus e della loro esperienza con il software.

50.000 pagine di verbali di riunione trascritti

La storia dell'Archivio di Stato con Transkribus risale a molti anni fa: è stato uno dei partner del progetto originario. LEGGI il progetto di ricercache si è svolto dal 2016 al 2019. All'epoca, l'archivio di Zurigo si occupava principalmente della trascrizione manuale, che è molto meno efficiente in termini di tempo, e si è subito accorto dei vantaggi della trascrizione automatica. "In passato trascrivevamo manualmente i testi scritti a mano, e sappiamo quanto impegno richieda", ha spiegato. "Quindi ci è stato chiaro fin da subito che in futuro avremmo voluto utilizzare Transkribus per i nostri progetti".  

L'archivio ospita documenti degli ultimi mille anni di storia svizzera. © Staatsarchiv Zürich

Nel 2019 l'archivio era pronto ad avviare il primo progetto Transkribus su larga scala. I documenti scelti per questo progetto erano i verbali delle riunioni del Consiglio di Zurigo del XVIII secolo, in quanto forniscono informazioni su quasi tutte le interazioni tra il consiglio comunale e gli abitanti dell'epoca. Tuttavia, dato che la raccolta contava oltre 50.000 pagine, era necessario un po' di lavoro. La prima cosa che il team ha fatto è stato creare un modello di intelligenza artificiale. Hanno trascritto manualmente 203.189 parole e sono arrivati a un CER di soli 4,80% sul Train Set. Questo ha creato una solida base per la trascrizione del resto dei documenti. 

Come in ogni progetto su larga scala, ci sono stati alcuni intoppi lungo il percorso. "Una delle sfide nei testi erano i marginalia, la cui disposizione non sempre veniva riconosciuta correttamente", spiega Christian. "Un'altra era rappresentata dai vari scrittori che lavoravano ai protocolli. Ma con Transkribus siamo riusciti a elaborare oltre 50.000 pagine di verbali del Consiglio di Zurigo in soli tre anni, cosa che non sarebbe mai stata possibile con la trascrizione manuale".

Rendere disponibile la collezione in formato digitale

Naturalmente, la trascrizione è solo metà dell'opera. Per rendere accessibili collezioni come queste ai ricercatori e al pubblico, le trascrizioni devono essere pubblicate in un database online, preferibilmente affidabile e facilmente consultabile. Per l'Archivio di Stato di Zurigo, la scelta migliore è stata quella di utilizzare la piattaforma gemella di Tranksribus: read&search.

"Per noi era importante avere una soluzione standard, che viene utilizzata da molti altri progetti e che sarà continuamente sviluppata", ha detto Christian a proposito del loro processo decisionale. "Con read&search, READ-COOP ha offerto una soluzione editoriale che ci ha convinto".

Poiché l'archivio aveva già effettuato tutte le trascrizioni con Transkribus, le collezioni digitali potevano essere semplicemente caricate. a read&searchinsieme ai metadati e ai tag assegnati durante la trascrizione. Ciò significa che, ad esempio, se si vogliono trovare tutti i verbali delle riunioni del consiglio comunale che coinvolgono un determinato membro del consiglio, è sufficiente cercare il nome di quella persona e trovare i verbali in cui è menzionata. 

"Nelle scorse settimane abbiamo già ricevuto un feedback positivo da molti ricercatori. Alcuni hanno suggerito di correggere manualmente i testi con Citizen Science e quindi di migliorarli ulteriormente".

Il futuro è luminoso

Questo progetto è solo il primo di alcuni che l'archivio ha in programma. A partire dal prossimo anno, il team inizierà a digitalizzare i verbali del Consiglio di Zurigo dal XV al XVII secolo, creando un database online di quasi 400 anni di documenti del Consiglio. Nei prossimi anni, il piano prevede di rendere tutti i documenti chiave dell'archivio liberamente accessibili online, in modo che i ricercatori e le altre parti interessate possano trovare le informazioni di cui hanno bisogno nel modo più rapido e semplice possibile.

"Con la digitalizzazione delle nostre collezioni, stiamo creando una risorsa inestimabile che risponde alla grande richiesta di ricercatori di tutto il mondo interessati alla storia di Zurigo".

Il consiglio di Christian per il Transkribus

"Assicuratevi di avere una buona panoramica dei testi che volete digitalizzare. In questo modo sarà più facile pianificare tutto per soddisfare le vostre esigenze e non perdere tempo e denaro lungo il percorso. In breve: più si conoscono i testi, meglio si può pianificare il progetto".

I documenti dell'archivio offrono una grande quantità di informazioni sulla storia di Zurigo. © Staatsarchiv Zürich
Panoramica