Il futuro dell'estrazione delle informazioni - Partecipa al progetto TUC 2024! ✨ 15-16 febbraio, di persona e online. Ottieni il tuo biglietto >>

Storia di successo
Pubblicato: 3 anni fa

Iurisprudentia - Un viaggio nel tempo

La storia del diritto è un campo di ricerca che si concentra sull'evoluzione dei sistemi giuridici e sulle ragioni alla base dell'applicazione delle diverse leggi. Fortunatamente per gli storici del diritto, il diritto è anche un campo noto per la sua accurata documentazione. Ciò significa che i ricercatori hanno a disposizione un'ampia documentazione giuridica che risale a diverse centinaia di anni fa.

Tuttavia, accedere a questa documentazione (per lo più cartacea) non è sempre facile. In primo luogo, la documentazione è spesso conservata in diversi archivi in località differenti e un ricercatore deve recarsi personalmente all'archivio per visionare i documenti. Anche i documenti già digitalizzati sono sparsi su Internet e spesso nascosti dietro a paywall.

All' Università di Zurigo Un gruppo di ricercatori ha deciso di porre rimedio a questo problema. Prof. Dr. Walter Boente - cattedra di diritto privato dell'università - e il suo team hanno deciso di produrre un corpus digitale di testi giuridici e di pubblicarlo online utilizzando il read&search piattaforma. In questo modo hanno creato una delle più grandi raccolte digitali di documenti legali storici disponibili su Internet. 

Trascrizione dei documenti

Naturalmente, digitalizzare tutti i documenti esistenti in un'unica soluzione sarebbe un progetto piuttosto vasto, soprattutto perché il team non si era mai imbarcato in un progetto di questo tipo. Hanno invece deciso di iniziare con alcune piccole raccolte campione, come i documenti scritti da avvocati di importanza storica o i documenti relativi a una legge particolare. 

Il punto di partenza è stato quello di portare sulla nuova piattaforma i documenti conservati in digitale in altri archivi e biblioteche. Inoltre, molti documenti dovevano essere digitalizzati per la prima volta e il team è stato fortunato ad avere il supporto di molte istituzioni, che hanno preparato i loro documenti per l'uso con Transkribus.

Una volta che i documenti erano accessibili su Iurisprudentia, sono stati trascritti utilizzando la piattaforma Transkribus. Il team ha iniziato utilizzando i modelli pubblici offerti da Transkribus per trascrivere automaticamente i documenti storici. Ma con l'aiuto della folla, sempre più documenti sono stati trascritti o corretti manualmente. Utilizzando la Ground Truth risultante, il team ha riqualificato i modelli generali e li ha quindi adattati alle esigenze del progetto. 

Esempio di un'edizione resa accessibile grazie al progetto iurisprudentia

Rendere accessibili le collezioni

Un altro obiettivo fondamentale per il team di Iurisprudentia era l'accessibilità. Dopotutto, è stata proprio la mancanza di accesso ai documenti storico-giuridici a spingere il team ad avviare il progetto. L'obiettivo era quello di avere tutti i documenti trascritti disponibili in un unico luogo, senza un muro a pagamento, e di permettere agli utenti di cercare rapidamente intere collezioni per ottenere informazioni specifiche.

Dopo aver esaminato diverse opzioni, il team ha deciso di utilizzare la piattaforma read&search per pubblicare il corpus. La ragione principale è stata la facilità d'uso offerta da read&search. I documenti possono essere caricati direttamente da Transkribus, così come i tag e i metadati che sono stati implementati. Il team ha quindi potuto contare sull'infrastruttura creata a livello centrale da READ-COOP. Per il team di Iursprudentia, questo rimane uno dei maggiori vantaggi.

"La piattaforma read&search è un pacchetto completo e senza preoccupazioni", ha spiegato il professor Boente. "Ogni settimana vedo spuntare nuovi strumenti che sembrano offrire soluzioni migliori di read&search. Questo a volte è molto allettante. Tuttavia, ci vorrebbero molti investimenti e ulteriori sviluppi per poter utilizzare questi strumenti in modo produttivo".

Un viaggio nel tempo con l'applicazione web di iurisprudentia

Un corpus in continua espansione

La piattaforma Iurisprudentia conserva attualmente 22 diverse collezioni di documenti, che coprono centinaia di anni di storia del diritto. Sebbene la piattaforma fosse inizialmente destinata solo ai documenti relativi al diritto svizzero, tedesco e austriaco, sono state ora lanciate diverse raccolte internazionali. La prima di queste, una raccolta in lingua polacca sul diritto civile, è già stata aggiunta e sono in programma altre collaborazioni.

Sono passati diversi anni dall'inizio del progetto, ma il professor Boente è ancora molto soddisfatto della decisione di utilizzare read&search per il progetto. "Ad oggi, non ho trovato un'offerta migliore di read&search. Il mio consiglio è quindi di concentrarsi sul contenuto del progetto. Se, contrariamente alle aspettative, in futuro troverete qualcosa di meglio, potrete continuare a utilizzare tutti i dati archiviati con read&search, senza convertirli. Non c'è niente di più sostenibile!".

Panoramica