+ Lavorare con la scrittura olandese (della prima età moderna)? Unisciti a un nuovo gruppo di lavoro Transkribus!

di Annemieke Romein, Università di Ghent

(Versione in lingua olandese qui sotto)

Per tutta la prima età moderna molto fu scritto in lingua olandese, non solo nei Paesi Bassi - ma nelle ex colonie, tra certi gruppi religiosi del Nord America, e anche nelle città dell'Hansa. Una scrittura gotica della prima età moderna era ampiamente utilizzata, anche se aveva alcune varietà a seconda dei contesti, dello scopo e del tipo. I primi esperimenti con documenti del Belgio (Gand, nelle Fiandre) hanno dimostrato che la lingua olandese può essere riconosciuta da modelli di Handwritten Text Recognition (HTR) con un buon livello di precisione.

Il prossimo passo è quello di combinare diversi esempi di testi olandesi della prima età moderna al fine di costruire e migliorare modelli generici per il riconoscimento di vari tipi di documenti. Dr. Annemieke Romein (Erasmus University Rotterdam/ Ghent University), Dr. Jetze Touber, e Koen Verstraeten hanno iniziato il Olandese antico moderno gruppo di lavoro - dove tutti gli utenti di Transkribus possono lavorare insieme per l'obiettivo di migliorare il riconoscimento della lingua olandese. Scorri in basso per saperne di più sull'adesione al gruppo di lavoro e sui suoi obiettivi.

Il processo di combinare i dati di allenamento di diversi documenti olandesi della prima età moderna è già iniziato all'Università di Ghent. Diversi ricercatori del Istituto per la storia della prima modernità e il Centro di Gand per le scienze umane digitali stanno mettendo insieme i materiali al fine di formare un modello HTR. Tuttavia, all'interno di un gruppo multidisciplinare come questo, ci siamo rapidamente resi conto che ci sono vari tipi di testi così come periodi all'interno del primo periodo moderno da affrontare. La calligrafia del XVI secolo è diversa da quella di un secolo dopo, anche se in termini di contenuto è cambiata poco; allo stesso modo, i testi scritti con uno sfondo politico-istituzionale o legale differiranno enormemente da diari, lettere e testi accademici. Tuttavia, ognuno di questi tipi di testi può allenare il riconoscimento del testo così come della scrittura. Come possono essere fatti i computer intelligenti, è ancora da scoprire in un tale contesto.

Per semplificare questo sforzo, tre storici di Gand stanno lavorando insieme e coordineranno/addestreranno diversi modelli linguistici, sperando di arrivare a un modello finale per la lingua olandese (a seconda della quantità di materiale di addestramento).

Dr. Annemieke Romein 16°, 17°, 18° secolo Testi politico-istituzionali/giuridici (incluse richieste, lettere di statisti).
Dr. Jetze Touber 16°, 17°, 18° secolo Testi culturali (diari, lettere); testi accademici e religiosi.
Koen Verstraeten 19° secolo Testi culturali (diari, lettere); testi scientifici e accademici.

Il gruppo di lavoro "Early Modern Dutch" sta cercando altri esempi di documenti scritti in olandese del 16°, 17° e 18° secolo. Puoi aiutarci ad arricchire la collezione - tutto ciò che serve sono immagini (preferibilmente a circa 300 dpi) e trascrizioni.

È possibile:

  • condividere i dati di allenamento esistenti che avete già preparato in Transkribus (duplicateli nella cartella in cui vi inviteremo).
  • preparare nuove immagini e trascrizioni in Transkribus nella collezione "Early Modern Dutch
  • inviare file contenenti immagini e trascrizioni che possono essere abbinate automaticamente e convertite in dati di allenamento usando il Strumento Text2image.

Per favore, indicate il tipo di materiale testuale che state condividendo, in modo che abbiamo una visione d'insieme e possiamo iniziare a formare i modelli il prima possibile.

Per unirsi al gruppo di lavoro e ottenere l'accesso alla collezione "Early Modern Dutch" in Transkribus, contattare il gruppo all'indirizzo: TranskribusEMDutch@gmail.com.

Il gruppo di lavoro "Early Modern Dutch" mira a dimostrare che gli algoritmi basati sull'addestramento come il riconoscimento del testo scritto a mano hanno bisogno di un contributo significativo da parte di molti stakeholder - possono essere migliorati solo attraverso la cooperazione e la condivisione!

————————————————————————————————————

Hai lavorato con le costruzioni olandesi moderne (± 1500-1900)? Sluit u aan bij de Transkribus werkgroep!

Ci sono molti testi creati nel linguaggio olandese, non solo nelle Lage Landen, ma anche nelle colonie voormali, nei gruppi religiosi del Nord-America e nei Paesi Bassi. La scrittura gotica vroegmoderna è stata molto criticata, anche se ci sono state diverse varianti a seconda del contesto, della finalità e del tipo di tecnica. Gli ultimi esperimenti con i documenti dimostrano che i modelli OCR (Automatische Tekst Herkenning) olandesi possono essere utilizzati in modo corretto e che con l'addestramento si possono ottenere buoni risultati.

L'altro punto è la combinazione di diversi tipi di documenti dei Paesi Bassi, in modo da poter creare modelli di riferimento che possano essere analizzati ed elaborati da diversi tipi di documenti. Dr. Annemieke Romein (Università Erasmus di Rotterdam/ Università di Ghent - IEMH), Dr. Jetze Touber (UGent - IEMH), it Koen Verstraeten (UGent archief) hanno dato il via ad un gruppo di lavoro "Vroegmodern Nederlands". L'attenzione si concentra sul periodo 1500-1900, ma sono disponibili anche materiali provenienti da altri periodi. In questo gruppo si riuniscono i ricercatori di Transkribus per analizzare l'eredità del linguaggio teatrale olandese. Ti invitiamo a leggere ancora per saperne di più sul nome di questo gruppo e sulle sue attività.

Il processo di combinazione di materiali di formazione di diversi tipi di tecnologie moderne è un momento importante per il gruppo. Aan de UGent zijn verschillende onderzoekers van het Istituto per la storia della prima modernità e il suo Centro di Gand per le scienze umane digitali per il caricamento del tuo materiale su Transkribus. Tramite Text2Image sono disponibili le migliori trascrizioni sulle foto e sono disponibili al computer. Questo è momentaneamente in un'unica banda. Abbiamo già realizzato diversi tipi di tecnologie, ma anche diversi periodi in cui è possibile scegliere tra diverse varianti. Tutti i tipi di corsi possono essere ottenuti in Transkribus, ma da allora c'è molto materiale di formazione da utilizzare. Meer e un altro operatore possono essere trattati. Da qui questa opzione per il nome.

Transkribus (voorlopig) è un programma gratuito che può essere utilizzato per addestrare i server di Innsbruck a scrivere a mano (ma anche a drukwerk) attraverso il "Handwriting Text Recognition" (HTR). Dieci min. 75 pagine di tecniche di trascrizione sono necessarie per creare un testo scritto a mano in modo corretto, ma questo non significa che sia un autore. Quanto più materiale c'è da caricare, quanto più universale è il modello. Questo è ancora più interessante. Archivi, biblioteche ed erfgoedinstellingen, ma anche singoli operatori sono stati invitati a fornire il loro materiale, e il 16e tot en met 19e eeuw bestrijkt.

I nostri clienti sono stati ingaggiati per la coordinazione del modello olandese e hanno effettuato dei test per addestrare un modello mogelijk (o modelli) più accurato. I candidati sono tenuti a rispettare le regole del gioco:

Dr. Annemieke Romein 16e, 17e, 18e, , 19e eeuw Tecnica politico-istituzionale/giuridica (incl. leggi, leggi degli statuti)
Dr. Jetze Touber 16e, 17e, 18e eeuw Testi culturali (dagboeken, brieven); testi scientifici, accademici e religiosi.
Koen Verstraeten 19e eeuw Testi culturali (dagboeken, brieven); testi scientifici, accademici e religiosi.

Se si desidera che il materiale venga spedito e che il prodotto venga spedito a questa azienda, dobbiamo contattare l'utente tramite TranskribusEMDutch@gmail.com. È utile quando si sa che tipo di tecnologia va bene, e che noi abbiamo un'idea su quali modelli possiamo usare.

Veel gestelde vragen:

  • Gli accordi e le trascrizioni che hai fatto tramite Transkribus sul tuo server (direttamente tramite il programma, o tramite Strumento Text2image) blijven privé: tieni conto di ciò che hai fatto.
  • Puoi procurarti dei documenti utili da consegnare (duplicare) al gruppo Vroegmodern Nederlands. Questo gruppo è utile per la formazione dei metodi di insegnamento per l'apprendimento del Nederlands sneller. I membri di questo gruppo possono utilizzare le attrezzature di altri.
  • Questo è il tuo punto di riferimento per quanto riguarda i documenti che hai trovato da noi! Quanto più materiale abbiamo a disposizione, quanto è facile allenarsi con i metodi di allenamento.
  • Hai del materiale (foto e trascrizioni) ma non hai usato nessun Transkribus? Nessun problema. Se hai un account e hai un contatto con Transkribus (email@transkribus.eu) ti aiutano nel processo. Puoi scegliere tra diversi tipi di materiale e Transkribus si occuperà di fornire le informazioni necessarie per la trascrizione. (Fino a maggio 2019 il servizio è gratuito).
  • Hai piegato un'istallazione e vuoi sapere cos'è il tuo obiettivo? In un primo momento, si tratta di un modello di riferimento che permette a molti utenti e a tutti i servizi (compresi i nostri) di avere un'idea del tipo di servizio che si può ottenere quando si è in grado di vendere i manuali. Il materiale che hai a disposizione, nel tuo account personale di Transkribus, può essere utilizzato anche per creare dei PDF. Avete anche un'analisi del materiale bronco-materico, con all'esterno le trascrizioni (o in base a una chiave: anche più tardi); questo può esservi utile per rendere disponibile il materiale per il vostro publico. Questo è quindi anche un ottimo modo di presentarsi!
  • Kosten? Fino a giugno 2019 Transkribus è gratis. Attualmente è stato finanziato tramite Europese Onderzoeksgelden (il progetto READ). A partire da giugno inizia "READ-COOP", in cui gli utenti individuali possono usufruire gratuitamente del servizio, ma i "grandi utenti", che hanno richiesto l'installazione di un servizio, devono essere pagati. Quanto siano alti questi costi non è ancora chiaro, ma è bene sapere che non è poi così alto, dato che è meglio che le istallazioni qui non abbiano bisogno di molto denaro. MAAR: voorlopig is de service gratis en kunt u dus de "doorzoekbare pdf's" als tegenprestatie krijgen en u kunt altijd na juni stoppen met gebruik van het program!
CONDIVIDI QUESTO ARTICOLO

Post recenti

17 aprile 2024
News, Transkribus
Uno dei maggiori vantaggi di Transkribus è la possibilità di addestrare modelli personalizzati di riconoscimento del testo scritto a mano. Questa caratteristica unica ...
4 aprile 2024
News
La primavera è arrivata e così anche l'uscita di aprile 2024 di Transkribus. Ecco una rapida panoramica di tutte le ...
3 aprile 2024
News
Si può imparare molto sulla storia francese leggendo libri e guardando documentari. Questo tipo di fonti è ottimo per ...