Questo modello si basa su testi stampati con i caratteri di tipo romano che venivano utilizzati nella
Paesi Bassi, alla fine del XVI, XVII, XVIII e XIX secolo. Alcune pagine possono contenere
carattere gotico (correttamente) trascritto; sono stati inclusi anche testi in francese o latino per garantire la sicurezza del testo.
la trascrizione (più o meno corretta) delle parole in quelle lingue quando si verificano.
Il tipo di fonti utilizzate per questo modello sono i libri delle ordinanze,
che conteneva le norme ("leggi") dell'epoca.
Questo modello è il risultato di uno dei progetti della KB National Library of the Netherlands.
Posizione di ricercatore in residenza 2019. Il progetto si chiamava "Entangled Histories".
Per maggiori informazioni sul contesto del modello e su come citarlo,
visitare: www.https://lab.kb.nl/dataset/entangled-histories-ordinances-low-countries
Il modello è stato addestrato su 88100 parole e il CER sul set di convalida è 1.4%.