Dieses Modell basiert auf gedruckten Texten in den römischen Schriftarten, die in der
Niederländische Länder, im späten 16., 17., 18. und 19. Jahrhundert. Einige Seiten können enthalten haben
(korrekt) transkribierte gotische Schrift; sowie französische oder lateinische Texte wurden aufgenommen, um sicherzustellen
die (mehr oder weniger) korrekte Umschrift von Wörtern in diesen Sprachen, wenn sie vorkommen.
Die Art der Quellen, die für dieses Modell verwendet werden, sind Verordnungsbücher,
die die damaligen Normen ("Gesetze") enthielten.
Dieses Modell ist das Ergebnis einer der KB National Library of the Netherlands
Gastwissenschaftler-Stelle 2019. Das Projekt trug den Titel "Entangled Histories".
Weitere Informationen über den Hintergrund des Modells und wie man es zitiert,
besuchen Sie bitte: www.https://lab.kb.nl/dataset/entangled-histories-ordinances-low-countries
Das Modell wurde auf 88.100 Wörtern trainiert und der CER auf dem Validierungsset beträgt 1,4%.