Das "NOSCEMUS General Model" ist auf die Erkennung von lateinischen Drucken aus der frühen Neuzeit zugeschnitten. Obwohl das Modell darauf ausgelegt ist, lateinische Drucke in Antiqua-Schriften zu erkennen, ist es auch in der Lage, Passagen in Griechisch und Passagen in (deutscher) Fraktur zu erkennen.
Bei der Erstellung der Ground Truth wurden die folgenden Transkriptionsrichtlinien befolgt:
- Ligaturen (z. B. Æ oder æ, Œ oder œ) und Standardabkürzungen (z. B. -que, -us, -tur, ...mm..., ...nn...) wurden erweitert
- langes s (ſ) wurde als normales s umgeschrieben
- Kapitälchen wurden als Majuskeln transkribiert
- Sonderzeichen und diakritische Zeichen (z. B. &, ë, ï oder ę) wurden beibehalten
Das Modell wurde von Stefan Zathammer veröffentlicht und basiert auf Trainingsdaten, die aus dem Digital Sourcebook des NOSCEMUS-Projekts (https://transkribus.eu/r/noscemus/#).
Wenn Sie das Noscemus-Modell als Basis für Ihr eigenes Modell verwenden oder wenn Ihre Ausgabe auf einer Transkription basiert, die mit Hilfe des Noscemus-Modells erstellt wurde, bitten wir Sie, das Noscemus-Modell anzugeben.
Das Projekt NOSCEMUS (https://www.uibk.ac.at/projects/noscemus) wurde vom Europäischen Forschungsrat (ERC) im Rahmen des Forschungs- und Innovationsprogramms "Horizont 2020" der Europäischen Union gefördert (Finanzhilfevereinbarung Nr. 741374).