Dieses Modell ist darauf trainiert, die gotischen und Antiqua-Schriften zu erkennen, die in lateinischen Inkunabeln und frühen Drucken zu finden sind.
Es wurde von dem Projekt Digitalisierung und Volltexterkennung der ehemals Reichenauer Inkunabeln in der Badischen Landesbibliothek, die von der Stiftung Kulturgut gefördert wurde
Baden-Württemberg.
Die für das Training und die Auswertung dieses Modells verwendete Ground Truth basiert auf einer Sammlung von Inkunabeln und Nachinkunabeln des ehemaligen Klosters Reichenau, die heute in der Badischen Landesbibliothek in Karlsruhe aufbewahrt wird. Da in der Regel 1-20 Seiten aus einzelnen Dokumenten entnommen wurden, spiegelt der Ground Truth-Satz eine breite Palette von Schriften wider, die von Druckern aus dem deutschen Sprachraum und Norditalien verwendet wurden.
Die Transkription der Ground Truth erfolgte nach den Richtlinien, die unter https://doi.org/10.57962/regionalia-22875 und verwendet eine Reihe von Unicode-Zeichen zur Darstellung lateinischer Abkürzungen.
Dieses Modell wurde von der Badischen Landesbibliothek erstellt und wird unter der CC-BY-SA 4.0 Lizenz veröffentlicht.