Dieses Modell ist darauf trainiert, die gotischen Schriften zu erkennen, die in lateinisch-deutschen zweisprachigen Inkunabeln und frühen Drucken zu finden sind.
Es wurde von dem Projekt Digitalisierung und Volltexterkennung der ehemals Reichenauer Inkunabeln in der Badischen Landesbibliothek, die von der Stiftung Kulturgut Baden-Württemberg gefördert wurde.
Die zum Training und zur Evaluierung dieses Modells verwendete Ground Truth basiert auf einer Sammlung von Inkunabeln und Nachinkunabeln des ehemaligen Klosters Reichenau, die heute in der Badischen Landesbibliothek in Karlsruhe aufbewahrt wird. Zusätzlich zu Auszügen aus wirklich zweisprachigen Inkunabeln enthält das Set auch einige einsprachige Materialien, um die Leistung des Modells zu verbessern.
Die Transkription der Ground Truth erfolgte nach den Richtlinien, die unter https://doi.org/10.57962/regionalia-22875 und verwendet eine Reihe von Unicode-Zeichen zur Darstellung lateinischer Abkürzungen.
Beim Training wurde das Transkribus Print M1 Modell als Basismodell verwendet.
Dieses Modell wurde von der Badischen Landesbibliothek erstellt und wird unter der CC-BY-SA 4.0 Lizenz veröffentlicht.