Das HTR-Modell wurde auf der Grundlage von mehr als 1.500.000 Wörtern von etwa 1300 verschiedenen Schriftstellern aus dem Zeitraum 1580-1750 trainiert. Es kann mit den Sprachen Deutsch, Niederdeutsch und Latein umgehen und ist in der Lage, einfache deutsche und lateinische Abkürzungen zu entziffern. Das Trainingsmaterial enthält neben den üblichen Kanzleischriften auch eine Auswahl von Konzeptschriften und Druckschriften der Zeit. Das gesamte Trainingsmaterial basiert auf Gesetzestexten bzw. Gerichtsschriften aus den Responsa der Juristischen Fakultät Greifswald und des Oberlandesgerichts Wismar.
Die Validierungssätze basieren auf einer chronologischen Auswahl der Jahre: 1580 - 1750 . GT & Validierungsset wurde von Dirk Alvermann, Elisabeth Heigl, Anna Brandt und Antje Laasch erstellt.