Dieses Modell basiert auf der Grundlage von drei alttschechischen Handschriften:
1) Padeřov-Bibel (Wien, Österreichische Nationalbibliothek, Signatur Cod. 1175, 1432-1435)
2) Zisterzienserbibel (New York, The Morgan Library & Museum, Signatur MS M.752, 1456)
3) Neues Testament von Martin Lupáč (Wien, Österreichische Nationalbibliothek, Signatur Cod. 1175, 1440).
Es kann auf altböhmischen Handschriften verwendet werden, die in Bastard geschrieben sind und hauptsächlich aus dem 14. und 15. Jahrhundert stammen.
Die Transkriptionsregeln basieren auf den semidiplomatischen Transkriptionsregeln von Pero OCR und "Směrnice pro vydávání starších českých textů" von Jiří Daňhelka.
https://vokabular.ujc.cas.cz/moduly/edicnipoznamka.aspx?id=DanhelkaSmernice
Abkürzungen wurden getaggt und erweitert. Dieses Modell wurde an der Transkription trainiert, bei der auf der Grundlage der semidiplomatischen Transkriptionsregeln von Jiří Daňhelka (siehe oben) unabhängig von der Form in den Manuskripten Leerzeichen zwischen den Wörtern erzeugt wurden, und im Rahmen der HTR Winter School 2023 erstellt.