Questo modello si basa sulla verità di base di tre manoscritti in ceco antico:
1) Bibbia di Padeřov (Vienna, Biblioteca Nazionale Austriaca, segnatura Cod. 1175, 1432-1435)
2) Bibbia cistercense (New York, Morgan Library & Museum, segnatura MS M.752, 1456).
3) Nuovo Testamento di Martin Lupáč (Vienna, Biblioteca Nazionale Austriaca, segnatura Cod. 1175, 1440).
Può essere utilizzato su manoscritti cechi antichi scritti in bastardo, principalmente del XIV e XV secolo.
Le regole di trascrizione si sono basate sulle regole di trascrizione semidiplomatica stabilite da Pero OCR e su "Směrnice pro vydávání starších českých textů" di Jiří Daňhelka.
https://vokabular.ujc.cas.cz/moduly/edicnipoznamka.aspx?id=DanhelkaSmernice
Le abbreviazioni sono state etichettate ed espanse. Questo modello è stato addestrato sulla trascrizione, dove gli spazi sono stati creati tra le parole in base alle regole di trascrizione semidiplomatica di Jiří Daňhelka (vedi sopra), indipendentemente dalla forma dei manoscritti, e prodotto nell'ambito della HTR Winter School 2023.