Dieses Modell wurde als Studentenprojekt im Rahmen des Masterstudiengangs "Digital Humanities" von November 2021 bis Januar 2022 entwickelt.
Der Textkorpus für das Modell umfasst Bücher, die nach der von Peter I. durchgeführten Reform der russischen Rechtschreibung in den folgenden Druckereien veröffentlicht wurden:
die Druckerei der Akademie der Wissenschaften in St. Petersburg, die der Kaiserlichen Moskauer Universität, die von Vilkovsky und Galchenko, die des Landkadettenkorps und einige in Zivilschrift gedruckte Dekrete.
Schulungsquellen sind Bücher, die von Rusneb eingescannt wurden (https://rusneb.ru/) und von Google Books.
Das Modell zeigt gute Ergebnisse bei russischsprachigem Material, aber es erkennt keine anderen Sprachen, die in Texten aus dieser Zeit vorkommen können.