Dieses neue öffentliche Modell zur Erkennung von mittelalterlichem Latein wurde dank einer Zusammenarbeit zwischen dem Bentham-Projekt des University College London und dem DEEDS-Projekt (Documents of Early England Data Set) der Universität Toronto veröffentlicht. Das Besondere: Transkribus kann nun die besondere Art von handgeschriebenem mittelalterlichem Latein lesen, die in juristischen Manuskripten des 12. bis 15. Jahrhunderts zu finden ist. Jahrhundert zu finden ist. "Eigenartig" deshalb, weil das Juristenlatein voller eigenwilliger Abkürzungen und zufälliger Worttrennungen ist. Es wurde mit Material aus dem DEEDS-Projekt an der Universität von Toronto erstellt, das 1975 von Professor Michael Gervers ins Leben gerufen wurde, und später mit Material aus den Kartularien von St. Frideswide und Eynsham Abby erweitert, die sich im Besitz des Christ Church College in Oxford befinden. Es wurden mehr als 140 000 Wörter trainiert und der CER auf dem Validation Set beträgt 0,8%.
Kontakt: Chris Riley: c.riley@ucl.ac.uk.