Das kommt heraus, wenn zwei Transkribus-Power-User-Archive, nämlich das Amsterdamer Stadtarchiv und das Nationalarchiv der Niederlande, zusammenarbeiten: ein Modell mit 1 384 893 Wörtern Trainingsdaten, in diesem Fall Lesen 18. Jahrhundert Niederländisch. Das Modell steht nun allen Transkribus-Benutzern zur Verfügung und ist zu finden unter dem Namen: "Dutch Mountains (18th Century)". Es kombiniert die Modelle des 18. Jahrhunderts der beiden Archive (Stadtarchiv Amsterdam : 3500+ Scans von 15 notariellen Handschriften und Nationalarchiv der Niederlande 3500+ Scans von VOC-Handschriften). Die Zeichenfehlerrate geht bis zu 5,67%.
Wenn Sie so große Modelle wie dieses für Ihre Dokumente verwenden, ist es sinnvoll, das entsprechende Sprachmodell oder ein Basismodell hinzuzufügen, wenn Sie bereits selbst ein Modell trainiert haben. Dort finden Sie die Sprachmodell-Einstellung in Transkribus: "Tools"-Registerkarte -> Klicken Sie auf "Run" im Bereich "Text Recognition" -> "Select HTR-model" -> "Dictionary" (oben links) -> "Language model from training data"
Viel Spaß beim Ausprobieren dieses oder eines unserer anderen öffentlichen Modelle! Mit diesem Link können Sie sich die Übersicht über alle verfügbaren Modelle ansehen: https://transkribus.eu/wiki/images/d/d6/Public_Models_in_Transkribus.pdf