+ Stolz präsentiert der niederländische Riese

Das kommt heraus, wenn zwei Transkribus-Power-User-Archive, nämlich das Amsterdamer Stadtarchiv und das Nationalarchiv der Niederlande, zusammenarbeiten: ein Modell mit 1 384 893 Wörtern Trainingsdaten, in diesem Fall Lesen 18. Jahrhundert Niederländisch. Das Modell steht nun allen Transkribus-Benutzern zur Verfügung und ist zu finden unter dem Namen: "Dutch Mountains (18th Century)". Es kombiniert die Modelle des 18. Jahrhunderts der beiden Archive (Stadtarchiv Amsterdam : 3500+ Scans von 15 notariellen Handschriften und Nationalarchiv der Niederlande 3500+ Scans von VOC-Handschriften). Die Zeichenfehlerrate geht bis zu 5,67%.

Wenn Sie so große Modelle wie dieses für Ihre Dokumente verwenden, ist es sinnvoll, das entsprechende Sprachmodell oder ein Basismodell hinzuzufügen, wenn Sie bereits selbst ein Modell trainiert haben. Dort finden Sie die Sprachmodell-Einstellung in Transkribus: "Tools"-Registerkarte -> Klicken Sie auf "Run" im Bereich "Text Recognition" -> "Select HTR-model" -> "Dictionary" (oben links) -> "Language model from training data"

Viel Spaß beim Ausprobieren dieses oder eines unserer anderen öffentlichen Modelle! Mit diesem Link können Sie sich die Übersicht über alle verfügbaren Modelle ansehen: https://transkribus.eu/wiki/images/d/d6/Public_Models_in_Transkribus.pdf

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Juli 3, 2024
News, Transkribus
Einige Transkribus-Projekte enden mit einer vollständig digitalisierten Sammlung in Transkribus. Andere nehmen diese digitalisierte Quelle und verwenden sie ...
Juni 12, 2024
News, Transkribus
Wenn man an karolingische (oder karolingische) Minuskeln denkt, kommen einem wahrscheinlich Karl der Große und sein riesiges karolingisches Reich in den Sinn. Während die ...
Mai 14, 2024
Uncategorized
Das Verstehen historischer Dokumente ist der Schlüssel zum Verständnis der Geschichte. Das Verstehen historischer Dokumente auf Polnisch kann jedoch eine Herausforderung sein. Nicht nur ...