+ Stolz präsentiert der niederländische Riese

Das kommt heraus, wenn zwei Transkribus-Power-User-Archive, nämlich das Amsterdamer Stadtarchiv und das Nationalarchiv der Niederlande, zusammenarbeiten: ein Modell mit 1 384 893 Wörtern Trainingsdaten, in diesem Fall Lesen 18. Jahrhundert Niederländisch. Das Modell steht nun allen Transkribus-Benutzern zur Verfügung und ist zu finden unter dem Namen: "Dutch Mountains (18th Century)". Es kombiniert die Modelle des 18. Jahrhunderts der beiden Archive (Stadtarchiv Amsterdam : 3500+ Scans von 15 notariellen Handschriften und Nationalarchiv der Niederlande 3500+ Scans von VOC-Handschriften). Die Zeichenfehlerrate geht bis zu 5,67%.

Wenn Sie so große Modelle wie dieses für Ihre Dokumente verwenden, ist es sinnvoll, das entsprechende Sprachmodell oder ein Basismodell hinzuzufügen, wenn Sie bereits selbst ein Modell trainiert haben. Dort finden Sie die Sprachmodell-Einstellung in Transkribus: "Tools"-Registerkarte -> Klicken Sie auf "Run" im Bereich "Text Recognition" -> "Select HTR-model" -> "Dictionary" (oben links) -> "Language model from training data"

Viel Spaß beim Ausprobieren dieses oder eines unserer anderen öffentlichen Modelle! Mit diesem Link können Sie sich die Übersicht über alle verfügbaren Modelle ansehen: https://transkribus.eu/wiki/images/d/d6/Public_Models_in_Transkribus.pdf

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Juni 20, 2022
Transkribus
Von Joe Nockels, Universität Edinburgh Im Rahmen seiner Doktorarbeit an der Universität Edinburgh und der Nationalbibliothek ...
Juni 15, 2022
Transkribus, Webinare
Wir freuen uns, unsere neue "Ask Us Anything"-Webinarreihe zu starten, in der die Teilnehmer uns alles fragen können, was mit ...
Juni 9, 2022
Uncategorized
Die neue Freigabefunktion Es mag eine kleine Schaltfläche für einen Bildschirm sein, aber sie ist eine großartige Funktion für ...