+ "German_Kurrent_17th-18th" - Der Kurrent Tausendsassa

Haben Sie schon eines unserer größten Modelle in Transkribus kennengelernt? Das ist der German_Kurrent_17th-18. Modell der Universität Greifswald. Um seinem Beinamen "Der Kurrent Tausendsassa" gerecht zu werden, wurden verschiedene Textarten eingearbeitet. Die meisten der trainierten Handschriften stammen aus den Konzilsprotokollen der Universität Greifswald, den Assessorenstimmen des Hochgerichts Wismar, den Protokollen der Pommerschen Regierung zu Stralsund, den Responsa der Juristischen Fakultät Greifswald und anderen Archivbeständen wie privaten Briefsammlungen. Die Trainingsdaten bestehen hauptsächlich aus Dokumenten aus dem 17..-18. Jahrhundert und ein paar Seiten aus dem 19. Jahrhundert. Das Modell hat eine Trainingsmenge von mehr als 1 840 000 Wörtern (ehrlich!) und eine Zeichenfehlerrate auf der Validierungsmenge von 5,5%. Es ist eine gute Wahl, um eine vernünftige Transkription für ein beliebiges Kurrent-Skript zu erhalten, das Sie haben oder wenn Sie ein stabiles Basismodell für 17.-19. bis 19. Jahrhunderts benötigen.

Vielen Dank an die Universität Greifswald für diesen mächtigen Riesen!

DIESEN ARTIKEL TEILEN

Neueste Beiträge

25. April 2024
News, Transkribus
Im Januar haben wir unsere neuen Abonnementpläne angekündigt: Einzelpersonen, Stipendiaten und Organisationen. Jeder Plan ist auf eine bestimmte ...
April 17, 2024
News, Transkribus
Einer der größten Vorteile von Transkribus ist die Möglichkeit, benutzerdefinierte Modelle zur Erkennung von handschriftlichem Text zu trainieren. Diese einzigartige Funktion ...
4. April 2024
News
Der Frühling hat begonnen und damit auch die Veröffentlichung von Transkribus im April 2024. Hier ist ein kurzer Überblick über alle ...