Die Zukunft der Informationsextraktion - Nehmen Sie teil an TUC 2024! 15. und 16. Februar, persönlich und online. Holen Sie sich Ihr Ticket >>

+ "German_Kurrent_17th-18th" - Der Kurrent Tausendsassa

Haben Sie schon eines unserer größten Modelle in Transkribus kennengelernt? Das ist der German_Kurrent_17th-18. Modell der Universität Greifswald. Um seinem Beinamen "Der Kurrent Tausendsassa" gerecht zu werden, wurden verschiedene Textarten eingearbeitet. Die meisten der trainierten Handschriften stammen aus den Konzilsprotokollen der Universität Greifswald, den Assessorenstimmen des Hochgerichts Wismar, den Protokollen der Pommerschen Regierung zu Stralsund, den Responsa der Juristischen Fakultät Greifswald und anderen Archivbeständen wie privaten Briefsammlungen. Die Trainingsdaten bestehen hauptsächlich aus Dokumenten aus dem 17..-18. Jahrhundert und ein paar Seiten aus dem 19. Jahrhundert. Das Modell hat eine Trainingsmenge von mehr als 1 840 000 Wörtern (ehrlich!) und eine Zeichenfehlerrate auf der Validierungsmenge von 5,5%. Es ist eine gute Wahl, um eine vernünftige Transkription für ein beliebiges Kurrent-Skript zu erhalten, das Sie haben oder wenn Sie ein stabiles Basismodell für 17.-19. bis 19. Jahrhunderts benötigen.

Vielen Dank an die Universität Greifswald für diesen mächtigen Riesen!

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Feber 22, 2024
Uncategorized
Spannende Neuigkeiten für Liebhaber und Forscher der niederländischen Geschichte! Nach der Ankündigung auf der Transkribus-Nutzerkonferenz 24 in der vergangenen Woche, wird die neue ...
Jänner 31, 2024
News
Wir freuen uns, die neuesten Aktualisierungen unseres Dokumenten-Editors anzukündigen, die Ihnen eine intuitivere und übersichtlichere Benutzeroberfläche bieten. Unser ...
Jänner 17, 2024
News, Transkribus
Muss ich handgeschriebenen Text transkribieren oder übersetzen, um mit ihm arbeiten zu können? Nun, das hängt davon ab ...