+ "German_Kurrent_17th-18th" - Der Kurrent Tausendsassa

Haben Sie schon eines unserer größten Modelle in Transkribus kennengelernt? Das ist der German_Kurrent_17th-18. Modell der Universität Greifswald. Um seinem Beinamen "Der Kurrent Tausendsassa" gerecht zu werden, wurden verschiedene Textarten eingearbeitet. Die meisten der trainierten Handschriften stammen aus den Konzilsprotokollen der Universität Greifswald, den Assessorenstimmen des Hochgerichts Wismar, den Protokollen der Pommerschen Regierung zu Stralsund, den Responsa der Juristischen Fakultät Greifswald und anderen Archivbeständen wie privaten Briefsammlungen. Die Trainingsdaten bestehen hauptsächlich aus Dokumenten aus dem 17..-18. Jahrhundert und ein paar Seiten aus dem 19. Jahrhundert. Das Modell hat eine Trainingsmenge von mehr als 1 840 000 Wörtern (ehrlich!) und eine Zeichenfehlerrate auf der Validierungsmenge von 5,5%. Es ist eine gute Wahl, um eine vernünftige Transkription für ein beliebiges Kurrent-Skript zu erhalten, das Sie haben oder wenn Sie ein stabiles Basismodell für 17.-19. bis 19. Jahrhunderts benötigen.

Vielen Dank an die Universität Greifswald für diesen mächtigen Riesen!

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Juli 3, 2024
News, Transkribus
Einige Transkribus-Projekte enden mit einer vollständig digitalisierten Sammlung in Transkribus. Andere nehmen diese digitalisierte Quelle und verwenden sie ...
Juni 12, 2024
News, Transkribus
Wenn man an karolingische (oder karolingische) Minuskeln denkt, kommen einem wahrscheinlich Karl der Große und sein riesiges karolingisches Reich in den Sinn. Während die ...
Mai 14, 2024
Uncategorized
Das Verstehen historischer Dokumente ist der Schlüssel zum Verständnis der Geschichte. Das Verstehen historischer Dokumente auf Polnisch kann jedoch eine Herausforderung sein. Nicht nur ...