Haben Sie schon eines unserer größten Modelle in Transkribus kennengelernt? Das ist der German_Kurrent_17th-18. Modell der Universität Greifswald. Um seinem Beinamen "Der Kurrent Tausendsassa" gerecht zu werden, wurden verschiedene Textarten eingearbeitet. Die meisten der trainierten Handschriften stammen aus den Konzilsprotokollen der Universität Greifswald, den Assessorenstimmen des Hochgerichts Wismar, den Protokollen der Pommerschen Regierung zu Stralsund, den Responsa der Juristischen Fakultät Greifswald und anderen Archivbeständen wie privaten Briefsammlungen. Die Trainingsdaten bestehen hauptsächlich aus Dokumenten aus dem 17..-18. Jahrhundert und ein paar Seiten aus dem 19. Jahrhundert. Das Modell hat eine Trainingsmenge von mehr als 1 840 000 Wörtern (ehrlich!) und eine Zeichenfehlerrate auf der Validierungsmenge von 5,5%. Es ist eine gute Wahl, um eine vernünftige Transkription für ein beliebiges Kurrent-Skript zu erhalten, das Sie haben oder wenn Sie ein stabiles Basismodell für 17.-19. bis 19. Jahrhunderts benötigen.
Vielen Dank an die Universität Greifswald für diesen mächtigen Riesen!