+ "German_Kurrent_17th-18th" - Der Kurrent Tausendsassa

Haben Sie schon eines unserer größten Modelle in Transkribus kennengelernt? Das ist der German_Kurrent_17th-18. Modell der Universität Greifswald. Um seinem Beinamen "Der Kurrent Tausendsassa" gerecht zu werden, wurden verschiedene Textarten eingearbeitet. Die meisten der trainierten Handschriften stammen aus den Konzilsprotokollen der Universität Greifswald, den Assessorenstimmen des Hochgerichts Wismar, den Protokollen der Pommerschen Regierung zu Stralsund, den Responsa der Juristischen Fakultät Greifswald und anderen Archivbeständen wie privaten Briefsammlungen. Die Trainingsdaten bestehen hauptsächlich aus Dokumenten aus dem 17..-18. Jahrhundert und ein paar Seiten aus dem 19. Jahrhundert. Das Modell hat eine Trainingsmenge von mehr als 1 840 000 Wörtern (ehrlich!) und eine Zeichenfehlerrate auf der Validierungsmenge von 5,5%. Es ist eine gute Wahl, um eine vernünftige Transkription für ein beliebiges Kurrent-Skript zu erhalten, das Sie haben oder wenn Sie ein stabiles Basismodell für 17.-19. bis 19. Jahrhunderts benötigen.

Vielen Dank an die Universität Greifswald für diesen mächtigen Riesen!

DIESEN ARTIKEL TEILEN
Teilen auf facebook
Teilen auf twitter
Teilen auf linkedin

Neueste Beiträge

September 14, 2021
HTR-Modelle
Wir freuen uns, ein neues PyLaia-Druckmodell (Transkribus print 0.3) vorstellen zu können. Vielleicht sind Sie bereits mit unserem ...
September 14, 2021
Uncategorized
Auf dem Maritimen Portal gibt es mehrere Berichte über die englische Archivsammlung der Prize Papers, Dokumente, die britische Freibeuter ...
August 4, 2021
HTR-Modelle
Transkribus freut sich, neue öffentliche Modelle für Spanisch und Französisch vorstellen zu können. Álvaro Cuéllar von der ETSO "Estilometría aplicada al ...