Das Modell "Schwedisch 17. Jahrhundert (Savo, Ostfinnland)" ist darauf trainiert, die gotische Handschrift, auch bekannt als "deutsche" Handschrift, zu lesen. Es ist auf die schwedische Handschrift des 17. Jahrhunderts zugeschnitten und wurde im Rahmen des Promotionsprojekts von Ville-Pekka Kääriäinen an der Universität von Helsinki entwickelt.
Der Schwerpunkt des Projekts lag im 17. Jahrhundert in Obersavoyen (Ylä-Savo, Gemeinde Iisalmi/Idensalmi, Ostfinnland). Folglich könnte die Fähigkeit des Modells, Eigennamen (Personen- und Ortsnamen) zu interpretieren, aufgrund der begrenzten geografischen Reichweite der Trainingsdaten etwas eingeschränkt sein.
Das Modell enthält Trainingsdaten aus verschiedenen Dokumentensammlungen der finnischen und schwedischen Nationalarchive:
- Akten des Bezirksgerichts (fi: kihlakunnanoikeus, swe: häradsrätten) für die Gemeinde Iisalmi von 1639-1699 (Gerichtsbarkeit von Savolax 1639-1650, Kajana friherreskap 1651-1680, Lilla Savolax 1681-1699)
- Erwähnungen von Einwohnern der Gemeinde Iisalmi in den Aufzeichnungen des Lagmansrätt (fi: laamanninoikeus) von 1643-1699 (Rechtsbezirk Karjala, Karelska lagsagan)
- Briefe an Graf Per Brahe von lokalen Beamten, Geistlichen und Bürgern (Skokolstersamlingen, Rydboholmssamlingen)
- Die Beschwerden des einfachen Volkes (fi: rahvaanvalitukset, swe: allmogens besvär) aus der Gerichtsbarkeit von Lilla-Savolax (fi: Pien-Savo)
Die Bildqualität der Trainingsdaten ist unterschiedlich. Das Modell wurde in erster Linie entwickelt, bevor das finnische Nationalarchiv eine neue Runde der Digitalisierung der Gerichtsakten einleitete, was die Arbeit mit Mikrofilmkopien von geringer Qualität erforderlich machte. Das Material des schwedischen Nationalarchivs hingegen schwankt zwischen selbst fotografierten Digitalisierungen von hoher Qualität und Digitalisierungen von Mikrofilmen von geringer Qualität.
Das Modell lehnt sich in seiner Struktur eng an das Ausgangsmaterial an. Geldeinheiten, Maßeinheiten und andere Abkürzungen wurden mit der ihnen innewohnenden Logik behandelt, wenn auch ohne sie zu erweitern.
So werden beispielsweise gängige Währungseinheiten wie die Mark und der Taler je nach Kontext mit den Symbolen m/m:r oder D/D:r dargestellt.
Das Modell wurde mit großem persönlichen Einsatz und Engagement entwickelt.
Ich hoffe, dass es sich für andere als nützlich erweisen wird. Ich bin offen für eine Zusammenarbeit, um dieses Modell weiterzuentwickeln. Bitte zögern Sie nicht, mich zu kontaktieren unter: v.kaariainen@gmail.com.
GT:
Seiten: 1353 (Trainingsmenge) + 147 (Validierungsmenge) = 1500 Seiten
Wörter: 472.655 (Trainingsmenge) + 51.613 (Validierungsmenge) = 524.268 Wörter