Dieses Modell wird anhand von Berichten der Göteborger Polizeidetektei aus den Jahren 1868-1902 trainiert, die im Schwedischen Nationalarchiv in Göteborg aufbewahrt werden. Der Ground Truth für das Modelltraining besteht aus transkribierten Spreads aus den Jahren 1873, 1880, 1888 und 1896. Es wurden 165 000 Wörter trainiert und der CER auf dem Validierungsset beträgt 2,7%.
Link zum Archiv-Findmittel: https://sok.riksarkivet.se/arkiv/gj8w3gHtrH6cyG018W43t3 (Material zum Trainieren des Modells in Serie A II)
Das Training dieses Modells ist Teil eines Forschungs- und Entwicklungsprojekts am Schwedischen Nationalarchiv, in Zusammenarbeit mit GPS400: Zentrum für kollaborative visuelle Forschung an der Universität Göteborg und Vinnova: Schwedens Innovationsagentur, sowie Teilnehmern der Öffentlichkeit durch Citizen Science-Aktivitäten am Regionalen Staatsarchiv in Göteborg, wo die Teilnehmer den Großteil der Groundtruth-Spreads für das Training dieses Modells transkribiert haben.