Erkundung der niederländischen Preisdokumente

Auf der Portal Maritiem gibt es mehrere Berichte über die englische Archivsammlung der Prize Papers, Dokumente, die britische Freibeuter zwischen 1652 und 1815 von feindlichen Schiffen erbeuteten. Das Portal enthält auch Informationen über die Website der niederländischen Prize Papers, die Huygens ING (KNAW) vor zwei Jahren eingerichtet hat. 72 000 Scans hauptsächlich niederländischer Dokumente aus dem 17. bis frühen 19. Jahrhundert sind frei zugänglich unter https://prizepapers.huygens.knaw.nl/ (Der Inhalt der Website des Maritiem-Portals ist durch die folgende Lizenz abgedeckt:  https://creativecommons.org/licenses/by-nc-sa/4.0/ (CC BY NC SA 4.0)). Das erste Ziel des Huygens ING-Projekts besteht darin, eine Vielzahl niederländischer Dokumente zu digitalisieren, um sie in einer strukturierten Forschungsumgebung frei zugänglich zu machen. Ermöglicht wurde dies durch Zuschüsse des Bureau Metamorfoze und des kooperierenden Maritimen Fonds. Die 87 Inventarnummern, aus denen das so vielfältige, einzigartige, nicht ausleihbare Material stammt, wurden von Huygens ING mit einigen Metadaten wie Schiffs- und Kapitänsnamen und einer Periodisierung, meist dem Jahr, in dem das (niederländische) Schiff von einem englischen Freibeuter gekapert wurde, versehen. Dies erleichtert die Suche nach Inventarnummern, Baujahren und Namen von Schiffen und Kapitänen. Die gewünschten Dokumente erscheinen dann in der Ergebnisliste. Die Website wurde während des ersten "Vlootschouw"-Symposiums im Scheepvaartmuseum in Amsterdam (Januar 2020) einem breiten Publikum vorgestellt. Dabei wurde das zweite Ziel erörtert, nämlich den gesamten Inhalt der Dokumente durchsuchbar zu machen und für eine interdisziplinäre analytische Forschung zu nutzen. Zu diesem Zweck wurde eine automatische Transkription (OCR) eingesetzt, die es ermöglicht, gedruckte Texte zu erkennen und zu transkribieren. Um die drei Jahrhunderte alten handschriftlichen Dokumente vollständig lesen zu können, ist jedoch eine andere Methode erforderlich. An dieser Stelle kommt Transkribus ins Spiel. Mit der HTR-Software werden 100 Scans von Dokumenten aus verschiedenen Epochen und Sprachen als Trainingsmaterial verwendet, um einen Ground Truth zu erstellen; dies geschieht manuell. Nachdem der Ground Truth-Status erreicht ist, dienen 900 weitere Scans als Validierungsset. Ziel ist es, mit Transkribus ein neues Modell zu erstellen, das die Niederländische Preispapiere. Lesen Sie hier mehr: https://maritiemportal.nl/blog-dutch-prize-papers-huygens-ing-knaw/#more-19325

DIESEN ARTIKEL TEILEN
Teilen auf facebook
Teilen auf twitter
Teilen auf linkedin

Neueste Beiträge

September 14, 2021
HTR-Modelle
Wir freuen uns, ein neues PyLaia-Druckmodell (Transkribus print 0.3) vorstellen zu können. Vielleicht sind Sie bereits mit unserem ...
September 14, 2021
Uncategorized
Auf dem Maritiem-Portal gibt es mehrere Berichte über die englische Archivsammlung der Prize Papers, Dokumente, die britische Freibeuter ...
August 4, 2021
HTR-Modelle
Transkribus freut sich, neue öffentliche Modelle für Spanisch und Französisch vorstellen zu können. Álvaro Cuéllar von der ETSO "Estilometría aplicada al ...