+ Gemeinsame Nutzung von Daten mit Transkribus - Transcribimus und Protokolle des Stadtrats von Vancouver

Wir sind uns alle einig, dass es schön ist, Daten zu teilen - und im READ-Projekt bringt das Teilen von Daten direkte Vorteile für die Handschrift-Erkennungstechnologie in unserem Transkribus Plattform. Nach den Prinzipien des maschinellen Lernens gilt: Je mehr Bilder und Transkripte uns als Trainingsdaten übermittelt werden, desto stärker kann die Technologie der Handschrifterkennung werden. Bilder und Transkripte werden nicht öffentlich freigegeben, tragen aber zu einer allgemeinen Verbesserung der Technologie im Hintergrund bei.

Transcribimus ist ein Gemeinschaftsprojekt mit Sitz in Vancouver, Kanada, das über eine umfangreiche Sammlung von Transkripten verfügt, die zum Trainieren eines Modells zur Erkennung von handgeschriebenem Text verwendet werden sollen.

Mit Transcribimus fing alles an, als Sam Sullivan, ehemaliger Bürgermeister von Vancouver, begann, die Stadtratsprotokolle aus dem späten neunzehnten Jahrhundert zu recherchieren, um die Leistungen von Vancouvers zweitem Bürgermeister, David Oppenheimer, zu erforschen. Sams körperliche Einschränkungen hinderten ihn daran, die Archive so oft zu besuchen, wie er es gerne getan hätte. Also bildete er eine Partnerschaft mit Margaret Sutherland, eine lokale Rentnerin, die Erfahrung mit Genealogie und dem Lesen alter Handschriften hatte. Margaret begann mit der Transkription und Digitalisierung der Protokolle für Sam und wurde nach und nach von anderen freiwilligen Transkriptionisten unterstützt, darunter Christopher Stephenson, einem Doktoranden der Bibliotheks- und Archivwissenschaften, der viel Hilfe leistete. Transcribimus wurde schließlich zu einer Online-Plattform, auf der mehr als 20 Freiwillige etwa 3.500 Seiten handschriftlicher Protokolle transkribiert haben.

Bild aus dem Stadtratsprotokoll. Archiv der Stadt Vancouver, VMA 23-5 Seite 214. Bildnachweis: Margaret Sutherland.

Diese Transkriptionen sind bereits frei verfügbar auf der Transcribimus-Website. Die Archiv der Stadt Vancouver wird die Bilder und Abschriften schließlich auch auf ihrer Website anzeigen.

Die überwiegende Mehrheit der Protokolle ist mit einer Hand geschrieben, so daß diese Bilder und Transkripte wahrscheinlich in ein starkes Modell zur Erkennung von handgeschriebenem Text einfließen werden, das nützliche Transkripte der Sammlung erzeugt. Freiwillige Mitarbeiter von Transcribimus könnten dann eventuelle Fehler in diesen automatischen Abschriften überprüfen und korrigieren - und die Transkription der Stadtratsprotokolle sollte hoffentlich schneller realisiert werden!

  • Haben Sie vorhandene Transkriptionen, die Sie im Rahmen eines Forschungsprojekts erstellt oder gesammelt haben? Idealerweise 500 Seiten oder mehr...
  • Schicken Sie sie uns und wir können sie bearbeiten und ein Modell trainieren, um die Schrift in Ihren Dokumenten zu erkennen!
  • Um mehr über das Arbeiten mit vorhandenen Transkripten zu erfahren, konsultieren Sie unsere Wegweiser oder Kontakt.
DIESEN ARTIKEL TEILEN

Neueste Beiträge

November 17, 2022
Transkribus
Wir freuen uns sehr, Ihnen mitteilen zu können, dass wir gestern 100.000 Nutzer auf der Transkribus-Plattform erreicht haben! Trotz unserer jahrelangen, sehr ...
August 12, 2022
Erkennung von handgeschriebenem Text
Hatten Sie schon einmal Probleme, die Handschrift einer anderen Person zu lesen? Vielleicht beruhigt es Sie zu wissen, dass es nicht nur Menschen sind, die ...
22. Juli 2022
Uncategorized
Die neueste Version von Transkribus Lite ist da und bringt eine Reihe von neuen Funktionen. Hier sind die wichtigsten ...