Wir sind uns alle einig, dass es schön ist, Daten zu teilen - und im READ-Projekt bringt das Teilen von Daten direkte Vorteile für die Handschrift-Erkennungstechnologie in unserem Transkribus Plattform. Nach den Prinzipien des maschinellen Lernens gilt: Je mehr Bilder und Transkripte uns als Trainingsdaten übermittelt werden, desto stärker kann die Technologie der Handschrifterkennung werden. Bilder und Transkripte werden nicht öffentlich freigegeben, tragen aber zu einer allgemeinen Verbesserung der Technologie im Hintergrund bei.
Transcribimus ist ein Gemeinschaftsprojekt mit Sitz in Vancouver, Kanada, das über eine umfangreiche Sammlung von Transkripten verfügt, die zum Trainieren eines Modells zur Erkennung von handgeschriebenem Text verwendet werden sollen.
Mit Transcribimus fing alles an, als Sam Sullivan, ehemaliger Bürgermeister von Vancouver, begann, die Stadtratsprotokolle aus dem späten neunzehnten Jahrhundert zu recherchieren, um die Leistungen von Vancouvers zweitem Bürgermeister, David Oppenheimer, zu erforschen. Sams körperliche Einschränkungen hinderten ihn daran, die Archive so oft zu besuchen, wie er es gerne getan hätte. Also bildete er eine Partnerschaft mit Margaret Sutherland, eine lokale Rentnerin, die Erfahrung mit Genealogie und dem Lesen alter Handschriften hatte. Margaret begann mit der Transkription und Digitalisierung der Protokolle für Sam und wurde nach und nach von anderen freiwilligen Transkriptionisten unterstützt, darunter Christopher Stephenson, einem Doktoranden der Bibliotheks- und Archivwissenschaften, der viel Hilfe leistete. Transcribimus wurde schließlich zu einer Online-Plattform, auf der mehr als 20 Freiwillige etwa 3.500 Seiten handschriftlicher Protokolle transkribiert haben.
Diese Transkriptionen sind bereits frei verfügbar auf der Transcribimus-Website. Die Archiv der Stadt Vancouver wird die Bilder und Abschriften schließlich auch auf ihrer Website anzeigen.
Die überwiegende Mehrheit der Protokolle ist mit einer Hand geschrieben, so daß diese Bilder und Transkripte wahrscheinlich in ein starkes Modell zur Erkennung von handgeschriebenem Text einfließen werden, das nützliche Transkripte der Sammlung erzeugt. Freiwillige Mitarbeiter von Transcribimus könnten dann eventuelle Fehler in diesen automatischen Abschriften überprüfen und korrigieren - und die Transkription der Stadtratsprotokolle sollte hoffentlich schneller realisiert werden!
- Haben Sie vorhandene Transkriptionen, die Sie im Rahmen eines Forschungsprojekts erstellt oder gesammelt haben? Idealerweise 500 Seiten oder mehr...
- Schicken Sie sie uns und wir können sie bearbeiten und ein Modell trainieren, um die Schrift in Ihren Dokumenten zu erkennen!
- Um mehr über das Arbeiten mit vorhandenen Transkripten zu erfahren, konsultieren Sie unsere Wegweiser oder Kontakt.