Wenn wir zusammenarbeiten, können wir so viel erreichen! Stadtarchiv Amsterdam und VeleHanden haben gerade eine fantastische Crowdsourcing-Initiative gestartet, die die Leistungsfähigkeit unserer Handwritten Text Recognition (HTR)-Technologie mit den Talenten von freiwilligen Transkriptionisten kombiniert.
- Ausprobieren Menschenmenge leert Computer lezen (oder Crowd bringt dem Computer das Lesen bei)
Das Amsterdamer Stadtarchiv ist daran interessiert, den Zugang zu den Aufzeichnungen der Amsterdamer Notare zu öffnen, die vom sechzehnten bis zum zwanzigsten Jahrhundert reichen. Diese Dokumente sind reif für eine weitere Erforschung für diejenigen, die sich für die reiche soziale und wirtschaftliche Geschichte der niederländischen Hauptstadt interessieren. Das ultimative Ziel ist es, eine vollständig durchsuchbare Aufzeichnung dieser wertvollen handschriftlichen Sammlung zu erstellen.
Das Team hat mit unserem Transkribus Plattform, um HTR-Modelle zur Erkennung verschiedener Teile dieser Sammlung zu trainieren.
Die HTR-Modelle wurden verwendet, um automatische Transkripte der Dokumente zu generieren. Es liegt nun an den Freiwilligen, die von der Maschine gemachten Fehler zu korrigieren!
Das Projekt wird auf VeleHanden gehostet, einer erfolgreichen Crowdsourcing-Plattform, die von der Firma Picturae. Menschenmenge leert Computer lezen ist direkt mit dem Transkribus-Webinterface verbunden, so dass alle von den Probanden vorgenommenen Änderungen direkt in das System zurückgespielt werden können, um die automatische Erkennung zu verbessern.
Jeder kann an diesem neuen Projekt teilnehmen und verschiedene Schwierigkeitsstufen erkunden, um Dokumente zu finden, an denen er interessiert ist. Freiwillige sammeln für ihre Transkriptionsarbeit Punkte, die bei Ausstellungen und Veranstaltungen im Stadtarchiv Amsterdam eingelöst werden können.
Wir sind wirklich gespannt, was der Computer aus der Menge lernen kann...
Mark Ponte vom Amsterdamer Stadtarchiv gab uns auf unserer letzten Transkribus-Anwenderkonferenz einen kleinen Einblick in das Projekt