In Transkribus wurden bereits viele Modelle auf verschiedene Sprachen aus unterschiedlichen Epochen trainiert. Was uns noch fehlt, ist ein allgemeines Modell, das eine breite Palette moderner Handschriften erkennen kann. Wir haben uns zum Ziel gesetzt, unseren Benutzern in naher Zukunft ein solches Modell zur Verfügung zu stellen: ein großes und robustes Modell, das mit den meisten modernen Handschriften umgehen kann.
Bei der Überlegung, wie wir die große Menge an benötigten Trainingsdaten erstellen können, kam uns Crowdsourcing in den Sinn und die Idee für das Projekt readme2020 war geboren. Hier kommen Sie und andere Transkribus-Nutzer ins Spiel: Bitte helfen Sie uns bei der Erstellung der Trainingsdaten, indem Sie uns einen handschriftlichen Text zur Verfügung stellen!
Wenn Sie einen Beitrag leisten möchten, sind die folgenden vier Schritte alles, was dazu nötig ist:
- Nehmen Sie ein leeres Blatt Papier und schreiben Sie etwas mit der Hand auf, dies kann jede Art von Text und Thema sein. Natürlich können Sie auch einfach einen Text kopieren.
- Laden Sie die DocScan-App auf Ihr Android-Handy (leider nicht für iPhones verfügbar) und scannen Sie Ihr Schreiben, indem Sie den Anweisungen folgen, die auf den Screenshots auf dieser Seite gezeigt werden: https://readcoop.eu/readme2020/
- Hochladen des Dokuments in Transkribus
- Sie erhalten eine Bestätigungs-E-Mail mit dem Link zu unserem Web-Interface. Bitte fügen Sie dort die Transkription Ihres Textes ein.
Das war's auch schon.
Sobald genügend Daten vorhanden sind, werden wir vom READ-COOP-Team mit dem Training des modernen Handschriftmodells beginnen. Wir sind super-neugierig auf das Ergebnis und freuen uns darauf, gemeinsam mit Ihnen etwas Nützliches für viele Menschen zu schaffen.
Unter diesem Link können Sie alles über die Projektdetails nachlesen: https://readcoop.eu/readme2020/