Am 8. und 9. November 2018 wurde Wien von mehr als 100 Menschen überrannt. Transkribus Anwender, die ihre Erfahrungen austauschen und sich über die neuesten Fortschritte im Bereich der handschriftlichen Texterkennung informieren möchten.
Die Transkribus User Conference fand zum zweiten Mal an der Technischen Universität Wien statt. Obwohl der Himmel weniger sonnig war als im letzten Jahr, war das Konferenzprogramm genauso vollgepackt mit Anwender-Fallstudien, Demonstrationen neuer Tools und technologischen Einblicken.
- Die Folien der Konferenzpräsentationen sind jetzt auf der Konferenz-Website verfügbar.
- Verfolgen Sie den Konferenz-Hashtag auf Twitter: #Transkribus18
- Videos von der Konferenz folgen in Kürze!
Wir haben schon vor Beginn der Konferenz mit einer Scanathon Veranstaltung auf der Österreichische Akademie der Wissenschaften am 7. November. Wir luden die Teilnehmer ein, das Digitalisieren von Dokumenten mit ihrem Mobiltelefon mit unserem DocScan-App und ScanTent-Gerät. Nach Zugverspätungen in Österreich atmeten wir erleichtert auf, als die ScanTents ankamen und wir mit dem Testen und dem Feedback zu unseren neuen Prototypen beginnen konnten!
Um auf die Konferenz zurückzukommen, waren die Anwenderberichte ein großes Highlight der Veranstaltung. Wir hörten, wie Forscher und Archivare aus ganz Europa unsere Transkribus-Plattform nutzen, um eine Vielzahl von Schriften zu erkennen, darunter die Papiere der Der französische Philosoph Michel Foucault, frühneuzeitliche Signaturen und Initialen und Sechzehntes Jahrhundert polnische Steuerregister.
Wir haben auch von einem der ersten Projekte gehört, das Transkribus für Crowdsourcing nutzt. Menschenmenge leert Computer lezen (oder Crowd bringt dem Computer das Lesen bei) im Stadtarchiv Amsterdam hat Transkribus mit dem VeleHanden Crowdsourcing-Plattform, die es Freiwilligen ermöglicht, Transkriptionen zu erstellen, die dann automatisch als Trainingsdaten für die Erkennung notarieller Dokumente verwendet werden können.
Die Konferenz war auch ein wichtiges Schaufenster für bahnbrechende Fortschritte in der Texterkennungstechnologie, darunter:
- HTR+ - eine schnellere und genauere Form der Erkennung von handgeschriebenem Text mit Tensorflow
- Schlüsselwort-Spotting - eine ausgefeilte Form der Stichwortsuche mit Hilfe der Technologie der handschriftlichen Texterkennung
- Tabelle Verarbeitung - Anwendung von automatisierter Layout-Analyse und Vorlagen auf tabellarische Dokumente
Wir blickten auch in die Zukunft mit einer Präsentation über das neue READ-COOP. Das READ-Projekt wird im Juli 2019 auslaufen. Ab diesem Zeitpunkt werden die Transkribus-Dienste im Rahmen dieser neuen Kooperation angeboten. Geplant ist ein Freemium-Servicemodell, bei dem die grundlegenden Transkribus-Funktionen für alle kostenlos bleiben und intensivere Nutzer (Forschungsprojekte, Archive etc.) kostenpflichtig werden - mehr dazu demnächst!
Schließlich hoffen wir, dass die Konferenz eine einzigartige Gelegenheit für unsere Anwender war, direkt mit Informatikern und Entwicklern über ihre Anforderungen und ihre Forschung zu sprechen. Es sah auf jeden Fall so aus, als würden viele nette Verbindungen geknüpft werden!
Ein großes Dankeschön geht an alle unsere Referenten und Teilnehmer. Unser Dank geht auch an die Computer Vision Labor an der Technischen Universität Wien für die Ausrichtung der Konferenz und unseren anderen READ-Projektkollegen, die bei organisatorischen Details geholfen haben. Wir freuen uns schon jetzt auf die Konferenz im nächsten Jahr!