+ Gewinnt Wettbewerbe und Auszeichnungen! READ-Technologie ist auf dem neuesten Stand der Technik

Wir wollten das Jahr 2017 abrunden, indem wir einige fantastische Fortschritte in der Handwritten Text Recognition (HTR) und Layout-Analyse historischer Dokumente feierten.

Im Bereich der Informatik geben offizielle Wettbewerbe den Forschern die Möglichkeit, neue Technologien zu verfeinern und sicherzustellen, dass die besten Techniken in den Vordergrund treten. In der Tat hat das READ-Projekt eine eigene Plattform für Forschungswettbewerbe (ScriptNet), wo Informatiker an Wettbewerben teilnehmen oder diese organisieren können.

In den vergangenen Monaten haben die READ-Projektpartner aus CITlab an der Universität Rostock und das PRHLT Forschungszentrum an der Universitat Politècnica de València haben beeindruckende Ergebnisse erzielt, die Wettbewerbspreise und Konferenzauszeichnungen verdient haben.

Die Internationale Konferenz zur Dokumentenanalyse und -erkennung (ICDAR)die in diesem Jahr in Tokio stattfand, ist eine der größten Konferenzen auf diesem Gebiet und war Schauplatz zweier bedeutender Erfolge für das READ-Projekt.

Joan Puigcerver (PRHLT Research Centre, Universitat Politècnica de València) gewann den Konferenzpreis für Beste studentische Arbeit'. mit dem Titel "Are Multidimensional Recurrent Layers Really Necessary for Handwritten Text Recognition?". Multidimensional Long Short-Term Memory (MLSTM) Einheiten wurden in den letzten Jahren häufig für HTR verwendet. Multidimensionales LSTM ist eine leistungsfähige Form des maschinellen Lernens, die in der Lage ist, Bilder beliebiger Größe zu verarbeiten. Allerdings sind diese Einheiten viel langsamer als andere Architekturen und benötigen eine große Menge an Speicher. In diesem Beitrag wird argumentiert, dass MLSTM-Einheiten für HTR möglicherweise doch nicht notwendig sind, und es wird eine kostengünstigere Architektur vorgeschlagen, die in der Lage ist, das hochmoderne MDLSTM-Modell zu übertreffen und den Zeitaufwand für das Training eines Modells zum Lesen und Verarbeiten einer Reihe von handgeschriebenen Dokumenten erheblich zu reduzieren.

Eine weitere Leistung auf der ICDAR 2017 kam von Tobias Grüning (CITlab, Universität Rostock), der den Wettbewerb zur Layout-Analyse von anspruchsvollen mittelalterlichen Manuskripten. Die Layout-Analyse ist ein wichtiger Bestandteil von HTR, da bei letzterer Technologie Textzeilen in einem Bild mit Zeilen des transkribierten Textes genau abgeglichen werden müssen. Dieser Wettbewerb wurde organisiert von der Dokumenten-, Bild- und Sprachanalyse (DIVA) Forschungsgruppe an der Universität Fribourg. Der Wettbewerb verlangte von den Teilnehmern, das Layout zu analysieren und die Textzeilen in einem anspruchsvollen Datensatz mittelalterlicher Handschriften mit komplexen Layouts zu finden, die marginale und interlineare Ergänzungen und Korrekturen enthielten. Grüning und sein Team konzentrierten sich auf die Erkennung von Textzeilen und gewannen zwei von drei Aufgaben in diesem Wettbewerb. Ihre effektive Layout-Analyse-Technologie ist nun in unserem Transkribus Plattform (wählen Sie "CITlab advanced" im Abschnitt "Layout Analysis" auf der Registerkarte "Tools"). Wie das Bild unten zeigt, kann diese Technologie gut mit den Komplikationen umgehen, die in mittelalterlichen Dokumenten üblich sind!

In Zeilen segmentiertes Dokument mit preisgekrönter CITlab-Technologie. Cologny, Fondation Martin Bodmer, Cod. Bodmer 28, f. 1r - Lateinische Bibel (verfügbar über e-codices: http://www.e-codices.unifr.ch/en/list/one/fmb/cb-0028) [Bild freigegeben unter CC-BY-NC Lizenz]

Tobias Grüning (CITlab, Universität Rostock) wird für seine Arbeit zur Segmentierung von Textzeilen beglückwünscht [Bild von Mathias Seuret ]
Unsere letzte erwähnenswerte Leistung kam von Tobias Strauss (CITlab, Universität Rostock). Er führte sein Team zum Sieg bei einem Wettbewerb über Informationsextraktion in historischen handschriftlichen Aufzeichnungen. Die Aufgabe bestand darin, aus handgeschriebenen Heiratsurkunden Informationen wie Namen, Orte und Berufe zu extrahieren und diese Informationen dann den entsprechenden Personen zuzuordnen, egal ob es sich um Ehemann, Ehefrau oder Vater der Braut handelt. Das Team arbeitete daran, diese Informationen aus ganzen Textzeilen zu extrahieren und zuzuordnen. Diese Arbeit wurde mit der gleichen Funktionalität durchgeführt, die jetzt in Transkribus als Teil unseres neuen Keyword-Spotting-Tools integriert ist. Keyword Spotting ist eine leistungsfähige Form der Schlagwortsuche, bei der die Technologie Bilder von Schrift analysiert, anstatt die Transkriptionen dieser Wörter zu durchsuchen, die entweder von Menschen oder Computern erstellt wurden. Dieses Tool könnte daher die Suche in riesigen Sammlungen erleichtern, die noch nicht transkribiert worden sind.

Diese Errungenschaften zeigen, dass das READ-Projekt auf dem sich entwickelnden Gebiet der HTR an vorderster Front steht. Wir sind stolz darauf, solche Innovationen in Transkribus verfügbar zu machen, die es unseren Nutzern ermöglichen, alle Arten von handschriftlichen historischen Dokumenten automatisch zu transkribieren und zu durchsuchen.

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Juni 20, 2022
Transkribus
Von Joe Nockels, Universität Edinburgh Im Rahmen seiner Doktorarbeit an der Universität Edinburgh und der Nationalbibliothek ...
Juni 15, 2022
Transkribus, Webinare
Wir freuen uns, unsere neue "Ask Us Anything"-Webinarreihe zu starten, in der die Teilnehmer uns alles fragen können, was mit ...
Juni 9, 2022
Uncategorized
Die neue Freigabefunktion Es mag eine kleine Schaltfläche für einen Bildschirm sein, aber sie ist eine großartige Funktion für ...