Was ist Handschrifterkennung und wie funktioniert sie?

Hatten Sie schon einmal Schwierigkeiten, die Handschrift einer anderen Person zu lesen? 

Vielleicht beruhigt es Sie zu wissen, dass nicht nur Menschen dieses Problem haben, sondern auch Computer. Während Computer schon seit Jahrzehnten in der Lage sind, gedruckten Text zu erkennen und zu transkribieren, ist die Erkennung von handgeschriebenen Texten erst seit einigen Jahren möglich. Die Technologie, die dies ermöglicht, wird als Handschrifterkennung oder HTR bezeichnet und ist die Grundlage der Transkribus-Software. 

Die Handschrifterkennung ist eine faszinierende Technologie, die jedoch anfangs etwas kompliziert sein kann. Wenn Sie diese neue und einzigartige Technologie noch nicht kennen, finden Sie hier eine kurze Einführung, was HTR ist und was sie leistet.

Was ist Handschrifterkennung oder HTR?

Bei der Handschrifterkennung handelt es sich um eine Technologie, mit der die Schrift in Bildern von handschriftlichen Dokumenten "gelesen" werden kann. Nehmen wir an, Sie haben in der Schulzeit einen Aufsatz mit der Hand geschrieben und möchten diesen Aufsatz nun als digitalen Text auf Ihrem Computer haben. Mit der richtigen HTR-Software können Sie ein Foto des Aufsatzes machen, es durch die Software laufen lassen und erhalten denselben Aufsatz als digitale Textdatei, die Sie bei Bedarf herunterladen und weitergeben können. Dies ist das Grundprinzip der Handschrifterkennung.

Handschrifterkennung

Wir sollten uns auch über die Terminologie im Klaren sein. Die oben beschriebene Art der Handschrifterkennung wird als "Offline-Handschrifterkennung" bezeichnet. Das liegt daran, dass es sich um Bilder von bereits geschriebenem Text handelt. Es gibt auch eine "Online-Handschrifterkennung". Dabei handelt es sich um Software, die digitalen Text aus der Handschrift generiert wie Sie es schreibenin der Regel mit einem Tablett und einem Eingabestift. Da Transkribus zur Erkennung der Handschrift in bereits geschriebenen historischen Dokumenten entwickelt wurde, kann es nur zur Offline-Handschrifterkennung verwendet werden.

Warum ist handgeschriebener Text für Computer schwerer zu erkennen als gedruckter Text?

Bei gedruckten Texten gibt es eine endliche Anzahl von Schriftarten, die verwendet werden können - 200.000 Stück, in Tatsache. Das mag zwar viel erscheinen, aber es bedeutet zumindest, dass man eine Software programmieren kann, die sie alle liest.

Handschrift ist ein anderes Spiel. Die 6,5 Milliarden Menschen auf diesem Planeten, die schreiben können, haben alle ihren eigenen Handschriftstil, und keine zwei Stile sind genau gleich. Um die Dinge noch komplizierter zu machen, kann sich die Art, wie jemand auf einem offiziellen Formular schreibt, stark von der Art unterscheiden, wie er z. B. in sein Tagebuch schreibt. Die unendliche Anzahl von Möglichkeiten macht es auch unmöglich, eine Software zu programmieren, die sie alle lesen kann. Lesen Sie mehr über den Unterschied zwischen optischer Zeichenerkennung (OCR) und Handschrifterkennung in unserem Einblicke Blog.

Die Vielfalt der Handschriften

Wie funktioniert die Handschrifterkennung?

Wie also erkennt die HTR-Technologie die Handschrift, wenn man sie nicht programmieren kann? Antwort: Die HTR-Software erkennt die Handschrift nicht, sie lernt um Handschrift zu erkennen. Mit der Zeit lernt eine Software wie Transkribus mithilfe von KI und Deep Learning, verschiedene Arten von Handschriften zu lesen und zu transkribieren, genau wie ein Mensch es tun würde. Dazu braucht man zunächst ein KI-Modell. Das ist wie ein riesiges digitales Gehirn, das die Formen und Merkmale von Tausenden von handgeschriebenen Wörtern, Buchstaben und sogar einfachen Symbolen gelernt hat. Das Wichtigste ist, dass das Modell auch Vermutungen über Zeichen anstellen kann, die es noch nie gesehen hat. Die Software erkennt die Handschrift auf dem Bild und nutzt dann das Wissen des Modells, um die Handschrift in digitalen Text zu übertragen. Mit dem richtigen Modell können Sie mit nur einem Mausklick eine nahezu perfekte Transkription erzielen. 

Es gibt eine Vielzahl von öffentliche Modelle die bereits für Transkribus verfügbar sind und verschiedene Sprachen und Handschrifttypen abdecken, wie z.B. die deutsche Kurrentschrift oder die englische Handschrift des 18. und 19. Sie können aber auch Ihr eigenes Modell erstellen. Dazu müssen Sie eine bestimmte Anzahl von Dokumenten manuell transkribieren, um den "digitalen Verstand" darauf zu trainieren, die spezifische Handschrift in Ihren Dokumenten zu erkennen. Sie können dann dieses benutzerdefinierte Modell verwenden, um den Rest Ihrer Dokumente automatisch zu transkribieren.

Wofür wird die HTR-Technologie eingesetzt?

Es gibt viele Berufe, bei denen es darauf ankommt, handschriftliche Dokumente schnell lesen zu können. Historiker und andere Forscher nutzen zum Beispiel historische handschriftliche Dokumente, um mehr über die Vergangenheit zu erfahren. Sie möchten oft digitale Versionen der Dokumente erstellen, um sie leichter analysieren und die gesamte Sammlung nach bestimmten Wörtern oder Begriffen durchsuchen zu können. Die HTR-Technologie ist dafür perfekt geeignet.

Handschriftliche Sammlungen werden häufig online über die read&search Plattform

Archive und Bibliotheken sind ebenfalls Orte, an denen die HTR-Technologie nützlich sein kann. Heutzutage sind Archivare und Bibliothekare bestrebt, digitale Versionen von so vielen Büchern und Dokumenten wie möglich anzubieten. Die manuelle Transkription der Hunderte und Tausende von Bänden in einem Standardarchiv würde jedoch ewig dauern. Die automatische Transkription mit HTR ist eine viel schnellere Alternative und erleichtert auch die Online-Veröffentlichung aller Dokumente.

Aber es gibt noch viele andere Menschen, die die HTR-Technologie nutzen, um sich das Leben zu erleichtern: Unternehmen, die ihre alten Akten digitalisieren wollen, Entwickler, die die Handschrifterkennung in ihre eigene Software integrieren wollen, Hobby-Genealogen, die die alten Aufzeichnungen ihrer Familie lesen wollen - die Liste ist endlos!

Kann ich ein Beispiel für die Handschrifterkennung in Aktion sehen?

Wenn Sie sehen möchten, wie die Handschrifterkennung funktioniert, laden Sie einfach ein gescanntes Bild mit handgeschriebenem Text in das unten stehende Widget hoch, um die Technologie in Aktion zu sehen.

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Juli 3, 2024
News, Transkribus
Einige Transkribus-Projekte enden mit einer vollständig digitalisierten Sammlung in Transkribus. Andere nehmen diese digitalisierte Quelle und verwenden sie ...
Juni 12, 2024
News, Transkribus
Wenn man an karolingische (oder karolingische) Minuskeln denkt, kommen einem wahrscheinlich Karl der Große und sein riesiges karolingisches Reich in den Sinn. Während die ...
Mai 14, 2024
Uncategorized
Das Verstehen historischer Dokumente ist der Schlüssel zum Verständnis der Geschichte. Das Verstehen historischer Dokumente auf Polnisch kann jedoch eine Herausforderung sein. Nicht nur ...