Wie man französische Handschrift mit AI liest

Sie können viel über die französische Geschichte lernen, wenn Sie Bücher lesen oder Dokumentarfilme sehen. Diese Arten von Quellen sind gut geeignet, um sich einen Überblick über ein Thema zu verschaffen. Aber es sind Primärquellen wie Geburtsregister, mittelalterliche Handschriften oder persönliche Briefe, die wirklich zum Kern eines Themas vordringen und uns eine ungefilterte Perspektive auf die Geschichte geben und es uns ermöglichen, unsere eigenen Schlüsse über die Ereignisse zu ziehen, die stattgefunden haben.

Handgeschriebene Dokumente wie diese sind jedoch nicht immer leicht zu lesen. Alte Handschriften sind in jeder Sprache schwierig zu entziffern, und Französisch ist da keine Ausnahme. Außerdem wurden im Laufe der Geschichte viele verschiedene Schriften und Schreibstile für die französische Sprache verwendet, von der mittelalterlichen karolingischen Schrift bis zur modernen Kursivschrift. Das bedeutet, dass Sie nicht nur die Sprache, sondern auch die Schrift verstehen müssen.

Primäre Quellen, wie z. B. Briefe, sind der Schlüssel zur Erschließung der Vergangenheit. Von KI generiertes Bild

In der Vergangenheit waren umfangreiche Fähigkeiten und Kenntnisse erforderlich, um solche Dokumente zu lesen. Zum Glück ist es heute dank der KI-gestützten Technologie zur Erkennung handgeschriebener Texte möglich, handgeschriebene Dokumente in Französisch und vielen anderen Sprachen zu lesen und zu transkribieren, ohne dass man ein Experte für die historische französische Handschrift sein muss. In diesem Beitrag werfen wir einen Blick darauf, was die französische Kursivschrift so schwer lesbar macht, und zeigen, wie Plattformen für künstliche Intelligenz wie Transkribus können zur Bewältigung dieser Herausforderungen eingesetzt werden.

Eine kurze Geschichte der französischen Handschrift

Eines der Haupthindernisse beim Verstehen alter französischer Handschriften ist die Vielzahl der Schriften, die von französischen Schreibern im Laufe der Geschichte verwendet wurden. Wie das Französische im 15. Jahrhundert geschrieben wurde, unterscheidet sich stark von dem, wie es heute geschrieben wird. Ihre Dokumente könnten zum Beispiel in einer beliebigen Anzahl von Schriften geschrieben sein:

Karolingische Schrift

Im Mittelalter war die Handschrift in Frankreich stark von der karolingischen Schrift geprägt, die unter der Herrschaft Karls des Großen entwickelt wurde. Diese Schrift zeichnete sich durch klare, gut lesbare Buchstaben mit einigen Verzierungen aus.

Kursive Schrift

Während der Renaissance veränderte sich die französische Handschrift unter dem Einfluss der humanistischen Bewegung. Humanistische Gelehrte setzten sich für eine Rückkehr zu klassischen Formen ein, was zur Entwicklung neuer Stile wie der kursiven Schrift mit ihren geneigten, fließenden Strichen führte.

Ein typisches Beispiel für eine französische Handschrift des 19. Jahrhunderts. Bild aus "Bulliot, Bibracte und ich" Projekt, über Transkribus

Sekretärin Hand

Im 17. Jahrhundert wurde die französische Sekretärsschrift, eine für offizielle Dokumente und Korrespondenz verwendete Handschrift, populär. Diese Schrift zeichnete sich durch ihre Lesbarkeit und Formalität aus und entwickelte sich im Laufe der Jahrhunderte mit der Entwicklung neuer Schreibgeräte zu verschiedenen Formen.

Kursive Schrift / "Écriture cursive" (Schreibschrift)

Im 19. und frühen 20. Jahrhundert entwickelten die Franzosen eine Schreibschrift, die speziell für Bildungszwecke entwickelt wurde. Diese als "écriture cursive" bezeichnete Schrift betonte die Flüssigkeit und die Verbindung zwischen den Buchstaben. Sie wurde zur Standardschrift, die in den französischen Schulen gelehrt wurde, und ist heute die häufigste französische Handschrift.

Handschriftliche Dokumente in französischer Sprache ohne Technik lesen

Vor der Entwicklung von Hilfsmitteln wie der Handschrifterkennung war das Lesen handschriftlicher Dokumente in jeder Sprache eine Herausforderung. Wie in der Einleitung erläutert, musste man nicht nur die Sprache kennen, sondern auch die Schrift, in der das Dokument verfasst war.

Natürlich ist es möglich, das Lesen verschiedener Schriften zu lernen. Man muss klein anfangen und lernen, wie ein paar Buchstaben in der Schrift aussehen. Von dort aus können Sie beginnen, ganze Wörter zu entziffern, vor allem gebräuchliche oder erwartete Wörter, wie z. B. "Cordialement" in einem Brief oder "Date de naissance" in einem Geburtsregister.

Öffentliche Register sind eine Fundgrube für historische Informationen. Bild aus Batz-sur-Mer Zivilstandsbehördeüber Wikimedia Commons

Der letzte Schritt besteht darin, ganze Sätze und damit den gesamten Inhalt des Dokuments zu entziffern. Hierfür waren gute Französischkenntnisse wichtig: Wenn man 90% der Wörter eines Satzes versteht, kann man die anderen 10% oft aus dem Kontext erraten.

Wie die Erkennung handschriftlicher Texte das Lesen von Dokumenten erleichtert

Dank der OCR-Technologie (Optical Character Recognition) sind Maschinen seit einigen Jahrzehnten in der Lage, gedruckten Text zu lesen. Allerdings, aufgrund der unendlich vielen möglichen Handschriftenwaren diese OCR-Systeme bei handschriftlichem Text wenig hilfreich.

Vor etwa 10 Jahren schloss sich eine Gruppe von Forschern, Archivaren und Historikern zusammen, um eine neue Technologie zur Handschrifterkennung zu entwickeln, die für die Digitalisierung und Transkription handschriftlicher Dokumente eingesetzt werden kann. Die automatische Transkription großer Textmengen ermöglicht es Forschern, Daten aus Quellen viel schneller zu extrahieren als bei der manuellen Transkription, was die Forschung effizienter macht.

Das Ergebnis dieses Projekts war eine Technologie, die als handschriftliche Texterkennung (HTR) bezeichnet wird. HTR-Plattformen wie Transkribus nutzen künstliche Intelligenz, maschinelles Lernen und neuronale Netze um buchstäblich zu lernen, wie man handgeschriebene Texte liest, genau wie ein Mensch es tun würde.

Wie man ein AI-Modell in Transkribus trainiert

Die Plattform tut dies mithilfe von KI-Modellen. Jedes Modell ist so etwas wie ein Handbuch, das Transkribus sagt, wie eine bestimmte Art von Handschrift zu lesen ist. Wenn Sie zum Beispiel eine Sammlung handschriftlicher Texte aus dem 19. Jahrhundert in französischer Sprache transkribieren möchten, laden Sie Bilder aller Seiten hoch und weisen die Plattform an, sie mit Hilfe des Französische Handschrift 19. Jahrhundert Modell. Transkribus würde das Wissen in diesem Modell nutzen, um den Text in den Bildern zu lesen und eine digitale Transkription zu erstellen.

Transkribus nutzt KI, um handgeschriebenen Text automatisch zu transkribieren. Bild aus "Bulliot, Bibracte und ich" Projekt, über Transkribus

Das wirklich Einzigartige an Transkribus ist jedoch, dass Sie Ihr eigenes Handschrifterkennungsmodell erstellen und die Plattform darauf trainieren können, die spezifische Handschrift in Ihren Dokumenten zu lesen. Dazu müssen Sie eine bestimmte Anzahl von Dokumenten hochladen. "Bodenwahrheit" Trainingsdaten - Dokumente, die bereits mit 100%-Genauigkeit transkribiert worden sind. Die Plattform nutzt die Informationen in diesen Daten, um ein neues "Handbuch" oder Modell zu erstellen, das dann für die Transkription der übrigen Dokumente verwendet werden kann. Es kann zwar etwas Zeit in Anspruch nehmen, ein benutzerdefiniertes Modell von Grund auf zu erstellen, aber auf lange Sicht ist es fast immer schneller als die manuelle Transkription aller Ihrer Dokumente.

Weitere Informationen über das Training von KI-Modellen finden Sie in unserem Hilfe-Center.

Wie genau ist die Handschrifterkennung?

Die Genauigkeit ist immer noch eine der Herausforderungen bei der Handschrifterkennung. Die menschliche Handschrift ist für Maschinen äußerst komplex, und es gibt noch kein System, das Dokumente fehlerfrei transkribieren kann.

Aber einige Modelle kommen dem nahe. Jedem Modell ist eine "Zeichenfehlerrate" oder CER zugeordnet. Diese gibt an, wie viel Prozent der Zeichen in einem Text wahrscheinlich falsch transkribiert werden. Wenn das Modell eine CER von 100% hat, wird es alle Zeichen falsch transkribieren. Hat es eine CER von 0%, dann wird es eine perfekte, fehlerfreie Transkription produzieren.

In der Regel liefern Modelle mit einer CER von 10% oder weniger eine Transkription von ausreichender Qualität für die Analyse oder weitere Forschung, wobei nur eine minimale Nachbearbeitung erforderlich ist.

Die CERs der neuesten Transkribus-Modelle sind in der letzten Spalte zu sehen. Bild über Transkribus

Welche KI-Modelle gibt es für die französische Handschrift?

Auf Transkribus gibt es mehrere "öffentliche" KI-Modelle für die französische Handschrift, die für alle Nutzer zugänglich sind.

Allgemeines französisches Modell

Dieses universell einsetzbare Modell, das für eine Vielzahl von Dokumenten geeignet ist, wurde an verschiedenen Händen aus unterschiedlichen Epochen geübt und ist in der Lage, sowohl historische als auch moderne Handschriften zu lesen. Es hat einen CER von 7.8%.

Sie können das Modell ausprobieren auf dieser Seite.

Französische Handschrift 19. Jahrhundert

Dieses Modell, das offiziell als "BBM Bulliot French C19th handwritten 2021" bekannt ist, wurde im Rahmen des bürgerwissenschaftlichen Projekts "Bulliot, Bibracte et moi" trainiert. Sein Datensatz besteht aus etwa 147 000 Wörtern und hat eine CER von 8,2%. Dieses Modell ist auch für andere handschriftliche Dokumente in französischer Sprache aus demselben Zeitraum nützlich.

Sie können das Modell ausprobieren auf dieser Seite.

Der Text Titan I

Dieses transformatorgesteuerte KI-Modell ist unser bevorzugtes Modell für handschriftliches und gedrucktes Material in einer Reihe von Sprachen, einschließlich Französisch. Es ist daher ideal für Sammlungen mit vielen verschiedenen Arten von Material und Schriften.

Sie können das Modell ausprobieren, indem Sie sich bei Ihrem Konto anmelden unter app.transkribus.org.

Mittelalterliche Handschriften M2.4

Dieses umfangreiche Modell wurde mit einer Vielzahl von Daten aus dem Mittelalter trainiert und kann nicht nur für französische, sondern auch für niederländische, deutsche, lateinische und flämische Texte verwendet werden. Es hat einen CER von 7,1%.

Sie können das Modell ausprobieren auf dieser Seite.

Die französische Handschrift wird nach dem Modell "Französische Handschrift 19. Jahrhundert" transkribiert. Bild aus "Bulliot, Bibracte und ich" Projekt, über Transkribus

Wie kann ich Transkribus selbst ausprobieren?

Möchten Sie herausfinden, ob Transkribus auch für Ihre Dokumente geeignet ist?

  • Weiter zu app.transkribus.org und erstellen Sie ein Konto.
  • Laden Sie Bilder von Ihren Dokumenten hoch.
  • Wählen Sie ein öffentliches Modell, wie das oben beschriebene.
  • Lassen Sie Transkribus eine automatische Transkription erstellen.

Alternativ können Sie Transkribus auch gleich testen, indem Sie Transkribus AI.

Mit AI erstelltes Vorschaubild

DIESEN ARTIKEL TEILEN

Neueste Beiträge

25. April 2024
News, Transkribus
Im Januar haben wir unsere neuen Abonnementpläne angekündigt: Einzelpersonen, Stipendiaten und Organisationen. Jeder Plan ist auf eine bestimmte ...
April 17, 2024
News, Transkribus
Einer der größten Vorteile von Transkribus ist die Möglichkeit, benutzerdefinierte Modelle zur Erkennung von handschriftlichem Text zu trainieren. Diese einzigartige Funktion ...
4. April 2024
News
Der Frühling hat begonnen und damit auch die Veröffentlichung von Transkribus im April 2024. Hier ist ein kurzer Überblick über alle ...