KI-Modelle für das Lesen von kursiven und gedruckten polnischen Texten

Das Verstehen historischer Dokumente ist der Schlüssel zum Verständnis der Geschichte. Historische Dokumente auf Polnisch zu verstehen, kann jedoch eine Herausforderung sein. Nicht nur die Sprache ist oft schwer zu verstehen, auch die Handschrift ist manchmal fast unmöglich zu lesen. Die Tatsache, dass das polnische Alphabet hat sich stark verändert in den letzten Jahrhunderten macht dies besonders schwierig.

Heutzutage kann jedoch die KI helfen. Mit Hilfe von KI-gestützten Plattformen zur Erkennung von handgeschriebenem Text (HTR) wie Transkribuskönnen Sie sowohl handschriftliche als auch gedruckte Dokumente in einem Bruchteil der Zeit automatisch transkribieren, die Sie für die manuelle Transkription benötigen würden. In diesem Beitrag sehen wir uns genauer an, wie man historische Dokumente mit KI transkribiert und welche Modelle Transkribus für polnische Dokumente anbietet.

Briefe sind eine der vielen wertvollen Quellen, die mit KI transkribiert werden können. © Jerzy Krzewicki via Wikimedia Commons

Der Nutzen der Digitalisierung von Dokumenten

Es ist etwas Besonderes, historische Dokumente in ihrer ursprünglichen Form zu lesen. Der Geruch des Pergaments, das vorsichtige Umblättern der Seiten und das Gefühl, Worte zu lesen, die Hunderte von Jahren zuvor geschrieben wurden, ist einfach magisch.

Auch wenn eine digitale Version in dieser Hinsicht nie mithalten kann, bietet die Erstellung digitaler Versionen historischer Dokumente viele Vorteile:

  • Sie ermöglicht es jedem, sie zu lesen. Nicht jeder hat die Fähigkeit, die polnische Handschrift aus dem 16. Jahrhundert zu lesen, und auch nicht die Zeit, dies zu lernen. Eine digitale Version bedeutet, dass jeder den Inhalt des Dokuments verstehen kann, ohne Hilfe bei der polnischen Handschrift zu benötigen.
  • Digitale Versionen können leicht online weitergegeben werden. Statt persönlich ins Archiv oder Museum zu gehen, um sich die Dokumente anzusehen, können Interessierte sie einfach online bequem von ihrem Büro oder Wohnzimmer aus einsehen. Dadurch werden polnischsprachige Ressourcen für mehr Menschen zugänglich, was die Zusammenarbeit fördert und neue Perspektiven auf historische Ereignisse eröffnet.
  • Das Wichtigste, Die Digitalisierung von Dokumenten erleichtert die Informationsgewinnung. Angenommen, Sie haben eine Sammlung von Geburtsurkunden und möchten alle Urkunden eines bestimmten Jahres finden. Bei Papierdokumenten müssten Sie alle Seiten manuell durchsuchen und nach dem betreffenden Jahr scannen. Bei digitalen Dokumenten können Sie einfach das Jahr in die Suchleiste eingeben und schnell alle relevanten Dokumente finden. Dies ist eine intelligentere und effizientere Arbeitsweise, die Zeit, Mühe und Geld spart.

Die Digitalisierung von Dokumenten wie diesem Tagebuch macht sie für alle zugänglich. Tagebuch von Janina Turek über Transkribus

Automatische Transkription von Dokumenten mit KI

Vor der KI war die Transkription historischer Dokumente ein zeitaufwändiger Prozess. Man brauchte jemanden mit Kenntnissen der Sprache und Schreibschrift, der bereit war, manchmal Monate oder Jahre mit der manuellen Transkription der Dokumente zu verbringen.

KI-Plattformen wie Transkribus haben diesen Prozess revolutioniert. Jetzt müssen Sie nur noch ein Bild des Dokuments hochladen, ein Modell auswählen (siehe unten), und die Plattform liefert Ihnen eine digitale Version des Textes im Dokument. Sie können diese Transkription dann bei Bedarf bearbeiten, herunterladen, weitergeben oder sogar online mit Ihrer eigenen Version veröffentlichen. Standort Transkribus.

Transkribus wurde zwar für Dokumente in historischer Schreibschrift entwickelt, kann aber auch mit gedruckten Texten verwendet werden und bietet mehrere Vorteile gegenüber herkömmlicher OCR Systeme.

Transkribus ist eine effektive Alternative zu herkömmlichen OCR-Systemen. © ZG ZPwN via Wikimedia Commons

KI-Modelle für die Transkription polnischer Dokumente

Wie bereits erwähnt, müssen Sie bei der Transkription mit Transkribus ein "Modell" auswählen. Das ist so etwas wie ein Handbuch, das der Plattform vorgibt, wie eine bestimmte Art von Dokument zu transkribieren ist.

Jedes Modell ist darauf trainiert, entweder handschriftliche oder gedruckte Dokumente in einer bestimmten Sprache und aus einem bestimmten Zeitraum zu lesen. Sie können auf die Handschrift einer einzelnen Person abgestimmt sein oder ein breites Spektrum von Handschriften aus der Geschichte abdecken.

Mit Transkribus können Sie Trainieren Sie Ihre eigenen AI-Modelle, zugeschnitten auf Ihre spezifischen Dokumente. Wenn Sie jedoch neu auf der Plattform sind, würden wir Ihnen empfehlen, ein öffentliches Modell zu verwenden, das von der Transkribus-Community trainiert wurde. Damit sollten Sie eine ziemlich genaue Transkription erhalten, ohne dass Sie Trainingsdaten vorbereiten oder ein Modell testen müssen.

Das Modell Text Titan I ist in der Lage, Dokumente zu lesen, die sowohl handschriftliche als auch gedruckte Texte enthalten. © Regierung von Polen via Wikimedia Commons

Es gibt zwei öffentliche Modelle für polnische Sprachdokumente:

Allgemeines polnisches Modell

Dieses universell einsetzbare Modell wurde an einer Vielzahl handschriftlicher polnischer Dokumente, sowohl historischer als auch moderner Art, trainiert, so dass es sich gut für polnische handschriftliche Dokumente unterschiedlicher Art eignet.

Weitere Informationen finden Sie unter hier erläutert.

Text Titan I

Der Text Titan I ist eines unserer neuen transformatorbetriebenen "Supermodelle". Diese fortschrittlichen Modelle sind Meister des Multitaskings und können handschriftliche und gedruckte Dokumente in vielen verschiedenen Sprachen und Schriften gleichzeitig transkribieren. Es ist daher ideal für unterschiedliche Sammlungen, die vielleicht sowohl polnische als auch anderssprachige Dokumente und Dokumente aus verschiedenen Epochen umfassen.

Der Text Titan I ist nur für Benutzer mit einem Plan für Stipendiaten, Teams oder Organisationen. Sie können mehr über das Modell herausfinden hier erläutert.

Transkribus jetzt ausprobieren

Möchten Sie Transkribus selbst ausprobieren? Laden Sie einfach ein polnisches Dokument in unsere Demoversion hoch und lassen Sie die Plattform eine automatische Transkription für Sie erstellen.

Thumbnail enthält: Daukantas Handschrift, 1857 -1859. © Simonas Daukantas via Wikimedia Commons

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Juli 3, 2024
News, Transkribus
Einige Transkribus-Projekte enden mit einer vollständig digitalisierten Sammlung in Transkribus. Andere nehmen diese digitalisierte Quelle und verwenden sie ...
Juni 12, 2024
News, Transkribus
Wenn man an karolingische (oder karolingische) Minuskeln denkt, kommen einem wahrscheinlich Karl der Große und sein riesiges karolingisches Reich in den Sinn. Während die ...
Mai 14, 2024
Uncategorized
Das Verstehen historischer Dokumente ist der Schlüssel zum Verständnis der Geschichte. Das Verstehen historischer Dokumente auf Polnisch kann jedoch eine Herausforderung sein. Nicht nur ...