Einführung der Transkribus-Supermodelle - Zugang zu 'The Text Titan I' erhalten

Die Transkribus Next Gen ist auf dem Weg und wir freuen uns, Ihnen mitteilen zu können, dass der Zugang zu unserem neuen Transkribus-Supermodell 'The Text Titan I' ab sofort möglich ist für früher Zugang.

In diesem Blogbeitrag werden wir darüber sprechen, warum wir diese neue Technologie einführen und welche Vorteile sie mit sich bringt. Außerdem zeigen wir Ihnen, wie Sie auf den "Text Titan I" zugreifen können und wann Sie damit rechnen können, dass er in Betrieb genommen wird.

Warum die Veränderung

Einer unserer nächsten Schritte in Richtung Transkribus Next Gen besteht darin, neue Elemente und neue Technologien für unsere Nutzer hinzuzufügen. Und eines dieser technologischen Elemente sind die neuen Transkribus-Supermodelle für die Texterkennung, die die fortschrittlichsten Modelle sind, die wir anbieten. 

Sie können hervorragend mit natürlicher Sprache umgehen, was ihnen hilft, alle Arten von schriftlichem Material zu entziffern. Sie sind in der Lage, die bestehenden PyLaia-Modelle deutlich zu übertreffen. Ein wesentlicher Vorteil dieser Modelle besteht darin, dass sie sowohl aus einem optischen Teil, der die Bilder verarbeitet, als auch aus einem umfassenden Sprachmodell bestehen, das versucht, die extrahierten Textinformationen sinnvoll zu nutzen und zu verbessern. Der sprachliche Teil ist in der Lage, mehr als nur eine Sprache sowie alte und neue Formen einer Sprache gleichzeitig zu verarbeiten. Dadurch können die Modelle sehr hochwertige Texte ausgeben.

Das erste von uns trainierte Supermodell, der Text Titan I, zielt darauf ab, sowohl handschriftlichen als auch gedruckten Text mit bemerkenswerter Genauigkeit und Effizienz in einer Vielzahl von Sprachen zu erkennen. Text Titan I übertrifft bereits bestehende große Modelle wie The Dutchess I oder The German Giants. 

Leistung des transformatorbasierten Text-Titan-Modells im Vergleich zum stärksten PyLaia-Modell

Bei einer Menge von 300 sehr heterogenen Seiten konnte das transformatorbasierte Text Titan-Modell im Vergleich zu unserem stärksten PyLaia-Modell bessere Ergebnisse erzielen. Insbesondere die Anzahl der Seiten mit sehr niedrigen Zeichenfehlerraten ist mit Text Titan deutlich höher.

Vorteile des Text Titan

Die Verwendung von Supermodellen wie dem Text Titan I bringt eine Reihe von Vorteilen mit sich. Wie oben erläutert, ist ein Supermodell ein großes, sehr allgemeines Modell mit der Fähigkeit, sowohl handgeschriebenen als auch gedruckten Text gleichzeitig zu erkennen. Dies ist besonders nützlich, wenn man mit gemischten Materialien arbeitet. Einige Archivbestände oder Manuskriptsammlungen können verschiedene Arten von Schrift enthalten, gedruckte und handschriftliche Dokumente, vorgedruckte, handschriftlich ausgefüllte Formulare, Karteikarten usw. Mit dem Text Titan können Sie das Modell auf beide Arten von Text anwenden, d. h. Sie benötigen keine unterschiedlichen Modelle und müssen nicht ständig die Einstellungen ändern, wenn Sie sowohl mit handschriftlichen als auch mit gedruckten Dokumenten arbeiten.

Der Text Titan ist bemerkenswert versiert in der Verarbeitung einer Vielzahl von Materialien und Schriften. Obwohl unsere Supermodelle derzeit noch nicht von den Nutzern feinabgestimmt oder trainiert werden können, bieten sie eine hervorragende Leistung bei zahlreichen heterogenen Materialtypen, die Ihnen dabei helfen werden, schnell Ground Truth für das Training Ihres eigenen maßgeschneiderten PyLaia-Modells zu erzeugen. Wir sind uns des Wertes von Anpassung und Geschwindigkeit bewusst und planen fleißig für die Zukunft, in der Supermodelle wie der Text-Titan anpassbar gemacht werden, um Ihre spezifischen Bedürfnisse besser zu erfüllen.

Ein spezialisiertes Pylaia-Modell, das für wohldefiniertes Material trainiert wurde, kann jedoch noch bessere Ergebnisse liefern. Die Erstellung der Trainingsdaten für ein solches spezialisiertes Modell kann jedoch erheblich beschleunigt werden, indem zunächst ein Teil des Materials mit dem Text Titan bearbeitet und manuell korrigiert wird.

Neues Supermodell: Der Text Titan I

Wie kann ich auf den Text Titan zugreifen?

Sie können unser neues fortschrittliches Texterkennungsmodell, den Text Titan I, ausprobieren, indem Sie das folgende Formular ausfüllen dieses Anfrageformular um sich in die Liste für den frühen Zugang einzutragen. Sobald Sie Zugang erhalten und den Text Titan I ausprobiert haben, lassen Sie uns bitte wissen, was Sie denken und geben Sie uns Feedback. Dies können Sie tun, indem Sie uns auf unseren Social Media Kanälen eine Nachricht senden oder, noch besser, indem Sie den Feedback-Button in der Transkribus Web App benutzen.

Was sind die nächsten Schritte? 

Die nächsten Schritte für Transkribus sind die Aufnahme weiterer Sprachen in die Supermodelle und Bemühungen um höhere Genauigkeit durch verbesserte Layout-Erkennung. Der Text Titan wird in den Sommermonaten der Öffentlichkeit zur Verfügung gestellt werden. 

Die Super-Modelle bedeuten einen bedeutenden Schritt nach vorn in der Texterkennungstechnologie und in unserem ständigen Bestreben, unseren Benutzern die neueste Technologie zur Verfügung zu stellen. Mit der Möglichkeit, sowohl handgeschriebenen als auch gedruckten Text gleichzeitig zu verarbeiten und mit mehreren Sprachen zu arbeiten, bieten diese Modelle einen noch nie dagewesenen Komfort und Flexibilität. 

Verpassen Sie nicht Ihre Chance, die Möglichkeiten dieses leistungsstarken Modells zu erkunden. Melden Sie sich für den Frühzugang an, um zu den ersten zu gehören, die den Text Titan I ausprobieren und die Entwicklung mit Ihrem wertvollen Feedback mitgestalten können. 

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Juli 3, 2024
News, Transkribus
Einige Transkribus-Projekte enden mit einer vollständig digitalisierten Sammlung in Transkribus. Andere nehmen diese digitalisierte Quelle und verwenden sie ...
Juni 12, 2024
News, Transkribus
Wenn man an karolingische (oder karolingische) Minuskeln denkt, kommen einem wahrscheinlich Karl der Große und sein riesiges karolingisches Reich in den Sinn. Während die ...
Mai 14, 2024
Uncategorized
Das Verstehen historischer Dokumente ist der Schlüssel zum Verständnis der Geschichte. Das Verstehen historischer Dokumente auf Polnisch kann jedoch eine Herausforderung sein. Nicht nur ...