+ Stichwortsuche in handschriftlichem Text - neuer Durchbruch bei französischen mittelalterlichen Aufzeichnungen

Einer der READ-Projektpartner trägt dazu bei, dass die Stichwortsuche in handschriftlichen Dokumenten möglich wird! Die Mustererkennung und menschliche Sprachtechnologie (PRHLT) Forschungszentrum an der Universitat Politècnica de València ist Teil des HIMANIS Projekt. HIMANIS steht für Historical MANuscript Indexing for user-controlled Search (Historische MANuskript-Indizierung für die benutzergesteuerte Suche) und ist wie READ ein Projekt, das darauf abzielt, neue Technologien zu nutzen, um den Zugang zu Dokumenten des kulturellen Erbes zu öffnen.

Die Arbeit von HIMANIS konzentriert sich auf die Trésor des Chartes, eine Sammlung von mittelalterlichen Registern, die die von französischen Königen im vierzehnten und fünfzehnten Jahrhundert verliehenen Urkunden, Zuwendungen und Privilegien dokumentieren. Durch die Zusammenarbeit von Archivaren und Informatikern in HIMANIS ist es nun möglich, eine Volltextsuche in diesen Registern durchzuführen. Probieren Sie es aus!

 

Um ein paar Beispiele zu nennen: Sie können nach Personennamen suchen (Alfonso) und Ortsnamen (Paris), sowie Wörter in Französisch oder Latein. Es ist auch möglich, kompliziertere boolesche Suchanfragen durchzuführen - Sie können eine Vollständige Erklärung und Beispiele auf dem HIMANIS Blog.

Dieses Suchwerkzeug ist ein Prototyp und Sie können helfen, es zu verbessern! Wenn Sie auf ein in den Suchergebnissen hervorgehobenes Wort klicken, können Sie eine Rückmeldung geben, ob das Wort richtig erkannt wurde. Wenn Sie Wörter sehen, die vom Tool übersehen wurden, können Sie auf sie doppelklicken, um sicherzustellen, dass eine Suche sie beim nächsten Mal aufgreift.

Diese Form der Suche wird als Keyword-Spotting bezeichnet. Sie stellt eine erweiterte Version der Schlagwortsuche dar, da die Technologie Ähnlichkeiten in Bildern von Wörtern erkennt, anstatt durch computergenerierte Transkriptionen dieser Wörter zu suchen.

Diese beeindruckende Technologie wird in unsere Transkribus Plattform in den kommenden Monaten. Auch das Forschungszentrum PRHLT an der Universitat Politècnica de València wird seine Experimente fortsetzen und diesmal mit Theateraufzeichnungen aus dem Goldenen Zeitalter Spaniens arbeiten.

DIESEN ARTIKEL TEILEN

Neueste Beiträge

25. April 2024
News, Transkribus
Im Januar haben wir unsere neuen Abonnementpläne angekündigt: Einzelpersonen, Stipendiaten und Organisationen. Jeder Plan ist auf eine bestimmte ...
April 17, 2024
News, Transkribus
Einer der größten Vorteile von Transkribus ist die Möglichkeit, benutzerdefinierte Modelle zur Erkennung von handschriftlichem Text zu trainieren. Diese einzigartige Funktion ...
4. April 2024
News
Der Frühling hat begonnen und damit auch die Veröffentlichung von Transkribus im April 2024. Hier ist ein kurzer Überblick über alle ...