Die Zukunft der Informationsextraktion - Nehmen Sie teil an TUC 2024! 15. und 16. Februar, persönlich und online. Holen Sie sich Ihr Ticket >>

+ Stichwortsuche in handschriftlichem Text - neuer Durchbruch bei französischen mittelalterlichen Aufzeichnungen

Einer der READ-Projektpartner trägt dazu bei, dass die Stichwortsuche in handschriftlichen Dokumenten möglich wird! Die Mustererkennung und menschliche Sprachtechnologie (PRHLT) Forschungszentrum an der Universitat Politècnica de València ist Teil des HIMANIS Projekt. HIMANIS steht für Historical MANuscript Indexing for user-controlled Search (Historische MANuskript-Indizierung für die benutzergesteuerte Suche) und ist wie READ ein Projekt, das darauf abzielt, neue Technologien zu nutzen, um den Zugang zu Dokumenten des kulturellen Erbes zu öffnen.

Die Arbeit von HIMANIS konzentriert sich auf die Trésor des Chartes, eine Sammlung von mittelalterlichen Registern, die die von französischen Königen im vierzehnten und fünfzehnten Jahrhundert verliehenen Urkunden, Zuwendungen und Privilegien dokumentieren. Durch die Zusammenarbeit von Archivaren und Informatikern in HIMANIS ist es nun möglich, eine Volltextsuche in diesen Registern durchzuführen. Probieren Sie es aus!

 

Um ein paar Beispiele zu nennen: Sie können nach Personennamen suchen (Alfonso) und Ortsnamen (Paris), sowie Wörter in Französisch oder Latein. Es ist auch möglich, kompliziertere boolesche Suchanfragen durchzuführen - Sie können eine Vollständige Erklärung und Beispiele auf dem HIMANIS Blog.

Dieses Suchwerkzeug ist ein Prototyp und Sie können helfen, es zu verbessern! Wenn Sie auf ein in den Suchergebnissen hervorgehobenes Wort klicken, können Sie eine Rückmeldung geben, ob das Wort richtig erkannt wurde. Wenn Sie Wörter sehen, die vom Tool übersehen wurden, können Sie auf sie doppelklicken, um sicherzustellen, dass eine Suche sie beim nächsten Mal aufgreift.

Diese Form der Suche wird als Keyword-Spotting bezeichnet. Sie stellt eine erweiterte Version der Schlagwortsuche dar, da die Technologie Ähnlichkeiten in Bildern von Wörtern erkennt, anstatt durch computergenerierte Transkriptionen dieser Wörter zu suchen.

Diese beeindruckende Technologie wird in unsere Transkribus Plattform in den kommenden Monaten. Auch das Forschungszentrum PRHLT an der Universitat Politècnica de València wird seine Experimente fortsetzen und diesmal mit Theateraufzeichnungen aus dem Goldenen Zeitalter Spaniens arbeiten.

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Jänner 31, 2024
News
Wir freuen uns, die neuesten Aktualisierungen unseres Dokumenten-Editors anzukündigen, die Ihnen eine intuitivere und übersichtlichere Benutzeroberfläche bieten. Unser ...
Jänner 17, 2024
News, Transkribus
Muss ich handgeschriebenen Text transkribieren oder übersetzen, um mit ihm arbeiten zu können? Nun, das hängt davon ab ...
Jänner 11, 2024
News, Transkribus
Die Verwaltung und Veröffentlichung historischer Dokumente war noch nie so einfach! Erstellen Sie eine Website, die Ihr transkribiertes Material präsentiert ...