+ Stichwortsuche in handschriftlichem Text - neuer Durchbruch bei französischen mittelalterlichen Aufzeichnungen

Einer der READ-Projektpartner trägt dazu bei, dass die Stichwortsuche in handschriftlichen Dokumenten möglich wird! Die Mustererkennung und menschliche Sprachtechnologie (PRHLT) Forschungszentrum an der Universitat Politècnica de València ist Teil des HIMANIS Projekt. HIMANIS steht für Historical MANuscript Indexing for user-controlled Search (Historische MANuskript-Indizierung für die benutzergesteuerte Suche) und ist wie READ ein Projekt, das darauf abzielt, neue Technologien zu nutzen, um den Zugang zu Dokumenten des kulturellen Erbes zu öffnen.

Die Arbeit von HIMANIS konzentriert sich auf die Trésor des Chartes, eine Sammlung von mittelalterlichen Registern, die die von französischen Königen im vierzehnten und fünfzehnten Jahrhundert verliehenen Urkunden, Zuwendungen und Privilegien dokumentieren. Durch die Zusammenarbeit von Archivaren und Informatikern in HIMANIS ist es nun möglich, eine Volltextsuche in diesen Registern durchzuführen. Probieren Sie es aus!

 

Um ein paar Beispiele zu nennen: Sie können nach Personennamen suchen (Alfonso) und Ortsnamen (Paris), sowie Wörter in Französisch oder Latein. Es ist auch möglich, kompliziertere boolesche Suchanfragen durchzuführen - Sie können eine Vollständige Erklärung und Beispiele auf dem HIMANIS Blog.

Dieses Suchwerkzeug ist ein Prototyp und Sie können helfen, es zu verbessern! Wenn Sie auf ein in den Suchergebnissen hervorgehobenes Wort klicken, können Sie eine Rückmeldung geben, ob das Wort richtig erkannt wurde. Wenn Sie Wörter sehen, die vom Tool übersehen wurden, können Sie auf sie doppelklicken, um sicherzustellen, dass eine Suche sie beim nächsten Mal aufgreift.

Diese Form der Suche wird als Keyword-Spotting bezeichnet. Sie stellt eine erweiterte Version der Schlagwortsuche dar, da die Technologie Ähnlichkeiten in Bildern von Wörtern erkennt, anstatt durch computergenerierte Transkriptionen dieser Wörter zu suchen.

Diese beeindruckende Technologie wird in unsere Transkribus Plattform in den kommenden Monaten. Auch das Forschungszentrum PRHLT an der Universitat Politècnica de València wird seine Experimente fortsetzen und diesmal mit Theateraufzeichnungen aus dem Goldenen Zeitalter Spaniens arbeiten.

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Juli 3, 2024
News, Transkribus
Einige Transkribus-Projekte enden mit einer vollständig digitalisierten Sammlung in Transkribus. Andere nehmen diese digitalisierte Quelle und verwenden sie ...
Juni 12, 2024
News, Transkribus
Wenn man an karolingische (oder karolingische) Minuskeln denkt, kommen einem wahrscheinlich Karl der Große und sein riesiges karolingisches Reich in den Sinn. Während die ...
Mai 14, 2024
Uncategorized
Das Verstehen historischer Dokumente ist der Schlüssel zum Verständnis der Geschichte. Das Verstehen historischer Dokumente auf Polnisch kann jedoch eine Herausforderung sein. Nicht nur ...