Im Spanien des sechzehnten und siebzehnten Jahrhunderts gab es einen bedeutenden Anstieg von Tausenden von Theaterproduktionen. Diese Periode ist als das spanische Goldene Zeitalter bekannt geworden. Dank eines neuen Webtools von protoype kann nun jeder 40.000 Bilder aus einer bedeutenden digitalisierten Sammlung von Manuskripten zu dieser Periode der spanischen Geschichte durchsuchen. Dieses Tool verwendet modernste Keyword-Spotting-Technologie, die es dem Benutzer ermöglicht, Bilder zu durchsuchen, die noch nie zuvor transkribiert wurden.
Dieses Tool ist eine Zusammenarbeit zwischen der Forschungszentrum für Mustererkennung und menschliche Sprachtechnologie an der Universitat Politecnica de Valencia (einer der READ-Partner), die Nationalbibliothek von Spanien und das PROLOPE Forschungsgruppe (beide READ MOU-Partner).
Das Forschungszentrum PRHLT hat diese Manuskripte mit fortschrittlicher Texterkennung und probabilistischer Wortindizierungstechnologie behandelt. Diese hochentwickelte Form der Suche wird oft als Keyword Spotting bezeichnet. Sie ist leistungsfähiger als eine herkömmliche Volltextsuche, weil sie statistische Modelle verwendet, die für die Texterkennung trainiert wurden, um durch Wahrscheinlichkeitswerte zu suchen, die Zeichenfolgen (Wörtern) zugeordnet sind, wobei die meisten möglichen Lesarten jedes Wortes auf einer Seite berücksichtigt werden.
Die 40.000 Seiten, die derzeit für die Suche zur Verfügung stehen, stellen etwa die Hälfte der Sammlung dar. Weitere Dokumente aus der Sammlung werden auf diese Weise bearbeitet werden, wenn weitere Finanzmittel gefunden werden können.
Die Veröffentlichung dieses Keyword-Spotting-Tools fällt zusammen mit einer neue Ausstellung in der Nationalbibliothek von Spanien rund um das Goldene Zeitalter Spaniens, die bis März 2019 läuft. Die Ausstellung wird Originalmanuskripte mit digitalen Displays kombinieren. Das PRHLT-Team hat ein Online-Quiz (auf Spanisch) für die Ausstellung erstellt, bei dem die Benutzer mit dem Keyword Spotting arbeiten müssen, um herauszufinden, welche Wörter häufig oder in Kombination auftreten.
Wenn Sie an Keyword Spotting interessiert sind, schauen Sie sich auch andere Tools an, die vom PRHLT-Team zu diesem Thema erstellt wurden: