+ Suche nach dem Goldenen Zeitalter Spaniens mit Keyword Spotting

Im Spanien des sechzehnten und siebzehnten Jahrhunderts gab es einen bedeutenden Anstieg von Tausenden von Theaterproduktionen. Diese Periode ist als das spanische Goldene Zeitalter bekannt geworden. Dank eines neuen Webtools von protoype kann nun jeder 40.000 Bilder aus einer bedeutenden digitalisierten Sammlung von Manuskripten zu dieser Periode der spanischen Geschichte durchsuchen. Dieses Tool verwendet modernste Keyword-Spotting-Technologie, die es dem Benutzer ermöglicht, Bilder zu durchsuchen, die noch nie zuvor transkribiert wurden.

Dieses Tool ist eine Zusammenarbeit zwischen der Forschungszentrum für Mustererkennung und menschliche Sprachtechnologie an der Universitat Politecnica de Valencia (einer der READ-Partner), die Nationalbibliothek von Spanien und das PROLOPE Forschungsgruppe (beide READ MOU-Partner).

Das Forschungszentrum PRHLT hat diese Manuskripte mit fortschrittlicher Texterkennung und probabilistischer Wortindizierungstechnologie behandelt. Diese hochentwickelte Form der Suche wird oft als Keyword Spotting bezeichnet. Sie ist leistungsfähiger als eine herkömmliche Volltextsuche, weil sie statistische Modelle verwendet, die für die Texterkennung trainiert wurden, um durch Wahrscheinlichkeitswerte zu suchen, die Zeichenfolgen (Wörtern) zugeordnet sind, wobei die meisten möglichen Lesarten jedes Wortes auf einer Seite berücksichtigt werden.

Keyword Spotting für das Wort 'Madrid'.

Die 40.000 Seiten, die derzeit für die Suche zur Verfügung stehen, stellen etwa die Hälfte der Sammlung dar. Weitere Dokumente aus der Sammlung werden auf diese Weise bearbeitet werden, wenn weitere Finanzmittel gefunden werden können.

Die Veröffentlichung dieses Keyword-Spotting-Tools fällt zusammen mit einer neue Ausstellung in der Nationalbibliothek von Spanien rund um das Goldene Zeitalter Spaniens, die bis März 2019 läuft. Die Ausstellung wird Originalmanuskripte mit digitalen Displays kombinieren. Das PRHLT-Team hat ein Online-Quiz (auf Spanisch) für die Ausstellung erstellt, bei dem die Benutzer mit dem Keyword Spotting arbeiten müssen, um herauszufinden, welche Wörter häufig oder in Kombination auftreten.

Wenn Sie an Keyword Spotting interessiert sind, schauen Sie sich auch andere Tools an, die vom PRHLT-Team zu diesem Thema erstellt wurden:

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Juli 3, 2024
News, Transkribus
Einige Transkribus-Projekte enden mit einer vollständig digitalisierten Sammlung in Transkribus. Andere nehmen diese digitalisierte Quelle und verwenden sie ...
Juni 12, 2024
News, Transkribus
Wenn man an karolingische (oder karolingische) Minuskeln denkt, kommen einem wahrscheinlich Karl der Große und sein riesiges karolingisches Reich in den Sinn. Während die ...
Mai 14, 2024
Uncategorized
Das Verstehen historischer Dokumente ist der Schlüssel zum Verständnis der Geschichte. Das Verstehen historischer Dokumente auf Polnisch kann jedoch eine Herausforderung sein. Nicht nur ...