+ Suche nach dem Goldenen Zeitalter Spaniens mit Keyword Spotting

Im Spanien des sechzehnten und siebzehnten Jahrhunderts gab es einen bedeutenden Anstieg von Tausenden von Theaterproduktionen. Diese Periode ist als das spanische Goldene Zeitalter bekannt geworden. Dank eines neuen Webtools von protoype kann nun jeder 40.000 Bilder aus einer bedeutenden digitalisierten Sammlung von Manuskripten zu dieser Periode der spanischen Geschichte durchsuchen. Dieses Tool verwendet modernste Keyword-Spotting-Technologie, die es dem Benutzer ermöglicht, Bilder zu durchsuchen, die noch nie zuvor transkribiert wurden.

Dieses Tool ist eine Zusammenarbeit zwischen der Forschungszentrum für Mustererkennung und menschliche Sprachtechnologie an der Universitat Politecnica de Valencia (einer der READ-Partner), die Nationalbibliothek von Spanien und das PROLOPE Forschungsgruppe (beide READ MOU-Partner).

Das Forschungszentrum PRHLT hat diese Manuskripte mit fortschrittlicher Texterkennung und probabilistischer Wortindizierungstechnologie behandelt. Diese hochentwickelte Form der Suche wird oft als Keyword Spotting bezeichnet. Sie ist leistungsfähiger als eine herkömmliche Volltextsuche, weil sie statistische Modelle verwendet, die für die Texterkennung trainiert wurden, um durch Wahrscheinlichkeitswerte zu suchen, die Zeichenfolgen (Wörtern) zugeordnet sind, wobei die meisten möglichen Lesarten jedes Wortes auf einer Seite berücksichtigt werden.

Keyword Spotting für das Wort 'Madrid'.

Die 40.000 Seiten, die derzeit für die Suche zur Verfügung stehen, stellen etwa die Hälfte der Sammlung dar. Weitere Dokumente aus der Sammlung werden auf diese Weise bearbeitet werden, wenn weitere Finanzmittel gefunden werden können.

Die Veröffentlichung dieses Keyword-Spotting-Tools fällt zusammen mit einer neue Ausstellung in der Nationalbibliothek von Spanien rund um das Goldene Zeitalter Spaniens, die bis März 2019 läuft. Die Ausstellung wird Originalmanuskripte mit digitalen Displays kombinieren. Das PRHLT-Team hat ein Online-Quiz (auf Spanisch) für die Ausstellung erstellt, bei dem die Benutzer mit dem Keyword Spotting arbeiten müssen, um herauszufinden, welche Wörter häufig oder in Kombination auftreten.

Wenn Sie an Keyword Spotting interessiert sind, schauen Sie sich auch andere Tools an, die vom PRHLT-Team zu diesem Thema erstellt wurden:

DIESEN ARTIKEL TEILEN

Neueste Beiträge

Dezember 7, 2022
Community
Der November 2022 war ein Meilenstein in der Geschichte von Transkribus. Nach drei Jahren als Teil einer europäischen Genossenschaft wird die Plattform ...
November 17, 2022
Transkribus
Wir freuen uns sehr, Ihnen mitteilen zu können, dass wir gestern 100.000 Nutzer auf der Transkribus-Plattform erreicht haben! Trotz unserer jahrelangen, sehr ...
August 12, 2022
Erkennung von handgeschriebenem Text
Hatten Sie schon einmal Probleme, die Handschrift einer anderen Person zu lesen? Vielleicht beruhigt es Sie zu wissen, dass es nicht nur Menschen sind, die ...