+ Blogbeitrag von The British Library - Handschriftliche Texterkennung von India Office Records

Die Britische Bibliothekeines der READ-Projekte Memorandum of Understanding Partnerarbeitet seit Jahren mit Transkribus zum Verarbeiten von Datensätzen aus dem Büro Indien. Diese Sammlung bezieht sich größtenteils auf die in London ansässige Verwaltung der East India Company und der indischen Regierung vor 1947.

Die British Library begann bereits 2015 mit der Transkribus-Technologie zu experimentieren. Aufgrund des komplexen Layouts einiger Dokumente und der Anzahl verschiedener Hände stellt diese Sammlung eine Herausforderung für die automatische Verarbeitung dar. Aber die neuesten Ergebnisse zeigen, dass ein Modell zur automatisierten Texterkennung die Seiten mit einer zufriedenstellenden Zeichenfehlerrate (CER) von 15% transkribieren kann.

Alex Hailey, Kurator für moderne Archive und Manuskripte, erklärt mehr über den Fortschritt und die Lektionen, die er gelernt hat, in seinem Blogbeitrag auf der Website der British Library Digital Scholarship Blog.

DIESEN ARTIKEL TEILEN

Neueste Beiträge

März 15, 2023
Uncategorized
Von Fiona Park Nicht jeder, der sich mit Geschichte beschäftigt, ist ein professioneller Historiker. Von Hobby-Genealogen bis hin zu Freiwilligen in lokalen ...
März 7, 2023
Transkribus
Die Herstellung von Büchern im Mittelalter war eine Herausforderung. Vor der Einführung des Buchdrucks wurden alle Bücher in mühsamer Kleinarbeit ...
1. März 2023
Transkribus, Uncategorized
Wir freuen uns, die neueste Version von Transkribus ankündigen zu können, die einige bedeutende Verbesserungen an unserem Dokumenteneditor enthält. Unten ...