Informationen, die in Tabellen angeordnet sind, erscheinen dem menschlichen Auge oft sehr übersichtlich, aber Computer haben Schwierigkeiten, die Tabellen zu verarbeiten, die häufig in historischen Dokumenten vorkommen. Bei READ arbeiten wir hart daran, die automatische Layout-Analyse und Erkennung von tabellarischen Daten zu verbessern. Und wir brauchen Ihre Hilfe! Können Sie uns Bilder von Tabellen (wie das untenstehende) zur Verfügung stellen, damit wir sie in unseren Experimenten verwenden können? Scrollen Sie nach unten für weitere Informationen...
READ Forscher an der Computer Vision Labor an der Technischen Universität Wien, Naver Labs Europa und das Diözesanarchiv Passau möchten ein Table Understanding Modul entwickeln, das uns hilft, Tabellen zu erkennen und zu verarbeiten. Sie möchten einen offenen Datensatz mit Bildern von historischen Dokumenten aufbauen, die Tabellen enthalten. Diese Sammlung soll dazu dienen, READ-Tools zu entwerfen und zu evaluieren sowie als Grundlage für zukünftige Forschungswettbewerbe, zu denen andere Informatiker ihre eigenen Ansätze beisteuern können.
Wenn Sie zu dieser Tabellensammlung beitragen möchten...
- Bitte stellen Sie mindestens 10 Bilder von verschiedenen Tabellen aus Ihren Dokumenten zur Verfügung.
- Wenn Sie eine Sammlung haben, in der derselbe Tabellentyp wiederholt verwendet wird, stellen Sie bitte 25-50 Seiten aus dieser Sammlung zur Verfügung.
- Die Bilder können handgeschriebenen oder gedruckten Text enthalten.
- Zur Verfügung gestellte Bilder müssen frei verwendbar sein.
- Senden Sie Ihre Bilder per WeTransfer oder einer ähnlichen File-Sharing-Site.
Um Ihre Bilder zu senden oder weitere Informationen anzufordern, wenden Sie sich an:
- Hervé Déjean bei Naver Labs Europe (herve.dejean@naverlabs.com)
- Eva Lang im Diözesanarchiv Passau (Eva.Lang@bistum-passau.de)
- Florian Kleber an der Technischen Universität Wien (kleber@cvl.tuwien.ac.at)
Vielen Dank im Voraus für Ihre Hilfe!