So verwenden Sie Transkribus in 10 Schritten

So verwenden Sie Transkribus in 10 Schritten

Grundlegende Übersicht
Transkribus Expert Client
Letzte Aktualisierung Vor 5 Monaten
Über Transkribus

Transkribus ist eine umfassende Lösung für die Digitalisierung, KI-gestützte Texterkennung, Transkription und Suche von historischen Dokumenten. Erfahren Sie mehr über Transkribus hier erläutert

Transkribus ist eine umfassende Lösung für die Digitalisierung, KI-gestützte Texterkennung, Transkription und Suche von historischen Dokumenten. Erfahren Sie mehr über Transkribus hier erläutert

Inhaltsverzeichnis

Inhaltsverzeichnis

Dieses Dokument ist eine grundlegende Einführung in Transkribus. Es bietet einen einfachen Standard-Workflow für die Arbeit mit der Plattform. Wenn Sie eine ausführlichere Anleitung zu den Funktionen von Transkribus benötigen, schauen Sie bitte in unsere anderen Anleitungen.

1 - Einleitung

Transkribus kann für mehrere Zwecke verwendet werden. Die wichtigsten sind:

  • Das Transkribieren von Dokumenten für eine wissenschaftliche Edition
  • Das Erstellen von Trainingsdaten, um sie in das Handwritten-Text-Recognition- -System zu speisen, damit es lernen kann, Ihre historischen Dokumente zu entziffern.
  • Wenden Sie die HTR+ auf Ihre Dokumente an und erhalten Sie automatisch generierte Transkripte.
  • Suchen Sie nach bestimmten Wörtern in Ihren Dokumentensammlungen.
  • Die Plattform lebt von der Community. Je mehr Daten auf Transkribus hochgeladen werden, desto leistungsfähiger wird das Programm und insbesondere die Handschrifterkennung

Transkribus ist eine Forschungsinfrastruktur, die im Rahmen des H2020-Projektst READ (Erkennung und Anreicherung von Archivdokumenten).

Nehmen Sie sich etwas Zeit, um Transkribus zu erkunden und sich mit seiner Funktionsweise vertraut zu machen. Um Ihnen die Arbeit zu erleichtern, haben wir mehrere Leitfäden erstellt, die Ihnen die verschiedenen Funktionen der Plattform erklären. Sie finden diese in unserer Ressourcenbasis.

2 - Um Transkribus zu nutzen - registrieren Sie sich auf der Website

  • Gehen Sie auf unsere Transkribus-Seite
  • Lesen und akzeptieren Sie unsere Geschäftsbedingungen und unsere Datenschutzrichtlinien.
  • Alle auf Transkribus hochgeladenen Dokumente sind "privat", d.h. niemand außer Ihnen hat Zugriff darauf.
  • Das Transkribus-Team unterstützt voll und ganz alle EU-Richtlinien zum Datenschutz und zur Privatsphäre. Wir werden Ihre Privatsphäre respektieren und die Daten, die Sie uns geben, nur zur Verbesserung unserer Dienstleistungen und zur Unterstützung der zukünftigen Forschung in den Geisteswissenschaften und der Informatik verwenden!

3 - Laden Sie Transkribus von der Website herunter

  • Gehen Sie zur Transkribus Download-Seite
  • Transkribus läuft auf Windows, MacOS und Linux. Wenn Sie Hilfe bei der Installation der Plattform benötigen, schauen Sie hier erläutert.
  • Wenn Sie MacOS verwenden, kann beim ersten Versuch, Transkribus zu öffnen, eine Fehlermeldung erscheinen. Um dies zu beheben:
    • Klicken Sie mit der rechten Maustaste auf das Track Pad, um das Kontextmenü zu öffnen und eine Sicherheitsausnahme für Transkribus hinzuzufügen.
  • Nachdem Sie Transkribus heruntergeladen haben, entpacken Sie die Datei unbedingt. Das Programm kann nicht aus der gezippten Datei gestartet werden.

4 - Öffnen Sie Transkribus

  • Starten Sie das Tool und verwenden Sie die Schaltfläche "Login" in der Registerkarte "Server".
Abbildung 1. Anmeldung
  • Sie haben Zugriff auf Ihre private Collection, die nach Ihrer E-Mail-Adresse benannt ist. Diese Collection enthält einige Testdokumente, mit denen Sie experimentieren können.
  • Sie finden sie, indem Sie auf die Schaltfläche "Collections" im Register "Server" klicken. 
Abbildung 2. Testdokumente in Ihrer Sammlung

5 - Laden Sie Ihre Dokumente hoch

  • In Transkribus können Sie mit Ihren eigenen Dokumenten arbeiten, entweder lokal oder durch Hochladen auf den Server.
  • Automatisierte Prozesse können nur durchgeführt werden, wenn die Dokumente auf die Transkribus-Plattform hochgeladen werden. Die Plattform kann PDF-, JPEG-, PNG- und TIFF-Dateien verarbeiten. JP2-Dateien werden leider nicht unterstützt.
  • Sie können Dokumente hochladen, die Sie selbst eingescannt haben. Sie können auch unsere DocScan-App für Android-Smartphones benutzen, um Bilder aufzunehmen und direkt in Transkribus hochzuladen. Für mehr Informationen: https://scantent.cvl.tuwien.ac.at/en
  • Sie können auch Dokumente aus dem Internet herunterladen und in Transkribus hochladen. Viele Bibliotheken und Archive verfolgen eine Open-Access-Politik und fördern damit die weitere Nutzung ihrer Bestände - fragen Sie Archive und Bibliotheken direkt, ob Sie Bilder ihrer Dokumente in Transkribus hochladen können!
  • Klicken Sie auf die Schaltfläche "Import document(s)", um die Bilder von Ihrem Computer auf die Plattform zu übertragen. Hinweis: Die Bilder müssen sich in einem separaten Ordner auf Ihrem Computer befinden, bevor Sie sie in Transkribus hochladen!
Abbildung 3. Laden Sie Ihre Dokumente auf Transkribus hoch
  • Sie können Ihre Dokumente zu einer Ihrer bestehenden Collections hinzufügen oder eine neue erstellen, indem Sie auf die Schaltfläche "Add to collection" unten im Feld "Document ingest/upload" und dann auf "Create" klicken.
Abbildung 4. Dokumente zu einer der bestehenden Sammlungen hinzufügen oder eine neue Sammlung erstellen
Abbildung 5. Erstellen Sie Ihre eigene Sammlung
  • Um auf Ihre Dokumente zuzugreifen, klicken Sie in der Registerkarte "Server" auf die Schaltfläche "Collections" und wählen Sie Ihre Collection aus. Doppelklicken Sie dann auf die Dokumente in der Box unten auf der Registerkarte "Server", um sie zu öffnen.
Abbildung 6. Öffnen Sie die Dokumente in Ihrer Sammlung
  • Alle auf Transkribus hochgeladenen Dokumente sind standardmäßig privat. Sie können anderen Benutzer*innen die Berechtigung erteilen, Ihre Dokumente anzusehen, wenn Sie dies wünschen. Verwenden Sie die Schaltfläche "User Manager" im Register "Server", um Benutzer*innen zu Ihrer Collection hinzuzufügen. Sie können Collections nur mit Benutzer*innen teilen, die ein Transkribus-Konto haben.
Abbildung 7. Schaltfläche "Benutzerverwaltung" zur Verwaltung des Zugriffs auf Ihre Sammlung

6 - Segmentieren Sie Ihre Dokumente in Zeilen

  • Um die HTR-Engine mit Trainingsdaten zu füttern, müssen Ihre Dokumente in Zeilen segmentiert werden. Dies kann in Transkribus automatisch erfolgen.
  • Öffnen Sie die Registerkarte "Werkzeuge" und gehen Sie zum Abschnitt "Layoutanalyse".
  • Sie können wählen, ob Sie die aktuelle Seite oder mehrere Seiten segmentieren möchten.
  • Vergewissern Sie sich, dass "Find Text Regions" ausgewählt ist, und klicken Sie auf "Run".
  • Die Zeilen und Textregionen in Ihrem Dokument werden automatisch erkannt.
  • Wenn keine oder nur wenige Zeilen erkannt werden, Ihre Bilder eine geringe Auflösung haben oder zu viele Textbereiche erstellt wurden, lesen Sie hier erläutert wie Sie die Einstellungen für die Layoutanalyse konfigurieren, um bessere Ergebnisse zu erzielen.
Abbildung 8. Layout-Analyse

7 - Starten Sie die Transkription

  • Sobald die Grundlinien in Ihrem Bild sichtbar sind, können Sie Text in das Texteditor-Feld schreiben.
  • Für jede Basislinie wird es eine entsprechende Zeile im Texteditor geben. Schreiben Sie den Text Zeile für Zeile genau so ab, wie er auf dem Bild erscheint.
Abbildung 9. Transkription
  • Sonderzeichen finden sich in der "Virtuellen Tastatur" in der Symbolleiste Formatierung unter dem Texteditor.
Abbildung 10. "Schaltfläche "Virtuelle Tastaturen
Abbildung 11. Virtuelle Tastaturen
  • Wenn Sie in einem Team arbeiten, ist es vielleicht einfacher, die Transkription in die Browser-Version von Transkribus, Transkribus Lite.

8 - Speichern und exportieren Sie die Transkription

Abbildung 12. Speichern der Änderungen in Ihrem Dokument

  • Drücken Sie die Schaltfläche "Save" im Hauptmenü, um das Dokument in Transkribus zu speichern.
  • Wenn Sie in der Registerkarte "Server" auf die Schaltfläche "Versions" klicken, sehen Sie, dass eine neue Version erstellt worden ist. Das bedeutet, dass Sie bei Bedarf immer auf frühere Versionen eines Dokuments zugreifen können.
Abbildung 13. Klicken Sie auf die Schaltfläche "Versionen", um auf frühere Versionen Ihres Dokuments zuzugreifen
  • Sie können auch das gesamte Dokument exportieren an jeder Stelle des Prozesses durch Klicken auf die Schaltfläche "Dokument exportieren".
Abbildung 14. "Schaltfläche "Dokument exportieren

9 - Verwenden Sie die Handschrifterkennung (HTR) für Ihre Dokumente

  • Es ist einfach, Ihre Dokumente vom Computer erkennen zu lassen. Sie können eine der öffentliche Modelle die von der Transkribus-Gemeinschaft zur Verfügung gestellt werden, oder Sie können Ihr eigenes Modell trainieren: Dazu benötigen Sie etwa 5.000 transkribierte Wörter eines gedruckten Textes oder 15.000 Wörter eines handgeschriebenen Textes.
  • Sobald ein HTR-Modell für Ihre Dokumente trainiert wurde, kann es über die Schaltfläche "Run" im Bereich "Text Recognition" auf der Registerkarte "Tools" angewendet werden. Sie können eine oder mehrere Seiten Ihrer Dokumente auswählen und die Erkennung starten.
Abbildung 15. Handschriftliche Texterkennung ausführen
Abbildung 16. Modellübersicht und Lernkurve
  • Wenn Sie auf "Run" und dann auf "Select HTR model" klicken, können Sie das Modell für die Erkennung auswählen und weitere Informationen darüber erhalten.
  • Auf der linken Seite des Fensters sehen Sie eine Übersicht über die verfügbaren Modelle.
  • Auf der rechten oberen Seite des Fensters werden die Details des Modells angezeigt.
  • Die Grafik unten rechts zeigt die Genauigkeit Ihres Modells mit der Zeichenfehlerrate (CER), d.h. dem Prozentsatz der Zeichen, die von HTR falsch transkribiert wurden. Die blaue Linie stellt den Fortschritt des Trainings dar. Die rote Linie stellt den Fortschritt der Auswertungen auf dem Testdatensatz dar, der während des Trainingsprozesses beiseite gelegt wurde.
  • Nach Abschluss des HTR erscheinen die Ergebnisse direkt in einer neuen Version Ihres Dokuments in Transkribus. Es ist möglich die Genauigkeit der automatischen Transkription mit der "Compute Accuracy"-Funktion in der Registerkarte "Tools" zu bewerten.

10 – Suche auf

  • Sobald Sie das HTR-Modell auf Ihre Dokumente angewendet haben, können Sie nach bestimmten Begriffen suchen.
  • Öffnen Sie die Suchfunktion mit der in Abbildung 18 gezeigten Schaltfläche "Fernglas".
Abbildung 18. Öffnen Sie das Fenster "Suchen nach...".
  • In dem sich öffnenden Fenster wählen Sie die Registerkarte "Volltext (Sorl)".
  • Geben Sie einfach das Wort ein, das Sie suchen möchten, und drücken Sie auf die Schaltfläche "Suchen".
  • Die Ergebnisse werden unten angezeigt: Wenn Sie mit dem Mauszeiger über ein Ergebnis fahren, sehen Sie die Wortvorschau; wenn Sie auf ein Ergebnis doppelklicken, öffnet sich die Seite, die es enthält, im Hintergrund.
  • Sie können auch die Option "Unscharfe Suche" aktivieren: Bei der unscharfen Suche handelt es sich um eine Suchtechnik, die es ermöglicht, neben den exakten Übereinstimmungen mit dem Suchbegriff auch ähnliche Wörter zu finden. Dies kann nützlich sein, wenn alternative Schreibweisen plausibel sind.
Abbildung 19. Volltextsuche

Danksagung

Wir möchten uns bei den vielen Anwender*innen bedanken, die mit ihrem Feedback zur Verbesserung der Transkribus-Software beigetragen haben.

Transkribus und die dahinter stehende Technologie werden über die folgenden Projekte und Seiten zur Verfügung gestellt:

Kontakt

http://transcriptorium.eu/figs/jaune.jpg

Die Transkribus-Plattform wird zur Verfügung gestellt von der Europäischen Genossenschaft READ-COOP SCE.

Bis Juni 2019 wurde Transkribus im Rahmen des Horizon 2020 READ-Projekts unter der Fördervereinbarung Nr. 674943 finanziert.