So exportieren Sie Dokumente aus Transkribus

So exportieren Sie Dokumente aus Transkribus

Exportieren
Transkribus Expert Client
Letzte Aktualisierung Vor 1 Jahr
Über Transkribus

Transkribus ist eine umfassende Lösung für die Digitalisierung, KI-gestützte Texterkennung, Transkription und Suche von historischen Dokumenten. Erfahren Sie mehr über Transkribus hier erläutert

Transkribus ist eine umfassende Lösung für die Digitalisierung, KI-gestützte Texterkennung, Transkription und Suche von historischen Dokumenten. Erfahren Sie mehr über Transkribus hier erläutert

Inhaltsverzeichnis

Inhaltsverzeichnis

Diese Anleitung erklärt, wie Sie Ihre Dokumente aus Transkribus exportieren können. Sie ermöglicht es Ihnen, Ihren Export entsprechend dem von Ihnen bevorzugten Dateiformat und den Optionen anzupassen.

Einführung

  • Wenn Sie mit Ihren Bildern und Transkriptionen außerhalb von Transkribus arbeiten möchten, können Sie Ihre Dokumente aus der Plattform exportieren.
  • Es stehen verschiedene Exportformate und -funktionen zur Verfügung, um Ihren Anforderungen gerecht zu werden.

Exportfunktion

  • Um die Exportfunktion zu nutzen, klicken Sie auf dieses Symbol:

Abbildung 1 Schaltfläche "Export document"

  • Es öffnet sich das folgende Fenster. Sie sehen, dass es zwei Registerkarten gibt, die Client-Export und Server-Export anbieten.
  • Wenn Sie die Option Server-Export wählen, wird der Export auf dem Transkribus-Server verarbeitet und Sie erhalten einen Link zum Herunterladen Ihrer Dateien. Der Export verlangsamt Ihren Computer nicht und der Vorgang wird nicht unterbrochen, wenn Sie Ihren Computer ausschalten.
  • Beim Client-Export werden die Dateien direkt auf Ihrem Computer gespeichert.

Abbildung 2 Fenster "Export document"

Esportazione dal Server

Abbildung 3 Server-Export

  • Klicken Sie auf die Export-Registerkarte "Server", geben Sie die gewünschten Optionen ein und klicken Sie auf OK.
  • Sie können den Fortschritt Ihres Exports überprüfen, indem Sie auf die Schaltfläche "Jobs" in der Registerkarte "Server" klicken.

Abbildung 4 Klicken Sie auf die Schaltfläche "Jobs", um den Fortschritt des Exports zu überprüfen

  • Nach Abschluss des Vorgangs erhalten Sie eine E-Mail mit dem Link zum Herunterladen der Dateien. Wenn Sie die Dateien an eine andere Person weitergeben möchten, können Sie die E-Mail an diese Person weiterleiten.
  • Hinweis: Der Rest dieses Handbuchs konzentriert sich auf den Client-Export. Alle im Folgenden besprochenen Optionen sind auch beim Server-Export verfügbar.

Client-Export

  • Klicken Sie auf die Registerkarte "Client-Export" und geben Sie die unten stehenden Optionen ein:

Speicherort

Wählen Sie bitte zunächst aus, wo Sie die exportierten Dateien speichern möchten. Geben Sie den Dateispeicherort in das Feld "Base folder" oben im Fenster "Export document" ein.

Abbildung 5 Speicherort der Datei angeben

Zu exportierende Seiten

  • Wählen Sie die Anzahl der Seiten, die Sie exportieren möchten. Sie können alle Seiten in Ihrem Dokument oder nur die aktuelle Seite exportieren.

Abbildung 6 Wählen Sie die Seiten, die Sie exportieren möchten

Exportieren als Transkribus-Dokument

Abbildung 7 Export als Transkribus-Dokument

  • Wenn Sie Ihre Transkription als Transkribus-Dokument exportieren, erzeugen Sie eine METS-Datei (Metadata Encoding and Transmission Standard), die die Links zu PAGE-, XML-, ALTO- und/oder Bilddateien enthält, je nachdem, welche Optionen Sie wählen. Eine METS-Datei ist wie ein Container, der alle Hintergrundinformationen zu einer Datei enthält. Nähere Informationen zu METS finden Sie unter: http://www.loc.gov/standards/mets/

ALTO

Abbildung 8 Export als ALTO-Dokument

  • ALTO ist ein spezielles Ausgabeformat, das es Ihnen ermöglicht, das exportierte Dokument in andere Programme einzugeben, die mit diesem Format arbeiten. Das Format ist ähnlich wie XML und funktioniert z. B. für OCR. Es wird oft in Kombination mit METS für die Beschreibung des gesamten digitalisierten Objekts und die Erstellung von Referenzen über die ALTO-Dateien hinweg verwendet, z. B. für die Beschreibung der Lesereihenfolge. Weitere Informationen zu ALTO finden Sie unter: http://www.loc.gov/standards/alto/
  • Mit der Option "Word Level" unterteilt Transkribus die Zeilen in Wörter. Das Programm tut dies, indem es die Zwischenräume zwischen den Wörtern analysiert, auch wenn zuvor keine Wortsegmentierung durchgeführt wurde.

Filename pattern

Abbildung 9 Filename pattern

  • Unter "FIlename pattern" können Sie wählen, wie der Dateiname zusammengesetzt sein soll.
  • Hinweis: Die zweite Option "filename" ist die Standardoption. Mit dieser Option wird die exportierte Datei den gleichen Namen haben wie das Dokument, das Sie importiert haben. Dies ist wichtig, wenn Sie lokale Transkripte mit den Bildern in Transkribus abgleichen wollen. Wenn Sie also ein Dokument exportieren, es dann extern anpassen und danach wieder in Transkribus hochladen, benötigt das Programm zwei ähnliche Dateinamen, um die Datei richtig zu erkennen.

Als PDF exportieren

Abbildung 10 Exportieren als PDF

  • Wenn Sie eine PDF-Datei exportieren, können Sie zwischen "Images only" oder "Images plus text layer" wählen
    • "Images only": Sie erzeugen eine PDF-Datei mit dem Dokument als Bild. Das bedeutet, dass Sie den transkribierten Text nicht sehen werden.

Abbildung 11 Exportiertes PDF-Dokument

  • "Images plus text layer": Sie werden im exportierten PDF-Dokument zwei Ebenen sehen: OCR (der transkribierte Text) und Image (Bild des Dokuments).

Abbildung 12 Ebenen im exportierten PDF

  • "Extra text pages": wenn Sie in der exportierten PDF-Datei nach unten blättern, erscheint der transkribierte Text nach dem Bild.
  • "Highlight tags": Mit dieser Option werden alle Tags in Ihrer Transkription hervorgehoben. Die Markierungen werden in denselben Farben dargestellt, die auch in Transkribus verwendet werden. Am Ende des Dokuments wird zusätzlich eine Symbollegende eingeblendet, die die Bedeutung der verschiedenen Farben erklärt.

Exportieren als TEI

Abbildung 13 Export als TEI

Exportieren als DOCX

Abbildung 14 Exportieren als DOCX

  • Wenn Sie diese Option wählen, erhalten Sie Ihre Transkriptionen in Word-Dateien.
  • Sie können Optionen zu Zeilenumbrüchen, Abkürzungen und mehr nach Ihren Bedürfnissen auswählen.

Export als einfache TXT

  • Wenn Sie normalerweise nicht mit Microsoft Word arbeiten, ist es möglich, Ihre Transkription als einfache TXT-Datei zu exportieren.

Abbildung 15 Export als TXT

Tag Export

Wenn Sie die Tags, die Sie Ihrer Transkription zugewiesen haben, exportieren möchten, gibt es drei mögliche Optionen:

Excel-Datei: Wählen Sie diese Option, um eine Excel-Datei mit einzelnen Registerkarten für jede Tag-Kategorie und einer Registerkarte mit einer Übersicht über alle Tags zu erstellen.

Abbildung 16 Tag-Export Excel

PDF-Datei: wählen Sie diese Optionen, um die Tags in der exportierten PDF-Datei hervorzuheben.

Abbildung 17 Tag-Export PDF

DOCX-Datei: wählen Sie diese Optionen, damit die Tags in der exportierten DOCX-Datei sichtbar sind.

Abbildung 18 Tag Export DOCX

  • Nach dem Export des Word-Dokuments öffnen Sie es bitte und gehen Sie wie folgt vor
    • Klicken Sie im Home-Menü von Word auf die Schaltfläche Absatz.

Abbildung 19 Schaltfläche Absatz in Word

  • Gehen Sie dann auf "Referenzen" und wählen Sie "Index einfügen".

Abbildung 20 Index in Word einfügen

  • Es öffnet sich das folgende Office-Fenster:

Abbildung 21 Indexoptionen in Word

  • Wählen Sie "Seitenzahlen rechts ausrichten" und drücken Sie "OK".
  • Es wird ein Bestätigungsfenster angezeigt, klicken Sie auf "Ja".

Abbildung 22 Bestätigen in Word

  • Am Ende des Dokuments sollte nun eine Übersicht über die Tags erscheinen
  • Wenn die Übersicht der Tags nicht erscheint, klicken Sie auf "Index aktualisieren". Dies sollte das Problem lösen.

Abbildung 23 "Index aktualisieren" in Word

Tabellenexport in Excel

Informationen zum Export von Tabellen finden Sie unter So bearbeiten Sie Tabellen in Transkribus.

Mehr Optionen

Es gibt noch ein paar andere Exportoptionen, die Sie erkunden können.

Alle Formate exportieren

  • Das bedeutet, dass die Transkription am gewählten Speicherort in allen verfügbaren Formaten gespeichert wird.
  • Wenn Sie "ALLE Formate exportieren" wählen, werden alle Optionen werden automatisch angekreuzt

Abbildung 24 Alle Formate exportieren

Verwenden Sie den Versionsfilter

Abbildung 25 Auswählen des Versionsstatus

  • Diese Option ermöglicht es, bestimmte Versionen des Dokuments zu exportieren.
  • Wenn Sie z.B. "Ground Truth" auswählen, wird Transkribus nur die Seiten des Dokuments exportieren, die Sie als "Ground Truth" markiert haben
  • Für den Export zieht das Programm frühere Versionen Ihres Dokuments heran. Das heißt, wenn Sie alle "In Progress"-Seiten exportieren möchten, exportiert das Programm alle Seiten, die als "In Progress" markiert waren, auch wenn ihr Status jetzt aktualisiert ist.
  • Das Programm exportiert die letzte "In Progress"-Version Ihres Dokuments.
  • Wenn Sie eine bestimmte ehemalige "In Progress"-Version Ihrer Seite exportieren möchten, öffnen Sie diese Version der Seite in Transkribus. Öffnen Sie das Exportfenster und wählen Sie "Loaded version for current page". In der Option "Pages" wählen Sie vor dem Bestätigen "Current".

Abbildung 26 Geladene Version exportieren (für aktuelle Seite)

Schwärzen

  • Wenn Sie sensible Abschnitte Ihrer Transkription geschwärzt haben, können diese Wörter oder Phrasen auch in den exportierten Dateien ausgeblendet werden.
  • Wählen Sie dazu in den Exportoptionen die Option "Do blackening".
  • Hinweis: diese Option funktioniert nur für Word-, PDF- und METS-Dateien.

Titelseite erstellen

  • Transkribus bietet die Möglichkeit, eine Titelseite zu erstellen. Die Seite basiert auf den Informationen, die im Reiter "Document" innerhalb der Registerkarte "Metadata" hinzugefügt wurden.
  • In der Registerkarte "Document" können Sie Informationen über den Titel, den Autor, die Sprache und das Datum Ihres Dokuments hinzufügen. Sie können auch eine Redaktionserklärung erstellen, um zu erklären, wie genau Ihr Dokument transkribiert wurde. Mehr zur Redaktionserklärung finden Sie unter So reichern Sie transkribierte Dokumente mit Markup an.

Abbildung 27 Informationen für die Titelseite

  • Diese Informationen werden in Ihre Titelseite aufgenommen, wie in der folgenden Abbildung zu sehen ist.

Abbildung 28 Titelseite

Danksagung

Wir möchten uns bei den vielen Anwender*innen bedanken, die mit ihrem Feedback zur Verbesserung der Transkribus-Software beigetragen haben.