Hilfe

Sie können uns unter info@readcoop.eu erreichen.

Laden Sie zunächst das Transkribus-Tool von unserer Website oder uns Transkribus lite in Ihrem Browser. Werfen Sie als nächstes einen Blick auf unser Anleitungen um einen Überblick über das Arbeiten mit Dokumenten in Transkribus zu erhalten.

Download & Installation

Alles, was Sie über den Download und die Installation von Transkribus wissen müssen, finden Sie hier hier.

  • Transkribus ist in der Haupt-Jar-Datei Transkribus-.jar enthalten
  • Um das Programm von der Kommandozeile aus zu starten, geben Sie ein: java -jar Transkribus-.jar
  • Hinweis: Java 8 wird benötigt um das Programm auszuführen. Stellen Sie sicher, dass Java 8 entweder systemweit installiert ist oder kopieren Sie eine JRE in das Programmverzeichnis!
    • Java 9 und 10 werden nicht unterstützt! Falls bereits auf Ihrem System installiert, kopieren Sie bitte eine Java 8 JRE (von https://java.com/de/download/manual.jsp#win) in das Transkribus-Paket (=der entpackte Installationsordner mit der Anwendungs-Exe). Auf diese Weise übernimmt das Programm das Java von dort, ohne es auf dem Rechner installiert zu haben. Hinweis: Bitte benennen Sie den Ordner in 'jre' um - nur dann wird er auch gefunden!!!
    • Einige Probleme (hauptsächlich Java-Heap-Space) treten auf, weil eine Java-32-Bit-Version auf einem 64-Bit-Betriebssystem installiert ist. Bitte prüfen!"
  • Hinweis: Um die Skripte unter Mac (oder Linux) auszuführen, müssen Sie sie eventuell über die Kommandozeile ausführbar machen: (jede Version vor 0.6.8)
    • Grundlagen der Mac-Konsole
    • Wechseln Sie mit 'cd'-Befehlen in den Programmordner
    • chmod +x Transkribus.command (oder chmod +x Transkribus.sh für Linux!)
  • Außerdem finden Sie im Transkribus-Paket einige Dateien, die auf Ihren Computer kopiert wurden:
    • config.properties kann geändert werden, um einfache Eigenschaften des Erscheinungsbildes anzupassen
    • virtualKeyboards.xml kann verwendet werden, um einen Satz virtueller Tastaturen festzulegen
    • logback.xml kann geändert werden, um die Logging-Eigenschaften anzupassen (nur für erfahrene Benutzer)
  • Der Unterordner "libs" enthält die notwendigen Bibliotheken für alle Plattformen. Derzeit werden unterstützt:
    • Windows 32/64 Bit
    • Linux 32/64 Bit
    • OSX 64 Bit

Wenn Sie auf mysteriöse Fehlermeldungen wie "already connected" stoßen, ist vielleicht Ihr Java nicht auf dem neuesten Stand. Bitte versuchen Sie, Java zu aktualisieren (https://www.java.com/de/download/) und versuchen Sie es erneut.

Für Mac-Anwender - wenn die integrierte Java-Version veraltet ist, versuchen Sie, die neueste Version von Transkribus von unserer Homepage herunterzuladen und die komplette Installation auf Ihrem Computer zu ersetzen.

Pro-Tipp: Die Mac-Version des Expert-Clients wird mit einem Java ausgeliefert, das in der Anwendung enthalten ist. Wenn diese Java-Version veraltet ist, können Sie versuchen, sie zu löschen oder durch eine aktualisierte Version zu ersetzen. Um die Dateien im Mac-Finder zu finden, klicken Sie mit der rechten Maustaste (oder cmd-Klick) auf die Transkribus-Anwendung in der Programmansicht, klicken im Kontextmenü auf "Paketinhalt anzeigen" und gehen dann in den Unterordner "Inhalt/MacOS". Dort befindet sich im Unterordner "jre" diese Java-Version. Wenn Sie diesen Ordner löschen, wird der Applikationsstarter versuchen, java auf Ihrem System zu finden].

  • Nach dem Öffnen der Befehlsdatei auf dem Mac meldet Transkribus, dass eine falsche Java-Version (1.6.0.65) statt 1.7 installiert ist. Es ist jedoch die aktuellste Version von Java RE (1.8.0.66) installiert.
    • Das Problem ist, dass Java 1.6.0.65 das Standard-Java auf der Kommandozeile ist, das der Transkribus.Befehl verwendet. Sie können die Standardversion überprüfen, indem Sie das Terminal öffnen und 'java -version' eingeben.
    • Um das Problem zu lösen, können Sie entweder das neueste jdk als .tar.gz-Paket von hier herunterladen:

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

und entpacken Sie sie in den Transkribus-Ordner - die Transkribus.command-Datei prüft automatisch auf Java-Installationen in ihren Unterverzeichnissen!

  • Oder Sie können Ihre Java 8-Installation auf der Kommandozeile zur Standard-Installation machen, indem Sie z.B. der Anleitung hier folgen:

http://myshittycode.com/2014/03/17/mac-os-x-setting-default-java-version/

Das Paket "libwebkitgtk" ist möglicherweise nicht installiert. Unter Fedora können Sie das Paket mit dnf auf der Kommandozeile installieren (verwenden Sie "yum" statt "dnf" in älteren Versionen von Fedora):

sudo dnf install webkitgtk

Wenn Sie nicht wissen, ob Sie einen Proxy-Server verwenden müssen, und Sie beim Versuch, sich anzumelden, die Fehlermeldung "Login failed: already connected" erhalten, dann ist das höchstwahrscheinlich der Hinweis darauf.

  • Wenn das Programm gestartet ist, klicken Sie auf die Home-Menü-Schaltfläche oben links und wählen Sie "Proxy-Einstellungen...". Im folgenden Dialog können Sie den Proxy-Host, den Port, den Benutzernamen (optional) und das Passwort (optional) einstellen. Dies ist die empfohlene Methode zur Verwendung eines Proxyservers.
  • Alternativ können Sie das Startskript (z. B. Transkribus.bat unter Windows, Transkribus.sh unter Linux) so bearbeiten, dass es die Umgebungsvariablen für den Proxy-Server enthält:

java -Dhttps.proxyHost=

-Dhttps.proxyPort=

-Dhttps.proxyUser=

-Dhttps.proxyPassword=

-jar Transkribus-0.7.0.jar

Die Bearbeitung dieser Datei ist jedoch bei jedem Update von Transkribus erforderlich.

Die Anmeldung am Server ist über Transkribus nicht möglich, aber auf der Website funktioniert es.

  • Fehlermeldung "Already connected": Ihre Java-Installation ist möglicherweise veraltet und kann keine sichere Verbindung zum Server herstellen. Sie können Ihre installierte Version überprüfen, indem Sie ein Terminal/eine Kommandozeile öffnen und "java -version" eingeben. Wenn dieses Problem auftritt, versuchen Sie, Java auf Ihrem Rechner zu aktualisieren. Wir empfehlen eine aktuelle Version von Java 8 (Oracle oder OpenJdk). Die Mac-Version von Transkribus enthält eine Java-Laufzeitumgebung. Wenn Sie dieses Problem auf einem Mac haben, laden Sie bitte ein neues Paket von https://transkribus.eu und aktualisieren Sie Ihre Installation. Wenn der Fehler weiterhin besteht, wenden Sie sich bitte an info@readcoop.eu, idealerweise mit der Log-Datei Ihrer Installation (aus dem Transkribus-Verzeichnis: logs/TrpGui.log) und/oder Angaben zu Ihrer Java-Version und Ihrem Betriebssystem.
  • Seit Februar 2017 werden alte Transkribus-Versionen aus Kompatibilitätsgründen für das Einloggen gesperrt. Wenn Sie eine Version älter als 1.0.0 verwenden, kann ein Update der Anwendung notwendig sein, um dieses Problem zu lösen.
  • Eventuell müssen Sie einen Proxyserver über 'Hauptmenü' - 'Proxy-Einstellungen' konfigurieren.

Java Heap-Speicher / Keine Handles mehr

  • 32-Bit-Java auf einem 64-Bit-Windows-Betriebssystem -> installieren Sie 64-Bit-Java von hier: https://java.com/de/download/manual.jsp#win
  • Zu wenig RAM: Versuchen Sie, mehr Hauptspeicher zu allokieren, indem Sie Transkribus.bat öffnen und z. B. java -Xmx2048m -jar Transkribus-1.5.4.jar einstellen.
    • Starten Sie Transkribus mit dieser Bat-Datei

Einloggen wird durch die Firewall Ihres Internet-Providers verhindert

  • Einige IT-Abteilungen blockieren den SSL-Port 443 und/oder unbekannte Anwendungen über eine Firewall. Erkundigen Sie sich bei Ihrer IT-Abteilung, ob dies der Fall sein könnte.

Norton Antivirus erkennt eine Bedrohung und blockiert das Entpacken der Zip-Datei.

  • Lösung: Dies ist ein Fehlalarm, den Norton auslöst, wenn es auf Software trifft, die es nicht kennt (WS.Reputation.1). Sie sollten in der Lage sein, die Datei aus der Quarantäne wiederherzustellen, indem Sie die Anweisungen aus der folgenden Ressource befolgen [1].

Versionen älter oder gleich 0.6.5 können nicht aktualisiert werden (sehr lange Fehlermeldung):

  • Bitte klicken Sie auf die Schaltfläche "Home" (oben links), dann auf "Eine bestimmte Version installieren", wählen Sie unter "Releases" die neueste Version aus und setzen Sie das Häkchen neben "Komplettpaket herunterladen".
  • Klicken Sie anschließend auf "Aktualisieren" oder "Ersetzen". Auf diese Weise wird das komplette Paket heruntergeladen und das Update sollte funktionieren.

Auf neueren MacBooks (ab 2016) scheint es ein Problem zu geben, wenn Transkribus direkt aus dem Downloads-Ordner gestartet wird - versuchen Sie, das Programm in einen Ordner zu kopieren, in dem Sie volle Systemrechte haben (z.B. den Programme-Ordner) und starten Sie es von dort

Sollten Ihre Startprobleme weiterhin bestehen, finden Sie hier eine Umgehung, um die App von Ihrem Terminal aus zu starten

Handschriftliche Texterkennung (HTR) Workflow

Unser langfristiges Ziel ist es, so viele verschiedene Schreibstile zu trainieren, dass Transkribus mit den meisten handschriftlichen Dokumenten ohne vorheriges Training umgehen kann. Je mehr Anwender mit Transkribus für ihre Transkription arbeiten, desto schneller werden wir dieses ehrgeizige Ziel erreichen!

Ja, wir haben jetzt ein Text2Image-Matching-Tool, das vorhandenen Text mit einem Bild abgleichen kann. Wenn Sie viele vorhandene Transkripte haben und diese zum Trainieren eines HTR-Modells verwenden möchten, wenden Sie sich bitte an konsultieren Sie unseren How to Guide.

Nein! Auf Transkribus hochgeladene Dokumente sind standardmäßig privat. Über die Schaltfläche "Sammlungen verwalten..." im Reiter "Server" von Transkribus können Sie bestimmten Benutzern die Ansicht und/oder Bearbeitung Ihrer Sammlung erlauben, wenn Sie dies wünschen.

Theoretisch, ja! Die Software muss trainiert werden, um jede Art von Handschrift zu verstehen. Jedes Stück Trainingsdaten, das an Transkribus übermittelt wird, hilft, die Gesamtgenauigkeit des HTR zu stärken.

Beide Technologien sind sich sehr ähnlich, aber OCR ist bereits in einem fortgeschrittenen Stadium, während sich HTR noch in einer frühen Phase befindet. Anders als OCR konzentriert sich HTR nicht auf einzelne Buchstaben. Stattdessen scannt und verarbeitet es das Bild ganzer Zeilen und versucht, diese Daten zu entschlüsseln. Der Hauptunterschied aus Sicht des Anwenders besteht darin, dass die Stufe der Layout-Analyse/Segmentierung in die OCR-Engine integriert ist, während sie bei HTR ein separater Schritt im Workflow ist.

Die Genauigkeit von HTR ist nicht vollständig, aber beeindruckende Wort- und Zeichenfehlerraten sind möglich. Die neuesten Experimente haben Transkripte mit einer Zeichenfehlerrate von etwa 5% erzeugt. Das bedeutet, dass 95% der Zeichen in einem automatisch generierten Transkript korrekt wären. Für einige erfolgreiche Beispiele von HTR, schauen Sie sich unsere Beispiel-Dokumente oder unser Erfolgsgeschichten aus dem Blog des READ-Projekts. Sie können die Genauigkeit Ihres HTR-Modells in Transkribus mit der Funktion "Vergleichen" im Reiter "Werkzeuge" messen.

Sie können Ihr HTR-Modell verwenden, um automatisch Transkripte Ihrer Dokumente zu erzeugen, indem Sie in Transkribus auf die Schaltfläche "Texterkennung ausführen" im Reiter "Werkzeuge" klicken. Sie können Ihre Dokumente exportieren und in Transkribus suchen, indem Sie im Hauptmenü auf die Schaltfläche "Suchen" klicken. Sie können Ihre Dokumente jetzt auch mit unserem neuen Keyword-Spotting-Tool durchsuchen.

Sie sollten dann das Transkribus-Team per E-Mail kontaktieren info@readcoop.eu. Sie können die Trainingstaste in Transkribus für Sie aktivieren. Auf diese Weise können Sie ein HTR-Modell erstellen, das spezifisch für die Sammlung von Dokumenten ist, mit denen Sie in Transkribus gearbeitet haben. Erfahren Sie mehr in unserem How to Guide

Je mehr Trainingsdaten, desto besser! Aber schon mit 75 Seiten (15.000 Wörtern) sauber geschriebener Dokumente können Sie beginnen, den HTR zu trainieren.

Erstens müssen Sie Ihre Dokumente auf die Plattform hochladen. Zweitens müssen Sie die Seiten Ihrer Sammlung in Textbereiche und Grundlinien segmentieren. Drittens müssen Sie jede Seite so genau wie möglich transkribieren. Weitere Informationen zu diesen Schritten finden Sie in unserem Anleitungen.

HTR-Engines können Text nicht sofort verarbeiten - sie müssen darauf trainiert werden, eine bestimmte Art von Handschrift zu erkennen. Dies kann erreicht werden, indem mindestens 75 Seiten (15.000) an Trainingsdaten (Bilder und Transkripte) in Transkribus erstellt werden.