Ottenere aiuto
Come posso contattare il team di Transkribus?
Puoi contattarci a info@readcoop.eu.
Sono nuovo su Transkribus. Da dove posso cominciare?
Per prima cosa, scarica il programma Transkribus dal nostro sito web o usa Transkribus lite nel tuo Browser. Poi, dai un'occhiata alle nostre guide pratiche per l'uso per ottenere una panoramica su come lavorare con i documenti in Transkribus.
Scaricamento e installazione
Come scaricare e installare
Tutto quello che devi sapere sul download e l'installazione di Transkribus lo puoi trovare qui.
Eseguire Transkribus tramite la riga di comando
- Transkribus è contenuto nel file jar principale Transkribus-.jar
- Per eseguire il programma dalla riga di comando digitare: java -jar Transkribus-.jar
- Nota: è necessario Java 8 per eseguire il programma. Assicurati che Java 8 sia installato in tutto il sistema o copia un JRE nella directory del programma!
- Java 9 e 10 non sono supportati! Se è già installato sul tuo sistema, copia un Java 8 JRE (da https://java.com/de/download/manual.jsp#win) nel pacchetto Transkribus (=la cartella di installazione decompressa con l'exe dell'applicazione). In questo modo il programma prende il Java da lì senza averlo installato sul computer. Nota: si prega di rinominare la cartella in 'jre' - solo allora può essere trovata!
- Alcuni problemi (principalmente lo spazio heap di Java) si verificano perché è installata una versione di Java a 32 bit su un sistema operativo a 64 bit. Si prega di controllare!"
- Nota: Per eseguire gli script in Mac (o Linux) è necessario renderli eseguibili dalla linea di comando: (qualsiasi versione prima della 0.6.8)
- Nozioni di base sulla console Mac
- cambiare nella cartella del programma usando i comandi 'cd'.
- chmod +x Transkribus.command (o chmod +x Transkribus.sh per Linux!)
- Inoltre troverai diversi file nel pacchetto Transkribus copiati sul tuo computer:
- config.properties può essere modificato per regolare semplici proprietà di aspetto
- virtualKeyboards.xml può essere usato per specificare un set di tastiere virtuali
- logback.xml può essere modificato per regolare le proprietà di registrazione (solo per utenti esperti)
- La sottocartella 'libs' contiene le librerie necessarie per tutte le piattaforme. Attualmente sono supportate:
- Windows 32/64 bit
- Linux 32/64 bit
- OSX 64 bit
Java non aggiornato / Già eseguito il login
Se appaiono messaggi di errore come "già connesso", forse il tuo Java non è aggiornato. Aggiorna Java (https://www.java.com/de/download/) e prova di nuovo.
Per gli utenti Mac - se la versione java integrata non è aggiornata, prova a scaricare l'ultima versione di Transkribus dalla nostra homepage e sostituisci l'installazione completa sul tuo computer.
[Suggerimento: la versione Mac dell' expert client viene fornita con un java spedito all'interno dell'applicazione. Se questa versione java è superata, puoi provare a cancellarla o sostituirla con una versione aggiornata. Per trovare i file nel finder del Mac, clicca con il tasto destro del mouse (o cmd-click) sull'applicazione Transkribus nella tua vista programmi, clicca "mostra il contenuto dei pacchetti" nel menu contestuale, poi vai alla sottocartella "Contents/MacOS". Lì, la sottocartella "jre" contiene quella versione di java. Se cancelli questa cartella, lo starter dell'applicazione cercherà di trovare java sul tuo sistema].
Versione sbagliata di JAVA su Mac
- Dopo aver aperto il file di comando sul Mac, Transkribus dice che è installata una versione sbagliata di Java (1.6.0.65) invece della 1.7. Tuttavia, è installata la versione più recente di Java RE (1.8.0.66).
- Il problema è che Java 1.6.0.65 è il Java predefinito sulla linea di comando che il comando Transkribus.command usa. Puoi controllare la versione di default aprendo il terminale e digitando 'java -version'.
- Per risolvere il problema puoi scaricare l'ultimo jdk come pacchetto .tar.gz da qui:
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
e aprendolo nella cartella Transkribus - il file Transkribus.command controllerà automaticamente le installazioni di java nelle sue sub directories!
- Oppure puoi rendere la vostra installazione di java 8 quella predefinita sulla linea di comando seguendo per esempio queste istruzioni:
http://myshittycode.com/2014/03/17/mac-os-x-setting-default-java-version/
Transkribus non si avvia su (Fedora) Linux - messaggio di errore 'MOZILLA_FIVE_HOME not set
Il pacchetto "libwebkitgtk" potrebbe non essere installato. Su Fedora puoi installare il pacchetto usando dnf sulla linea di comando (usa "yum" invece di "dnf" nelle vecchie versioni di Fedora):
sudo dnf install webkitgtk
Usare un server proxy
Se non sai se devi usare un server proxy e ottieni il messaggio di errore "Login failed: already connected" quando cerchi di accedere, allora molto probabilmente si tratta proprio di questo.
- Quando il programma si è avviato, clicca sul pulsante del menu iniziale in alto a sinistra e seleziona "Impostazioni proxy...". Nella seguente finestra di dialogo puoi impostare l'host proxy, la porta, il nome utente (opzionale) e la password (opzionale). Questo è il metodo raccomandato per usare un server proxy.
- In alternativa, puoi modificare lo script di avvio (ad esempio Transkribus.bat su Windows, Transkribus.sh su Linux) per includere le variabili di ambiente per il server proxy:
java -Dhttps.proxyHost=
-Dhttps.proxyPort=
-Dhttps.proxyUser=
-Dhttps.proxyPassword=
-jar Transkribus-0.7.0.jar
Tuttavia, la modifica di questo file sarà necessaria per ogni aggiornamento di Transkribus.
Problemi noti
Il login nel server non è possibile via Transkribus, ma sul sito web funziona.
- Messaggio di errore "Già connesso": la tua installazione di Java potrebbe essere obsoleta e non può stabilire una connessione sicura al server. Puoi controllare la tua versione installata aprendo un terminale/linea di comando e inserendo "java -version". Se riscontri questo problema, prova ad aggiornare Java sul tuo dispositivo. Raccomandiamo una versione attuale di Java 8 (Oracle o OpenJdk). La versione Mac di Transkribus include un runtime Java. Se riscontri questo problema su un Mac per favore scarica un nuovo pacchetto da https://transkribus.eu e aggiorna la tua installazione. Se l'errore persiste, contatta info@readcoop.eu, idealmente includendo il file di log della tua installazione (dalla directory di Transkribus: logs/TrpGui.log) e/o informazioni sulla tua versione di Java e sul tuo sistema operativo.
- Da febbraio 2017, le vecchie versioni di Transkribus sono bloccate per motivi di compatibilità. Se usi una versione precedente alla 1.0.0, potrebbe essere necessario un aggiornamento dell'applicazione per risolvere questo problema.
- Potrebbe essere necessario configurare un server proxy tramite "menu principale" - "Impostazioni proxy".
Spazio Heap Java / No more handles
- 32 bit Java su un sistema operativo Windows a 64 bit -> installare Java a 64 bit da qui: https://java.com/de/download/manual.jsp#win
- Troppo poca RAM: Prova ad assegnare più memoria principale aprendo Transkribus.bat e imposta ad esempio java -Xmx2048m -jar Transkribus-1.5.4.jar
- Avviare Transkribus con questo file bat
L'accesso è impedito dal Firewall del tuo Internet Provider
- Alcuni dipartimenti IT stanno bloccando la porta SSL 443 e/o applicazioni sconosciute tramite un firewall. Controlla con il tuo dipartimento IT se questo potrebbe essere il caso.
Norton Antivirus rileva una minaccia e blocca la decompressione del file zip.
- Soluzione: Questo è un falso allarme che Norton dà quando incontra un software che non conosce (WS.Reputation.1). Dovresti essere in grado di ripristinare il file dalla quarantena seguendo le istruzioni della seguente risorsa [1].
Versioni più vecchie o uguali a 0.6.5 non possono aggiornarsi (messaggio di errore molto lungo):
- Clicca sul pulsante "Home" (in alto a sinistra), poi "Installare una versione specifica", seleziona la versione più recente da "Releases" e spunta la casella accanto a "Download complete package".
- Poi clicca su "Update" o "Replace". In questo modo, il pacchetto completo viene scaricato e l'aggiornamento dovrebbe funzionare.
Problema di avvio del MacBook (Pro)
Sui MacBook più recenti (dal 2016 in poi), sembra esserci un problema quando si avvia Transkribus direttamente dalla cartella Downloads - prova a copiare l'applicazione in una cartella dove hai pieni diritti di sistema (ad esempio la cartella delle applicazioni) e avviala da lì
Se i tuoi problemi di avviamento persistono, qui puoi trovare un workaround per avviare l'app dal tuo terminale
Workflow di riconoscimento del testo scritto a mano (HTR)
In che modo Transkribus beneficia dell'uso?
Il nostro obiettivo a lungo termine è quello di addestrare così tanti stili di scrittura diversi che Transkribus sarà in grado di gestire la maggior parte dei documenti scritti a mano senza un precedente addestramento. Più utenti lavorano con Transkribus per la loro trascrizione, più velocemente raggiungeremo questo ambizioso obiettivo!
C'è un modo per usare le trascrizioni esistenti per addestrare l'HTR?
Sì, ora abbiamo uno strumento di corrispondenza Text2Image che può abbinare il testo esistente con un'immagine. Se hai molte trascrizioni esistenti e vorresti usarle per addestrare un modello HTR, ti preghiamo di consultare la nostra guida d'istruzione.
I documenti in Transkribus sono accessibili al pubblico?
No! I documenti caricati su Transkribus sono privati per impostazione predefinita. Puoi usare il pulsante "Manage collections..." nella scheda "Server" di Transkribus per permettere a specifici utenti di vedere e/o modificare la tua collezione, se lo desideri.
HTR può lavorare con documenti in qualsiasi lingua/layout/stile?
In teoria, sì! Il software deve essere addestrato per poter comprendere ogni stile di scrittura. Ogni dato di addestramento inviato a Transkribus contribuisce a rafforzare la precisione complessiva dell'HTR.
Qual è la differenza tra OCR (Optical Character Recognition) e HTR?
Le tecnologie sono molto simili, ma l'OCR è già in uno stato avanzato, mentre l'HTR è ancora in una fase iniziale. A differenza dell' OCR, l'HTR non si concentra su singole lettere. Invece, scansiona ed elabora l'immagine di intere linee e cerca di decodificare questi dati. La differenza principale dal punto di vista dell'utente è che la fase di analisi/segmentazione del layout è integrata nel motore OCR, mentre l'HTR è un passo separato nel workflow.
Quanto è preciso l'HTR?
L'accuratezza di HTR non è completa, ma sono possibili straordinari tassi di errore di parole e caratteri. Gli ultimi esperimenti hanno generato trascrizioni con un Character Error Rate di circa 5%. Questo significa che 95% dei caratteri in una trascrizione generata automaticamente sarebbero corretti. Per alcuni esempi di successo di HTR, date un'occhiata al nostro Esempi di documenti o il nostro Storie di successo dal blog del progetto READ. Puoi misurare la precisione del tuo modello HTR in Transkribus usando la funzione "Compare" nella scheda "Tools".
Una volta che ho un modello HTR per la mia collection, come lo uso?
Puoi usare il tuo modello HTR per generare automaticamente le trascrizioni dei tuoi documenti cliccando il pulsante "Run text recognition" nella scheda "Tools" in Transkribus. Puoi esportare i tuoi documenti e cercarli in Transkribus cliccando il pulsante "Search" nel menu principale. Ora puoi anche cercare i tuoi documenti usando il nostro nuovo strumento Keyword Spotting.
Una volta che ho creato un set di dati di addestramento, cosa succede?
In passato, era necessario contattare il team di Transkribus via e-mail all'indirizzo info@readcoop.eu.
Tuttavia, da qualche tempo a questa parte, il pulsante di formazione è stato attivato per tutti gli utenti di Transkribus fin dall'inizio.
In questo modo, non c'è nulla che vi ostacoli e potete iniziare immediatamente a creare un modello HTR specifico per la raccolta di documenti con cui avete lavorato in Transkribus. Scopri di più nella nostra guida d'istruzione
Quanti dati di addestramento devo creare?
Più dati di addestramento ci sono, meglio è! Ma si può iniziare ad addestrare l'HTR con appena 75 pagine (15.000 parole) di documenti scritti in modo ordinato.
Come faccio a creare dati di addestramento in Transkribus?
In primo luogo, è necessario caricare i tuoi documenti sulla piattaforma. In secondo luogo, è necessario segmentare le pagine della vostra collezione in regioni di testo (text regions) e linee di base (baselines). In terzo luogo, è necessario trascrivere ogni pagina nel modo più accurato possibile. Per maggiori informazioni su queste fasi, dai un'occhiata al nostro Guide pratiche per l'uso.
Cosa è necessario affinché l'HTR funzioni?
I motori HTR non possono elaborare il testo immediatamente - hanno bisogno di essere addestrati a riconoscere un certo stile di scrittura. Questo può essere ottenuto creando almeno 75 pagine (15.000) di dati di addestramento (immagini e trascrizioni) in Transkribus.