Se siete nuovi a Transkribus, probabilmente avete molte domande sulla piattaforma. Come si trascrivono i documenti? Cos'è un modello? Come faccio ad accedere?
Molte di queste domande possono essere risolte con una visita al nostro sito web Centro assistenzache contiene informazioni su ogni caratteristica e funzione di Transkribus. Tuttavia, per aiutarvi ulteriormente, abbiamo stilato un elenco delle cinque domande più comuni poste dai nuovi utenti di Transkribus, insieme alle istruzioni passo-passo per risolverle.
- Come si caricano i file su Transkribus?
- Come si esportano i file da Transkribus?
- Come si controlla lo stato di un lavoro?
- Qual è il modello pubblico migliore per il mio materiale?
- Che cos'è un CER e come posso migliorare il CER del mio modello?
1) Come si caricano i file su Transkribus?
La prima fase del processo di riconoscimento del testo consiste nel caricare un'immagine del documento che si desidera trascrivere. Questa può essere in formato JPEG, PNG o PDF.
Per caricare un documento, accedere alla sezione Scrivania e selezionare Caricare i file. Selezionare la raccolta in cui si desidera caricare i file, quindi selezionare i file stessi.
La maggior parte dei documenti caricati ha più di una pagina. Tuttavia, non è necessario caricare ogni pagina singolarmente.
Se si caricano JPEG o PNG, tutte le immagini selezionate in un unico caricamento verranno caricate come un unico documento e ogni immagine diventerà una pagina del documento. Se si caricano PDF, ogni pagina del PDF viene estratta e caricata come pagina del documento.
Per ulteriori informazioni sul caricamento di documenti su Transkribus, visitate il nostro sito web Centro assistenza.
2) Come si esportano i file da Transkribus?
È possibile scaricare o esportare le immagini e le trascrizioni dei documenti da Transkribus, per poterle utilizzare anche al di fuori della piattaforma.
Per esportare i documenti, selezionare la raccolta, i documenti o le pagine che si desidera scaricare. Fare clic sui tre puntini nel menu superiore e selezionare Esportazione. Scegliere un formato di esportazione dall'elenco e selezionare Avviare l'esportazione.
Per ulteriori informazioni sui diversi formati di esportazione possibili con Transkribus, visitate il nostro sito web Centro assistenza.
3) Come si controlla lo stato di un lavoro?
Un "lavoro" di Transkribus è un'attività che viene richiesta alla piattaforma, come il caricamento di documenti, il riconoscimento del testo o l'addestramento di un modello. A seconda delle dimensioni del lavoro, è possibile che si debba attendere un breve periodo di tempo prima che il lavoro venga completato. Durante questo lasso di tempo, è possibile continuare a lavorare sulla piattaforma e persino chiuderla completamente: i lavori non completati continueranno a essere eseguiti in background.
È possibile controllare lo stato dei lavori in qualsiasi momento facendo clic su Jobs in alto a destra dello schermo. Qui viene visualizzato un elenco completo di tutti i lavori attuali e precedenti, indipendentemente dal fatto che siano stati eseguiti in Desk o in Sites. A ciascuno di essi viene assegnata un'etichetta, ad esempio Creato, In corsa, Finito, o Fallito.
Se il vostro lavoro è etichettato come Creato o In corsanon è ancora completo. Si può vedere sotto Descrizione quanti lavori ci sono prima di voi nella coda. Questo dovrebbe fornire un indicatore del tempo di attesa.
Se il vostro lavoro è etichettato come Fallitoè necessario provare a eseguire di nuovo il lavoro. Se il lavoro fallisce costantemente, è possibile creare un ticket di assistenza e selezionare Lavoro fallito nel Argomento campo. Questo avverte il team di Transkribus del problema.
È possibile annullare un lavoro in qualsiasi momento facendo clic sui tre puntini sotto la voce Azione e selezionando Annullamento.
4) Quale modello di pubblico è più adatto al mio materiale?
Per trascrivere il testo in Transkribus, è necessario un modello di riconoscimento del testo. Il modello indica alla piattaforma come trascrivere il testo del documento.
Il modo più semplice per farlo è selezionare un modello pubblico. Si tratta di modelli che sono stati addestrati dalla comunità di Transkribus e resi pubblici per essere utilizzati da tutti. È possibile visualizzare tutti i modelli pubblici in questa pagina o nel Galleria della Modelli sezione di Transkribus.
Ogni modello è etichettato con una lingua (ad esempio, il tedesco), una scrittura (ad esempio, l'alfabeto latino), un periodo (ad esempio, il XVII secolo) e se è adatto a testi scritti a mano o stampati. Quando si sceglie un modello pubblico da utilizzare con i propri documenti, è importante sceglierne uno con lingua, scrittura, periodo e tipo di testo uguali o simili a quelli dei propri documenti. In questo modo si otterrà una trascrizione più accurata. Può anche valere la pena di provare un paio di modelli diversi, per vedere qual è il più adatto ai vostri documenti.
Abbiamo anche due Super Modelli, il Text Titan I e l'Dutch Demeter I, e altri sono attualmente in fase di formazione. I super modelli sono modelli più potenti basati su trasformatori, in grado di trascrivere simultaneamente molti tipi diversi di materiali. Sono quindi ideali per le collezioni che includono una serie di lingue, scritture o un mix di documenti scritti a mano e stampati.
Per ulteriori informazioni sulla scelta del modello, visitate il nostro sito web Centro assistenza.
5) Che cos'è il CER e come posso migliorare il CER del mio modello?
A ogni modello viene assegnato anche un tasso di errore di caratterizzazione, o CER. Si tratta di un numero compreso tra 0% e 100% che indica la precisione del modello. Un modello con un CER di 100% produrrà una trascrizione molto imprecisa, mentre un modello con un CER di 0% fornirà una trascrizione perfetta e priva di errori. Per ottenere risultati ottimali, è opportuno utilizzare modelli con un CER pari o inferiore a 10%.
Con Transkribus è anche possibile addestrare il proprio modello di riconoscimento del testo, adattandolo alla grafia o alla stampa dei documenti specifici. Se siete alle prime armi con l'addestramento dei modelli, potreste trovare difficile produrre un modello con un CER inferiore a 10%. Tuttavia, con alcuni suggerimenti utili, è possibile migliorare rapidamente il CER del modello personalizzato.
Per ulteriori informazioni su come migliorare il CER del modello, visita il nostro blog.
Avete un'altra domanda su Transkribus?
Il nostro Centro assistenza è una miniera di informazioni su tutto ciò che riguarda Transkribus. Dalla creazione di un account all'addestramento di un modello e all'uso dell'ScanTent, contiene istruzioni passo-passo per tutte le diverse funzioni di Transkribus.
Abbiamo anche un Playlist di tutorial su YouTube, dove i membri del team vi guidano attraverso tutte le attività che potete svolgere con la piattaforma, consentendovi di seguirli in tempo reale e di sfruttare al meglio la piattaforma.