Come esportare documenti da Transkribus

Come esportare documenti da Transkribus

Esportazione
Transkribus Expert Client
Ultimo aggiornamento 3 anni fa
Informazioni su Transkribus

Transkribus è una soluzione completa per la digitalizzazione, il riconoscimento del testo tramite IA, la trascrizione e la ricerca di documenti storici. Scopri di più su Transkribus qui

Transkribus è una soluzione completa per la digitalizzazione, il riconoscimento del testo tramite IA, la trascrizione e la ricerca di documenti storici. Scopri di più su Transkribus qui

Sommario

Sommario

Questa guida spiega come esportare i tuoi documenti da Transkribus. Ti permetterà di personalizzare la tua esportazione secondo il formato di file e le opzioni che preferisci.

Introduzione

  • Se vuoi lavorare con le tue immagini e trascrizioni fuori da Transkribus, puoi esportare i tuoi documenti dalla piattaforma.
  • Sono disponibili diversi formati di esportazione e funzioni per soddisfare le tue esigenze.

Funzione di esportazione

  • Per utilizzare la funzione di esportazione clicca su questo simbolo:

Figura 1 Pulsante "Export document"

  • Si aprirà la seguente finestra. Vedrai che ci sono due schede che offrono l'esportazione del client e l'esportazione del server.
  • Se scegli l'opzione di esportazione su server, questa verrà svolta sul server di Transkribus e riceverai un link per scaricare i tuoi file. L'esportazione non rallenterà il tuo computer e il processo non sarà interrotto se spegni il tuo computer.
  • Con Client export i file verranno salvati direttamente sul tuo computer.

Figura 2 Finestra "Export document"

Server Export

Figura 3 Esportazione dal server

  • Clicca sulla scheda di esportazione "Server", compila le opzioni desiderate e clicca su OK.
  • Puoi controllare il progresso della tua esportazione cliccando sul pulsante "Jobs" nella scheda "Server".

Figura 4 Fai clic sul pulsante "Jobs" per controllare il progresso dell'esportazione

  • Al termine del processo riceverai un'e-mail con il link per scaricare i file. Se vuoi passare i file a qualcun altro, puoi inoltrare loro l'e-mail.
  • Nota: Il resto di questa guida si concentra sull'esportazione client. Tutte le opzioni discusse di seguito sono disponibili anche nell'esportazione dal Server.

Esportazione dal Client

  • Clicca sulla scheda "Client-Export" e compila le seguenti opzioni:

Salva in..

Prima di tutto, scegli dove vuoi salvare i file esportati. Digita la posizione del file nella casella "Base folder" nella parte superiore della finestra "Export document".

Figura 5 Indica dove salvare il file

Pagine da esportare

  • Seleziona il numero di pagine che vuoi esportare. Puoi esportare tutte le pagine del tuo documento o solo la pagina corrente.

Figura 6 Scegli le pagine che vuoi esportare

Esporta come documento Transkribus

Figura 7 Esportazione come documento Transkribus

  • Se esporti la tua trascrizione come documento Transkribus, genererai un file METS (Metadata Encoding and Transmission Standard) contenente i collegamenti ai file PAGE, XML, ALTO e/o immagine, a seconda delle opzioni che scegli. Un file METS è come un contenitore che include tutte le informazioni di base su un file. Puoi trovare informazioni più dettagliate su METS in: http://www.loc.gov/standards/mets/

ALTO

Figura 8 Esportare in formato ALTO

  • ALTO è un formato di output speciale che permette di inserire il documento esportato in altri programmi che lavorano con questo formato. Il formato è simile a XML e funziona per esempio per OCR. Viene spesso usato in combinazione con METS per la descrizione dell'intero oggetto digitalizzato e la creazione di riferimenti dei file ALTO, per esempio la descrizione della sequenza di lettura. Maggiori informazioni su ALTO possono essere trovate qui: http://www.loc.gov/standards/alto/
  • Con l'opzione "Word Level" Transkribus dividerà le linee in parole. Il programma lo fa analizzando gli spazi tra le parole, anche se non è stata eseguita una segmentazione di parole in precedenza.

Filename pattern

Figura 9 Filename pattern

  • Sotto "Filename pattern" puoi scegliere come verrà composto il nome del file.
  • Nota: La seconda opzione "filename" è quella standard. Con questa opzione il file esportato avrà lo stesso nome del documento importato. Questo è importante se vuoi far corrispondere le trascrizioni locali con le immagini in Transkribus. Quindi se esporti un documento, modificalo esternamente e dopo caricalo di nuovo in Transkribus, il programma avrà bisogno di avere due nomi di file simili per riconoscere correttamente il file.

Esportazione come PDF

Figura 10 Esportazione come PDF

  • Se esporti un file PDF puoi scegliere tra "Images only" o "Images plus text layer".
    • "Images only": genererai un file PDF con il documento come immagine. Ciò significa che non si vedrà il testo trascritto.

Figura 11 Documento PDF esportato

  • "Images plus text layer": vedrai due livelli nel documento PDF esportato: OCR (il testo trascritto) e Image (immagine del documento).

Figura 12 Livelli nel PDF esportato

  • "Extra text pages": se scorri verso il basso nel file PDF esportato, il testo trascritto apparirà dopo l'immagine.
  • "Highlight tags": questa opzione evidenzierà qualsiasi tag nella tua trascrizione. I tag verranno mostrati con gli stessi colori usati in Transkribus. Alla fine del documento ci sarà anche una legenda dei simboli che spiega il significato dei diversi colori.

Esportare come TEI

Figura 13 Esportazione come TEI

Esportare come DOCX

Figura 14 Esportazione come DOCX

  • Scegliendo questa opzione otterrai le tue trascrizioni in file Word.
  • È possibile selezionare le opzioni relative alle interruzioni di riga, abbreviazioni e altro secondo le tue esigenze.

Esportare come semplice TXT

  • Se non lavori abitualmente con Microsoft Word, è possibile esportare la tua trascrizione come un semplice file TXT.

Figura 15 Esportazione come TXT

Esportazione di tag

Se vuoi esportare i tag che hai assegnato alla tua trascrizione, ci sono tre opzioni possibili:

File Excel: seleziona questa opzione per generare un file Excel con schede individuali per ogni categoria di tag e una scheda con una panoramica di tutti i tag.

Figura 16 Esportazione di tag Excel

File PDF: seleziona queste opzioni per evidenziare i tag nel file PDF esportato.

Figura 17 Esportazione di tag PDF

File DOCX: seleziona queste opzioni per rendere i tag visibili nel file DOCX esportato.

Figura 18 Tag Export DOCX

  • Dopo l'esportazione del documento Word, aprilo e fai quanto segue
    • Clicca sul pulsante paragrafo nel menu Home di Word.

Figura 19 Pulsante Paragrafo in Word

  • Poi vai su "Riferimenti" e scegli "Inserisci indice".

Figura20 Inserisci indice in Word

  • Si aprirà la seguente finestra di Office:

Figura 21 Opzioni di indice in Word

  • Seleziona "Allinea a destra i numeri di pagina" e premi "OK".
  • Apparirà una finestra di conferma, clicca su "Sì".

Figura 22 Conferma in Word

  • Una panoramica dei tag dovrebbe ora apparire alla fine del documento
  • Se la panoramica dei tag non appare, clicca su "Aggiorna indice". Questo dovrebbe risolvere il problema.

Figura 23 "Aggiorna indice" in Word

Esportazione di tabelle in Excel

Per informazioni sull'esportazione di tabelle, consulta Come modificare le tabelle in Transkribus.

Altre opzioni

Ci sono ulteriori opzioni di esportazione da esplorare.

Esportare tutti i formati

  • Questo significa che la trascrizione verrà salvata nella posizione selezionata in tutti i formati disponibili.
  • Se scegli "Esportazione di tutti i formati" tutte le opzioni verranno spuntate automaticamente

Figura 24 Esportare tutti i formati

Usare il filtro versione

Figura 25 Scegliere lo stato della versione

  • Questa opzione permette di esportare diverse versioni del documento.
  • Se selezioni "Ground Truth" per esempio, Transkribus esporterà solo le pagine del documento che hai contrassegnato come "Ground Truth".
  • Per l'esportazione il programma consulta le versioni precedenti del tuo documento. Questo significa che se scegli di esportare tutte le pagine "In Progress", il programma esporterà tutte le pagine che sono state contrassegnate come "In Progress", anche se il loro stato ora è aggiornato.
  • Il programma esporterà l'ultima versione "In Progress" del tuo documento.
  • Se vuoi esportare una versione precedente "In Progress" della tua pagina, apri questa versione della pagina in Transkribus. Apri la finestra Esportazione e seleziona "Loaded version for current page". Nell'opzione "Pages", seleziona "Current" prima di confermare.

Figura 26 Esportazione della versione caricata (per la pagina corrente)

Oscurare

  • Se hai oscurato sezioni sensibili della tua trascrizione, queste parole o frasi possono anche essere nascoste nei file esportati.
  • Per farlo, seleziona "Do blackening" nelle opzioni di esportazione.
  • Nota: questa opzione funziona solo per i file Word, PDF e METS.

Creare la pagina di copertina

  • Transkribus fornisce l'opzione di creare una pagina di copertina. La pagina sarà basata sulle informazioni aggiunte nella scheda "Document" all'interno della scheda "Metadata".
  • Nella scheda "Documento" puoi aggiungere informazioni su titolo, autore, lingua e data del tuo documento. Puoi anche creare una Dichiarazione Editoriale per spiegare come esattamente è stato trascritto il tuo documento. Per saperne di più sulla Dichiarazione Editoriale, vedi Come arricchire i documenti trascritti con il mark-up.

Figura 27 Informazioni per la pagina di copertina

  • Queste informazioni saranno incluse nella tua pagina di copertina, come nella figura seguente.

Figura 28 Pagina di copertina

Crediti

Vorremmo ringraziare i molti utenti che con il loro feedback hanno contribuito a migliorare il software Transkribus.