In questa guida imparerai come usare la funzione di riconoscimento del testo scritto a mano in Transkribus Lite. HTR permette di riconoscere automaticamente il testo sulle immagini e produce una trascrizione del testo utilizzando l'intelligenza artificiale.
Panoramica
La scheda "Riconoscimento" si trova nella collection page in Transkribus Lite. Quando clicchi su una collezione nella panoramica delle collezioni (di più sulla gestione delle collections) si aprirà la rispettiva collezione. In alto a destra della pagina vedrai la scheda "Riconoscimento". Per iniziare il riconoscimento dovrai passare attraverso un processo in 3 fasi che viene spiegato nelle sezioni seguenti.
Passo 1: Scegliere il documento
Come primo passo è necessario selezionare il documento su cui si desidera eseguire il riconoscimento del testo scritto a mano. Per farlo devi semplicemente cliccare sul documento desiderato nell'elenco per selezionarlo. Se hai molti documenti nella tua collezione puoi anche utilizzare i filtri per cercare il documento.
Passo 2: selezionare il modello
Dopo aver selezionato il documento desiderato, è necessario selezionare il modello HTR che desideri utilizzare per il riconoscimento. Può essere uno dei modelli che hai addestrato tu stesso o uno dei modelli gratuiti e pubblicamente disponibili.
Tutti i modelli
Sotto la scheda tutti i modelli troverai tutti i modelli che puoi usare. I modelli che hai addestrato o a cui hai accesso così come i modelli pubblici sono elencati qui. Vedrai il nome, la lingua e il provider (cioè il motore di riconoscimento che verrà usato con questo modello). Inoltre è possibile filtrare ID del modello, il nome utente del creatore, nonché per il numero di pagine di Ground Truth che sono state utilizzate per addestrare il modello.
Nota: l'addestramento dei modelli non è ancora disponibile in Transkribus Lite, quindi è necessario utilizzare Transkribus Expert Client se si vuole addestrare il proprio modello. Puoi leggere di più sull'addestramento dei modelli qui.
Modelli pubblici
Nella scheda "modelli pubblici" puoi trovare tutti i modelli pubblici che sono disponibili e accessibili per tutti. Molti di questi modelli sono stati creati dalla nostra grande comunità grazie ad alcuni progetti molto interessanti. Cliccando su un modello si ottengono maggiori informazioni sul rispettivo modello e per molti modelli puoi anche vedere un'anteprima del materiale utilizzato per l'addestramento. In questo modo, puoi cercare un modello che si adatta meglio alle tue esigenze. A volte è anche utile testare diversi modelli e confrontare i risultati per trovare un modello che funziona per te. Tuttavia, è necessario tenere a mente che il materiale storico e in particolare gli innumerevoli diversi tipi di scrittura, possono essere molto eterogenei e quindi (ancora 😉 ) non siamo in grado di fornire un modello pubblico che funziona per tutti . Puoi anche consultare tutti i modelli pubblici qui.
Una volta identificato un modello che si desidera utilizzare, basta cliccare sul pulsante "select" per selezionare il modello.
Passo 3: Iniziare il riconoscimento
Nell'ultimo passo, devi definire le pagine che vuoi riconoscere tramite HTR. Puoi inserire una stringa di pagine con il numero di pagina iniziale e il numero di pagina finale o selezionare le pagine manualmente con il pulsante "Select Pages". Dopo aver selezionato le pagine puoi cliccare su "Start".
Prima che il lavoro di riconoscimento inizi, vedrai un pop-up che ti mostra quanti credits saranno consumati dall'incarico che hai iniziato. Inoltre, vedrai il tuo attuale saldo credits e il saldo credits dopo il riconoscimento. Cliccando nuovamente su "Start", il lavoro di riconoscimento verrà avviato.
Risultati
Non appena avrai iniziato il processo di riconoscimento, verrai reindirizzato al sito jobs page. Qui vedrai il tuo incarico di riconoscimento appena creato. Nella colonna dello stato puoi sempre controllare lo stato attuale del tuo lavoro di riconoscimento e altre informazioni riguardanti l' incarico. Cliccando sul lavoro nell'elenco si accede al documento relativo all'incarico. Dopo che il riconoscimento è finito, puoi vedere i risultati visualizzando le pagine del documento.