>

Tasso di errore dei caratteri (CER)

Tasso di errore dei caratteri (CER)

Il tasso di errore dei caratteri (CER) confronta, per una data pagina, il numero totale di caratteri (n), compresi gli spazi, con il numero minimo di inserimenti (i), sostituzioni (s) e cancellazioni (d) di caratteri che sono necessari per ottenere il risultato Ground Truth . La formula per calcolare il CER è la seguente: CER = [ (i + s + d) / n ]*100

Ogni piccolo errore di trascrizione è un errore statisticamente completo. Questo significa che ogni virgola mancante, una "u" invece di una "v", uno spazio in più o anche una lettera maiuscola invece di una minuscola sono inclusi nel CER come errori.

Figura 1 CER sul Set di addestramento e sul Set di convalida

Inizia ad usare Transkribus

Rendi accessibili i tuoi documenti storici