Stefan KarcherUno studente laureato all'Università di Heidelberg ha scritto un affascinante post sul blog spiegando come ha usato Transkribus per elaborare i sermoni tedeschi del XIX secolo.
Karcher ha colto l'occasione per addestrare i propri modelli di riconoscimento automatico del testo. Ha usato circa 30.000 parole trascritte di dati di allenamento per generare un modello che può produrre trascrizioni dei suoi documenti con un tasso di errore dei caratteri di 8-10%. Il post sul blog nota che queste trascrizioni sono una base utile ed efficiente per la sua ricerca e include una descrizione di come queste trascrizioni automatizzate possono essere analizzate con Strumenti Voyant.
Vuoi addestrare il tuo modello di riconoscimento automatico del testo?
- Scopri come iniziare nel nostro Come guidare.