+ Presentare il modello Noscemus-pubblico

Siamo felici di presentare uno dei nostri modelli pubblici, che è il modello "Noscemus GM v1" rilasciato da Stefan Zathammer come parte del progetto NOSCEMUS (Nova Scientia: Early Modern Scientific Literature and Latin) basato a Innsbruck. Questo modello può leggere testi impostati in caratteri basati su Antiqua dal 16°, 17° e 18° secolo, superando la maggior parte dei motori OCR standard. Sebbene sia fatto su misura per la trascrizione di testi (neo)latini, fornisce risultati convincenti anche per altre lingue come il francese, l'italiano o l'inglese. Il modello Noscemus può quindi fornire aiuto non solo ai neolatini, ma a tutti i tipi di ricerca che hanno a che fare con grandi corpora di testi del primo periodo moderno.

Il modello si basa su dati di allenamento provenienti dal Sourcebook digitale del progetto e comprende circa 1.000 pagine. Per mantenere il modello il più flessibile possibile, le standardizzazioni nel processo di trascrizione sono state tenute al minimo. Solo nei seguenti casi sono state fatte delle normalizzazioni: legature (es. aeoectff) e abbreviazioni (per esempio -que-us-tur...mm...) sono stati espansi, lungo s (ſ) è stato trascritto come normale s, I tappi piccoli sono stati trascritti come maiuscole.

Anche se il modello fornisce già buoni risultati, il progetto sta ancora affrontando alcuni problemi: ci sono alcune incongruenze rimanenti nella trascrizione delle virgolette e il tasso di errore per la trascrizione di parole o passaggi greci è ancora alto, in misura minore lo stesso vale per il Fraktur (tedesco).

Speriamo che il modello Noscemus renda la vita di trascrizione più facile per molti di voi e per tutti coloro che lavorano su diversi tipi di documenti, non dimenticate di dare un'occhiata agli altri modelli che siamo stati in grado di pubblicare di recente grazie ai nostri laboriosi utenti. Una panoramica su tutti i nostri modelli pubblici la potete trovare in questo documento: https://transkribus.eu/wiki/images/d/d6/Public_Models_in_Transkribus.pdf

CONDIVIDI QUESTO ARTICOLO

Messaggi recenti

20 giugno 2022
Transkribus
Di Joe Nockels, Università di Edimburgo Nell'ambito della sua ricerca di dottorato presso l'Università di Edimburgo e la National Library ...
15 giugno 2022
Transkribus, Webinar
Siamo entusiasti di lanciare la nostra nuova serie di webinar "Ask Us Anything", in cui i partecipanti possono chiederci qualsiasi cosa ...
Giugno 9, 2022
Uncategorized
La nuova funzione di condivisione potrebbe essere un piccolo pulsante per una schermata, ma è una grande funzione per ...