Il futuro dell'estrazione delle informazioni - Partecipa al progetto TUC 2024! ✨ 15-16 febbraio, di persona e online. Ottieni il tuo biglietto >>

+ Presentando con orgoglio il gigante olandese

Questo è ciò che viene fuori, quando due archivi power user di Transkribus, cioè l'Archivio della città di Amsterdam e l'Archivio Nazionale dei Paesi Bassi lavorano insieme: un modello con 1 384 893 parole di dati di allenamento, in questo caso leggendo 18° secolo olandese. Il modello è ora disponibile per tutti gli utenti di Transkribus e può essere trovato sotto il nome: "Dutch Mountains (18th Century)". Combina i modelli del 18° secolo dei due archivi (Amsterdam City Archives: 3500+ scansioni di 15 scritture notarili e National Archives of the Netherlands 3500+ scansioni di scritture VOC). Il tasso di errore dei caratteri scende a 5.67%.

Quando usi modelli grandi come questo per i tuoi documenti, ha senso aggiungere il modello di lingua corrispondente, o un modello di base, se hai già addestrato un modello da solo. Ecco dove puoi trovare l'impostazione del modello di lingua in Transkribus: scheda "Strumenti" -> Clicca su "Esegui" nella sezione "Riconoscimento del testo" -> "Seleziona modello HTR" -> "Dizionario" (in alto a sinistra) -> "Modello di lingua dai dati di allenamento"

Divertiti a provare questo o uno degli altri nostri modelli pubblici! Con questo link puoi dare un'occhiata alla panoramica di tutti i modelli disponibili: https://transkribus.eu/wiki/images/d/d6/Public_Models_in_Transkribus.pdf

CONDIVIDI QUESTO ARTICOLO

Post recenti

31 gennaio 2024
News
Siamo lieti di annunciare gli ultimi aggiornamenti del nostro editor di documenti, con un'interfaccia più intuitiva e pulita. Il nostro ...
17 gennaio 2024
News, Transkribus
È necessario trascrivere o tradurre un testo scritto a mano per poter lavorare con esso? Beh, dipende da ...
11 gennaio 2024
News, Transkribus
Il processo di gestione e pubblicazione dei documenti storici non è mai stato così semplice! Creare un sito web che presenti il vostro materiale trascritto ...