Lo strumento Società Linneana di Londra ha recentemente prodotto alcuni risultati promettenti nei suoi esperimenti con il nostro Transkribus piattaforma.
Fondata nel 1788, la Linnean Society è la più antica società di storia naturale del mondo. Le sue collezioni contengono migliaia di documenti ed esemplari di animali che un tempo appartenevano al botanico svedese Carl Linneo, al quale si attribuisce il merito di aver formalizzato la tassonomia delle specie viventi che è ancora oggi ampiamente utilizzata. La Linnean Society è una delle società del progetto READ Memorandum d'intesa partner e ha ospitato il nostro Conferenza di Digital Toolbox che ha avuto luogo nell'ottobre 2016.
Dopo aver sottoposto al team di Transkribus dei dati di addestramento basati sulla grafia del XVIII secolo in svedese, inglese, francese e latino, la Linnean Society ha ora un modello di riconoscimento del testo scritto a mano che è in grado di riconoscere alcune delle grafie di Linneo con un tasso di errore dei caratteri (CER) di 22%. La Linnean Society ha deliberatamente selezionato pagine difficili (come quella sopra) per sfidare la nostra tecnologia - con layout complicati, grafia intricata, diverse lingue e mani multiple. Speriamo che i risultati di questo processo di riconoscimento del testo possano essere migliorati in futuro se l'addestramento fosse focalizzato su una particolare lingua o mano. Ma questi primi risultati aprono già l'eccitante possibilità di Keyword Spotting - un nuovo strumento di ricerca disponibile in Transkribus che utilizza la tecnologia di riconoscimento del testo scritto a mano per garantire risultati di ricerca più accurati di quelli generati attraverso la ricerca convenzionale di parole chiave delle trascrizioni.