Antica grafia occitana

Modello pubblico gratuito di IA per il riconoscimento del testo scritto a mano con Transkribus

Antica grafia occitana

Il modello è stato addestrato con testi in occitano antico, principalmente del XIII e XIV secolo, provenienti dalla Linguadoca o dalla Provenza. Complessivamente, sono stati utilizzati 7 testi per un totale di circa 830 pagine e circa 190.000 token.

Sono stati utilizzati i seguenti testi:

Las Leys d'amors (= Bibliothèque municipale de Toulouse, cote 2883/-4),
Le roman de Flamenca (=Bibliothèque municipale de Carcassonne, cote 34),

e dalla Bibliothèque nationale de France (BnF):
La vida de sant Enimia (= Arsenal 6355), NAF 11180, NAF 1050, Latin 1139 e Français 846.

Il modello effettua segmentazioni indipendenti delle parole ed è in grado di risolvere le abbreviazioni più comuni. La punteggiatura viene lasciata come nel manoscritto (cioè le vocali elise, ad esempio nell'articolo, non vengono sostituite da apostrofi). Il CER sul set di addestramento è di 2,6%, sul set di validazione di 3,51%.

Panoramica del modello

Name:
OldOccitanHandwriting
Sviluppato da:
Marinus Wiedner
Modello ID:
52822
Secolo:
14°, 13°
Lingue:
Occitano antico, provenzale antico
Scrittura:
Alfabeto latino
Motore:
PyLaia
Materiale:
Scritto a mano
CER sul set di convalida:
3.51 %
Basta caricare una foto e testare questo modello

Caricando un'immagine, accetti il nostro termini e condizioni e la nostra politica sulla privacy

OldOccitanHandwriting è disponibile e gratuito per tutti

Inizia con Transkribus e usalo per il tuo materiale
È possibile utilizzare questo modello per trascrivere automaticamente documenti scritti a mano con la tecnologia di Handwritten Text Recognition in Transkribus. Questo modello può essere utilizzato nel Transkribus Expert Client così come in Transkribus Lite.
Questo modello di IA è stato addestrato per convertire automaticamente il testo da immagini di documenti storici dell'alfabeto latino in testo che si può modificare e cercare.