Stampa tibetana moderna U-chen

Modello pubblico gratuito di IA per il riconoscimento del testo scritto a mano con Transkribus

Stampa tibetana moderna U-chen

Tibetan Modern U-chen Print 0.1 (TMUP) è il primo modello HTR di Transkribus per le pubblicazioni in lingua tibetana stampata in Uchen (དབུ་ཅན་). dbu può). È stato addestrato su testi pubblicati nella RPC tra gli anni '50 e '80, senza l'utilizzo di un modello di base.

Questo modello è stato addestrato su 522 pagine di 20 documenti. L'insieme di addestramento è costituito da 470 pagine; l'insieme di validazione è costituito da 52 (10%) pagine selezionate automaticamente.

Le pagine per la formazione sono state selezionate da fonti diverse, tra cui tre pagine con cifre prevalentemente tibetane dal Specchio Tibet (pubblicato in India), per riflettere tutte le influenze delle lingue inglese e cinese sull'ortografia tibetana moderna (in particolare, punteggiatura, parole di prestito e la resa della fricativa labiodentale /f/, che tradizionalmente non esiste in tibetano).
TMUP 0.1 è in grado di trascrivere la punteggiatura tibetana tradizionale e la punteggiatura cinese tradizionale e tibetana moderna.

Il modello è più adatto al testo tibetano puro e ha una capacità molto limitata di trascrivere testi occasionali in cinese o in inglese (il Divergent Discourses Project prevede di migliorare le capacità del modello in lingua cinese).

Il modello è stato sviluppato da Franz Xaver Erhard (Università di Lipsia) e da Xiaoying 笑影 (Università di Lipsia) per la Discorsi divergenti (DFG/AHRC).


Panoramica del modello

Name:
Tibetan Modern U-chen Print 0.1
Sviluppato da:
Franz Xaver Erhard (Università di Lipsia), Xiaoying 笑影
Modello ID:
60669
Secolo:
20°
Lingue:
Tibetano
Scrittura:
U-chen tibetano moderno
Motore:
PyLaia
Materiale:
Stampa
CER sul set di convalida:
1.8 %
Basta caricare una foto e testare questo modello

Caricando un'immagine, accetti il nostro termini e condizioni e la nostra politica sulla privacy

Tibetan Modern U-chen Print 0.1 è disponibile e gratuito per tutti

Inizia con Transkribus e usalo per il tuo materiale
È possibile utilizzare questo modello per trascrivere automaticamente i documenti di stampa con la tecnologia del riconoscimento del testo scritto a mano in Transkribus. Questo modello può essere utilizzato nel Transkribus Expert Client così come in Transkribus Lite.
Questo modello di intelligenza artificiale è stato addestrato per convertire automaticamente il testo di immagini di documenti storici tibetani moderni U-chen in testo modificabile e ricercabile.