Il futuro dell'estrazione delle informazioni - Partecipa al progetto TUC 2024! ✨ 15-16 febbraio, di persona e online. Ottieni il tuo biglietto >>

Alfabeto rumeno di transizione

Modello pubblico gratuito di IA per il riconoscimento del testo scritto a mano con Transkribus

Alfabeto rumeno di transizione

Si tratta di un primo tentativo di modello addestrato per i testi dell'alfabeto di transizione rumeno (1830-1862).

Contesto storico e principi di trascrizione (di Roxana Patras)

L'alfabeto romeno di transizione è una combinazione di caratteri cirillici e latini che è stata utilizzata per la stampa tra il 1830 circa, dopo la caduta dei governanti fanarioti e l'istituzione del protettorato russo (Regolamento Organico), e il 1862 circa, quando il primo re dei Principati Uniti Romeni (Moldavia e Valacchia) emanò una legge che obbligava i tipografi a utilizzare solo glifi latini.

Mescolandosi in un modo che fa assomigliare i testi stampati rumeni - stampa, documenti legali e narrativa - alla poesia d'avanguardia Dada, le lettere cirilliche e latine non sono distribuite uniformemente nei tre decenni di transizione. Stabilite attraverso le abitudini e le pratiche dei tipografi e non attraverso convenzioni o standard linguistici, le regole per l'uso del latino al posto del cirillico sono in qualche modo discrete e totalmente dipendenti dall'ubicazione delle tipografie. Rispetto a quelle valacche (Bucarest), le stampe moldave (Iasi) presentano alcune particolarità dialettali. Inoltre, se prendiamo dei campioni a caso, possiamo facilmente notare che la quantità di lettere cirilliche sta lentamente diminuendo. Tuttavia, per alcune consonanti, soprattutto palatali, è possibile che in uno stesso testo vengano utilizzate contemporaneamente lettere cirilliche e latine: K/ k - Ч/ч (che); G/g - Г/ г (ghe) - Џ/ џ (Dze); S/s - C/c (es).

Per addestrare un modello HTR per questi testi, ho scelto 5 campioni che mostrano, prima e dopo il 1859, quando le due province rumene diventano un paese con una lingua ufficiale, la progressione da un uso massiccio di lettere cirilliche a un impiego più agevole per gli occhi, che rende la lettura più fluida.

Le informazioni paratestuali caratterizzano i 5 testi come romanzi "originali" o "storici". Infatti, se si tiene conto che il primo romanzo romeno è stato pubblicato nel 1845 da un misterioso autore che si firma D.F.B. (Elvira sau amorul fără de sfârşit. Romani originaliElvira o l'amore infinito. Romanticismo originale), sono considerati dalla tradizione letteraria romena come una sorta di opere fondanti:

1. PELIMONE Al., Hoţii şi Hagiul. Istorico romano, Buc., Tip. Sfintei Mitropolii, 1853, 117 p.

2. BOERESCU Costache, Aldo şi Aminta sau Bandiţii, Buc., Tip. Bisericească din Sf. Mitropolie, 1855, 164 p.  

3. PELIMONE Al., Jidovul cămătar. Moldavia şi Bucovina, Buc., Tip. Stephan Rassidescu, 1863, 292 p.

4. PELIMONE Al., Bucur, istoria fundării Bucureştilor, Buc., Tip. Nationala Iosif Romanov, 1858, 251 p.

5. ARICESCU C.D., Misterele căsătoriei, I. Bărbatul predestinat, Buc., Tip. Stephan Rassidescu, 1861, 179 p.

Come regola generale, le lettere maiuscole latine sono preferite per la scrittura dei titoli dopo il 1859.
Le lettere latine Z/ z, M/ m, D/ d, S/ s, T/ t, N/ n, A/ a, I/ i, E/ e, O/ o, Î/ î, U/ u, Ŭ/ ŭ, Ĭ/ ĭ sono presenti dal testo più antico campionato (1853), mentre il cirillico Х/х (ha), Ш/ ш (sha), Щ/ щ (shcha), Ц/ ц (tze), Џ/ џ (dze), Ч/ ч (che), Ъ/ ъ (ă), П/ п (pe), Р/ р (er), Ж/ ж (zhe), Ф/ф (ef), К/ к (ca), В/ в (ve), Л/ л (el), Г/ г (ghe), Б/ б (be).
Tra queste lettere cirilliche, le prime a ricevere un equivalente latino sono: Ф/ф (ef) → f; Г/ г (ghe) → g; Л/ л (el) → l; Ж/ж (zhe) → j. Allo stesso tempo, Р/ р (er), П/ п (pe), Ъ/ ъ (ă), Ч/ ч (che), В/ в (ve), Ш/ ш (sha), Щ/ щ (shcha), Ц/ ц (tse) tendono a essere mantenuti fino al 1862, quando alcuni di essi vengono sostituiti da glifi come "ḑ" (dz), "ş" (sh) e "ț" (tz), importati dall'alfabeto livoniano ma entrati nel circuito della stampa solo dopo il 1865.

Le linee guida generali per la trascrizione sono state stabilite come segue:

1.     Creazione della collezione "ALFABET DE TRANZITIE contenente 6 articoli.

2.     Trascrizione casuale di pagine iniziali, centrali e finali:

2.1. PELIMONE Al, Hoţii şi Hagiul. Istorico romano (1853): pagine 6, 7, 8, 52, 53, 54, 76, 77, 78, 79, 80.

2.2. BOERESCU Costache, Aldo şi Aminta sau Bandiţii (1855): pagine 8, 9, 10, 36, 37, 38, 114, 115, 116, 148, 150.

2.3. PELIMONE Al, Jidovul cămătar. Moldavia şi Bucovina (1863): pagine 5, 6, 7, 8, 49, 50, 51, 100, 101, 102.

2.4. PELIMONE Al, Bucur, istoria fundării Bucureştilor (1858): pagine 5, 6, 7, 84, 85, 86, 87.

2.5. ARICESCU C.D., Misterele căsătoriei, I. Bărbatul predestinat (1861): pagine 1, 2, 56, 57, 58, 97, 98, 99, 133, 135, 136.

3.     Traslitterazione uno a uno di tutte le lettere cirilliche, ad eccezione delle situazioni in cui K/k sta per il gruppo Ch/ ch (ad es. Бukete → Bukete):

Х/х → H/ h; Ш/ ш → Ș/ ș; Щ/ щ → Șt/ șt; Ц/ ц → Ț/ ț, Ч/ ч → C/ c;

Ъ/ ъ → Ă/ ă; П/ п → P/ p; C/c → S/s; Р/ р → R/ r; Ж/ ж → J/j; Ф/ф → F/ f;

К/ к → C/c; В/ в → V/ v; Л/ л → L/l; Г/ г → G/ g; Б/ б → B/ b; Џ/ џ → G/ g.

4.     Personalizzazione dei seguenti glifi:

apostrofo, doppia virgoletta destra, doppia virgola bassa-9, Ŭ/ ŭ, Ĭ/ ĭ, á.

Panoramica del modello

Name:
RTA2 (Romanian Transition Alphabet)
Sviluppato da:
Roxana Patras
Modello ID:
51515
Secolo:
19°
Lingue:
Rumeno
Scrittura:
Alfabeto rumeno di transizione
Motore:
PyLaia
Materiale:
Stampa
CER sul set di convalida:
2.80 %
Basta caricare una foto e testare questo modello

Caricando un'immagine, accetti il nostro termini e condizioni e la nostra politica sulla privacy

RTA2 (Romanian Transition Alphabet) è disponibile e gratuito per tutti

Inizia con Transkribus e usalo per il tuo materiale
È possibile utilizzare questo modello per trascrivere automaticamente i documenti di stampa con la tecnologia del riconoscimento del testo scritto a mano in Transkribus. Questo modello può essere utilizzato nel Transkribus Expert Client così come in Transkribus Lite.
Questo modello di intelligenza artificiale è stato addestrato per convertire automaticamente il testo da immagini di documenti storici dell'alfabeto di transizione rumeno in testo modificabile e ricercabile.