Rumänisches Übergangsalphabet

Kostenloses öffentliches KI-Modell für die Erkennung von handgeschriebenem Text mit Transkribus

Rumänisches Übergangsalphabet

Dies ist ein erster Versuch mit einem Modell, das für Texte im rumänischen Übergangsalphabet (1830-1862) trainiert wurde.

Historischer Kontext und Transkriptionsprinzipien (von Roxana Patras)

Das rumänische Übergangsalphabet ist eine Kombination aus kyrillischen und lateinischen Buchstaben, die zwischen ca. 1830, nach den Phanarioten-Herrschern und der Errichtung des russischen Protektorats (Organische Verordnung), und ca. 1862, als der erste König der Vereinigten Rumänischen Fürstentümer (Moldawien und Walachei) ein Gesetz erließ, das die Typographen zwang, nur lateinische Zeichen zu verwenden, für den Druck verwendet wurde.

Die kyrillischen und lateinischen Buchstaben sind in den drei Jahrzehnten des Übergangs nicht gleichmäßig verteilt und vermischen sich auf eine Weise, die rumänische Drucktexte - Presse, juristische Dokumente und Belletristik - an die avantgardistische Dada-Poesie erinnern lässt. Die Regeln für die Verwendung von lateinischen statt kyrillischen Buchstaben sind durch die Gewohnheiten und Praktiken der Typographen und nicht durch Konventionen oder sprachliche Normen festgelegt und hängen in gewisser Weise vom Standort der Druckereien ab. Im Vergleich zu den walachischen (Bukarest) weisen die moldawischen Drucke (Iasi) gewisse dialektale Besonderheiten auf. Darüber hinaus können wir bei einer zufälligen Entnahme von Stichproben leicht feststellen, dass der Anteil der kyrillischen Buchstaben langsam abnimmt. Bei einigen Konsonanten, vor allem den Palatallauten, können jedoch in ein und demselben Text sowohl kyrillische als auch lateinische Buchstaben verwendet werden: K/ k - Ч/ч (che); G/g - Г/ г (ghe) - Џ/ џ (Dze); S/s - C/c (es).

Um ein HTR-Modell für diese Texte zu trainieren, habe ich fünf Beispiele ausgewählt, die vor und nach 1859, als die beiden rumänischen Provinzen zu einem Land mit einer offiziellen Sprache wurden, den Übergang von einer massiven Verwendung kyrillischer Buchstaben zu einer augenfreundlichen Verwendung zeigen, die das Lesen flüssiger macht.

Die paratextuellen Informationen charakterisieren die 5 Texte als "originale" oder "historische" Romane. Wenn wir berücksichtigen, dass der erste rumänische Roman 1845 von einem mysteriösen Autor mit der Unterschrift D.F.B. veröffentlicht wurde (Elvira sau amorul fără de sfârşit. Römer OriginalElvira oder die unendliche Liebe. Original-Romanze), gelten sie in der rumänischen Literaturtradition als eine Art Gründungsstücke:

1. PELIMON Al., Hoţii şi Hagiul. Römisch istorisch, Buc., Tip. Sfintei Mitropolii, 1853, 117 S.

2. BOERESCU Costache, Aldo şi Aminta sau Bandiţii, Buc., Tip. Bisericească din Sf. Mitropolie, 1855, 164 S.  

3. PELIMON Al., Jidovul cămătar. Moldawien şi Bucovina, Buc., Tip. Stephan Rassidescu, 1863, 292 S.

4. PELIMON Al., Bucur, istoria fundării Bucureştilor, Buc., Tip. Nationala Iosif Romanov, 1858, 251 S.

5. ARICESCU C.D., Misterele căsătoriei, I. Bărbatul predestinat, Buc., Tip. Stephan Rassidescu, 1861, 179 S.

In der Regel werden lateinische Großbuchstaben für Titel nach 1859 bevorzugt.
Die lateinischen Buchstaben Z/ z, M/ m, D/ d, S/ s, T/ t, N/ n, A/ a, I/ i, E/ e, O/ o, Î/ î, U/ u, Ŭ/ ŭ, Ĭ/ ĭ sind im ältesten untersuchten Text (1853) vorhanden, während die kyrillischen Х/х (ha), Ш/ ш (sha), Щ/ щ (shcha), Ц/ ц (tze), Џ/ џ (dze), Ч/ ч (che), Ъ/ ъ (ă), П/ п (pe), Р/ р (er), Ж/ ж (zhe), Ф/ф (ef), К/ к (ca), В/ в (ve), Л/ л (el), Г/ г (ghe), Б/ б (be).
Die ersten dieser kyrillischen Buchstaben, die eine lateinische Entsprechung erhalten haben, sind: Ф/ф (ef) → f; Г/ г (ghe) → g; Л/ л (el) → l; Ж/ ж (zhe) → j. Gleichzeitig bleiben Р/ р (er), П/ п (pe), Ъ/ ъ (ă), Ч/ ч (che), В/ в (ve), Ш/ ш (sha), Щ/ щ (shcha), Ц/ ц (tse) bis 1862 erhalten, dann werden einige von ihnen durch Glyphen wie "ḑ" (dz), "ş" (sh) und "ț" (tz) ersetzt, die aus dem livländischen Alphabet importiert wurden, aber erst nach 1865 in den Druckkreislauf gelangten.

Die allgemeinen Richtlinien für die Transkription wurden wie folgt festgelegt:

1.     Schaffung der Sammlung "ALFABET DE TRANZITIE" mit 6 Artikeln.

2.     Zufällige Transkription der Anfangs-, Mittel- und Endseiten:

2.1. PELIMON Al., Hoţii şi Hagiul. Römisch istorisch (1853): Seiten 6, 7, 8, 52, 53, 54, 76, 77, 78, 79, 80.

2.2. BOERESCU Costache, Aldo şi Aminta sau Bandiţii (1855): Seiten 8, 9, 10, 36, 37, 38, 114, 115, 116, 148, 150.

2.3. PELIMON Al., Jidovul cămătar. Moldawien şi Bucovina (1863): Seiten 5, 6, 7, 8, 49, 50, 51, 100, 101, 102.

2.4. PELIMON Al., Bucur, istoria fundării Bucureştilor (1858): Seiten 5, 6, 7, 84, 85, 86, 87.

2.5. ARICESCU C.D., Misterele căsătoriei, I. Bărbatul predestinat (1861): Seiten 1, 2, 56, 57, 58, 97, 98, 99, 133, 135, 136.

3.     Eins-zu-eins-Transkription aller kyrillischen Buchstaben mit Ausnahme der Fälle, in denen K/k für die Gruppe Ch/ ch steht (z. B. Бukete → Bukete):

Х/х → H/ h; Ш/ ш → Ș/ ș; Щ/ щ → Șt/ șt; Ц/ ц → Ț/ ț, Ч/ ч → C/ c;

Ъ/ ъ → Ă/ ă; П/ п → P/ p; C/c → S/s; Р/ р → R/ r; Ж/ ж → J/j; Ф/ф → F/ f;

К/ к → C/c; В/ в → V/ v; Л/ л → L/l; Г/ г → G/ g; Б/ б → B/ b; Џ/ џ → G/ g.

4.     Anpassung der folgenden Glyphen:

Apostroph, rechtes doppeltes Anführungszeichen, doppeltes kleines Anführungszeichen, Ŭ/ ŭ, Ĭ/ ĭ, á.

Modell-Übersicht

Name:
RTA2 (Romanian Transition Alphabet)
Ersteller:
Roxana Patras
Modell-ID:
51515
Jahrhundert:
19.
Sprachen:
Rumänisch
Schrift:
Rumänisches Übergangsalphabet
Engine:
PyLaia
Material:
Gedruckt
CER auf Validierungssatz:
2.80 %
Einfach ein Bild hochladen und dieses Modell testen

Mit dem Hochladen eines Bildes akzeptieren Sie unsere Allgemeinen Geschäftsbedingungen und unsere Datenschutzpolitik

RTA2 (Romanian Transition Alphabet) ist für jeden frei verfügbar

Starten Sie mit Transkribus und nutzen Sie es für Ihr eigenes Material
Sie können dieses Modell verwenden, um Druckdokumente mit handschriftlicher Texterkennung in Transkribus automatisch zu transkribieren. Dieses Modell kann in der Transkribus Expert Client möglich als auch mit Transkribus Lite.
Dieses KI-Modell wurde darauf trainiert, Text aus Bildern historischer rumänischer Übergangsalphabet-Dokumente automatisch in editierbaren und durchsuchbaren Text umzuwandeln.