Viennese Property Registers (ENHG) 15th-16th century

Free Public AI Model for Handwritten Text Recognition with Transkribus

Viennese Property Registers (ENHG) 15th-16th century

The model is based on the property registers of the city of Vienna from the 15th and early 16th centuries. These are part of the city books. All real estate transactions in which a property changed hands, for example through a purchase or inheritance, were listed in them. The entries follow a form that varies only slightly, which is why the vocabulary represented in the training material is limited.

The entries were written in Early New High German with a few Latin phrases. The fonts used are late Gothic minuscule, Bastarda and a very early Kurrent.

The training material consists of 1228264 words, which corresponds to approximately 3500 pages. The Ground Truth was created as part of the DFG-funded research project Mapping Medieval Vienna, which focuses on analyzing the content of the sources. The transcription guidelines are therefore aimed at simplifying readability.

Abbreviations have been resolved and medieval punctuation has been omitted. The letters are always transcribed in their basic form, diacritics have not been taken into account, and no distinction has been made between long and round “s”. The following abbreviations were used for currency symbols:
tl. = pound, s. = shilling, d. = pfenning, fl. = florin. Due to the homogeneity of the source corpus, the model achieves a 1.50% CER on a validation set.

Contact: j.helmchen@fu-berlin.de

Picture: WStLA 2.1.2.1.B1.8 – Gewährbuch E, fol. 74v (1478)

German description:

Grundlage des Modells sind die Kauf- und Gewerbücher der Stadt Wien aus dem 15. und frühen 16. Jahrhundert. Bei diesen handelt es sich um einen Teil der Stadtbücher. Eingetragen wurden in sie sämtliche Immobilientransaktionen, in denen eine Liegenschaft den Besitz wechselte, etwa durch ein Kaufgeschäft oder eine Erbschaft. Die Einträge folgen einem nur wenig variierenden Formular, weshalb das im Trainingsmaterial repräsentierte Vokabular eingeschränkt ist.

Verfasst wurden die Einträge in frühneuhochdeutscher Sprache mit wenigen lateinischen Phrasen. Verwendete Schriftarten sind die spätgotische Minuskel, Bastarda und ein sehr frühes Kurrent.

Das Trainingsmaterial setzt sich aus 1228264 Wörtern zusammen, was ungefähr 3500 beschriebenen Seiten entspricht. Die Ground Truth entstand im Rahmen des von der DFG geförderten Forschungsprojekts Mapping Medieval Vienna, in welchem die inhaltliche Auswertung der Quellen im Vordergrund steht. Die Transkriptionsrichtlinien sind daher auf eine vereinfachte Lesbarkeit ausgerichtet.

Abkürzungen sind aufgelöst, auf eine Wiedergabe der mittelalterlichen Interpunktion wurde verzichtet. Die Buchstaben sind stets in ihrer Grundform transkribiert, Diakritika wurden nicht berücksichtigt, eine Unterscheidung zwischen langem und rundem „s“ wurde nicht vorgenommen. Für Währungszeichen wurden einheitlich folgende Kürzel verwendet: tl. = Pfund, s. = Schilling, d. = Pfenning, fl. = Gulden. Aufgrund der Homogenität des Quellenkorpus erreicht das Modell eine CER von 1,50% auf dem Validierungsset.

Kontakt: j.helmchen@fu-berlin.de

Model Overview

Name:
Viennese Property Registers 1420-1517
Creator:
Julian Helmchen
Model ID:
57815
Century:
15th, 16th
Languages:
German, Latin
Script:
German Kurrent, Bastarda, Gothic minuscule
Engine:
PyLaia
Material:
Handwritten
CER on validation set:
1.5 %
Simply upload a picture and test this model

By uploading an image, you accept our terms and conditions and our privacy policy

Viennese Property Registers 1420-1517 is freely available to everyone

Get started with Transkribus and use it for your own Material
You can use this model to automatically transcribe Handwritten documents with Handwritten Text Recgnition in Transkribus. This model can be used in the Transkribus Expert Client as well as in Transkribus Lite.
This AI model was trained to automatically convert text from images of historical German Kurrent, Bastarda, Gothic minuscule documents into editable and searchable text.