Erfolgsgeschichte
Veröffentlicht: Vor 6 Monaten

Mit Hervé Baudry die Geheimnisse der portugiesischen Inquisition lüften

"Nach den inquisitorischen Regeln der Vergangenheit musste alles geheim bleiben. Um Menschen zu bestrafen, die beschuldigt wurden, vom christlichen Glauben abzuweichen, führte die portugiesische Inquisition Prozesse durch, die von Geheimhaltung und Zensur geprägt waren. Diese Prozesse wurden jedoch in Gerichtsakten festgehalten, die heute im portugiesischen Nationalarchiv (ANTT) aufbewahrt werden und darauf warten, transkribiert und ausgewertet zu werden. Heute, dank der harten Arbeit des TraPrInq Projekt werden nach und nach lange gehütete Geheimnisse der portugiesischen Inquisition gelüftet. 

Um den Inhalt der inquisitorischen Prozessakten aufzudecken, nutzte das TraPrInq-Team ein KI-gestütztes Texterkennungsmodell, um diese Dokumente aus den Jahren 1536 bis 1821 zu transkribieren. Hervé Baudry, leitende Forscherin am CHAM-Zentrum für die Geisteswissenschaften der Neuen Universität von Lissabon und Koordinator des TraPrInq Projekt, erläuterte uns, wie es möglich war, die inquisitorischen Gerichtsakten mit Hilfe von Transkribus.

Offiziell Website der TraPrInq Projekt. © TranPrInq

Das TraPrInq-Projekt

300 Jahre Archivgut und mehr als 40.000 Akten dieser Gerichtsprozesse der portugiesischen Inquisition befinden sich im Nationalarchiv von Portugal und warten darauf, transkribiert und analysiert zu werden. In Anerkennung des Potenzials der Prozessakten, "Processos", hat das Projekt TraPrInq wurde gegründet. Der einzigartige Name "TraPrInq", ein Unwort, fasst seine Aufgabe zusammen: "Transcrever os Processos da Inquisição Portuguesa, 1536-1821", was übersetzt soviel heißt wie "Transkription der Gerichtsverfahren der portugiesischen Inquisition, 1536-1821". 

Der Versuch, die in Tausenden von Dokumentenseiten verborgene Geschichte zu erschließen, birgt jedoch eine große Herausforderung: die Zugänglichkeit. Nicht jeder kann auf diese historischen Akten zugreifen oder jahrhundertealte Manuskripte lesen. 

Aufgrund seiner Vorkenntnisse über Transkribus erkannte Hervé Baudry diese Herausforderung und dachte über eine Lösung nach: "Im Jahr 2020 brachte mich ein Webinar für brasilianische Studenten zum Thema Inquisitionsstudien dazu, ein Projekt zu konzipieren, das dazu beitragen könnte, die Schwierigkeiten zu überwinden, mit denen Nicht-Paleographen beim Lesen und Konsultieren der Archive konfrontiert sind." So wurde das Projekt TraPrInq ins Leben gerufen, das aus einer Team von elf Paläographen aus Portugal und Brasilien, mit dem vorrangigen Ziel, eine vielseitige Texterkennungsmodusl Transkribus zu nutzen und der Öffentlichkeit zugänglich zu machen. 

Prozess gegen Manuel Gois, Gerichtsprozesse der portugiesischen Inquisition, 1586. © ANTT

Die Gerichtsprozesse der portugiesischen Inquisition

Diese "Processos" für die Forschung und die Öffentlichkeit zugänglich zu machen, würde eine wertvolle Ressource darstellen, erklärt Hervé Baudry. "In der portugiesischen wie auch in der spanischen und italienischen Kultur ist die frühneuzeitliche Zensur eng mit der Inquisition verbunden." Die enge Verbindung zwischen der frühneuzeitlichen Zensur und der Inquisition in der portugiesischen, spanischen und italienischen Kultur lässt sich auf die Doppelrolle der Inquisition als religiöse und politische Autorität zurückführen. Die portugiesische Inquisition, die religiöse Abweichungen vom Christentum innerhalb des Landes feststellte und unterdrückte, stellte Menschen vor Gericht, um sie unter dem Vorwurf der Ketzerei oder Hexerei zu inhaftieren. Als die Zensur Teil der inquisitorischen Tätigkeit wurde, musste jeder, der mit der Inquisition in Berührung kam, sogar Insassen, die aufgrund überfüllter Gefängnisse entlassen wurden, einen Geheimhaltungseid unterschreiben. 

Abgesehen vom allgemeinen historischen Wert der Entdeckung von Informationen über die Vergangenheit kann die Offenlegung des Inhalts von Dokumenten, die unter Geheimhaltung behandelt werden, zu neuen Entdeckungen und Erkenntnissen führen. Das TraPrInq-Team hat sich zusammengetan, um mit Hilfe von Transkribus die Prozesse der portugiesischen Inquisition zu entschlüsseln.

Prozess gegen Isaac Almosnino, Gerichtsprozesse der portugiesischen Inquisition, 1618. © ANTT

Transkribieren jahrhundertealter Dokumente mit Transkribus

Das Material, das zum Trainieren des Transkribus-Texterkennungsmodells verwendet wurde, bestand aus handschriftlichen Dokumenten von Gerichtsverfahren der portugiesischen Inquisition aus den Jahren 1536 bis 1821. Aus der bestehenden digitalen Datenbank des portugiesischen Nationalarchivs extrahierte TraPrInq über 6.000 Bilder und transkribierte über eine Million Wörter für die Erstellung von Ground Truth

Um die Grundwahrheit zu schaffen und eine effiziente maßgeschneidertes ModellErstens musste eine angemessene Anzahl von Texten transkribiert werden und zweitens mussten die Texte aus verschiedenen Händen auf die Projektmitglieder verteilt werden. Hervé Baudry erklärt weiter: "Es gab ein Gebot der Quantität und Qualität, das bei jeder Sitzung nach der Schulung zum Modell erneuert wurde". Im Laufe von neun Schulungen, die im Juni 2022 begannen und im Juli 2023 endeten, transkribierte das Team den gesamten Korpus von 6000 digitalisierten Dokumenten. Nach der vierten Trainingssitzung des portugiesischen Texterkennungsmodells wurden die Ergebnisse immer effizienter, bis zu dem Punkt, an dem "die manuelle Transkription allmählich ersetzt werden konnte, indem nur noch die von der [Texterkennungs-]Maschine gemachten Fehler korrigiert wurden".

Bei der Transkription von beschädigten Dokumenten oder Aufzeichnungen mit komplexem Layout gab es noch Schwierigkeiten. "Solche Bilder haben einen CER über 15-20%", erklärt Baudry. 

Während es keine Möglichkeit gibt, Schäden an historischen Dokumenten rückgängig zu machen, hat Transkribus bereits die Layouterkennung mit neuen trainierbaren Layoutmodellen verbessert. Mit dem Feldmodelle (bereits verfügbar auf beta.transkribus.eu) und Tabellenmodelle (in Kürze) Transkribus-Modelle können so trainiert werden, dass sie knifflige Layouts wie Zeitschriften, Register, Gerichtsakten oder Formulare automatisch erkennen und transkribieren. 

Die endgültige Zeichenfehlerrate (CER) nach dem Training betrug 5,2%, womit die Genauigkeit des Transkribus-Texterkennungsmodells bei 94,8% lag.

Öffentliches Transkribus-Texterkennungsmodell: Portugiesische Handschrift 16.-19. Jahrhundert. 

Ein erfolgreiches Ergebnis des TraprInq-Projekts

Ziel des 18-monatigen TraPrInq-Projekts war es, ein öffentliches Texterkennungsmodell zu erstellen, das für jeden zugänglich ist. Und tatsächlich wurde im Sommer 2023 das neue Modell für die portugiesische Handschrift des 16. bis 19. Jahrhunderts für jeden Transkribus-Nutzer öffentlich zugänglich gemacht.

Das Modell finden Sie hier: Portugiesische Handschrift 16.-19. Jahrhundert

Baudry ist mit dem Ergebnis des Projekts zufrieden: "Mitglieder des Teams und Personen aus anderen Projekten, die sich an uns gewandt haben, haben das Modell mit hoher Effizienz genutzt". Hervé Baudry fügt hinzu, dass die von diesem neuen portugiesischen Modell automatisch erkannten Texte nicht Teil des TraPrInq-Projekts waren und aus nicht-inquisitorischen Quellen stammten. Das bedeutet, dass das Modell auch für andere Texte und Dokumenttypen geeignet ist. Diese Ergebnisse wurden auf der Abschlusstagung des Projekts vorgestellt, Humanidades Digitais e Estudos Inquisitoriais (Conference on Digital Humanities and Inquisitorial Studies) im Juni 2023.

Außerdem, so Baudry, diente das Projekt als erster Schritt zur systematischen Transkription von Dokumenten, um die digitalisierten und transkribierten Dokumente auf Transkribus Sites (ehemals Read&Search) verfügbar zu machen.

Im Rückblick auf das Projekt bringt Hervé Baudry seine Bewunderung für alle Teilnehmer am TraPrInq-Projekt die trotz der Ungewissheit des Ergebnisses "den Sprung gewagt haben, indem sie einfach meiner Einladung zur Teilnahme gefolgt sind". Und gemeinsam haben sie es geschafft, ihr Ziel zu erreichen. Er möchte auch seinen Dank an den verstorbenen Dirk Alvermann aussprechen

der in einer für TraPrInq entscheidenden Phase sein ganzes Können und seine Sympathie in den Dienst des Projekts gestellt hat.

Erschließung von Chancen für künftige Projekte

Erkennung von handgeschriebenem Text (HTR)-Technologie ist für die Archivgemeinschaft nicht neu, und obwohl das Interesse groß ist, gibt es nicht immer die Mittel, um sie in einer solchen Funktion zu nutzen. "TraPrInq war ein erster Schritt zu etwas Großem und Ehrgeizigem", bemerkt Hervé Baudry. Bisher wurde nur ein Bruchteil der insgesamt 3,4 Millionen Seiten des Inquisitionsarchivs untersucht, und nur ein kleiner Teil der 40.000 Akten aus dem portugiesischen Nationalarchiv wurde transkribiert und bearbeitet.

Baudry erklärt, dass dieses Transkribus-Modell als Instrument geschaffen wurde, um die Inquisitionsarchive besser zugänglich zu machen, und dass hoffentlich eines Tages alle Aufzeichnungen der portugiesischen Inquisition transkribiert und für alle lesbar gemacht werden.

Transkribus bietet das Potenzial, Informationen und Wissen aus historischen Dokumenten zu extrahieren und die schriftliche Vergangenheit zu erschließen. Mit der Möglichkeit, mithilfe der KI-gestützten Transkriptionssoftware individuelle Modelle zu trainieren, können Projekte wie TraPrInq haben die Möglichkeit, historische Dokumente zu transkribieren und sie für weitere Forschungen zur Verfügung zu stellen. 

In Bezug auf die Gerichtsverhandlungen der portugiesischen Inquisition kam Hervé Baudry zu dem Schluss, dass die HTR-Software von Transkribus in der Lage war, "ein doppeltes Geheimnis zu lüften, ein historisches und ein paläographisches".

Der Transkribus-Tipp von Hervé Baudry:

"Transkribus sieht vielleicht etwas kompliziert aus, aber in ein paar Stunden kann man es benutzen, und es lohnt sich."

Vorschaubild: Porträtfoto von Hervé Baudry. 

Übersicht