Erfolgsgeschichte
Veröffentlicht: Vor 2 Monaten

Erstellung einer digitalen wissenschaftlichen Ausgabe der Lovelace-Papiere mit Jessica Cook

Erstellung einer digitalen wissenschaftlichen Ausgabe der Lovelace-Papiere mit Jessica Cook

Mathematik, Informatik, Musik, Poesie: Ada Lovelace war ein Mensch mit vielen Talenten. Die Mathematikerin aus dem 19. Jahrhundert - und Tochter des berühmt-berüchtigten romantischen Dichters Lord Byron - gilt dank ihrer Arbeit an Charles Babbages "Analytical Engine" als eine der Pioniere der modernen Computertechnik. Eine der bahnbrechendsten Ideen von Lovelace war, dass die Maschine nicht nur zum Rechnen verwendet werden kann: etwas, das sich in der heutigen Welt der Smartphones und Server als sehr zutreffend erweist.

Doch trotz der technischen Errungenschaften von Lovelace wissen wir erstaunlich wenig über ihr Leben. Obwohl im Lovelace-Archiv eine Fülle von Papieren und Dokumenten aufbewahrt wird, ist ein Großteil davon unzugänglich, was die wissenschaftliche Erforschung der Quellen erschwert. Doch das soll sich nun ändern.

Jessica Cook, Doktorandin in der englischen Abteilung der UCLAtranskribiert derzeit das gesamte Ada Lovelace-Archiv, um mehr über das Leben dieser erstaunlichen Mathematikerin herauszufinden. Sie hofft, dass wir durch die Erleichterung des Zugangs zu Lovelaces persönlichen Schriften einen besseren Einblick in Lovelaces Denken und in die Art und Weise erhalten, wie ihre Poesie ihre revolutionären Ideen über das Rechnen beeinflusst hat. Wir haben uns mit Jessica unterhalten, um mehr über dieses einzigartige Forschungsprojekt und ihre Erfahrungen mit Transkribus zu erfahren.

Zugriff auf das Ada Lovelace-Archiv

Nicht immer war das Interesse am Leben und Werk von Ada Lovelace so groß. In der Vergangenheit wurde ihrem männlichen Mitarbeiter Charles Babbage viel mehr Aufmerksamkeit geschenkt, während Lovelace lediglich als Assistentin angesehen wurde. "In vielen Berichten wurde Lovelace als naive und etwas starrköpfige junge Frau ohne fortgeschrittene mathematische Kenntnisse und ohne wirkliche Visionen dargestellt", erklärte Jessica. "Seit den späten 1970er Jahren gibt es jedoch eine Reihe von Studien, die sich eingehender mit dem intellektuellen Vermächtnis von Lovelace befassen. Zusammen zeigen sie überzeugend, dass sie tatsächlich über das erforderliche technische Wissen verfügte, um die Konzeption der Analytical Engine maßgeblich zu beeinflussen."

Die Bodleian Library der Universität Oxford ist für die Bewahrung der gesamten Lovelace-Sammlung verantwortlich. @ subherwal, verteilt unter einer CC-BY 2.0 Lizenz

Doch trotz des gestiegenen Interesses an Lovelaces Werk haben Wissenschaftler immer noch Schwierigkeiten, sich ein vollständiges Bild von ihrem Leben zu machen. Dies ist nicht auf einen Mangel an historischen Quellen zurückzuführen. In der Bodleian Bibliothek in Oxford gibt es eine große Sammlung von Briefen, Notizen und anderen Papieren, die alle von und an die bemerkenswerte Mathematikerin geschrieben wurden und eine Fülle von Einblicken in ihr Leben bieten. Der Zugang zu dieser umfangreichen Sammlung bleibt jedoch eine Herausforderung. Da das Lovelace-Archiv noch nie in einer vollständigen wissenschaftlichen Ausgabe veröffentlicht wurde, ist es für Forscher schwierig, es effektiv zu erforschen. "Die meisten Wissenschaftler, die heute über Lovelace arbeiten, haben nur Zugang zu einem unvollständigen und oft irreführenden Porträt ihres Lebens", erklärte Jessica. "Solange diese Lücke nicht geschlossen ist, wird unser Wissen über diese bemerkenswerte Frau notwendigerweise immer unvollständig sein. Überzeugt von dem Potenzial des Lovelace-Archivs, beschloss Jessica kühn, diese Lücke selbst zu schließen und eine vollständig transkribierte digitale Version des Lovelace-Archivs zu erstellen.

Wie man 14.000 Seiten transkribiert

Natürlich ist die Digitalisierung eines Archivs in diesem Umfang keine Kleinigkeit. Das Lovelace-Archiv umfasst rund 14 000 Seiten, für deren manuelle Transkription eine Einzelforscherin wie Jessica Jahre benötigen würde. Daher suchte sie nach einer zeitsparenderen Methode und fand zwei Möglichkeiten vor. "Die erste war das Crowd-Sourcing, das bereits erfolgreich von Projekten der digitalen Geisteswissenschaften wie dem Dickens Code Projekt ", erklärte Jessica. "Es gibt einige unglaubliche Vorteile, die sich aus dieser Art von öffentlichem Modell ergeben können, aber es birgt auch einige erhebliche Fallstricke". 

Crowd-Sourcing ist eine ziemlich ressourcenintensive Methode. Die Materialien müssen professionell digitalisiert werden, es ist viel Öffentlichkeitsarbeit und Schulung erforderlich und man muss mit vielen Teammitgliedern mit unterschiedlichem Engagement und Fachwissen zusammenarbeiten. "All diese Aufgaben kosten Zeit und Geld. Daher ist diese Art von Modell möglicherweise nicht die beste Lösung für Doktoranden, Postdoktoranden oder andere Personen, die außerhalb des akademischen Umfelds arbeiten."

Jessicas zweite Option war der Einsatz einer Software, die die Transkription automatisch vornimmt. Nach langer Suche in akademischen Blogs und Foren stieß sie auf die Transkribus Software zur Handschrifterkennung. Tranksribus verwendet KI-Modelle, um den Text in handschriftlichen Dokumenten in digitalen Text umzuwandeln, der dann in einer Datenbank gespeichert und über Tags und Metadaten durchsuchbar gemacht werden kann. "Durch das Training von KI-Modellen, die einen Großteil der eigentlichen Transkriptionsarbeit übernehmen, kann ich die Stichwortsuche nutzen, um Material zu finden, das für meine unmittelbaren Forschungsziele im Rahmen meiner Dissertation relevant ist, anstatt mich auf Vermutungen zu verlassen, wo relevantes Material zu finden sein könnte. 

Die Tatsache, dass Transkribus von einem Team von Akademikern entwickelt wurde, die sich mit dem Prozess der historischen Archivforschung auskennen, war für Jessica ebenso ein Schlüsselfaktor wie die ihr zur Verfügung stehenden Stipendienmöglichkeiten. Die Transkribus-Stipendienprogramm vergibt kostenlose Kredite an junge Forscher, die Transkribus für ihr Projekt nutzen wollen. Aufgrund der akademischen Bedeutung von Jessicas Projekt erhielt sie genügend Kredite, um die Transkription aller Seiten zu decken. "Dank des Stipendiums werde ich Transkribus nutzen können, um meine gesamte Sammlung zu transkribieren.

Erstellung des Lovelace AI-Modells mit Transkribus

Jessicas erster Schritt im Transkriptionsprozess bestand darin, genau zu erfahren, was mit Transkribus möglich ist. "Ich würde jedem, der ein Transkribus-Projekt beginnt, dringend empfehlen, sich die Zeit zu nehmen, die Website vollständig zu lesen und sich alle aufgezeichneten Fragen und Antworten auf YouTube", riet sie. Es standen so viele relevante Informationen zur Verfügung, dass Jessica begann, alles, was sie las, in einem persönlichen Trainingshandbuch zusammenzufassen, um es später nachschlagen zu können. "Am wichtigsten ist, dass ich mich mit meinen Fragen oft an das READ-COOP-Team gewandt habe, das mir bei der Beantwortung meiner Fragen sehr hilfreich war.  

Mit ihrem neu erworbenen Wissen machte sich Jessica daran, ihr KI-Modell mit Transkribus zu trainieren. Bislang hat sie etwa ein Zehntel der Sammlung transkribiert und ist mit den ersten Ergebnissen sehr zufrieden. Doch die Arbeit mit der Software verlief in mancher Hinsicht anders, als sie erwartet hatte. "Ursprünglich wollte ich erreichen, dass das Lovelace-Modell fast so gut funktioniert, wie ich lesen und transkribieren kann. Mit dem Fortschreiten meiner Arbeit hat sich meine Sichtweise auf diese gemeinsame Operation gewandelt. Während das Lovelace-Modell manchmal Wörter oder Buchstaben übersieht, die für das menschliche Auge relativ einfach erscheinen, hat es oft Wörter erkannt, die sowohl frühere Wissenschaftler als auch ich falsch entziffert haben. Bei diesem Prozess handelt es sich wirklich um eine Zusammenarbeit, bei der Mensch und Maschine unterschiedliche Fachkenntnisse einbringen."

Das korrekte Training des Lovelace-Modells ist in dieser Phase des Projekts besonders wichtig, da es die Grundlage für künftige Projektphasen bildet. Das Lovelace-Archiv enthält nicht nur Dokumente von Lovelace selbst, sondern auch von ihrem Ehemann William King und ihrer Mutter Lady Noel Byron, die ebenfalls transkribiert werden müssen. "Ich werde das Lovelace-Modell als Basismodell verwenden, um weitere Modelle für die Handschriften anderer wichtiger Autoren zu trainieren", erklärt Jessica - eine Strategie, die ihr in den kommenden Monaten sowohl Zeit als auch Transkriptionsaufwand ersparen wird und die Grundlage für die weitere Erforschung der Sammlung nach ihrer Promotion bildet.

Ein sinnvolles Projekt

Es gibt eine schöne Symmetrie in diesem Projekt. Ada Lovelace war eine der ersten Personen, die vorschlug, dass die Computer der Zukunft viel mehr können würden als nur Zahlen zu berechnen. Fast 200 Jahre später setzt Jessica Cook Computer ein, um Dokumente zu transkribieren, sie anzureichern, sie zu veröffentlichen und so mehr über das Leben dieser bemerkenswerten Frau zu erfahren. 

Die Mathematikerin Ada Lovelace war eine der Pionierinnen der modernen Computertechnik. @ Alfred Edward Chalon, verteilt unter einer CC-BY 2.0 Lizenz

"Ohne Lovelaces Beiträge zur Informatik überzubewerten, halte ich es für angemessen zu sagen, dass ihre intellektuelle Offenheit und Kreativität ein kleines Fenster zur Welt der wunderbaren digitalen Möglichkeiten geöffnet hat, in der wir uns heute befinden. Ich bin noch dabei, die volle konzeptionelle Tragweite dieser Frage zu ergründen, aber auf persönlicher Ebene würde ich gerne glauben, dass dieses Transkribus-Projekt eine stolze Erfüllung von Lovelaces frühen Einsichten ist."   

Jessicas Transkribus-Tipp

An alle, die mit dem Gedanken spielen, ein ähnliches Projekt in Angriff zu nehmen: Machen Sie es. Lassen Sie sich nicht von denjenigen entmutigen, die große digitale Projekte als Unterfangen abtun, das zu viel Arbeit ist, um von Doktoranden durchgeführt zu werden. Es ist wichtig, seine Grenzen zu kennen, aber ich glaube auch, dass die Zukunft der digitalen Forschung von Wissenschaftlern abhängt, die sich auf lösungsorientierte Ansätze für Herausforderungen konzentrieren.   

Übersicht