Ein neues KI-Modell namens Aeneas soll Historikern helfen, fragmentarische antike Texte schneller zu restaurieren, zu datieren und zu kontextualisieren. Es wurde in Zusammenarbeit mit mehreren Universitäten entwickelt und in der Fachzeitschrift Nature vorgestellt.
In der römischen Welt war Schrift allgegenwärtig, von kaiserlichen Monumenten bis hin zu Alltagsgegenständen. Viele dieser Texte sind jedoch fragmentarisch, verwittert oder absichtlich beschädigt. Ihre Rekonstruktion und Einordnung ist eine komplexe und zeitaufwendige Arbeit. Google Deepmind hat nun ein KI-Modell namens Aeneas vorgestellt, das diesen Prozess beschleunigen soll.
Das Modell wurde in Zusammenarbeit mit der University of Nottingham und Forschern der Universitäten Warwick, Oxford und der Wirtschaftsuniversität Athen entwickelt. Laut Google Deepmind kann Aeneas Tausende von lateinischen Inschriften analysieren und in Sekundenschnelle textuelle und kontextuelle Parallelen finden. Um die Forschung zu fördern, stellen die Entwickler eine interaktive Version von Aeneas auf der Webseite predictingthepast.com frei zur Verfügung und haben den Code sowie den zugrundeliegenden Datensatz als Open Source veröffentlicht.
Multimodale Analyse für präzisere Ergebnisse
Aeneas baut auf dem früheren Modell Ithaca auf, das für griechische Inschriften entwickelt wurde, geht aber laut den Forschern einen Schritt weiter. Es soll nicht nur bei der Wiederherstellung helfen, sondern auch bei der Interpretation und Kontextualisierung. Als erstes Modell seiner Art kann Aeneas zudem multimodale Eingaben verarbeiten, also sowohl Text als auch Bilder einer Inschrift nutzen, um deren geografische Herkunft zu bestimmen. Eine weitere Neuerung ist die Fähigkeit, Lücken von unbekannter Länge in beschädigten Texten zu füllen.
Das Modell erreicht laut dem Paper eine Genauigkeit von 72 % bei der Zuordnung zu einer von 62 römischen Provinzen und kann Texte auf 13 Jahre genau datieren. Bei der Wiederherstellung von Lücken mit bis zu zehn Zeichen liegt die Top-20-Genauigkeit bei 73 %, bei Lücken unbekannter Länge immer noch bei 58 %.
Ein neuer Blick auf historische Debatten
Um die Fähigkeiten des Modells zu testen, wurde es auf eine der berühmtesten römischen Inschriften angesetzt: die "Res Gestae Divi Augusti", den Tatenbericht von Kaiser Augustus. Die Datierung dieses Textes ist unter Historikern seit Langem umstritten. Aeneas lieferte keine einzelne Datierung, sondern eine Wahrscheinlichkeitsverteilung mit zwei Gipfeln: einem kleineren um 10-1 v. Chr. und einem größeren zwischen 10-20 n. Chr. Damit, so die Forscher, habe das Modell die beiden vorherrschenden wissenschaftlichen Hypothesen quantitativ erfasst, basierend auf subtilen linguistischen Merkmalen und historischen Markern im Text.
In einer Studie zur Zusammenarbeit zwischen Mensch und KI arbeiteten 23 Historiker mit Aeneas. Das Ergebnis zeigte, dass die besten Resultate erzielt wurden, wenn die Experten die Vorhersagen des Modells mit den von ihm gelieferten Kontextinformationen kombinierten. Die Historiker gaben an, dass Aeneas ihre Arbeit beschleunigte und ihr Vertrauen bei komplexen Aufgaben erhöhte. "Aeneas' Parallelen haben meine Wahrnehmung der Inschrift komplett verändert", wird ein anonymisierter Teilnehmer zitiert. "Es hat Details bemerkt, die für die Wiederherstellung und chronologische Zuordnung den entscheidenden Unterschied machten."
Das Team plant, die Technologie auch in das bestehende Griechenland-Modell Ithaca zu integrieren.