KI in der Praxis

Neue Deepmind-KI übersetzt und lokalisiert antike Texte

Matthias Bastian

Deepmind

Mit der KI-Software Ithaca sollen Historiker und Historikerinnen antike Texte besser entziffern, lokalisieren und datieren können.

Das neue KI-Modell setzt auf einer Deepmind Forschungsarbeit aus 2019 auf: Die Entzifferungs-KI "Pythia", benannt nach dem Orakel von Delphi, übersetzt altgriechische Texte und macht Historker:innen nach Wahrscheinlichkeit sortierte Übersetzungsvorschläge.

Die KI wurde mit einem digitalen Datensatz griechischer Inschriften trainiert und konnte bei damaligen Tests die Leistung von Menschen deutlich übertreffen. KI-Übersetzungen lagen zu etwa 70 Prozent richtig, Epigraphen schafften 43 Prozent.

Schon damals galt allerdings: Das KI-Modell ist ein Werkzeug für menschliche Profis. Es soll sie nicht ersetzen.

Ithaca erweitert Pythia und bemüht sich um Transparenz

So ist es auch beim neuen transformerbasierten KI-Modell, das den Namen der griechischen Insel Ithaca aus Homer's Odyssey trägt. Es erweitert die Möglichkeiten für Historiker:innen um Raum und Zeit:

Trainiert ist Ithaca mit einem Datensatz von 78608 antiken griechischen Inschriften. Jede Inschrift ist dabei von Historiker:innen mit Metadaten zu Ort und Zeit versehen. Anhand der Muster in diesem Datensatz analysiert Ithaca dann neue Inschriften.

Ithaca berücksichtigt bei der Textanalyse sowohl ganze Wörter als auch einzelne Zeichen, damit etwa Wortreihenfolgen wie "Es war einmal", die in ihrem Zusammenhang mehr bedeuten als die jeweils einzelnen Wörter, korrekt übersetzt werden können.

Bei solchen zerstörten Inschriften hilft Ithaca, fehlende Buchstaben zu ergänzen. Sie analysiert dabei ganze Wörter ebenso wie einzelne Buchstaben und Zeichen. Übersetzungen schlägt sie nach Wahrscheinlichkeit vor. | Bild: Deepmind

Transparenz stellt das KI-Modell über eine sogenannte Salienzkarte her: Die Computer-Vision-Technik visualisiert mit verschiedenen Farbintensitäten, welche Sequenzen bei der Vorhersage von Text, Ort und Datum eine mehr oder minder starke Rolle spielen.

Antikes Wissen schneller entschlüsseln

Laut Deepmind erreicht Ithaca bei Tests eine Genauigkeit von 62 Prozent bei der Wiederherstellung von historischen Texten. Historiker:innen schafften ohne maschinelle Hilfe eine Genauigkeit von nur 25 Prozent. In Zusammenarbeit mit dem KI-Modelle erreichten sie eine Genauigkeit von 72 Prozent.

Bei der Ortsangabe erreicht Ithaca eine Genauigkeit von 71 Prozent, bei der Zeitangabe schafft die KI die korrekte Zuordnung innerhalb einer Zeitspanne von weniger als 30 Jahren. Wichtige Texte des klassischen Athens könnten so neu datiert werden, was ein signifikanter Beitrag sei zur wissenschaftlichen Debatte in der antiken Geschichte, schreiben die Deepmind-Forschenden.

Beispiel für eine Ergebnisvisualisierung durch die Ithaca-KI nach der Analyse einer Inschrift. Oben sind die Text-Hypothesen, links unten die geographische Zuordnung nach Wahrscheinlichkeit, rechts die wahrscheinliche zeitliche Einordnung. | Bild: Deepmind

Ferner sehen Deepminds Forscher:innen Ithaca als starkes Beispiel für das Potenzial einer Mensch-KI-Kollaboration und für den Einsatz Künstlicher Intelligenz, um den Fortschritt in anderen Wissenschaften zu beschleunigen. Weitere Beispiele für diesen Wissenschafts-Boost durch KI gibt es im Bereich der Materialwissenschaften, der Mathematik und der Kernfusion.

"Wir glauben, dass dies erst der Anfang für Tools wie Ithaca und das Potenzial für die Zusammenarbeit zwischen maschinellem Lernen und den Geisteswissenschaften ist", schreibt das Deepmind-Team.

Das Team plant bereits die Erweiterung des KI-Modells um weitere antike Sprachen wie Latein und Maya. Neben Inschriften könnten auch andere geschriebene Medien wie Papyri und Manuskripte analysiert werden.

Das bisher trainierte Modell und die Forschungsergebnisse sind öffentlich zugänglich: Ithaca ist als Open-Source-Modell und als interaktive Version im Browser verfügbar.

Weiterlesen über Künstliche Intelligenz:

Quellen: