Google Deepmind stellt mit AlphaGeometry ein neues KI-System vor, das beim Lösen von Geometrieaufgaben fast an die Fähigkeiten der weltbesten Schülerinnen und Schüler heranreicht.
Laut einer am Mittwoch in Nature veröffentlichten Studie beantwortete AlphaGeometry von Google Deepmind 25 von 30 Fragen der Internationalen Mathematik-Olympiade (IMO) für Schülerinnen und Schüler richtig.
Zum Vergleich: Das bisherige Spitzenmodell löste zehn dieser Geometrieaufgaben, während der menschliche Goldmedaillengewinner im Durchschnitt 25,9 Aufgaben löste.
Diese Leistung kommt dem Goldmedaillenstandard der menschlichen Teilnehmerinnen und Teilnehmer sehr nahe und unterstreicht laut Deepmind die wachsende Kompetenz von KI im mathematischen Bereich.
Die Herausforderungen an logisches Denken und Lernen, die komplexe Mathematik mit sich bringt, machen sie zu einem wichtigen Test auf dem Weg zu einer künstlichen allgemeinen Intelligenz (AGI), die dem Menschen ebenbürtig oder sogar überlegen ist.
Der am Projekt beteiligte Deepmind-Forscher Quoc V Le spricht gegenüber der Financial Times sogar von einem "wichtigen Schritt" auf dem Weg zur Entwicklung einer AGI.
"Es ist ein weiteres Beispiel dafür, wie KI uns helfen kann, die Wissenschaft voranzubringen und die zugrundeliegenden Prozesse, die bestimmen, wie die Welt funktioniert, besser zu verstehen."
Wie funktioniert AlphaGeometry?
AlphaGeometry ist ein sogenanntes neuro-symbolisches System, das Spracherwerb und deduktives Denken kombiniert. Das System verbindet die Vorhersagekraft eines neuronalen Sprachmodells mit einer regelbasierten Deduktionsmaschine, die gemeinsam Lösungen finden.
Das Sprachmodell dient dabei als eine Art Lösungsassistent, der der symbolischen Einheit neue Vorgehensweisen vorschlägt, wenn diese zunächst keine Lösung findet.
Google Deepmind vergleicht diesen Ansatz mit dem von dem Psychologen Daniel Kahneman geprägten Begriff "Fast Thinking, Slow Thinking", der die Stärke der schnellen Mustererkennung mit der Bedachtsamkeit des logischen Denkens verbindet.
Manche in der KI-Forschung gehen davon aus, dass die Zukunft der KI in solchen hybriden Systemen liegt. Rein korrelationsbasierte KI-Systeme wie große Sprachmodelle haben oft Schwierigkeiten mit komplexen geometrischen und mathematischen Problemen, weil ihnen die logischen Fähigkeiten und die Verlässlichkeit fehlen.
AlphaGeometry erzeugt seine Trainingsdaten selbst, indem es zufällige geometrische Diagramme aus Formen und Linien generiert. Anschließend identifiziert und rekonstruiert das System alle Verbindungen, Beziehungen und Beweise innerhalb dieser Diagramme. Dieser Prozess ermöglicht es AlphaGeometry, Geometrie zu lernen und zu verstehen, ohne auf menschliche Demonstration oder Anleitung angewiesen zu sein.
Deepmind bezeichnet diese Technik als "symbolische Deduktion und Rückverfolgung". Damit umgeht das Team das Problem fehlender Trainingsdaten in der Mathematik.
Der fertige Datensatz besteht aus einer Milliarde zufälliger, einzigartiger Diagramme geometrischer Objekte, wobei alle Beziehungen zwischen den Punkten und Linien in jedem Diagramm abgeleitet wurden.
Logisches Denken: Noch ist der Mensch überlegen
Trotz dieser beeindruckenden Leistung stieß AlphaGeometry auf einige Probleme, die es nicht lösen konnte, wie ein Rätsel über sich überschneidende Kreise, das der vietnamesische Mathematiker Lê Bá Khánh Trình bei der Olympiade 1979 gelöst hatte.
Obwohl AlphaGeometry nur auf ein Drittel der Olympia-Probleme angewendet werden kann, ist es das erste KI-Modell der Welt, das bei den Olympischen Spielen 2000 und 2015 die Schwelle zur Bronzemedaille überschritten hat.
Die Forscher hoffen, dass AlphaGeometry und andere Ansätze zur synthetischen Datengenerierung und zum Training neue Möglichkeiten in Mathematik, Wissenschaft und KI eröffnen werden.
Ein noch größeres Ziel von Deepmind ist es, KI-Systeme zu schaffen, die mathematische Probleme lösen können, die sich für den menschlichen Verstand als zu komplex erwiesen haben.
Deepmind hat noch keine Pläne, offiziell an der Internationalen Mathematik-Olympiade teilzunehmen, schließt dies aber nicht aus. Deepmind stellt Code und Modell als Open Source bei Github zur Verfügung.