Forscher von OpenAI feiern einen vermeintlichen Mathematik-Durchbruch. Nach deutlichen Korrekturen aus der Community, unter anderem von Deepmind-Chef Demis Hassabis, nehmen sie ihre Aussagen zurück.
Ein mittlerweile gelöschter Tweet von OpenAI-Manager Kevin Weil sorgte für Aufsehen: GPT-5 habe "Lösungen für 10 (!) bisher ungelöste Erdős-Probleme gefunden" und bei weiteren elf Fortschritte erzielt. Diese Probleme seien "seit Jahrzehnten offen". Auch andere OpenAI-Forscher äußerten sich ähnlich.
Die Formulierungen suggerierten, GPT-5 habe eigenständig mathematische Beweise für komplexe Zahlentheorie-Probleme geliefert – ein potenzieller wissenschaftlicher Durchbruch und ein Hinweis auf die kreative Leistungsfähigkeit generativer KI.

Korrektur folgt schnell
Doch die Realität sah anders aus. Der Mathematiker Thomas Bloom, Betreiber von erdosproblems.com, widersprach umgehend. Die Aussage sei "eine dramatische Fehlinterpretation", schrieb Bloom. Die Kennzeichnung "offen" auf seiner Website bedeute lediglich, dass ihm persönlich keine Lösung bekannt sei – nicht, dass das Problem tatsächlich ungelöst sei. GPT-5 habe lediglich bereits existierende Arbeiten gefunden, die ihm entgangen waren.
Deepmind-CEO Demis Hassabis kritisierte die Darstellung als "peinlich", Metas KI-Forscher Yann LeCun spielt darauf an, dass OpenAI durch die eigenen überzogenen Versprechungen und den Wirbel um die eigenen GPT-Modelle nun selbst bloßgestellt und von den eigenen Aussagen eingeholt wird.
Die ursprünglichen Tweets wurden gelöscht oder relativiert. Dennoch bleibt die Frage, warum führende KI-Forscher so sorglos und ohne Überprüfung solche Fortschrittsnachrichten verbreiten in einem Umfeld, das ohnehin stark von Hype geprägt ist. Bubeck wusste um den eigentlichen Sachverhalt, verwendete dennoch eine zweideutige Aussage ("found solutions").
GPT-5 als wirkungsvolles Recherchewerkzeug
Dabei war der eigentliche Beitrag von GPT-5 bemerkenswert: Das Modell wurde erfolgreich als Recherchetool eingesetzt, um relevante Fachliteratur zu identifizieren. Das ist insbesondere bei Problemen mit uneinheitlicher Terminologie oder verstreuter Literatur hilfreich.
Der Mathematiker Terence Tao sieht genau darin das kurzfristige Potenzial von KI in der Mathematik: nicht beim Lösen der schwierigsten mathematischen Probleme, auch wenn es hier zuletzt isolierte Fortschrittsmeldungen gegeben hätte, sondern bei der Beschleunigung zeitaufwendiger Aufgaben wie der Literaturrecherche.
In einem Thread auf Mastodon beschreibt Tao, wie die GPT-gestützten Recherchen auf der Erdős-Website bereits zur Neubewertung mehrerer Probleme führten. Menschliche Erfahrung und Urteil seien dabei entscheidend, um die KI-Ausgaben zu prüfen, einzuordnen und sicher in bestehende Arbeitsabläufe zu integrieren.
Tao sagte bereits früher, generative KI könne in der Mathematik zu einer Art Industrialisierung des Feldes führen und so den Fortschritt beschleunigen.