Ein fortgeschrittener Gemini-Agent hat bei den diesjährigen Weltmeisterschaften im studentischen Programmieren eine Leistung auf Goldmedaillenniveau erzielt – und dabei sogar ein Problem gelöst, an dem alle menschlichen Teams scheiterten.
Eine neue Version von Gemini 2.5 Deep Think, eine weiterentwickelte Version von Googles KI-Modellreihe, hat beim International Collegiate Programming Contest (ICPC) World Finals 2025 ein Ergebnis auf Goldmedaillenniveau erzielt. Der Wettbewerb gilt als weltweit renommierteste Programmierolympiade auf Hochschulebene.
Die diesjährige Endrunde fand am 4. September 2025 in Baku, Aserbaidschan, statt. Von nahezu 3.000 Universitäten und über 103 Ländern qualifizierten sich 139 Teams für das World Final. In einem fünfstündigen Wettbewerb mussten die Teilnehmer zwölf algorithmische Probleme lösen – korrekt und möglichst schnell, denn nur fehlerfreie Lösungen zählten, und jede Minute beeinflusste die Rangliste
KI löst zehn von zwölf Aufgaben
Gemini Deep Think trat unter offiziellen ICPC-Regeln in einer Online-Umgebung an, zehn Minuten nach dem Start der menschlichen Teams. Innerhalb von 45 Minuten löste das Modell acht Aufgaben, zwei weitere folgten innerhalb von drei Stunden. Insgesamt erreichte Gemini eine kombinierte Lösungszeit von 677 Minuten für zehn Aufgaben – das hätte im direkten Vergleich Platz zwei bedeutet.
Besonders bemerkenswert: Gemini löste Problem C, das von keinem menschlichen Team bewältigt wurde. Dabei ging es um die effiziente Verteilung von Flüssigkeit durch ein Netzwerk aus steuerbaren Röhren zu mehreren Reservoirs. Die Herausforderung bestand darin, unter unendlich vielen möglichen Konfigurationen die schnellstmögliche Befüllung aller Reservoirs zu finden.
Im Gegenzug scheiterte das System jedoch an Problem B und Problem G.
Fortschritte im abstrakten Denken
Laut Google Deepmind beruht Geminis Leistung auf Fortschritten in Pretraining, Posttraining, neuartigen Reinforcement-Learning-Methoden, mehrstufigem logischen Denken und paralleler Problemlösung. Im Rahmen des Reinforcement Learnings trainierte das Team das Modell an besonders schwierigen Programmieraufgaben. Mehrere Gemini-Agenten generieren dabei unterschiedliche Lösungsvorschläge, testen sie über virtuelle Terminals und iterieren auf Basis der Ergebnisse.
Vor kurzem hatte eine Variante von Gemini 2.5 Deep Think bereits eine Goldmedaille bei der Internationalen Mathematik-Olympiade (IMO) gewonnen. Die neue Version baut laut dem Unternehmen direkt auf dieser Variante auf.
Eine abgespeckte Version von Gemini 2.5 Deep Think steht Nutzern mit Google AI Ultra-Abonnement bereits über die Gemini-App zur Verfügung. Die IMO-Variante vereinzelten Testern. Laut Google könnten künftige Varianten deutlich leistungsfähigere Coding-Assistenten ermöglichen – etwa in Bereichen wie Softwareentwicklung, Logistik oder Forschung.
Symbol für Googles Ziele
Dr. Bill Poucher, Executive Director des ICPC, sieht in Geminis Erfolg einen Wendepunkt: "Dass Gemini in diesem Umfeld erfolgreich mitspielt und Ergebnisse auf Goldmedaillenniveau erzielt, markiert einen entscheidenden Moment für die Entwicklung der KI-Werkzeuge und akademischen Standards, die die nächste Generation braucht."
Die Fähigkeit, komplexe Probleme zu durchdringen, mehrstufige Lösungsstrategien zu entwickeln und diese korrekt umzusetzen, sei nicht nur für das Programmieren entscheidend – sondern auch für Bereiche wie Medikamentenentwicklung, Mikrochipdesign oder wissenschaftliche Forschung.
Laut Google Deepmind könnte Gemini künftig als kollaborativer Partner für Entwickler fungieren. In der Theorie hätte eine Kombination aus den besten menschlichen und KI-basierten Lösungen alle zwölf Wettbewerbsprobleme vollständig lösen können.
Wettlauf der KI-Systeme bei Olympiaden
Der Erfolg von Google folgt einem früheren Durchbruch des Konkurrenten OpenAI. Erst im August 2025 erreichte ein KI-System von OpenAI eine Goldmedaille bei der Internationalen Informatik-Olympiade (IOI), dem wichtigsten Programmierwettbewerb für Schüler. Das System wurde nur von fünf der 330 menschlichen Teilnehmer übertroffen.
Der entscheidende Punkt war laut OpenAI-Forscher Noam Brown, dass auch hier kein spezialisiertes Modell, sondern ein allgemeines Logik-Modell zum Einsatz kam – dasselbe, das zuvor bereits bei der Internationalen Mathematik-Olympiade erfolgreich war. Dies markierte einen enormen Fortschritt gegenüber dem Vorjahr, als OpenAI mit einem aufwendig angepassten System eine Medaille noch knapp verfehlte. Der jetzige Erfolg von Google beim ICPC, einem Wettbewerb auf Hochschulebene, verschärft den Wettlauf um die leistungsfähigsten KI-Systeme. Es ist davon auszugehen, dass auch OpenAI eines seiner Systeme beim ICPC hat antreten lassen.