Inhalt
summary Zusammenfassung

Google stellt eine neue Version seines KI-Modells Gemini vor, die durch längere "Denkzeit" komplexe Probleme lösen soll. Die Technologie ist eine Variante des Modells, das bei der Mathematik-Olympiade erfolgreich war, wirft laut Googles eigener Analyse aber auch neue Sicherheitsfragen auf.

Anzeige

Google hat eine neue, leistungsfähigere Version seines KI-Modells namens Deep Think veröffentlicht. Laut der Ankündigung des Unternehmens steht die Funktion ab sofort Abonnenten des Tarifs Google AI Ultra in der Gemini-App zur Verfügung. Diese Version soll eine deutliche Verbesserung gegenüber der auf der Entwicklerkonferenz I/O angekündigten Fassung sein und auf dem Feedback von Testern sowie auf neuen Forschungserkenntnissen basieren.

Die neue Funktion lässt sich in der App über einen Schalter aktivieren und ist auf eine feste Anzahl von Anfragen pro Tag beschränkt. Sie integriert automatisch Tools wie Code-Ausführung und Google Suche und kann deutlich längere Antworten generieren.

Paralleles Denken für komplexe Probleme

Die Kerntechnologie von Deep Think basiert laut Google auf Techniken des parallelen Denkens. Ähnlich wie ein Mensch, der ein komplexes Problem von verschiedenen Seiten beleuchtet, soll das KI-Modell viele Ideen gleichzeitig generieren, bewerten und kombinieren, um zur besten Lösung zu gelangen. Dafür wird dem Modell mehr Inferenzzeit, also "Denkzeit", zugestanden.

Anzeige
Anzeige

Diese Idee ist nicht neu: Schon lange gibt es Ansätze wie Self Consistency, Tree-of-Thought oder XOT, aber im Falle von Deep Think sollen zusätzlich neuartige Reinforcement-Learning-Methoden das Modell dazu anregen, diese erweiterten Denkpfade wirklich produktiv zu nutzen und so mit der Zeit zu einem besseren Problemlöser zu werden. Laut dem Model Card basiert Gemini 2.5 auf einer Sparse-Mixture-of-Experts (MoE) Architektur und hat ein Kontextfenster von einer Million Token für die Eingabe und 192.000 Token für die Ausgabe.

Bild: Google

Google sieht die Stärken von Deep Think bei Aufgaben, die Kreativität und strategische Planung erfordern. Dazu gehören die iterative Entwicklung, wie die Verbesserung von Ästhetik und Funktionalität bei Webentwicklungsaufgaben, die Unterstützung bei der wissenschaftlichen und mathematischen Forschung sowie die Lösung komplexer Programmieraufgaben.

In Benchmarks zeigt Gemini 2.5 Deep Think eine hohe Leistung. Es erreicht bei LiveCodeBench V6 (Code-Generierung) 87,6 % und bei Humanity's Last Exam (Wissen und logisches Denken) 34,8 %, womit es Konkurrenzmodelle wie OpenAI o3 und Grok 4 in Fällen ohne Tool-Use deutlich übertrifft.

Deep Think schlägt die Konkurrenz insbesondere dann, wenn keine Tools helfen.
Bild: Google Deepmind

Verbindung zur Mathematik-Olympiade und neue Sicherheitsbedenken

Die jetzt veröffentlichte Version ist eine Variante des Modells, das bei der Internationalen Mathematik-Olympiade (IMO) den Standard einer Goldmedaille erreichte. Während die IMO-Version Stunden für die Lösung von Problemen benötigt, ist die öffentliche Version schneller und für den täglichen Gebrauch optimiert. Sie erreicht laut internen Auswertungen immer noch das Niveau einer Bronze-Medaille im IMO-Benchmark 2025. Die vollständige Gold-Version wird einer kleinen Gruppe von Mathematikern und Akademikern für Forschungszwecke zur Verfügung gestellt.

Gleichzeitig wirft die gesteigerte Leistungsfähigkeit aber auch neue Sicherheitsfragen auf. Die Model Card des Modells beschreibt eine umfassende Sicherheitsbewertung im Rahmen des "Frontier Safety Framework" (FSF). Diese wurde aufgrund "außergewöhnlicher Unterschiede" zu früheren Modellen durchgeführt.

Empfehlung

Die Analyse ergab, dass Deep Think in bestimmten Risikobereichen eine kritische Schwelle erreicht hat. Im Bereich CBRN (chemische, biologische, radiologische und nukleare Risiken) hat das Modell womöglich die "Frühwarnschwelle" ("early warning alert threshold") für "Uplift Level 1" erreicht. Das bedeutet, es verfügt über ausreichend technisches Wissen, um Akteuren mit geringen Ressourcen bei der Entwicklung von Massenvernichtungswaffen erheblich zu helfen. Google gibt an, dass weitere Untersuchungen notwendig seien, um das Risiko final zu bewerten, aber bereits "vorsorglich" Gegenmaßnahmen ergriffen habe.

Auch im Bereich Cybersicherheit erfüllt das Modell weiterhin die Frühwarnschwelle, die bereits von Gemini 2.5 Pro erreicht wurde. Es zeigt zwar verbesserte Leistungen, hat aber weiterhin Schwierigkeiten mit den anspruchsvollsten, realitätsnahen Szenarien.

Als Reaktion auf diese Ergebnisse hat Google nach eigenen Angaben mehrere Schutzmaßnahmen implementiert. Dazu gehören die Filterung gefährlicher Antworten, eine mehrstufige Überwachung der Nutzung, die Sperrung missbräuchlicher Konten und kontinuierliche Tests der Schutzsysteme durch Red-Teaming.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Google veröffentlicht Gemini 2.5 Deep Think, eine neue Version seines KI-Modells, die durch längere "Denkzeit" und parallele Denkprozesse komplexe Probleme lösen soll und ab sofort für Google AI Ultra-Abonnenten verfügbar ist.
  • Das Modell basiert auf einer Variante der KI, die bei der Internationalen Mathematik-Olympiade Goldmedaillen-Niveau erreichte, und übertrifft in Benchmarks Konkurrenzmodelle wie OpenAI o3 bei Code-Generierung (87,6%) und logischem Denken (34,8%).
  • Googles Sicherheitsanalyse zeigt, dass Deep Think möglicherweise eine kritische Schwellen in CBRN-Risiken erreicht hat und Akteuren mit geringen Ressourcen bei der Entwicklung von Massenvernichtungswaffen helfen könnte, weshalb das Unternehmen Schutzmaßnahmen wie Antwortfilterung und Nutzerüberwachung implementiert hat.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!