Deepmind-Chef Hassabis: Weltmodelle sind die Zukunft, aber die KI-Blase ist real
Kurz & Knapp
- Demis Hassabis sieht in „Weltmodellen“ wie SIMA 2 und Genie 3 den nächsten Schritt der KI-Entwicklung, warnt aber vor hohen Kosten und technischen Hürden.
- Er spricht von einer möglichen Blase auf dem privaten KI-Markt, hält Googles auf DeepMind gestützte Strategie jedoch für robust.
- Eine echte AGI erwartet Hassabis erst in fünf bis zehn Jahren – Fortschritte sollen weniger durch Skalierung, sondern durch gezielte Forschung kommen.
Mit Gemini 3 Pro will Google die KI-Führung zurückerobern. Doch Deepmind-CEO Demis Hassabis blickt bereits auf die nächste, teure Stufe der KI-Entwicklung, warnt vor einer Blase im Privatmarkt und erklärt, warum Googles Langfrist-Strategie aufgeht.
Google hat nach einer von Mitarbeitenden und CEO Sundar Pichai befeuerten Hype-Phase sein neustes KI-Modell, Gemini 3 Pro, veröffentlicht. Laut Demis Hassabis, CEO von Google Deepmind, war das Ziel, das beste Allround-Modell zu schaffen und dabei Schwächen früherer Versionen in den Bereichen Programmierung, logisches Denken und Mathematik zu beheben. Laut einem Interview mit Hassabis ist das Modell ein wichtiger Baustein für eine zukünftige allgemeine künstliche Intelligenz (AGI).
Erste Berichte bescheinigen dem Modell Spitzenleistungen. Josh Woodward, Vizepräsident bei Google, hob im Podcast "Hard Fork" hervor, dass Gemini 3 besser darin sei, Gedankengänge über mehrere Schritte beizubehalten. Zudem könne es für Nutzer benutzerdefinierte Schnittstellen generieren, etwa interaktive Tutorials oder Rechner.
Die potenzielle Nutzerbasis ist bereits enorm: Laut Google hat die Gemini-App über 650 Millionen monatliche Nutzer, während zwei Milliarden Menschen monatlich über die KI-Übersichten in der Suche mit Gemini in Kontakt kommen. Um das Wachstum weiter anzukurbeln, erhalten alle US-College-Studenten ein Jahr lang kostenlosen Zugang zu einer bezahlten Version von Gemini.
Weltmodelle als nächste KI-Grenze – mit hohen Kosten verbunden
Während Gemini 3 ausgerollt wird, richtet Hassabis seinen Blick bereits auf die nächste Forschungsfront: Weltmodelle. Er verbringe den Großteil seiner Forschungszeit mit diesem Thema und nennt Projekte wie SIMA 2 und das Video-Generierungsmodell Genie 3 als Beispiele. Diese Modelle, die intern bereits zum Training von Robotern und anderen Agenten genutzt werden, sollen laut Hassabis entscheidend für das Erreichen von AGI sein.
Er prognostiziert für Weltmodelle einen "ChatGPT-Moment", also einen Durchbruch in der öffentlichen Wahrnehmung und Verfügbarkeit. Die größten Hindernisse seien jedoch der Preis und aktuelle technische Hürden. "Wir würden Genie gerne mehr Menschen in die Hand geben, aber es ist teuer", so Hassabis. Der Grund sei, dass jeder Nutzer quasi eine neue Instanz der Erstellung des Modells sei. Bevor eine Skalierung möglich sei, müssten neben dem Kostenproblem aber auch Herausforderungen wie die Fähigkeit, die generierten Welten "länger als eine Minute konsistent" zu halten, gelöst werden.
Hassabis warnt vor KI-Blase und bekräftigt Googles "Maschinenraum"-Strategie
Angesprochen auf eine mögliche KI-Blase, zeigte sich Hassabis differenziert. Er sehe "offensichtlich eine Blase auf dem privaten Markt". Als Beispiel nannte er Seed-Finanzierungsrunden, bei denen Start-ups mit "im Grunde nichts" Bewertungen von zig Milliarden Dollar erhielten. Das sei "ein wenig unhaltbar" und "nicht ganz logisch".
Für Google gelte das jedoch nicht. Hassabis verwies auf seine These von vor zwölf Jahren, als Deepmind zu Google kam: Die KI-Forschung sollte zum "Maschinenraum" für die Produkte von Google werden. Diese Strategie zahle sich nun aus, indem Gemini bestehende Dienste wie die Suche, YouTube und die Cloud antreibe und so unmittelbare Erträge liefere. "Was auch immer passiert, ich habe das Gefühl, dass wir in einer wirklich starken Position sind, um an der Spitze zu stehen", so Hassabis. Ob die Blase platzt oder nicht, Google sei für beide Szenarien gut aufgestellt.
Der Weg zur AGI: Skalierung allein reicht nicht mehr aus
Trotz der Fortschritte mit Gemini 3 bleibt Hassabis bei seiner Einschätzung, dass eine echte AGI noch fünf bis zehn Jahre entfernt sei. Es seien noch "ein oder zwei weitere Durchbrüche" nötig, insbesondere bei der Zuverlässigkeit, dem logischen Denken und dem Gedächtnis der Modelle.
Zur reinen Skalierung sagte er, zwar gebe es "abnehmende Erträge" beim Vergrößern der Modelle, aber der Fortschritt sei keineswegs null. Die Investition lohne sich weiterhin, auch wenn sie nicht mehr zu exponentiellem Wachstum führe.
Wenn Menschen von abnehmenden Erträgen hören, denken sie: Entweder ist es null oder exponentiell, richtig? Aber da gibt es auch etwas dazwischen. Es kann also durchaus abnehmend sein. Es ist nicht so, dass sich der Fortschritt in jeder Generation exponentiell verdoppelt – aber es lohnt sich trotzdem sehr. Und der Ertrag auf diese Investition ist extrem gut. Ich denke, wir befinden uns gerade in dieser Phase.
Gleichzeitig warnte er, dass die verbesserten Fähigkeiten der Modelle, wie die Nutzung externer Tools ("Function Calling"), auch neue Risiken schaffen. Insbesondere im Bereich der Cybersicherheit müsse man "doppelt vorsichtig" sein, um Missbrauch zu verhindern.