Demis Hassabis, CEO von Deepmind, sieht eine Zukunft mit KI-Agenten, die nicht nur Fragen beantworten, sondern auch planen und handeln können. Diese Systeme könnten schon in ein bis zwei Jahren einsatzbereit sein.
Demis Hassabis, CEO von Google Deepmind, erwartet in naher Zukunft KI-Systeme, die nicht nur Fragen beantworten, sondern auch selbstständig planen und handeln können. In einem Interview mit Bloomberg sagt Hassabis, sein Unternehmen arbeite an solchen "agentenähnlichen" Systemen, die in ein bis zwei Jahren einsatzbereit sein könnten.
"Ich bin wirklich gespannt auf die nächste Stufe dieser großen, allgemeinen Modelle", sagt Hassabis. "Ich denke, dass wir vielleicht in diesem Jahr, vielleicht im nächsten Jahr, ein Verhalten sehen werden, das dem von Agenten ähnlicher ist. Systeme, die nicht nur Fragen für einen beantworten, sondern auch planen und Ziele in der Welt verfolgen können."
Hassabis sieht darin den nächsten Schritt, um KI-Systeme im Alltag noch nützlicher zu machen. Deepmind könne dabei auf seine Erfahrungen im Bereich des bestärkenden Lernens (Reinforcement Learning) zurückgreifen, die das Unternehmen bereits bei seinem berühmten Go-Spielprogramm AlphaGo eingesetzt hat.
"Wir bringen einige der Arbeiten zurück, die wir vor Jahren mit Spielen gemacht haben, bei denen es sich um Agentensysteme handelte, und kombinieren sie mit modernen, großen, multimodalen Arbeiten", erklärt Hassabis.
Reden und Handeln
Bereits vor der Vorstellung des Sprachmodells Gemini im Juni 2023 hatte Hassabis gegenüber Wired angedeutet, dass das Know-how des Unternehmens im Bereich Reinforcement Learning Gemini besondere Eigenschaften verleihen könnte.
Durch den Einsatz von AlphaGo-Techniken wie Reinforcement Learning und Tree Search soll Gemini erweiterte Problemlösungs- und Planungsfähigkeiten bieten.
Die Aussagen von Hassabis deuten darauf hin, dass Deepmind seine KI-Systeme konsequent in Richtung autonomer Agenten weiterentwickelt.
Sollte es Deepmind gelingen, KI-Agenten zu entwickeln, die in der Lage sind, komplexe Aufgaben in der realen Welt selbstständig zu lösen, hätte dies weitreichende Auswirkungen. Die Anwendungsmöglichkeiten reichen von intelligenten persönlichen Assistenten über autonome Roboter bis zu selbstlernenden Systemen in Wissenschaft und Forschung.
Neben Gemini arbeitet das Unternehmen auch an Projekten wie dem Roboterprogramm RT-2, das ebenfalls große KI-Modelle für Bild- und Sprachverarbeitung einsetzt, um KI, verkörpert in einem Roboter, im Alltag handlungsfähiger zu machen.
Mit dem Ansatz, Sprachmodelle mit Agententechnologien zu kombinieren, verfolgt Deepmind eine ähnliche Vision wie OpenAI und Anthropic. Auch diese Unternehmen arbeiten an KI-Agenten, die kommunizieren und handeln können.
KI wird sich für die Menschheit lohnen
Kritiker warnen vor dem enormen Energiebedarf großer KI-Modelle beim Training und Inferencing. Der Energiehunger wächst mit zunehmender Skalierung.
Hassabis teilt diese Bedenken nicht: Er ist überzeugt, dass sich die Entwicklung langfristig für die Menschheit auszahlen wird.
"Ich denke, dass der Nutzen der generativen KI-Modelle, die wir bauen, etwa für die Medikamentenentdeckung und andere Dinge, diese Kosten langfristig bei Weitem überwiegen wird."
KI habe enormes Potenzial, auch in Bereichen wie Energie und Klima zu helfen, etwa durch effizientere Stromnetze, neue Materialien und Technologien. Sie könne außerordentlich produktiv und hilfreich sein und die Kosten und Mühen, die mit dem Bau dieser Systeme verbunden sind, weit übertreffen.
Es gehe darum, KI auf möglichst viele Bereiche anzuwenden. Dann könne die Entwicklung nachhaltig sein, so Hassabis.