Anzeige
Skip to content

Deepmind-Chef sieht drei KI-Themen für 2026: Multimodal, interaktiv und autonom

Demis Hassabis, CEO von Google Deepmind, erwartet in den nächsten zwölf Monaten Fortschritte bei der Konvergenz multimodaler Modelle, interaktiven Videowelten und verlässlichen KI-Agenten. Besonders die Multimodalität von Gemini ermögliche neue Anwendungen, erklärte Hassabis auf dem Axios AI+ Summit. Als Beispiel nannte er eine Szene aus dem Film "Fight Club", in der die KI das Ablegen eines Rings philosophisch als Symbol für den Verzicht auf den Alltag deutete. Auch das neueste Bildmodell von Google nutzt diese multimodalen Fähigkeiten, um visuelle Inhalte präzise zu verstehen und etwa Infografiken zu erstellen.

Zudem arbeitet Google Deepmind weiter an "Weltmodellen" wie Genie 3, die interaktive, begehbare Videoräume erzeugen. Hassabis prognostiziert auch, dass KI-Agenten in einem Jahr "nahe dran" sein werden, komplexere Aufgaben verlässlich und eigenständig zu erledigen. Ziel sei ein universeller Assistent, der Nutzer über verschiedene Geräte hinweg im Alltag begleitet.

Anzeige
DEC_D_Incontent-1

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar“‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.