Demis Hassabis, CEO von Google Deepmind, erwartet in den nächsten zwölf Monaten Fortschritte bei der Konvergenz multimodaler Modelle, interaktiven Videowelten und verlässlichen KI-Agenten. Besonders die Multimodalität von Gemini ermögliche neue Anwendungen, erklärte Hassabis auf dem Axios AI+ Summit. Als Beispiel nannte er eine Szene aus dem Film "Fight Club", in der die KI das Ablegen eines Rings philosophisch als Symbol für den Verzicht auf den Alltag deutete. Auch das neueste Bildmodell von Google nutzt diese multimodalen Fähigkeiten, um visuelle Inhalte präzise zu verstehen und etwa Infografiken zu erstellen.
Zudem arbeitet Google Deepmind weiter an "Weltmodellen" wie Genie 3, die interaktive, begehbare Videoräume erzeugen. Hassabis prognostiziert auch, dass KI-Agenten in einem Jahr "nahe dran" sein werden, komplexere Aufgaben verlässlich und eigenständig zu erledigen. Ziel sei ein universeller Assistent, der Nutzer über verschiedene Geräte hinweg im Alltag begleitet.
Google erweitert Earth AI: Neue KI-Funktionen für Katastrophenhilfe und Umweltüberwachung
Google verknüpft seine geospatiale KI Earth AI mit Gemini-Sprachmodellen und macht sie breiter zugänglich. Das System soll helfen, Überschwemmungen, Dürren und Krankheitsausbrüche schneller zu erkennen und gezielter darauf zu reagieren.
Google hat laut Produktmanager Logan Kilpatrick im Juni über 980 Billionen Token über seine KI-Produkte und APIs verarbeitet, mehr als doppelt so viele wie im Mai. Auch Deepmind-CEO Demis Hassabis meldet, dass die Systeme von Google im selben Monat fast eine Billiarde Token verarbeitet hätten. Token sind Textbausteine, die als Recheneinheit für KI-Modelle dienen.
Die stark gestiegene Tokenzahl dürfte jedoch nicht allein auf eine höhere Nutzung zurückgehen. Wahrscheinlicher ist, dass vermehrt Reasoning-Modelle wie Gemini Flash 2.5 eingesetzt werden, die vor einer Antwort deutlich mehr Token erzeugen, um genauere Ergebnisse zu liefern. Laut einer Analyse von Artificial Analysis verbraucht Flash 2.5 circa 17-mal mehr Token und ist damit 150-mal teurer als sein Vorgänger.
Der Deepmind-Ableger Isomorphic Labs will Medikamente künftig per Knopfdruck entwickeln - und bereitet erste klinische Studien vor.
"Eines Tages wollen wir sagen können: Da ist eine Krankheit – und mit einem Klick spuckt die KI den passenden Wirkstoff aus", sagt Colin Murdoch, Präsident von Isomorphic Labs und Chief Business Officer bei Deepmind, gegenüber Fortune.
Das Unternehmen bereitet erste klinische Studien mit Medikamenten vor, die mithilfe von AlphaFold-basierten KI-Systemen entworfen wurden. Ziel ist es, die bislang langsame und teure Arzneimittelentwicklung radikal zu beschleunigen. Laut Murdoch sind auch Wirkstoffe gegen Krebs in Entwicklung.