Anzeige
Skip to content

Perplexity stellt Sicherheitssystem gegen Prompt-Injection-Angriffe auf Browser-Agenten vor

Perplexity stellt ein neues Sicherheitssystem für KI-Browser vor – und trifft damit einen wunden Punkt der Branche. Während immer mehr Anbieter Agenten tief ins Web integrieren, steigt das Risiko versteckter Prompt-Injection-Angriffe. BrowseSafe soll diese Lücke schließen: schnell, präzise und für die unberechenbare Realität des Netzes gebaut. Doch die grundlegenden Sicherheitsprobleme bleiben bestehen.

Open-Source-KI GeoVista findet Aufnahmeorte von Fotos durch Zoom und Websuche

Ein Forschungsteam aus China hat mit GeoVista ein Open-Source-KI-Modell vorgestellt, das Bilder analysiert und gleichzeitig das Internet durchsucht, um deren Aufnahmeort zu bestimmen. Das Modell soll die Leistung kommerzieller Systeme wie Gemini-2.5-flash erreichen.

Apple zeigt Alternative zu Diffusionsmodellen für Video-KI

Apples STARFlow‑V zeigt: Videogen­erierung muss nicht auf Diffusion setzen. Das neue Modell nutzt „Normalizing Flows“, erzeugt so stabilere längere Clips und hängt andere autoregressive Ansätze im Benchmark ab. Es bleibt aber bei Qualität, Auflösung und Physik noch sichtbar hinter Top-Modellen wie Veo 3 oder HunyuanVideo zurück.

Read full article about: Deepmind-Chef sieht drei KI-Themen für 2026: Multimodal, interaktiv und autonom

Demis Hassabis, CEO von Google Deepmind, erwartet in den nächsten zwölf Monaten Fortschritte bei der Konvergenz multimodaler Modelle, interaktiven Videowelten und verlässlichen KI-Agenten. Besonders die Multimodalität von Gemini ermögliche neue Anwendungen, erklärte Hassabis auf dem Axios AI+ Summit. Als Beispiel nannte er eine Szene aus dem Film "Fight Club", in der die KI das Ablegen eines Rings philosophisch als Symbol für den Verzicht auf den Alltag deutete. Auch das neueste Bildmodell von Google nutzt diese multimodalen Fähigkeiten, um visuelle Inhalte präzise zu verstehen und etwa Infografiken zu erstellen.

Zudem arbeitet Google Deepmind weiter an "Weltmodellen" wie Genie 3, die interaktive, begehbare Videoräume erzeugen. Hassabis prognostiziert auch, dass KI-Agenten in einem Jahr "nahe dran" sein werden, komplexere Aufgaben verlässlich und eigenständig zu erledigen. Ziel sei ein universeller Assistent, der Nutzer über verschiedene Geräte hinweg im Alltag begleitet.

Read full article about: Meta-KI-Forscher LeCun gründet Startup für KI mit echtem Weltverständnis und Fokus auf Europa

Yann LeCun, der scheidende KI-Wissenschaftler von Meta, plant ein neues Startup mit Fokus auf sogenannte "World Models", die die physische Welt verstehen, anstatt lediglich Text zu generieren.  Da das Silicon Valley laut LeCun von generativer KI "hypnotisiert" sei, setzt er für das Projekt stark auf europäische Talente. Das Unternehmen soll global agieren und unter anderem einen Standort in Paris haben, bestätigten Quellen gegenüber Sifted.

LeCun argumentiert, dass aktuellen Sprachmodellen das Verständnis für die physische Welt fehle und bloßes Skalieren dieser Technologie nicht zu menschlicher Intelligenz führe. Sein Projekt "AMI" setzt daher auf eine neue, nicht-generative Architektur.

Some people claim we can scale up current technology and get to general intelligence [...] I think that’s bullshit, if you’ll pardon my French.

Meta wird Partner des Startups, da Mark Zuckerberg das Vorhaben unterstützt, die Anwendungsmöglichkeiten jedoch laut LeCun über Metas Interessen hinausgehen. LeCun wird Meta Ende des Jahres verlassen, um die unabhängige Organisation zu leiten.

MIRAS und Titans: Google zeigt, wie KI-Modelle dauerhaft dazulernen können

Ein Jahr nach der Veröffentlichung des Titans-Papers stellt Google die Architektur offiziell im eigenen Forschungsblog vor – gemeinsam mit dem neuen Framework MIRAS. Beide Projekte zielen auf ein zentrales Zukunftsthema der KI: kontinuierlich lernende Modelle mit echtem Langzeitgedächtnis, die sich während der Nutzung weiterentwickeln können.