OpenAI wehrt sich gegen Prompt-Injections, die das "agentische Web" bedrohen
OpenAI kämpft mit automatisiertem Red Teaming gegen Prompt Injections in ChatGPT Atlas. Das Unternehmen vergleicht das Problem mit Online-Betrug und verharmlost damit eine technische Sicherheitslücke, die das agentische Web ausbremsen könnte.
GPT-5 löst angeblich offenes Mathe-Problem ohne menschliche Hilfe
GPT-5 löst erstmals ein offenes Mathe-Problem – und der Mathematiker dahinter zeigt genau, welche Zeile von welcher KI stammt. Muss Wissenschaft so transparent sein?
Google baut seine KI-Kapazitäten weiter aus. Der Mutterkonzern Alphabet kauft den Entwickler für saubere Energie Intersect für 4,75 Milliarden Dollar in bar, plus übernommene Schulden. Der Grund: Große Tech-Unternehmen investieren massiv in Energiefirmen, da die US-Stromnetze mit dem steigenden Strombedarf für künstliche Intelligenz kaum Schritt halten können.
Alphabet erwirbt Intersects Energie- und Rechenzentrumsprojekte, die sich in Entwicklung oder im Bau befinden. Das Unternehmen verfügt über Anlagen im Wert von 15 Milliarden Dollar. Bis 2028 sollen Projekte mit etwa 10,8 Gigawatt Leistung online sein, mehr als das Zwanzigfache der Stromproduktion des Hoover-Staudamms laut Reuters. Intersects Betrieb bleibt von Alphabet getrennt. Bestehende Anlagen in Texas und Kalifornien gehören nicht zur Übernahme.
OpenAI hat angeblich die Wirtschaftlichkeit seiner KI-Dienste stark verbessert. Die sogenannte Compute-Marge – der Anteil der Einnahmen nach Abzug der Serverkosten für zahlende Nutzer – stieg von etwa 35 Prozent im Januar 2024 auf rund 70 Prozent im Oktober 2025, berichtet The Information unter Berufung auf interne Finanzdaten. Anthropic soll sich bis Ende des Jahres auf 53 Prozent verbessern.
Kling AI Videogenerator 2.6 kann jetzt Stimmen und Bewegungen präzise steuern
In kaum einem anderen Bereich war der KI-Fortschritt in diesem Jahr so deutlich spürbar wie bei der Videogenerierung. Mit neuen Funktionen für Kling 2.6 legt das chinesische Unternehmen Kuaishou zum Jahresende nach. Das beeindruckt technisch und zeigt, wie eng das KI-Wettrennen ist: international sowie zwischen großen Namen und weniger bekannten Playern.
Nvidia hat ein neues Grundlagenmodell für Gaming-Agenten veröffentlicht. NitroGen ist ein offenes Vision-Action-Modell, das auf 40.000 Stunden Gameplay-Videos von mehr als 1.000 Spielen trainiert wurde. Die Forscher nutzten eine bisher kaum erschlossene Ressource: YouTube- und Twitch-Videos mit sichtbaren Controller-Overlays. Mit Template-Matching und einem feinabgestimmten SegFormer-Modell extrahierten sie daraus die Spieler-Eingaben.
NitroGen basiert auf dem Robotik-Modell GR00T N1.5 und ist laut den Forschern das erste Modell, das zeigt, dass Robotik-Grundlagenmodelle als universelle Agenten in virtuellen Umgebungen mit unterschiedlicher Physik und Grafik funktionieren können. Das Modell beherrscht verschiedene Genres: Action-RPGs, Plattformer, Roguelikes und mehr. Bei unbekannten Spielen erreicht es bis zu 52 Prozent bessere Erfolgsraten als Modelle, die von Grund auf trainiert werden.
Die Forscher von Nvidia, Stanford, Caltech und anderen Universitäten haben den Datensatz, die Modellgewichte, das Paper und den Code öffentlich zugänglich gemacht.
Alibabas KI-Einheit Qwen hat ein neues Bild-Editierungsmodell veröffentlicht. Qwen-Image-Layered zerlegt Bilder in mehrere einzelne Ebenen mit transparentem Hintergrund (RGBA-Ebenen). Jede Ebene kann dann unabhängig bearbeitet werden, ohne andere Bildinhalte zu beeinflussen.
Das Modell ermöglicht einfache Bearbeitungen wie Größenänderung, Neupositionierung und Farbänderung einzelner Elemente. Nutzer können etwa den Hintergrund umfärben, Personen austauschen, Texte ändern oder Objekte löschen, verschieben und vergrößern.
Ein Bild kann wahlweise in 3 oder 8 Ebenen zerlegt werden. Zudem lässt sich die Zerlegung beliebig oft wiederholen – jede Ebene kann erneut in weitere Ebenen aufgeteilt werden. Das Qwen-Team bezeichnet den Ansatz als Brücke zwischen normalen Bildern und strukturierten, bearbeitbaren Darstellungen.
Die KI-Forschungsorganisation METR hat neue Testergebnisse für Claude Opus 4.5 veröffentlicht. Das Modell von Anthropic erreicht einen sogenannten 50-Prozent-Zeithorizont von etwa 4 Stunden und 49 Minuten. Das ist der höchste bisher gemessene Wert. Der Zeithorizont beschreibt, wie lange Aufgaben sein können, die ein KI-Modell mit einer bestimmten Erfolgsrate (in diesem Fall 50 Prozent) löst.
Auffällig ist der Unterschied zwischen verschiedenen Schwierigkeitsstufen. Der 80%-Zeithorizont liegt weiter bei nur 27 Minuten, ähnlich wie bei früheren Modellen. Laut METR zeigt das, dass Opus 4.5 besonders bei längeren Aufgaben besser abschneidet als Vorgänger. Die theoretische Obergrenze von mehr als 20 Stunden hält METR indes für unwahrscheinlich und führt sie eher auf fehlende Testdaten und statistische Unschärfe zurück als auf die tatsächliche Leistungsfähigkeit des Modells.