Anzeige
Skip to content

OpenAI wehrt sich gegen Prompt-Injections, die das "agentische Web" bedrohen

OpenAI kämpft mit automatisiertem Red Teaming gegen Prompt Injections in ChatGPT Atlas. Das Unternehmen vergleicht das Problem mit Online-Betrug und verharmlost damit eine technische Sicherheitslücke, die das agentische Web ausbremsen könnte.

Read full article about: Google sichert sich weitere Energiereserven für den Ausbau seiner KI-Kapazitäten

Google baut seine KI-Kapazitäten weiter aus. Der Mutterkonzern Alphabet kauft den Entwickler für saubere Energie Intersect für 4,75 Milliarden Dollar in bar, plus übernommene Schulden. Der Grund: Große Tech-Unternehmen investieren massiv in Energiefirmen, da die US-Stromnetze mit dem steigenden Strombedarf für künstliche Intelligenz kaum Schritt halten können.

Alphabet erwirbt Intersects Energie- und Rechenzentrumsprojekte, die sich in Entwicklung oder im Bau befinden. Das Unternehmen verfügt über Anlagen im Wert von 15 Milliarden Dollar. Bis 2028 sollen Projekte mit etwa 10,8 Gigawatt Leistung online sein, mehr als das Zwanzigfache der Stromproduktion des Hoover-Staudamms laut Reuters. Intersects Betrieb bleibt von Alphabet getrennt. Bestehende Anlagen in Texas und Kalifornien gehören nicht zur Übernahme.

Der Druck auf die Energieversorgung ist enorm: Google will laut eigenen Angaben seine KI-Kapazität alle sechs Monate verdoppeln und innerhalb von vier bis fünf Jahren eine tausendfache Leistungssteigerung erreichen. Google investiert dafür auch in moderne Reaktortechnologie.

Anzeige
Read full article about: OpenAI steigert Effizienz bei Serverkosten deutlich und die Marge freut's

OpenAI hat angeblich die Wirtschaftlichkeit seiner KI-Dienste stark verbessert. Die sogenannte Compute-Marge – der Anteil der Einnahmen nach Abzug der Serverkosten für zahlende Nutzer – stieg von etwa 35 Prozent im Januar 2024 auf rund 70 Prozent im Oktober 2025, berichtet The Information unter Berufung auf interne Finanzdaten. Anthropic soll sich bis Ende des Jahres auf 53 Prozent verbessern.

Die Effizienzsteigerung gelang OpenAI durch sinkende Mietkosten für Rechenleistung, optimierte Modelle und ein teureres Abo-Angebot. Dennoch ist der Weg zur Profitabilität noch weit, insbesondere da OpenAI-CEO Sam Altman weiter große Investitionen in noch mehr Rechenleistung plant und weitere Zirkelgeschäfte antreibt.

OpenAI arbeitet derzeit an einer Finanzierungsrunde von bis zu 100 Milliarden Dollar.

Kling AI Videogenerator 2.6 kann jetzt Stimmen und Bewegungen präzise steuern

In kaum einem anderen Bereich war der KI-Fortschritt in diesem Jahr so deutlich spürbar wie bei der Videogenerierung. Mit neuen Funktionen für Kling 2.6 legt das chinesische Unternehmen Kuaishou zum Jahresende nach. Das beeindruckt technisch und zeigt, wie eng das KI-Wettrennen ist: international sowie zwischen großen Namen und weniger bekannten Playern.

Anzeige
Read full article about: Nvidia will mit NitroGen universelle KI-Agenten für alle Welten erschaffen

Nvidia hat ein neues Grundlagenmodell für Gaming-Agenten veröffentlicht. NitroGen ist ein offenes Vision-Action-Modell, das auf 40.000 Stunden Gameplay-Videos von mehr als 1.000 Spielen trainiert wurde. Die Forscher nutzten eine bisher kaum erschlossene Ressource: YouTube- und Twitch-Videos mit sichtbaren Controller-Overlays. Mit Template-Matching und einem feinabgestimmten SegFormer-Modell extrahierten sie daraus die Spieler-Eingaben.

NitroGen basiert auf dem Robotik-Modell GR00T N1.5 und ist laut den Forschern das erste Modell, das zeigt, dass Robotik-Grundlagenmodelle als universelle Agenten in virtuellen Umgebungen mit unterschiedlicher Physik und Grafik funktionieren können. Das Modell beherrscht verschiedene Genres: Action-RPGs, Plattformer, Roguelikes und mehr. Bei unbekannten Spielen erreicht es bis zu 52 Prozent bessere Erfolgsraten als Modelle, die von Grund auf trainiert werden.

Die Forscher von Nvidia, Stanford, Caltech und anderen Universitäten haben den Datensatz, die Modellgewichte, das Paper und den Code öffentlich zugänglich gemacht.

Read full article about: Neues KI-Modell von Alibaba macht statische Bilder nachträglich editierbar

Alibabas KI-Einheit Qwen hat ein neues Bild-Editierungsmodell veröffentlicht. Qwen-Image-Layered zerlegt Bilder in mehrere einzelne Ebenen mit transparentem Hintergrund (RGBA-Ebenen). Jede Ebene kann dann unabhängig bearbeitet werden, ohne andere Bildinhalte zu beeinflussen.

Das Modell ermöglicht einfache Bearbeitungen wie Größenänderung, Neupositionierung und Farbänderung einzelner Elemente. Nutzer können etwa den Hintergrund umfärben, Personen austauschen, Texte ändern oder Objekte löschen, verschieben und vergrößern.

Ein Bild kann wahlweise in 3 oder 8 Ebenen zerlegt werden. Zudem lässt sich die Zerlegung beliebig oft wiederholen – jede Ebene kann erneut in weitere Ebenen aufgeteilt werden. Das Qwen-Team bezeichnet den Ansatz als Brücke zwischen normalen Bildern und strukturierten, bearbeitbaren Darstellungen.

Das Qwen-Team stellt den Code bereit. Die Modelle sind auf Hugging Face und ModelScope verfügbar. Weitere Infos liefern der Blog sowie der technische Bericht. Wer es testen will, findet Demos auf Hugging Face und ModelScope.

Anzeige
Read full article about: KI-Modell von Anthropic löst Aufgaben mit fast fünf Stunden Zeithorizont

Die KI-Forschungsorganisation METR hat neue Testergebnisse für Claude Opus 4.5 veröffentlicht. Das Modell von Anthropic erreicht einen sogenannten 50-Prozent-Zeithorizont von etwa 4 Stunden und 49 Minuten. Das ist der höchste bisher gemessene Wert. Der Zeithorizont beschreibt, wie lange Aufgaben sein können, die ein KI-Modell mit einer bestimmten Erfolgsrate (in diesem Fall 50 Prozent) löst.

METR

Auffällig ist der Unterschied zwischen verschiedenen Schwierigkeitsstufen. Der 80%-Zeithorizont liegt weiter bei nur 27 Minuten, ähnlich wie bei früheren Modellen. Laut METR zeigt das, dass Opus 4.5 besonders bei längeren Aufgaben besser abschneidet als Vorgänger. Die theoretische Obergrenze von mehr als 20 Stunden hält METR indes für unwahrscheinlich und führt sie eher auf fehlende Testdaten und statistische Unschärfe zurück als auf die tatsächliche Leistungsfähigkeit des Modells.

Wie jeder Benchmark hat auch die METR-Messung Einschränkungen, unter anderem, dass der Benchmark auf nur 14 Testfällen basiert. Eine ausführliche Analyse der Schwächen steht hier.