Skip to content
Read full article about: Claude Opus 4.6 lieferte in Sicherheitstest Anleitungen für Senfgas in Excel-Tabellen

Anthropics Sicherheitstraining versagt, wenn Claude eine grafische Benutzeroberfläche bedient.

In Pilottests ließ sich Claude Opus 4.6 dazu bringen, in einer Excel-Tabelle detaillierte Anleitungen zur Herstellung von Senfgas zu liefern und eine Buchhaltungstabelle für eine kriminelle Bande zu führen – Verhaltensweisen, die in reinen Textinteraktionen nicht oder kaum auftraten.

„Wir haben festgestellt, dass einige Arten von Missbrauchsverhalten in diesen Pilotauswertungen auftraten, die in reinen Text-Interaktionen fehlten oder deutlich seltener waren", schreibt Anthropic in der System Card zu Claude Opus 4.6. „Diese Ergebnisse legen nahe, dass unsere standardmäßigen Alignment-Trainingsmaßnahmen in GUI-Umgebungen wahrscheinlich weniger wirksam sind."

Tests mit dem Vorgängermodell Claude Opus 4.5 in derselben Umgebung zeigten laut Anthropic „ähnliche Ergebnisse" – das Problem besteht also über Modellgenerationen hinweg fort, ohne dass es bisher behoben wurde. Die Sicherheitslücke entsteht offenbar dadurch, dass Modelle zwar lernen, schädliche Anfragen im Gespräch abzulehnen, dieses Verhalten aber nicht vollständig auf agentenbasierte Werkzeugnutzung übertragen.

Read full article about: OpenAIs GPT-5.3-Codex vereint 25 Prozent mehr Geschwindigkeit mit neuen Bestwerten im Coding

OpenAI hat sein neuestes Coding-Modell GPT-5.3-Codex veröffentlicht. Es vereint laut OpenAI die Coding-Fähigkeiten von GPT-5.2-Codex mit den Denk- und Wissensfähigkeiten von GPT-5.2 und ist dabei 25 Prozent schneller als sein Vorgänger. Bei vier Leistungstests für Programmierung und praktische Anwendungen erreicht GPT-5.3-Codex laut OpenAI neue Bestwerte in der Branche. Im agentischen Coding-Benchmark Terminal-Bench 2.0 übertrifft Codex 5.3 das gerade erst veröffentlichte Opus 4.6 um zwölf Prozentpunkte; für aktuelle KI-Modellverhältnisse eine riesige Lücke. Dabei verbraucht das Modell weniger Token als die eigenen Vorgänger.

OpenAI

Das Modell half zudem angeblich bei seiner eigenen Entstehung mit: Das Codex-Team nutzte frühe Versionen, um Fehler im Training zu finden, die Bereitstellung zu steuern und Testergebnisse auszuwerten. Das Team sei überrascht gewesen, wie sehr Codex seine eigene Entwicklung beschleunigt habe, so OpenAI.

GPT-5.3-Codex wird für zahlende ChatGPT-Nutzer in allen Codex-Umgebungen verfügbar sein: in der Codex-App, in der CLI, in der IDE-Erweiterung und im Web. Ein API-Zugang soll folgen. Das Modell wird als erstes OpenAI-Modell mit dem Cybersecurity-Risiko "High" eingestuft: als Vorsichtsmaßnahme, wie OpenAI schreibt, obwohl es keinen sicheren Beweis gebe.

OpenAI startet Frontier-Plattform für KI-Agenten in Unternehmen

OpenAI stellt mit Frontier eine neue Plattform vor, die KI-Agenten in Unternehmen aus ihrer Isolation befreien soll. Die Agenten erhalten eigene Identitäten, gemeinsamen Kontext und sollen aus Erfahrung lernen. Die Software ist zunächst für ausgewählte Enterprise-Kunden verfügbar.

Read full article about: Voxtral Mini Transcribe V2 kombiniert niedrige Fehlerrate mit aggressivem Kampfpreis

Mistral AI will mit Voxtral Transcribe 2 die Konkurrenz bei der Spracherkennung preislich unterbieten. Die zweite Generation der Spracherkennungsmodelle kostet ab 0,003 US-Dollar pro Minute und soll laut Mistral bei der Genauigkeit Modelle wie GPT-4o mini Transcribe, Gemini 2.5 Flash und Deepgram Nova übertreffen. Die Modellfamilie umfasst zwei Varianten: Voxtral Mini Transcribe V2 für die Verarbeitung größerer Audiodateien und Voxtral Realtime für Echtzeit-Anwendungen mit Verzögerungen unter 200 Millisekunden. Das doppelt so teure Voxtral Realtime nutzt eine eigene Streaming-Architektur, die Audio während des Eintreffens transkribiert, gedacht für Sprachassistenten, Live-Untertitel oder Callcenter-Analyse.

Beide neuen Modelle unterstützen 13 Sprachen, darunter Deutsch, Englisch und Chinesisch. Neue Funktionen sind Sprechererkennung, Zeitstempel auf Wortebene und die Verarbeitung von Aufnahmen bis zu drei Stunden. Voxtral Realtime steht als Open-Weights unter Apache 2.0 auf Hugging Face und per API bereit, Voxtral Mini Transcribe V2 ist nur über Le Chat, die Mistral-API sowie einen Playground verfügbar. Die erste Voxtral-Generation hatte Mistral im Juli 2025 vorgestellt.

Read full article about: Amazon entwickelt KI-Werkzeuge für Film- und Fernsehproduktion

Amazon will KI nutzen, um Film- und Fernsehproduktionen zu beschleunigen und Kosten zu senken. Albert Cheng leitet das "AI Studio" bei Amazon MGM Studio, das im März 2026 ein geschlossenes Beta-Programm mit Branchenpartnern startet. Ergebnisse sollen im Mai vorliegen, berichtet Reuters.

Die KI-Werkzeuge sollen die "letzte Meile" zwischen bestehenden KI-Angeboten und den Anforderungen von Regisseuren überbrücken. Dazu gehören bessere Charakterkonsistenz über verschiedene Aufnahmen hinweg und die Einbindung in branchenübliche Kreativwerkzeuge. Amazon arbeitet mit mehreren Sprachmodell-Anbietern zusammen. Produzenten wie Robert Stromberg ("Maleficent") und Animator Colin Brady testen laut dem Bericht bereits die Tools. Die Serie "House of David" auf Amazon nutzt bereits KI: Regisseur Jon Erwin kombinierte für Staffel zwei KI mit Live-Action-Material für Kampfszenen.

Cheng sagte, die hohen Produktionskosten würden das Schaffen neuer Inhalte erschweren. KI solle Prozesse beschleunigen, aber keine Menschen ersetzen. Autoren, Regisseure und Schauspieler blieben in jeden Schritt eingebunden. Amazon hat seit Oktober rund 30.000 Stellen abgebaut, auch bei Prime Video.

Read full article about: Streit um Werbung in KI: Sam Altman verteidigt OpenAIs Strategie gegen Anthropic

Laut OpenAI-CEO Sam Altman hat ChatGPT so viele Nutzer in Texas wie Claude in den USA. Altman verrät diese Statistik im Kontext von Anthropics offensiven Werbespots, die ChatGPT mit Werbung auf die Schippe nehmen. Anthropic hatte angekündigt, keine Werbung in Claude zu bringen.

Laut Altman sind diese Spots zwar lustig, aber unehrlich. OpenAI habe sich explizit dagegen ausgesprochen, Werbung so einzusetzen, wie Anthropic es darstellt: als subtile Beeinflussung, eingebunden in persönliche, vertrauliche Chat-Gespräche. Er wirft Anthropic zudem Elitismus vor: OpenAI wolle KI für Milliarden Menschen zugänglich machen, die sich keine Abos leisten können. Anthropic hingegen bediene mit einem teuren Produkt primär wohlhabende Kunden.

Zur Wahrheit gehört auch: Die Dystopie, die Anthropic in den Werbespots skizziert, hat Altman früher selbst prophezeit, als sie in sein Anti-Google-Narrativ passte. Und gerade bei börsennotierten Unternehmen – und einen Börsengang hat OpenAI Ende des Jahres vor – hat Werbung die Eigenschaft, Überhand zu nehmen und an Einfluss zu gewinnen, wenn der Wachstumsdruck steigt.