GPT‑5.1 startet in der API mit neuem Modus und besserer Code‑Performance
OpenAI bringt GPT‑5.1 in die API mit neuen Developer‑Tools und verbessertem Prompt‑Caching. Die Sicherheitskarte zeigt ein gemischtes Bild: Fortschritte beim Datenschutz und Jailbreak‑Schutz, aber Rückschritte bei Themen wie Hassrede und emotionaler Abhängigkeit.
Microsoft-Chef warnt: KI-Rechenpower zu Dumpingpreisen ist kein Zukunftsmodell
Microsoft-CEO Satya Nadella grenzt sich klar von Oracle ab: Statt auf wenige große KI-Kunden zu setzen, soll Microsoft zur Plattform für viele werden – mit Office als Infrastruktur für KI-Agenten. Gleichzeitig warnt Nadella vor geopolitischen Risiken und pocht auf Vertrauen in Herkunft und Institutionen.
Man kann jetzt auch mit Googles NotebookLM das Copyright verletzen. Das neueste Notebook-LMUpdate erlaubt es, Video-Zusammenfassungen per Texteingabe komplett frei zu gestalten. Zuvor konnte man nur aus vorgegebenen Stilen wählen.
Heißt: Durch die freie Stileingabe sind Copyright-Brüche möglich. Im Video unten etwa habe ich das System aufgefordert, ein Video im Stil von „Die Simpsons“ zu generieren – über die Frage, ob Bart Simpson im KI-Zeitalter sich darum kümmern würde, ob KI das Copyright verletzt. Funktioniert einwandfrei. Bemerkenswert: NotebookLM versieht das KI-Video mit einem eigenen Copyright-Vermerk unten rechts im Bild, selbst in Szenen, in denen ausschließlich Simpsons-Inhalte zu sehen sind (bspw. 03:20).
Deepmind-Studie will Maschinenblick und menschliche Wahrnehmung aufeinander abstimmen
Ein Forschungsteam von Google DeepMind, deutschen Partnern und Anthropic hat eine Methode vorgestellt, mit der KI-Modelle menschliche Urteilsmuster in der visuellen Wahrnehmung besser nachvollziehen sollen. Die Studie in Nature zeigt, dass solche „human-aligned“ Modelle robuster, generalisierungsfähiger und weniger fehleranfällig sind.
Gemini Live hat sein bisher größtes Update erhalten. Laut Google ist die Sprach-KI nun schneller, ausdrucksstärker und kann mit verschiedenen Akzenten sprechen. Nutzer können nun auch die Geschwindigkeit der Antworten anpassen. Nach dem Update soll Gemini Live außerdem besser für das Sprachenlernen geeignet sein.
Google hatte das Update bereits im August auf der „Made by Google“-Veranstaltung angekündigt.
OpenAI-Konkurrent Anthropic will 50 Milliarden US-Dollar in amerikanische KI-Infrastruktur pumpen. Geplant ist der Bau eigener Rechenzentren in Texas und New York, weitere Standorte sollen folgen. Die Anlagen sollen speziell auf die Anforderungen von Anthropics KI-Systemen wie Claude zugeschnitten sein. Der Betrieb soll ab 2026 starten und etwa 800 dauerhafte sowie 2400 temporäre Jobs schaffen.
„Wir nähern uns einer KI, die wissenschaftliche Entdeckungen beschleunigen und komplexe Probleme auf neue Weise lösen kann“, sagt Anthropic-CEO Dario Amodei. Die neuen Standorte sollen solche Fortschritte ermöglichen.
Baidus neues ERNIE-Modell bearbeitet Bilder während des Denkprozesses
Baidu hat mit ERNIE-4.5-VL-28B-A3B-Thinking ein Reasoning-Model veröffentlicht, das Bilder während des Denkprozesses ver- und bearbeiten kann, etwa einzoomen, um Text besser lesen zu können.