Die KI-Forschungsorganisation METR hat neue Testergebnisse für Claude Opus 4.5 veröffentlicht. Das Modell von Anthropic erreicht einen sogenannten 50-Prozent-Zeithorizont von etwa 4 Stunden und 49 Minuten. Das ist der höchste bisher gemessene Wert. Der Zeithorizont beschreibt, wie lange Aufgaben sein können, die ein KI-Modell mit einer bestimmten Erfolgsrate (in diesem Fall 50 Prozent) löst.
Auffällig ist der Unterschied zwischen verschiedenen Schwierigkeitsstufen. Der 80%-Zeithorizont liegt weiter bei nur 27 Minuten, ähnlich wie bei früheren Modellen. Laut METR zeigt das, dass Opus 4.5 besonders bei längeren Aufgaben besser abschneidet als Vorgänger. Die theoretische Obergrenze von mehr als 20 Stunden hält METR indes für unwahrscheinlich und führt sie eher auf fehlende Testdaten und statistische Unschärfe zurück als auf die tatsächliche Leistungsfähigkeit des Modells.
OpenAI ermöglicht Nutzern ab sofort, den Kommunikationsstil von ChatGPT anzupassen. In den "Personalisierung"-Einstellungen lassen sich verschiedene Eigenschaften wie Wärme, Enthusiasmus, die Verwendung von Überschriften und Listen sowie Emojis einstellen. Jede Eigenschaft kann auf "More" oder "Less" gesetzt werden. Zusätzlich gibt es einen Basis-Stil, etwa "effizient" für prägnant formulierte Antworten.
OpenAI erklärt, dass diese Einstellungen nur den Ton und Stil der Gespräche beeinflussen, nicht jedoch die eigentlichen Fähigkeiten des Chatbots. Sehr wahrscheinlich funktioniere diese Vorgaben als Anhängsel der "individuellen Hinweise", die sich im selben Fenster einstellen lassen.
Offener Google-Standard soll KI-Agenten schnell Nutzeroberflächen generieren lassen
Google stellt mit A2UI einen offenen Standard vor, der KI-Agenten das Erstellen grafischer Oberflächen erlaubt. Statt nur Textnachrichten zu senden, können KIs dynamisch Formulare oder Buttons generieren, die sich optisch nahtlos in die jeweilige App einfügen.
Google hat FunctionGemma veröffentlicht, eine spezialisierte Version des kleinen Sprachmodells Gemma 3 270M. Das Modell wurde basierend auf dem im August vorgestellten Basismodell gezielt für das sogenannte "Function Calling" erweitert. Damit kann die KI nicht nur Texte generieren, sondern konkrete Befehle an Software weitergeben, um Kalendereinträge zu erstellen oder Spielelemente zu steuern. Über die AI Edge Gallery lässt sich auf Android-Geräten ein Farming-Minispiel ausprobieren, das Prompts wie "Plant the sunflower seed in plot 8" umsetzt. Hier gibt es eine Demo mit Physikrätseln, die sich durch natürliche Sprache direkt im Browser lösen lassen.
Da das Modell sehr kompakt ist, läuft es direkt auf Endgeräten wie Smartphones, was die Datensicherheit erhöht und Verzögerungen minimiert. Laut Google lässt sich die Zuverlässigkeit durch weiteres Training von 58 auf 85 Prozent steigern. FunctionGemma dient als Brücke zwischen natürlicher Sprache und Software und kann auch als "Verkehrsleiter" fungieren, der komplexe Anfragen an größere Modelle weiterleitet. Das Modell ist ab sofort auf Plattformen wie Hugging Face und Kaggle verfügbar.
OpenAI hat die Verfügbarkeit seines günstigen Abonnements ChatGPT Go massiv ausgeweitet. Nach dem Start im August in Indien ist das Abo nun in über 70 weiteren Ländern verfügbar, darunter viele in Europa und Südamerika, wie aus einem aktualisierten Hilfe-Dokument hervorgeht. In Deutschland kostet der Zugang 8 Euro monatlich. Neben dem erweiterten Zugriff auf das Flaggschiff-Modell umfasst das Abo auch mehr Möglichkeiten zur Bildgenerierung, Datei-Analyse und Datenauswertung sowie ein größeres Kontextfenster für längere Gespräche. Nutzer können zudem Projekte organisieren und eigene GPTs erstellen. Nicht enthalten sind hingegen der Zugriff auf Sora, die API oder ältere Modelle wie GPT-4o.
Dem breiteren Rollout geht auch eine Sparmaßnahme voran: OpenAI hat den automatischen Modell-Router für Nutzer der kostenlosen Version und des Go-Abos kürzlich entfernt. Anfragen werden nun standardmäßig vom schnelleren GPT-5.2 Instant beantwortet. Nutzer müssen die leistungsfähigeren Reasoning-Modelle nun manuell auswählen, während der automatische Router nur noch in den teureren Tarifen aktiv bleibt.
Meta entwickelt unter den Codenamen "Mango" und "Avocado" neue KI-Modelle für Bilder, Videos und Text. Die Veröffentlichung ist für die erste Jahreshälfte 2026 geplant, berichtet das Wall Street Journal unter Berufung auf interne Aussagen von Metas KI-Chef Alexandr Wang. Wang erklärte in einem internen Q&A mit Produktchef Chris Cox, dass "Mango" auf visuelle Inhalte fokussiert ist, während das Sprachmodell "Avocado" besonders gut im Programmieren sein soll. Zudem erforscht Meta sogenannte Weltmodelle, die ihre Umgebung visuell erfassen.