Artificial Analysis hat Version 4.0 seines Intelligence Index veröffentlicht, der die Leistung von KI-Modellen über verschiedene Benchmarks hinweg misst. OpenAIs GPT-5.2 mit höchster Reasoning-Stufe führt das Ranking an, gefolgt von Anthropics Claude Opus 4.5 und Googles Gemini 3 Pro.
Die Bewertung deckt vier gleichgewichtete Kategorien ab: Agenten, Programmierung, wissenschaftliches Denken und Allgemeines. Im Vergleich zur Vorgängerversion sind die Ergebnisse weniger gesättigt: Spitzenmodelle erreichen maximal 50 Punkte statt zuvor 73.
Artificial Analysis Intelligence Index v4.0: Gesamtranking der KI-Modelle. GPT-5.2 (xhigh) führt mit 50 Punkten, gefolgt von Claude Opus 4.5 (49) und Gemini 3 Pro Preview (48). Die Spitzenmodelle liegen eng beieinander. | Bild: Artificial Analysis
Dass KI-Modelle fähiger sind als die Menschen, die sie nutzen, scheint das neue Narrativ der KI-Industrie für 2026 zu sein.Nach Satya Nadella äußert sich nun auch OpenAI-Produktchefin Fidji Simo: Ziel für 2026 sei es, die Lücke zwischen KI-Fähigkeiten und deren Nutzung im Alltag zu schließen. Marktführer werde, wer Forschung in nützliche Produkte umwandelt.
Für Unternehmen will OpenAI eine Plattform für automatisierte Arbeitsabläufe schaffen. Entwickler sollen mit Codex einen "automatisierten Teamkollegen" erhalten. OpenAI benötigt starke Leistungssteigerungen bei KI-Agenten, um höhere Preise zu rechtfertigen: Angeblich denkt das Unternehmen über bis zu 20.000 US-Dollar pro Monat nach.
Der Chiphersteller AMD hat auf der CES 2026 eine Reihe neuer Prozessoren vorgestellt, darunter KI-Beschleuniger für Rechenzentren und aufgefrischte Laptop-Chips.
Als Grund für seinen Abschied nennt Tworek den Wunsch, wissenschaftliche Felder zu erkunden, die bei OpenAI nur schwer zu bearbeiten seien. Das könnte ein Seitenhieb auf den starken Produkt- und Umsatzfokus von CEO Sam Altman sein, der für Unzufriedenheit im Forschungsteam sorgen soll. Wohin Tworek als Nächstes wechselt, ist nicht bekannt.
Das Technology Innovation Institute (TII) aus Abu Dhabi hat mit Falcon H1R 7B ein kleines Reasoning-Sprachmodell mit 7 Milliarden Parametern veröffentlicht. Es erreicht laut TII über verschiedene Benchmarks hinweg die Leistung von Modellen, die zwei- bis siebenmal größer sind. Das Modell nutzt eine hybride Transformer-Mamba-Architektur und erzielt dadurch höhere Verarbeitungsgeschwindigkeiten als vergleichbare Modelle. Wie immer gilt: Benchmarks korrelieren gerade bei kleinen KI-Modellen nur bedingt mit der realen Leistungsfähigkeit.
Das Modell steht als vollständiger Checkpoint und quantisierte Version auf Hugging Face zur Verfügung. Eine Demo ist ebenfalls verfügbar. Die Veröffentlichung erfolgt unter der Falcon-LLM-Lizenz, die kostenlose Nutzung, Vervielfältigung, Änderung und Verbreitung des Modells erlaubt. Die Nutzung muss allerdings der Acceptable Use Policy entsprechen, die jederzeit aktualisiert werden kann.
Mehr als fünf Prozent aller weltweit über ChatGPT verschickten Nachrichten drehen sich um das Thema Gesundheit. Laut einem Bericht, den OpenAI exklusiv mit Axios teilte, nutzen täglich alleine 40 Millionen US-Bürger den Chatbot für medizinische Fragen. Die Nutzer lassen sich Arztrechnungen erklären, vergleichen Versicherungen oder prüfen Symptome, oft weil gerade kein Arzt verfügbar ist. Das Unternehmen hatte diesen Trend bereits früh erkannt und vermarktete GPT-5 als besonders leistungsfähiges Modell für solche Anwendungsfälle.
OpenAI verzeichnete laut dem Bericht zuletzt wöchentlich fast zwei Millionen Fragen alleine zu Versicherungsthemen, da die Regierung unter US-Präsident Donald Trump zum neuen Jahr lange geltende Subventionen für Krankenversicherungen auslaufen ließ.