Anzeige
Skip to content

Amazon listet ungefragt Produkte unabhängiger Shops via "Buy For Me"-KI

Mehrere Online-Händler berichten, dass Amazons KI-gestütztes Einkaufstool ihre Produkte ohne Erlaubnis auf dem Marktplatz anzeigt. Amazon verteidigt das Programm, doch die Kritik wächst.

Read full article about: Neues KI-Ranking: GPT-5.2 führt vor Claude Opus 4.5 und Gemini 3 Pro

Artificial Analysis hat Version 4.0 seines Intelligence Index veröffentlicht, der die Leistung von KI-Modellen über verschiedene Benchmarks hinweg misst. OpenAIs GPT-5.2 mit höchster Reasoning-Stufe führt das Ranking an, gefolgt von Anthropics Claude Opus 4.5 und Googles Gemini 3 Pro.

Die Bewertung deckt vier gleichgewichtete Kategorien ab: Agenten, Programmierung, wissenschaftliches Denken und Allgemeines. Im Vergleich zur Vorgängerversion sind die Ergebnisse weniger gesättigt: Spitzenmodelle erreichen maximal 50 Punkte statt zuvor 73.

Artificial Analysis Intelligence Index v4.0: Gesamtranking der KI-Modelle. GPT-5.2 (xhigh) führt mit 50 Punkten, gefolgt von Claude Opus 4.5 (49) und Gemini 3 Pro Preview (48). Die Spitzenmodelle liegen eng beieinander. | Bild: Artificial Analysis
Balkendiagramm mit Kostenvergleich verschiedener KI‑Modelle. Dargestellt sind die Gesamtkosten zur Ausführung des Artificial Analysis Intelligence Index, aufgeteilt in Input‑, Output‑ und Reasoning‑Kosten. Links stehen sehr teure Modelle mit mehreren tausend US‑Dollar Gesamtkosten, rechts deutlich günstigere Modelle mit Kosten im zweistelligen Dollarbereich.
An der Spitze der Kostentabelle steht GPT-5.2 (xhigh) mit Gesamtkosten von 2.322 US-Dollar, gefolgt von Grok 4 (1.574 US-Dollar) und Claude 4.5 Opus (1.510 US-Dollar). Mit deutlichem Abstand reiht sich dahinter Gemini 3 Pro Preview (988 US-Dollar) ein. | Bild: Artificial Analysis

Der neue Index ersetzt drei bisherige Tests (AIME 2025, LiveCodeBench und MMLU-Pro) durch drei neue: AA-Omniscience prüft Wissen und Halluzinationen über 40 Themen, GDPval-AA testet KI-Modelle auf wirtschaftlich wertvolle Aufgaben in 44 Berufen und CritPt bewertet Physik-Forschungsaufgaben.

Alle Tests wurden laut Artificial Analysis unabhängig und mit standardisierter Methodik durchgeführt, die auf der Webseite von Artificial Analysis einsehbar ist.

Read full article about: OpenAI will 2026 die Lücke zwischen KI-Fähigkeiten und Alltagsnutzung schließen

Dass KI-Modelle fähiger sind als die Menschen, die sie nutzen, scheint das neue Narrativ der KI-Industrie für 2026 zu sein. Nach Satya Nadella äußert sich nun auch OpenAI-Produktchefin Fidji Simo: Ziel für 2026 sei es, die Lücke zwischen KI-Fähigkeiten und deren Nutzung im Alltag zu schließen. Marktführer werde, wer Forschung in nützliche Produkte umwandelt.

ChatGPT habe mehr als 800 Millionen wöchentlich aktive Nutzer und eine Million Geschäftskunden. 2026 solle ChatGPT vom Chatbot zum "Super-Assistenten" werden, der Ziele versteht, Kontext speichert und proaktiv hilft. In einem geleakten Dokument von Mitte 2025 beschrieb OpenAI, dass ein solcher Super-Assistent mit menschlicher Aufmerksamkeit konkurriere.

Für Unternehmen will OpenAI eine Plattform für automatisierte Arbeitsabläufe schaffen. Entwickler sollen mit Codex einen "automatisierten Teamkollegen" erhalten. OpenAI benötigt starke Leistungssteigerungen bei KI-Agenten, um höhere Preise zu rechtfertigen: Angeblich denkt das Unternehmen über bis zu 20.000 US-Dollar pro Monat nach.

Read full article about: OpenAI verliert Top-KI-Forscher Jerry Tworek nach sieben Jahren

OpenAI verliert mit Jerry Tworek einen weiteren hochrangigen Forscher. Er verlässt das Unternehmen nach fast sieben Jahren, wie er in einer Nachricht an sein Team mitteilte. Tworek war maßgeblich an der Entwicklung von GPT-4, ChatGPT und den ersten KI-Modellen für das Programmieren beteiligt sowie an der Entwicklung neuer Skalierungshorizonte. Zuletzt leitete er das Team für "Reasoning Models", also KI-Systeme für komplexe logische Schlüsse. Er gehörte zum Kernteam hinter den o1- und o3-Modellen, die als Grundlage für den starken KI-Fortschritt der letzten Monate gelten.

Als Grund für seinen Abschied nennt Tworek den Wunsch, wissenschaftliche Felder zu erkunden, die bei OpenAI nur schwer zu bearbeiten seien. Das könnte ein Seitenhieb auf den starken Produkt- und Umsatzfokus von CEO Sam Altman sein, der für Unzufriedenheit im Forschungsteam sorgen soll. Wohin Tworek als Nächstes wechselt, ist nicht bekannt.

Read full article about: Falcon H1R 7B: Neues Reasoning-KI-Modell schlägt in Benchmarks größere Konkurrenz

Das Technology Innovation Institute (TII) aus Abu Dhabi hat mit Falcon H1R 7B ein kleines Reasoning-Sprachmodell mit 7 Milliarden Parametern veröffentlicht. Es erreicht laut TII über verschiedene Benchmarks hinweg die Leistung von Modellen, die zwei- bis siebenmal größer sind. Das Modell nutzt eine hybride Transformer-Mamba-Architektur und erzielt dadurch höhere Verarbeitungsgeschwindigkeiten als vergleichbare Modelle. Wie immer gilt: Benchmarks korrelieren gerade bei kleinen KI-Modellen nur bedingt mit der realen Leistungsfähigkeit.

via Technology Innovation Institute (TII)

Das Modell steht als vollständiger Checkpoint und quantisierte Version auf Hugging Face zur Verfügung. Eine Demo ist ebenfalls verfügbar. Die Veröffentlichung erfolgt unter der Falcon-LLM-Lizenz, die kostenlose Nutzung, Vervielfältigung, Änderung und Verbreitung des Modells erlaubt. Die Nutzung muss allerdings der Acceptable Use Policy entsprechen, die jederzeit aktualisiert werden kann.

Read full article about: Amazon öffnet Alexa Plus Webversion für bestimmte Nutzer im Early Access

Amazon hat die Webversion seines KI-Assistenten Alexa Plus für Nutzer in den USA und Kanada im Early Access freigegeben. Unter Alexa.com können sich Nutzer anmelden und den neuen Chatbot im Browser nutzen. Alexa Plus war bereits auf neuen Echo-Geräten verfügbar und wurde kürzlich auch für ältere Echos ausgerollt. Ein Beta-Test läuft in Deutschland.

Die Weboberfläche ermöglicht das Hochladen von Dokumenten, E-Mails und Bildern. Alexa Plus kann daraus Informationen extrahieren – etwa Rezepte in Einkaufslisten umwandeln oder Termine automatisch in den Kalender eintragen. Amazon bewirbt zudem Funktionen wie die automatische Erstellung von Essensplänen und das Befüllen von Amazon-Fresh-Warenkörben unter Berücksichtigung von Ernährungseinschränkungen. Auch Smart-Home-Geräte lassen sich über die Webseite steuern. Amazon startet außerdem eine neue Seitenleiste für Schnellzugriffe und eine überarbeitete mobile Alexa-App.