Anthropics Claude 3 liegt wohl hinter GPT-4 Turbo

Anthropic hat mit Claude 3 einen echten Konkurrenten zu OpenAIs GPT-4 auf den Markt gebracht. Oder? In den von der Firma veröffentlichten Benchmarks schlägt das größte Modell Opus sogar GPT-4. Doch ein genauerer Blick zeigt: Anthropic hat sein neuestes Modell gegen die erste Version von GPT-4 antreten lassen und nicht gegen neuere Versionen wie GPT-4 Turbo. Der Grund: OpenAI hat bisher nur Benchmarks für das alte GPT-4-Modell veröffentlicht, das nur noch über die API aufgerufen werden kann. Allerdings gibt es für einige Benchmarks Evaluierungen von GPT-4 Turbo, die nicht direkt von OpenAI stammen. KI-Forscher Lawrence Chan hat sie zusammengestellt. Ein Blick auf diese Zahlen macht deutlich: In jedem Benchmark, in dem Claude 3 und GPT-4 Turbo verglichen wurden, schlägt das OpenAI-Modell immer noch das beste Modell von Anthropic - wenn auch nur um wenige Prozentpunkte. Allerdings liegen die Modelle so nah beieinander, dass die Frage, welches Modell besser ist, zum einen stark von der jeweiligen Aufgabenstellung abhängt - und vor allem eine Geschmacksfrage ist.

Anthropics Claude 3 liegt wohl hinter GPT-4 Turbo

Anthropics Claude kann jetzt KI-Apps bauen

Anthropic zeigt seinen Bauplan für einen KI-Research-Agenten mit parallelen Subagenten

Anthropic kappt Claude-Zugang für Coding-Tool Windsurf nach OpenAI-Deal

Cloudflare-Boss Matthew Prince hat schlechte Nachrichten für das WWW

Othello-Experiment stützt erneut Weltmodell-Hypothese für große Sprachmodelle

MIT-Studie zeigt "kognitive Schulden" durch ChatGPT - was das für die Praxis bedeutet

Anthropics Claude 3 liegt wohl hinter GPT-4 Turbo

Anthropics Claude kann jetzt KI-Apps bauen

Anthropic zeigt seinen Bauplan für einen KI-Research-Agenten mit parallelen Subagenten

Anthropic kappt Claude-Zugang für Coding-Tool Windsurf nach OpenAI-Deal