Anthropic hat mit Claude 3 einen echten Konkurrenten zu OpenAIs GPT-4 auf den Markt gebracht. Oder? In den von der Firma veröffentlichten Benchmarks schlägt das größte Modell Opus sogar GPT-4. Doch ein genauerer Blick zeigt: Anthropic hat sein neuestes Modell gegen die erste Version von GPT-4 antreten lassen und nicht gegen neuere Versionen wie GPT-4 Turbo. Der Grund: OpenAI hat bisher nur Benchmarks für das alte GPT-4-Modell veröffentlicht, das nur noch über die API aufgerufen werden kann. Allerdings gibt es für einige Benchmarks Evaluierungen von GPT-4 Turbo, die nicht direkt von OpenAI stammen. KI-Forscher Lawrence Chan hat sie zusammengestellt. Ein Blick auf diese Zahlen macht deutlich: In jedem Benchmark, in dem Claude 3 und GPT-4 Turbo verglichen wurden, schlägt das OpenAI-Modell immer noch das beste Modell von Anthropic - wenn auch nur um wenige Prozentpunkte. Allerdings liegen die Modelle so nah beieinander, dass die Frage, welches Modell besser ist, zum einen stark von der jeweiligen Aufgabenstellung abhängt - und vor allem eine Geschmacksfrage ist.
Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Quellen
News, Tests und Berichte über VR, AR und MIXED Reality.
Pimax 60G Airlink: Erste öffentliche Demos für CES 2025 angekündigt
Pimax Crystal Super: Kommende High-End VR-Brille mit "Retina-Auflösung" wird günstiger als gedacht
VR-Brillen ab 11,99 $ pro Monat: Pimax führt Raten-Modell für High-End VR-Headsets ein
MIXED.de
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!