Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Short

Anthropic hat mit Claude 3 einen echten Konkurrenten zu OpenAIs GPT-4 auf den Markt gebracht. Oder? In den von der Firma veröffentlichten Benchmarks schlägt das größte Modell Opus sogar GPT-4. Doch ein genauerer Blick zeigt: Anthropic hat sein neuestes Modell gegen die erste Version von GPT-4 antreten lassen und nicht gegen neuere Versionen wie GPT-4 Turbo. Der Grund: OpenAI hat bisher nur Benchmarks für das alte GPT-4-Modell veröffentlicht, das nur noch über die API aufgerufen werden kann. Allerdings gibt es für einige Benchmarks Evaluierungen von GPT-4 Turbo, die nicht direkt von OpenAI stammen. KI-Forscher Lawrence Chan hat sie zusammengestellt. Ein Blick auf diese Zahlen macht deutlich: In jedem Benchmark, in dem Claude 3 und GPT-4 Turbo verglichen wurden, schlägt das OpenAI-Modell immer noch das beste Modell von Anthropic - wenn auch nur um wenige Prozentpunkte. Allerdings liegen die Modelle so nah beieinander, dass die Frage, welches Modell besser ist, zum einen stark von der jeweiligen Aufgabenstellung abhängt - und vor allem eine Geschmacksfrage ist.

Anzeige
Anzeige
Short

ServiceNow, Hugging Face und Nvidia haben StarCoder2 veröffentlicht, eine Familie von Open-Access-LLMs zur Codegenerierung. StarCoder2 wurde in Zusammenarbeit mit der BigCode Community als Nachfolger zu dem im Mai 2023 erschienen Starcoder entwickelt und auf 619 Programmiersprachen trainiert. StarCoder2 bietet drei Modellgrößen: ein 3-Milliarden-Parameter-Modell von ServiceNow, ein 7-Milliarden-Parameter-Modell von Hugging Face und ein 15-Milliarden-Parameter-Modell von Nvidia. StarCoder2 wurde mit dem neuen Code-Datensatz Stackv2 trainiert, der ebenfalls verfügbar ist. Neue Trainingsmethoden sollen dem Modell helfen, besser ressourcenarme Programmiersprachen, Mathematik und Diskussionen über Programmquellcode zu verstehen. Das Modell kann von Unternehmen für ihre eigenen Aufgaben verfeinert werden.

Google News