Mit Claude 2 bringt Anthropic einen direkten Konkurrenten zu ChatGPT auf den Markt. Der Chatbot bietet ähnliche Funktionen wie der OpenAI Chatbot, Google Bard oder Bing Chat.
Anthropic wurde 2021 von ehemaligen OpenAI-Forschenden gegründet, ist mit rund 1,5 Milliarden US-Dollar finanziert und gilt als direkter Konkurrent von OpenAI. Letzteres hat mit dem Erfolgsprodukt ChatGPT und den Microsoft-Milliarden im Rücken natürlich einen großen Vorsprung. Allerdings konnte sich bereits das erste Modell von Anthropic zumindest in Benchmarks recht gut behaupten.
Mit Claude 2 legt Anthropic nun nach. Zu den Verbesserungen gehören nach Angaben des Start-ups eine bessere Konversationsfähigkeit, eine klarere Erklärung der eigenen Argumentation, harmlosere Ausgaben, ein längeres Gedächtnis und bessere Programmier-, Mathematik- und Denkfähigkeiten.
Das Modell soll helfen, Dokumente, Memos, Briefe, Geschichten, technische Dokumentationen oder Bücher zu schreiben. Ein Highlight des Modells ist, dass Claude 2 bis zu 75.000 Wörter (100.000 Token) gleichzeitig verarbeiten kann, was deutlich über dem Standard-ChatGPT mit einem Limit von 3.000 Wörtern liegt.
Dadurch kann der Chatbot bei seinen Antworten einen größeren Kontext berücksichtigen, was sich positiv auf die Antwortqualität und die Aufgabenvielfalt auswirkt. Das besonders große Kontextfenster wurde von Anthropic bereits im Mai für das erste Claude-Modell angekündigt.
Im Multiple-Choice-Test der amerikanischen Anwaltsprüfung (Bar Exam) soll Claude 2 mit 76,5 Prozent gleichauf mit GPT-4 liegen. GPT-3.5, das kostenlose ChatGPT, erreicht hier im Durchschnitt nur etwa 50 Prozent.
Beim Codex HumanEval Python-Programmierungstest erreicht Claude 2 71,2 Prozent (gegenüber 56,0 Prozent bei Claude 1.3) und bei den GSM8k-Grundschulmathematikaufgaben 88,0 Prozent (gegenüber 85,2 Prozent bei Claude 1.3).
Weitere Fähigkeiten sind in Planung und werden laut Anthropic in den kommenden Monaten "langsam und iterativ" ausgerollt.
Claude 2 startet zuerst in UK und den USA
Die Entwicklung des neuen Chatbots dauerte etwa zwei Monate. Rund 35 Personen arbeiteten direkt am KI-Modell, weitere 150 in unterstützenden Rollen. Bei der Entwicklung von Claude 2 hat Anthropic nach eigenen Angaben besonderen Wert auf Sicherheit gelegt.
Im Gegensatz zu OpenAI setzt Anthropic auf einen KI-gestützten Feedback-Mechanismus, anstatt Menschen in die Bewertung der KI-generierten Inhalte zur Optimierung des Modells einzubeziehen, und legt grundlegende Regeln durch eine Art Verfassung fest, die sich unter anderem an den Apple AGB orientiert.
In Red-Team-Tests, bei denen der Chatbot absichtlich zu Fehlern provoziert wird, erzielte Claude 2 laut Anthropic eine doppelt so harmlose User Experience im Vergleich zum Vorgängermodell.
Frei von sogenannten Halluzinationen, also Fehlinformationen, ist auch Claude 2 nicht. Hier sind laut Hersteller noch viele Hürden zu überwinden.
Laut Anthropic nutzen bereits Tausende Unternehmen die Claude 2 API, darunter Partner wie Jasper, eine Plattform für generative KI für Marketingtexte, und Sourcegraph, eine Code-KI-Plattform, die Claudes verbesserte Denkfähigkeiten und größere Kontextfenster nutzt, um Entwickler beim Schreiben, Korrigieren und Warten von Code zu unterstützen.
Geschäftskunden erhalten die Claude 2 API zum gleichen Preis wie Claude 1.3. Der Web Chatbot ist als kostenlose Beta-Version in den USA und Großbritannien verfügbar.