Read full article about: Claude Fable 5: Anthropic gesteht "falschen Kompromiss" bei unsichtbarer Modell-Drosselung ein
Anthropic rudert bei einer Maßnahme zurück, die KI-Forscher heimlich sabotiert hätte, doch ein zweiter Streitpunkt bleibt bestehen.
Anthropic hatte für sein neues Modell Claude Fable 5 vorgesehen, die Leistung für Nutzer, die damit konkurrierende KI-Modelle trainieren wollen, gezielt und unsichtbar zu verschlechtern. Nach scharfer Kritik aus der Forschungsgemeinschaft macht das Unternehmen nun einen Rückzieher: "Wir haben den falschen Kompromiss gewählt und entschuldigen uns dafür, die Balance nicht richtig getroffen zu haben", teilte Anthropic WIRED mit. Künftig sollen die Schutzmaßnahmen für Nutzer sichtbar sein.
Dean Ball, ehemaliger KI-Berater des Weißen Hauses, nannte das heimliche Vorgehen "schockierend feindselig". Will Brown vom Open-Source-Startup Prime Intellect formulierte den Kern der Kritik so: "Es fühlte sich an, als würde Anthropic der Öffentlichkeit sagen: 'Wir trauen niemand anderem zu, KI-Forschung zu betreiben. Wir sind die Einzigen, die KI-Forschung betreiben dürfen.'"
Ungelöst bleibt jedoch ein zweites Problem: Claude Fable 5 verlangt Datenspeicherung, um die neuen Sicherheits-Klassifikatoren zu betreiben – Prompts und Ausgaben werden bis zu 30 Tage, bei Regelverstößen sogar bis zu zwei Jahre aufbewahrt. Microsoft schränkt das Modell laut The Verge deshalb intern ein: Während alle anderen Claude-Modelle unter Zero-Data-Retention-Regeln laufen, fehlt Fable 5 in der internen Modellauswahl der GitHub-Copilot-Version.