KI-Agenten können bereits die meisten getesteten Smart-Contract-Schwachstellen ausnutzen

19. Februar 2026

OpenAI und die Krypto-Investmentfirma Paradigm haben gemeinsam EVMbench entwickelt, einen Testrahmen, der misst, wie gut KI-Agenten Sicherheitslücken in Smart Contracts auf Ethereum-Blockchains finden, reparieren und ausnutzen können. Der Datensatz umfasst 120 Schwachstellen aus 40 echten Sicherheitsprüfungen.

In der realistischsten Testumgebung interagieren die KI-Agenten mit einer lokalen Blockchain und müssen Angriffe vollständig selbst durchführen.

Das beste Modell, GPT-5.3-Codex, schaffte es, 72 Prozent der Schwachstellen erfolgreich auszunutzen und 41,5 Prozent zu reparieren. Beim Erkennen lag Claude Opus 4.6 mit 45,6 Prozent vorn.

Die größte Hürde für die KI-Agenten ist laut den Forschern nicht das Ausnutzen oder Reparieren selbst, sondern das Auffinden der Schwachstellen in großen Codebasen. Bekamen die Agenten Hinweise, wo eine Lücke liegt, stieg die Erfolgsquote beim Ausnutzen von 63 auf 96 Prozent und beim Reparieren von 39 auf 94 Prozent.

Angesichts der über 100 Milliarden Dollar in Smart Contracts sehen die Autoren sowohl Chancen für bessere Sicherheit als auch wachsende Risiken.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: OpenAI