KI-Forschung

28. Juli 202328. Juli 2023

Forscher entdecken automatisierte Jailbreak-Angriffe auf LLMs wie ChatGPT oder Bard

Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.

Profil

E-Mail Website

Forscher haben herausgefunden, dass es möglich ist, Angriffe zu automatisieren, die große Sprachmodelle (LLMs) wie ChatGPT, Bard und Claude dazu bringen, unerwünschte und potenziell schädliche Inhalte bereitzustellen. Herkömmliche Jailbreaks erfordern einen erheblichen manuellen Entwicklungsaufwand und können in der Regel von den LLM-Anbietern behoben werden. Diese automatisierten Angriffe können jedoch in großer Zahl erstellt und auf quelloffene und öffentlich verfügbare Chatbots angewendet werden.

Ähnliche gegnerische Angriffe gibt es seit mehr als einem Jahrzehnt im Bereich des maschinellen Sehens. Nach Ansicht der Forscher ist das ein Zeichen dafür, dass solche Bedrohungen KI-Systemen innewohnen könnten. Sie weisen darauf hin, dass diese Art von Angriffen möglicherweise nicht vollständig verhindert werden kann.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:

Banküberweisung

Quellen

Project site Twitter oh sorry "X"

Matthias Bastian

Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.

Profil

E-Mail Website

KI in der Praxis

15. Juli 202515. Juli 2025

Update

xAI korrigiert Grok: Chatbot soll nicht mehr Elon Musks Meinungen als Referenz nehmen

News, Tests und Berichte über VR, AR und MIXED Reality.

Wie es mit MIXED weitergeht Mein persönlicher Abschied von MIXED Meta und Anduril entwickeln jetzt gemeinsam VR-Brillen fürs US-Militär MIXED.de

KI in der Praxis

15. Juli 2025

Grok führt interaktive KI-Avatare für iOS-App ein

KI und Gesellschaft

15. Juli 202515. Juli 2025

Nvidia darf H20-KI-Chip wieder nach China exportieren - US-Regierung ändert Kurs

Google News

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Forscher entdecken automatisierte Jailbreak-Angriffe auf LLMs wie ChatGPT oder Bard

xAI korrigiert Grok: Chatbot soll nicht mehr Elon Musks Meinungen als Referenz nehmen

Grok führt interaktive KI-Avatare für iOS-App ein

Nvidia darf H20-KI-Chip wieder nach China exportieren - US-Regierung ändert Kurs

Kimi K2: Das nächste Open-Model-Wunder nach Deepseek kommt wieder aus China

Neue KI-Architektur verspricht besseres "System 2-Denken"

Musk präsentiert Grok 4: xAI-Modell übertrifft OpenAI und Google in Benchmarks

Forscher entdecken automatisierte Jailbreak-Angriffe auf LLMs wie ChatGPT oder Bard

xAI korrigiert Grok: Chatbot soll nicht mehr Elon Musks Meinungen als Referenz nehmen

Grok führt interaktive KI-Avatare für iOS-App ein

Nvidia darf H20-KI-Chip wieder nach China exportieren - US-Regierung ändert Kurs