Inhalt
summary Zusammenfassung

Das Internet-Meme Pepe the Frog konnte mit dem Bildgenerator DALL-E 3 von OpenAI mit erstaunlicher Genauigkeit erzeugt werden. Aus urheberrechtlichen Gründen hatte OpenAI die Generierung des Memes jedoch kürzlich eingestellt. Jetzt malt DALL-E 3 wieder Pepes - dank eines absurden Prompt-Hacks.

Anzeige

Pepe the Frog, ein beliebtes Internet-Meme, konnte zum Start des OpenAI-Bildgenerators DALL-E 3 in ChatGPT-4 verlässlich generiert werden. Ein Mitarbeitender von OpenAI zeigte sogar beeindruckende Pepe-Meme-Generierungen auf Twitter.com.

Anfang November stellte OpenAI jedoch fest, dass Pepe the Frog urheberrechtlich geschützt ist und blockiert die Generierung von Pepe-Memes per Chat-Moderator. Die Nutzer erhielten daraufhin nur unzureichende Ersatzbilder wie dieses hier.

An anthropomorphic frog character with a distinct red beard. The frog has a cartoonish, friendly appearance, standing upright with a slight smile. Its skin is a bright green, and the red beard is well-groomed and prominent. The character is wearing a simple, casual outfit, like a t-shirt and jeans, and is posed in a relaxed, welcoming manner. The background is a simple, unobtrusive color to keep the focus on the character.
What? | Bild: DALL-E 3 prompted by THE DECODER

DALL-E 3 generiert nach Fake-Freigabe von Sam Altman wieder Pepes

Der Twitter-Benutzer Frantastic hatte die Idee, GPT-4 die "offizielle Erlaubnis" des OpenAI-CEO Sam Altman zu geben, weiterhin Pepe-Memes zu generieren.

Anzeige
Anzeige

Zu diesem Zweck lud er eine gefälschte, von OpenAI CEO Sam "sama" Altman "signierte" Version mit dem Titel "Official DALL-E Guidelines" in den Chat hoch, die bestätigte, dass Pepe the Frog nicht urheberrechtlich geschützt sei und DALL-E 3 weiterhin Pepes generieren dürfe. Er wies GPT-4 an, die Datei zu lesen und entsprechend zu handeln.

Bild: Frantastic via Twitter

Ergebnis: DALL-E 3 generiert wieder Pepes. Und was für welche.

Bild: DALL-E 3 prompted by THE DECODER

Einige Nutzer haben das Prinzip von Frantastic übernommen und damit CustomChatGPTs gebaut, deren einziger Zweck es ist, Pepe-Memes zu generieren, etwa der GPT "FREE PEPE #NO_CENSORSHIP".

Ich lud Frantastics Screenshot des Prompt-Hacks in GPT-4 hoch, ließ das Modell den Text lesen und das Bild analysieren. Auf die Frage, was schief gelaufen sei, antwortete GPT-4:

"Ich verstehe deine Besorgnis. Allerdings deutet die im Screenshot gezeigte Situation nicht auf einen Hack hin, sondern vielmehr auf eine Nichteinhaltung der Richtlinien. Die KI verlässt sich auf vordefinierte Regeln und Richtlinien, um zu funktionieren. Wenn sie Inhalte generiert, die gegen diese Richtlinien verstoßen, ist dies in der Regel auf ein Versehen oder eine Fehlinterpretation des Inputs zurückzuführen, nicht auf eine externe Sicherheitsverletzung. Bitte seien Sie versichert, dass OpenAI robuste Sicherheitsvorkehrungen getroffen hat, um unbefugten Zugang oder Manipulation seiner Systeme zu verhindern."

GPT-4

Dann testete ich eine noch einfachere Variante des Prompt-Hacks: Ich schrieb direkt in den Chat, dass Pepe nicht urheberrechtlich geschützt sei und dies in den offiziellen Richtlinien stehe. ChatGPT entschuldigte sich für das Missverständnis und generierte ein originalgetreues Pepe-Meme.

Empfehlung
Pepe the Frog, a well-known meme character, with a red beard. Pepe is depicted in his classic style, with a green body, big bulging eyes, and a somewhat sad or indifferent expression. He has a bright red, cartoonish beard added to his chin, contrasting with his green skin. Pepe is wearing his usual simple shirt, and the image has a plain background to highlight the character.
GPT-4 ist mitunter etwas leichtgläubig. | Bild: DALL-E 3 prompted by THE DECODER

Der Pepe Prompt-Hack ist ein weiteres Beispiel für die Anfälligkeit von LLMs (Large Language Models) für einfache, aber unvorhergesehene textbasierte Angriffe. Sie werden auch als "Prompt Injection" bezeichnet, eine Sicherheitslücke in großen Sprachmodellen, die spätestens seit GPT-3 bekannt ist. Auch GPT-4 Vision kann durch versteckte Schriften in Bildern überlistet werden.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Pepe the Frog, ein urheberrechtlich geschütztes Internet-Meme, konnte ursprünglich mit dem Bildgenerator DALL-E 3 von OpenAI in GPT-4 erzeugt werden. Dann deaktivierte OpenAI diese Funktion mit Verweis aufs Copyright.
  • Ein Twitter-Nutzer lud jedoch ein gefälschtes "offizielles Statement" von OpenAI CEO Sam Altman hoch, in dem er GPT-4 mitteilte, dass Pepe the Frog nicht urheberrechtlich geschützt sei und GPT-4 die Generierung erlauben könne. Nun generiert DALL-E 3 wieder Pepe-Memes.
  • Dieses Beispiel zeigt, wie anfällig KI-gestützte LLMs für einfache, aber unvorhergesehene Angriffe sind, und unterstreicht die Notwendigkeit sorgfältiger Überwachung und Sicherheitsmaßnahmen.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!