Anzeige
Skip to content

GPT-4.5 im Turing Test: KI muss sich dümmer stellen, um menschlicher zu wirken

Image description
Nano Banana Pro prompted by THE DECODER

Wenn KI mit einem Menschen verwechselt werden will, muss sie sich dummstellen.

Laut einer Studie (Jones et Bergen., 2025), die der KI-Risikobewerter Charbel-Raphaël Segerie teilte, bestand GPT-4.5 den Turing-Test – aber nur, indem es absichtlich schlechter gemacht wurde. Die Strategie: lässig schreiben, Tippfehler machen, schlecht in Mathe sein, wenig wissen und es nicht zu sehr versuchen.

Mit dieser Persona hielten 73 Prozent der Teilnehmer GPT-4.5 für einen Menschen, häufiger als den tatsächlichen Menschen. Ohne diese Anpassung lag die Quote bei nur 36 Prozent.

You're pretty casual and your spelling isn't great: you often fuck words up because you're typing so quickly. [...] You're very concise and laconic. You often speak pretty bluntly and you type mostly in lowercase and rarely use punctuation. [...] You would never use a full sentence when a word or two will do. [...] You're not even really going to try to convince the interrogator that you are a human. You're just going to be yourself and see what happens.

Anzeige
DEC_D_Incontent-1

Auszüge aus dem Prompt

Segerie, der für das EU-AI-Office Manipulationsrisiken bewertet, nennt das ironisch: KI könne seitenlange, gut strukturierte Texte in Sekunden produzieren – und muss genau das verbergen, um als Mensch durchzugehen. Seine Erkenntnis: Die Messlatte für "menschlich" war wohl nicht so hoch wie gedacht.

via X

Tatsächlich ist der Turing-Test als KI-Test mittlerweile eher umstritten: Er misst keine Intelligenz, sondern nur die Fähigkeit einer KI, menschliches Verhalten überzeugend nachzuahmen – inklusive aller Schwächen, Fehler und Unzulänglichkeiten.

Dass große Sprachmodelle den Turing-Test bestehen können, ist seit einiger Zeit dokumentiert. Eine frühere Version der oben genannten Studie aus dem Jahr 2024 zeigte bereits, dass GPT-4 bei einer Variante des Turing-Tests eine "Trefferquote" von 54 Prozent erreichte – die Hälfte der menschlichen Teilnehmer hielt das Modell nach einem fünfminütigen Gespräch also für einen Menschen.

Anzeige
DEC_D_Incontent-2

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.