Inhalt
summary Zusammenfassung

Eine neue Studie der Universität Pittsburgh zeigt: Leser können KI-Gedichte nicht von menschlichen unterscheiden. Sie bewerten die computergenerierten Verse sogar besser als die Werke berühmter Dichter wie Shakespeare.

Anzeige

Wie die Forscher der University of Pittsburgh berichten, lag die Trefferquote der insgesamt 16.340 Studienteilnehmer bei der Unterscheidung von KI- und menschengeschriebenen Gedichten bei nur 46,6 Prozent - also unter dem Zufallsniveau.

Noch überraschender: Die KI-Gedichte wurden häufiger für menschliche Werke gehalten als die tatsächlich von Menschen verfassten Verse.

Für die Studie ließen die Wissenschaftler ChatGPT 3.5 jeweils fünf Gedichte "im Stil" von zehn bekannten englischsprachigen Dichtern generieren, darunter William Shakespeare, Walt Whitman und Emily Dickinson. Diese wurden dann von den Testpersonen ebenso wie echte Gedichte der Autoren bewertet und die Ergebnisse verglichen.

Anzeige
Anzeige

"Die KI-generierten Gedichte wurden in Kategorien wie Rhythmus und Schönheit sogar besser bewertet als die menschlichen Originale", erklären die Studienautoren Brian Porter und Edouard Machery.

Box-Plot-Diagramm zeigt Bewertungen von 13 poetischen Qualitätsdimensionen, vergleicht KI- und menschliche Autorenschaft auf 7-Punkte-Skala.
In 13 verschiedenen Qualitätsdimensionen von "beautiful" bis "witty" erreichen KI-generierte Gedichte durchweg vergleichbare oder bessere Bewertungen als menschliche Werke. Besonders bei technischen Aspekten wie Rhythmus und Klang überzeugt die KI. | Grafik: Porter, Machery

Einfachere Sprache als KI-Erfolgsfaktor

Die Forscher haben auch eine mögliche Erklärung für dieses Phänomen: Die KI-Gedichte seien in einer direkteren, zugänglicheren Sprache verfasst und damit für Laien leichter zu verstehen. "Die Teilnehmer interpretierten diese Zugänglichkeit fälschlicherweise als Zeichen menschlicher Autorschaft", heißt es in der Studie.

Wurden die Teilnehmenden in einem zweiten Experiment mit 696 Probanden vorab darüber informiert, dass ein Gedicht von einer KI stammt, bewerteten sie es schlechter - ein Effekt, der auch aus anderen kreativen Bereichen bekannt ist.

Box-Plot vergleicht vier Qualitätsfaktoren von Gedichten zwischen KI, Mensch und neutraler Gruppe, alle mit ähnlichen Bewertungen um den Nullpunkt.
Die Analyse von vier Schlüsselfaktoren - Kreativität, Atmosphäre, strukturelle und emotionale Qualität - zeigt überraschend ausgeglichene Bewertungen zwischen KI, Mensch und neutralem Framing. Die Vorurteile zugunsten des Menschen verschwinden, wenn die Herkunft der Gedichte unbekannt ist. KI wird abgewertet. | Grafik: Porter, Machery

Bei der Bewertung der Ergebnisse sind zwei Dinge zu beachten: Zum einen wurde mit ChatGPT 3.5 eine mittlerweile veraltete Version des Sprachmodells verwendet. Neuere Versionen könnten noch überzeugendere Ergebnisse liefern.

Zum anderen basieren die KI-Gedichte auf der expliziten Anweisung, den Stil bestimmter Dichter nachzuahmen - sie sind also keine gänzlichen Neuschöpfungen. Ohne die großen menschlichen Vorbilder gäbe es die KI-Gedichte wohl nicht oder zumindest nicht in dieser Form.

Empfehlung

Die Forscher betonen zudem, dass sich die Studie auf Laien beschränkt, die gerade durch die einfachere Sprache der KI abgeholt werden könnten. Poesie-Experten könnten besser zwischen KI-Gedichten und von Menschen geschriebenen Gedichten unterscheiden, da sie mit den strukturellen Anforderungen von Reim und Metrik besser vertraut seien.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Eine Studie der Universität Pittsburgh zeigt, dass Leser KI-generierte Gedichte nicht von menschlichen unterscheiden können und die computergenerierten Verse sogar besser bewerten als Werke berühmter Dichter wie Shakespeare.
  • Die Forscher ließen ChatGPT 3.5 Gedichte im Stil von zehn bekannten englischsprachigen Dichtern generieren und verglichen diese mit echten Gedichten der Autoren. Die KI-Gedichte wurden in Kategorien wie Rhythmus und Schönheit besser bewertet als die menschlichen Originale.
  • Als mögliche Erklärung nennen die Forscher die direktere, zugänglichere Sprache der KI-Gedichte, die für Laien leichter zu verstehen sei. Wurden die Teilnehmer vorab über die KI-Herkunft informiert, bewerteten sie die Gedichte schlechter - ein bekannter Effekt aus anderen kreativen Bereichen.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!