Eine Studie von Forschenden der Harvard University und der TU Graz zeigt, dass GPT-4 bei der kognitiven Neubewertung negativer Situationen besser abschneidet als Menschen.
Wissenschaftler der Harvard University haben in zwei Studien untersucht, wie gut Menschen und die KI GPT-4 negative Situationen neu bewerten können. Diese "kognitive Neubewertung" ist eine effektive Methode, um negative Gefühle in verschiedenen Kontexten zu reduzieren.
Die Forscher ließen menschliche Probanden und GPT-4 insgesamt 18 negative Situationsbeschreibungen, die entweder Traurigkeit, Angst oder Wut ausdrückten, neu interpretieren. Andere Personen bewerteten dann die Qualität dieser neuen Interpretationen in vier Bereichen: Wirksamkeit, Empathie, Neuheit und Angemessenheit (Specificity).
In beiden Studien stellten die Forscher fest, dass GPT-4 in den Bereichen Wirksamkeit, Empathie, Neuheit besser abschnitt als Menschen. Bei der Übereinstimmung der Neubewertung mit der ursprünglichen Situation gab es keinen signifikanten Unterschied zwischen Menschen und GPT-4.
In der zweiten Studie wurden die Teilnehmer durch zusätzliche Bonuszahlungen motiviert, bessere Umdeutungen zu liefern. Obwohl die Teilnehmer dadurch mehr Zeit für ihre Umdeutungen aufwendeten, verringerte sich der Qualitätsunterschied zwischen Menschen und GPT-4 nicht. Das deutet darauf hin, dass der Unterschied eher auf die Fähigkeit als auf die Anstrengung zurückzuführen ist, so die Forscher.
Eine Analyse der sprachlichen Ähnlichkeit zwischen den ursprünglichen Situationsbeschreibungen und den Neubewertungen zeigte, dass die menschlichen Neubewertungen dazu neigten, semantisch den ursprünglichen Beschreibungen ähnlicher zu sein. Menschen hielten sich viel stärker an die beschriebene Situation, anstatt eine allgemeine Antwort zu geben. Bei der KI war es umgekehrt.
Die Ergebnisse deuten darauf hin, wie sowohl menschliche als auch GPT-4-Neubewertungen verbessert werden können: Menschen können lernen, über die spezifische Situation hinauszugehen und eine breitere und allgemeinere Interpretation zu liefern, während GPT-4 von einer stärkeren Fokussierung auf die spezifischen Details der Situation profitieren könne.
KI könnte Menschen bei Neubewertungen unterstützen
Die Forscher betonen, dass die Ergebnisse Auswirkungen auf den Einsatz von KI bei der Neubewertung und allgemein bei der Unterstützung der psychischen Gesundheit haben. Modelle wie GPT-4 könnten menschliche Neubewertungen verbessern, indem sie Verbesserungsvorschläge für erste menschliche Neubewertungen liefern.
Die Studien weisen jedoch auch einige Einschränkungen auf. Sie konzentrierten sich auf die Neubewertung sehr spezifischer Situationen, die von anderen Personen erstellt wurden und begrenzt waren. Es sei möglich, dass Menschen in komplexeren oder detaillierteren Situationen besser abschneiden als GPT-4. Außerdem wussten die Teilnehmer nicht, dass einige der Neubewertungen von einer KI stammten. Frühere Forschungsergebnisse deuten darauf hin, dass dies die Bewertung beeinflussen kann.
Eine im Sommer 2023 durchgeführte Studie unterstützt die Erkenntnisse der Harvard-Forscher: Sie wiesen nach, dass GPT-4 die mögliche Vielfalt von Emotionen in einem bestimmten Szenario detaillierter beschreiben kann. Das macht KI aber nicht automatisch zum besseren Psychotherapeuten.