So unterscheiden sich KI-generierte Fragen von menschlichen Fragen

Eine neue Studie vergleicht Fragen, die von großen Sprachmodellen generiert werden, mit Fragen, die von Menschen erstellt werden.

Ein Forschungsteam der University of California Berkeley, des King Abdullah City for Science and Technology (KACST) in Saudi-Arabien und der University of Washington hat in einem Paper die Charakteristika von Fragen untersucht, die von großen Sprachmodellen generiert werden.

Ein zentrales Ergebnis der Untersuchung ist, dass LLMs eine starke Präferenz für beschreibende Fragen zeigen, die Erklärungen oder Charakterisierungen erfordern. Bis zu 44 Prozent der von LLMs generierten Fragen fallen in diese Kategorie, während menschliche Fragesteller:innen sich mehr auf faktische Fragen konzentrieren.

Infografik: Zweispaltiges Layout zur Analyse von LLM-Fragen mit Kontext, generierten Fragen und Charakteristik-Auswertung inkl. Bewertungsmetriken. — KI stellt gerne Fragen, die detaillierte Antworten erfordern. | Bild: Zhang et al.

Diese Vorliebe für deskriptive Fragen führt auch zu längeren Antworten. Selbst bei einer Beschränkung auf eine Mindestlänge ohne Qualitätsverlust erfordern LLM-generierte Fragen deutlich ausführlichere Antworten als von Menschen formulierte Fragen.

KI-Fragen decken Kontext gleichmäßiger ab

Ein weiterer Unterschied betrifft die Kontextabdeckung. Während sich menschliche Fragen häufig auf den Anfang eines bestimmten Kontextes konzentrieren, berücksichtigen Sprachmodelle den gesamten Kontext gleichmäßiger. Das steht im Gegensatz zur positionalen Verzerrung, die zuvor bei KI-basierten Aufgaben zur Fragebeantwortung beobachtet wurde.

Die Ergebnisse zeigen laut den Wissenschaftler:innen, dass die von Sprachmodellen generierten Fragen aufgrund ihrer Einzigartigkeit gut geeignet sind, um RAG-Systeme zu testen oder Halluzinationen automatisch zu erkennen.

Darüber hinaus können die Erkenntnisse dazu beitragen, das Prompt-Engineering für die Fragengenerierung mit LLMs zu optimieren. Durch gezielte Anpassungen der Prompts könnten Fragen generiert werden, die menschlichen Fragen ähnlicher sind oder bestimmte erwünschte Eigenschaften aufweisen.

Neuartige Methode zur Untersuchung von KI-generierten Fragen

Um die Eigenschaften der von den Sprachmodellen erzeugten Fragen zu analysieren, entwickelten die Forscher eine spezielle Methodik. Zunächst definierten sie verschiedene Fragekategorien, von einfachen Faktenfragen bis zu komplexeren Fragen, die ausführlichere Antworten erfordern. Diese Kategorien wandten sie sowohl auf einen eigenen Datensatz als auch auf bestehende, von Menschen erstellte Fragesammlungen an.

Neben den Fragen untersuchten die Forscherinnen und Forscher auch die Antworten auf die Fragen. Sie ließen die Sprachmodelle Antworten generieren, einmal mit und einmal ohne Kontext.

Empfehlung

KI-Forschung

Hm, Moment mal! Forscher warnen vor vermenschlichten KI-"Gedankengängen"

Indem sie die Länge der Antworten variierten, konnten sie herausfinden, wie viele Informationen für eine vollständige Antwort notwendig sind. Im Umkehrschluss gewannen sie so Erkenntnisse über die Komplexität und den Informationsgehalt der Fragen.

Zum Vergleich der KI-generierten Fragen nutzten die Wissenschaftler:innen zwei Datensätze, die auf Wikipedia-Artikeln basieren, sich aber in der Erstellungsmethode unterscheiden. In einem Fall wurden die Fragen anhand vorgegebener Textabschnitte erstellt, im anderen Fall suchte man zu existierenden Fragen passende Wikipedia-Abschnitte.

Die Fragengenerierung durch Sprachmodelle findet sich bereits in vielen Produkten, die Unternehmen um KI-Fähigkeiten erweitert haben oder die von Grund auf mit den neuen generativen Möglichkeiten entwickelt wurden. So schlägt Amazon etwa Fragen zu Produkten durch seinen Einkaufshelfer Rufus vor, mit der Suchmaschine Perplexity lassen sich Themen durch (auch durch ebenfalls vorgeschlagene) Folgefragen immer tiefer recherchieren.

Zusätzlich zum Paper haben die Wissenschaftler:innen ihren Code quelloffen auf GitHub zur Verfügung gestellt.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

So unterscheiden sich KI-generierte Fragen von menschlichen Fragen

KI-Fragen decken Kontext gleichmäßiger ab

Neuartige Methode zur Untersuchung von KI-generierten Fragen

Hm, Moment mal! Forscher warnen vor vermenschlichten KI-"Gedankengängen"

Midjourney erweitert KI-Videofunktionen mit Start- und Endbildern

Disney-Chefjurist kündigt KI-Klagekampagne an - Midjourney ist nur der Anfang

Animierte KI-Bilder: Midjourney veröffentlicht sein erstes Videomodell

OpenAI startet GPT-5 – mit besserem Verständnis, Personalisierung und Entwickler-Tools

Google Deepmind zeigt mit Genie 3 ein KI-Modell für interaktive Welten in Echtzeit

Google schaltet Gemini 2.5 Deep Think frei – und zieht erste Sicherheitsgrenzen

So unterscheiden sich KI-generierte Fragen von menschlichen Fragen

KI-Fragen decken Kontext gleichmäßiger ab

Neuartige Methode zur Untersuchung von KI-generierten Fragen

Artikel teilen

Bankverbindung