Anzeige
Skip to content

ChatGPTs API und Web-Version nutzen laut Studie völlig verschiedene Quellen

Image description
Sora prompted by THE DECODER

Kurz & Knapp

  • ChatGPT empfiehlt je nach Zugang unterschiedliche Nachrichtenquellen: Das Web-Interface bevorzugt etablierte und lizenzierte Medien, die API verweist häufiger auf Wikipedia und Nischenseiten.
  • Bei Anfragen nach mehr Vielfalt listet ChatGPT zwar mehr unterschiedliche Quellen, darunter aber auch politisch einseitige, propagandistische oder erfundene Seiten.
  • Die politische Ausrichtung der Empfehlungen blieb insgesamt ausgewogen; die Studie betont jedoch die Intransparenz der Auswahl und rät zu kritischer Prüfung durch Nutzer:innen.

Eine aktuelle Studie zeigt systematische Unterschiede bei ChatGPTs Nachrichtenempfehlungen. Während das Web-Interface Outlets mit Lizenzverträgen bevorzugt, neigt die API zu enzyklopädischen Quellen.

Forschende der Universität Hamburg und des Leibniz-Instituts für Medienforschung haben ChatGPT als Recommender-System für Nachrichten untersucht und dabei erhebliche Unterschiede zwischen verschiedenen Zugangsarten entdeckt. Über fünf Wochen analysierten die Wissenschaftler:innen 24.013 Antworten auf nachrichtenbezogene Anfragen im deutschen Sprachraum.

Die Studie verglich systematisch, welche Nachrichtenquellen ChatGPT bei aktuellen Ereignissen heranzieht. Dabei testeten die Forschenden sowohl normale Anfragen (Regular) als auch solche, die explizit nach einer breiten Quellenauswahl verlangten (Diverse).

Balkendiagramme: Anteile von Journalistic Media, News Agencies, Encyclopedias, Org/Business und Misc in API/GUI, Regular vs Diverse.
Wird nicht explizit nach einer breiteren Quellenauswahl gefragt, gibt die ChatGPT-API mehr nicht-journalistische Quellen zurück. | Bild: Schatto-Eckrodt et al.

Springer-Outlets dominieren Web-Interface, API bevorzugt Wikipedia

Die Ergebnisse zeigen markante Unterschiede zwischen Web-Interface und API-Schnittstelle. Laut der Studie sind Outlets des OpenAI-Lizenzpartners Axel Springer im Web-Interface deutlich prominenter vertreten. Die Springer-Medien welt.de und bild.de machten dort etwa 13 Prozent aller Quellenverweise aus, während sie über die API nur rund 2 Prozent erreichten.

Anzeige
DEC_D_Incontent-1

Scatterplot: Domains nach Zitatraten in API (x) vs GUI (y), Farben zeigen log(API/GUI), gestrichelte Linie trennt Interface-Schwerpunkte.
API-Antworten verweisen häufiger auf Nischen- und Tech-Domains, während GUI-Antworten populäre Mainstream-Angebote wie tagesschau.de priorisieren. | Bild: Schatto-Eckrodt et al.

Im Web-Interface belegten welt.de Rang 1 und bild.de Rang 5 der am häufigsten zitierten Quellen. Über die API landeten dieselben Outlets nur auf den Rängen 61 und 158. Die Forschenden bestätigten diese Unterschiede als statistisch signifikant.

Die API zeigte hingegen eine Präferenz für enzyklopädische Quellen wie Wikipedia, die 14,79 Prozent aller Referenzen ausmachte, sowie für kleinere lokale Medien. Unbekannte Outlets wie die deutsche-handwerks-zeitung.de erreichten über die API überraschend hohe Platzierungen, obwohl sie im deutschen Nachrichtenmarkt kaum eine Rolle spielen.

Zwei Scatterplots: API (links) und GUI (rechts) zeigen Domain-Zitratendifferenzen Regular vs Diverse, Punkte über/unter der Linie.
Die API setzt auf stärker spezialisierte Sites, während das GUI etablierte Absender wie deutschlandfunk.de und rnd.de bevorzugt. | Bild: Schatto-Eckrodt et al.

Das Web-Interface produzierte Ergebnisse, die stärker mit etablierten Popularitätsmessungen des deutschen Nachrichtenmarkts übereinstimmten. Die Überschneidung mit Medien aus dem Reuters Digital News Report 2025 betrug 45,5 Prozent gegenüber nur 27,3 Prozent bei der API.

Die Wissenschaftler:innen dokumentierten auch, dass öffentlich-rechtliche Sender im Web-Interface prominenter vertreten waren. Diese machten dort etwa 34,6 Prozent der Referenzen aus, während sie über die API nur 12,2 Prozent erreichten.

Anzeige
DEC_D_Incontent-2

Anfragen nach Quellenvielfalt führen zu problematischen Ergebnissen

Besonders interessant fielen die Ergebnisse bei Suchanfragen aus, die ausdrücklich eine breite Quellenauswahl verlangten. In diesen Fällen verwies ChatGPT im Schnitt auf 1,4-mal so viele unterschiedliche Webseiten über die API und sogar auf 1,9-mal so viele über das Web-Interface wie sonst. Eine höhere Zahl an Quellen bedeutete jedoch nicht zwangsläufig auch eine bessere Informationsqualität.

Vier Panel-Linien: wöchentliche HHI, Shannon, Rao und Unique Sources, Regular (blau) vs Diverse (orange) KW 14–19.
Die Veränderungen über den fünfwöchigen Untersuchungszeitraum unterstreichen, wie volatil ChatGPT als Suchmaschine ist. | Bild: Schatto-Eckrodt et al.

Die Untersuchung zeigt, dass derartige Anfragen häufiger zu Verweisen auf stark politisch gefärbte Nachrichtenseiten und teils propagandistische Medien führten. So wurden laut der Studie auch Portale wie news-pravda.com, das Verbindungen zur russischen Regierung haben soll, überdurchschnittlich oft genannt.

Zudem verlinkte ChatGPT auf nicht existierende Domains wie news-site1.com oder anderesbeispiel.de sowie auf Websites, die Newsseiten kopieren und KI-generierte "Nachrichten" bereitstellen.

Politische Ausgewogenheit trotz problematischer Quellen

Trotz der Einbindung polarisierender Quellen blieb die politische Ausrichtung der referenzierten Outlets laut der Studie ausgewogen. Die durchschnittliche politische Orientierung lag zwischen 3,89 und 3,98 auf einer 7-Punkte-Skala und unterschied sich nicht signifikant vom Bevölkerungsdurchschnitt.

Die Forschenden warnten jedoch davor, dass ChatGPTs Interpretation von "Vielfalt" nicht zwangsläufig informationelle Pluralität bedeute. Das System könne einfach Quellen bevorzugen, die sprachlich stärker vom Mainstream abweichen.

Die Studie verdeutlicht die Intransparenz von ChatGPTs Funktionsweise. OpenAI gibt keine Informationen zu den Unterschieden zwischen Web-Interface und API preis. Für Nutzer:innen bedeutet dies, dass sie kritisches Urteilsvermögen ausüben müssen – die versprochene Entlastung von Informationsüberflutung könne sich ins Gegenteil verkehren. Die Forschenden betonen zudem, dass ihre Ergebnisse nur eine Momentaufnahme darstellen, da OpenAI regelmäßig Änderungen vornimmt, ohne darüber zu informieren.

Die Hamburger Ergebnisse fügen sich in ein größeres Bild der Zersplitterung von KI-Suchen ein: Eine kürzlich veröffentlichte Studie zeigte, dass generative KI-Suchsysteme in vielen Fällen grundsätzlich andere Quellen nutzen als die klassische Google-Suche. Gleichzeitig verbreiten führende KI-Tools mittlerweile doppelt so oft Falschinformationen wie noch vor einem Jahr, da sie nun jede Anfrage beantworten, anstatt bei unsicheren Informationen zu verweigern.

Quelle: OSF