Anzeige
Skip to content

Studie: 35 Prozent aller neuen Websites sind Mitte 2025 KI-generiert

Image description
Midjourney prompted by THE DECODER

Eine groß angelegte Analyse von Websites aus dem Internet Archive zeigt, wie stark KI-Text das Netz bereits durchdringt. Die tatsächlichen Auswirkungen weichen laut den Forschern aber deutlich von der öffentlichen Wahrnehmung ab.

Rund 35 Prozent aller neu veröffentlichten Websites waren Mitte 2025 ganz oder teilweise von KI generiert. Das ist das zentrale Ergebnis einer Studie von Forschern des Imperial College London, des Internet Archive und der Stanford University. Vor dem Launch von ChatGPT Ende 2022 lag der Anteil bei praktisch null.

Für die Untersuchung zogen die Forscher eine repräsentative Stichprobe englischsprachiger Websites aus der Wayback Machine des Internet Archive, verteilt über 33 Monatsintervalle von August 2022 bis Mai 2025. Zur Erkennung von KI-Texten setzten sie den Detektor Pangram v3 ein, der in einer eigenen Robustheitsanalyse über fünf Dimensionen die zuverlässigsten Ergebnisse lieferte.

Die Forscher testeten sechs verbreitete Hypothesen über die Auswirkungen von KI-Text auf das Internet. Statistisch signifikant bestätigt wurden nur zwei: die sogenannte "Semantic Contraction" und der "Positivity Shift".

Die semantische Kontraktion beschreibt eine Verengung der Ideenvielfalt im Netz. KI-generierte Texte wiesen laut der Studie eine um 33 Prozent höhere semantische Ähnlichkeit untereinander auf als menschlich verfasste Inhalte. Die Forscher sehen darin ein Indiz, dass Sprachmodelle Outputs erzeugen, die näher am Durchschnitt ihrer Trainingsdaten liegen, und so das "Overton Window" des Online-Diskurses verengen könnten.

Der Positivity Shift zeigt sich in einer zunehmend künstlich positiven Tonalität. Der positive Sentiment-Score lag bei KI-Texten 107 Prozent höher als bei komplett menschlich verfassten. Die Forscher führen das auf die bekannte Neigung von Sprachmodellen zur Schmeichelei und zum Überoptimismus zurück. Ein Diskurs, der von bereinigten, betont freundlichen Texten dominiert werde, könne menschlichen Widerspruch marginalisieren. Co-Autor Jonas Dolezal, KI-Forscher an der Stanford University, plädiert deshalb dafür, KI-Modellen mehr Reibung und eine eigenständigere Stimme zu geben, "anstatt sie zu zwingen, perfekt gefällig und einverstanden zu sein", wie er gegenüber 404 Media sagte. Allerdings misst die Studie natürlich Korrelationen, keine kausalen Zusammenhänge.

Studie findet keine Zunahme faktischer Fehler

Vier weitere Hypothesen ließen sich nicht belegen: weder ein Verschwinden individueller Schreibstile noch ein Rückgang externer Verlinkungen oder eine sinkende Informationsdichte. Auch eine Zunahme faktischer Fehler konnte die Studie nicht nachweisen, wobei dieser Befund methodisch deutlich fragiler ist als die übrigen Ergebnisse.

Um die sogenannte Truth-Decay-Hypothese zu prüfen, ließen die Forscher GPT-4o-mini automatisiert überprüfbare Behauptungen aus den Websites extrahieren, bis zu fünf pro Seite. Anschließend bewerteten 50 menschliche Annotatoren diese Behauptungen anhand externer Quellen als belegt, widerlegt, nicht ausreichend belegbar oder widersprüchlich belegt. Gemessen wurde der Anteil klar widerlegter Aussagen. Eine statistisch signifikante Korrelation mit dem KI-Anteil fanden die Forscher nicht.

Dieses Ergebnis beruht allerdings auf einer vergleichsweise schmalen Basis: Jeder Annotator prüfte Behauptungen aus fünf Artikeln, was auf eine Teilstichprobe von schätzungsweise 250 Websites hindeutet. Gemessen an den rund 10.000 URLs pro Monat über 33 Monate, die der Gesamtstudie zugrunde liegen, ist das ein kleiner Ausschnitt. Zudem erfasst die Methode nur einen engen Typ von Wahrheitsverfall: klar widerlegbare Einzelaussagen. Subtilere Formen wie vage, suggestive oder schlicht nicht überprüfbare Behauptungen, die gerade bei KI-generierten Texten häufig vorkommen dürften, fallen durch dieses Raster. Dass ein KI-Modell vorab entscheidet, welche Aussagen überhaupt als "überprüfbar" gelten und den Annotatoren vorgelegt werden, macht den Test zusätzlich konservativ.

"Wir haben gezielt nach einer Zunahme nachweislich falscher Aussagen gesucht, die wir nicht gefunden haben", sagte Dolezal gegenüber 404 Media. "Aber es könnte durchaus sein, dass KI leise das Volumen nicht überprüfbarer Behauptungen erhöht, also solcher, die sich mit bestehenden Faktencheck-Werkzeugen gar nicht verifizieren lassen."

Die Forscher schließen daraus, dass die unmittelbare Bedrohung weniger in offensichtlichen Falschaussagen liege als in einer schleichenden epistemischen Verschiebung. Wenn KI-Text allgegenwärtig und von menschlichem Schreiben kaum mehr unterscheidbar werde, könnten Nutzer die Glaubwürdigkeit aller Online-Informationen pauschal in Frage stellen. Die Studie spricht von "Reality Apathy".

Öffentliche Wahrnehmung weicht von den Daten ab

Parallel befragten die Forscher 853 US-Erwachsene in einer repräsentativen Umfrage. Die Mehrheit glaubte an sämtliche negativen Hypothesen, auch an jene vier, die sich empirisch nicht bestätigen ließen. 83 Prozent stimmten etwa der These zu, dass individuelle Schreibstile zugunsten einer generischen KI-Stimme verschwinden. Auch das fand in den Daten keine Stütze.

Personen, die KI selten nutzen, neigten laut der Studie stärker dazu, an negative Auswirkungen zu glauben als regelmäßige Nutzer (88,3 gegenüber 76,2 Prozent Zustimmung). Bei KI-Skeptikern war die Kluft noch größer (91,3 gegenüber 71,1 Prozent).

Die Forscher warnen, dass der hohe KI-Anteil das theoretische Risiko eines "Model Collapse", bei dem KI-Modelle durch Training auf eigene Outputs degradieren, zu einem praktischen Problem mache. Statt nachträglicher Erkennung empfehlen sie kryptographische Herkunftsnachweise wie den C2PA-Standard und eine Neukalibrierung von Such- und Empfehlungsalgorithmen zugunsten semantischer Vielfalt. Laut Co-Autor Maty Bohacek von der Stanford University arbeitet das Team bereits mit dem Internet Archive daran, die Analyse in ein kontinuierliches Monitoring-Tool umzuwandeln, das den KI-Anteil im Netz fortlaufend misst.

Die Studie hat Einschränkungen, auf die auch die Forscher hinweisen. Analysiert wurden ausschließlich englischsprachige Texte, andere Sprachen und Modalitäten wie Bilder oder Videos blieben außen vor. Die gesamte Analyse hängt von der Zuverlässigkeit des Detektors Pangram v3 ab, dessen Genauigkeit sich mit der Weiterentwicklung von Sprachmodellen verändern könnte. Die Daten stammen ausschließlich aus dem Internet Archive, das nicht das gesamte Netz abbildet.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Der Rest ist für Abonnenten.
Jetzt Abo abschließen.

  • Zugriff auf alle THE DECODER Artikel.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: “KI Radar” – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren