Reddit stellte der KI-Suchmaschine Perplexity eine Falle, um das Scrapen von Daten über die Google-Suche nachzuweisen.
Im Rahmen einer Klage gegen mehrere Daten-Scraper-Unternehmen wirft Reddit der KI-Firma Perplexity vor, unrechtmäßig Inhalte zu nutzen. Um den Vorwurf zu untermauern, hat Reddit einen gezielten Test durchgeführt. Laut Klageschrift wurde ein „Test-Beitrag“ erstellt, der „nur von Googles Suchmaschine gecrawlt werden konnte und sonst nirgendwo im Internet zugänglich war“. Innerhalb weniger Stunden sei der Inhalt dieses Beitrags in den Suchergebnissen von Perplexity aufgetaucht, was als Beweis für das Scraping von Google-Suchergebnissen gewertet wird.
Dieser Vorfall ist Teil eines größeren Konflikts, in dem Plattformen wie Reddit versuchen, die unlizenzierte Nutzung ihrer Daten für das Training von KI-Modellen zu unterbinden. „KI-Unternehmen befinden sich in einem Wettrüsten um hochwertige menschliche Inhalte – und dieser Druck hat eine ‚Datenwäsche‘-Wirtschaft im industriellen Maßstab angeheizt“, so Ben Lee, Chief Legal Officer bei Reddit.