Das KI-Start-up Perplexity AI steht mit seiner "Antwortmaschine" wegen möglicher Urheberrechtsverletzungen und unseriöser Datenbeschaffungspraktiken in der Kritik.
Amazon Web Services (AWS) hat eine Untersuchung eingeleitet, ob das Unternehmen gegen die Nutzungsbedingungen verstößt, berichtet das US-Technikmagazin WIRED.
Im Zentrum steht der Vorwurf, dass Perplexity Webseiten durchsucht und deren Inhalte verwendet, obwohl diese eine solche Nutzung ausdrücklich untersagen.
Laut WIRED ignoriert Perplexity offenbar das Robots Exclusion Protocol, einen Webstandard, mit dem Seiten den Zugriff durch automatisierte Bots verhindern können. Diese so genannte robots.txt ist zwar nicht rechtsverbindlich, aber etwa Cloud-Anbieter wie Amazon haben ihre Einhaltung in ihren Nutzungsbedingungen festgeschrieben.
So soll der Perpexity-Bot regelmäßig Inhalte von WIRED gescraped haben, obwohl der WIRED-Verlag Condé Naste den Bot explizit blockiert hat. Teilweise sollen WIRED-Inhalte wortwörtlich von Perplexity ausgespielt worden sein.
Manchmal verwendet der Bot spezielle URLs, um auf Inhalte hinter der Bezahlschranke zuzugreifen. Eine Sprecherin von Perplexity räumt ein, dass dies vorkomme, aber nur "sehr selten" und nur dann, wenn der Nutzer die URL explizit im Prompt eingegeben habe. Der Perplexity-Bot bei AWS verstoße nicht gegen die Nutzungsbedingungen.
Auch OpenAIs ChatGPT stand bereits in der Kritik, Paywalls zu umgehen, was OpenAI veranlasste, den Service vorübergehend offline zu nehmen, um das Problem zu beheben. Derzeit schließt OpenAI zahlreiche Deals mit Medienunternehmen ab, um deren aktuelle Inhalte auf ChatGPT zeigen zu dürfen. Perplexity dürfte dafür - trotz großzügiger Finanzierung und exorbitanter Bewertung - das Geld fehlen.
Perplexity-CEO Aravind Srinivas verteidigte sein Start-up damit, dass die kritisierten Crawler von einer Drittfirma stammten, die Crawling- und Indexierungsdienste für Perplexity erbringe. Es sei "kompliziert", diese Dienste zu stoppen. Den Namen des Unternehmens wollte Srinivas unter Berufung auf eine Geheimhaltungsvereinbarung nicht nennen.
Perplexity hat kürzlich mit "Pages" ein Produkt vorgestellt, das automatisiert Inhalte aus verschiedenen Quellen sammelt, auf einer Landingpage zusammenführt und dann bei Google indexiert, wo sie dann mit den Originalinhalten konkurrieren.
Nach der Veröffentlichung von Pages nahm die Kritik an Perplexity deutlich zu, nachdem unter anderem Forbes aufgedeckt hatte, dass es sich bei Perplexity derzeit eher um eine intransparente Kopier- als um eine Antwortmaschine handelt.
Zuvor hatte der CEO von Perplexity, Aravind Srinivas, gegenüber Forbes erklärt, dass sein Tool nichts anderes tue als andere Nachrichtenseiten, die journalistische Primärquellen zitieren. Das lässt darauf schließen, dass Srinivas weder den Journalismus noch sein Tool versteht. Perplexity soll angeblich Publishern zukünftig eine Umsatzbeteiligung anbieten wollen.