„Ins Meer pinkeln“ hilft nicht – Warum KI-Datengift keine Wirkung zeigt

Datenvergiftung gegen KI klingt verlockend – bringt aber nichts, sagt Entwicklerin Xe Iaso. Ihr Tool Anubis setzt stattdessen auf unsichtbare Rechenhürden für Bot-Scraper.

„Nach allem, was ich gelernt habe, funktioniert das Vergiften von Datensätzen nicht. Es fühlt sich gut an, aber es verbraucht mehr Rechenleistung, als man letztlich einspart. Ich weiß nicht, wie man das höflich sagt, aber du kannst ins Meer pinkeln, aber es bleibt trotzdem ein Meer“, sagt Xe Iaso, Entwicklerin der Open-Source-Software Anubis, die Webserver vor KI-Scrapern schützt, in einem Gespräch mit 404 Media.

Demnach wäre eine gängige Idee im Kampf gegen KI-Modelle ineffektiv: das Einfügen von absichtlich fehlerhaften oder schädlichen Daten in öffentlich zugängliche Inhalte durch Tools wie Glaze oder Nightshade, um Trainingsprozesse zu sabotieren. Iaso argumentiert, dass solche Maßnahmen auf individueller Ebene keinen spürbaren Effekt auf große KI-Datensätze haben – und dabei unverhältnismäßig viele Ressourcen kosten.

Anubis erhöht Kosten für automatisiertes Crawling

Die eigentliche Herausforderung liege laut Iaso nicht nur in der technischen Umsetzung, sondern im asymmetrischen Kräfteverhältnis: Große KI-Unternehmen können sich die nötige Rechenleistung leisten, um selbst stark vergiftete Inhalte zu verarbeiten oder zu filtern. Einzelne Künstler:innen und Entwickler:innen hingegen müssten enorme Energie aufbringen, um minimale Störungen zu erzeugen. Effektiver sei es daher, den Zugriff auf Inhalte technisch zu regulieren – etwa so, wie es Anubis tut. Das Tool zwingt Bots, kryptografische Rechenaufgaben im Browser zu lösen, was für Millionen Anfragen durch KI-Scraper plötzlich teuer wird – während echte Nutzer:innen davon nichts mitbekommen.

Ziel von Anubis ist es, die Kosten für automatisiertes Crawling selektiv zu erhöhen. Der Mechanismus wirkt wie ein „unsichtbares CAPTCHA“: Wer JavaScript nicht korrekt ausführt oder sich nicht wie ein menschlicher Browser verhält, wird blockiert. Im Gegensatz zu klassischen CAPTCHAs bleibt der Schutz damit barrierefrei – ein Vorteil für Barrierefreiheit und Nutzererlebnis. Technisch basiert Anubis auf Open-Source-Komponenten, ist leichtgewichtig und lässt sich auf nahezu jedem Server selbst hosten. Organisationen wie GNOME, FFmpeg und die UNESCO nutzen das System.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

„Ins Meer pinkeln“ hilft nicht – Warum KI-Datengift keine Wirkung zeigt

Anubis erhöht Kosten für automatisiertes Crawling

Auch Apple verliert Spitzenkraft für KI-Modelle an Meta

Studie enthüllt "strategische Fingerabdrücke" von KI-Modellen im Spieltheorie-Klassiker

Sakana AI kombiniert mehrere KI-Modelle zur besseren Problemlösung

Katzen-Attacke auf Reasoning-Modell zeigt, wie wichtig "Context Engineering" ist

Neue Studie relativiert Apples Kritik an KI-Reasoning

Cloudflare-Boss Matthew Prince hat schlechte Nachrichten für das WWW

„Ins Meer pinkeln“ hilft nicht – Warum KI-Datengift keine Wirkung zeigt

Anubis erhöht Kosten für automatisiertes Crawling

Auch Apple verliert Spitzenkraft für KI-Modelle an Meta

Studie enthüllt "strategische Fingerabdrücke" von KI-Modellen im Spieltheorie-Klassiker

Sakana AI kombiniert mehrere KI-Modelle zur besseren Problemlösung