Datenvergiftung gegen KI klingt verlockend – bringt aber nichts, sagt Entwicklerin Xe Iaso. Ihr Tool Anubis setzt stattdessen auf unsichtbare Rechenhürden für Bot-Scraper.
„Nach allem, was ich gelernt habe, funktioniert das Vergiften von Datensätzen nicht. Es fühlt sich gut an, aber es verbraucht mehr Rechenleistung, als man letztlich einspart. Ich weiß nicht, wie man das höflich sagt, aber du kannst ins Meer pinkeln, aber es bleibt trotzdem ein Meer“, sagt Xe Iaso, Entwicklerin der Open-Source-Software Anubis, die Webserver vor KI-Scrapern schützt, in einem Gespräch mit 404 Media.
Demnach wäre eine gängige Idee im Kampf gegen KI-Modelle ineffektiv: das Einfügen von absichtlich fehlerhaften oder schädlichen Daten in öffentlich zugängliche Inhalte durch Tools wie Glaze oder Nightshade, um Trainingsprozesse zu sabotieren. Iaso argumentiert, dass solche Maßnahmen auf individueller Ebene keinen spürbaren Effekt auf große KI-Datensätze haben – und dabei unverhältnismäßig viele Ressourcen kosten.
Anubis erhöht Kosten für automatisiertes Crawling
Die eigentliche Herausforderung liege laut Iaso nicht nur in der technischen Umsetzung, sondern im asymmetrischen Kräfteverhältnis: Große KI-Unternehmen können sich die nötige Rechenleistung leisten, um selbst stark vergiftete Inhalte zu verarbeiten oder zu filtern. Einzelne Künstler:innen und Entwickler:innen hingegen müssten enorme Energie aufbringen, um minimale Störungen zu erzeugen. Effektiver sei es daher, den Zugriff auf Inhalte technisch zu regulieren – etwa so, wie es Anubis tut. Das Tool zwingt Bots, kryptografische Rechenaufgaben im Browser zu lösen, was für Millionen Anfragen durch KI-Scraper plötzlich teuer wird – während echte Nutzer:innen davon nichts mitbekommen.
Ziel von Anubis ist es, die Kosten für automatisiertes Crawling selektiv zu erhöhen. Der Mechanismus wirkt wie ein „unsichtbares CAPTCHA“: Wer JavaScript nicht korrekt ausführt oder sich nicht wie ein menschlicher Browser verhält, wird blockiert. Im Gegensatz zu klassischen CAPTCHAs bleibt der Schutz damit barrierefrei – ein Vorteil für Barrierefreiheit und Nutzererlebnis. Technisch basiert Anubis auf Open-Source-Komponenten, ist leichtgewichtig und lässt sich auf nahezu jedem Server selbst hosten. Organisationen wie GNOME, FFmpeg und die UNESCO nutzen das System.