Inhalt
summary Zusammenfassung

Datenvergiftung gegen KI klingt verlockend – bringt aber nichts, sagt Entwicklerin Xe Iaso. Ihr Tool Anubis setzt stattdessen auf unsichtbare Rechenhürden für Bot-Scraper.

Anzeige

„Nach allem, was ich gelernt habe, funktioniert das Vergiften von Datensätzen nicht. Es fühlt sich gut an, aber es verbraucht mehr Rechenleistung, als man letztlich einspart. Ich weiß nicht, wie man das höflich sagt, aber du kannst ins Meer pinkeln, aber es bleibt trotzdem ein Meer“, sagt Xe Iaso, Entwicklerin der Open-Source-Software Anubis, die Webserver vor KI-Scrapern schützt, in einem Gespräch mit 404 Media.

Demnach wäre eine gängige Idee im Kampf gegen KI-Modelle ineffektiv: das Einfügen von absichtlich fehlerhaften oder schädlichen Daten in öffentlich zugängliche Inhalte durch Tools wie Glaze oder Nightshade, um Trainingsprozesse zu sabotieren. Iaso argumentiert, dass solche Maßnahmen auf individueller Ebene keinen spürbaren Effekt auf große KI-Datensätze haben – und dabei unverhältnismäßig viele Ressourcen kosten.

Anubis erhöht Kosten für automatisiertes Crawling

Die eigentliche Herausforderung liege laut Iaso nicht nur in der technischen Umsetzung, sondern im asymmetrischen Kräfteverhältnis: Große KI-Unternehmen können sich die nötige Rechenleistung leisten, um selbst stark vergiftete Inhalte zu verarbeiten oder zu filtern. Einzelne Künstler:innen und Entwickler:innen hingegen müssten enorme Energie aufbringen, um minimale Störungen zu erzeugen. Effektiver sei es daher, den Zugriff auf Inhalte technisch zu regulieren – etwa so, wie es Anubis tut. Das Tool zwingt Bots, kryptografische Rechenaufgaben im Browser zu lösen, was für Millionen Anfragen durch KI-Scraper plötzlich teuer wird – während echte Nutzer:innen davon nichts mitbekommen.

Anzeige
Anzeige

Ziel von Anubis ist es, die Kosten für automatisiertes Crawling selektiv zu erhöhen. Der Mechanismus wirkt wie ein „unsichtbares CAPTCHA“: Wer JavaScript nicht korrekt ausführt oder sich nicht wie ein menschlicher Browser verhält, wird blockiert. Im Gegensatz zu klassischen CAPTCHAs bleibt der Schutz damit barrierefrei – ein Vorteil für Barrierefreiheit und Nutzererlebnis. Technisch basiert Anubis auf Open-Source-Komponenten, ist leichtgewichtig und lässt sich auf nahezu jedem Server selbst hosten. Organisationen wie GNOME, FFmpeg und die UNESCO nutzen das System.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Die Entwicklerin Xe Iaso hält das gezielte Vergiften von Trainingsdaten mit fehlerhaften Inhalten für uneffektiv und ressourcenintensiv, da es auf große KI-Modelle kaum Einfluss hat.
  • Stattdessen setzt ihr Open-Source-Tool Anubis auf unsichtbare kryptografische Rechenaufgaben, die automatisiertes Crawling durch Bots erheblich verteuern, während echte Nutzer:innen unbeeinträchtigt bleiben.
  • Anubis funktioniert wie ein barrierefreies, unsichtbares CAPTCHA und wird bereits von Organisationen wie GNOME, FFmpeg und der UNESCO genutzt, um KI-Scraper abzuwehren.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!