Skip to content

„Ins Meer pinkeln“ hilft nicht – Warum KI-Datengift keine Wirkung zeigt

Image description
Sora prompted by THE DECODER

Kurz & Knapp

  • Die Entwicklerin Xe Iaso hält das gezielte Vergiften von Trainingsdaten mit fehlerhaften Inhalten für uneffektiv und ressourcenintensiv, da es auf große KI-Modelle kaum Einfluss hat.
  • Stattdessen setzt ihr Open-Source-Tool Anubis auf unsichtbare kryptografische Rechenaufgaben, die automatisiertes Crawling durch Bots erheblich verteuern, während echte Nutzer:innen unbeeinträchtigt bleiben.
  • Anubis funktioniert wie ein barrierefreies, unsichtbares CAPTCHA und wird bereits von Organisationen wie GNOME, FFmpeg und der UNESCO genutzt, um KI-Scraper abzuwehren.

Datenvergiftung gegen KI klingt verlockend – bringt aber nichts, sagt Entwicklerin Xe Iaso. Ihr Tool Anubis setzt stattdessen auf unsichtbare Rechenhürden für Bot-Scraper.

„Nach allem, was ich gelernt habe, funktioniert das Vergiften von Datensätzen nicht. Es fühlt sich gut an, aber es verbraucht mehr Rechenleistung, als man letztlich einspart. Ich weiß nicht, wie man das höflich sagt, aber du kannst ins Meer pinkeln, aber es bleibt trotzdem ein Meer“, sagt Xe Iaso, Entwicklerin der Open-Source-Software Anubis, die Webserver vor KI-Scrapern schützt, in einem Gespräch mit 404 Media.

Demnach wäre eine gängige Idee im Kampf gegen KI-Modelle ineffektiv: das Einfügen von absichtlich fehlerhaften oder schädlichen Daten in öffentlich zugängliche Inhalte durch Tools wie Glaze oder Nightshade, um Trainingsprozesse zu sabotieren. Iaso argumentiert, dass solche Maßnahmen auf individueller Ebene keinen spürbaren Effekt auf große KI-Datensätze haben – und dabei unverhältnismäßig viele Ressourcen kosten.

Anubis erhöht Kosten für automatisiertes Crawling

Die eigentliche Herausforderung liege laut Iaso nicht nur in der technischen Umsetzung, sondern im asymmetrischen Kräfteverhältnis: Große KI-Unternehmen können sich die nötige Rechenleistung leisten, um selbst stark vergiftete Inhalte zu verarbeiten oder zu filtern. Einzelne Künstler:innen und Entwickler:innen hingegen müssten enorme Energie aufbringen, um minimale Störungen zu erzeugen. Effektiver sei es daher, den Zugriff auf Inhalte technisch zu regulieren – etwa so, wie es Anubis tut. Das Tool zwingt Bots, kryptografische Rechenaufgaben im Browser zu lösen, was für Millionen Anfragen durch KI-Scraper plötzlich teuer wird – während echte Nutzer:innen davon nichts mitbekommen.

Ziel von Anubis ist es, die Kosten für automatisiertes Crawling selektiv zu erhöhen. Der Mechanismus wirkt wie ein „unsichtbares CAPTCHA“: Wer JavaScript nicht korrekt ausführt oder sich nicht wie ein menschlicher Browser verhält, wird blockiert. Im Gegensatz zu klassischen CAPTCHAs bleibt der Schutz damit barrierefrei – ein Vorteil für Barrierefreiheit und Nutzererlebnis. Technisch basiert Anubis auf Open-Source-Komponenten, ist leichtgewichtig und lässt sich auf nahezu jedem Server selbst hosten. Organisationen wie GNOME, FFmpeg und die UNESCO nutzen das System.

Quelle: 404 Media

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren