- OpenAI hat zwischenzeitlich ein kostenloses KI-Text-Erkennungs-Tool veröffentlicht, das für ChatGPT und andere KI-Textgeneratoren funktioniert.
- Auch hier gilt jedoch: Vorsicht! Die Texterkennung ist nicht verlässlich und sollte bestenfalls als ein Indikator in die Bewertung der Gesamtlage einfließen.
Ein neues Tool der Anti-Plagiat-Plattform Crossplag soll KI-Texte verlässlich identifizieren können.
KI-Textwerkzeuge wie ChatGPT sind wie gemacht dafür, generische Texte über zuvor schon ausführlich beschriebene Themen zu generieren. Oder anders formuliert: ChatGPT und Co. sind eine Aufsatzautomatik, die insbesondere den Bildungsapparat vor neue Herausforderungen stellt.
Das Zeitalter des "AIgiraism"
Crossplag ist eine Plattform, die sich auf die Erkennung akademischer Plagiate spezialisiert hat. In KI-Textgeneratoren hat Crossplag einen neuen Endgegner gefunden: Mikro-Plagiate aus womöglich Millionen Texten, zusammengestellt in einem neuen Text auf Augenhöhe mit Originalinhalt. Womöglich ist es Originalinhalt, hier lässt sich vortrefflich streiten.
In Anbetracht der neuen Bedrohung ruft Crossplag das Zeitalter der KI-Plagiate aus und nennt es "Aigiarism". KI-Text könne sich als die Achillesferse akademischer Integrität erweisen, spekuliert das Crossplag-Team. Der Begriff Aigiarism wurde zuvor von Mike Waters bei Twitter erwähnt.
ChatGPT hatte unmittelbare negative Auswirkungen auf die akademische Welt, da es sich als erfolgreich erwies, Studierenden dabei zu helfen, Inhalte zu generieren, ohne irgendwelche Arbeit zu leisten.
Crossplag
Als Gegenmaßnahme stellt Crossplag einen kostenlosen KI-Content-Detektor vor: Er soll erkennen, ob ein Text aus der Maschine oder von einem Menschen stammt - oder ob beide daran gearbeitet haben.
Selbst bei umfassenden Anpassungen an einem KI-Text könne das Tool noch immer die "Pfade der KI-generierten Inhalte finden", schreibt die Plattform. Der Detektor funktioniert in der aktuellen Beta-Version derzeit nur für englische Texte und ist noch nicht für die institutionelle Nutzung freigegeben. Er kann bis zu 1.000 Wörter gleichzeitig analysieren.
Mit KI gegen KI
Für die KI-Content-Detektion verwendet Crossplag ein mit einem GPT-2 Datensatz feingetuntes RoBERTa-Modell, also ebenfalls ein großes Transformer-basiertes Sprachmodell wie GPT-3.5, das hinter ChatGPT steckt.
Das KI-System soll "menschliche Muster und Unregelmäßigkeiten" in Texten identifizieren. Weitere klare Hinweise seien repetitive Sprache und Inkonsistenzen im Ton. Ich habe Daten zur Verlässlichkeit des Systems angefragt und aktualisiere den Artikel, wenn sie zur Verfügung stehen.
Zudem soll das Tool von der Verschränkung mit der Crossplag-Plattform profitieren, da KI "in den meisten Fällen" Text aus vorhandenen Quellen generiere. Wie genau diese Verschränkung technisch funktioniert, beschreibt die Plattform nicht.
Die Frage nach der Transparenz bei KI-generierten Medien dürfte uns trotz des AI Content Detectors noch eine Weile begleiten. Sie stellt sich generell bei generativer KI. Neben Text gibt es eine Plagiats-Diskussion bei Bildern und bald vielleicht bei Videos oder 3D-Modellen.
OpenAI, die Firma hinter ChatGPT, experimentiert mit einem in den Text integrierten Wasserzeichen, das eine eindeutige Identifizierung zulassen soll. Das Kennzeichnungssystem soll im kommenden Jahr in einer wissenschaftlichen Arbeit vorgestellt werden. China verbannt ab Anfang 2023 KI-generierte Medien ohne Kennzeichnung.