Halluzinationen in großen Sprachmodellen: Bug oder Feature?

DALL-E 3 prompted by THE DECODER

Sind Halluzinationen, also von großen Sprachmodellen generierte Falschaussagen, ein Bug oder ein Feature?

Andrej Karpathy, KI-Entwickler bei OpenAI und ehemaliger Leiter der KI-Abteilung bei Tesla, sieht Halluzinationen nicht als Fehler großer Sprachmodelle. Im Gegenteil: Sie seien ihre größte Stärke.

Karpathy bezeichnet LLMs als "Traummaschinen", die auf Basis ihrer Trainingsdaten Inhalte generieren. Die Anweisungen, die den LLMs gegeben werden, lösen einen "Traum" aus, der durch das Verständnis des Modells seiner Trainingsdaten gesteuert wird.

In den meisten Fällen sei der generierte Inhalt nützlich und relevant. Wenn der Traum jedoch einen falschen oder irreführenden Weg einschlägt, würde man dies als "Halluzination" bezeichnen. "Es sieht aus wie ein Fehler, obwohl das LLM nur das tut, was es immer tut", schreibt Karpathy.

Karpathy sieht LLMs auf einem Spektrum zwischen Suchmaschinen und Kreativitätsgeneratoren. Während Suchmaschinen ein "Kreativitätsproblem" hätten und nur vorhandene Inhalte zurückgeben könnten, seien LLMs in der Lage, aus ihren Trainingsdaten neue Inhalte zu generieren. Diese Kreativität gehe jedoch mit dem Risiko einher, Halluzinationen zu erzeugen.

Ob Halluzinationen ein Problem sind, hängt von der Anwendung ab

Karpathy räumt jedoch ein, dass Halluzinationen zwar ein Merkmal großer Sprachmodelle seien, aber bei der Anwendung von LLMs, beispielsweise für persönliche Assistenten, problematisch sein könnten. Nach eigenen Angaben arbeitet Karpathy bei OpenAI an einer Art "JARVIS" (Personal AI Assistant).

LLM-Assistenten seien komplexer als das zugrunde liegende LLM und erforderten zusätzliche Methoden, um Halluzinationen zu reduzieren. Ein Ansatz, den Karpathy erwähnt, ist die Retrieval Augmented Generation (RAG), die den generierten Inhalt stärker in realen Daten verankert.

Andere Methoden umfassen die Ausnutzung von Inkonsistenzen zwischen mehreren Beispielen, Reflexion, Verifikationsketten, die Dekodierung von Unsicherheiten aus Aktivierungen und die Verwendung von Werkzeugen.

Diese Forschungsbereiche werden aktiv untersucht, um die Genauigkeit und Zuverlässigkeit von LLM-Assistenten zu verbessern.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Empfehlung

KI-Forschung

Halluzinationen in großen Sprachmodellen: Bug oder Feature?

Ob Halluzinationen ein Problem sind, hängt von der Anwendung ab

Nvidia-Forscher Jim Fan erwartet "GPT-3-Moment" für Robotik in den nächsten Jahren

Microsofts MAI-DxO sorgt für präzisere KI-Diagnosen und spart fast 70 Prozent der Kosten

Forschende haben womöglich eine Leiter für die "Datenmauer" gefunden

OmniGen 2 vereint Bild und Text wie GPT-4o, ist aber Open Source

Cloudflare-Boss Matthew Prince hat schlechte Nachrichten für das WWW

Othello-Experiment stützt erneut Weltmodell-Hypothese für große Sprachmodelle

MIT-Studie zeigt "kognitive Schulden" durch ChatGPT - was das für die Praxis bedeutet

Halluzinationen in großen Sprachmodellen: Bug oder Feature?

Ob Halluzinationen ein Problem sind, hängt von der Anwendung ab

Artikel teilen

Bankverbindung