MEND: Minimalinvasive Eingriffe in große KI-Netze

Große KI-Netze wie Sprachmodelle machen Fehler oder enthalten veraltete Informationen. MEND zeigt, wie man eine Black Box minimalinvasiv anpasst.

Große KI-Modelle sind in zahlreichen KI-Anwendungen zum Standard geworden, etwa in der Verarbeitung natürlicher Sprache, der Bildanalyse oder der Bildgenerierung. Die Modelle, etwa OpenAIs GPT-3, verfügen oft über vielfältigere Fähigkeiten als kleine, spezialisierte Modelle und können per Nachtraining weiter verbessert werden.

Doch selbst die größten KI-Modelle machen regelmäßig Fehler und enthalten zusätzlich veraltete Informationen. GPT-3 jüngste Daten stammen von 2019 - da war Theresa May noch Premierministerin.

Wie große KI-Modelle dazulernen können

Also GPT-3 komplett neu trainieren? Das ist keine Lösung - weder wirtschaftlich noch grundsätzlich, denn spätestens ein Jahr später ist das Modell erneut veraltet und viele Fehler fallen erst in der Nutzung und nicht in der Kuratierung von Trainingsdaten auf.

Im Idealfall sollten große KI-Modelle daher von Entwickler:innen und/oder Nutzer:innen so korrigierbar sein, dass das Modell bis auf die Änderungen intakt bleibt.

Solche gezielten Korrekturen sind jedoch extrem schwierig, schreiben Forschende der Universität Stanford in einer neuen Arbeit, die sich dieses Problems annimmt. Die dezentralisierte Black-Box-Natur der von großen neuronalen Netzen gelernten Repräsentationen sei das größte Hindernis. Bisher bekannte Lösungen für kleinere neuronale Netze ließen sich nicht auf große Modelle übertragen, so das Team.

Wenn nur eine einzige problematische Eingabe und eine neue gewünschte Ausgabe vorliegen, neigen Feinabstimmungsansätze zu einer Überanpassung; andere Bearbeitungsalgorithmen sind entweder auf Grund der benötigten Rechenleistung undurchführbar oder einfach unwirksam, wenn sie auf sehr große Modelle angewendet werden.

Aus dem Paper

MEND setzt auf kleine Hilfs-Netze

Eine erfolgreiche Änderung müsse drei Bedingungen erfüllen: Zuverlässigkeit, Lokalität und Generalität. Sie müsse die Ausgabe für eine vorher problematische Eingabe ("Wer ist der Premierminister des Vereinigten Königreichs?") zuverlässig ändern, die Ausgabe des Modells für nicht verwandte Eingaben ("Für welche Mannschaft spielt Messi?") dabei möglichst minimal beeinflussen und gleichzeitig korrekte Ausgaben für verwandte Eingaben ("Wer ist die britische Premierministerin?") erzeugen.

Das Team schlägt daher "Model Editor Networks with Gradient Decomposition" (MEND) vor. Statt ein großes Modell direkt per Nachtraining feinabzustimmen, trainiert MEND kleine Modell-Editor-Netzwerke (Multi-Layer Perceptrons), die Änderungen an den Gewichtungen des großen Modells vornehmen. Dafür nutzen sie eine niedrig-dimensionale Repräsentation des Feinabstimmungs-Gradienten der jeweiligen Korrekturen.

Video: Mitchell et al.

Empfehlung

KI-Forschung

DOOM auf dem Toaster war witzig, auf KI ist es bahnbrechend

In ihrer Arbeit zeigen die Forschenden, dass MEND auf einer einzigen GPU an einem Tag für große Modelle mit mehr als zehn Milliarden Parameter trainiert werden kann und anschließend die schnelle Bearbeitung von T5-, GPT-, BERT- oder BART-Modellen erlaubt. Das Team weist zudem nach, dass MEND sehr wahrscheinlich auch auf Modellgrößen von hunderten Milliarden Parametern skaliert.

Mehr Informationen gibt es auf der MEND-Projektseite. Der Code ist auf GitHub verfügbar.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

MEND: Minimalinvasive Eingriffe in große KI-Netze

Wie große KI-Modelle dazulernen können

MEND setzt auf kleine Hilfs-Netze

DOOM auf dem Toaster war witzig, auf KI ist es bahnbrechend

Große KI-Modelle könnten bald viel schneller noch größer werden

Sparsification: Graphcore und Aleph Alpha zeigen schlankes KI-Sprachmodell

Katzen-Attacke auf Reasoning-Modell zeigt, wie wichtig "Context Engineering" ist

Neue Studie relativiert Apples Kritik an KI-Reasoning

Cloudflare-Boss Matthew Prince hat schlechte Nachrichten für das WWW

MEND: Minimalinvasive Eingriffe in große KI-Netze

Wie große KI-Modelle dazulernen können

MEND setzt auf kleine Hilfs-Netze

DOOM auf dem Toaster war witzig, auf KI ist es bahnbrechend

Große KI-Modelle könnten bald viel schneller noch größer werden

Sparsification: Graphcore und Aleph Alpha zeigen schlankes KI-Sprachmodell