Forscher geben einer KI Neugierde - und sie schaut für immer TV

TV-Schnee ist für eine neugierige Künstliche Intelligenz einfach unwiderstehlich.

Einige der mächtigsten KI-Systeme unserer Zeit lernen, weil sie dafür von außen belohnt werden. Was dem Hund sein Leckerli oder dem strebsamen Schüler seine Note, ist für eine KI eine höhere Punktzahl oder ein gewonnenes Spiel.

OpenAIs Team-KI "Five" oder Googles Super-KI "Alpha Zero" wurden mit diesem Verfahren ausgebildet. In der Fachsprache heißt es bestärkendes Lernen.

Vom Menschen wissen wir jedoch, dass die intrinsische die extrinsische Motivation deutlich übertreffen und zu besseren Ergebnissen führen kann. Außerdem sinkt der Betreuungsaufwand für den Lernenden, da er sich Inhalte und Zusammenhänge eigenständig erschließt.

Wie verhält sich eine neugierige KI in Videospielen?

KI-Forscher von OpenAI und den Universitäten Berkeley und Edinburgh versuchten daher in einem Experiment, eine intrinsisch motivierte Künstliche Intelligenz zu entwickeln. Sie sollte Videospiele aus Neugierde erforschen.

Technisch übersetzten die Forscher Neugierde, indem sie die KI dafür belohnten, neuen Inhalt zu entdecken. Sie sagte den nächsten Bildausschnitt vorher und überprüfte dann ihre Vorhersage. Bei einer falschen Vorhersage galt der Inhalt als neu - Mission erfüllt.

Das Ergebnis: Die neugierige KI entwickelte Fähigkeiten in klassischen Spielen wie Super Mario Bros. und Pong. Insgesamt erforschte sie mehr als 50 Spiele. Einige davon konnte sie sogar erfolgreich beenden. Bei Super Mario passierte sie elf Level.

Eine Auswahl der Spiele, die die neugierige KI eigenständig erforschen durfte. Bild: Burda / OpenAI

Faszination Fernsehen

Es entstanden allerdings auch ungewöhnliche Resultate: Zwei neugierige KIs spielten sich beim Pong-Duell den Ball lieber permanent volley zu, anstatt den Spielregeln zu folgen. Das eigentliche Ziel bei Pong ist es, den Ball am Gegner vorbeizuschießen.

Manchmal starb die KI absichtlich, um den Game-Over-Screen zu entdecken - auch das war für sie neuer Inhalt.

Empfehlung

KI-Forschung

Studie: OpenAIs o1 übertrifft Sprachmodelle deutlich, bleibt aber fehleranfällig

Und: Die KI-Neugierde lässt sich wie ihr menschliches Gegenstück sehr einfach mit einem TV-Gerät befriedigen.

In einem digitalen Labyrinth versteckten die Forscher einen Fernseher samt Fernbedienung. Sobald die KI den TV fand, blieb sie davor hängen und zappte auf der Suche nach neuen Inhalten durch die Kanäle.

Die Forscher zeigten zwar nur Schneegestöber. Doch für eine pixelanalysierende KI ohne grundlegendes Verständnis für Inhalt ist das offenbar ausreichend abwechslungsreich. Nur in Ausnahmefällen konnte sie sich wieder vom TV-Gerät lösen.

Die Neugierde der KI-Forscher, ob eine neugierige KI möglich ist, hat einen pragmatischen Hintergrund: Eine aus Neugierde effizient lernende KI bräuchte - wie Menschen - weniger Betreuung. Das wiederum würde den Aufwand für die Einrichtung des KI-Systems reduzieren.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Größere Lernprojekte wären möglich: Beispielsweise könnte die neugierige KI eigenständig Fehler in Videospielen oder in Programmiercode finden.

Forscher geben einer KI Neugierde - und sie schaut für immer TV

Wie verhält sich eine neugierige KI in Videospielen?

Faszination Fernsehen

Studie: OpenAIs o1 übertrifft Sprachmodelle deutlich, bleibt aber fehleranfällig

OpenAI, Github & Microsoft: KI-Programmier-Tool Copilot startet

Deepfakes: Wie alles begann - und wohin es führen könnte

Alexa Guide: Routinen, Multiroom, Anrufe & Echo einrichten

Nach OpenAI bestätigt auch Google Deepmind Mathe-Gold für KI – nur per Sprache

ChatGPT Agent: OpenAI stattet ChatGPT mit autonomen Agenten-Fähigkeiten aus

Kimi K2: Das nächste Open-Model-Wunder nach Deepseek kommt wieder aus China

Forscher geben einer KI Neugierde - und sie schaut für immer TV

Wie verhält sich eine neugierige KI in Videospielen?

Faszination Fernsehen

Artikel teilen

Bankverbindung