KI-Forschung

Deepmind: Kartenspiel Hanabi soll KI Einfühlungsvermögen lehren

Matthias Bastian
Deepminds KI-Forschung kostet viel Geld. Ob und wann sie viel verdient, ist offen. Ein KI-Forscher fürchtet, dass die Investitionen in die falsche Technologie fließen.

Dass eine Künstliche Intelligenz mehr und präzisere Spielzüge bei Go oder Starcraft berechnen kann als ein Mensch, ist bemerkenswert, aber im Grunde nicht allzu überraschend. Das Kartenspiel Hanabi stellt im Vergleich ganz andere Anforderungen an die Spieler - es verlangt nach geschickter Kommunikation und Einfühlungsvermögen. Deepmind-Forscher wollen sich das zunutze machen.

In Hanabi sehen Spieler die Karten der Mitspieler, nicht jedoch ihre eigenen. Erst im Austausch mit den Mitspielern finden sie heraus, welche Karten sie auf der Hand halten und entwickeln so ihre Spielstrategie. Ziel des Spiels ist es, dass alle Spieler gemeinsam möglichst viele Karten ablegen.

Hanabi erfordert daher Argumentationstalent, strategische Zusammenarbeit sowie die Fähigkeit, sich in andere Spieler hineinzuversetzen und ihre Gedanken und Ziele zu erspüren ("Theory of Mind").

Da die expliziten Informationen ("Diese Karte ist blau"), die die Spieler pro Runde austauschen dürfen, limitiert sind, müsste eine Hanabi-KI auch implizite Informationen aus den Reaktionen der Mitspieler und aus dem Spielverlauf ableiten.

Umgekehrt muss sie den menschlichen Mitspielern Tipps zur Verfügung stellen und ihnen helfen, erfolgreich zu sein.

Hanabi: Die nächste, große KI-Herausforderung

Deepmind-Forscher sehen diese kollaborative Strategieentwicklung zwischen Mensch und Maschine als nächste Forschungsherausforderung für Künstliche Intelligenz. Sie gehen davon aus, dass der Weg zu einer kollaborativen KI über Hanabi führt.

"Wir glauben, dass die Entwicklung neuartiger Techniken, die KI-Agenten Einfühlungsvermögen verleihen, nicht nur für ihren Erfolg in Hanabi, sondern auch für die weitere Zusammenarbeit entscheidend sein werden", heißt es in der wissenschaftlichen Publikation.

In einem Test setzten die Forscher aktuelle bestärkende Lernverfahren auf Hanabi an, das ist die Trainingsmethode, mit der AlphaGo oder Alphastar erfolgreich Schach, Go und Starcraft 2 lernten. Bei Hanabi schnitt die Methode jedoch miserabel ab: Die KI besiegte nicht einmal handgeschriebene Spiele-Bots und war unfähig zur Zusammenarbeit.

Deepmind veröffentlicht daher eine Trainings- und Entwicklungsumgebung für Hanabi, die die wissenschaftliche Forschung zu einfühlsamen KIs voranbringen soll. KI-Agenten sollen zunächst lernen, untereinander zu kooperieren und letztlich mit dem Menschen. Dafür brauche es jedoch neuartige Ansätze bei der KI-Entwicklung, schreiben die Forscher.

Via: MIT, Venturebeat

Weiterlesen über Künstliche Intelligenz: