Alphastar: Deepmind feiert "großen Durchbruch" bei Künstlicher Intelligenz

25. Januar 2019

Deepminds neueste Spiele-KI schafft etwas, das noch keiner vor ihr gelang: Sie besiegt Profispieler im komplexen PC-Strategiespiel "Starcraft II". Das ist ein größerer Erfolg als AlphaGos Triumph über Go-Champion Lee Sedol vor rund drei Jahren - auch wenn die Live-Premiere misslang.

Merkbar stolz kündigt Deepmind im eigenen Blog das neueste neuronale Wundernetz aus der eigenen KI-Schmiede an: Es hört auf den Namen "Alphastar" und kann besonders gut das komplexe PC-Strategiespiel "Starcraft II" steuern. Sogar besser als menschliche Profis.

Laut Deepmind ist Starcraft ein Lackmustest für KI-Cleverness, da es Künstliche Intelligenz vor besondere Herausforderungen stellt:

Es gibt keine eindeutige Siegesstrategie: Das Vorgehen muss permanent justiert und das Wissen über den Spielverlauf erweitert werden.
Teile des Spielfeldes sind in künstlichen Nebel verhüllt und müssen zunächst erforscht werden.
Entscheidungen können sich erst viel später im Spiel auswirken - das erfordert Planung.
Im Unterschied zum Brettspiel Go laufen viele Prozesse parallel und in Echtzeit: Spieler handeln permanent, Hunderte Einheiten und Gebäude müssen gleichzeitig kontrolliert werden. Millionen Entscheidungen sind möglich.

Die Grafik zeigt, wie anspruchsvoll Starcraft ist im Vergleich zu Go - und erklärt, weshalb Deepmind die Siege gegen Profis so hoch hängt. Bild: Deepmind — Die Grafik zeigt, wie anspruchsvoll Starcraft ist im Vergleich zu Go - und erklärt, weshalb Deepmind Alphastars Siege gegen Menschen so hoch hängt. Bild: Deepmind

Trainiert wurde Alphastar im ersten Schritt mit aufgezeichneten Partien menschlicher Profispieler. So lernte sie zunächst, die Handlungen der Profis zu imitieren.

Im zweiten Schritt traten dann Variationen der vortrainierten Künstlichen Intelligenz in einem Liga-System gegeneinander an.

Hier setzte Deepmind auf bestärkendes Lernen nach dem Versuch-und-Irrtum-Prinzip: Zielführende Handlungen werden belohnt, alle anderen bestraft. Mit der Methode werden beispielsweise auch selbstfahrende Autos verkehrssicher gemacht. Rund 200 Jahre Lerneinheiten führte sich jede einzelne KI in der Liga über 14 Tage hinweg zu Gemüte.

In einer Liga trainierten sich Alphastar-Varianten gegenseitig. Die effizienteste KI blieb übrig und besiegte anschließend menschliche Profis. Bild: Deepmind — In einer Liga trainierten sich die Alphastar-Varianten gegenseitig. Die effizienteste KI blieb übrig - und besiegte anschließend menschliche Profis. Bild: Deepmind

Die Liga-Gewinnerin durfte sich dann im vergangenen Dezember mit den Profispielern Grzegorz "MaNa" Komincz und Dario "TLO" Wünsch messen. Champions League, sozusagen.

Das Ergebnis: Alphastar macht seinem Namen alle Ehre und fegte die menschlichen Profis mit zehn zu null vom digitalen Spielfeld.

"Alphastar nimmt bekannte Strategien und stellt sie auf den Kopf", kommentiert der Starcraft-Profi Wünsch sein KI-Scharmützel. "Der Agent demonstrierte Strategien, an die ich noch nie gedacht hatte, was bedeutet, dass es immer noch neue Spielweisen geben kann, die wir noch nicht vollständig erforscht haben."

KI klickt weniger als Menschen

Die Besonderheit im Vergleich zu ähnlichen Tests: Starcraft II wurde für die KI nicht künstlich eingeschränkt, beispielsweise auf eine bestimmte Auswahl an Gebäuden oder Einheiten. Alphastar spielte also fast unter menschlichen Wettbewerbsbedingungen - und war dennoch erfolgreich.

Fast deshalb, da die KI direkt mit dem Spieleinterface verbunden war und den Spielverlauf so nicht umständlich über eine Karte visuell ablesen musste.

Komincz und Wünsch hingegen mussten wie üblich die Kamera manuell über das Spielfeld führen, um den Spielverlauf überall im Blick zu haben. Alphastar sah allerdings nicht mehr - nur alles gleichzeitig.

Alphastar hatte immer die komplette Karte im Blick. Menschliche Spieler hingegen müssen mit der Maus permanent den Spielfeldausschnitt (weißer Kasten) justieren. — Alphastar hatte immer die komplette Karte im Blick. Die menschlichen Gegner hingegen mussten mit der Maus permanent den Spielfeldausschnitt (weißer Kasten) justieren.

Eben diesen Vorteil entfernten die Deepmind-Wissenschaftler im aktuellsten Test, der live übertragen wurde - und prompt war Alphastar dem Profi Komincz unterlegen. Allerdings, rechtfertigt sich Deepmind, sei die Variante ohne Kartensehbonus erst sieben Tage im Training gewesen. Der nächste Test kommt bestimmt.

Interessant: Alphastar führte signifikant weniger Aktionen pro Minute durch als ihre Gegner. Mit 350 Millisekunden war außerdem die Reaktionsgeschwindigkeit überdurchschnittlich lang.

Die Anzahl Klicks pro Minute und die Reaktionsgeschwindigkeit wurden von den Deepmind-Forschern zwar künstlich auf menschliche Augenhöhe beschränk. Dennoch hätte Alphastar am oberen Limit menschlicher Fähigkeiten agieren können. Wollte sie aber offenbar nicht.

Dass Alphastar mit weniger Aktionen dennoch gewann, ist laut Deepmind ein Zeichen, dass die Künstliche Intelligenz aufgrund der besseren Strategie und Planung siegreich war.

Alphastar agierte effizienter als die menschlichen Profis. Bild: Deepmind

Was bringt's?

Als "großen Durchbruch" feiert Deepmind Alphastars Siege in einem "der komplexesten Videospiele aller Zeiten".

Starcraft sei zwar nur ein Computerspiel, räumt die Google-Schwester ein, die Technologie hinter Alphastar könne aber womöglich auch andere Probleme lösen. Die ausgeprägte Planungsfähigkeit der KI könne zum Beispiel der langfristigen Wettervorhersage und somit der Klimaforschung dienen oder um Sprache zu verstehen.

Das ligabasierte Training sei außerdem eine Möglichkeit, fehleranfällige KIs von verlässlichen Systemen zu trennen. In der Zukunft könne sich das als Sicherheitsfaktor erweisen.

Deepminds Fazit: Alphastar sei "ein großer Schritt nach vorne auf dem Weg zu intelligenten Systemen, die einzigartige Lösungen finden für die wichtigsten und fundamentalsten wissenschaftlichen Probleme der Welt".

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

Alphastar: Deepmind feiert "großen Durchbruch" bei Künstlicher Intelligenz

KI klickt weniger als Menschen

Was bringt's?

KI-News ohne Hype – von Menschen kuratiert

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.