DeepcubeA ist nicht der schnellste Zauberwürfel-Algorithmus, aber der beeindruckendste.
Rund 1,2 Sekunden und 28 Drehungen benötigt die KI-Software DeepcubeA, um bei einem Zauberwürfel alle Farben richtig zu sortieren. Das ist zwar schneller als der aktuelle menschliche Rekordhalter Yusheng Du aus China, der bei den Wuhu Open 2018 den Würfel in gemächlichen 3,47 Sekunden zurechtrückte. Aber deutlich langsamer als ein für einen Roboter spezialisierter Algorithmus, der für den Lösungsweg nur 0,38 Sekunden benötigt.
Weshalb ist DeepcubeA dennoch eine Meldung wert? Nun, anders als die eben erwähnte Maschine brauchte die KI keine menschliche Lösungsvorlage. Sie brachte sich die optimale Würfeldrehung nach dem Reverse-Engineering-Prinzip - per Rekonstruktion also - selbst bei: DeepcubeA startete mit einem fertigen Würfel und verdrehte ihn zufällig. In zwei Tagen simulierte die KI auf diese Art rund zehn Milliarden unterschiedliche Züge.
Die Entwickler setzten beim Training auf bestärkendes Lernen: Umso zielführender ein Zug, desto positiver wurde er bewertet. So lernte die KI nicht nur, den Würfel zu lösen. Sie lernte, ihn besonders effizient zu lösen, das heißt mit möglichst wenig Zügen.
KI-Strategie: Für Menschen nicht mehr nachvollziehbar
Nach der ersten Trainingsphase löste Deepcube 1.000 verdrehte Würfel erfolgreich in den eingangs erwähnten durchschnittlich rund 1,2 Sekunden bei 28 Zügen. Trainierte Menschen benötigen etwa 50 Züge.
In 60 Prozent der Fälle wählte Deepcube den effizientesten Lösungsweg, also den, mit den wenigsten Drehungen. Das ist laut der Entwickler von der Universität Kalifornien, Irvine, nahe dran an der optimalen Strategie, dem sogenannten Gott-Algorithmus, der immer gewinnt.
Welchem strategischen Prinzip die KI dabei folgt, ist unklar: Zwar war es bislang nicht Ziel der Forscher, die DeepcubeA-Strategie für Menschen verstehbar zu machen. Aber es sei schon ersichtlich, dass sie für Menschen nicht ohne weiteres nachvollziehbar sei, so Mitautor Forest Agostinelli zu Gizmodo. Die Entscheidungsfindung der KI sei "vollkommen anders" als bei Menschen, das beweise die deutlich geringere Anzahl an benötigten Zügen, bestätigt sein Kollege Steve Zylius.
Die Forscher sehen in ihrem Algorithmus und dem Reverse-Engineering-Lernen großes Potenzial: Eine KI, die ein komplexes mathematisches Problem wie den Zauberwürfel lösen könne, käme wieder ein Stück näher an eine Maschine, die "denken, begründen, planen und Entscheidungen treffen kann."
Die Forscher untermauern diese These mit einem Test: DeepcubeA konnte neben dem Zauberwürfel sieben weiteren Puzzle-Spiele lösen. Mögliche Anwendungsbereiche außerhalb von traditionellen Puzzles seien die Medikamentenentwicklung oder die Roboter-Navigation in komplexen Umgebungen.