Die grazilen Gangnam-Style-Bewegungen überfordern die Bildanalysekompetenz Künstlicher Intelligenz zwar noch. Dafür funktionieren andere akrobatische Bewegungen beeindruckend gut.
KI-Forscher der Universität Kalifornien, Berkeley, stellen ein KI-System vor, das Bewegungsabläufe anhand von Videos lernen und auf digitale Charaktere übertragen kann. Das spart die Investition in teure Motion-Capture-Hardware.
Außerdem entspricht es dem menschlichen Lernen: Auch wir schauen uns Vieles einfach bei anderen Menschen ab. Über 20 akrobatische Bewegungen wie Saltos, Handstand oder Radschlag lernte das KI-System anhand von YouTube-Videos.
Zunächst analysiert die KI die Posen im Video und konstruiert daraus eine animierte Referenzbewegung. Ein simulierter Charakter versucht dann, diese Referenzbewegung nachzuahmen.
Für jeden Versuch, der näher dran ist an der Referenzbewegung, wird die KI belohnt. So wird der Bewegungsablauf nach und nach immer glaubhafter, bis die Referenz irgendwann erreicht ist. Training eben.
Die Bewegungen kann die Künstliche Intelligenz unabhängig der Umgebung ausführen, beispielsweise schafft sie das Salto auch auf unebenem Untergrund und steht dennoch stabil oder schlägt Rad über Lücken im Boden hinweg.
Das trainierte System kann sogar anhand eines einzelnen Fotos eines Akrobaten mitten in der Bewegung den weiteren Bewegungsablauf prognostizieren und animieren.
Trotz dieses Erfolgs ist es laut der Forscher noch immer eine große Herausforderung, eine Künstliche Intelligenz Fähigkeiten anhand eines Videos lernen zu lassen.
Es existierten zahlreiche Videoclips, bei denen die Nachahmungstechnik noch nicht funktioniere, insbesondere dann, wenn viele kleine und detaillierte Bewegungen involviert seien - wie zum Beispiel beim Kulttanz Gangnam-Style. Der sieht bei der KI dann so aus:
Mehr Infos gibt es im Video: