Metas KI-Pionier Yann LeCun spricht über die drei großen Herausforderungen auf dem Weg zur nächsten Generation Künstlicher Intelligenz.
Der 1960 geborene KI-Forscher Yann LeCun gilt als einer der weltweit wichtigsten KI-Forscher. Er war unter anderem an der Erfindung von Convolutional Neural Nets beteiligt, die zu einem Durchbruch in der KI-Bildanalyse führten. 2018 erhielt LeCun für seine Forschung den Turing-Award, die höchste Auszeichnung der Computerwissenschaft.
2013 heuerte Mark Zuckerberg den KI-Forscher für Facebook an, wo er das Facebook AI Research Labor (FAIR) mit aufbaute. Dort ist LeCun auch heute noch Chef-KI-Wissenschaftler und Vizepräsident.
Trotz aller Erfolge der KI-Forschung sieht LeCun Künstliche Intelligenz nicht einmal auf dem kognitiven Niveau einer Hauskatze, verriet er etwa 2018 in einem Vortrag. Es fehle ein rudimentäres Verständnis der Welt.
Vier Jahre später ist LeCun beim KI-Forscher und Podcaster Lex Fridman zu Gast und spricht erneut über die Herausforderungen der KI-Forschung. Was hat sich geändert?
Selbstüberwachtes Lernen als Schlüssel zum KI-Weltverständnis
Auch 2022 sieht LeCun Künstliche Intelligenz noch nicht auf Katzenniveau. Trotz magerer 800 Millionen Neuronen sei das Katzenhirn weit vor jedem gigantischen künstlichen neuronalen Netz. Spekulationen über einen Weg zu den hoch entwickelten kognitiven Fähigkeiten und dem langfristigen Planen menschlicher Intelligenz erschienen so auf den ersten Blick sinnlos.
Doch die gemeinsame Grundlage von Katze und Mensch sei ein hoch entwickeltes Weltverständnis, begründet in abstrakten Repräsentationen ihrer Umwelt, die Modelle bilden, um etwa Handlungen und ihre Konsequenzen vorauszusagen, so LeCun. Die Fähigkeit, solche Modelle der Umwelt zu lernen, sei der Schlüssel zu denkenden Maschinen.
LeCun leitet daraus drei große Herausforderungen für die KI-Forschung ab:
- KI muss lernen, die Welt zu repräsentieren.
- KI muss lernen, auf eine Art und Weise zu denken und zu planen, die mit dem gradientenbasierten Lernen vereinbar ist.
- KI muss hierarchische Repräsentationen von Handlungsplänen lernen.
Die Lösung für die erste Herausforderung sieht LeCun im selbstüberwachten Lernen, das etwa beim Training von Sprachmodellen oder Bildanalyse-Systemen zum Einsatz kommt.
Der erfolgreiche Einsatz dieser Systeme zeige, dass KI in der Lage ist, komplexe Modelle der Welt zu bilden. Statt Sprache oder Bilder soll die nächste KI-Generation jedoch direkt aus Videos lernen. Meta sammelt für diese neue KI-Generation gerade mit hohem Aufwand Videodaten aus der Ego-Perspektive, aber auch YouTube-Videos sind laut LeCun passendes Trainingsmaterial.
LeCun glaubt, dass KI-Systeme anhand solcher Videos etwa die physikalischen Grundlagen unserer Welt lernen können. Deren Verständnis wäre wiederum die Grundlage für zahlreiche Fähigkeiten wie Gegenstände greifen oder Autofahren.
KI soll lernen, zu denken und zu handeln
Die Lösung der ersten Herausforderung schafft die Grundlage für die Lösung der zweiten: Systeme, die Schlussfolgern mit der gleichen Methode erlernen, die das Deep Learning so erfolgreich machen, dem gradientbasierten Lernen. Die gelernten, komplexen Modelle der Welt sind für LeCun der Schlüssel, um denkende Maschinen zu schaffen.
Für die dritte Herausforderung habe er bisher keine Lösung, so LeCun. Ein KI-System, das in der echten Welt handeln soll - sei es als Roboter oder als autonomes Fahrzeug - müsse die Folgen seiner Handlungen voraussehen können und die jeweils beste Handlung auswählen. In simplen Fällen, wie dem Bewegen eines Roboterarms oder der Steuerung einer Rakete, sei das jetzt bereits möglich (Model Predictive Control).
Doch in Zukunft brauche es Systeme, die auch in allen anderen Szenarien zurechtkommen: "Es geht nicht nur um die Flugbahn einer Rakete oder die Bewegung eines Roboterarms, die man durch sorgfältige Mathematik modellieren kann. Es geht um alles andere, um alles, was wir in der Welt beobachten: Um das Verhalten von Menschen, um physikalische Systeme, die kollektive Phänomene wie Wasser oder Äste in einem Baum beinhalten, um komplexe Dinge, für die der Mensch problemlos abstrakte Repräsentationen und Modelle entwickeln kann", so LeCun.
Die große Herausforderung des nächsten Jahrzehnts für die KI-Forschung bringt LeCun in einer Frage auf den Punkt: Wie können wir Maschinen dazu bringen, Modelle zu lernen, die mit Ungewissheit umgehen und die reale Welt mit all ihrer Komplexität erfassen?
Für LeCun beginnt die Antwort mit dem selbstüberwachten Lernen.
Korrektur: Darstellung von LeCuns Position zu schlussfolgernden Systemen angepasst. Er argumentiert im Podcast nicht explizit gegen symbolische Systeme.
Titelbild: O'Reilly Internal bei Flickr, lizenziert nach CC BY-NC 2.0