Andrew Barto und Richard Sutton werden für die Grundlagen einer Schlüsseltechnologie der modernen KI ausgezeichnet, die auch hinter den jüngsten Erfolgen so genannter Large Reasoning Models steht.
Die Association for Computing Machinery (ACM) hat den renommierten A.M. Turing Award 2024 an Andrew Barto und Richard Sutton verliehen. Die beiden Forscher werden für ihre grundlegenden Beiträge zum Reinforcement Learning geehrt – einer Technologie, die hinter Erfolgen wie AlphaGo und jüngst Large Reasoning Modellen (LRMs).
Der mit einer Million US-Dollar dotierte "Nobelpreis der Informatik" würdigt ihre seit den 1980er Jahren entwickelten Algorithmen und Konzepte, die es Maschinen ermöglichen, durch Belohnungssignale selbstständig zu lernen.
Vom Tiertraining zur KI-Revolution
Reinforcement Learning basiert auf einem einfachen Prinzip: Ein System erhält Feedback zu seinen Handlungen und verbessert sich entsprechend. Barto und Sutton übersetzten diese aus der Psychologie bekannte Idee in ein mathematisches Framework, das heute in zahlreichen KI-Anwendungen zum Einsatz kommt. Ihr 1998 erschienenes Lehrbuch "Reinforcement Learning: An Introduction" wurde über 75.000 Mal zitiert und gilt als Standardwerk des Feldes.
Die Kombination ihrer Methoden mit Deep Learning führte in den letzten Jahren zu spektakulären Erfolgen: vom Sieg des Computerprogramms AlphaGo über Weltmeister Lee Sedol, über das Training von ChatGPT durch menschliches Feedback hin zu LRMs wie OpenAIs o3 oder Deepseeks R1.
Weitere Anwendungen reichen von Robotern, die komplexe Manipulationsaufgaben beherrschen, bis zu Optimierungen in Netzwerktechnik, Chip-Design und Internetwerbung.
Deep-Learning-Pioniere wurden bereits 2019 ausgezeichnet
Jeff Dean, Senior Vice President bei Google, sieht in der Arbeit der beiden Preisträger die direkte Antwort auf Alan Turings Vision: "In einem Vortrag von 1947 erklärte Turing: 'Was wir wollen, ist eine Maschine, die aus Erfahrung lernen kann.' Reinforcement Learning, wie es von Barto und Sutton entwickelt wurde, beantwortet diese Herausforderung direkt."
Die Zusammenarbeit der beiden Wissenschaftler begann 1978 an der University of Massachusetts, wo Barto als Doktorvater und Mentor des jungen Richard Sutton fungierte. Ihre gemeinsame Forschung hat nicht nur zahlreiche Auszeichnungen erhalten, sondern auch Milliarden-Investitionen in KI-Technologien angestoßen. Heute ist Barto emeritierter Professor an der UMass Amherst, während Sutton an der University of Alberta und bei Keen Technologies forscht. Er ist auch für sein kurzes und prägendes Essay The Bitter Lesson bekannt.
Mit dem Turing Award reihen sich Barto und Sutton in eine illustre Liste von Informatik-Pionieren ein, darunter auch die Deep-Learning-Pioniere Yoshua Bengio, Geoffrey Hinton und Yann LeCun. Der nach dem britischen Mathematiker Alan Turing benannte Preis ehrt seit 1966 Forscher, deren Beiträge die Computerwissenschaften nachhaltig geprägt haben.