KI-Forschung

Deepmind: Kostenloses KI-Training zu Reinforcement Learning

THE DECODER
Deepmind Logo 2021

Deepmind

Deepminds Reinforcement Learning Lecture Series 2021 ist ab sofort frei verfügbar: In 13 Video-Einheiten wird die KI-Trainingsmethode umfassend erklärt.

Reinforcement Learning (Bestärkendes Lernen) ist eine der wichtigsten KI-Trainingsmethoden. Sie wird unter anderem beim autonomen Fahren, für die Automatisierung von Robotern, für Entscheidungen bei Finanztransaktionen an der Börse, beim Go-Spielen mit AlphaGo oder für die Verarbeitung und Ausgabe natürlicher Sprache eingesetzt.

Bei der Methode lernt eine Künstliche Intelligenz anhand vorab festgelegter Regeln, selbstständig eine Reihe von Entscheidungen zu treffen. In häufig spielähnlichen Situationen interagiert der KI-Agent dabei nach dem Trial-and-Error-Prinzip mit seiner Umgebung, bis er durch viele Versuche die vorteilhafteste Strategie zur Lösung einer vorgegebenen Problemstellung findet. Jeder tendenziell bessere Versuch wird durch eine Belohnungsfunktion verstärkt.

KI-Wissen von Deepmind – kostenlos in der Reinforcement Learning Lecture Series

Wer sich für RL-Algorithmen interessiert und bereits fortgeschrittene Programmierkenntnisse vorweisen kann – sei es durch ein entsprechendes Studium oder ausreichend Praxiserfahrung – bekommt durch die neue Lernreihe von Deepmind die Möglichkeit, sich umfassendes Wissen zu Reinforcement Learning anzueignen.

Die Lernreihe wurde als Kollaborationsprojekt zwischen dem University College London (UCL) und Forschenden von Deepmind entwickelt. Die 13 Lerneinheiten werden von den drei Deepmind-Forschenden und Ingenieur:innen Hado van Hasselt, Diana Borsa und Matteo Hessel unterrichtet. Dabei werden zunächst die Grundsätze des Reinforcement Learning und dem Planen aufeinanderfolgender Entscheidungen vorgestellt, ehe fortgeschrittenere Themen und modernste Deep-RL-Algorithmen detaillierter behandelt werden.

An wen richtet sich Deepminds KI-Kurs?

Deepmind zufolge richtet sich das Angebot an Studierende im Masterstudium und darüber hinaus. Das bedeutet, dass bereits weitergehende Theorie- und Programmierkenntnisse vonnöten sind, um der umfassenden Unterrichtsreihe gut folgen und sich ein vertieftes Wissen aneignen zu können.

Unter anderem werden Themen wie Markow-Entscheidungsprozesse, Deep Reinforcement Learning, dynamisches Programmieren sowie stichprobenbasierte Lernalgorithmen (z. B. Q-Learning, SARSA-Algorithmus) behandelt. Die einzelnen Videos dauern zwischen 45 Minuten und zwei Stunden.

Die Reinforcement Learning Lecture Series 2021 ist bei Deepminds YouTube-Kanal oder über die Deepmind-Webseite verfügbar.

Weiterlesen über Deepmind: