Bestärkendes Lernen (Reinforcement Learning)
Bestärkendes Lernen ist eine Klasse des maschinellen Lernens, bei der ein Agent durch Versuch und Irrtum lernt, Folgen von Entscheidungen zu treffen, und für seine Aktionen Belohnungen oder Bestrafungen erhält. Es wird auf Regelungs- und Optimierungsprobleme wie Energiemanagement und Prozesseinstellung angewandt.
Statt aus beschrifteten Beispielen zu lernen, interagiert ein Agent des bestärkenden Lernens mit einer Umgebung, führt Aktionen aus, beobachtet den resultierenden Zustand und die Belohnung und lernt nach und nach eine Strategie, die die kumulierte Belohnung maximiert. In der Industrie zeigt es Potenzial für komplexe Regelung und Terminierung, wo gute Aktionen schwer direkt anzugeben sind. Da Versuch und Irrtum in der realen Welt kostspielig oder unsicher sein können, wird das Training meist gegen eine Simulation oder einen digitalen Zwilling durchgeführt, bevor es eingesetzt wird.
Verwandte Begriffe
Advanced Process Control (APC) · Digital Twin · Machine Learning (Industrial)