Förstärkningsinlärning

Förstärkningsinlärning är en klass maskininlärning där en agent lär sig att fatta sekvenser av beslut genom försök och misstag, och tar emot belöningar eller straff för sina handlingar. Den tillämpas på styr- och optimeringsproblem som energihantering och processtrimning.

Snarare än att lära sig från märkta exempel interagerar en förstärkningsinlärningsagent med en miljö, vidtar handlingar, observerar det resulterande tillståndet och belöningen, och lär sig gradvis en policy som maximerar kumulativ belöning. I industrin visar den lovande resultat för komplex styrning och schemaläggning där bra handlingar är svåra att specificera direkt. Eftersom verkliga försök och misstag kan vara kostsamma eller osäkra görs träning vanligtvis mot en simulering eller digital tvilling före driftsättning.

Relaterade termer

Advanced Process Control (APC) · Digital Twin · Machine Learning (Industrial)