Apprentissage par renforcement
L'apprentissage par renforcement est une classe d'apprentissage automatique où un agent apprend à prendre des séquences de décisions par essais et erreurs, recevant récompenses ou pénalités pour ses actions. Il s'applique aux problèmes de commande et d'optimisation comme la gestion de l'énergie et le réglage de procédés.
Plutôt que d'apprendre à partir d'exemples étiquetés, un agent d'apprentissage par renforcement interagit avec un environnement, agit, observe l'état et la récompense résultants, et apprend peu à peu une politique qui maximise la récompense cumulée. En industrie, il est prometteur pour la commande et l'ordonnancement complexes où les bonnes actions sont difficiles à spécifier directement. Comme les essais et erreurs réels peuvent être coûteux ou dangereux, l'entraînement se fait généralement sur une simulation ou un jumeau numérique avant déploiement.
Termes liés
Advanced Process Control (APC) · Digital Twin · Machine Learning (Industrial)