Reinforcement learning

Reinforcement learning is een gebied van machine learning dat zich bezighoudt met hoe intelligente agenten acties moeten ondernemen in een omgeving om hun cumulatieve beloning te maximaliseren. Het is een vorm van kunstmatige intelligentie die leert door simulatie en op deze manier de ideale uitkomst onderzoekt in plaats van gebruik te maken van historische gegevens. Reinforcement learning is een van de drie fundamentele machine learning-paradigma's, naast supervised learning (leren onder toezicht) en unsupervised learning (leren zonder toezicht). De omgeving wordt meestal uitgedrukt in de vorm van een Markov-beslissingsproces (MDP).

Reinforcement learning

Toepassing

Verschil met supervised learning

Wikiwand - on