深度强化学习

深度强化学习（英语：Deep reinforcement learning，简称 Deep RL 或 DRL）是机器学习的一个子领域，结合了强化学习和深度学习。强化学习探讨如何在尝试错误的过程中让智能代理人学习做更好的决策。深度强化学习采用了深度学习的方法，让智能代理人可以直接基于非结构化资料来做决策，而不需要人为设计的状态空间。深度强化学习算法可以读取非常大的输入资料（像是电玩画面上的每个像素），来判断哪个动作可以达到最好的目标（像是最高的游戏分数）。深度强化学习已经有了广泛的应用，包括机器人学、电动游戏、自然语言处理、电脑视觉、教育、交通运输、金融、医疗卫生等等。^[1]

[1]