热门问题
时间线
聊天
视角
机器学习控制
机器学习子领域,智能控制与控制论 来自维基百科,自由的百科全书
Remove ads
机器学习控制(Machine learning control、MLC)是机器学习、智能控制及控制理论中的一部份,是由机器学习的方式来求解最优控制问题。主要的应用是一些不适用控制系统方法的复杂非线性系统。
问题和任务的分类
以下是四种常用机器学习控制来处理的问题。
- 控制参数识别;若控制律的结构已知,但其参数未知,机器学习控制会转换为参数识别[1]。其中一个例子是PID控制器的参数利用遗传算法进行最佳化[2],或是离散时间最佳控制的相关应用[3]。
- 第一类回归问题的控制设计:只要每一个状态的感测器讯号以及最佳的致动器命令是已知的,机器学习控制可以针对感测器讯号到致动器命令之间关系,近似一个泛用的非线性映射。例子是从已知的全状态回授计算感测器回授。此应用中常会用到神经网路[4]。
- 第二类回归问题的控制设计:机器学习控制也可以识别将受控体的支出函数最小化的任意非线性控制律。此情形下,不需要知道模型,也不用知道控制律结构或是最佳的致动器命令。此最佳化只以受控体量测到的控制性能为其基础。遗传编程是这种应用的有力回归工具[5]。
- 强化学习控制:可以透过强化学习,依量测到的性能变化(奖赏)持续的更新控制律[6]。
机器学习控制包括神经网络控制、基于遗传算法的控制、遗传编程控制、强化学习控制等,和其他资料驱动的控制(例如人工智能及机械人控制)在方向论上有重叠之处。
Remove ads
应用
机器学习控制已应用在许多非线性控制问题上,探索许多未知且未预期的动作机制。以下是一些应用案例:
- 卫星姿态控制[7]。
- 大楼温度控制[8]。
- 回授紊流控制[2][9]。
- 水下载具遥控[10]。
- 在PJ Fleming和RC Purshouse 2002年发表的回顾论文中有许多机器学习控制应用在工程上的例子[11]。
机器学习控制有些方向类似其他非线性方法:对于在许多不同的应用条件下,无法保证收敛性、最佳解或是强健性。
参考资料
延伸阅读
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads