热门问题
时间线
聊天
视角
機器學習控制
来自维基百科,自由的百科全书
Remove ads
機器學習控制(Machine learning control、MLC)是机器学习、智能控制及控制理论中的一部份,是由机器学习的方式來求解最优控制問題。主要的應用是一些不適用控制系統方法的複雜非線性系統。
問題和任務的分類
以下是四種常用機器學習控制來處理的問題。
- 控制參數識別;若控制律的結構已知,但其參數未知,機器學習控制會轉換為參數識別[1]。其中一個例子是PID控制器的參數利用遗传算法進行最佳化[2],或是離散時間最佳控制的相關應用[3]。
- 第一類回歸問題的控制設計:只要每一個狀態的感測器訊號以及最佳的致動器命令是已知的,機器學習控制可以針對感測器訊號到致動器命令之間關係,近似一個泛用的非線性映射。例子是從已知的全狀態回授計算感測器回授。此應用中常會用到神經網路[4]。
- 第二類回歸問題的控制設計:機器學習控制也可以識別將受控體的支出函數最小化的任意非線性控制律。此情形下,不需要知道模型,也不用知道控制律結構或是最佳的致動器命令。此最佳化只以受控體量測到的控制性能為其基礎。遗传编程是這種應用的有力回歸工具[5]。
- 强化学习控制:可以透過强化学习,依量測到的性能變化(獎賞)持續的更新控制律[6]。
機器學習控制包括神經網絡控制、基於遺傳算法的控制、遺傳编程控制、强化学习控制等,和其他資料驅動的控制(例如人工智能及機械人控制)在方向論上有重疊之處。
Remove ads
應用
機器學習控制已應用在許多非線性控制問題上,探索許多未知且未預期的動作機制。以下是一些應用案例:
- 衛星姿態控制[7]。
- 大樓溫度控制[8]。
- 回授紊流控制[2][9]。
- 水下載具遙控[10]。
- 在PJ Fleming和RC Purshouse 2002年發表的回顧論文中有許多機器學習控制應用在工程上的例子[11]。
機器學習控制有些方向類似其他非線性方法:對於在許多不同的應用條件下,無法保證收斂性、最佳解或是強健性。
參考資料
延伸閱讀
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads