热门问题
时间线
聊天
视角

最佳投影方程

来自维基百科,自由的百科全书

Remove ads

最佳投影方程(optimal projection equations)[1][2][3]控制理论中,建构局部最佳降阶LQG控制器的充分必要条件[4]

LQG控制(线性二次高斯控制)问题是最优控制领域中最基础的问题之一,这问题包括了存在不确定性的线性系统,受到加性高斯白噪声的影响,没有完整的状态资讯(无法量测到所有的状态变数,也无法透过回授得知),对应二次的成本泛函。不过存在唯一解,而且可以建构线性动态回授的控制律,易于计算以及实现。而LQG控制器也是非线性系统中最佳扰动控制的基础[5]

LQG控制器的架构会类似要控制的系统,两者会有相同的维度。因此若系统本身就是高维度,要实现(全阶)LQG控制器会很困难。降阶LQG问题(固定阶LQG问题)事先固定LQG控制器的阶数,因此克服了这个困难。不过在全阶LQG控制器中适用的分离原理,在降阶LQG问题中已无法适用,因此这方面会更困难,而且其解也不唯一。不过可以找到数值分析的演算法[4][6][7][8]来求解对应的最佳投影方程。

Remove ads

问题的数学表示以及其解

连续时间

降阶的LQG控制问题几乎和全阶的LQG控制问题相同。令表示降阶LQG控制器的状态,唯一的差异是LQG控制器的状态维度是事先定义好的值,比受控系统的状态维度要少。

降阶LQG控制器可以表示为下式:

上述公式刻意写的类似传统全阶LQG控制器的形式,降阶的LQG控制问题也可以改写为下式:

其中

降阶LQG控制器的矩阵是由所谓的最佳投影方程(optimal projection equations、OPE)来决定[3]

维的最佳投影方阵OPE的核心。此矩阵的秩在所有状态下几乎都等于。相关投影为斜投影(oblique projection):。最佳投影方程包括四个矩阵微分方程。前二个是LQG控制器对应的矩阵Riccati微分方程的扩展。在方程式中表示,而维的单位矩阵

若LQG的维度没有减少,也就是,则,上述二个方程就是二个没有耦合的矩阵Riccati微分方程,对应全阶的LQG控制器。若,则两个方程会有斜投影项。这也是为何降阶的LQG控制器无法分离的原因,斜投影是由另外二个矩阵微分方程所决定,其中也和秩的条件(rank conditions)有关。这四个矩阵微分方程组成了最佳投影方程。为了要列出另外二个矩阵微分方程,先定义以下二个矩阵:

则最后二个矩阵微分方程如下:

almost everywhere,
almost everywhere,

其中

此处的 * 表示群广义逆矩阵(group generalized inverse)或Drazin逆矩阵英语Drazin inverse,是唯一的,定义如下

其中 + 是摩尔-彭若斯广义逆.

矩阵都需要是非负对称矩阵。可以建构最佳投影方程的解,而此解可以决定降阶LQG控制器矩阵

上式中的矩阵是符合以下性质的矩阵:

几乎在所有状态下。

可以由的投影分解中得到[4]

若降阶LQG问题中的所有矩阵都是非时变的,且最终时间(horizon)趋近无限大,则最佳降阶LQG控制器和最佳投影方程也都会是非时变的[1]。此情形下,最佳投影方程左侧的微分项会为零。

Remove ads

离散时间

离散时间的情形类似连续时间的例子,要处理的是将阶传统离散时间全阶LQG问题转换为事先已知固定阶数的阶降阶LQG控制器。为了要表示离散时间的OPE,先引入以下二个矩阵:

则离散时间OPE为

.
.
almost everywhere,
almost everywhere.

斜投影(oblique projection)矩阵为

非负对称矩阵是离散时间OPE的解,也决定了降阶LQG控制器的矩阵 and

在上述的方程中,矩阵是有以下性质的矩阵:

几乎在所有状态下。

这些矩阵可以从的投影因式分解中求得[4]

如同在连续时间中的例子一样,若问题中所有的矩阵都是非时变,且且最终时间(horizon)趋近无限大,降阶LQG控制器就会是非时变的。因此离散时间OPE会收敛到稳态解,决定非时变的降阶LOG控制器[2]

离散时间OPE也可以应用在状态维度,输入维度或是输出维度可变的离散时间系统(具有时变维度的离散时间系统)[6]。若在数位控制器中的取样是不同步的,就可能会出现这类的系统。

Remove ads

参考资料

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads