可控制性格拉姆矩陣

控制理論中，可控制性格拉姆矩陣（Controllability Gramian）是用來判斷線性動態系統是否可控制的格拉姆矩陣。

若針對以下的線性時變系統

${\dot {x}}(t)=A(t)x(t)+B(t)u(t)$

$y(t)=C(t)x(t)+D(t)u(t)\,$

可控制性格拉姆矩陣為

$W_{c}(t_{0},t_{1})=\int _{t_{0}}^{t_{1}}\Phi (\tau ,t_{0})B(\tau )B^{T}(\tau )\Phi ^{T}(\tau ,t_{0})d\tau$ ,

其中 $\Phi$ 為狀態轉換矩陣

系統在 $t\in [t_{0},t_{1}]$ 具有可控制性，若且唯若 $W_{c}(t_{0},t_{1})$ 為非奇異矩陣。

Remove ads

連續時間，線性非時變系統

若在連續時間的線性非時變系統中，也可以定義可控制性格拉姆矩陣（不過也有其他判斷可觀測性的方法）。

若考慮以下的系統

${\dot {x}}(t)=Ax(t)+Bu(t)$

$y(t)=Cx(t)+Du(t)\,$

其可控制性格拉姆矩陣是以下 $n\times n$ 的方陣

${\boldsymbol {W_{c}}}(t)=\int _{0}^{t}e^{{\boldsymbol {A}}\tau }{\boldsymbol {B}}{\boldsymbol {B^{T}}}e^{{\boldsymbol {A}}^{T}\tau }d\tau$

${\boldsymbol {A}}$ 若穩定（所有的特徵值實部均為負），可控制性格拉姆矩陣也是以下李亞普諾夫方程的唯一解

${\boldsymbol {A}}{\boldsymbol {W}}_{c}+{\boldsymbol {W}}_{c}{\boldsymbol {A^{T}}}=-{\boldsymbol {BB^{T}}}$

${\boldsymbol {A}}$ 若穩定（所有的特徵值實部均為負），而且 ${\boldsymbol {W}}_{c}$ 也是正定矩陣，則此系統具有可控制性，也就是 $({\boldsymbol {A}},{\boldsymbol {B}})$ 矩陣對具有可控制性。

此一定義也和以下其他可控制性的定義等效：

1. $n\times np$ 的可控制性矩陣

${\mathcal {C}}=[{\begin{array}{ccccc}{\boldsymbol {B}}&{\boldsymbol {AB}}&{\boldsymbol {A^{2}B}}&...&{\boldsymbol {A^{n-1}B}}\end{array}}]$

的秩為n。

2. $n\times (n+p)$ 矩陣

$[{\begin{array}{cc}{\boldsymbol {A}}{\boldsymbol {-\lambda }}{\boldsymbol {I}}&{\boldsymbol {B}}\end{array}}]$

對於每個 ${\boldsymbol {A}}$ 的特徵值 $\lambda$ ，都有滿秩。

Remove ads

和李亞普諾夫方程的關係

可控制性格拉姆矩陣是以下李亞普諾夫方程的解

${\boldsymbol {A}}{\boldsymbol {W}}_{c}+{\boldsymbol {W}}_{c}{\boldsymbol {A^{T}}}=-{\boldsymbol {BB^{T}}}$

假若令

${\boldsymbol {W_{c}}}=\int _{0}^{\infty }e^{{\boldsymbol {A}}\tau }{\boldsymbol {BB^{T}}}e^{{\boldsymbol {A}}^{T}\tau }d\tau$

為一個解，可得：

${\begin{array}{ccccc}{\boldsymbol {A}}{\boldsymbol {W}}_{c}+{\boldsymbol {W}}_{c}{\boldsymbol {A^{T}}}&=&\int _{0}^{\infty }{\boldsymbol {A}}e^{{\boldsymbol {A}}\tau }{\boldsymbol {BB^{T}}}e^{{\boldsymbol {A}}^{T}\tau }d\tau &+&\int _{0}^{\infty }e^{{\boldsymbol {A}}\tau }{\boldsymbol {BB^{T}}}e^{{\boldsymbol {A}}^{T}\tau }{\boldsymbol {A^{T}}}d\tau \\&=&\int _{0}^{\infty }{\frac {d}{d\tau }}(e^{{\boldsymbol {A}}\tau }{\boldsymbol {B}}{\boldsymbol {B}}^{T}e^{{\boldsymbol {A}}^{T}\tau })d\tau &=&e^{{\boldsymbol {A}}t}{\boldsymbol {B}}{\boldsymbol {B}}^{T}e^{{\boldsymbol {A}}^{T}t}|_{t=0}^{\infty }\\&=&{\boldsymbol {0}}-{\boldsymbol {BB^{T}}}\\&=&{\boldsymbol {-BB^{T}}}\end{array}}$

其中用到了對於穩定 ${\boldsymbol {A}}$ ，在 $t=\infty$ 時， $e^{{\boldsymbol {A}}t}=0$ 的事實（所有的特徵值實部均為負），因此 ${\boldsymbol {W}}_{c}$ 確實是李亞普諾夫方程的解。

Remove ads

格拉姆矩陣的性質

因為 ${\boldsymbol {BB^{T}}}$ 是對稱矩陣，因此 ${\boldsymbol {W}}_{c}$ 也是對稱矩陣。

若 ${\boldsymbol {A}}$ 是穩定矩陣（所有的特徵值實部均為負），可以證明 ${\boldsymbol {W}}_{c}$ 是唯一的。利甪反證法，先假設以下方程有二個不同解

${\boldsymbol {A}}{\boldsymbol {W}}_{c}+{\boldsymbol {W}}_{c}{\boldsymbol {A^{T}}}=-{\boldsymbol {BB^{T}}}$

分別是 ${\boldsymbol {W}}_{c1}$ 和 ${\boldsymbol {W}}_{c2}$ ，因此可得：

${\boldsymbol {A}}{\boldsymbol {(W}}_{c1}-{\boldsymbol {W}}_{c2})+{\boldsymbol {(W}}_{c1}-{\boldsymbol {W}}_{c2}){\boldsymbol {A^{T}}}={\boldsymbol {0}}$

在左右分別乘以 $e^{{\boldsymbol {A}}t}$ 和 $e^{{\boldsymbol {A}}^{T}t}$ ，可得：

$e^{{\boldsymbol {A}}t}[{\boldsymbol {A}}{\boldsymbol {(W}}_{c1}-{\boldsymbol {W}}_{c2})+{\boldsymbol {(W}}_{c1}-{\boldsymbol {W}}_{c2}){\boldsymbol {A^{T}}}]e^{{\boldsymbol {A^{T}}}t}={\frac {d}{dt}}[e^{{\boldsymbol {A}}t}[({\boldsymbol {W}}_{c1}-{\boldsymbol {W}}_{c2})e^{{\boldsymbol {A^{T}}}t}]={\boldsymbol {0}}$

從 $0$ 積分到 $\infty$ ：

$[e^{{\boldsymbol {A}}t}[({\boldsymbol {W}}_{c1}-{\boldsymbol {W}}_{c2})e^{{\boldsymbol {A^{T}}}t}]|_{t=0}^{\infty }={\boldsymbol {0}}$

再利用此一事實，當 $t\rightarrow \infty$ 時， $e^{{\boldsymbol {A}}t}\rightarrow 0$ ：

${\boldsymbol {0}}-({\boldsymbol {W}}_{c1}-{\boldsymbol {W}}_{c2})={\boldsymbol {0}}$

因此， ${\boldsymbol {W}}_{c}$ 是唯一的。

也可以看出

${\boldsymbol {x^{T}W_{c}x}}=\int _{0}^{\infty }{\boldsymbol {x}}^{T}e^{{\boldsymbol {A}}t}{\boldsymbol {BB^{T}}}e^{{\boldsymbol {A}}^{T}t}{\boldsymbol {x}}dt=\int _{0}^{\infty }\left\Vert {\boldsymbol {B^{T}e^{{\boldsymbol {A}}^{T}t}{\boldsymbol {x}}}}\right\Vert _{2}^{2}dt$

在任何t時都為正，因此 ${\boldsymbol {W}}_{c}$ 是正定矩陣。

可控制性系統的其他特性在^[1]中，以及可控制性中都有描述。

Remove ads

離散時間，線性非時變系統

若考慮以下的離散時間系統

${\begin{array}{c}{\boldsymbol {x}}[k+1]{\boldsymbol {=Ax}}[k]+{\boldsymbol {Bu}}[k]\\{\boldsymbol {y}}[k]={\boldsymbol {Cx}}[k]+{\boldsymbol {Du}}[k]\end{array}}$

其離散可控制性格拉姆矩陣是以下 $n\times n$ 的方陣

${\boldsymbol {W}}_{dc}=\sum _{m=0}^{\infty }{\boldsymbol {A}}^{m}{\boldsymbol {BB}}^{T}({\boldsymbol {A}}^{T})^{m}$

${\boldsymbol {A}}$ 若穩定（所有的特徵值絕對值均小於1），也是以下離散李亞普諾夫方程的解

$W_{dc}-{\boldsymbol {A}}{\boldsymbol {W}}_{dc}{\boldsymbol {A^{T}}}={\boldsymbol {BB^{T}}}$

${\boldsymbol {A}}$ 若穩定（所有的特徵值絕對值均小於1），而且 ${\boldsymbol {W}}_{dc}$ 也是正定矩陣，則此系統有可控制性。

更多相關的性質及證明在^[2]。

Remove ads

線性時變系統（LTV）

考慮以下的線性時變系統（LTV）：

${\begin{array}{c}{\dot {\boldsymbol {x}}}(t){\boldsymbol {=A}}(t){\boldsymbol {x}}(t)+{\boldsymbol {B}}(t){\boldsymbol {u}}(t)\\{\boldsymbol {y}}(t)={\boldsymbol {C}}(t){\boldsymbol {x}}(t)\end{array}}$

其中矩陣 ${\boldsymbol {A}}$ , ${\boldsymbol {B}}$ 和 ${\boldsymbol {C}}$ 的元素會隨時間而變化。其可控制性格拉姆矩陣為 $n\times n$ 矩陣，定義如下：

${\boldsymbol {W}}_{c}(t_{0},t_{1})=\int _{_{0}}^{^{\infty }}{\boldsymbol {\Phi }}(t_{1},\tau ){\boldsymbol {B}}(\tau ){\boldsymbol {B}}^{T}(\tau ){\boldsymbol {\Phi }}^{T}(t_{1},\tau )d\tau$

其中 ${\boldsymbol {\Phi }}(t,\tau )$ 為 ${\boldsymbol {\dot {x}}}={\boldsymbol {A}}(t){\boldsymbol {x}}$ 的狀態轉移矩陣。

系統 $({\boldsymbol {A}}(t),{\boldsymbol {B}}(t))$ 有可控制性的充份必要條是存在 $t_{1}>t_{0}$ ，使得可控制性格拉姆矩陣 ${\boldsymbol {W}}_{c}(t_{0},t_{1})$ 為非奇異矩陣。

Remove ads

格拉姆矩陣的性質

可控制性格拉姆矩陣 ${\boldsymbol {W}}_{c}(t_{0},t_{1})$ 有以下的性質：

${\boldsymbol {W}}_{c}(t_{0},t_{1})={\boldsymbol {W}}_{c}(t_{0},t)+{\boldsymbol {\Phi }}(t,t_{0}){\boldsymbol {W}}_{c}(t,t_{0}){\boldsymbol {\Phi }}^{T}(t,t_{0})$

可以由 ${\boldsymbol {W}}_{c}(t_{0},t_{1})$ 的定義，以及以下的狀態轉移矩陣性質來推導：

${\boldsymbol {\Phi }}(t_{0},t_{1})={\boldsymbol {\Phi }}(t_{1},\tau ){\boldsymbol {\Phi }}(\tau ,t_{0})$

其他有關可控制性格拉姆矩陣的性質可以參考^[3]。

Remove ads

參考資料

Loading content...

外部連結

Loading content...

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads

連續時間，線性非時變系統

和李亞普諾夫方程的關係

格拉姆矩陣的性質

離散時間，線性非時變系統

線性時變系統（LTV）

格拉姆矩陣的性質

相關條目

參考資料

外部連結