控制理論中,可控制性格拉姆矩陣(Controllability Gramian)是用來判斷線性動態系統是否可控制的格拉姆矩陣。 若針對以下的線性時變系統 x ˙ ( t ) = A ( t ) x ( t ) + B ( t ) u ( t ) {\displaystyle {\dot {x}}(t)=A(t)x(t)+B(t)u(t)} y ( t ) = C ( t ) x ( t ) + D ( t ) u ( t ) {\displaystyle y(t)=C(t)x(t)+D(t)u(t)\,} 可控制性格拉姆矩陣為 W c ( t 0 , t 1 ) = ∫ t 0 t 1 Φ ( τ , t 0 ) B ( τ ) B T ( τ ) Φ T ( τ , t 0 ) d τ {\displaystyle W_{c}(t_{0},t_{1})=\int _{t_{0}}^{t_{1}}\Phi (\tau ,t_{0})B(\tau )B^{T}(\tau )\Phi ^{T}(\tau ,t_{0})d\tau } , 其中 Φ {\displaystyle \Phi } 為狀態轉換矩陣 系統在 t ∈ [ t 0 , t 1 ] {\displaystyle t\in [t_{0},t_{1}]} 具有可控制性,若且唯若 W c ( t 0 , t 1 ) {\displaystyle W_{c}(t_{0},t_{1})} 為非奇異矩陣。 Remove ads連續時間,線性非時變系統 若在連續時間的線性非時變系統中,也可以定義可控制性格拉姆矩陣(不過也有其他判斷可觀測性的方法)。 若考慮以下的系統 x ˙ ( t ) = A x ( t ) + B u ( t ) {\displaystyle {\dot {x}}(t)=Ax(t)+Bu(t)} y ( t ) = C x ( t ) + D u ( t ) {\displaystyle y(t)=Cx(t)+Du(t)\,} 其可控制性格拉姆矩陣是以下 n × n {\displaystyle n\times n} 的方陣 W c ( t ) = ∫ 0 t e A τ B B T e A T τ d τ {\displaystyle {\boldsymbol {W_{c}}}(t)=\int _{0}^{t}e^{{\boldsymbol {A}}\tau }{\boldsymbol {B}}{\boldsymbol {B^{T}}}e^{{\boldsymbol {A}}^{T}\tau }d\tau } A {\displaystyle {\boldsymbol {A}}} 若穩定(所有的特徵值實部均為負),可控制性格拉姆矩陣也是以下李亞普諾夫方程的唯一解 A W c + W c A T = − B B T {\displaystyle {\boldsymbol {A}}{\boldsymbol {W}}_{c}+{\boldsymbol {W}}_{c}{\boldsymbol {A^{T}}}=-{\boldsymbol {BB^{T}}}} A {\displaystyle {\boldsymbol {A}}} 若穩定(所有的特徵值實部均為負),而且 W c {\displaystyle {\boldsymbol {W}}_{c}} 也是正定矩陣,則此系統具有可控制性,也就是 ( A , B ) {\displaystyle ({\boldsymbol {A}},{\boldsymbol {B}})} 矩陣對具有可控制性。 此一定義也和以下其他可控制性的定義等效: 1. n × n p {\displaystyle n\times np} 的可控制性矩陣 C = [ B A B A 2 B . . . A n − 1 B ] {\displaystyle {\mathcal {C}}=[{\begin{array}{ccccc}{\boldsymbol {B}}&{\boldsymbol {AB}}&{\boldsymbol {A^{2}B}}&...&{\boldsymbol {A^{n-1}B}}\end{array}}]} 的秩為n。 2. n × ( n + p ) {\displaystyle n\times (n+p)} 矩陣 [ A − λ I B ] {\displaystyle [{\begin{array}{cc}{\boldsymbol {A}}{\boldsymbol {-\lambda }}{\boldsymbol {I}}&{\boldsymbol {B}}\end{array}}]} 對於每個 A {\displaystyle {\boldsymbol {A}}} 的特徵值 λ {\displaystyle \lambda } ,都有滿秩。 Remove ads和李亞普諾夫方程的關係 可控制性格拉姆矩陣是以下李亞普諾夫方程的解 A W c + W c A T = − B B T {\displaystyle {\boldsymbol {A}}{\boldsymbol {W}}_{c}+{\boldsymbol {W}}_{c}{\boldsymbol {A^{T}}}=-{\boldsymbol {BB^{T}}}} 假若令 W c = ∫ 0 ∞ e A τ B B T e A T τ d τ {\displaystyle {\boldsymbol {W_{c}}}=\int _{0}^{\infty }e^{{\boldsymbol {A}}\tau }{\boldsymbol {BB^{T}}}e^{{\boldsymbol {A}}^{T}\tau }d\tau } 為一個解,可得: A W c + W c A T = ∫ 0 ∞ A e A τ B B T e A T τ d τ + ∫ 0 ∞ e A τ B B T e A T τ A T d τ = ∫ 0 ∞ d d τ ( e A τ B B T e A T τ ) d τ = e A t B B T e A T t | t = 0 ∞ = 0 − B B T = − B B T {\displaystyle {\begin{array}{ccccc}{\boldsymbol {A}}{\boldsymbol {W}}_{c}+{\boldsymbol {W}}_{c}{\boldsymbol {A^{T}}}&=&\int _{0}^{\infty }{\boldsymbol {A}}e^{{\boldsymbol {A}}\tau }{\boldsymbol {BB^{T}}}e^{{\boldsymbol {A}}^{T}\tau }d\tau &+&\int _{0}^{\infty }e^{{\boldsymbol {A}}\tau }{\boldsymbol {BB^{T}}}e^{{\boldsymbol {A}}^{T}\tau }{\boldsymbol {A^{T}}}d\tau \\&=&\int _{0}^{\infty }{\frac {d}{d\tau }}(e^{{\boldsymbol {A}}\tau }{\boldsymbol {B}}{\boldsymbol {B}}^{T}e^{{\boldsymbol {A}}^{T}\tau })d\tau &=&e^{{\boldsymbol {A}}t}{\boldsymbol {B}}{\boldsymbol {B}}^{T}e^{{\boldsymbol {A}}^{T}t}|_{t=0}^{\infty }\\&=&{\boldsymbol {0}}-{\boldsymbol {BB^{T}}}\\&=&{\boldsymbol {-BB^{T}}}\end{array}}} 其中用到了對於穩定 A {\displaystyle {\boldsymbol {A}}} ,在 t = ∞ {\displaystyle t=\infty } 時, e A t = 0 {\displaystyle e^{{\boldsymbol {A}}t}=0} 的事實(所有的特徵值實部均為負),因此 W c {\displaystyle {\boldsymbol {W}}_{c}} 確實是李亞普諾夫方程的解。 Remove ads格拉姆矩陣的性質 因為 B B T {\displaystyle {\boldsymbol {BB^{T}}}} 是對稱矩陣,因此 W c {\displaystyle {\boldsymbol {W}}_{c}} 也是對稱矩陣。 若 A {\displaystyle {\boldsymbol {A}}} 是穩定矩陣(所有的特徵值實部均為負),可以證明 W c {\displaystyle {\boldsymbol {W}}_{c}} 是唯一的。利甪反證法,先假設以下方程有二個不同解 A W c + W c A T = − B B T {\displaystyle {\boldsymbol {A}}{\boldsymbol {W}}_{c}+{\boldsymbol {W}}_{c}{\boldsymbol {A^{T}}}=-{\boldsymbol {BB^{T}}}} 分別是 W c 1 {\displaystyle {\boldsymbol {W}}_{c1}} 和 W c 2 {\displaystyle {\boldsymbol {W}}_{c2}} ,因此可得: A ( W c 1 − W c 2 ) + ( W c 1 − W c 2 ) A T = 0 {\displaystyle {\boldsymbol {A}}{\boldsymbol {(W}}_{c1}-{\boldsymbol {W}}_{c2})+{\boldsymbol {(W}}_{c1}-{\boldsymbol {W}}_{c2}){\boldsymbol {A^{T}}}={\boldsymbol {0}}} 在左右分別乘以 e A t {\displaystyle e^{{\boldsymbol {A}}t}} 和 e A T t {\displaystyle e^{{\boldsymbol {A}}^{T}t}} ,可得: e A t [ A ( W c 1 − W c 2 ) + ( W c 1 − W c 2 ) A T ] e A T t = d d t [ e A t [ ( W c 1 − W c 2 ) e A T t ] = 0 {\displaystyle e^{{\boldsymbol {A}}t}[{\boldsymbol {A}}{\boldsymbol {(W}}_{c1}-{\boldsymbol {W}}_{c2})+{\boldsymbol {(W}}_{c1}-{\boldsymbol {W}}_{c2}){\boldsymbol {A^{T}}}]e^{{\boldsymbol {A^{T}}}t}={\frac {d}{dt}}[e^{{\boldsymbol {A}}t}[({\boldsymbol {W}}_{c1}-{\boldsymbol {W}}_{c2})e^{{\boldsymbol {A^{T}}}t}]={\boldsymbol {0}}} 從 0 {\displaystyle 0} 積分到 ∞ {\displaystyle \infty } : [ e A t [ ( W c 1 − W c 2 ) e A T t ] | t = 0 ∞ = 0 {\displaystyle [e^{{\boldsymbol {A}}t}[({\boldsymbol {W}}_{c1}-{\boldsymbol {W}}_{c2})e^{{\boldsymbol {A^{T}}}t}]|_{t=0}^{\infty }={\boldsymbol {0}}} 再利用此一事實,當 t → ∞ {\displaystyle t\rightarrow \infty } 時, e A t → 0 {\displaystyle e^{{\boldsymbol {A}}t}\rightarrow 0} : 0 − ( W c 1 − W c 2 ) = 0 {\displaystyle {\boldsymbol {0}}-({\boldsymbol {W}}_{c1}-{\boldsymbol {W}}_{c2})={\boldsymbol {0}}} 因此, W c {\displaystyle {\boldsymbol {W}}_{c}} 是唯一的。 也可以看出 x T W c x = ∫ 0 ∞ x T e A t B B T e A T t x d t = ∫ 0 ∞ ‖ B T e A T t x ‖ 2 2 d t {\displaystyle {\boldsymbol {x^{T}W_{c}x}}=\int _{0}^{\infty }{\boldsymbol {x}}^{T}e^{{\boldsymbol {A}}t}{\boldsymbol {BB^{T}}}e^{{\boldsymbol {A}}^{T}t}{\boldsymbol {x}}dt=\int _{0}^{\infty }\left\Vert {\boldsymbol {B^{T}e^{{\boldsymbol {A}}^{T}t}{\boldsymbol {x}}}}\right\Vert _{2}^{2}dt} 在任何t時都為正,因此 W c {\displaystyle {\boldsymbol {W}}_{c}} 是正定矩陣。 可控制性系統的其他特性在[1]中,以及可控制性中都有描述。 Remove ads離散時間,線性非時變系統 若考慮以下的離散時間系統 x [ k + 1 ] = A x [ k ] + B u [ k ] y [ k ] = C x [ k ] + D u [ k ] {\displaystyle {\begin{array}{c}{\boldsymbol {x}}[k+1]{\boldsymbol {=Ax}}[k]+{\boldsymbol {Bu}}[k]\\{\boldsymbol {y}}[k]={\boldsymbol {Cx}}[k]+{\boldsymbol {Du}}[k]\end{array}}} 其離散可控制性格拉姆矩陣是以下 n × n {\displaystyle n\times n} 的方陣 W d c = ∑ m = 0 ∞ A m B B T ( A T ) m {\displaystyle {\boldsymbol {W}}_{dc}=\sum _{m=0}^{\infty }{\boldsymbol {A}}^{m}{\boldsymbol {BB}}^{T}({\boldsymbol {A}}^{T})^{m}} A {\displaystyle {\boldsymbol {A}}} 若穩定(所有的特徵值絕對值均小於1),也是以下離散李亞普諾夫方程的解 W d c − A W d c A T = B B T {\displaystyle W_{dc}-{\boldsymbol {A}}{\boldsymbol {W}}_{dc}{\boldsymbol {A^{T}}}={\boldsymbol {BB^{T}}}} A {\displaystyle {\boldsymbol {A}}} 若穩定(所有的特徵值絕對值均小於1),而且 W d c {\displaystyle {\boldsymbol {W}}_{dc}} 也是正定矩陣,則此系統有可控制性。 更多相關的性質及證明在[2]。 Remove ads線性時變系統(LTV) 考慮以下的線性時變系統(LTV): x ˙ ( t ) = A ( t ) x ( t ) + B ( t ) u ( t ) y ( t ) = C ( t ) x ( t ) {\displaystyle {\begin{array}{c}{\dot {\boldsymbol {x}}}(t){\boldsymbol {=A}}(t){\boldsymbol {x}}(t)+{\boldsymbol {B}}(t){\boldsymbol {u}}(t)\\{\boldsymbol {y}}(t)={\boldsymbol {C}}(t){\boldsymbol {x}}(t)\end{array}}} 其中矩陣 A {\displaystyle {\boldsymbol {A}}} , B {\displaystyle {\boldsymbol {B}}} 和 C {\displaystyle {\boldsymbol {C}}} 的元素會隨時間而變化。其可控制性格拉姆矩陣為 n × n {\displaystyle n\times n} 矩陣,定義如下: W c ( t 0 , t 1 ) = ∫ 0 ∞ Φ ( t 1 , τ ) B ( τ ) B T ( τ ) Φ T ( t 1 , τ ) d τ {\displaystyle {\boldsymbol {W}}_{c}(t_{0},t_{1})=\int _{_{0}}^{^{\infty }}{\boldsymbol {\Phi }}(t_{1},\tau ){\boldsymbol {B}}(\tau ){\boldsymbol {B}}^{T}(\tau ){\boldsymbol {\Phi }}^{T}(t_{1},\tau )d\tau } 其中 Φ ( t , τ ) {\displaystyle {\boldsymbol {\Phi }}(t,\tau )} 為 x ˙ = A ( t ) x {\displaystyle {\boldsymbol {\dot {x}}}={\boldsymbol {A}}(t){\boldsymbol {x}}} 的狀態轉移矩陣。 系統 ( A ( t ) , B ( t ) ) {\displaystyle ({\boldsymbol {A}}(t),{\boldsymbol {B}}(t))} 有可控制性的充份必要條是存在 t 1 > t 0 {\displaystyle t_{1}>t_{0}} ,使得可控制性格拉姆矩陣 W c ( t 0 , t 1 ) {\displaystyle {\boldsymbol {W}}_{c}(t_{0},t_{1})} 為非奇異矩陣。 Remove ads格拉姆矩陣的性質 可控制性格拉姆矩陣 W c ( t 0 , t 1 ) {\displaystyle {\boldsymbol {W}}_{c}(t_{0},t_{1})} 有以下的性質: W c ( t 0 , t 1 ) = W c ( t 0 , t ) + Φ ( t , t 0 ) W c ( t , t 0 ) Φ T ( t , t 0 ) {\displaystyle {\boldsymbol {W}}_{c}(t_{0},t_{1})={\boldsymbol {W}}_{c}(t_{0},t)+{\boldsymbol {\Phi }}(t,t_{0}){\boldsymbol {W}}_{c}(t,t_{0}){\boldsymbol {\Phi }}^{T}(t,t_{0})} 可以由 W c ( t 0 , t 1 ) {\displaystyle {\boldsymbol {W}}_{c}(t_{0},t_{1})} 的定義,以及以下的狀態轉移矩陣性質來推導: Φ ( t 0 , t 1 ) = Φ ( t 1 , τ ) Φ ( τ , t 0 ) {\displaystyle {\boldsymbol {\Phi }}(t_{0},t_{1})={\boldsymbol {\Phi }}(t_{1},\tau ){\boldsymbol {\Phi }}(\tau ,t_{0})} 其他有關可控制性格拉姆矩陣的性質可以參考[3]。 Remove ads相關條目 可控制性 可觀測性格拉姆矩陣 格拉姆矩陣 最小能量控制 參考資料Loading content...外部連結Loading content...Loading related searches...Wikiwand - on Seamless Wikipedia browsing. On steroids.Remove ads