热门问题
时间线
聊天
视角
矩陣微積分
来自维基百科,自由的百科全书
Remove ads
在數學中,矩陣微積分是多元微積分的一種特殊表達,尤其是在矩陣空間上進行討論的時候。它把單個函數對多個變量或者多元函數對單個變量的偏導數寫成向量和矩陣的形式,使其可以被當成一個整體被處理。這使得要在多元函數尋找最大或最小值,又或是要為微分方程系統尋解的過程大幅簡化。這裡我們主要使用統計學和工程學中的慣用記法,而張量下標記法更常用於物理學中。
此條目需要精通或熟悉相關主題的編者參與及協助編輯。 (2019年3月5日) |
記法與術語說明
本條目中,我們使用單個字母變量來表示多個變量的集合體(向量和矩陣),這樣可以充分利用矩陣記法的效用。
本條目使用不同字體來區分標量、向量和矩陣。下面使用M(n,m)來表示包含n行m列的n×m實矩陣的空間,它等同於。該空間中的一般矩陣用粗體大寫字母表示,例如,,等。而若該矩陣屬於M(n,1),即列向量,則用粗體小寫字母表示,如,,等。特別地,M(1,1)中的元素為標量,用小寫斜體字母表示,如a,t,x等。 表示矩陣轉置,tr()表示矩陣的跡,而 或表示行列式。除非專門註明,所有函數都默認屬於光滑函數C1。 通常字母表前半部分的字母(a, b, c, …)用於表示常量,而後半部分的字母(t, x, y, …)用於表示變量。
Remove ads
向量的內積(點積)在諸多領域中有着廣泛的運用。
定義在上的向量和的點積定義為:
- 。
和向量類似,矩陣也可以定義內積(弗羅比尼烏斯內積):對於定義在上的實矩陣和,。
利用內積,可以定義向量和矩陣的範數(模)。
向量可以以多種形式定義範數。歐幾里得範數是 上最常用的範數。它可以以向量與其自身的內積的平方根表示:
。
而矩陣範數也有多種定義,數值線性代數中最常用的一種範數為弗羅貝尼烏斯範數,它是矩陣與其自身的弗羅比尼烏斯內積的平方根:對於定義在上的實矩陣,
。
對於復向量和復矩陣,將轉置改為共軛轉置即可。
Remove ads
線性映射指的是滿足保持向量空間中向量加法和數乘運算的映射。此處的「向量」是抽象代數意義上的。也就是說,從向量空間到(二者的係數體均為)的映射要想成為線性映射,必須滿足齊次性和疊加性:
- 齊次性:對於任何向量 和任何標量 :
- 疊加性:對於任意兩個 中的向量 和 :
對於實列向量(即一般意義上的實向量),將上述表述中的、和改為、和即可。可以知道這種線性映射可以通過n×m實矩陣矩陣左乘向量得到。
對於實矩陣,將上述表述中的、和改為、和即可。
特別地,對於實標量,線性映射指的就是正比例函數。
Remove ads
向量和矩陣的極限
對於向量和矩陣,可以使用類似於標量的極限定義方式來定義它們的極限。
標量函數的極限的現代定義如下:
對於標量函數,當
時,稱其在處的極限為A。記作。
對於向量或矩陣函數也有類似的定義。
我們可以定義向量函數的連續:
Remove ads
向量求導
由於向量可看成僅有一列的矩陣,最簡單的矩陣求導為向量求導。
這裡的標記方法可以通過如下方式表達大部分向量微積分:把n維向量構成的空間M(n,1)等同為歐氏空間, 標量M(1,1)等同於。對應的向量微積分的概念在每小節末尾列出。
我們首先定義向量函數的微分:
有如下的定理:
定理 — 當在處可微時,其在該點處連續。反之則不然。
我們將向量函數的第i個分量在處對自變量向量的第j個分量的偏導數定義為,其中是第j個單位向量。記作。
定理 — 當在處可微時,其各分量在該點處關於自變量各分量的偏導數存在。
定理 — 當在處可微時,如果令為一個m×n矩陣,其第i列第j行元素為。那麼它就是向量微分定義中的矩陣。
我們把矩陣叫做向量函數的導數。也記作。注意這裡使用的是分子布局記法。
這裡的「分子布局記法」一般指,在表示導數向量(或矩陣)時,該導數的行數等於導數表達式中處於分子部分的參數維度;若採用分母布局記法,則導數的行數等於導數表達式中處於分母部分的參數維度。分子布局記法的結果與分母布局記法的結果互為轉置關係。
Remove ads
標量可以視作一個1維向量。所以採用分子布局記法時,m維向量向量對標量求導的結果是一個m×1的矩陣,也就是m維列向量。
向量關於標量x的導數可以(用分子記法)寫成
在向量微積分中,向量關於標量的導數也被稱為向量的切向量,。注意這裡。
可以看到向量對標量求導就是其各個分量分別對標量求導。
有
例子 簡單的樣例包括歐式空間中的速度向量,它是位移向量(看作關於時間的函數)的切向量。更進一步而言, 加速度是速度的切向量。
Remove ads
標量y對向量的導數可以(用分子記法)寫成
有。
在向量微積分中,標量y在空間(其獨立坐標是x的分量)中的梯度是標量y對向量的導數的轉置。在物理學中,電場是電勢的負梯度向量。
標量函數對空間向量在單位向量(在這裡表示為列向量)方向上的方向導數可以用梯度定義:
使用剛才定義的標量對向量的導數的記法,我們可以把方向導數寫作
。
這類記法在證明乘法法則和鏈式法則的時候非常直觀,因為它們與我們熟悉的標量導數的形式較為相似。
Remove ads
前面兩種情況可以看作是向量對向量求導在其中一個是一維向量情況下的特例。類似地我們將會發現有關矩陣的求導可被以一種類似的方式化歸為向量求導。
向量函數 (分量為函數的向量) 對輸入向量的導數,可以(用分子記法) 寫作
在向量微積分中,向量函數對分量表示一個空間的向量的導數也被稱為前推,或雅可比矩陣。
向量函數對Rn空間中向量的前推為
Remove ads
矩陣求導
有兩種類型的矩陣求導可以被寫成相同大小的矩陣:矩陣對標量求導和標量對矩陣求導。它們在解決應用數學的許多領域常見的最小化問題中十分有用。類比於向量求導,相應的概念有切矩陣和梯度矩陣。
矩陣函數對標量x的導數被稱為切矩陣,(用分子記法)可寫成:
Remove ads
定義在元素是獨立變量的p×q矩陣上的標量函數y對的導數可以(用分子記法)寫作
類比於向量微積分,這個導數常被寫成如下形式:
類似地,標量函數f(X)關於矩陣X在方向Y的方向導數可寫成
Remove ads
參考文獻
延伸閱讀
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads