热门问题
时间线
聊天
视角

矩陣微積分

来自维基百科,自由的百科全书

Remove ads

數學中,矩陣微積分多元微積分的一種特殊表達,尤其是在矩陣空間上進行討論的時候。它把單個函數對多個變量或者多元函數對單個變量的偏導數寫成向量和矩陣的形式,使其可以被當成一個整體被處理。這使得要在多元函數尋找最大或最小值,又或是要為微分方程系統尋解的過程大幅簡化。這裡我們主要使用統計學工程學中的慣用記法,而張量下標記法更常用於物理學中。

記法與術語說明

本條目中,我們使用單個字母變量來表示多個變量的集合體(向量和矩陣),這樣可以充分利用矩陣記法的效用。

本條目使用不同字體來區分標量向量和矩陣。下面使用M(n,m)來表示包含nm列的n×m矩陣的空間,它等同於。該空間中的一般矩陣用粗體大寫字母表示,例如等。而若該矩陣屬於M(n,1),即列向量,則用粗體小寫字母表示,如等。特別地,M(1,1)中的元素為標量,用小寫斜體字母表示,如atx等。 表示矩陣轉置,tr()表示矩陣的,而 表示行列式。除非專門註明,所有函數都默認屬於光滑函數C1。 通常字母表前半部分的字母(a, b, c, …)用於表示常量,而後半部分的字母(t, x, y, …)用於表示變量。

Remove ads

矩陣的內積和範數

向量的內積(點積)在諸多領域中有着廣泛的運用。

定義在上的向量的點積定義為:

和向量類似,矩陣也可以定義內積(弗羅比尼烏斯內積):對於定義在上的實矩陣

利用內積,可以定義向量和矩陣的範數(模)。

向量可以以多種形式定義範數。歐幾里得範數是 上最常用的範數。它可以以向量與其自身的內積平方根表示:

矩陣範數也有多種定義,數值線性代數中最常用的一種範數為弗羅貝尼烏斯範數,它是矩陣與其自身的弗羅比尼烏斯內積的平方根:對於定義在上的實矩陣

對於復向量和復矩陣,將轉置改為共軛轉置即可。

Remove ads

線性映射

線性映射指的是滿足保持向量空間中向量加法和數乘運算的映射。此處的「向量」是抽象代數意義上的。也就是說,從向量空間(二者的係數體均為)的映射要想成為線性映射,必須滿足齊次性和疊加性:

  • 齊次性:對於任何向量 和任何標量

  • 疊加性:對於任意兩個 中的向量

對於實列向量(即一般意義上的實向量),將上述表述中的改為即可。可以知道這種線性映射可以通過n×m實矩陣矩陣左乘向量得到。

對於實矩陣,將上述表述中的改為即可。

特別地,對於實標量,線性映射指的就是正比例函數。

Remove ads

向量和矩陣的極限

對於向量和矩陣,可以使用類似於標量的極限定義方式來定義它們的極限。

標量函數的極限的現代定義如下:

對於標量函數,當

時,稱其在處的極限為A。記作

對於向量或矩陣函數也有類似的定義。

定義 — 對於定義在的子集上的向量或者矩陣函數,令的內點,當

時,稱其在處的極限為。記作[1]

我們可以定義向量函數的連續:

定義 — 對於定義於的子集的向量函數,令的內點,當

時,稱其在處連續。[2]:88

Remove ads

向量求導

由於向量可看成僅有一列的矩陣,最簡單的矩陣求導為向量求導。

這裡的標記方法可以通過如下方式表達大部分向量微積分:把n維向量構成的空間M(n,1)等同為歐氏空間, 標量M(1,1)等同於。對應的向量微積分的概念在每小節末尾列出。

我們首先定義向量函數的微分

定義 — 採用分子布局記法時,對於定義於的子集的向量函數,令的內點,中以為球心,為半徑的超球體,,如果存在一個線性映射,使得

並且

時,稱其在處可微。我們定義向量函數的微分為[3]:91-92

有如下的定理:

定理 — 處可微時,其在該點處連續。反之則不然。

我們將向量函數的第i個分量在處對自變量向量的第j個分量的偏導數定義為,其中是第j個單位向量。記作

定理 — 處可微時,其各分量在該點處關於自變量各分量的偏導數存在。

定理 — 處可微時,如果令為一個m×n矩陣,其第i列第j行元素為。那麼它就是向量微分定義中的矩陣

我們把矩陣叫做向量函數的導數。也記作。注意這裡使用的是分子布局記法。

這裡的「分子布局記法」一般指,在表示導數向量(或矩陣)時,該導數的行數等於導數表達式中處於分子部分的參數維度;若採用分母布局記法,則導數的行數等於導數表達式中處於分母部分的參數維度。分子布局記法的結果與分母布局記法的結果互為轉置關係。

Remove ads

向量對標量求導

標量可以視作一個1維向量。所以採用分子布局記法時,m維向量向量對標量求導的結果是一個m×1的矩陣,也就是m維列向量。

向量關於標量x的導數可以(用分子記法)寫成

向量微積分中,向量關於標量的導數也被稱為向量切向量。注意這裡

可以看到向量對標量求導就是其各個分量分別對標量求導。

例子 簡單的樣例包括歐式空間中的速度向量,它是位移向量(看作關於時間的函數)的切向量。更進一步而言, 加速度是速度的切向量。

Remove ads

標量對向量求導

標量y對向量的導數可以(用分子記法)寫成

向量微積分中,標量y在空間(其獨立坐標是x的分量)中的梯度是標量y對向量的導數的轉置。在物理學中,電場電勢的負梯度向量。

標量函數對空間向量在單位向量(在這裡表示為列向量)方向上的方向導數可以用梯度定義:

使用剛才定義的標量對向量的導數的記法,我們可以把方向導數寫作

這類記法在證明乘法法則和鏈式法則的時候非常直觀,因為它們與我們熟悉的標量導數的形式較為相似。

Remove ads

向量對向量求導

前面兩種情況可以看作是向量對向量求導在其中一個是一維向量情況下的特例。類似地我們將會發現有關矩陣的求導可被以一種類似的方式化歸為向量求導。

向量函數 (分量為函數的向量) 對輸入向量的導數,可以(用分子記法) 寫作

向量微積分中,向量函數對分量表示一個空間的向量的導數也被稱為前推,或雅可比矩陣

向量函數Rn空間中向量的前推為

Remove ads

矩陣求導

有兩種類型的矩陣求導可以被寫成相同大小的矩陣:矩陣對標量求導和標量對矩陣求導。它們在解決應用數學的許多領域常見的最小化問題中十分有用。類比於向量求導,相應的概念有切矩陣梯度矩陣

矩陣對標量求導

矩陣函數對標量x的導數被稱為切矩陣,(用分子記法)可寫成:

Remove ads

標量對矩陣求導

定義在元素是獨立變量的p×q矩陣上的標量函數y的導數可以(用分子記法)寫作

定義矩陣上的重要的標量函數包括矩陣的行列式

類比於向量微積分,這個導數常被寫成如下形式:

類似地,標量函數f(X)關於矩陣X在方向Y方向導數可寫成

梯度矩陣經常被應用在估計理論的最小化問題中,比如卡爾曼濾波算法的推導,因此在這些領域中有着重要的地位。

Remove ads

參考文獻

延伸閱讀

外部連結

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads