热门问题
时间线
聊天
视角

矩阵微积分

来自维基百科,自由的百科全书

Remove ads

数学中,矩阵微积分多元微积分的一种特殊表达,尤其是在矩阵空间上进行讨论的时候。它把单个函数对多个变量或者多元函数对单个变量的偏导数写成向量和矩阵的形式,使其可以被当成一个整体被处理。这使得要在多元函数寻找最大或最小值,又或是要为微分方程系统寻解的过程大幅简化。这里我们主要使用统计学工程学中的惯用记法,而张量下标记法更常用于物理学中。

记法与术语说明

本条目中,我们使用单个字母变量来表示多个变量的集合体(向量和矩阵),这样可以充分利用矩阵记法的效用。

本条目使用不同字体来区分标量向量和矩阵。下面使用M(n,m)来表示包含nm列的n×m矩阵的空间,它等同于。该空间中的一般矩阵用粗体大写字母表示,例如等。而若该矩阵属于M(n,1),即列向量,则用粗体小写字母表示,如等。特别地,M(1,1)中的元素为标量,用小写斜体字母表示,如atx等。 表示矩阵转置,tr()表示矩阵的,而 表示行列式。除非专门注明,所有函数都默认属于光滑函数C1。 通常字母表前半部分的字母(a, b, c, …)用于表示常量,而后半部分的字母(t, x, y, …)用于表示变量。

Remove ads

矩阵的内积和范数

向量的内积(点积)在诸多领域中有着广泛的运用。

定义在上的向量的点积定义为:

和向量类似,矩阵也可以定义内积(弗罗比尼乌斯内积):对于定义在上的实矩阵

利用内积,可以定义向量和矩阵的范数(模)。

向量可以以多种形式定义范数。欧几里得范数是 上最常用的范数。它可以以向量与其自身的内积平方根表示:

矩阵范数也有多种定义,数值线性代数中最常用的一种范数为弗罗贝尼乌斯范数,它是矩阵与其自身的弗罗比尼乌斯内积的平方根:对于定义在上的实矩阵

对于复向量和复矩阵,将转置改为共轭转置即可。

Remove ads

线性映射

线性映射指的是满足保持向量空间中向量加法和数乘运算的映射。此处的“向量”是抽象代数意义上的。也就是说,从向量空间(二者的系数体均为)的映射要想成为线性映射,必须满足齐次性和叠加性:

  • 齐次性:对于任何向量 和任何标量

  • 叠加性:对于任意两个 中的向量

对于实列向量(即一般意义上的实向量),将上述表述中的改为即可。可以知道这种线性映射可以通过n×m实矩阵矩阵左乘向量得到。

对于实矩阵,将上述表述中的改为即可。

特别地,对于实标量,线性映射指的就是正比例函数。

Remove ads

向量和矩阵的极限

对于向量和矩阵,可以使用类似于标量的极限定义方式来定义它们的极限。

标量函数的极限的现代定义如下:

对于标量函数,当

时,称其在处的极限为A。记作

对于向量或矩阵函数也有类似的定义。

定义 — 对于定义在的子集上的向量或者矩阵函数,令的内点,当

时,称其在处的极限为。记作[1]

我们可以定义向量函数的连续:

定义 — 对于定义于的子集的向量函数,令的内点,当

时,称其在处连续。[2]:88

Remove ads

向量求导

由于向量可看成仅有一列的矩阵,最简单的矩阵求导为向量求导。

这里的标记方法可以通过如下方式表达大部分向量微积分:把n维向量构成的空间M(n,1)等同为欧氏空间, 标量M(1,1)等同于。对应的向量微积分的概念在每小节末尾列出。

我们首先定义向量函数的微分

定义 — 采用分子布局记法时,对于定义于的子集的向量函数,令的内点,中以为球心,为半径的超球体,,如果存在一个线性映射,使得

并且

时,称其在处可微。我们定义向量函数的微分为[3]:91-92

有如下的定理:

定理 — 处可微时,其在该点处连续。反之则不然。

我们将向量函数的第i个分量在处对自变量向量的第j个分量的偏导数定义为,其中是第j个单位向量。记作

定理 — 处可微时,其各分量在该点处关于自变量各分量的偏导数存在。

定理 — 处可微时,如果令为一个m×n矩阵,其第i行第j列元素为。那么它就是向量微分定义中的矩阵

我们把矩阵叫做向量函数的导数。也记作。注意这里使用的是分子布局记法。

这里的“分子布局记法”一般指,在表示导数向量(或矩阵)时,该导数的行数等于导数表达式中处于分子部分的参数维度;若采用分母布局记法,则导数的行数等于导数表达式中处于分母部分的参数维度。分子布局记法的结果与分母布局记法的结果互为转置关系。

Remove ads

向量对标量求导

标量可以视作一个1维向量。所以采用分子布局记法时,m维向量向量对标量求导的结果是一个m×1的矩阵,也就是m维列向量。

向量关于标量x的导数可以(用分子记法)写成

向量微积分中,向量关于标量的导数也被称为向量切向量。注意这里

可以看到向量对标量求导就是其各个分量分别对标量求导。

例子 简单的样例包括欧式空间中的速度向量,它是位移向量(看作关于时间的函数)的切向量。更进一步而言, 加速度是速度的切向量。

Remove ads

标量对向量求导

标量y对向量的导数可以(用分子记法)写成

向量微积分中,标量y在空间(其独立坐标是x的分量)中的梯度是标量y对向量的导数的转置。在物理学中,电场电势的负梯度向量。

标量函数对空间向量在单位向量(在这里表示为列向量)方向上的方向导数可以用梯度定义:

使用刚才定义的标量对向量的导数的记法,我们可以把方向导数写作

这类记法在证明乘法法则和链式法则的时候非常直观,因为它们与我们熟悉的标量导数的形式较为相似。

Remove ads

向量对向量求导

前面两种情况可以看作是向量对向量求导在其中一个是一维向量情况下的特例。类似地我们将会发现有关矩阵的求导可被以一种类似的方式化归为向量求导。

向量函数 (分量为函数的向量) 对输入向量的导数,可以(用分子记法) 写作

向量微积分中,向量函数对分量表示一个空间的向量的导数也被称为前推,或雅可比矩阵

向量函数Rn空间中向量的前推为

Remove ads

矩阵求导

有两种类型的矩阵求导可以被写成相同大小的矩阵:矩阵对标量求导和标量对矩阵求导。它们在解决应用数学的许多领域常见的最小化问题中十分有用。类比于向量求导,相应的概念有切矩阵梯度矩阵

矩阵对标量求导

矩阵函数对标量x的导数被称为切矩阵,(用分子记法)可写成:

Remove ads

标量对矩阵求导

定义在元素是独立变量的p×q矩阵上的标量函数y的导数可以(用分子记法)写作

定义矩阵上的重要的标量函数包括矩阵的行列式

类比于向量微积分,这个导数常被写成如下形式:

类似地,标量函数f(X)关于矩阵X在方向Y方向导数可写成

梯度矩阵经常被应用在估计理论的最小化问题中,比如卡尔曼滤波算法的推导,因此在这些领域中有着重要的地位。

Remove ads

参考文献

延伸阅读

外部链接

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads