多元变量统计和概率论中,散布矩阵是一种统计量,用于估计协方差矩阵,例如多元正态分布的协方差矩阵。 定义 给定m维数据的n个样本,写作m×n矩阵 X = [ x 1 , x 2 , … , x n ] {\displaystyle X=[\mathbf {x} _{1},\mathbf {x} _{2},\ldots ,\mathbf {x} _{n}]} ,则样本均值为 x ¯ = 1 n ∑ j = 1 n x j {\displaystyle {\overline {\mathbf {x} }}={\frac {1}{n}}\sum _{j=1}^{n}\mathbf {x} _{j}} 其中 x j {\displaystyle \mathbf {x} _{j}} 是 X {\displaystyle X} 的第j列。[1] 散布矩阵是m×m正半定矩阵 S = ∑ j = 1 n ( x j − x ¯ ) ( x j − x ¯ ) T = ∑ j = 1 n ( x j − x ¯ ) ⊗ ( x j − x ¯ ) = ( ∑ j = 1 n x j x j T ) − n x ¯ x ¯ T {\displaystyle S=\sum _{j=1}^{n}(\mathbf {x} _{j}-{\overline {\mathbf {x} }})(\mathbf {x} _{j}-{\overline {\mathbf {x} }})^{T}=\sum _{j=1}^{n}(\mathbf {x} _{j}-{\overline {\mathbf {x} }})\otimes (\mathbf {x} _{j}-{\overline {\mathbf {x} }})=\left(\sum _{j=1}^{n}\mathbf {x} _{j}\mathbf {x} _{j}^{T}\right)-n{\overline {\mathbf {x} }}{\overline {\mathbf {x} }}^{T}} 其中 ( ⋅ ) T {\displaystyle (\cdot )^{T}} 表示矩阵转置,[2]乘法为外积。散布矩阵可更简洁地表为 S = X C n X T {\displaystyle S=X\,C_{n}\,X^{T}} 其中 C n {\displaystyle \,C_{n}} 是n×n中心化矩阵。 Remove ads应用 给定n个样本的多元正态分布协方差矩阵的最大似然估计值可表为归一化散布矩阵 C M L = 1 n S . {\displaystyle C_{ML}={\frac {1}{n}}S.} [3] 当 X {\displaystyle X} 的列从多元正态分布中独立采样时, S {\displaystyle S} 遵循威沙特分布。 Remove ads另见 威沙特分布 外积— X X ⊤ {\displaystyle XX^{\top }} 或X⊗X是X与自身的外积。 格拉姆矩阵 参考文献Loading content...Loading related searches...Wikiwand - on Seamless Wikipedia browsing. On steroids.Remove ads