高斯过程

在概率论和统计学中，高斯过程（英语：Gaussian process）是观测值出现在一个连续域（例如时间或空间）的随机过程。在高斯过程中，连续输入空间中每个点都是与一个正态分布的随机变量相关联。此外，这些随机变量的每个有限集合都有一个多元正态分布，换句话说他们的任意有限线性组合是一个正态分布。高斯过程的分布是所有那些（无限多个）随机变量的联合分布，正因如此，它是连续域（例如时间或空间）上函数的分布。

高斯过程被认为是一种机器学习算法，是以惰性学习（英语：lazy learning）方式，利用点与点之间同质性的度量作为核函数（英语：Kernel function），以从输入的训练数据预测未知点的值。其预测结果不仅包含该点的值，而同时包含不确定性的资料－它的一维高斯分布（即该点的边际分布）。^[1]^[2]

对于某些核函数，可以使用矩阵代数（见克里金法（英语：kriging）条目）来计算预测值。若核函数有代数参数，则通常使用软体以拟合高斯过程的模型。

由于高斯过程是基于高斯分布（正态分布）的概念，故其以卡尔·弗里德里希·高斯为名。可以把高斯过程看成多元正态分布的无限维广义延伸。

高斯过程常用于统计建模中，而使用高斯过程的模型可以得到高斯过程的属性。举例来说，如果把一随机过程用高斯过程建模，我们可以显示求出各种导出量的分布，这些导出量可以是例如随机过程在一定范围次数内的平均值，及使用小范围采样次数及采样值进行平均值预测的误差。

[1]

[2]