地理统计(英语:geostatistics,或译作地统计学地学统计地质统计学等)是统计学中关注空间或时空数据集的一个分支,最初是从采矿作业中预测矿石品位的概率分布而发展出来的[1],目前已应用于石油地质学水文地质学水文学气象学海洋学地球化学地质冶金学英语Geometallurgy地理学林业、环境控制、景观生态学土壤学,以及农业(尤其是精准农业)等多个学科。地理统计应用于地理学的各个分支,特别是涉及疾病传播(流行病学)、商业和军事规划(物流)的实践,还应用于建设高效的空间网络英语Spatial network。地理统计相关算法已融入地理信息系统(GIS)等许多应用场景。

背景

地理统计与插值方法密切相关,但远不止简单的插值问题。地理统计技术依赖基于随机函数(或随机变量)理论的统计模型来模拟与空间估计和模拟相关的不确定性。

许多更简单的插值方法/算法,例如反距离加权双线性插值最近邻插值,在地统计学问世前就已经普及。[2]但地统计学超越了插值问题,将位于未知位置的要研究的现象视作一组相关的随机变量。

Z(x)为特定位置x处的感兴趣变量的值。这个值是未知的(例如温度、降雨量、测压水位、地质相等)。尽管可以前往位置x测量该数值,但地统计学认为该值在尚未测量时是随机的。然而,Z(x)又不完全随机,可以用累积分布函数(CDF)定义,而该函数依赖于关于Z(x)值的某些已知信息(information):

通常,如果靠近x的某些位置(或位于x邻域中)的Z的值已知,则可以通过该邻域来约束Z(x)的累积分布函数:如果假设空间是高度连续的(空间自相关),则Z(x)必与附近的值相似。相反,若空间连续性很弱,则Z(x)可以取任何值。随机变量的空间连续性可以用空间连续性模型来描述;它可以是基于变差函数的地统计学中的参数形式的模型,也可以是非参数形式的,如多点模拟[3]或伪遗传方法。

研究者可将单个空间模型应用在整个定义域上,借此假设Z是一个平稳过程。它表示相同的统计属性适用于整个定义域。许多种地理统计方法提供了将这些平稳性假设的条件放宽的方法。

该框架中,可以区分两个建模目标:

  1. 估计Z(x)的值,通常使用累积分布函数f(z,x)期望值中位数众数。其通常表现为估计问题。
  2. 考虑每个位置上的每种可能结果,从整个概率密度函数f(z,x)采样。其方法通常是建立几个替代性的Z,称为实现(realization)。考虑在N维网格节点(或像素)中离散化的域。每个实现都是完整N联合分布函数的样本
该方法承认插值问题存在多种解法。每个实现都被视作真实变量可能取值的情形。然后,所有与之相关的工作流都在考虑实现的集成,从而考虑允许概率预测的预测集成。因此,地统计学常用于在求解逆问题时生成或更新空间模型。[4][5]

地理统计估计和多重实现方法都存在许多方法。一些参考书提供了该学科的全面概述。[6][2][7][8][9][10][11][12][13][14][15]

方法

估计

克里金法

克里金法(Kriging)是一类地统计技术,用于在缺少观测值的位置,根据在附近位置的观察值插入随机场的值(例如高程z)。

贝叶斯估计

贝叶斯推断是一种统计推断方法,它使用贝叶斯定理在获得更多证据或信息时更新概率模型。贝叶斯推断在地统计学中日益重要。[16]贝叶斯估计通过空间过程实现克里金法,最常见的是高斯过程,并使用贝叶斯定理更新该过程以计算其后验概率。另有高维贝叶斯地统计学。[17]

有限差分法

考虑到概率守恒原理,循环差分方程(有限差分方程)可与格网相结合,计算概率,对地质构造的不确定性进行量化。此过程是马尔可夫链和贝叶斯模型的数值替代方法。[18]

模拟

定义和工具

参见

参考文献

外部链接

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.