卡方检验

历史

在十九世纪，统计分析方法主要被用于生物数据分析。当时主流意见认为正态分布普遍适用于此类数据，例如乔治·比德尔·艾里爵士以及梅里曼教授（英语：Mansfield Merriman），而卡尔·皮尔森在他1900年的论文中就针对了他们的研究数据作出了指正^[2]。

直到十九世纪末期，皮尔森指出了部分数据具有明显的偏态，正态分布并不是普遍适用。为了更好地对这些观察数据进行建模，皮尔森在1893年至1916年发表的系列文章^[3]^[4]^[5]^[6]中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——皮尔森分布族（英语：Pearson Distribution）。同时，他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后，使用拟合优度检验技术来评价模型和实验数据间的拟合优度。

著名的卡方检验

皮尔森卡方检验

在1900年，皮尔森发表了著名的关于 $\chi ^{2}$ 检验的文章^[2]，该文章被认为是现代统计学的基石之一^[7]。在该文章中，皮尔森研究了拟合优度检验：

假设实验中从总体中随机取样得到的 $n$ 个观察值被划分为 $k$ 个互斥的分类，这样每个分类都有一个对应的实际观察次数 $x_{i}$ （ $i=1,2,...,k$ ）。研究人员会对实验中各个观察值落入第 $i$ 个分类的概率 $p_{i}$ 的分布提出零假设，从而获得了对应所有第 $i$ 分类的理论期望次数 $m_{i}=np_{i}$ 以及限制条件

\sum _{i=1}^{k}{p_{i}}=1

以及

\sum _{i=1}^{k}{m_{i}}=\sum _{i=1}^{k}{x_{i}}=n

。

皮尔森提出，在上述零假设成立以及 $n$ 趋向 $\infty$ 的时候，以下统计量的极限分布趋向 $\chi ^{2}$ 分布。

X^{2}=\sum _{i=1}^{k}{\frac {(x_{i}-m_{i})^{2}}{m_{i}}}=\sum _{i=1}^{k}{\frac {x_{i}^{2}}{m_{i}}}-n

皮尔森首先讨论零假设中所有分类的理论期望次数 $m_{i}$ 均为足够大且已知的情况，同时假设各分类的实际观测次数 $x_{i}$ 均服从正态分布。皮尔森由此得到当样本容量 $n$ 足够大时， $X^{2}$ 趋近服从自由度为 $(k-1)$ 的 $\chi ^{2}$ 分布。

然而，皮尔森在讨论当零假设中的理论期望次数 $m_{i}$ 未知并依赖于必须由样本去进行估计的若干参数的情况时，记 $m_{i}$ 为实际的理论期望次数以及 $m'_{i}$ 为估计的理论期望次数，认为

X^{2}-X'^{2}=\sum _{i=1}^{k}{\frac {x_{i}^{2}}{m_{i}}}-\sum _{i=1}^{k}{\frac {x_{i}^{2}}{m'_{i}}}

的值通常为正且足够小以至于可以忽略。皮尔森总结为，如果我们认为 $X'^{2}$ 也服从自由度为 $(k-1)$ 的 $\chi ^{2}$ 分布，那么由此近似带来的误差通常足够小并不会对实际决策的结论带来实质性的影响。这个结论在应用层面造成了长达20年的争论，直到费歇尔在1922年及1924年的论文^[8]^[9]发表后才暂告一段落。

Remove ads

其他卡方检验例子

皮尔逊卡方检验，是最有名的卡方检验，有两种用途，分别是“适配度检验”（Goodness of Fit test）以及“独立性检验”。科学文章中，当提到卡方检验而没有特别注明是哪一种时，通常便是指皮尔逊卡方检验。
叶氏连续性修正（英语：Yates's correction for continuity）：当用皮尔逊卡方检验做独立性检验时，若任何一个栏位的期望次数小于5，会使“近似于卡方分配”的假设不可信，统计值会系统性地偏高，导致过度地拒绝零假设，此时可以做叶氏连续性修正。
Cochran–Mantel–Haenszel chi-squared test（英语：Cochran–Mantel–Haenszel statistics）。
McNemar's test（英语：McNemar's test），用于某些 2 × 2 表格的配对样本。
Tukey's test of additivity（英语：Tukey's test of additivity）。
portmanteau test（英语：portmanteau test），用于时间数列分析里检验自相关的存在。
似然比检验（英语：likelihood ratio test），在建立统计模型时，用于检验证据是否支持某个复杂的模型（使用变量较多）优于简单的模型（使用变量较少），其中简单模型所使用的变量全部包含于复杂模型中。

Remove ads

运用

建立零假设（Null Hypothesis），即认为观测值与理论值的差异是由于随机误差所致；
确定数据间的实际差异，即求出卡方值；
如卡方值大于某特定概率标准（即显著性差异）下的理论值，则拒绝虚无假说，即实测值与理论值的差异在该显著水平下是显著的。

历史

著名的卡方检验

皮尔森卡方检验

其他卡方检验例子

运用

相关条目

外部链接

脚注

Wikiwand - on