热门问题
时间线
聊天
视角
卡方分布
機率分布 来自维基百科,自由的百科全书
Remove ads
卡方分布(英语:chi-square distribution[2], χ²-distribution,或写作χ²分布)是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布,是统计推断中应用最为广泛的概率分布之一,例如假设检验和置信区间的计算。
Remove ads
由卡方分布延伸出来皮尔逊卡方检验常用于:
- 样本某性质的比例分布与总体理论分布的拟合优度(例如某行政机关男女比是否符合该机关所在城镇的男女比);
- 同一总体的两个随机变量是否独立(例如人的身高与交通违规的关联性);
- 二或多个总体同一属性的同素性检验(意大利面店和寿司店的营业额有没有差距)。(详见皮尔逊卡方检验)
Remove ads
数学定义
若k个随机变量、……、是相互独立且符合标准正态分布的随机变量(数学期望为0、方差为1),则随机变量Z的平方和
被称为服从自由度为 k 的卡方分布,记作
Remove ads
性质
可以在文章右上角的表中看到更多卡方分布的性质。
卡方分布的概率密度函数为:
其中,当时。这里Γ代表Gamma函数。
卡方分布的累积分布函数为:
- ,
其中γ(k,z)为不完全Γ函数
在大多数涉及卡方分布的书中都会提供它的累积分布函数的对照表。此外许多表格计算软件如OpenOffice.org Calc和Microsoft Excel中都包括卡方分布函数。
自由度为k的卡方变量的平均值是k,方差是2k。 卡方分布是伽玛分布的一个特例,它的熵为:
其中是双伽玛函数。
Remove ads
当Gamma变量 频率(λ)为1/2时,α的2倍为卡方变量之自由度。 即:
卡方变量之期望=自由度 卡方变量之方差=两倍自由度
Remove ads
由定义可得,独立卡方变量之和同样服从卡方分布。特别地,若分别独立服从自由度为的卡方分布,那么它们的和服从自由度为的卡方分布。
Remove ads
若k个随机变量、……、是相互独立,符合标准正态分布的随机变量,则它们与均值之间偏差的平方和
其中均值
它的平方正比于自由度为1的卡方分布,即
Remove ads
卡方分布表
p-value = 1- p_CDF.
χ2越大,p-value越小,则可信度越高。通常用p=0.05作为阈值,即95%的可信度。
常用的χ2与p-value表如下:
Remove ads
参考文献
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads