司徒顿t分布(Student's t-distribution),简称t 分布,在概率论及统计学中用于根据小样本来估计总体呈正态分布且标准差未知的期望。若总体标准差已知,或是样本数足够大时(依据中心极限定理渐进正态分布),则应使用正态分布来进行估计。其为对两个样本期望差异进行显著性测试的学生t检验之基础。
Quick Facts 参数, 值域 ...
学生t 分布
概率密度函数 |
累积分布函数 |
参数 |
自由度 |
---|
值域 |
|
---|
概率密度函数 |
|
---|
累积分布函数 |
其中:是超几何函数 |
---|
期望 |
时为,时未定义 |
---|
中位数 |
|
---|
众数 |
|
---|
方差 |
时为,否则为无穷大 |
---|
偏度 |
时为 |
---|
峰度 |
时为 |
---|
熵 |
- : 双Γ函数,
- : 贝塔函数
|
---|
矩生成函数 |
未定义 |
---|
特征函数 |
- : 第二类修正贝塞尔函数
|
---|
Close
学生t 检验改进了Z检验(Z-test),因为在小样本中,Z检验以总体标准差已知为前提,Z检验用在小样本会产生很大的误差,因此必须改用学生t 检验以求准确。但若在样本数足够大(普遍认为超过30个即足够)时,可依据中心极限定理近似正态分布,以Z检验来求得近似值,
在总体标准差数未知的情况下,不论样本数量大或小皆可应用t检验。在待比较的数据有三组以上时,因为误差无法被压低,此时可以用方差分析(ANOVA)代替t检验。
t 分布的推导最早由德国大地测量学家弗里德里希·罗伯特·赫尔默特于1876年提出,并由德国数学家雅各布·鲁洛斯证明。[1][2]
英国人威廉·戈塞于1908年再次发现并发表了t分布,当时他还在爱尔兰都柏林的吉尼斯啤酒酿酒厂工作。酒厂虽然禁止员工发表一切与酿酒研究有关的成果,但允许他在不提到酿酒的前提下,以笔名发表t 分布的发现,所以论文使用了“学生”(Student)这一笔名。之后t检定以及相关理论经由罗纳德·费希尔发扬光大,为了感谢戈塞的功劳,费希尔将此分布命名为学生t 分布(Student's t)。[3]