負二項分布(Negative binomial distribution)是統計學上一種描述在一系列独立同分布的伯努利试验中,成功次数达到指定次数(记为)时失败次数的離散概率分布。比如,如果我们定义掷骰子随机变量值为时成功,所有为失败,这时我们反复掷骰子直到1出现3次(成功次数),此时非1数字出现次数的概率分布即为负二项分布。
事实速览 参数, 值域 ...
负二项分布
不同來源對负二项分布的定義略有差異:隨機變量的最小可能取值可能是(僅計失敗的次數,或反之),亦可能是(總次數,不論成敗);參數可能表示每次試驗成功的概率,也可能表示失敗的概率;試驗的終止條件可能是成功次或失敗次。[1] |
概率质量函數
|
参数 |
(實) (實) |
---|
值域 |
|
---|
概率质量函数 |
|
---|
累積分布函數 |
|
---|
期望值 |
|
---|
眾數 |
|
---|
方差 |
|
---|
偏度 |
|
---|
峰度 |
|
---|
矩生成函数 |
|
---|
特徵函数 |
|
---|
关闭
帕斯卡分布(Pascal distribution,来自布莱兹·帕斯卡 (Blaise Pascal))和波利亚分布(Polya distribution,又称罐子模型,来自喬治·波利亞 (George Pólya))均是负二项分布的特例。在工程、气候等领域中经常用“负二项分布”或“帕斯卡分布”来描述变量为整数的情况,而使用“波利亚分布”来描述取到实数值的情况。
对于“相关的离散事件”("associated discrete events")的发生,例如龙卷风爆发,相比于泊松分布,波利亚分布由于允许其平均值和方差不同,而能够给出更精确的模型。在流行病学中,它已被用于模拟传染病的疾病传播,其中可能的继发感染数量可能因个体和环境而异[2]。 更一般地说,由于正协方差项,事件具有正相关的事件导致比独立事件更大的方差可能是合适的。
“负二项分布”与“二项分布”的区别在于:“二项分布”是固定试验总次数的独立试验中,成功次数k的分布;而“负二项分布”是所有到r次成功时即终止的独立试验中,失败次数k的分布。
术语“负二项式”可能是因为出现在分布的概率质量函数公式中的某个二项式系数可以用负数更简单地写出[3]。