热门问题
时间线
聊天
视角

霍夫丁不等式

集中不等式的一种 来自维基百科,自由的百科全书

Remove ads

概率論中,霍夫丁不等式(英語:Hoeffding's inequality)適用於有界的隨機變量,提供了有界獨立隨機變量之和偏離其期望值超過一定數量的概率的上限,即。霍夫丁不等式在1963年由瓦西里·霍夫丁(Wassily Hoeffding)證明。

霍夫丁不等式是吾妻不等式麥克迪亞米德不等式英語McDiarmid's inequality的一個特例。它類似於切爾諾夫界,但往往不那麼尖銳,特別是當隨機變量的方差很小時。它與伯恩斯坦不等式相似,但無法與之相比。

Remove ads

闡述

設有兩兩獨立的一系列隨機變量 。假設對所有的 變量幾乎必然滿足 考慮這些隨機變量的總和, 然後霍夫丁不等式指出,對於所有 有:

這裡 期望

值得注意的是,若 為抽樣獲得,該不等式仍成立;但在這種情況下,隨機變量不再是獨立的。這一說法的證據可以在 Hoeffding [1]的論文中找到。對於抽樣的稍微更好的上界,可參見Serfling(1974)[2]的論文。

Remove ads

另一種形式

設有兩兩獨立的一系列隨機變量,那麼這n個隨機變量的經驗期望:

滿足以下的不等式[3]

Remove ads

特別地

假定對於所有的 都有 。當 是獨立的伯努利隨機變量時,儘管它們不必服從相同分布,我們可以得到如下更為簡潔的不等式:

上式對於所有的 成立。這樣我們就得到了增強版的切爾諾夫界。它更為通用,因為它允許取值介於 0 和 1 之間的隨機變量,但效果較差,因為當隨機變量方差較小時,切爾諾夫界給出了更好的尾邊界。

次高斯隨機變量的一般情況

霍夫丁不等式的證明可以推廣到任何次高斯分布。

回想一下,隨機變量 服從次高斯分布英語sub-Gaussian distribution,是否存在 使得, 成立。

對於任意有界變量 足夠大),有 。對於任意的 ,取 則有 所以每個有界變量都是亞高斯變量。

對於隨機變量 ,下式範數是有限的,當且僅當 是亞高斯:

然後設 零均值獨立亞高斯隨機變量,霍夫丁不等式的一般版本指出:

其中 且為絕對常數[4]

Remove ads

證明

霍夫丁界的證明與切爾諾夫界等集中不等式類似[5]。主要區別在於使用霍夫丁引理

假設 是一個真正的隨機變量,那麼幾乎必然 。然後

使用這個引理,我們可以證明霍夫丁不等式。如定理陳述,假設 個獨立隨機變量, 幾乎必然 。設 那麼對於 , 聯立馬爾可夫不等式 的獨立性可得:

此上界對於 的值是最佳的,最小值在指數 範圍內。這可以通過優化二次曲線輕鬆完成,給出

為這個值 編寫上面的界限,我們得到所需的界限:

Remove ads

用法

霍夫丁不等式可用於推導置信區間。我們考慮一枚硬幣,它以概率 顯示正面,以概率 顯示反面。我們拋硬幣 次,生成 個樣本  (即獨立同分布伯努利隨機變量)。硬幣正面朝上的預期次數是 。此外,硬幣正面至少出現k次的概率可以通過以下表達式精確量化:

其中 次拋硬幣的正面數量。當 表示某個 時,霍夫丁不等式將這個概率限制為一個在 中呈指數小的項:

由於這個界限在均值的兩側都成立,霍夫丁不等式意味着我們看到的頭部數量集中在其均值周圍,尾部呈指數級小。

作為「觀察到的」平均值,該概率可以解釋為一個置信區間的顯著性水平 (出錯的概率),這個置信區間是中心為 鄰域

解出  : [6] 因此,我們至少需要 份樣本才能獲得 (1- α)-置信區間 。因此,獲取置信區間的成本在置信水平方面是次線性的,在精度方面是二次的。請注意,有更有效的方法來估計置信區間。

Remove ads

參見

參考文獻

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads