热门问题
时间线
聊天
视角

U-統計量

来自维基百科,自由的百科全书

Remove ads

U-統計量是統計學中一類特定的、具有對稱性的統計量,它在估計理論中扮演重要角色。名稱中的「 U」為不偏(unbiased)之意。在初等統計學中,U-統計量與最小變異數不偏估計量 (UMVUE) 有密切聯繫。

U-統計量的一個重要性是,對機率分布來說,其可估計參數的最小變異數不偏估計量 是一個U-統計量。 [1][2] 因此通過研究U-統計量的一般性質,可以系統地了解這些估計量的統計學性質。[3]

U-統計量在無母數統計中尤其重要,不少用於估計和統計檢定的統計量,在形式上都是U-統計量。U-統計量通常具有良好的漸近常態性,這方便了基於它的統計推論。 近年來,U-統計量在研究複雜的隨機過程隨機網絡類型數據的隨機性質方面,發揮了作用。[4][5][6]

目前,統計學家們對U-統計量性質的了解,幾乎全都基於Hoeffding發表於1948年的經典論文[7]。在這篇論文裡,Hoeffding給出了U-統計量最重要的性質——它的ANOVA分解

Remove ads

定義

定義 為一個函數,其具有對稱性,即交換任意 的位置, 的值保持不變。對隨機變數 ,基於 的U-統計量定義如下:

這裡, 稱為U-統計量的核函數(Kernel function),而核函數的維數 稱為該U-統計量的度(degree)[8]

Remove ads

兩樣本U-統計量

定義 為一個函數,其對 分別具有對稱性,即交換任意 的位置或交換任意 的位置, 的值保持不變(但不能隨意交換 )。對隨機變數 ,基於 的兩樣本U-統計量定義如下:

目前在機器學習中,最常見的情形是 ,例如能量距離最大平均差異(MMD)

Remove ads

Hoeffding的ANOVA分解定理

定理表述

Hoeffding的ANOVA分解定理是現代U-統計量理論的基礎。[9]為表述該定理,定義:。 對所有 ,定義投影函數

然後定義正交化投影函數

,等等,每一個 都定義為相應的 減去之前定義過的所有 ,直至最後一個函數

Hoeffding的ANOVA分解定理的內容是:

Remove ads

分解項的性質

所有的正交化投影函數 都滿足:

因此,所有的分解項之間是互不相關的[9],並且度為 的分解項之平均的階為 .

在大多數應用中,一個U-統計量的ANOVA分解中最重要的是前一項或前兩項。根據分解項的性質,可以得到如下的兩項ANOVA分解式:

Remove ads

定理應用

  • U-統計量的漸近常態性是Hoeffding的ANOVA分解定理的簡單推論。具體而言,有如下結論:記 ,則:

同時,分解定理也指出了應該如何正確地一階逼近U-統計量的變異數,和對其進行t-標準化

  • 由該定理出發,在不同強度的假設條件下,可以用一項或兩項的Edgeworth展開來高精度地逼近U-統計量的分布。[8][10][11][12]


Remove ads

具體例子

  • 度為1的例子:令 ,則U-統計量 是樣本均值。
  • 度為2的例子:令 ,則U-統計量

稱為「平均成對偏差」。

  • 另一個度為2的例子:令 ,則U-統計量有如下變形:

這正是人們熟知的樣本變異數

  • 度為3的例子:樣本偏度定義中的分子項:

展開後可以寫成一個U-統計量。

  • 在機器學習中,用核函數方法進行一樣本或兩樣本無母數統計檢定時,檢定統計量是一個能量距離最大平均差異(MMD),兩者均為U-統計量或表達式包含兩樣本U-統計量。[13][14]
Remove ads

參見

參考文獻

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads