Loading AI tools
假說檢定的一種 来自维基百科,自由的百科全书
卡方檢定(Chi-Squared Test或 Test)是一種統計量的分佈在虛無假說成立時近似服從卡方分佈(分佈)的假設檢定。在沒有其他的限定條件或說明時,卡方檢定一般代指的是皮爾森卡方檢定。在卡方檢定的一般運用中,研究人員將觀察量的值劃分成若干互斥的分類,並且使用一套理論(或虛無假說)嘗試去說明觀察量的值落入不同分類的概率分佈的模型。而卡方檢定的目的就在於去衡量這個假設對觀察結果所反映的程度。
在十九世紀,統計分析方法主要被用於生物數據分析。當時主流意見認為正態分佈普遍適用於此類數據,例如喬治·比德爾·艾里爵士以及梅里曼教授,而卡爾·皮爾森在他1900年的論文中就針對了他們的研究數據作出了指正[1]。
直到十九世紀末期,皮爾森指出了部分數據具有明顯的偏態,正態分佈並不是普遍適用。為了更好地對這些觀察數據進行建模,皮爾森在1893年至1916年發表的系列文章[2][3][4][5]中提出了一個包含正態分佈以及眾多偏態分佈的連續概率分佈族——皮爾森分佈族。同時,他指出數據統計分析的步驟應該是在從皮爾森分佈族中選取合適的分佈來進行建模後,使用適合度檢定技術來評價模型和實驗數據間的適合度。
在1900年,皮爾森發表了著名的關於檢定的文章[1],該文章被認為是現代統計學的基石之一[6]。在該文章中,皮爾森研究了適合度檢定:
假設實驗中從總體中隨機取樣得到的個觀察值被劃分為個互斥的分類,這樣每個分類都有一個對應的實際觀察次數()。研究人員會對實驗中各個觀察值落入第個分類的概率的分佈提出虛無假說,從而獲得了對應所有第分類的理論期望值次數以及限制條件
皮爾森提出,在上述虛無假說成立以及趨向的時候,以下統計量的極限分佈趨向分佈。
皮爾森首先討論虛無假說中所有分類的理論期望值次數均為足夠大且已知的情況,同時假設各分類的實際觀測次數均服從正態分佈。皮爾森由此得到當樣本容量足夠大時,趨近服從自由度為的分佈。
然而,皮爾森在討論當虛無假說中的理論期望值次數未知並依賴於必須由樣本去進行估計的若干參數的情況時,記為實際的理論期望值次數以及為估計的理論期望值次數,認為
的值通常為正且足夠小以至於可以忽略。皮爾森總結為,如果我們認為也服從自由度為的分佈,那麼由此近似帶來的誤差通常足夠小並不會對實際決策的結論帶來實質性的影響。這個結論在應用層面造成了長達20年的爭論,直到費歇爾在1922年及1924年的論文[7][8]發表後才暫告一段落。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.