热门问题
时间线
聊天
视角

貝葉斯統計

来自维基百科,自由的百科全书

Remove ads
Remove ads

貝葉斯統計是一種基於貝葉斯概率的統計學理論,以貝葉斯統計的開創人,數學家長老會牧師托馬斯·貝葉斯命名。法國數學家皮埃爾-西蒙·拉普拉斯後來在托馬斯·貝葉斯工作的基礎上進一步發展了貝葉斯統計,並發明了拉普拉斯平滑等現代貝葉斯統計中常用的方法[1]

貝葉斯統計學認為概率是一種基於個人經驗、之前的相關實驗結果等先驗信息而得出的信念度英語Credence (statistics)degree of belief),沒有必要經由反覆實驗驗證。這一點也是貝葉斯學派與頻率學派的主要不同之處,因為頻率學派認為概率是經反覆的實驗後頻率應達到的極限大數定理[2][3]

貝葉斯統計的核心方法是基於貝葉斯定理,用取得的數據(可記為)對根據個人經驗等先驗信息對希望研究的命題或假設(可記為先驗概率進行修正,得到後驗概率[4][5]

在過去很長一段時間,貝葉斯統計並不受學界的重視。一方面,長期流行的很多統計學方法都是基於頻率學派的,因此很長時間內統計學界都是以頻率學派占主導地位。頻率學派常常批評貝葉斯統計中的先驗概率過於主觀。另一方面,貝葉斯統計方法往往涉及複雜的計算,這在電子計算機尚不普及的時代是一個很大的問題。不過,隨計算機技術的不斷發展以及馬爾可夫鏈蒙特卡洛等新算法的出現,21世紀貝葉斯統計已在統計學中占愈發重要的地位[3][6]

Remove ads

貝葉斯公式

假設有兩個事件,分別記為是人們希望探究的一個命題假設(例如「丟出一枚硬幣之後正面朝上的概率是50%」),而則是有關的實驗證據(例如丟出20次硬幣後的每次硬幣正面朝上還是朝下的結果)[7]

該公式中,被稱為先驗概率,是基於經驗、先前的實驗結果等得出的一個概率。則是根據證據修正後的概率,稱為後驗概率。貝葉斯統計學中一般需要求得最大後驗概率,即後驗概率的眾數[3]被稱為似然函數,因為基於似然原則英語equivalent principleequivalent principle,即條件概率等於條件B下A的似然。一般被稱為「證據」,可由全概率定理算出,求出在所有的不同情況下聯合概率之和[3][7]

概率分布一般是連續的,這往往造成的計算涉及到複雜的積分。不過,使用變分貝葉斯方法或馬爾可夫鏈蒙特卡洛等方法可在不涉及計算的情況下求得所需的最大後驗概率,在這種情況下可以只考慮先驗概率與似然函數對後驗概率的影響(符號代表「成正比」):

Remove ads

貝葉斯推斷

貝葉斯統計的思想可用於貝葉斯推斷中。貝葉斯推斷,顧名思義,是指使用貝葉斯統計的思想進行統計推斷,即利用樣本推斷總體情況的過程。貝葉斯推斷與頻率學派推斷的一個最大不同是頻率學派認為總體的頻率是一定的,只是我們無法準確知道,但在樣本量足夠大時頻率會逐漸收斂於真實的概率值[8]。因此頻率學派推斷不會為假設或者模型的參數賦予一個概率。例如頻率學派推斷中不會有「下次投硬幣正面朝上概率為1/2這種說法」,而是會認為,經過不斷大量實驗,(如果這枚硬幣是完美均勻的),那麼正面朝上的頻率會逐漸趨近於1/2。因此頻率學派推斷一般是給出統計量以及其置信區間[9]:1-3。貝葉斯推斷則會先基於經驗、先前的研究等先驗知識給假設賦予一個先驗概率(例如實驗者基於經驗認為的硬幣朝上的概率)或者先驗概率分布,再使用實驗得到的證據來修正這個先驗概率,得到更契合證據的後驗概率或後驗概率分布。後驗概率或後驗概率分布即貝葉斯推斷的輸出[3][10]

因為貝葉斯推斷的這一特點,貝葉斯推斷很適合用來做探索性數據分析英語exploratory data analysis,意即揭示數據的結構的分析過程[11]

Remove ads

參見

參考文獻

Loading content...
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads