热门问题
时间线
聊天
视角
中位數
數值集合中,不大於一半元素,也不小於另一半元素的數 来自维基百科,自由的百科全书
Remove ads
統計學上,中位數(英語:Median),又稱中央值[1]、中值,是一個樣本、種群或機率分布中之一個數值,其可將數值集合劃分爲數量相等的上下兩部分。對於有限的數集,可以通過把所有觀察值高低排序後找出正中間的一個作爲中位數。如果觀察值有偶數個,則中位數不唯一,通常取最中間的兩個數值的平均數作爲中位數。
此條目需要補充更多來源。 (2014年7月21日) |
一個數集中最多有一半的數值小於中位數,也最多有一半的數值大於中位數。如果大於和小於中位數的數值個數均少於一半,那麽數集中必有若干值等同於中位數。
設連續隨機變數X的分布函數為F(X),那麼滿足條件P(X≤m)=F(m)=1/2的數稱為X或分布F的中位數。
對於一組有限個數的數據來說,其中位數是這樣的一種數:這群數據的一半的數據比它大,而另外一半數據比它小。
計算有限個數的數據的中位數的方法是:把所有的同類數據按照大小的順序排列。如果數據的個數是奇數,則中間那個數據就是這群數據的中位數;如果數據的個數是偶數,則中間那2個數據的算術平均值就是這群數據的中位數。
Remove ads
公式
實數按大小順序(順序,降序皆可)排列為、
實數數列的中位數 為
其中 odd number 表示奇數,even number 表示偶數。
Remove ads
中位數特性
中位數在敘述統計學上和平均數、眾數並列為數據的集中趨勢。三者的位置排序亦對應著偏度的正負偏態意義。一般而言,平均數是最常被使用做為數據的集中趨勢,但如果有極端值存在,平均數的代表性降低,也就所謂的「男人女人平均一顆睪丸」的問題,因此在有極端值的狀況下,中位數是比較好的集中趨勢代表。因此,在各國的每人所得分布上,通常以中位數代表集中趨勢,而非平均數[2]。
中位數通常出現在敘述統計學和無母數統計,有母數的統計分析很少提及。中位數為集中趨勢時,對應的離散趨勢係數為平均絕對離差(Mean absolute deviation, MAD)或是四位位距(Q3 - Q1)。不過如果論及母體中位數的統計量時,仍需根據統計分析對抽樣分配的要求,尋找母體中位數統計量的期望值與變異數,再依照點估計的充分、不偏、效率、一致性進行討論。而母體中位數的統計量通常是樣本中位數。因此,樣本中位數的期望值與變異數就值得被討論,進行基礎研究。
Remove ads
常態分配下的平均數、中位數、眾數都是同一個位置。目前最為世人熟知的是平均數的抽樣分配會是常態分配,期望值為母體平均數且變異數為母體變異數()。統計學對常態分配的母體平均數統計量說明甚多,並發展完善。那麼中位數可基於機率分配模擬器和數值分析發展,在n個獨立隨機變數來自常態分配可生成n個隨機樣本,則E(樣本中位數)=且Var(樣本中位數)=,其中,k(n)受到樣本個數(n)影響。當樣本個數介於2至200時,兩者的關係不明顯,但可計算出樣本個數和k(n)的關聯表[3]。
如果樣本個數超過200,但不超過1000時,兩者有明顯的關係,並且受到樣本個數是否為奇數或偶數影響。此時可使用迴歸分析尋找兩者的關係。
1. 樣本個數為偶數,迴歸式為k(n) = 0.0000148965 + 1.5599936862 / n。
2. 樣本個數為奇數,迴歸式為k(n) = 0.0000084608 + 1.5674001064 / n。
由此可得到樣本中位數的變異數和母體常態分配的變異數形成穩定的對應關係[4]。
Remove ads
參考文獻
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads