热门问题
时间线
聊天
视角
計算統計學
来自维基百科,自由的百科全书
Remove ads
計算統計學或統計計算是統計學與計算機科學之間的紐帶,是指通過計算方法實現的統計方法。計算統計學是計算科學中專門針對統計學數學科學的領域,目前還在迅速發展,因此有人呼籲在普通統計教育中教授更廣泛的計算概念。[1]

與傳統統計學一樣,其目標是將原始數據轉化為知識,[2]而重點在於計算機密集型統計方法,例如樣本量非常大的情形與非齊性數據集等。[2]
「計算統計學」(computational statistics)與「統計計算」(statistical computing)兩詞常常混用,國際統計計算協會前主席Carlo Lauro建議加以區分,「統計計算」可定義為「計算機科學在統計學中的應用」,「計算統計學」則定義為「在計算機上實現統計方法的算法的設計,包括前計算機時代無法想像的算法(如自助法、蒙特卡洛方法等),並應對用分析難以解決的問題」。[3]
「計算統計學」也可指計算密集型統計方法,如重抽樣、馬爾可夫鏈蒙特卡洛、局部回歸、核密度估計、人工神經網絡與廣義加性模型。
Remove ads
歷史
雖然計算統計學在今天得到了廣泛應用,但在統計學界被接受的歷史其實相對較短。大多數情況下,統計領域的奠基人在開發計算統計方法時依賴數學與漸進逼近。[4]
統計學領域中,「計算機」(computer,即字面上的「計算用的機器」)一詞首次出現於Robert P. Porter於1891年發表在《美國統計協會雜誌》(Journal of the American Statistical Association)中的一篇文章,文章討論了赫爾曼·霍利里思的機器在美國第11次人口普查中的使用情況。[來源請求]赫爾曼·霍利里思的機器又叫穿孔制表機(tabulating machine),是電動機械學機器,用於協助匯總存儲在打孔卡上的信息。發明者赫爾曼·霍利里思(1860年2月29日 – 1929年11月7日)是美國商人、發明家、統計學家,穿孔制表機於1884年獲得專利,用在了美國1890年的人口普查中。1880年普查大約有5000萬人參與,用了7年多時間才完成制表工作;而1890年普查時,人口有超過6200萬,卻只用了不到一年時間。這標誌著機械化計算統計與半自動數據處理系統時代的開端。 1908年,威廉·戈塞進行了現在廣為人知的蒙特卡洛模擬,從而發現了學生t-分布。[5]在計算方法的幫助下,他還繪製了經驗分布圖與相應的理論分布圖。計算機給模擬帶來了革命性變化,使複製戈塞的實驗變得不過是一種練習。[6][7]
後來,科學家們提出了生成偽隨機性偏差的計算方法,用逆累積分布函數或接受-拒絕方法將均勻偏差轉換為其他分布形式,並開發了馬爾可夫鏈蒙特卡洛的狀態空間方法。[8]1947年,蘭德公司首次嘗試全自動生成隨機數,生成的隨機數表整合為《百萬亂數表》,於1955年出版。
到20世紀50年代中期,已經有多篇文章和專利提出了隨機數生成器的設備,[9]其開發源於用隨機數進行模擬和統計分析中其他基本組成的需要,其中最著名的是ERNIE,它產生的隨機數決定了英國發行的彩票債券Premium Bond的中獎者。1958年,約翰·圖基發明了大折刀(jackknife),是一種在非標準條件下減少樣本參數估計偏差的方法。[10]這就需要計算機操作,至此,計算機使很多繁瑣的統計研究變得可行。[11]
Remove ads
方法
蒙特卡洛法是依靠重複隨機抽樣獲得數值結果的統計方法,其概念是利用隨機性解決原則上確定性的問題,常用於物理學與數學問題,在難以使用其他方法是往往有效。蒙特卡洛法主要用於三類問題:最優化、數值積分與從概率分布中生成抽樣。
馬爾可夫鏈蒙特卡洛方法從連續隨機變量中創建樣本,概率分布與已知函數成正比。這些樣本可用於估計變量的積分,如其期望值或方差。包含的步驟越多,樣本分布就越接近實際預期分布。
應用
協會
- 國際統計計算協會
另見
參考文獻
閱讀更多
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads