置信區間

在統計學中，一個概率樣本的置信區間（英語：confidence interval，CI），是對產生這個樣本的總體的參數分佈（parametric distribution）中的某一個未知參數值，以區間形式給出的估計。相對於點估計（point estimation）用一個樣本統計量來估計參數值，置信區間還蘊含了估計的精確度的資訊。在現代機器學習中越來越常用的信賴集合（confidence set）概念是置信區間在多維分析的推廣^[1]。

置信區間在頻率學派中間使用，其在貝氏統計中的對應概念是可信區間（英語：credible interval）（credible interval）。兩者建立在不同的概念基礎上的，貝氏統計將分佈的位置參數視為隨機變量，並對給定觀測到的數據之後未知參數的後驗分布進行描述，故無論對隨機樣本還是已觀測數據，構造出來的可信區間，其可信水準都是一個合法的概率^[2]；而置信區間的置信水平，只在考慮隨機樣本時可以被理解為一個概率。

[1]

[2]

置信區間

定義

對隨機樣本的定義

對觀測到的數據的定義

例子

例1：正態分佈，已知總體方差 $\sigma ^{2}$

例2：正態分佈，未知總體方差 $\sigma ^{2}$

例3：兩個獨立正態樣本

常見誤解

構造法

與參數檢驗的聯繫

參考文獻

參考書目

Wikiwand - on

定義