ARIMA模型

来自维基百科,自由的百科全书

統計學計量經濟學所使用的時間序列分析中,自回歸單整移動平均模型ARIMA)和季節性ARIMA模型SARIMA)分別是自回歸移動平均模型(ARMA)向非平穩序列和周期性變化情形的推廣。所有這些模型都是為了更好地理解時間序列並預測未來值而擬合的。這種推廣的目的是使模型儘可能貼合數據。具體而言,ARMA模型假設序列具有平穩性,即其期望值不隨時間變化。若序列存在趨勢(但方差/自協方差保持恆定),可通過「差分」操作消除趨勢,[1] 得到平穩序列。這種操作實現了對ARMA模型的推廣,對應著ARIMA中的「單整」(integrated)部分。類似地,周期性變化可通過「季節性差分」操作消除。[2]

組成部分

與ARMA模型類似,ARIMA中的「自回歸」(AR)部分表示感興趣的演進變量對其前期值進行回歸;「移動平均」(MA)部分表示回歸誤差是同時期及過去不同時期誤差項的線性組合[3];而「單整」(I)部分表示數據值已被替換為當前值與前一值的差值(即通過差分操作消除趨勢)。

根據Wold分解定理英語Wold's decomposition theorem[4][5][6],ARMA模型足以描述規則(亦稱純非確定性[6])的廣義平穩時間序列。這促使我們在應用ARMA模型前,需先通過差分等操作將非平穩序列轉化為平穩形式。[7]

若時間序列包含可預測子過程(亦稱純正弦或復值指數過程[5]),則該可預測成分在ARIMA框架下被視為具有非零均值但周期性(即季節性)的成分,可通過季節性差分操作予以消除。

數學形式

非季節性ARIMA模型通常記作 ARIMA(p, d, q),其中參數 p, d, q 為非負整數:p 表示自回歸部分的階數(時間滯後項的數量),d 表示單整的階數(即數據經過差分操作的次數,即當前值與過去值相減的次數),q 表示移動平均部分的階數。季節性ARIMA模型通常記作 ARIMA(p, d, q)(P, D, Q)m,其中大寫字母 P, D, Q 分別對應季節性部分的自回歸、單整(差分)、移動平均項,m 表示每個季節包含的周期數。[8][2] 當三個參數中有兩個為0時,模型名稱可根據非零參數簡化,省略縮寫中的「AR」、「I」或「MA」。例如,可簡稱為AR(1)稱為I(1)稱為 MA(1)

給定時間序列數據 Xt,其中 t 為整數索引且 Xt 為實數,則 模型可表示為:

或等價形式:

其中滯後算子為模型自回歸部分的參數,為移動平均部分的參數,誤差項。通常假設誤差項獨立同分布的隨機變量,服從均值為0的常態分布

若多項式存在一個重數為 d單位根(即因子出現d次),則可將其重寫為:

此時,ARIMA(p, d, q) 過程通過 p = p'−d 體現此多項式分解特性,其數學形式為:

該過程本質上是自回歸多項式包含 d 個單位根的 ARMA(p+d, q) 過程。(這也是為何當 d > 0 時,嚴格符合ARIMA模型的過程不具有廣義平穩性的原因。)

進一步推廣後,模型形式為:

此時定義了一個具有漂移項的 ARIMA(p, d, q) 過程。


參見

參考文獻

延伸閱讀

外部連結

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.