热门问题
时间线
聊天
视角
格兰杰因果关系
检查两个时间序列之间是否存在基于时间滞后效应的因果关系的统计方法 来自维基百科,自由的百科全书
Remove ads
格兰杰因果关系检验(英语:Granger causality test)是一种假设检验的统计方法,检验一组时间序列是否为另一组时间序列的原因。它的基础是回归分析当中的自回归模型。回归分析通常只能得出不同 变量间的同期 相关性;自回归模型只能得出同一 变量前后期 的相关性;但诺贝尔经济学奖得主克莱夫·格兰杰(Clive Granger)于1969年论证[1],在自回归模型中透过一系列的检验进而揭示不同变量之间的时间落差相关性是可行的。
格兰杰本人在其2003年获奖演说中强调了其引用的局限性,以及“很多荒谬论文的出现”(Of course, many ridiculous papers appeared)。格兰杰因果关系检验的结论只是一种统计估计,不是真正意义上的因果关系,不能作为肯定或否定因果关系的根据。同时,格兰杰因果关系检验也有一些不足之处,如并未考虑干扰因素的影响,也未考虑时间序列间非线性的相互关系。一些基于格兰杰因果关系检验的方法一定程度上解决了这些问题[2]。
Remove ads
核心概念
过去值(lag value,或称落後期):同一变项比当期时间上更早的值。例如:当期为,它的落後期为。
格兰杰因果关系检验的基本观念在于:未来的事件不会对目前与过去产生因果影响,而过去的事件才可能对现在及未来产生影响。[1][3] 也就是说,如果我们试图探讨变量是否对变量有因果影响,那么只需要估计的落後期是否会影响的现在值,因为的未来值不可能影响的现在值。假如在控制了变量的过去值以后, 变量的过去值仍能对Y 变量有显著的解释能力,我们就可以称能“Granger 影响”(Granger-cause)。[4]
Remove ads
最初版的格兰杰因果测试,有时候无法发现真正的因果关系。因为虽然对于认定因果关系而言,理论上还必须控制其他可能的干扰因素,但在 Granger 最初提出这套因果测试的版本中,并未纳入干扰变量的分析,而是假设其他可能解释变量的信息包含在的落后值中。如果事实上带来因果关系的是第三变量(干扰变量),亦即若事实上操控 并无法改变 ,格兰杰因果关系的零假设仍然可能被拒绝。因此标准版的格兰杰因果测试结果可能会产生误导性。
1980年代由其他的计量经济学家对Granger测试加以修改、扩充,将可能的第三(以上)变量纳入测试,成为使用面板資料的向量自回归模型(英语:panel data VAR model)。相较于最初版的 Granger 测试,扩充版可以产生更有效的估计结果。[4]
Remove ads
步骤描述
- 准备工作:一开始要用几个落後期来建立模型,需要研究者的评估,通常使用 赤池信息量准则(英语:Akaike information criterion、簡稱AIC) 或 贝氏讯息量准则(英语:Bayesian information criterion、簡稱BIC)来判断。
- 格兰杰因果关系检验的第一步是建立用的落後期来预测的自回归模型。此际,如果时间序列是广义平稳的,则可以直接使用落後期。如果不平稳,就必须对不平稳的时间序列先做(一阶或更多阶)差分,直到得出平稳时间数列。
- 如果发现 的某期落後期 (1) 在回归分析中具有显著性(根据 t检验的p值来判断),且 (2) 这期落後期加入模型后可提高回归模型的解释力(根据回归分析的F检验),这个落後期便被留在模型中。
- 然后进一步加入(或Δ)的滞后期来扩充回归模型。关于平稳时间序列的要求、某期落後期留在模型中的条件,同上述的处理。
- 当且仅当(充分必要)没有任何解释变项(或Δ)的落後期被留在模型中,便无法拒绝无格兰杰因果关系的零假设。
研究人员希望发现明显的证据,比如是的格兰杰原因但反之不成立,便能做出因果关系的推论。然而在实际操作中也可能会发现没有变量是对方的格兰杰原因,或者和两个变量互为格兰杰原因。
1. 令和为广义平稳序列。如要检测非的格兰杰原因之零假设,首先引入的落後期建立的自回归模型(AR model on ):
- 所有的落後期中:(1) 在回归分析中具有显著性(根据t-统计值的p值来判断)的,且 (2) 这期落後期加入模型后可提高回归模型的解释力(根据回归分析的F检验)的--将被留在模型中。表示的是变量滞后期中检验为显著的时间上最早一个。
2. 接着,引入的落後期建立增广回归模型:
- 所有的落後期中:(1) 在回归分析中具有显著性(根据t检验的p值来判断)的,且 (2) 这期落後期加入模型后可提高回归模型的解释力(根据回归分析的F检验)的--将被留在模型中。在以上增广回归模型中,代表变量落後期中检验为显著的时间上最早一个,则是变量落後期中检验为显著的时间上最近一个。
3. 如果没有任何的落後期被留在模型中,无格兰杰因果关系的零假设就成立。
Remove ads
一些统计软件可以执行Granger causality test。例如:Stata、SPSS[5]、EViews[6]、R语言。
这里举个R语言中lmtest程序库里grangertest()指令的例子:
Granger causality test Model 1: fii ~ Lags(fii, 1:5) + Lags(rM, 1:5) Model 2: fii ~ Lags(fii, 1:5) Res.Df Df F Pr(>F) 1 629 2 634 5 2.5115 0.02896 * --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Granger causality test Model 1: rM ~ Lags(rM, 1:5) + Lags(fii, 1:5) Model 2: rM ~ Lags(rM, 1:5) Res.Df Df F Pr(>F) 1 629 2 634 5 1.1804 0.3172
模型1检验将滞后的rM从解释FII的回归模型中移除是否可行,答案是不可行的(因为p值 = 0.02896)。但由模型1和模型2的组合可发现从解释rM的模型中移除FII的落後期是可能的。我们可以由此断定rM是FII的格兰杰原因,反之则不成立。
Remove ads
延伸
承继著回归模型的基本性质,格兰杰因果关系分析也假设实际值与预测值之间的误差呈正态分布,若实际现象不呈正态分布将严重影响推论的有效性。
Hacker & Hatemi-J (2006)发展出一种不必在乎误差项是否呈正态分布的格兰杰因果关系研究方法[7]。这种方法在财金分析上特别实用, 因为许多金融变量不服从正态分布。[8]
近来,Hacker & Hatemi-J (2012)又进一步改善之,提出一种非对称的因果关系检验模型,据说可以区分正向与负向影响的因果影响。[9]
时变格兰杰因果关系:将格兰杰因果关系扩展到动态的时变性质,可以更细致地了解时间序列数据中的因果关系是如何随时间演变的。[10]该方法使用递归技术,如前向展(FE)、滚动(RO)和递归演化(RE)窗口,以克服传统格兰杰因果检验的局限性,并理解不同时期因果关系的变化。[11]这一方法的核心是 Stata 中的 "tvgc "命令。[10]经验应用,如涉及以太坊交易费用和经济子系统的数据,突出了经济关系随时间变化的动态性质。[12]
Remove ads
注脚
相关条目
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads