【摘要】在进行ADF检验时如何确定一个最优的滞后长度一直是研究者们关注的问题。最近的研究表明,不同的滞后长度选择方法对ADF检验的统计推断影响很大。本文在已有研究的基础上,模拟了更为一般的ARIMA(0,1,q)过程,分析了在不同的数据生成过程、检验式以及样本容量下,各种滞后长度选择方法对ADF检验功效和实际检验水平的影响,最后认为修正的信息准则通常具有较合理的实际检验水平,而从一般到特殊法具有更为稳健的ADF检验性质。
关键词 ADF检验 滞后长度 信息准则 修正的信息准则 从一般到特殊法
Abstract: The optimal lag length in estimating Augmented Dickey-Fuller statistics have been concentrated on for years. Previous research indicated that different leg length selection models affect a lot on the statistical inference of ADF test. Based on all the researches available, this paper simulates a more general ARIMA(0,1,q) process and analyzes the influence of lag length selection criterions to the size and power of the ADF test with different data generating processes, ADF regressions, and sample sizes. Finally, it is proved that the Modified Information Criteria always shows a more proper size and the General to Special Criteria has more robust properties in ADF test.
Keywords: ADF test Lag Length Information Criteria Modified Information Criteria General to Specific
一、引 言
随着时间序列非平稳问题的提出,单位根检验目前已经成为宏观数据建模前首先要进行的工作。为此,Dickey和Fuller(1979, 1981)[1]提出了著名的ADF检验,并推导了当时间序列yt是ARIMA(p,1,0)过程且满足检验式中滞后差分项长度k ≥ p时ADF检验统计量的极限分布。然而,在实际运用ADF检验时,真实的p是不知道的,因此需要研究者自己确定k。总的来说滞后长度的选择方法主要分为两类。一类是经验法(rule of thumb)。这种方法是研究者任意选择k,或将k表示为样本容量的函数。另外一类就是根据数据来选择k。这种方法主要有Akaike(1973)信息准则(Akaike Information Criteria,以下简写为AIC)、Schwarz(1978)信息准则(Schwarz Information Criteria,以下简写为SIC)、Hannan和Quinn(1979)信息准则(Hannan and Quinn Information Criteria,以下简写为HQIC)、从一般到特殊法则(General to Special Criteria,以下简写为GSC)、从特殊到一般法则(Special to General Criteria,以下简写为SGC)等。此外,在后来的研究中,Weber(1998)又提出了非自相关法则(No Autocorrelation Criteria),即从一个比较简化的模型开始,逐渐增加滞后差分项直到残差不能拒绝非自相关的原假设。2001年他又提出了一种考虑滞后长度k在特定区间[kmin, kmax]内的从特殊到一般法,该方法运用了一系列F检验,确定的最优滞后长度是使得比其大的直到kmax的所有滞后差分项对应参数的联合检验均不显著的最小的k。
然而很多学者都指出,ADF检验的结论对滞后长度k的选择非常敏感。Phillips和Perron(1988)模拟发现当真实数据生成过程为随机游走时,随着检验式中差分项滞后长度的增加,会导致ADF检验的功效和水平都降低。另外,Schwert(1989)、Agiakloglou和Newbold(1992)以及Harris(1992)等也指出不同的滞后长度选择方法对ADF检验的实际水平和功效有明显影响。这就引发了关于不同方法确定滞后长度是否以及如何影响ADF统计量极限分布的讨论。
其实早在ADF检验提出不久,Said和Dickey(1984)就证明了对阶数未知的ARMA过程检验单位根时,只要检验式中的滞后长度k满足一定的上界条件和下界条件,仍可以用ADF统计量来检验原过程中单位根的存在。紧接着,Lewis和Reinsel(1985)提出了一个与Said和Dickey(1984)下界条件等价的条件,并证明当满足该下界条件和Said和Dickey(1984)上界条件时检验式中滞后差分项的参数估计量具有一致性和渐近正态性。Hannan和Deistler(1988)[2]则提出了各信息准则确定一个平稳可逆的ARMA过程滞后长度的若干性质。
随后,Ng和Perron(1995)明确解答了哪些滞后长度选择方法满足这些上界与下界条件,以及运用它们确定滞后长度如何影响ADF检验统计量极限分布的问题。首先,该文讨论了检验式中滞后长度k不满足Said和Dickey(1984)或Lewis和Reinsel(1985)下界条件对ADF检验统计量极限分布的影响。他们认为这时仍渐近服从标准DF分布,同时滞后差分项的参数估计量仍具有一致性,但其向真值收敛的速度要小于 (T为样本容量,下同)。接着,Ng和Perron(1995)将滞后长度的选择准则与上述极限分布条件相比较,证明了在ADF检验中,利用各信息准则确定的滞后长度时不满足下界条件,但统计量仍服从标准DF分布。而当运用GSC时,如果我们确定的滞后长度最大值满足上界条件和Lewis和Reinsel(1985)下界条件,则滞后差分项的参数估计量具有一致性和渐近正态性,可以用t统计量、F统计量和Wald统计量检验其显著性。最后通过模拟重点讨论了当数据生成过程为ARIMA(0,1,1)时各方法确定的滞后长度以及对ADF检验功效和实际检验水平的影响。
类似地,Hall(1994)还从一个纯自相关过程入手,给出了当真实数据生成过程是一个ARIMA(p,1,0)过程时,ADF统计量服从DF分布应满足的假设条件。并讨论了不同滞后长度选择准则对ADF统计量极限分布的影响。他认为当运用AIC、SIC、HQIC以及GSC确定滞后长度时,满足上述条件,因此ADF统计量仍服从标准DF分布,而运用SGC时不能满足上述条件,从而ADF统计量的极限分布发生变化,不再服从标准DF分布。最后对于不同的ARIMA(p,1,0)过程,模拟了基于各种准则的ADF检验功效与实际检验水平。
此外,随着研究的不断深入,学者们又从一些新的角度对滞后长度选择的问题进行了探讨。比如Ng和Perron(2001)将Elliott、Rothenberg、和Stock(1996)[3]以及Dufour和King(1991)[4]提出的局部GLS退势法与Perron和Ng(1996)[5]提出的修正的单位根检验统计量相结合,提出了一系列MGLS统计量来检验单位根。在这种检验中,他们首度运用了一系列修正的信息准则(Modified Information Criteria,以下简写为MIC)来确定滞后长度,并给出了其局部渐近性质。MIC与一般信息准则的本质区别就在于它考虑到检验式中一阶滞后项参数估计量的偏差与滞后长度是高度相关的,进而通过加入一个包含一阶滞后项参数估计量的修正项对信息准则拟和不足的问题进行了一定的校正。Ng和Perron(2005)又重点探讨了在运用各种信息准则时,可用观测值个数(即调整的样本容量)、计算均方误差时的自由度、以及计算惩罚因子(penalty factor)时使用的观测值个数对滞后长度选择的影响。结果表明在有限样本下AIC与SIC选择的滞后长度对上述三个因素非常敏感。
综上所述,已有的研究主要集中在对ARIMA(p,1,0)和ARIMA(0,1,1) 过程进行单位根检验时,各方法确定的滞后长度以及相应的单位根检验的功效与实际水平上。而对ARIMA(0,1,q)即含有单位根的高阶移动平均过程的研究则比较少。另外,也鲜见MIC与其他方法比较的相关研究。针对这些问题,本文对Hall(1994),Ng和Perron(1995, 2001)的方法和结论进行扩展,在接下来的部分中用蒙特卡罗模拟的方法在有限样本下研究一个更一般的ARIMA(0,1,q)过程,对模拟结果中不同滞后期选择方法尤其是MIC的优劣进行比较,以期找到一种能应用在更一般的数据生成过程中,并使ADF检验推断更真实可靠的滞后长度选择方法。最后一部分是对全文的总结,并提出了一些滞后项选择及ADF检验中需要注意的问题。
二、模拟结果
根据Hall(1994),Ng和Perron(1995, 2001)文章中的结论,运用信息准则和GSC确定滞后长度时,ADF统计量仍服从标准DF分布。其中运用GSC时滞后差分项以的速度收敛于真值,从而使ADF检验有一个更优的有限样本性质。MIC是对通常信息准则的修正。因此本文选取AIC、SIC、MAIC、MSIC以及GSC五种方法来确定ADF检验式中的滞后长度。重点考察小样本下当误差项为高阶移动平均过程时基于各准则的ADF检验功效和实际检验水平的特征,以及MIC与其他方法相比对ADF检验统计推断的影响和滞后长度选择的异同。各方法确定滞后长度的原理如下:
首先,AIC与SIC具有相似的形式,选择的滞后长度k满足使(1)式的值最小。其中AIC准则中CT=2,SIC准则中CT=logT,表示估计方程的误差均方,它往往随着滞后长度的增加而下降。是ADF检验式中的解释变量个数,它等于滞后差分项个数k加上常数项以及时间趋势项,会随滞后长度的增加而变大,代表了对过度拟和的惩罚。因此选择k使(1)最小意味着在较少参数和较小的残差平方和之间做出选择。
(1)
另外,Ng和Perron(2001)提出了一系列的修正的信息准则即MIC。其选择的滞后长度是使得目标方程(2)的值最小的k,依据CT的表达式不同MIC又分别称为MAIC与MSIC。
(2)
它与一般的信息准则的不同就是增加了一个修正因子,其表达式为:
(3)
其中是ADF检验式中一阶滞后项的参数估计量。Ng和Perron(2001)证明会随着ADF检验式中滞后差分项个数k的增加而减小,尤其当数据生成过程的移动平均部分含有负根时,这种减小更加明显,因此可以有效地校正一般信息准则拟和不足的问题。
GSC则是在ADF检验式中选取r=j+m个滞后差分项,并通过对最后m个参数 (i=1, …, m)的显著性进行联合检验来完成的,其中j∈[0, jmax]。该检验的Wald形式为:
(4)
其中 (5)
(6)
它代表所有解释变量的方差协方差矩阵,是中右下方m×m阶的块矩阵。
代表该检验式回归函数的误差均方,其中代表回归式的残差。
检验规则为:j从最大的取值jmax开始,依次降低其取值直到(4)式表示的统计量显著。该统计量服从自由度为m的χ2分布。基于显著性水平α,滞后长度k的取值为① k = j +1,当是统计量所有值中第一个大于临界值的值时。② k = 0,当统计量所有值均小于临界值时。
为了考察误差项为高阶移动平均过程时ADF检验中滞后长度的选择问题,我们对形如(7)式的数据生成过程共10种情况运用上述五种方法选择滞后长度继而进行ADF检验。
(7)
其中L是滞后因子,ut是白噪声,y0=0。
10种数据生成过程如下:①θ1=0.8, θ2=0.0, θ3=0.0, θ4=0.0; ②θ1=0.5, θ2=0.0, θ3=0.0, θ4=0.0; ③θ1=-0.5, θ2=0.0, θ3=0.0, θ4=0.0; ④θ1=-0.8, θ2=0.0, θ3=0.0, θ4=0.0; ⑤θ1=0.8, θ2=0.5, θ3=0.0, θ4=0.0; ⑥θ1=0.5, θ2=0.3, θ3=0.0, θ4=0.0; ⑦θ1=-0.5, θ2=0.3, θ3=0.0, θ4=0.0; ⑧θ1=-0.8, θ2=0.5, θ3=0.0, θ4=0.0; ⑨θ1=-0.8, θ2=-0.5, θ3=0.0, θ4=0.0; ⑩θ1=0.5, θ2=0.3, θ3=0.2, θ4=0.1。这10种情况描述了误差项移动平均部分的根在个数、大小、正负等方面的不同情形。
ADF检验的原假设H0: ρ = 1;备择假设H1: ρ 1。ADF检验式如下:
(a)
(b)
为考察不同情形下ADF检验的功效和实际检验水平,我们对每种数据生成过程分别取β=1、0.95、0.85,用Rats6.2模拟样本容量T=100时基于两种检验式(a)和(b)的上述检验过程以及T=250时基于检验式(a)的上述检验过程。对每种情况重复10000次,计算ADF统计量小于临界值的概率,同时记录每次选择的滞后长度,最后计算滞后长度的均值和标准差。当真实数据生成过程是单位根过程即β = 1时,ADF统计量小于临界值的概率就是犯弃真错误的概率,即实际检验水平。而当真实数据生成过程为平稳过程即β 1时,ADF统计量小于临界值的概率则是1-犯取伪错误的概率,即检验功效。这里运用GSC确定滞后长度时取m=1,即计算单个参数的t统计量,显著性水平取5%,各准则的最大滞后长度取kmax = 20[6]。
根据模拟结果,我们重点比较了各方法在滞后长度选择及其相应的ADF检验功效和实际检验水平方面的异同,并考察了误差项为高阶移动平均时的各种数据生成过程、不同检验式以及样本容量对滞后长度选择及ADF检验统计推断的影响,从而对Hall(1994),Ng和Perron(1995)的结论做了一定的补充。
注:表中所列和分别代表模拟10000次时各准则确定的(1-βL)yt滞后长度的均值及其标准差。
对同一数据生成过程而言,基于各种信息准则的实际检验水平由小到大分别为:MAIC、MSIC、AIC、SIC。尤其是当DGP的移动平均部分含有较大负根时,AIC与SIC的检验尺度扭曲非常严重,在样本容量为100时甚至达到了50%以上(见表2)。而这时MAIC犯第一类错误的概率都能保持在10%以下。此时基于GSC的检验尺度扭曲要小于一般的信息准则,但仍大于修正的信息准则,在其他情况下通常介于AIC与SIC之间。从检验功效来看,基于SIC的检验功效最高,在移动平均部分中含有较大负根时其检验功效非常接近于1。其次是基于AIC与GSC的检验功效,且前者的略高。基于修正的信息准则的检验功效最低,尤其是在样本容量为100时更加明显(见表2)。
表2 ADF检验的功效和实际检验水平检验式(a) T=100
β ARIMA(p,d,q) θ1 θ2 θ3 θ4 AIC SIC MAIC MSIC GSC
1.0 ARIMA(0,1,1) 0.8 0.0 0.0 0.0 0.0566 0.0569 0.0239 0.0211 0.0596
1.0 ARIMA(0,1,1) 0.5 0.0 0.0 0.0 0.0611 0.0674 0.0313 0.0248 0.0629
1.0 ARIMA(0,1,1) -0.5 0.0 0.0 0.0 0.1008 0.1580 0.0516 0.0676 0.0981
1.0 ARIMA(0,1,1) -0.8 0.0 0.0 0.0 0.2436 0.4257 0.0605 0.0929 0.1856
1.0 ARIMA(0,1,2) 0.8 0.5 0.0 0.0 0.0604 0.0531 0.0218 0.0175 0.0594
1.0 ARIMA(0,1,2) 0.5 0.3 0.0 0.0 0.0586 0.0590 0.0275 0.0241 0.0604
1.0 ARIMA(0,1,2) -0.5 0.3 0.0 0.0 0.1187 0.1863 0.0576 0.0815 0.1043
1.0 ARIMA(0,1,2) -0.8 0.5 0.0 0.0 0.2558 0.4599 0.0885 0.1378 0.1899
1.0 ARIMA(0,1,2) -0.8 -0.5 0.0 0.0 0.1939 0.3480 0.0373 0.0407 0.1438
1.0 ARIMA(0,1,4) 0.5 0.3 0.2 0.1 0.0665 0.0859 0.0253 0.0391 0.0587
0.95 ARIMA(1,0,1) 0.8 0.0 0.0 0.0 0.2668 0.2911 0.1367 0.1240 0.2593
0.95 ARIMA(1,0,1) 0.5 0.0 0.0 0.0 0.3005 0.3619 0.1877 0.1448 0.2930
0.95 ARIMA(1,0,1) -0.5 0.0 0.0 0.0 0.5000 0.6536 0.2728 0.3463 0.4383
0.95 ARIMA(1,0,1) -0.8 0.0 0.0 0.0 0.7933 0.9547 0.3115 0.3824 0.6256
0.95 ARIMA(1,0,2) 0.8 0.5 0.0 0.0 0.2454 0.2687 0.1097 0.0910 0.2485
0.95 ARIMA(1,0,2) 0.5 0.3 0.0 0.0 0.2787 0.2861 0.1467 0.1453 0.2535
0.95 ARIMA(1,0,2) -0.5 0.3 0.0 0.0 0.5321 0.7436 0.3024 0.4025 0.4388
0.95 ARIMA(1,0,2) -0.8 0.5 0.0 0.0 0.7758 0.9536 0.3680 0.4797 0.6081
0.95 ARIMA(1,0,2) -0.8 -0.5 0.0 0.0 0.8408 0.9769 0.3570 0.3809 0.6770
0.95 ARIMA(1,0,4) 0.5 0.3 0.2 0.1 0.2791 0.3917 0.1399 0.1938 0.2445
0.85 ARIMA(1,0,1) 0.8 0.0 0.0 0.0 0.6912 0.7664 0.4479 0.5570 0.5993
0.85 ARIMA(1,0,1) 0.5 0.0 0.0 0.0 0.8031 0.8715 0.6137 0.6142 0.6787
0.85 ARIMA(1,0,1) -0.5 0.0 0.0 0.0 0.9308 0.9875 0.6248 0.7227 0.7701
0.85 ARIMA(1,0,1) -0.8 0.0 0.0 0.0 0.9847 0.9998 0.5978 0.6308 0.8492
0.85 ARIMA(1,0,2) 0.8 0.5 0.0 0.0 0.5836 0.6846 0.3394 0.4195 0.5292
0.85 ARIMA(1,0,2) 0.5 0.3 0.0 0.0 0.7371 0.7730 0.5239 0.5962 0.6230
0.85 ARIMA(1,0,2) -0.5 0.3 0.0 0.0 0.9333 0.9912 0.6485 0.7690 0.7563
0.85 ARIMA(1,0,2) -0.8 0.5 0.0 0.0 0.9767 0.9999 0.6594 0.7188 0.8403
0.85 ARIMA(1,0,2) -0.8 -0.5 0.0 0.0 0.9889 1.0000 0.7004 0.7062 0.8886
0.85 ARIMA(1,0,4) 0.5 0.3 0.2 0.1 0.6566 0.8509 0.3887 0.4404 0.5444
注:表中所列数值为模拟10000次时按照各种准则得到的ADF统计量小于Fuller(1976, 表8.5.2, 第373页)5%显著性水平下临界值的概率。
2.不同DGP的影响
滞后长度方面,当数据生成过程 (Data Generating Procedure, 以下简写为DGP)中移动平均部分根的绝对值向1趋近或根的个数增加时,各准则选择的滞后长度都会增加,标准差也相应增加。另外,当数据生成过程的移动平均部分相同时,是否含有单位根对平均滞后长度的选择影响不大。同时,基于AIC、SIC与GSC得到的滞后长度标准差也很稳健,而基于MIC的滞后长度标准差随着数据生成过程逐渐平稳有增加的趋势(见表1、3、5)。
检验功效方面,当DGP的移动平均部分含有负根时,基于各准则的ADF检验功效通常会大于只含有正根的情况。大多数情况下,原过程移动平均部分中正根个数的增加会使检验功效降低,而负根个数的增加会使检验功效增加。当根的个数相同时,绝对值较大的正根会降低检验功效,而绝对值较大的负根反而会增加检验功效。这一点在样本容量为250时表现的更为明显(见表6)。
表3 滞后长度的均值和标准差检验式(b) T=100
β ARIMA(p,d,q) θ1 θ2 θ3 θ4 AIC SIC MAIC MSIC GSC
1.0 ARIMA(0,1,1) 0.8 0.0 0.0 0.0 5.69 3.30 2.81 1.20 5.04 4.06 2.63 2.59 8.37 5.48
1.0 ARIMA(0,1,1) 0.5 0.0 0.0 0.0 3.08 2.94 1.43 0.73 3.15 3.68 1.53 2.39 7.09 6.36
1.0 ARIMA(0,1,1) -0.5 0.0 0.0 0.0 2.67 2.96 1.08 0.76 4.78 4.07 3.75 3.20 6.73 6.45
1.0 ARIMA(0,1,1) -0.8 0.0 0.0 0.0 3.12 3.30 0.92 1.17 8.85 4.78 7.92 4.41 6.88 6.19
1.0 ARIMA(0,1,2) 0.8 0.5 0.0 0.0 7.57 3.33 4.35 1.33 6.54 4.08 3.89 2.80 9.25 4.79
1.0 ARIMA(0,1,2) 0.5 0.3 0.0 0.0 4.00 2.94 2.19 0.85 3.92 3.84 2.20 2.37 7.37 5.99
1.0 ARIMA(0,1,2) -0.5 0.3 0.0 0.0 1.89 2.92 0.28 0.67 4.21 4.08 3.12 3.20 6.31 6.67
1.0 ARIMA(0,1,2) -0.8 0.5 0.0 0.0 2.91 3.17 0.65 1.06 7.64 4.87 6.49 4.38 6.89 6.26
1.0 ARIMA(0,1,2) -0.8 -0.5 0.0 0.0 3.22 3.76 0.71 1.43 11.05 5.43 0.64 5.32 7.32 6.08
1.0 ARIMA(0,1,4) 0.5 0.3 0.2 0.1 5.30 3.76 1.59 1.32 4.86 4.30 2.44 2.78 8.57 5.49
0.95 ARIMA(1,0,1) 0.8 0.0 0.0 0.0 5.69 3.27 2.78 1.91 4.90 3.58 2.52 2.08 8.31 5.38
0.95 ARIMA(1,0,1) 0.5 0.0 0.0 0.0 3.05 2.90 1.39 0.71 2.98 3.23 1.22 1.72 6.82 6.32
0.95 ARIMA(1,0,1) -0.5 0.0 0.0 0.0 2.30 2.74 0.85 0.73 4.44 3.70 3.55 2.74 6.52 6.54
0.95 ARIMA(1,0,1) -0.8 0.0 0.0 0.0 1.94 2.91 0.38 0.79 8.20 4.95 7.25 4.49 6.34 6.57
0.95 ARIMA(1,0,2) 0.8 0.5 0.0 0.0 7.49 3.27 4.31 1.33 6.48 3.60 3.86 2.42 9.22 4.77
0.95 ARIMA(1,0,2) 0.5 0.3 0.0 0.0 3.91 2.78 2.16 0.88 3.64 3.20 2.14 1.82 7.21 5.94
0.95 ARIMA(1,0,2) -0.5 0.3 0.0 0.0 1.58 2.82 0.18 0.56 3.82 3.75 2.81 2.71 6.17 6.79
0.95 ARIMA(1,0,2) -0.8 0.5 0.0 0.0 2.20 2.75 0.43 0.83 6.44 4.95 5.31 4.33 6.27 6.46
0.95 ARIMA(1,0,2) -0.8 -0.5 0.0 0.0 2.14 3.30 0.25 0.72 9.50 6.06 9.16 5.93 6.94 6.28
0.95 ARIMA(1,0,4) 0.5 0.3 0.2 0.1 5.23 3.80 1.56 1.32 4.73 3.72 2.42 2.34 8.52 5.54
0.85 ARIMA(1,0,1) 0.8 0.0 0.0 0.0 5.57 3.21 2.71 1.21 4.85 3.80 2.29 2.30 8.15 5.40
0.85 ARIMA(1,0,1) 0.5 0.0 0.0 0.0 2.91 2.79 1.33 0.70 3.11 3.47 0.89 1.80 6.65 6.26
0.85 ARIMA(1,0,1) -0.5 0.0 0.0 0.0 1.87 2.80 0.45 0.66 5.35 4.49 4.34 3.59 6.24 6.71
0.85 ARIMA(1,0,1) -0.8 0.0 0.0 0.0 1.07 2.56 0.06 0.31 6.50 5.92 6.14 5.68 5.97 6.89
0.85 ARIMA(1,0,2) 0.8 0.5 0.0 0.0 7.37 3.22 4.27 1.31 6.39 3.82 3.69 2.56 9.13 4.79
0.85 ARIMA(1,0,2) 0.5 0.3 0.0 0.0 3.84 2.80 2.10 0.87 3.86 3.54 2.00 1.97 7.09 5.91
0.85 ARIMA(1,0,2) -0.5 0.3 0.0 0.0 1.30 2.74 0.09 0.41 4.25 4.26 3.16 3.15 6.11 6.83
0.85 ARIMA(1,0,2) -0.8 0.5 0.0 0.0 2.00 2.76 0.44 0.67 4.69 5.69 3.65 4.98 6.17 6.64
0.85 ARIMA(1,0,2) -0.8 -0.5 0.0 0.0 1.77 2.73 0.38 0.62 4.40 6.60 4.18 6.40 6.24 6.69
0.85 ARIMA(1,0,4) 0.5 0.3 0.2 0.1 5.09 3.72 1.52 1.28 4.82 3.90 2.23 2.42 8.35 5.46
注:表中所列和分别代表模拟10000次时各准则确定的(1-βL)yt滞后长度的均值及其标准差。
表4 ADF检验的功效和实际检验水平检验式(b) T=100
β ARIMA(p,d,q) θ1 θ2 θ3 θ4 AIC SIC MAIC MSIC GSC
1.0 ARIMA(0,1,1) 0.8 0.0 0.0 0.0 0.0683 0.0713 0.0215 0.0230 0.0732
1.0 ARIMA(0,1,1) 0.5 0.0 0.0 0.0 0.0717 0.0667 0.0208 0.0194 0.0811
1.0 ARIMA(0,1,1) -0.5 0.0 0.0 0.0 0.1557 0.2455 0.0376 0.0478 0.1218
1.0 ARIMA(0,1,1) -0.8 0.0 0.0 0.0 0.4732 0.7289 0.0860 0.0911 0.3232
1.0 ARIMA(0,1,2) 0.8 0.5 0.0 0.0 0.0713 0.0721 0.0197 0.0238 0.0758
1.0 ARIMA(0,1,2) 0.5 0.3 0.0 0.0 0.0655 0.0702 0.0225 0.0239 0.0744
1.0 ARIMA(0,1,2) -0.5 0.3 0.0 0.0 0.1734 0.2349 0.0453 0.0531 0.1355
1.0 ARIMA(0,1,2) -0.8 0.5 0.0 0.0 0.4325 0.7176 0.1078 0.1201 0.2823
1.0 ARIMA(0,1,2) -0.8 -0.5 0.0 0.0 0.6082 0.8692 0.1187 0.1162 0.3691
1.0 ARIMA(0,1,4) 0.5 0.3 0.2 0.1 0.0809 0.1010 0.0340 0.0346 0.0807
0.95 ARIMA(1,0,1) 0.8 0.0 0.0 0.0 0.1451 0.1560 0.0180 0.0079 0.1550
0.95 ARIMA(1,0,1) 0.5 0.0 0.0 0.0 0.1567 0.1886 0.0266 0.0067 0.1758
0.95 ARIMA(1,0,1) -0.5 0.0 0.0 0.0 0.3566 0.5263 0.0936 0.1033 0.2971
0.95 ARIMA(1,0,1) -0.8 0.0 0.0 0.0 0.7728 0.9476 0.2001 0.2215 0.5420
0.95 ARIMA(1,0,2) 0.8 0.5 0.0 0.0 0.1279 0.1517 0.0146 0.0065 0.1453
0.95 ARIMA(1,0,2) 0.5 0.3 0.0 0.0 0.1402 0.1530 0.0203 0.0102 0.1460
0.95 ARIMA(1,0,2) -0.5 0.3 0.0 0.0 0.4159 0.5712 0.1123 0.1332 0.3281
0.95 ARIMA(1,0,2) -0.8 0.5 0.0 0.0 0.7185 0.9253 0.2600 0.2989 0.7400
0.95 ARIMA(1,0,2) -0.8 -0.5 0.0 0.0 0.8172 0.9812 0.2599 0.2612 0.5068
0.95 ARIMA(1,0,4) 0.5 0.3 0.2 0.1 0.1633 0.2137 0.0290 0.0191 0.1404
0.85 ARIMA(1,0,1) 0.8 0.0 0.0 0.0 0.3684 0.4516 0.1061 0.0663 0.3430
0.85 ARIMA(1,0,1) 0.5 0.0 0.0 0.0 0.4848 0.5911 0.1435 0.0782 0.4354
0.85 ARIMA(1,0,1) -0.5 0.0 0.0 0.0 0.7934 0.9352 0.3420 0.3933 0.6109
0.85 ARIMA(1,0,1) -0.8 0.0 0.0 0.0 0.9697 0.9993 0.5447 0.5616 0.7438
0.85 ARIMA(1,0,2) 0.8 0.5 0.0 0.0 0.2965 0.3920 0.0589 0.0499 0.2995
0.85 ARIMA(1,0,2) 0.5 0.3 0.0 0.0 0.4015 0.4425 0.1305 0.0563 0.3571
0.85 ARIMA(1,0,2) -0.5 0.3 0.0 0.0 0.8176 0.9627 0.3786 0.4273 0.6134
0.85 ARIMA(1,0,2) -0.8 0.5 0.0 0.0 0.9454 0.9978 0.6149 0.6812 0.5055
0.85 ARIMA(1,0,2) -0.8 -0.5 0.0 0.0 0.9761 0.9998 0.7112 0.7192 0.7704
0.85 ARIMA(1,0,4) 0.5 0.3 0.2 0.1 0.3714 0.5606 0.1180 0.0473 0.3048
注:表中所列数值为模拟10000次时按照各种准则得到的ADF统计量小于Fuller(1976, 表8.5.2, 第373页)5%显著性水平下临界值的概率。
1.0 ARIMA(0,1,1) 0.8 0.0 0.0 0.0 7.47 2.88 4.11 1.66 7.42 2.89 4.11 1.20 10.13 5.05
1.0 ARIMA(0,1,1) 0.5 0.0 0.0 0.0 3.63 2.43 1.96 0.70 3.55 2.39 1.97 0.69 7.96 6.28
1.0 ARIMA(0,1,1) -0.5 0.0 0.0 0.0 3.49 2.35 1.89 0.69 3.65 2.44 2.21 0.90 8.03 6.39
1.0 ARIMA(0,1,1) -0.8 0.0 0.0 0.0 7.01 2.98 3.75 1.25 8.05 3.18 5.57 2.26 9.73 5.16
1.0 ARIMA(0,1,2) 0.8 0.5 0.0 0.0 9.41 2.79 5.96 1.26 9.33 2.82 5.91 1.30 11.22 4.34
1.0 ARIMA(0,1,2) 0.5 0.3 0.0 0.0 4.49 2.33 2.82 0.73 4.47 2.28 2.78 0.80 8.39 5.95
1.0 ARIMA(0,1,2) -0.5 0.3 0.0 0.0 3.05 2.30 1.27 0.96 3.20 2.34 1.68 1.02 7.68 6.46
1.0 ARIMA(0,1,2) -0.8 0.5 0.0 0.0 6.32 3.01 2.95 1.25 7.29 3.18 4.68 2.07 9.48 5.46
1.0 ARIMA(0,1,2) -0.8 -0.5 0.0 0.0 9.08 2.92 5.49 1.55 10.42 3.33 7.99 3.00 10.91 4.44
1.0 ARIMA(0,1,4) 0.5 0.3 0.2 0.1 7.71 3.17 3.45 1.93 7.58 3.17 3.53 1.88 10.57 4.90
0.95 ARIMA(1,0,1) 0.8 0.0 0.0 0.0 7.45 2.84 4.13 1.19 7.59 3.38 3.97 1.67 10.11 5.02
0.95 ARIMA(1,0,1) 0.5 0.0 0.0 0.0 3.56 2.38 1.92 0.70 3.82 3.00 2.18 0.94 8.01 6.29
0.95 ARIMA(1,0,1) -0.5 0.0 0.0 0.0 3.26 2.41 1.67 0.68 5.25 3.46 3.85 1.89 7.87 6.50
0.95 ARIMA(1,0,1) -0.8 0.0 0.0 0.0 4.89 3.04 1.78 1.32 12.00 4.31 10.73 3.99 8.79 5.88
0.95 ARIMA(1,0,2) 0.8 0.5 0.0 0.0 9.34 2.80 5.93 1.24 9.50 3.28 5.77 1.75 11.11 4.28
0.95 ARIMA(1,0,2) 0.5 0.3 0.0 0.0 4.47 2.35 2.80 0.72 4.84 3.05 2.50 1.09 8.29 5.95
0.95 ARIMA(1,0,2) -0.5 0.3 0.0 0.0 2.75 2.46 0.80 0.95 4.59 3.34 3.23 1.71 7.74 6.66
0.95 ARIMA(1,0,2) -0.8 0.5 0.0 0.0 4.50 2.94 1.54 1.20 10.51 4.38 8.94 3.74 8.54 6.01
0.95 ARIMA(1,0,2) -0.8 -0.5 0.0 0.0 0.05 3.75 1.12 1.92 14.82 3.80 14.37 3.81 9.73 5.32
0.95 ARIMA(1,0,4) 0.5 0.3 0.2 0.1 7.59 3.12 3.40 1.93 7.87 3.64 4.14 1.50 10.52 4.94
0.85 ARIMA(1,0,1) 0.8 0.0 0.0 0.0 7.42 2.92 4.05 1.15 8.04 4.49 4.11 2.88 9.96 4.97
0.85 ARIMA(1,0,1) 0.5 0.0 0.0 0.0 3.54 2.45 1.87 0.71 5.12 4.59 2.02 2.59 7.88 6.32
0.85 ARIMA(1,0,1) -0.5 0.0 0.0 0.0 2.73 2.35 1.19 0.68 8.28 5.25 3.96 4.46 7.56 6.61
0.85 ARIMA(1,0,1) -0.8 0.0 0.0 0.0 1.35 2.47 0.08 0.32 11.20 6.17 10.78 6.13 7.19 7.07
0.85 ARIMA(1,0,2) 0.8 0.5 0.0 0.0 9.31 2.77 5.87 1.24 9.77 4.17 5.82 3.01 11.05 4.33
0.85 ARIMA(1,0,2) 0.5 0.3 0.0 0.0 4.44 2.34 2.73 0.70 5.66 4.49 3.02 2.38 8.40 5.97
0.85 ARIMA(1,0,2) -0.5 0.3 0.0 0.0 1.99 2.49 0.24 0.64 7.42 5.20 5.81 4.08 7.48 6.91
0.85 ARIMA(1,0,2) -0.8 0.5 0.0 0.0 2.78 2.48 0.94 0.84 9.37 6.82 8.47 6.82 7.54 6.61
0.85 ARIMA(1,0,2) -0.8 -0.5 0.0 0.0 2.11 2.43 0.62 0.62 7.08 8.04 6.90 8.04 7.53 6.85
0.85 ARIMA(1,0,4) 0.5 0.3 0.2 0.1 7.56 3.13 3.24 1.94 7.97 4.49 4.58 2.33 10.42 4.93
注:表中所列和分别代表模拟10000次时各准则确定的(1-βL)yt滞后长度的均值及其标准差。
表6 ADF检验的功效和实际检验水平检验式(a) T=250
β ARIMA(p,d,q) θ1 θ2 θ3 θ4 AIC SIC MAIC MSIC GSC
1.0 ARIMA(0,1,1) 0.8 0.0 0.0 0.0 0.0517 0.0543 0.0323 0.0283 0.0535
1.0 ARIMA(0,1,1) 0.5 0.0 0.0 0.0 0.0524 0.0528 0.0391 0.0361 0.0504
1.0 ARIMA(0,1,1) -0.5 0.0 0.0 0.0 0.0744 0.1147 0.0522 0.0679 0.0665
1.0 ARIMA(0,1,1) -0.8 0.0 0.0 0.0 0.1521 0.3059 0.0727 0.0983 0.1259
1.0 ARIMA(0,1,2) 0.8 0.5 0.0 0.0 0.0459 0.0549 0.0327 0.0255 0.0504
1.0 ARIMA(0,1,2) 0.5 0.3 0.0 0.0 0.0559 0.0520 0.0385 0.0298 0.0541
1.0 ARIMA(0,1,2) -0.5 0.3 0.0 0.0 0.0749 0.1389 0.0532 0.0705 0.0732
1.0 ARIMA(0,1,2) -0.8 0.5 0.0 0.0 0.1480 0.3181 0.0818 0.1200 0.1237
1.0 ARIMA(0,1,2) -0.8 -0.5 0.0 0.0 0.1222 0.2567 0.0469 0.0521 0.1075
1.0 ARIMA(0,1,4) 0.5 0.3 0.2 0.1 0.0530 0.0642 0.0315 0.0280 0.0504
0.95 ARIMA(1,0,1) 0.8 0.0 0.0 0.0 0.7283 0.7741 0.6024 0.6410 0.6751
0.95 ARIMA(1,0,1) 0.5 0.0 0.0 0.0 0.7937 0.8145 0.7018 0.7455 0.7131
0.95 ARIMA(1,0,1) -0.5 0.0 0.0 0.0 0.8924 0.9669 0.7638 0.8615 0.7943
0.95 ARIMA(1,0,1) -0.8 0.0 0.0 0.0 0.9532 0.9986 0.7254 0.7912 0.8785
0.95 ARIMA(1,0,2) 0.8 0.5 0.0 0.0 0.6763 0.7256 0.5399 0.5668 0.6438
0.95 ARIMA(1,0,2) 0.5 0.3 0.0 0.0 0.7763 0.7877 0.6725 0.6687 0.7050
0.95 ARIMA(1,0,2) -0.5 0.3 0.0 0.0 0.8896 0.9622 0.7678 0.8718 0.7828
0.95 ARIMA(1,0,2) -0.8 0.5 0.0 0.0 0.9528 0.9981 0.7543 0.8365 0.8690
0.95 ARIMA(1,0,2) -0.8 -0.5 0.0 0.0 0.9667 0.9991 0.7513 0.7658 0.9210
0.95 ARIMA(1,0,4) 0.5 0.3 0.2 0.1 0.6892 0.7983 0.5529 0.5579 0.6397
0.85 ARIMA(1,0,1) 0.8 0.0 0.0 0.0 0.9868 0.9985 0.9263 0.9779 0.9580
0.85 ARIMA(1,0,1) 0.5 0.0 0.0 0.0 0.9964 1.0000 0.9451 0.9881 0.9613
0.85 ARIMA(1,0,1) -0.5 0.0 0.0 0.0 0.9976 1.0000 0.9331 0.9610 0.9770
0.85 ARIMA(1,0,1) -0.8 0.0 0.0 0.0 0.9994 1.0000 0.9727 0.9728 0.9933
0.85 ARIMA(1,0,2) 0.8 0.5 0.0 0.0 0.9753 0.9952 0.9034 0.9639 0.9526
0.85 ARIMA(1,0,2) 0.5 0.3 0.0 0.0 0.9943 0.9999 0.9406 0.9852 0.9607
0.85 ARIMA(1,0,2) -0.5 0.3 0.0 0.0 0.9981 1.0000 0.9375 0.9689 0.9738
0.85 ARIMA(1,0,2) -0.8 0.5 0.0 0.0 0.9998 1.0000 0.9684 0.9670 0.9914
0.85 ARIMA(1,0,2) -0.8 -0.5 0.0 0.0 0.9998 1.0000 0.9875 0.9885 0.9974
0.85 ARIMA(1,0,4) 0.5 0.3 0.2 0.1 0.9976 0.9960 0.9095 0.9734 0.9444
注:表中所列数值为模拟10000次时按照各种准则得到的ADF统计量小于Fuller(1976, 表8.5.2, 第373页)5%显著性水平下临界值的概率。
4.不同样本容量的影响
对于同一数据生成过程和滞后长度选择准则,T=250时选择的滞后长度明显增加,大多数情况下增加了1,而滞后长度的标准差除了修正的信息准则在真实生成过程平稳时标准差有所增加外,在其余情况下均变小,即滞后长度表现出比样本容量为100时更加稳健的特征(见表1与表5)。
另外,当样本容量为100时,应用各准则进行检验犯弃真错误的概率略大。当样本容量为250时,除MIC导致更大的检验尺度扭曲外,应用各准则进行ADF检验的实际检验水平都低于样本容量较小时的水平,即犯第一类错误的概率明显下降。另外,应用各准则进行ADF检验的功效与T=100时相比都有很大提高,且基于各准则的检验功效之间的差距也有所减小。例如,当β=0.95时,基于不同DGP和准则的检验功效绝大部分都大于70%,当β=0.85时的检验功效更是均大于90%甚至更高(见表2与表6)。这与我们通常的结论相一致。
三、结 论
当数据生成过程的移动平均部分含有负根时,一般的信息准则会倾向于选择较小的滞后长度,而MIC通过加入了修正因子能够在一定程度上修正一般信息准则拟和不足的问题,继而得到较为合理的检验尺度,其犯弃真错误的概率往往能保持在0.05,然而代价往往是检验功效的降低。
总之,修正的信息准则通常拥有较好的实际检验水平,尤其是在移动平均部分含有较大的负根时,检验尺度的扭曲较小,即犯弃真错误的概率较小。而AIC、SIC与GSC通常具有较高的检验功效,即犯取伪错误的概率较小。因此,如果一个时间序列运用MIC进行ADF检验时,不能拒绝单位根原假设,那么我们可以认为,该序列是一个单位根过程的可能性很大。反过来,如果运用另外三个准则进行ADF检验,结果拒绝了单位根原假设,那么我们就有充分的理由相信原序列平稳。
在实际操作中,由于AIC与SIC往往拥有较高的检验功效,但相应的检验尺度的扭曲也较大;而修正的信息准则虽然拥有较合理的实际检验水平,但要以付出检验功效为代价。因此我们建议选用GSC,它恰好是信息准则与修正的信息准则的一个折中,即犯弃真错误的概率不会太大,同时检验功效也不至于太低。因此利用t检验或F检验选择滞后长度k的方法优于其他选择法,因为其拥有相对较为稳健ADF检验性质。
此外还有几个需要注意的问题:①误差项中的高阶移动平均过程会影响滞后长度的选择及相应的ADF检验功效、实际检验水平。移动平均部分中根的个数尤其是正根的增加往往会使检验功效下降,较大的负根则会造成检验尺度的扭曲。而这两种情况都会使选择的滞后长度及其标准差增加。②随着确定性成分的加入,基于各种准则的ADF检验功效均有所下降,而检验尺度的扭曲(除MIC外)也相应增加,这时MIC仍具有较优的检验尺度,但检验功效非常低,有的甚至低于0.1。而加入漂移项对滞后长度的影响则因选择方法不同而不同。③建议选择大样本进行ADF检验,模拟表明样本容量为250时各准则在滞后长度的选择方面更加稳健,检验尺度的扭曲有所减小,同时检验功效都大幅提高(接近于1),并且各准则在检验功效之间的差距也缩小。
本文在运用一般到特殊法则时,实际是运用t统计量检验滞后差分项的参数显著性,即取m = 1。那么当取m > 1时,检验结果是否随m的不同而改变?对不同的数据生成过程是否存在一个最佳的m使得检验功效和实际检验水平都最优?在实际操作中,如何确定一个先验的m?这些问题都值得进一步研究。另外,研究表明,滞后长度的上界与下界也直接影响最终滞后长度的选择,进而影响ADF检验的统计推断,如何确定最优的上界与下界也是一个值得研究者继续探讨的问题。
参考文献
[1] Akaike, H., 1973, Information Theory and an Extension of the Maximum Likelihood Principle.[C] in 2nd International Symposium on Information Theory, eds. B. N. Petrov and F. Csaki, Budapest: Akademiai Kiado, pp. 267-281.
[2] Agiakloglou, C., and P. Newbold, 1992, Empirical Evidence on Dickey-Fuller Type Tests.[J] Journal of Time series Analysis, 13, 471-483.
[3] Hall, A., 1994, Testing for a Unit Root in Time Series With Pretest Data Based Model Selection.[J] Journal of Business & Economic Statistics, 12, 461-470.
[4] Harris, R. I. D., 1992, Testing for Unit Roots Using the Augmented Dickey-Fuller Test.[J] Economic Letters, 38, 381-386.
[5] Hannan, E. and B. Quinn, 1979, The Determination of the Order of an Autoregression.[J] Journal of the Royal Statistical Society, Ser. B, 41, 190-195.
[6] Lewis, R., and G. C. Reinsel, 1985, Prediction of Multivariate Time Series by Autoregressive Model Fitting.[J] Journal of Multivariate Analysis, 16, 393-411.
[7] Ng, S., and P., Perron 1995, Unit Root tests in ARMA Models With Data-Dependent Methods for the Selection of the Truncation Lag.[J] Journal of the American Statistical Association, 90, 268-281.
[8] Ng, S., and P., Perron 2001, Lag Length Selection and the Construction of Unit Roots Tests With Good Size and Power.[J] Econometrica, 69, 1519-1554.
[9] Ng, S., and P., Perron 2005, Practitioners’ Corner: A Note on the Selection of Time Series Models.[J] Oxford Bulletin of Economics and Statistics, 67, 115-134.
[10] Phillips, P. C. B., and P. Perron, 1988, Testing for a Unit Root in Time Series Regression.[J] Biometrika, 75, 335-346.
[11] Weber, C. E., 1998, Data-Dependent Criteria for Lag Length Selection in Augmented Dickey-Fuller Regressions: a Monte Carlo Analysis.[J] Unpublished Working Paper, Seattle University.
[12] Weber, C. E., 2001, F-tests for Lag Length Selection in Augmented Dickey-Fuller Regressions: Some Monte Carlo Evidence.[J] Applied Economics Letters, 2001, 8, 455-458.
[13] Said, S. E., and D. A., Dickey 1984, Testing for Unit Roots in Autoregressive-Moving Average Models of Unknown Order.[J] Biometrika, 71, 599-607.
[14] Schwarz, G.. W., 1978, Estimation the Dimension of a Model.[J]The Annals of Statistics, 6, 461-464.
[15] Schwert, G..W., 1989, Tests for Unit Roots: A Monte Carlo Investigation.[J] Journal of Business & Economic Statistics, 7, 147-160.
[16] 张晓峒、攸频:《DF检验式中漂移项和趋势项的t统计量研究》[J]《数量经济技术经济研究》,2006年第2期。
[17] 聂巧平、张晓峒:《ADF单位根检验中联合检验F统计量研究》[J]《统计研究》,2007年第2期。
[18] 张晓峒:《计量经济分析》[M],南开大学出版社,2000。
[1] 参见Dickey, D. A., and W. Fuller, 1979, Distribution of the Estimators for Autoregressive Time Series With a Unit Roots.[J] Journal of the American Statistical Association, 74, 427-431.以及Dickey, D. A., and W. Fuller, 1981, Likelihood Ratio Statistics for Autoregressive Time Series With a Unit Root.[J] Econometrica, 49, 1057-1072.
[2] 参见Hannan, E. J., and M. Deistler, 1988, The Statistical Theory of Linear Systems.[J] New York: John Wiley.
[3] 参见Elliott, G., T. J. Rothenberg, and J. H. Stock, 1996, Efficient Tests for an Autoregressive Unit Root.[J] Econometrica, 64, 813-836.
[4]Dufour, J. M., and M. King, 1991, Optimal Invariant Tests for the Autocorrelation Coefficient in Linear Regressions with Stationary and Non-stationary Errors.[J] Journal of Econometrics, 47, 115-143.
[5] Perron, P., and S., Ng, 1996, Useful Modifications to Unit Root Tests with Dependent Errors and their Local Asymptotic Properties.[J] Review of Economic Studies, 63, 435-465.
[6] Said和Dickey(1984)下界条件要求kmax > logT ,本文中当T=100和250时,logT为4.61和5.30,因此取kmax=20能够满足下界条件。另外,为满足上界条件,我们限制kmax ≤T/4,因此当T=100和250时,kmax=20显然也能够满足上界条件。