问题的引出
在多元线性回归模型中,如果变量为时间序列数据,为了防止发生伪回归,需要对变量进行单位根检验。
第一种不带截距项和趋势项,对应如下平稳图形:
第二种带截距项,对应如下平稳图形:
第三种同时带截距项和趋势项,对应如下平稳图形:
那么,当多元线性回归模型中变量对应不同ADF检验形式时。例如,被解释变量对应ADF形式3的平稳,解释变量对应ADF形式1的平稳。那么,解释变量和被解释变量可以直接放入多元线性回归模型吗?
我们分几种情况来讨论
一、原始序列平稳,平稳形式不同
情况1:多元线性回归中的变量,其ADF检验的平稳形式均为形式1(无截距项和趋势项)或者形式2(只有截距项),此时可以将所有变量直接放入多元线性模型进行估计。
我们通过实际例子来说明。
设有两个平稳时间序列x和y,其平稳形式均为形式1(无截距项和趋势项):
采用EViews对y和x进行估计,结果如下所示:
生成序列y1,y1=y+10
,y1的平稳形式为形式2(只有截距项):
然对y1和x估计,结果如下所示:
对比两个结果可知,变量x的系数、R2、F统计量是一致,截距项的值发生了变化(增大了10)。但由于多元线性回归模型主要是研究解释变量对被解释变量的影响,所以不用关心截距项的系数。
如果原始序列平稳,在多元线性回归中,某个变量整体增加常数C,不会改变多元线性回归模型变量的系数。
情况2:多元线性回归中的变量,有1个或多个变量ADF检验的平稳形式均为形式3(同时包含截距项和趋势项),此时需要在多元线性回归方程中增加趋势变量t。
首先,生成序列t=(1,2,3,....);接着,生成序列y2,y2=y+0.2*t
,y2的平稳形式为形式3(同时有截距项和趋势项):
然后对y2和x进行估计,结果如下所示:
对比前面的结果可知,变量x的系数、R2、F统计量均发生了明显的改变。
在y2和x的回归方程中加入t,重新进行估计,结果如下所示:
对比前面的结果可知,变量x的系数和第1个结果近似相等,且模型识别出了趋势项t的系数(0.2)。
进一步,生成序列x2,x2=x+0.5*t
,x2的平稳形式为形式3(同时有截距项和趋势项),然后在y2和x2的回归方程中加入t进行估计,结果如下所示:
可以发现,变量x的系数仍与第1个结果近似相等。
如果原始序列平稳,在多元线性回归中,某个变量整体加上趋势T,那么多元线性回归模型应该加入趋势项T。
二、原序列不平稳,一阶差分后序列平稳,平稳形式不同
情况3:多元线性回归中的变量,有1个或多个变量ADF检验的平稳形式均为形式2(只有截距项),其余变量ADF检验的平稳形式均为形式1(无截距项和趋势项)
设有两个平稳时间序列w和z,原始序列不平稳,1阶差分后平稳,其平稳形式均为形式1(无截距项和趋势项):
采用EViews对w和z进行估计,结果如下所示:
生成序列△w1,△w1=△w+3
,则△w1的平稳形式为形式2(只有截距项);
根据△w1推导出w1:
对w1和z进行估计,结果如下所示:
对比前面的结果可知,变量z的系数、R2、F统计量均发生了明显的改变。
在w1和z的回归方程中加入趋势t,重新进行估计,结果如下所示:
此时,变量z的系数与w和z方程中估计结果近似相等。
如果序列1阶查分后平稳,在多元线性回归中,某个变量差分后整体加上常熟C,那么原始变量的多元线性回归模型应该加入趋势项T。
情况4:多元线性回归中的变量,有1个或多个变量ADF检验的平稳形式为形式3(同时包含截距项和趋势项)
生成序列△w2,△w2=△w+2t
,则△w2的平稳形式为形式3(只有截距项);
根据△w2推导出w2:
对w2和z进行估计,结果如下所示:
对比前面的结果可知,变量z的系数、R2、F统计量均发生了明显的改变。
在w2和z的回归方程中加入趋势t和趋势的平方t2,重新进行估计,结果如下所示:
此时,变量z的系数与w和z方程中估计结果近似相等。
如果序列1阶查分后平稳,在多元线性回归中,某个变量差分后整体加上趋势,那么原始变量的多元线性回归模型应该加入趋势项T和趋势的平方项T2。
三、二阶差分后序列平稳的情况
二阶差分后序列平稳的情况比较少见,且较为复杂,这里不再讨论。