1 功能描述
在时间序列预测时,通常需要比较多个模型、反复调整模型的参数来确定最优的模型形式。SPSS给我们提供了自动确定最优模型形式的功能,可以大大降低模型选择时的难度!
2 自动建模器的应用
我们以catalog.sav的数据为例来演示SPSS时间序列自动建模功能。
双击打开catalog.sav据文件,其中男装(销售)是我们要进行建模和预测的时间序列。
时间序列中,因变量除了收到自身过去数值的影响外,可能还受到其他解释变量的影响。
切换到变量视图,其中邮寄、页、电话、印刷、服务等变量也会影响到男装销售!
2.1 定义时间变量
在数据窗口中,依次点击“数据/定义日期”。
在弹出的定义日期窗口,个案为中选择年份、月份,右侧的年中输入起始年月:1989和1;点击确定。
2.2 构建时间序列预测模型
在数据窗口中,依次点击“分析/预测/创建模型”。
在弹出的“时间序列建模器”窗口,将男装移到右侧的因变量框;将邮寄、页、电话、印刷和服务变量移到右侧的自变量框;
方法中选择专家建模器,然后点击条件按钮;
在弹出的“时间序列建模器:专家建模器条件”窗口,模型类型选择所有模型(由于指数模型不能加入解释变量,所以此处指数模型为灰色。选择所有模型和仅限ARIMA模型的效果一样);
去掉专家建模器考虑季节性模型的对勾(我们先不考虑季节性效应);
设置好参数后,点击继续按钮返回“时间序列建模器”窗口。
在“时间序列建模器”窗口,切换到Statistics页面,勾选参数估计选项。
在“时间序列建模器”窗口,切换到图页面,勾选观察值和拟合值选项。
在“时间序列建模器”窗口,设置好所有参数后,点击确定进行运算。
运算完成后,输出窗口将给出相应的结果。
模型描述表给出了SPSS自动选择的模型形式,为ARIMA(0,0,12);
模型统计表中,预测变量个数为2(我们输入了5个,最后有2两个进入模型,其他变量对男装预测效果较低);
R方的值为0.82,相对较高;
Ljung-Box统计量的显著性大于0.05,说明模型合适。
ARIMA模型参数表给出了模型中参数的估计值。其中移动平均(MA)仅给出了显著的变量,即滞后5期和滞后12期的变量;
邮寄和电话两个变量进入到ARIMA模型中,两个变量后面标注了的“分子、分母”其实是SPSS里特有的转换函数信息,这里需要特别说明:“分子 延迟n”表示该变量滞后n期均加入模型。“分母 延迟n”表示该变量过去n个时间段的平均值偏差加入模型。除此之外,“差分 延迟n”表示该变量差分序列滞后n期加入模型。
根据ARIMA模型参数表中的结果可以写出ARIMA模型的具体形式:
输出结果给出了男装销售实际序列和拟合序列的走势!
拟合值与实际值某些位置偏离较大,所以可以尝试采用考虑季节效应的模型!
2.3 构建考虑季节效应的模型
参照前面的步骤,再次进入“时间序列建模器:专家建模器条件”窗口,勾选专家建模器考虑季节性模型选项;
其他参数保持默认,重新运行专家建模器的估计。
运算完成后,输出窗口将给出相应的结果。
模型描述表给出了SPSS自动选择的模型形式,为考虑季节效应的复合ARIMA模型:ARIMA(0,0,0)(1,1,0);
模型统计表中,预测变量个数仍然为2;R方的值为0.731,与前面模型相比有所降低;ARIMA模型参数表中,各参数均显著。
男装销售实际序列和拟合序列的走势图中,拟合值与实际值某些位置偏离仍较大。
前面两个ARIMA模型的结果相差不大,但是拟合值与实际值某些位置偏离均较大。这可能是极值(离群值)造成的,所以这里我们在建模时考虑离群值,重新进行估计!
参照前面的步骤,再次进入“时间序列建模器:专家建模器条件”窗口,切换到界外值页面,勾选自动检测离群值选项;同时勾选加法和移位水平选项;
其他参数保持默认,重新运行专家建模器的估计。
运算完成后,输出窗口将给出相应的结果。
模型描述表给出了SPSS自动选择的模型形式,为考虑季节效应的复合ARIMA模型:ARIMA(0,0,0)(0,1,0);
模型统计表中,预测变量个数仍然为2;R方的值为0.948,明显高于前面两个模型;ARIMA模型参数表中,各参数均显著(注意:模型参数中仅包含邮寄和电话两个变量,而没有AR项或MA项)。
界外值表中给出了专家建模器找到的9个离群值,并对其按照加法进行了估计。
男装销售实际序列和拟合序列的走势图中,拟合值与实际值的走势基本上十分吻合!
最后,应当注意的是,如果在构建ARIMA模型时加入了其他解释变量,由于没有这些解释变量未来时期的数据,所以无法对因变量时间序列进行预测!