1 空间回归模型的应用
1.1 数据
这里以2018年我国30个地区的截面数据为例,研究劳动者受教育年限、对外贸易和外商直接投资对GDP的影响!
1.2 准备空间权重矩阵
常见的空间权重矩阵有01权重矩阵、地理距离权重矩阵和经济距离权重矩阵。
本例中的数据为我国30个地区的截面数据,提供了01空间权重矩阵和地理距离倒数的权重矩阵。
由于stata不同版本的数据文件可能存在不兼容的情况,不方便分享,所以空间权重矩阵均存放在Excel数据文件中。为了在后续分析时调用,需要先将其复制粘贴到自己用的stata版本中,并保存为stata数据文件。
其中,01权重矩阵保存为binaryW.dta;地理距离权重矩阵保存为distanceW.dta。后续分析时需要调用这两个空间权重。
在保存空间权重时,需要注意空间权重中各地区的排列顺序,后续回归数据中各地区的排列顺序需要与之一致。
将Excel中的01空间权重矩阵复制到stata中并另存为binaryW.dta数据文件
将Excel中的地理距离空间权重矩阵复制到stata中并另存为distanceW.dta数据文件
1.3 录入数据
打开回归数据编辑窗口,将数据从Excel中复制到Stata,注意粘贴时选择“将第一行作为变量名”。
数据集中各地区的排序与空间权重矩阵中的顺序一致,所以不需要再修改!
1.4 空间自相关检验
安装空间权重矩阵处理命令:spatwmat
search spatwmat
在弹出的窗口中点击:sg162 from http://www.stata.com/stb/stb60
在新窗口中点击:click here to install。由于安装包在国外的服务器上,所以安装过程可能较慢。
切换到binaryW.dta、distanceW.dta文件所在目录:
cd D:\Desktop
调入binaryW.dta中的01空间权重,并将其命名为:bW
spatwmat using binaryW.dta, name(bW)
调入binaryW.dta中的01空间权重,进行“行-标准化”,并将标准化后的权重矩阵其命名为:stdW
spatwmat using binaryW.dta, name(stdW) standardize
在计算空间相关系数Getis and Ord's G时,不能对空间权重进行“行-标准化”。但是在进行局部空间相关系数绘图时,需要对空间权重进行“行-标准化”,所以最好生成两个空间权重矩阵。
另外,如果不进行“行-标准化”,生成的是对称矩阵(矩阵的一半没有数据);如果进行行标准化,则是正常的矩阵。
计算全局自相关系数:
spatgsa pgdp open , weights(bW) moran geary go twotail
分别计算了pgdp和open两个变量的Moran's I、Geary's c、Getis and Ord's G全局空间自相关系数。当然,也可以同时估计更多变量的空间自相关系数。
估计结果中,pgdp和open两个变量的Moran's I、Geary's c自相关系数显著,表明这两个变量存在空间自相关。但是Getis and Ord's G自相关系数不显著。一般来说,只要有两个系数显著,甚至只要莫兰指数一个显著,就可以认为存在空间自相关,具体取决于自己的研究需求。
计算局部自相关系数:
spatlsa pgdp , weights(bW) moran geary go twotail
计算局部自相关时一次只能计算一个变量,这里计算的是pgdp,其他变量也可以采用相同的方法进行,这里不再演示!
局部空间自相关的估计结果非常多,看起来比较杂乱,所以一般用局部空间自相关图来观察空间自相关性。
绘制局部莫兰自相关图:
spatlsa pgdp , weights(stdW) moran graph(moran)
绘制局部莫兰自相关图时,空间权重必须“行-标准化”,所以这里选用的是stdW空间权重!
在局部莫兰自相关图中,第一和第三象限表示正相关,第二和第四象限表示负相关!
本例中多数样本点位于第一和第三现象,且呈现一定的线性趋势,所以认为存在正的空间自相关。
1.5 空间效应诊断
进行OLS估计:
reg pgdp open eduyear pfdi
spatdiag, weights(bW)
需要先运行reg命令,才能运行空间效应诊断命令:spatdiag。这里不再展示reg回归的结果,仅展示空间效应诊断的结果。
空间效应诊断结果中,分别给出了空间误差(Spatial error)和空间自相关(Spatial lag)的检验。结果显示,reg回归中的空间误差(Spatial error)和空间自相关(Spatial lag)检验的3种方法均不显著。
一般情况下,我们可以通过空间诊断的结果来选择进行空间回归时选择空间误差模型还是空间自回归模型。本例中空间误差(Spatial error)和空间自相关(Spatial lag)均不显著。一方面,可能由于数据量较少,后续我们继续采用面板数据来进行检验。另一方面,两种类型都不显著也不能完全表明回归模型中不存在空间效应。需要进一步通过空间回归结果中的系数来判断。
1.6 估计空间回归
计算空间权重矩阵的特征值向量,命名为bW(在空间回归时将用到):
spatwmat using binaryW.dta, name(bW) eigenval(E)
估计空间自回归模型(sar):
spatreg pgdp eduyear pfdi open , weights(bW) eigenval(E) model(lag)
在估计结果中,pfdi、open的系数显著,eduyear变量的系数不显著!rho的系数不显著,因而表明不存在空间自相关。
估计空间误差模型(sem):
spatreg pgdp eduyear pfdi open , weights(bW) eigenval(E) model(error)
在估计结果中,pfdi、open和eduyear变量的系数均显著!同时,rho的系数也显著,因而表明存在空间自相关。
1.7 进一步研究
为了回归的稳健性,可以继续采用地理距离空间权重进行空间相关性检验、空间效应诊断和空间回归。操作步骤与01空间权重一致,这里不再演示!