• Index

面板数据(短面板)

Reads: 20615 Edit

1 模型说明

对于截面数据,模型中往往存在异方差、多重共线性、内生性等问题。对于时间序列数据,在建模时则受到平稳性的约束。虽然计量经济学家发明了处理这些问题的诸多精妙方法,但是不免会加入新的假设、约束条件,导致模型越来越复杂,并且现实数据也很难满足所有的假设和约束!导致模型与估计结果的可信度受到怀疑。与之相比,增加样本可以说是修正计量模型各种问题的最简单、高效和万能方法!

面板数据包含截面与时间两个维度,样本量自然获得提升。除此之外,面板数据模型还可以对截面上不同个体的差异进行控制,对各时间节点上的差异进行控制,模型结果聚焦在研究的核心问题上(即自变量因变量之间的关系)。

因而,面板数据模型已经成为社会科学中实证研究的最主要的数据类型之一。

2 面板数据模型的形式

面板数据模型与多元线性回归模型非常相似,只是在其模型基础上加入了时间元素。

3 面板数据模型(短面板)的应用

一般来说,如果面板数据中时间数远远低于截面个体数,就可以不考虑面板数据中的时间平稳性要求,称这类面板数据为短面板!短面板中的数据所包含的信息主要是截面数据的信息,因而在构建短面板模型时与截面数据模型的过程非常相似。当然,怎么界定截面个体数远大于时间数并没有统一的标准。但如果截面个体数仅比时间数大1,2个,最好不要将其当作短面板来处理,否则可能会引起质疑。

这里只讨论短面板的处理,长面板放到时间序列部分讨论!

3.1 数据

我们以2011年至2018年中国30个地区的面板数据为例,研究劳动者受教育年限对经济增长的影响。其中经济增长用人均GDP来表示;劳动者受教育年限通过劳动者受教育程度进行加权平均。控制变量包括人均FDI和贸易水平(各地区进出口总额与地区GDP之比表示)。area表示东中西部(area=1表示东部,area=2表示中部,area=3宝石西部)。

stata-52

3.2 录入数据

打开数据编辑窗口,将数据从Excel中复制到Stata

stata-53

3.3 设置数据为面板数据类型

生成prov变量对应的数值型变量:

encode prov,g(id)

设置面板数据格式:

xtset id year

3.4 估计面板模型

混合面板:

reg pgdp eduyear pfdi open

stata-54

固定效应:

xtreg pgdp eduyear pfdi open,fe

stata-55

随机效应:

xtreg pgdp eduyear pfdi open,re

stata-56

截面时间双重控制:

xtreg pgdp eduyear pfdi open i.year,fe
xtreg pgdp eduyear pfdi open i.year,re

stata-57

stata-58

选择特定样本回归:(选取2013年以后的数据进行回归)

xtreg pgdp eduyear pfdi open if year>2013,fe
xtreg pgdp eduyear pfdi open if year>2013,re

stata-59

stata-60

选择特定样本回归:(选取2013年以后和东部的数据进行回归)

xtreg pgdp eduyear pfdi open if year>2013 & area==1,fe
xtreg pgdp eduyear pfdi open if year>2013 & area==1,re

stata-61

stata-62

选择特定样本回归:(选取2013年以后,以及东部和中部的数据进行固定效应回归)

xtreg pgdp eduyear pfdi open if year>2013 & (area==1 | area==2),fe
xtreg pgdp eduyear pfdi open if year>2013 & area!=3,fe

stata-63

stata-64

上述例子中的固定效应和随机效应均是针对截面,理论上时间维度也可以进行固定效应和随机效应设置。但短面板中是以截面的样本数据为主体,因而也应该以截面的固定(随机)效应为主,时间的固定(随机)效应完全可以不考虑!或者以截面的固定效应/随机效应为主,配合时间的固定效应来设定模型(在xtreg命令中输入:i.year)。

3.5 Hausman检验

Hausman通常用于判断面板数据模型属于固定效应还是随机效应!

估计固定效应和随机效应模型:

xtreg pgdp eduyear pfdi open ,fe
esti store fe1
xtreg pgdp eduyear pfdi open ,re
esti store re1

进行hasman检验:

hausman fe1 re1

Hausman检验结果中原假设是:选择随机效应。chi2统计量的P值为0.0000,因而拒绝原假设,选择固定效应!

stata-65

也可以使用如下命令,其中sigmamore利用有效估计量方差(re),sigmaless利用一致估计量方差(fe)

hausman fe1 re1, sigmaless
hausman fe1 re1, sigmamore

另外,实际应用中也可以把固定效应和随机效应的结果都展示出来,如果固定效应和随机效应的结果都是显著,那么根本就不需要再做Hausman进行模型选择了,而且这样论证的说服力会更强。

3.6 变系数模型

变系数模型中,不同截面个体或时间节点的变量对应不同的系数(即斜率不同)!

应该注意的是:变系数模型实际应用中很少用到!因为变系数的模型过于复杂,变系数模型有非常多的系数,不便于进行解释!二是在理论上我们更关心解释变量对被解释变量的平均影响(例如某项政策的平均效果,只要对多数个体有效,那么这项政策就是有用的)。三是变系数模型待估计参数非常多,那么每个参数估计结果的可信度将下降,而变截距模型中只有一个系数待估计,其估计结果的可信度会更高,这也是变截距模型应用最广泛的原因。当然在变截距模型中也有很多待估计的截距项,但是这些截距项的估计值的可信度我们不太关心,我们更关心变量系数的估计值!

由于变系数模型实际中几乎不会用到,所以这里仅进行简单演示!

估计截面上的变系数模型:

xtset id year
xtrc pgdp eduyear pfdi open ,beta

估计结果中给出了变系数模型的检验,原假设是系数相同。chi2统计量的值为4156.59,对应的P值为0.0000,因而拒绝原假设,应该采用变系数模型。估计结果分别列出来30个地区的估计结果!

stata-66

估计时间维度上的变系数模型:

xtset year id
xtrc pgdp eduyear pfdi open ,beta

估计结果中给出了变系数模型的检验,原假设是系数相同。chi2统计量的值为127.66,对应的P值为0.0000,因而拒绝原假设,应该采用变系数模型。估计结果分别列出来30个地区的估计结果!

stata-67



获取案例数据,请关注微信公众号并回复:Stata_dt9


Comments

Make a comment

  • Index