1 logit和probit的模型形式
logit模型:
probit模型:
其中,被解释变量y是只能取0和1的二分类变量。
2 logit和probit模型应用
2.1 数据
在截面数据例子中,我们研究了企业被ST的影响因素。这里进一步收集了2018年至2020年3年的企业数据,其中某一个企业可能2018被ST,但是2019年去ST。
其中,企业成立年份,企业代码等信息不随时间变化。但roe、员工总人数等信息随着时间变化。
2.2 录入数据
打开数据编辑窗口,将数据从Excel中复制到Stata,注意粘贴时选择“将第一行作为变量名”
2.3 数据变形
由于Excel中的数据存放形式不符合面板数据的形式,所以需要将其转化为面板数据的形式。
用reshape命令将数据转化为面板数据形式:
reshape long roe 员工总数 资产总计 资产负债率 流动比率 总资产周转率 st,i(证券代码) j(year)
注意使用reshape命令时,需要转换的变量需要采用“变量名+年份”的这种形式命名。不随时间变化的变量如证券代码仍采用普通命名方式,且其也不用出现在reshape命令中。
变形后数据呈如下形式
2.4 设置面板格式及变量转换
encode 证券代码 ,g(id)
xtset id year
g lnlabor=ln( 员工总数 )
g lnage=ln(year - 成立年 )
rename 资产总计 asset
rename 资产负债率 debt
rename 流动比率 liquit
rename 总资产周转率 turnover
2.5 面板logit模型估计
xtlogit命令:
xtlogit st turnover liquit lnlabor ,fe
xtlogit st turnover liquit lnlabor ,re
加入lnage与企业个体差异相关性较高,加入后会导致面板二值选择模型不收敛,所以模型中未加入lnage变量。
面板logit固定效应模型中,只有lnlabor变量显著。
面板logit随机效应模型中,同样只有lnlabor变量显著。
面板logit模型的hausman检验:
xtlogit st turnover liquit lnlabor ,fe
esti store fe1
xtlogit st turnover liquit lnlabor ,re
esti store re1
hausman fe1 re1
在hausman检验中,chi2统计量为8.21,对应的P值小于0.1,因而拒绝原假设,选择固定效应模型。结合前面面板logit固定效应的估计结果可知,lnlabor是企业是否被ST的重要因素。
2.6 面板probit模型估计
xtprobit不支持面板数据的固定效应!
xtprobit命令:
xtprobit st turnover liquit lnlabor lnage,re
面板probit随机效应模型中,同样只有lnlabor变量显著。