logit和probit回归

Reads: 9482 Edit

在多元线性回归中,被解释变量是连续型变量。当被解释变量为二分类变量时,多元线性回归将不适用,需要采用logit模型或probit模型来估计解释变量对二分类变量的影响。例如,判断人是否能取得成功的影响因素,企业是否能够成功上市的影响因素等。

对于logit模型和probit模型的选择。首先,对于相同的数据,采用两个模型进行估计,变量的显著性一般情况下是一样的,所以采用两个模型的研究结论是一样的,只是变量系数的大小有所差异。
另外,logit模型的解释更方便,且计算量较低,所以一般情况下用logit模型就可以了。

1 logit和probit的模型形式

logit模型:

probit模型:

其中,被解释变量y是只能取0和1的二分类变量。

2 logit和probit模型应用

在多元线性回归的例子中,一些工业企业被“ST”了,那么,企业被“ST”的影响因素有哪些呢?

为了对上述问题进行研究,首先,需要增加一个变量ST,如果企业被ST了,就设1,否则,设为0。

101

2.1 估计logit模型

将数据导入EViews中,生成新的变量lnage=log(2020-year),lnlabor=log(labor)(参考多元线性回归的示例)。在EViews主窗口点击Quick/Estimate Equation

102

在Estimate Equation窗口的Method中选择BINARY-Binary...。

103

在Equation specification 中输入st liquit turnover lnage lnlabor c,(解释变量仍取多元线性回归中的值)。在Binary estimation method中选择logit,点击确定。

104

在估计结果窗口中,可以看到,LIQUIT、TURNOVER、LNAGE、LNLABOR四个解释变量系数的P值均小于0.1,因而四个变量都显著,都对企业是否被ST有影响。

logit模型的系数,只能根据正负符号判断对被解释变量的影响方向,影响的程度无法直接得出。需要计算出odds ratio(发生比之比)来解释;OR大于1,说明发生概率上升;OR小于1,说明发生概率下降。

对于LIQUIT的系数-0.314068,其OR值为,即OR约等于0.73,表面LIQUIT增加一单位,可以使企业被ST的概率下降(1-0.73)。

105

2.2 logit模型中加入虚拟变量

添加虚拟变量D1和D2,当为大型企业时,D1=1,否则D1=0;当为中型企业时,D2=1,否则D2=0。通过这样设定,D1=1,D2=0表示大型企业;D1=0,D2=1表示中型企业;D1=0,D2=0则表示小型企业。

将D1和D2导入EViews中,在上一步的估计结果窗口中,点击Estimate,重新进入Estimate Equation窗口。

106

在Equation specification 中输入st d1 d2 liquit turnover lnage lnlabor c,在Binary estimation method中选择logit,点击确定。

107

估计结果窗口中,D1和D2变量系数的P值均大于0.1,不显著,表明大型企业、中型企业、小型企业,在其他条件相同的情况下被ST的概率不存在差别。

108

可以进一步研究虚拟变量与解释变量的交互项。

在EViews主界面选择Quick/Generate Series,在新窗口中输入d1liquit=d1*liquit,生成d1liquit变量,按照同样步骤生成d2liquit变量。

109

在Equation specification 中输入st liquit d1liquit d2liquit turnover lnage lnlabor c,在Binary estimation method中选择logit,点击确定。

110

在估计结果窗口中,D1LIQUIT变量系数的P值小于0.1,表明D1LIQUIT变量显著。其OR约等于0.54,因而提高流动比率,大型企业被ST的概率比小型企业多降低(1-0.54)。D1LIQUIT变量则不显著,说明因而提高流动比率,中型企业被ST的概率降低幅度与小型企业不存在差别。

111

2.3 估计probit模型

probit模型的估计和logitic模型基本一样。在Estimate Equation窗口的Equation specification 中输入st liquit turnover lnage lnlabor c,(解释变量仍取多元线性回归中的值)。在Binary estimation method中选择probit,点击确定。

112

在估计结果窗口中,可以看出,probit和logit模型估计系数的显著性一致,但是系数值确不一样。

probit模型无法计算OR(发生比之比),解释较为困难。对于LIQUIT变量,其系数为-0.106891,表示企业流动比率增加1单位,企业被ST的概率密度函数下降0.106891。

113

3 logit和probit模型变换

在某些情况下,可以把多元线性回归模型的被解释变量转换为二分类变量,从而可以用logit和probit模型进行估计。

例如,在多元线性回归例子中,被解释变量为ROE,观察数据发现很多企业的ROE为负数。那么可以对ROE变量进行转换,如果ROE值为负数,就设为1;如果ROE值为正数,则设为0。这样可以研究企业ROE为负(企业亏损)的影响因素。

114

3.1 logit模型估计

将企业ROE是否为负变量(ROE0)导入EViews中。

在Equation Estimation窗口中输入roe0 liquit turnover lnage lnlabor c,在Binary estimation method中选择logit,点击确定。

115

估计结果窗口中,LIQUIT、TURNOVER、LNAGE、LNLABOR四个解释变量系数的P值均小于0.1,因而四个变量都显著,都对企业ROE是否为负有影响。

116

3.2 probit模型估计

在Equation Estimation窗口中输入roe0 liquit turnover lnage lnlabor c,在Binary estimation method中选择probit,点击确定。

117

估计结果窗口中,LIQUIT、TURNOVER、LNAGE、LNLABOR四个解释变量系数的P值均小于0.1,因而四个变量都显著,都对企业ROE是否为负有影响。

118



获取案例数据,请关注微信公众号并回复:Eviews_dt7


Comments

Make a comment