• Index

截面数据

Reads: 2787 Edit

1 Heckman两阶段模型的形式

第一阶段:

第二阶段:

Heckman两阶段模型第一阶段是一个概率模型,根据第一阶段y=1的预测值计算出逆米尔斯比率(λ),然后将λ加入到第二阶段的回归方程中对方程进行修正。

2 Heckman模型应用

2.1 数据

在上市工业企业中,我们想研究企业海外收入的影响因素,但是其中一些企业选择将产品出口,从而获得海外收入;另一些企业选择不出口,其没有海外收入。如果直接将选择不出口的企业样本删除,将产生样本选择偏差问题。所以这里采用Heckman两阶段方法来进行研究。

第一阶段:企业是否选择出口的影响因素为:企业年龄、ROE、资产负债率、总资本周转率。

第二阶段:企业海外收入的影响因素为:企业年龄、研发投入、是否有国资背景。

2.2 录入数据

打开数据编辑窗口,将数据从Excel中复制到Stata,注意粘贴时选择“将第一行作为变量名”

stata-144

2.3 变量转换

将变量修改为英文名:

rename 成立年 year
rename 员工总数 labor
rename 资产总计 asset
rename 资产负债率 debt
rename 流动比率 liquit
rename 总资产周转率 turnover
rename 研发支出总额 rd
rename 海外业务收入 income
rename 是否出口 export
rename 市盈率PE pe
rename 基本每股收益 grow
rename 国资背景 govern
rename 沪深股通持股占比 foreignstock
rename 是否陆港通股票 lgt

生成lnage、lnlabor和lnincome变量:

g lnage=ln(2020-year)
g lnlabor=ln(labor)
g lnincome=ln(income)

2.4 heckman两步法估计企业海外收入影响因素

初步估计:

reg lnincome rd lnage govern

初步估计采用OLS直接估计企业海外收入的影响因素。如果不存在样本选择偏差问题,可以直接采用OLS的估计结果作为研究结论。

stata-144-1

最大似然估计:

heckman lnincome rd lnage govern, select(export = lnage roe turnover)

最大似然估计方法没有给出逆米尔斯比率。两个方程扰动项服从二元正态分布N(0, 0,1, sigma2, rho)。如果参数RHO显著,则表明存在样本选择偏差,否则,则表明不存在样本选择偏差。本例中athrho的值为-1.539062,对应的P值小于0.1,因而rho显著,可以认为存在样本选择偏差。需要以Heckman两阶段模型中第二阶段模型估计值来研究企业海外收入的影响因素。

stata-145

twostep估计:

heckman lnincome rd lnage govern, select(export = lnage roe turnover) twostep

twostep估计可以给出逆米尔斯比率,其中,逆米尔斯比率估计值为-13.22743,其对应的P值为0.256,因而不显著,表明不存在样本选择偏差问题,可以直接用初步估计结果作为研究结论。

在实际研究中,出于稳健性的考虑,可以同时报告最大似然估计和twostep估计的结果!本例中两种估计方法的结论不一致,说明数据质量不高,模型不够稳健。

stata-146

3 进一步研究

为了方便海外投资者投资我国A股市场,我国资本市场开通了沪港通和深港通,允许海外投资者通过香港证券交易所买卖A股股票。但是并不是所有A股的上市公司的股票都是沪(深)港通的标的,只有通过交易所和证监会的审核,上市公司的股票才能成为沪(深)港通标的,才能够被海外投资者购买。

海外投资者被称为聪明的投资者,他们购买股票的影响因素有哪些呢?如果只选择沪(深)港通标的股票进行研究,可能会造成样本选择偏差(因为某些未成为沪(深)港通标的股票也可能是海外投资者愿意购买的股票)。

这里接着上面的例子数据,采用Heckman两阶段模型来研究海外投资者购买股票的影响因素。

第一阶段:企业是否为沪(深)港通标的的影响因素:企业年龄、ROE、资产负债率、总资本周转率、是否有国资背景。

第二阶段:海外投资者购买股票的影响因素:股票市盈率、股票成长性、企业年龄、是否有国资背景。

3.1 heckman两步法估计海外投资者购买股票的影响因素

初步估计:

reg foreignstock pe grow lnage govern

初步估计采用OLS直接估计海外投资者购买股票的影响因素。如果不存在样本选择偏差问题,可以直接采用OLS的估计结果作为研究结论。

stata-147

最大似然估计:

heckman foreignstock pe grow lnage govern, select(lgt =debt roe govern lnage turnover)

估计此模型时会出现不收敛的情况,说明数据质量较差。删除debt变量后可以正常估计。

heckman foreignstock pe grow lnage govern, select(lgt = roe govern lnage turnover)

最大似然估计方法没有给出逆米尔斯比率。两个方程扰动项服从二元正态分布N(0, 0,1, sigma2, rho)。如果参数RHO显著,则表明存在样本选择偏差,否则,则表明不存在样本选择偏差。本例中athrho的值为-0.1468646,对应的P值小大于0.1,因而rho不显著,可以认为不存在样本选择偏差。直接以初步估计中的估计结果作为研究结论。

stata-148

twostep估计:

heckman foreignstock pe grow lnage govern, select(lgt =debt roe govern lnage turnover) twostep

twostep估计可以给出逆米尔斯比率,其中,逆米尔斯比率估计值为0.496583,其对应的P值为0.714,因而不显著,表明不存在样本选择偏差问题,可以直接用初步估计结果作为研究结论。

stata-149



获取案例数据,请关注微信公众号并回复:Stata_dt18


Comments

Make a comment

  • Index