• Index

Heckman模型

Reads: 2766 Edit

在研究显示问题时,经常会遇到样本选择偏差问题。例如,为了研究教育对工资收入的影响,研究人员随机收集了1000名受访者的数据,其中,700名受访者有工作,可以获取收入数据;300名受访者无工作,没有收入数据。在简单的方法就是把这300名无工作的样本剔除,直接用700名有工作的样本进行回归,但这样就产生了样本选择偏差问题。因为那些无工作的人,有些可能接受了很好的教育,但是其却自愿选择了不参加工作。如果把这些样本剔除,可能会高估受教育对工资收入的影响。

Heckman两阶段模型为解决样本选择偏差问题提供了可行方法,其第一阶段采用二值选择模型(如logit模型)估计并预测每个受访者参加工作的概率,并计算出逆米尔斯比率,第二阶段将逆米尔斯比率加入700名有工作的样本中进行回归。如果第二阶段模型逆米尔斯比率没有通过显著性检验,则说明不存在选择偏差,可以直接用700名有工作的受访者样本来估计教育对工资收入的影响;如果第二阶段模型逆米尔斯比率通过了显著性检验,则认为存在选择偏差,需要用Heckman第二阶段中的估计结果作为教育对工资收入的影响程度。


Comments

Make a comment

  • Index