• Index

截面数据

Reads: 2777 Edit

1 门限模型的形式

其中,q为门限变量, γ为门限值。x1到xn是不受门限影响的解释变量,Z是受门限影响的解释变量(Z可以是多个变量)。门限变量可以取x1到xn,以及Z中的任何一个,甚至不在方程中的 变量也可以作为门限变量。当门限变量q小于门限值γ时,解释变量Z对被解释变量的影响程度为β0;当门限变量q大于门限值γ时,解释变量Z对被解释变量的影响程度为β1

上述公式仅给出了单个模型的情况,现实问题中可能存在多门限的情况,但其基本原理是一样的。单门限把方程分为两个阶段,双门限把方程分为三个阶段,...

2 门限模型的应用

2.1 数据

对于上市工业企业,资产负债率会对企业ROE产生多方面的影响。一般来说,企业负债率太高将会对企业ROE产生负面影响,但是适当的负债对企业发展来说至关重要。那么,资产负债率对 企业ROE是否存在非线性影响呢?我们通过门限回归模型来研究。

原始数据如下:

stata-122

2.2 录入数据

打开数据编辑窗口,将数据从Excel中复制到Stata,注意粘贴时选择“将第一行作为变量名”

stata-123

2.3 变量转换

将变量修改为英文名:

rename 成立年 year
rename 员工总数 labor
rename 资产总计 asset
rename 资产负债率 debt
rename 流动比率 liquit
rename 总资产周转率 turnover

生成lnage和lnlabor变量:

g lnage=ln(2020-year)
g lnlabor=ln(labor)

2.4 门限回归

对于截面数据,目前Stata还没有官方的门限回归命令。这里我们采用bruce hansen编写的“thresholdreg”命令来运行门限回归。该命令无法通过ssc install来安装,我们直接从hansen个人主页上下载该命令!命令的文件包含以下五个文件:

stata-124

在执行“thresholdreg”命令时,需要先将路径切换到“thresholdreg.ado”文件所在的目录

切换到“thresholdreg.ado”文件所在的目录:

cd D:\Desktop\threshold

“thresholdreg”命令不是官方命令,有些功能不完善,如果进行估计的变量存在缺失值,将无法使用。所以需要将所有缺失值删除!

删除所有缺失值所在的行:

egen nmissing = rowmiss(*)
drop if nmissing
drop nmissing

执行门限回归:

thresholdreg roe debt turnover lnage lnlabor,q(det) h(1)

其中,q()中为门限变量,可以是解释变量或者被解释变量,甚至不在回归模型中的变量也可以作为门限变量,选项h(1)表示对white相关来处理异方差,如果设置为h(0)则表示不处理异方差。这里不再展示h(0)选项的估计结果。

结果由四部分组成。

第一部分为全部样本的OLS估计:可以发现,全部样本为1179个,debt的系数为-0.525536666,结果并未给出变量系数估计的t统计量和P值。这里大致估算下t统计量=-0.525536666/0.155687659>2,所以可以认为debt变量的系数显著。即负债率上升将导致roe下降。

stata-126

第二部分为门限值的估计:门限值为91.5400009,对应的95%置信区间为[91.54500009,91.5400009],门限值正好位于置信区间上,基本可以认为门限显著。

stata-127

也可以通过图形来判断门限值是否位于置信区间内

stata-125

第三部分为第一个门限区域的估计结果:debt小于门限值时,debt系数的估计值为-0.231282063,位于95%的置信区间,所以显著。

stata-128

第四部分为第二个门限区域的估计结果:debt大于门限值时,debt系数的估计值为-14.7759436,位于95%的置信区间,所以显著。

对比两个门限区间debt系数的估计值可知,超过门限后,debt对roe的负面影响程度更大。

stata-129

综合来看,thresholdreg命令有以下几个问题。1.运行效率较低,如果数据量较大的话执行时间非常长。2.没有给出系数的t统计量和P值。3.只能选择1个门限,不能估计多门限情况。4.所有的变量系数都随门限改变,不够灵活。5.不能设置删除最大n%和最小n%的样本,容易使门限落在边缘。因而thresholdreg命令不太建议使用。

2.5 Stata官方命令threshold命令的应用

Stata官方命令threshold主要应用于时间序列,但这里我们可以将截面数据设置为时间序列类型,从而达到使用threshold命令的目的。

删除所有缺失值所在的行(threshold命令同样不能存在缺失值):

egen nmissing = rowmiss(*)
drop if nmissing
drop nmissing

设置时间变量:

g t=_n
tsset t

threshold命令估计单门限:

threshold roe , regionvars(debt turnover lnage lnlabor) threshvar(debt) trim(10) nthresholds(1)

其中,regionvars()内可以设置随门限变量改变的变量;threshvar()内为门限变量;trim(10)表示删除样本最大和最小的10%; nthresholds()可以设置门限的数量。

估计结果显示,门限值为71.410004,与采用thresholdreg命令不同,这是删除样本最大和最小的10%。小于门限值时,debt变量系数的估计值为-0.129143,大于门限值时,debt变量系数的估计值为-6.944825,且都显著。

stata-130

替换门限变量:

threshold roe lnage lnlabor, regionvars(debt turnover ) threshvar(year) trim(10) nthresholds(1)

其中,lnage和lnlabor设置为不随门限变动;门限变量设置为year,即研究不同年份成立的企业debt和turnover对roe的非线性影响。

结果显示,1997年以前成立的企业,debt变量系数估计值为-0.971066,1997年之后成立的企业,debt变量系数估计值为-0.2392318,且两个变量都显著。因而1997年之后成立的企业,debt对roe的负面影响更小。当然,背后更深层次的原因可能是1997年以前成立的企业,其负债率更高。

stata-132

threshold命令估计双门限:

threshold roe turnover lnage lnlabor, regionvars(debt) threshvar(debt) trim(10) nthresholds(2)

其中,turnover lnage lnlabor三个变量放在了regionvars()外面,因为他们系数的估计值不随门限改变,且nthresholds(2)表示有两个门限。

估计结果中,门限值为67.690002和71.410004,把所有样本分成了三部分。其中Region1和Region2中,debt变量的系数均不显著,因而对roe的影响不显著。Region3中,debt变量的系数为-6.884256,且显著,表明当负债率超过71.410004时,debt上升将对roe产生负面影响。

stata-131



获取案例数据,请关注微信公众号并回复:Stata_dt16


Comments

Make a comment

  • Index