• Index

数据复杂转化的命令

Reads: 9020 Edit

仍以上面的宏观经济数据为例来说明!

1 reshape 命令

reshape命令将面板数据转换为横向或纵向展示。

将数据导入Stata,数据呈现纵向排列

stata-26

将数据转化为横向展示:

reshape wide income export gdp,i(prov) j(year) 

此时,数据呈现横向排列

stata-27

更多的时候,我们从网上下载的数据不是纵向排列,需要将其转化为纵向排列。

将数据转化为纵向展示:

reshape long income export gdp,i(prov) j(year) 

在运行reshape long命令时,需要将变量名改写为变量名+时间的形式,j(year)中的year是新起的变量名。

此时,数据又重新呈现纵向排列。

2 merge 命令

如果数据存放在两个数据文件中,需要将两个数据文件进行匹配,那么可以使用merge命令。

进行匹配的数据文件必须是Stata的数据文件,即文件的后缀名是dta

接着上面例子,现在Stata中有prov、year、gdp、income、export五个变量;各省人口数pop变量存在在pop.dta数据文件中。

stata-28

现将pop.dta中的pop变量进行匹配:

首先,右键pop.dta文件选择属性,查看文件的路径

stata-29

其次,采用cd命令切换到pop.dta文件所在路径

cd D:\Desktop  

最后,采用merge命令进行匹配

merge m:m prov year using pop.dta 

3 循环语句命令:forvalues

有些时候,如果需要对不同区间样本重复执行某个命令,可以使用forvalues命令。

forvalues命令涉及多行内容,最好在do文件中使用!

分别列出2013到2020每年gdp、income和export变量的描述性统计结果:

forvalues  i=2013/2020 {
  su gdp income export if year==`i'
}

分别对2013到2020每年export和gdp进行最小二乘估计:

forvalues  i=2013/2020 {
  reg gdp export if year==`i'
}

Stata函数中,用 `变量名' 的形式表示变量。



获取案例数据,请关注微信公众号并回复:Stata_dt4


Comments

Make a comment

  • Index