仍以上面的宏观经济数据为例来说明!
1 reshape 命令
reshape命令将面板数据转换为横向或纵向展示。
将数据导入Stata,数据呈现纵向排列
将数据转化为横向展示:
reshape wide income export gdp,i(prov) j(year)
此时,数据呈现横向排列
更多的时候,我们从网上下载的数据不是纵向排列,需要将其转化为纵向排列。
将数据转化为纵向展示:
reshape long income export gdp,i(prov) j(year)
在运行reshape long命令时,需要将变量名改写为变量名+时间的形式,j(year)中的year是新起的变量名。
此时,数据又重新呈现纵向排列。
2 merge 命令
如果数据存放在两个数据文件中,需要将两个数据文件进行匹配,那么可以使用merge命令。
进行匹配的数据文件必须是Stata的数据文件,即文件的后缀名是dta
接着上面例子,现在Stata中有prov、year、gdp、income、export五个变量;各省人口数pop变量存在在pop.dta数据文件中。
现将pop.dta中的pop变量进行匹配:
首先,右键pop.dta文件选择属性,查看文件的路径
其次,采用cd命令切换到pop.dta文件所在路径
cd D:\Desktop
最后,采用merge命令进行匹配
merge m:m prov year using pop.dta
3 循环语句命令:forvalues
有些时候,如果需要对不同区间样本重复执行某个命令,可以使用forvalues命令。
forvalues命令涉及多行内容,最好在do文件中使用!
分别列出2013到2020每年gdp、income和export变量的描述性统计结果:
forvalues i=2013/2020 {
su gdp income export if year==`i'
}
分别对2013到2020每年export和gdp进行最小二乘估计:
forvalues i=2013/2020 {
reg gdp export if year==`i'
}
Stata函数中,用 `变量名' 的形式表示变量。