数据复杂转化的命令

Stata教程

Reads: 14501 Edit

仍以上面的宏观经济数据为例来说明！

1 reshape 命令

reshape命令将面板数据转换为横向或纵向展示。

将数据导入Stata，数据呈现纵向排列

将数据转化为横向展示：

reshape wide income export gdp,i(prov) j(year)

此时，数据呈现横向排列

更多的时候，我们从网上下载的数据不是纵向排列，需要将其转化为纵向排列。

将数据转化为纵向展示：

reshape long income export gdp,i(prov) j(year)

在运行reshape long命令时，需要将变量名改写为变量名+时间的形式，j(year)中的year是新起的变量名。

此时，数据又重新呈现纵向排列。

如果数据存放在两个数据文件中，需要将两个数据文件进行匹配，那么可以使用merge命令。

进行匹配的数据文件必须是Stata的数据文件，即文件的后缀名是dta

接着上面例子，现在Stata中有prov、year、gdp、income、export五个变量；各省人口数pop变量存在在pop.dta数据文件中。

现将pop.dta中的pop变量进行匹配：

首先，右键pop.dta文件选择属性，查看文件的路径

其次，采用cd命令切换到pop.dta文件所在路径

cd D:\Desktop

最后，采用merge命令进行匹配

merge m:m prov year using pop.dta

有些时候，如果需要对不同区间样本重复执行某个命令，可以使用forvalues命令。

forvalues命令涉及多行内容，最好在do文件中使用!

分别列出2013到2020每年gdp、income和export变量的描述性统计结果:

forvalues  i=2013/2020 {
  su gdp income export if year==`i'
}

分别对2013到2020每年export和gdp进行最小二乘估计：

forvalues  i=2013/2020 {
  reg gdp export if year==`i'
}

Stata函数中，用 `变量名' 的形式表示变量。