我们以数据读取中的宏观经济数据为例来说明Stata中最常用的数据展示相关命令!
参考数据读取部分内容,将数据录入Stata中。
1 sort命令
在将数据录入Stata后,如果想按照某一个或多个变量来对样本数据进行升序排序,可以使用sort命令。
按照gdp对数据进行排序:
sort gdp
按照year和gdp对数据进行排序:
sort year gdp
如果排序变量存在重复数据,为了使非排序变量保持原有的顺序,需要加入stable选项。
按照prov对数据进行排序,其他变量保持原先顺序:
sort prov,stable
如果不加stable,由于prov变量有相同的取值,相同取值对应的其他变量顺序将随机排列。
2 gsort命令
sort命令仅支持升序排列,如果想降序排列,需要使用gsort命令!
按照prov升序,year降序对数据进行排序:
gsort prov -year
按照year降序,gdp升序对数据进行排序,同时生成次序变量ob:
gsort -year gdp,g(ob)
3 order命令
order命令可以对变量的前后次序进行排列。
将gdp和income变量放到第一位和第二位:
order gdp income
将prov变量放gdp变量后面:
order prov ,a(gdp)
将export变量放gdp变量前面:
order export ,b(gdp)
4 list命令
list命令可以在结果窗口按条件列出相关变量。
列出gdp和export变量:
list gdp export
列出第8到第42位置上的gdp变量:
list gdp in 8/42
列出2020年的year和income变量:
list year income if year==2020
列出2015年到2018年的year和income变量:
list year income if (year>=2015 & year<=2018)
列出2015年和2018年的year和income变量:
list year income if (year==2015 | year==2018)
5 tabstat命令
tabstat可以对变量进行描述性统计
列出gdp、export和income变量的均值:
tabstat gdp export income
列出gdp、export和income变量的样本数、均值、最大值、最小值和方差:
tabstat gdp export income,s(n mean max min sd)
列出按年份分组的gdp、export和income变量的样本数、均值、最大值、最小值和方差:
tabstat gdp export income,by(year) s(n mean max min sd)
6 su命令
su可以直接给出变量的描述性统计结果
列出gdp、export和income变量的描述性统计结果:
su gdp export income
列出按年份分组的gdp、export和income变量的描述性统计结果:
bys year:su gdp export income
bys用于指定分组变量!