数据导入

Reads: 2357 Edit

1 read.table("clipboard")读取内存中的数据

第一步:打开需要导入的数据并复制

r-48

第二步:在R软件中使用read.table("clipboard")导入

> mydata=read.table("clipboard")
> mydata
    V1   V2       V3      V4        V5        V6   V7      V8      V9
1 prov year     pgdp eduyear      pfdi      open area educost college
2 安徽 2011 2.563782 8.24831 0.0717416 0.3282538    2   817.2     116
3 安徽 2012 2.874424 8.51635 0.0910822  0.347451    2  991.76     118
4 安徽 2013 3.189051 8.52448 0.1097763  0.399829    2  1041.3     117
5 安徽 2014 3.427436 8.72823 0.1246152 0.4362843    2 1045.78     118
6 安徽 2015 3.581879 8.79599 0.1380698 0.4307953    2 1157.85     119
7 安徽 2016 3.939254 8.56559 0.1583067 0.4392001    2 1235.79     119
8 安徽 2017 4.319563 8.67668 0.1716016 0.5503837    2 1375.16     119
9 安徽 2018 5.378408 8.94283 0.1779193 0.6216082    2 1501.18     119

> mydata=read.table("clipboard", header = TRUE)
> mydata
  prov year     pgdp eduyear      pfdi      open area educost college
1 安徽 2011 2.563782 8.24831 0.0717416 0.3282538    2  817.20     116
2 安徽 2012 2.874424 8.51635 0.0910822 0.3474510    2  991.76     118
3 安徽 2013 3.189051 8.52448 0.1097763 0.3998290    2 1041.30     117
4 安徽 2014 3.427436 8.72823 0.1246152 0.4362843    2 1045.78     118
5 安徽 2015 3.581879 8.79599 0.1380698 0.4307953    2 1157.85     119
6 安徽 2016 3.939254 8.56559 0.1583067 0.4392001    2 1235.79     119
7 安徽 2017 4.319563 8.67668 0.1716016 0.5503837    2 1375.16     119
8 安徽 2018 5.378408 8.94283 0.1779193 0.6216082    2 1501.18     119

说明:当数据量不大时,推荐使用read.table()来快速导入数据。默认情况下,R会对导入的数据分别以V1,V2,...来命名列名称;如果数据中第一行为列名,则在read.table()函数中添加header = TRUE。

2 读取EXCEL格式数据

> install.packages("readxl")
> library(readxl)
> mydata1=read_excel("D:/Desktop/EconomicData.xlsx",sheet="Sheet2")
> View(mydata1)

r-49

3 导入Stata格式数据

> install.packages("haven")
> library(haven)
> mydata2=read_dta("D:/Desktop/EconomicData.dta")
Error: loadNamespace()里算'readr'时.onLoad失败了,详细内容:
  调用: loadNamespace(x)
  错误: 不存在叫‘tzdb’这个名字的程辑包
  
> install.packages("tzdb")
> mydata2=read_dta("D:/Desktop/EconomicData.dta")
> mydata3=read_stata("D:/Desktop/EconomicData.dta")

说明:第一次使用 read_dta()导入Stata格式数据时,提示缺少'tzdb'包,所以需要采用install.packages("tzdb")进行安装。 read_dta()和read_stata()两个函数均可以导入Stata格式数据!

在运行R时出错并不可怕,根据报错的说明内容逐条检查并改正是学习编程式统计分析软件必须具备的能力。

4 导入SPSS格式数据

> library(haven)
> mydata4=read_sav("D:/Desktop/EconomicData.sav")
> install.packages("foreign")
> library(foreign)
> mydata5=read.spss("D:/Desktop/EconomicData.sav",to.data.frame = TRUE,reencode = "utf-8")

说明:read_sav()和read.spss()两个函数均可以导入Stata格式数据!如果导入时中文乱码可以加reencode = "utf-8"参数。

总结

使用R最大的困难在于有时候不知道哪个包提供了所需的功能。这时候可以先从网上查询什么包可以提供我们所需的功能,然后再查阅相关包的使用!



获取案例数据,请关注微信公众号并回复:R_dt3


Comments

Make a comment