如果数据量达到几十万,甚至上百万,那么一般的数据文件(Excel、CSV、TXT,SAV)根本放不下。数据必须要放在数据库中才行。
常见的数据库服务有MySQL、Oracle、Access等,幸运的是Stata提供了ODBC(开放数据库互连)接口,可以非常方便的调用数据库中的数据,为处理大样本提供了支持!
数据库的导入步骤为:
需要将数据库加入到ODBC接口才能够被Stata调用,这里以windows系统中的Access为例进行演示!
打开windows中的控制面板,点击管理工具
在管理工具中选择ODBC数据源(64位)
如果电脑是32位,则需要选择ODBC Data Sources(32-bit)
在ODBC数据源管理程序(64位)中,点击添加按钮
在创建新数据源窗口中,选择Microsoft Access Driver(*.mdb,*.accdb)
在ODBC Microsoft Access安装窗口的数据源名中输入数据源的名称(这个名字是自己起的):MyDate;
点击选择按钮,选择Access数据库文件
在选择数据库窗口,通过驱动器、目录和数据库名,选择Access数据文件的路径,然后点击确定返回在ODBC Microsoft Access安装窗口。
在ODBC Microsoft Access安装窗口点击确定,返回在ODBC数据源管理程序(64位)窗口,发现多了刚添加的MyData数据源
回到Stata主窗口,在Stata主窗口中,依次选择文件/导入/ODBC数据源;
在从ODBC数据源导入数据窗口,选择刚才添加的MyData数据源,接着在表格中选择需要导入的数据库中的表,这里选择了2020年的数据。点击确定,完成Access数据导入!