缺失值处理

Reads: 2184 Edit

1 功能说明

在数据分析中,缺失值是经常遇到且较为棘手的问题,但SPSS却提供了处理缺失值较为方便的方法。

2 插补缺失值

这里以GDP.sav中的数据为例进行演示!

双击打开GDP.sav数据文件。可以发现,GDP和CPI变量中均存在缺失值。

spss-36

在SPSS数据窗口中依次点击“转换/替换缺失值”按钮。

spss-37

2.1 插补GDP变量的缺失值。

在弹出的窗口中,将GDP变量移到“新变量”框中。方法中提供了插补缺失值的各种方法,由于GDP数据随着时间逐渐增大,所以采用所有时间序列的平均数进行插补不太准确,这里选择“邻近点的平均值”方法。

spss-38

修改好插补缺失值的方法后,点击更改按钮,新变量框中的公式自动变为“GDP_1=MEAN(GDP 2)”(这部很重要);点击确定。

spss-39

2.2 插补CPI变量的缺失值

按照同样的方法,在CPI的插补缺失值方法中选择“序列平均值”,因为CPI变量并不随时间呈现增大或减小的趋势。点击确定。

spss-40

返回SPSS数据视图窗口,可以发现,数据中新增了GDP_1和CPI_1两个新变量。其中已经对缺失值进行了插补。

spss-41



获取案例数据,请关注微信公众号并回复:SPSS_dt3


Comments

Make a comment