图形操作

Reads: 925 Edit

1 功能描述

数据读取到SPSS Modeler,并对变量进行变换操作后,可以用图形来直观观察下变量之间的关系和分布情况。在SPSS Modeler中关于图形的节点位于“图形”选项卡下面!我们通过几个例子来演示主要节点的用法。

mdl-172

2 散点图

我们以DRUG.sav数据集为例来演示,首先将其读取到SPSS Modeler中

将“源”选项卡下面的Statistics节点添加到数据流编辑区域。

mdl-173

双击打开Statistics节点,设置DRUG.sav数据文件的存放路径。

mdl-174

将“输出”选项卡下面的表添加到数据流中,并与Excel节点连接;

双击打开表节点,点击运行,可以看出数据成功读取到SPSS Modeler中。

mdl-175

将“字段选项”选项卡下面的类型节点添加到数据流中,并与Statistics节点连接。

mdl-176

将“字段选项”选项卡下面的导出节点添加到数据流中,并与类型节点连接。

mdl-177

双击打开导出节点。模式选择“单个”;导出字段输入“NaToK”;导出为选择“公式”;公式中输入“Na/K”,点击确定。

mdl-178

将“输出”选项卡下面的表节点添加到数据流中,并与导出节点连接。

双击打开表,并点击运行,可以看到数据中新增NaToK列。

mdl-179

将“图形”选项卡下面的图节点添加到数据流中,并与导出节点连接。

mdl-180

双击打开图节点,X字段选择“Na”;Y字段选择“K”;颜色选择“Drug”,点击运行。

mdl-181

在生成的散点图中,Drug用5中颜色就行了表示,其中黄色(drugY)处于图形下方,说明K低于0.04时,绝大部分使用drugY。

mdl-182

回到图节点设置窗口,将颜色中的Drug去除,在面板中选中Drug,点击运行。

mdl-183

在生成的散点图中,根据Drug的类型分成了5个散点图来显示。

mdl-184

3 分布图

仍然采用Drug.sav的数据流。

将“图形”选项卡下面的分布节点添加到数据流中,并与导出节点连接。

mdl-185

双击打开分布节点,字段中选择Drug,其他保持默认,点击运行。

mdl-186

在生成的图形中,分别给出了5中drug的百分比。

mdl-187

回到分布节点的设置窗口,在颜色中选择BP,点击运行。

mdl-188

在生成的图形中,除了给出5种drug的分布外,还给出了每种drug中BP的比例,其中drugA和drugB中仅包含高血压,drugC中仅包含低血压。

mdl-189

4 直方图

仍然采用Drug.sav的数据流。

将“图形”选项卡下面的直方图节点添加到数据流中,并与导出节点连接。

mdl-190

双击打开直方图节点,字段选择“NaToK”,其他保持默认,点击运行。

mdl-191

在生成的图形中,给出了NaToK变量的分布情况。

mdl-192

回到直方图设置窗口,颜色选择Drug,点击运行。

mdl-192-1

在生成的图形中,不仅给出了NaToK的分布,而且给出了Drug的分布,即当NaToK大于15后,Drug均为drugY。

mdl-193

5 网络图

仍然采用Drug.sav的数据流。

将“图形”选项卡下面的网络节点添加到数据流中,并与导出节点连接。

mdl-194

双击打开网络节点,字段中加入BP和Drug(用于研究两者的关系),点击运行。

注意:虽然可以选择三个以上的变量,但是网络图会很复杂,失去图形直观的优势,所以建议分成变量两两之间的网络图。

mdl-195

在生成的图形中,HIGH和drugY,NORMAL和drugX的关系比较强。

mdl-196

回到网络设置窗口,字段中加入Cholesterol和Drug(用于研究两者的关系),点击运行。

mdl-197

在生成的图形中,HIGH和drugY,NORMAL和drugX的关系比较强。

mdl-198

6 多重散点图

仍然采用Drug.sav的数据流。

将“图形”选项卡下面的多重散点图节点添加到数据流中,并与导出节点连接。

mdl-199

双击打开多重散点图,X字段选择Age;Y字段选择NaToK;面板选择Drug,点击运行。

mdl-200

在生成的图形中,按照Drug的类别分成了5个图形。NaToK的值处于20左右时仅对应drugY;在drugA和drugB的图中,NaToK的值均处于10左右,但是Age低于50时对应drugA,而Age高于50时对应drugB。

mdl-201



获取案例数据,请关注微信公众号并回复:Modeler_dt6


Comments

Make a comment