图形操作 - 炊数据

图形操作

Reads: 2269 Edit

1 功能描述

数据读取到SPSS Modeler，并对变量进行变换操作后，可以用图形来直观观察下变量之间的关系和分布情况。在SPSS Modeler中关于图形的节点位于“图形”选项卡下面！我们通过几个例子来演示主要节点的用法。

2 散点图

我们以DRUG.sav数据集为例来演示，首先将其读取到SPSS Modeler中

将“源”选项卡下面的Statistics节点添加到数据流编辑区域。

双击打开Statistics节点，设置DRUG.sav数据文件的存放路径。

将“输出”选项卡下面的表添加到数据流中，并与Excel节点连接；

双击打开表节点，点击运行，可以看出数据成功读取到SPSS Modeler中。

将“字段选项”选项卡下面的类型节点添加到数据流中，并与Statistics节点连接。

将“字段选项”选项卡下面的导出节点添加到数据流中，并与类型节点连接。

双击打开导出节点。模式选择“单个”；导出字段输入“NaToK”；导出为选择“公式”；公式中输入“Na/K”，点击确定。

将“输出”选项卡下面的表节点添加到数据流中，并与导出节点连接。

双击打开表，并点击运行，可以看到数据中新增NaToK列。

将“图形”选项卡下面的图节点添加到数据流中，并与导出节点连接。

双击打开图节点，X字段选择“Na”；Y字段选择“K”；颜色选择“Drug”，点击运行。

在生成的散点图中，Drug用5中颜色就行了表示，其中黄色（drugY）处于图形下方，说明K低于0.04时，绝大部分使用drugY。

回到图节点设置窗口，将颜色中的Drug去除，在面板中选中Drug，点击运行。

在生成的散点图中，根据Drug的类型分成了5个散点图来显示。

3 分布图

仍然采用Drug.sav的数据流。

将“图形”选项卡下面的分布节点添加到数据流中，并与导出节点连接。

双击打开分布节点，字段中选择Drug，其他保持默认，点击运行。

在生成的图形中，分别给出了5中drug的百分比。

回到分布节点的设置窗口，在颜色中选择BP，点击运行。

在生成的图形中，除了给出5种drug的分布外，还给出了每种drug中BP的比例，其中drugA和drugB中仅包含高血压，drugC中仅包含低血压。

4 直方图

仍然采用Drug.sav的数据流。

将“图形”选项卡下面的直方图节点添加到数据流中，并与导出节点连接。

双击打开直方图节点，字段选择“NaToK”，其他保持默认，点击运行。

在生成的图形中，给出了NaToK变量的分布情况。

回到直方图设置窗口，颜色选择Drug，点击运行。

在生成的图形中，不仅给出了NaToK的分布，而且给出了Drug的分布，即当NaToK大于15后，Drug均为drugY。

5 网络图

仍然采用Drug.sav的数据流。

将“图形”选项卡下面的网络节点添加到数据流中，并与导出节点连接。

双击打开网络节点，字段中加入BP和Drug（用于研究两者的关系），点击运行。

注意：虽然可以选择三个以上的变量，但是网络图会很复杂，失去图形直观的优势，所以建议分成变量两两之间的网络图。

在生成的图形中，HIGH和drugY，NORMAL和drugX的关系比较强。

回到网络设置窗口，字段中加入Cholesterol和Drug（用于研究两者的关系），点击运行。

在生成的图形中，HIGH和drugY，NORMAL和drugX的关系比较强。

6 多重散点图

仍然采用Drug.sav的数据流。

将“图形”选项卡下面的多重散点图节点添加到数据流中，并与导出节点连接。

双击打开多重散点图，X字段选择Age；Y字段选择NaToK；面板选择Drug，点击运行。

在生成的图形中，按照Drug的类别分成了5个图形。NaToK的值处于20左右时仅对应drugY；在drugA和drugB的图中，NaToK的值均处于10左右，但是Age低于50时对应drugA，而Age高于50时对应drugB。

获取案例数据，请关注微信公众号并回复:`Modeler_dt6`

Comments

Make a comment

Index