1 功能描述
数据读取到SPSS Modeler,并对变量进行变换操作后,可以用图形来直观观察下变量之间的关系和分布情况。在SPSS Modeler中关于图形的节点位于“图形”选项卡下面!我们通过几个例子来演示主要节点的用法。
2 散点图
我们以DRUG.sav数据集为例来演示,首先将其读取到SPSS Modeler中
将“源”选项卡下面的Statistics节点添加到数据流编辑区域。
双击打开Statistics节点,设置DRUG.sav数据文件的存放路径。
将“输出”选项卡下面的表添加到数据流中,并与Excel节点连接;
双击打开表节点,点击运行,可以看出数据成功读取到SPSS Modeler中。
将“字段选项”选项卡下面的类型节点添加到数据流中,并与Statistics节点连接。
将“字段选项”选项卡下面的导出节点添加到数据流中,并与类型节点连接。
双击打开导出节点。模式选择“单个”;导出字段输入“NaToK”;导出为选择“公式”;公式中输入“Na/K”,点击确定。
将“输出”选项卡下面的表节点添加到数据流中,并与导出节点连接。
双击打开表,并点击运行,可以看到数据中新增NaToK列。
将“图形”选项卡下面的图节点添加到数据流中,并与导出节点连接。
双击打开图节点,X字段选择“Na”;Y字段选择“K”;颜色选择“Drug”,点击运行。
在生成的散点图中,Drug用5中颜色就行了表示,其中黄色(drugY)处于图形下方,说明K低于0.04时,绝大部分使用drugY。
回到图节点设置窗口,将颜色中的Drug去除,在面板中选中Drug,点击运行。
在生成的散点图中,根据Drug的类型分成了5个散点图来显示。
3 分布图
仍然采用Drug.sav的数据流。
将“图形”选项卡下面的分布节点添加到数据流中,并与导出节点连接。
双击打开分布节点,字段中选择Drug,其他保持默认,点击运行。
在生成的图形中,分别给出了5中drug的百分比。
回到分布节点的设置窗口,在颜色中选择BP,点击运行。
在生成的图形中,除了给出5种drug的分布外,还给出了每种drug中BP的比例,其中drugA和drugB中仅包含高血压,drugC中仅包含低血压。
4 直方图
仍然采用Drug.sav的数据流。
将“图形”选项卡下面的直方图节点添加到数据流中,并与导出节点连接。
双击打开直方图节点,字段选择“NaToK”,其他保持默认,点击运行。
在生成的图形中,给出了NaToK变量的分布情况。
回到直方图设置窗口,颜色选择Drug,点击运行。
在生成的图形中,不仅给出了NaToK的分布,而且给出了Drug的分布,即当NaToK大于15后,Drug均为drugY。
5 网络图
仍然采用Drug.sav的数据流。
将“图形”选项卡下面的网络节点添加到数据流中,并与导出节点连接。
双击打开网络节点,字段中加入BP和Drug(用于研究两者的关系),点击运行。
注意:虽然可以选择三个以上的变量,但是网络图会很复杂,失去图形直观的优势,所以建议分成变量两两之间的网络图。
在生成的图形中,HIGH和drugY,NORMAL和drugX的关系比较强。
回到网络设置窗口,字段中加入Cholesterol和Drug(用于研究两者的关系),点击运行。
在生成的图形中,HIGH和drugY,NORMAL和drugX的关系比较强。
6 多重散点图
仍然采用Drug.sav的数据流。
将“图形”选项卡下面的多重散点图节点添加到数据流中,并与导出节点连接。
双击打开多重散点图,X字段选择Age;Y字段选择NaToK;面板选择Drug,点击运行。
在生成的图形中,按照Drug的类别分成了5个图形。NaToK的值处于20左右时仅对应drugY;在drugA和drugB的图中,NaToK的值均处于10左右,但是Age低于50时对应drugA,而Age高于50时对应drugB。