SPSS Modeler的数据流

Reads: 2538 Edit

1 数据流模式

SPSS Modeler最大的特点是:基于数据流的处理和运行模型,将数据挖掘的过程比作生产的流水线,将数据作为生产加工的原料,而数据导入、数据处理、模型估计等功能作为生产加工的节点。数据通过设定好的线路依次通过各个处理节点,最后完成数据挖掘的任务!

主窗口的下面为节点功能区,按照节点的功能分成了源、记录选项、字段选项、图形、建模、输出、导出等组别。源选项卡下面包含了数据导入功能的节点,记录选项卡下面包含了样本处理操作的节点,...。

mdl-2

2 节点的基本操作

2.1 将节点添加到流编辑区域。

有三种方式可以将节点添加到流编辑区域。一是直接双击需要添加的节点,二是将鼠标移动到需要添加的节点,按住鼠标左键拖动节点到需要流编辑区域中然后松开鼠标左键。三是将鼠标移动到需要添加的节点,点击鼠标右键后,旁边会出现“添加到流”的菜单,在用鼠标左键点击该菜单,即可完成添加。

这里我们以源选项卡下面的可变文件节点为例,直接点击鼠标左键将其拖动到流编辑区域!

mdl-3

按照同样的方式,将字段选项下面的类型节点添加到流编辑区域。

mdl-4

2.2 流编辑区域中节点的基本操作

我们可以把节点想象成Windows系统中的桌面图标,其操作也十分类似,可以对节点做如下操作。

  • 单选: 鼠标左键点击节点即可单选该节点,此时节点背景变为黄色。

  • 多选: 点击鼠标左键并移动框选,即可实现选中多个节点。

  • 复制/粘贴: 可以通过“Ctrl+C”和“Ctrl+V”实现节点的复制粘贴功能。

  • 删除: 在节点上点击鼠标右键,然后再出现的菜单中选择删除,即可删除该节点。

  • 移动: 按住鼠标左键拖动节点即可移动节点的位置。

  • 设置: 双击节点,即可打开节点参数设置的窗口。

以可变文件节点为例,双击后可以打开节点参数设置的窗口,如下图所示,具体参数设置这里不在讨论。

mdl-5

  • 连接: 连接是节点的核心操作,由于SPSS Modeler是基于数据流的运行模型,所以必须建立好节点之间的连接关系。节点的连接方法主要有两种。第一种是将鼠标移动到节点上,点按鼠标中键(滑轮)并拖动到需要连接的节点,松开鼠标中键即可建立两个节点的连接。第二种是将鼠标移动到节点上,点按鼠标右键,然后在出现的菜单中点击“连接”选项,之后再用鼠标左键点击需要连接的节点,即可建立两个节点的连接。

mdl-6

  • 删除连接: 当不需要节点之间的连接时,可以将鼠标移动到连接线上并点击鼠标右键,会出现“删除连接”的菜单,点击“删除连接”菜单即可将连接删除!

mdl-7

  • 超级节点: 数据流中的节点太多,流编辑区域显示不全,或者数据流的线路过于复杂,难以看出主要的数据流。此时可以将多个节点合并成一个超级节点,使流区域的显示更加清晰。同时,可以通过右建超级节点选择“放大”来显示超级节点内部的节点。

在前面流的例子中,将建模选项卡下面的c5.0节点添加到数据流。我们想将可变文件节点和类型节点合并成超级节点。

mdl-8

将可变文件节点和类型节点同时选中,然后右键点击“创建超级节点”。

mdl-9

可以发现,可变文件节点和类型节点在数据流中显示为一个超级节点(五角星图形)。

mdl-10

右建超级节点选择“放大”来显示超级节点内部的节点。在任何区域右键选择“缩小”返回主界面的数据流。

mdl-11

如果不需要超级节点了,可以右键超级节点,选择展开,则其内部的节点会再次连接到主界面的数据流上。

mdl-12

2.3 新建流/保存流

打开SPSS Modeler软件时,会自动创建流1,如果想再创建一个数据流,可以在流管理区域右键空白区域,然后点击新建流。

mdl-13

流管理区域将新增流2图标,可以点击流1和流2图标来切换两个数据流的编辑区域。

mdl-14

完成流编辑后,可以在流管理区域右键空白区域,然后点击保存流,选择保存的位置,下次可以直接双击打开此数据流。

mdl-15


Comments

Make a comment