1 功能描述
独立样本本T检验主要用于检验两个变量的均值是否相等。
2 分组变量的独立样本T检验
我们以creditpromo.sav的数据为例进行演示,商家为了验证信用卡减息是否能促进用户的消费,给与部分用户减息优惠,而另一部分用户没有优惠,经过一段时候后分别收集了两组用户的花费情况,据此检验两组用户的消费水平是否存在差异。
双击打开creditpromo.sav数据文件,其中第1列为用户id;第2列为用户分组标识,0表示正常用户,1表示减息用户;第3列为用户的花费数据。
在数据窗口中,依次点击“分析/比较平均值/独立样本T检验”。
在弹出的“独立样本T检验”窗口,将dollars变量移到右侧的“检验变量”框,将insert变量移到右侧的“分组变量”框,然后点击定义组。
在弹出的“定义组”窗口,选中“使用指定值”,组1输入0,组2输入1,(0和1分别是insert分类变量的两个取值),点击继续返回“独立样本T检验”窗口。
点击“独立样本T检验”窗口中的确定按钮,进行运算。
运算结束后,输出窗口将给出组统计和独立样本检验两个表。
组统计表给出了两组用户花费的平均值;
独立样本检验中,两组样本方差相等性检验的F统计量为1.190,显著性为0.276,大于0.05,因而接受两组样本方差相等的原假设;平均值相等性的T检验中,第一行的显著性(方差相等)为0.024,因而拒绝两组样本均值相等的原假设,即两组样本的均值不等,结合组统计表的结果可知,信用卡减息能促进用户的消费。
3 连续变量的独立样本T检验
我们以cellular.sav的数据为例进行演示。电信商对用户的忠诚度进行了评分,然后比较得分高于50分和得分低于50的两组用户的每月通信时长是否存在差异。
双击打开cellular.sav数据文件,其中第1列为用户每月通信时长(minutes);最后1列为电信商对用户的评分(score)。
由于score变量是连续性变量,不能直接使用T检验方法,所以需要按照一定的临界值对score进行分组后再进行T检验。
在数据窗口中,依次点击“分析/比较平均值/独立样本T检验”。
在弹出的“独立样本T检验”窗口,将minutes变量移到右侧的“检验变量”框,将score变量移到右侧的“分组变量”框,然后点击定义组。
在弹出的“定义组”窗口,选中“分割点”并输入50;点击继续返回“独立样本T检验”窗口。
点击“独立样本T检验”窗口中的确定按钮,进行运算。
运算结束后,输出窗口将给出组统计和独立样本检验两个表。
组统计表给出了得分大于50分合得分小于50分两组用户每月通信时长的平均值;
独立样本检验中,两组样本方差相等性检验的F统计量为0.966,显著性为0.327,大于0.05,因而接受两组样本方差相等的原假设;平均值相等性的T检验中,第一行的显著性(方差相等)为0.000,因而拒绝两组样本均值相等的原假设,即两组样本的均值不等,结合组统计表的结果可知,得分大于50分的用户每月通信时长更高。