Mann-Whitney U检验(两独立样本)-SPSS教程

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Mann-Whitney U检验(两独立样本)-SPSS
教程
一、问题与数据
某研究者想了解某工作岗位男性和女性的收入差异。

该研究者招募20名男性和20名女性,收集了每个研究对象的性别(变量名为gender)和每月平均收入水平(变量名为income)。

部分数据图1。

图1 部分数据
二、对问题分析
研究者想知道某工作岗位不同性别收入水平是否相同。

由于一般情况下收入水平不服从正态分布(仅为模拟数据,实际使用时需要专业判断或结合正态性检验结果),因此可以使用Mann-Whitney U检验。

使用Mann-Whitney U检验时,需要考虑以下3个假设。

假设1:有一个因变量,且因变量为连续变量或等级变量。

假设2:有一个自变量,且自变量为二分类。

假设3:具有相互独立的观测值。

三、SPSS操作
3.1 Mann-Whitney U检验
此处以旧对话框为例。

在主界面点击Analyze→Nonparametric Tests→Legacy Dialogs→2 Independent Samples,在Two-Independent-Samples Tests 对话框中,将变量income放入Test Variable List,将变量gender放入Grouping Variable,并确认勾选了Test Type中的Mann-Whitney U选项。

如图2。

图2 Two-Independent-Samples Tests
点击变量gender下方的Define Groups,将男性的赋值“1”填写至Group 1,将女性的赋值“2”填写至Group 2。

点击Continue→OK。

如图3。

图3 Define Groups
3.2 对数据分布的了解
Mann-Whitney U检验,其原理是将原始数据排序后分配秩次,再对秩次做假设检验。

因此,统计描述只能描述各组数据的“平均秩次”,假设检验的结果也只能表述为“各组数据分布的差异有无统计学意义”。

然而,“平均秩次”并不能充分反映各组数据的集中趋势。

我们知道,对于非正态分布数据,描述其集中趋势的较好指标是中位数(相对应的,对于正态分布数据,描述其集中趋势的较好指标是均数)。

因此,在做Mann-Whitney U检验(以及Kruskal-Wallis H 检验)前,需要首先对原始数据的分布形态做一个了解。

假设某研究关注不同教育程度(高中及以下、本科及以上)研究对象的年均收入,则年均收入的分布可能有2种情况(如图4)。

左侧的图表示各组年均收入的分布形状一致(分布形状一致代表变异一致),而右侧的图表示各组年均收入的分布形状不一致。

图4 数据分布示意图
因此,在做Mann-Whitney U检验(以及Kruskal-Wallis H检验)前,需要画直方图对各组数据的分布形状做一个了解(本例的模拟数据量较少,因此省去画直方图的操作。

实际研究中,应当首先做直方图)。

如果实际研究中,各组因变量的分布形状基本一致,则需要计算各组因变量的中位数,以便统计描述时汇报。

如果各组因变量的分布形状不一致,则在统计描述时不必汇报。

3.3 计算中位数
Mann-Whitney U检验并不直接给出中位数的具体数值,因此需要单独计算中位数。

在主界面栏中点击Analyze→Compare Means→Means,在Means对话框中,将income选入Dependent List框中,将gender选入Independent List框中。

如图5。

图5 Means
点击Options,出现Means: Options对话框。

将Cell Statistics框中的“Mean”、“Number of Cases”和“Standard Deviation”选回Statistics框中,并将Median 从Statistics框中选入Cell Statistics框中。

点击Continue→OK。

如图6。

图6 Means:Options
四、结果解释
4.1 Mann-Whitney U检验
Mann-Whitney U检验的最终结果如图7。

图7 Mann-Whitney Test
Test Statistics表格中Mann-Whitney U代表检验的U统计量值为148.000。

Asymp.Sig(2-tailed)代表渐进P值,Exact Sig[2*(1-tailed Sig.)]代表精确P值。

样本量越大,渐进P值就越接近真实P值。

当每个分组的样本量小于20时,SPSS 软件会自动计算精确P值,此时选择精确P值来判断检验假设。

当样本量大于
20时,渐进P值可以很好地代表真正的P值,因此选择渐进P值来判断检验假设。

本例中每组的样本量为20个,结果报告了精确P值为0.165,本例选用精确P 值判断检验假设,P值大于界值0.05,因此不能拒绝原假设,即不能认为男性和女性的收入水平分布有统计学差异。

4.2 描述中位数
假设本研究中,两组收入水平的分布形状基本一致,则报告结果时还应该报告各组评分的中位数。

Report表格给出了各组中位数,如图8。

图8 Report
五、撰写结论
5.1 两组收入水平的分布形状基本一致时
使用Mann-Whitney U检验判断男性与女性收入水平是否有差异。

根据直方图判断两组收入水平分布的形状基本一致。

男性收入水平的中位数为11160.00,
女性收入水平的中位数为10752.00。

Mann-Whitney U检验结果显示,男性与女性的收入水平差异无统计学意义(U=148.000,P=0.165)。

5.1 两组收入水平的分布形状不一致时
使用Mann-Whitney U检验判断男性与女性收入水平是否有差异。

根据直方图判断两组收入水平分布的形状不一致。

男性收入水平的平均秩次为23.10,女性收入水平的平均秩次为17.90。

Mann-Whitney U检验结果显示,男性与女性的收入水平差异无统计学意义(U=148.000,P=0.165)。

扩展阅读
Mann-Whitney U和Wilcoxon秩和检验的检验方法没有实质上的差别,检验原理和结果也完全等价,只是在计算统计量时略有差别,统计分析时写清楚用哪种方法即可。

SPSS中没有Wilcoxon秩和检验的模块,但Mann-Whitney U 检验会给出Wilcoxon秩和检验的统计量(图28.7 中Test Statistics的第二行);SAS则提供了Wilcoxon秩和检验的命令。

相关文档
最新文档