Mann-Whitney U检验(两独立样本)-SPSS教程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Mann-Whitney U检验(两独立样本)-SPSS
教程
一、问题与数据
某研究者想了解某工作岗位男性和女性的收入差异。
该研究者招募20名男性和20名女性,收集了每个研究对象的性别(变量名为gender)和每月平均收入水平(变量名为income)。
部分数据图1。
图1 部分数据
二、对问题分析
研究者想知道某工作岗位不同性别收入水平是否相同。
由于一般情况下收入水平不服从正态分布(仅为模拟数据,实际使用时需要专业判断或结合正态性检验结果),因此可以使用Mann-Whitney U检验。
使用Mann-Whitney U检验时,需要考虑以下3个假设。
假设1:有一个因变量,且因变量为连续变量或等级变量。
假设2:有一个自变量,且自变量为二分类。
假设3:具有相互独立的观测值。
三、SPSS操作
3.1 Mann-Whitney U检验
此处以旧对话框为例。
在主界面点击Analyze→Nonparametric Tests→Legacy Dialogs→2 Independent Samples,在Two-Independent-Samples Tests 对话框中,将变量income放入Test Variable List,将变量gender放入Grouping Variable,并确认勾选了Test Type中的Mann-Whitney U选项。
如图2。
图2 Two-Independent-Samples Tests
点击变量gender下方的Define Groups,将男性的赋值“1”填写至Group 1,将女性的赋值“2”填写至Group 2。
点击Continue→OK。
如图3。
图3 Define Groups
3.2 对数据分布的了解
Mann-Whitney U检验,其原理是将原始数据排序后分配秩次,再对秩次做假设检验。
因此,统计描述只能描述各组数据的“平均秩次”,假设检验的结果也只能表述为“各组数据分布的差异有无统计学意义”。
然而,“平均秩次”并不能充分反映各组数据的集中趋势。
我们知道,对于非正态分布数据,描述其集中趋势的较好指标是中位数(相对应的,对于正态分布数据,描述其集中趋势的较好指标是均数)。
因此,在做Mann-Whitney U检验(以及Kruskal-Wallis H 检验)前,需要首先对原始数据的分布形态做一个了解。
假设某研究关注不同教育程度(高中及以下、本科及以上)研究对象的年均收入,则年均收入的分布可能有2种情况(如图4)。
左侧的图表示各组年均收入的分布形状一致(分布形状一致代表变异一致),而右侧的图表示各组年均收入的分布形状不一致。
图4 数据分布示意图
因此,在做Mann-Whitney U检验(以及Kruskal-Wallis H检验)前,需要画直方图对各组数据的分布形状做一个了解(本例的模拟数据量较少,因此省去画直方图的操作。
实际研究中,应当首先做直方图)。
如果实际研究中,各组因变量的分布形状基本一致,则需要计算各组因变量的中位数,以便统计描述时汇报。
如果各组因变量的分布形状不一致,则在统计描述时不必汇报。
3.3 计算中位数
Mann-Whitney U检验并不直接给出中位数的具体数值,因此需要单独计算中位数。
在主界面栏中点击Analyze→Compare Means→Means,在Means对话框中,将income选入Dependent List框中,将gender选入Independent List框中。
如图5。
图5 Means
点击Options,出现Means: Options对话框。
将Cell Statistics框中的“Mean”、“Number of Cases”和“Standard Deviation”选回Statistics框中,并将Median 从Statistics框中选入Cell Statistics框中。
点击Continue→OK。
如图6。
图6 Means:Options
四、结果解释
4.1 Mann-Whitney U检验
Mann-Whitney U检验的最终结果如图7。
图7 Mann-Whitney Test
Test Statistics表格中Mann-Whitney U代表检验的U统计量值为148.000。
Asymp.Sig(2-tailed)代表渐进P值,Exact Sig[2*(1-tailed Sig.)]代表精确P值。
样本量越大,渐进P值就越接近真实P值。
当每个分组的样本量小于20时,SPSS 软件会自动计算精确P值,此时选择精确P值来判断检验假设。
当样本量大于
20时,渐进P值可以很好地代表真正的P值,因此选择渐进P值来判断检验假设。
本例中每组的样本量为20个,结果报告了精确P值为0.165,本例选用精确P 值判断检验假设,P值大于界值0.05,因此不能拒绝原假设,即不能认为男性和女性的收入水平分布有统计学差异。
4.2 描述中位数
假设本研究中,两组收入水平的分布形状基本一致,则报告结果时还应该报告各组评分的中位数。
Report表格给出了各组中位数,如图8。
图8 Report
五、撰写结论
5.1 两组收入水平的分布形状基本一致时
使用Mann-Whitney U检验判断男性与女性收入水平是否有差异。
根据直方图判断两组收入水平分布的形状基本一致。
男性收入水平的中位数为11160.00,
女性收入水平的中位数为10752.00。
Mann-Whitney U检验结果显示,男性与女性的收入水平差异无统计学意义(U=148.000,P=0.165)。
5.1 两组收入水平的分布形状不一致时
使用Mann-Whitney U检验判断男性与女性收入水平是否有差异。
根据直方图判断两组收入水平分布的形状不一致。
男性收入水平的平均秩次为23.10,女性收入水平的平均秩次为17.90。
Mann-Whitney U检验结果显示,男性与女性的收入水平差异无统计学意义(U=148.000,P=0.165)。
扩展阅读
Mann-Whitney U和Wilcoxon秩和检验的检验方法没有实质上的差别,检验原理和结果也完全等价,只是在计算统计量时略有差别,统计分析时写清楚用哪种方法即可。
SPSS中没有Wilcoxon秩和检验的模块,但Mann-Whitney U 检验会给出Wilcoxon秩和检验的统计量(图28.7 中Test Statistics的第二行);SAS则提供了Wilcoxon秩和检验的命令。