第10章__非参数检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第10章非参数检验
平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。由于这一类方法不涉及总体参数,因而称为非参数统计方法。
SPSS的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类:
1、分布类型检验方法:亦称拟合优度检验方法。即检验样本所在总体是否服从已知的理论分布。具体包括:
Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。
Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。
Runs Test:用于检验样本序列随机性。观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。
One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission 分布和指数分布。
2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。具体包括:
Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。
Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。
Two-Related-Samples Tests:配对设计的两样本秩和检验。
Tests for Several Related Samples:配伍设计的多样本秩和检验,此处同样不提供两两比较。
一、分布位置检验方法
1、Two Independent Samples Test与 K Independent Samples Test
用于检验两独立样本/多独立样本所在总体是否相同。
Two-lndependent-Samples Test对话框:
(1)Test Variable框,指定检验变量。
(2)Grouping Variable框,指定分组变量。Define Groups对话框,Groupl 和Groupl后的栏中,可指定分组变量的值。
(3)TestType框,确定用来进行检验的方法。Mann-Whitney U:默认值,相当于两样本秩和检验。Kolmogorov-Smimov Z:K-S检验的一种。Moses extreme reactions:如果施加的处理使得某些个体出现正向效应,而另一些个体出现负向效应,就应当采用该检验方法。Wald-Wolfowitz runs:游程检验的一种,检验总体分布是否相同。
(4)Options对话框,选择输出结果形式及缺失值处理方式。
多个独立样本检验中不同之处:
Define Range对话框,定义分组变量值范围。Minimum:分组变量范围的下限。Maximum:上限。
Test Type框,确定用来进行检验的方法。Kruskal-WallisH:默认值,单向方差分析,检验多个样本在中位数上是否有差异; Median:中位数检验,检验多个样本是否来自具有相同中位数的总体。
2、Two Related Samples Test与 K Related Samples Test
Two Related Samples Test是考察配对样本的总体分布是否相同,或者说差值总体是否以0为中心分布;K Related Samples Test则用于检验多个配伍样本所在总体的分布是否相同。
Two-Related-SamplesTests对话框:
(1)Test Pair(s)List框,指定检验变量对。可有多对。
(2)TestType框,确定检验的方法。Wilcoxon:默认值,配对设计差值的秩和检验,利用次序大小。Sign:符号检验,利用正负号。McNemar:配对卡方检验,适用于两分类资料,特别适合自身对照设计。Marginal Homogeneity:适用于资料为有序分类情况。(3)Options对话框中,选择输出结果形式及缺失值处理方式,
K Related SamplesTest 用于多组间的非参数检验,不同之处在于:
A、比较方法不同:
☆ Friedman:系统默认值,即最常用的随机区组设计资料的秩和检验,也被称为M检验。
☆ Kendall's W:该指标也被称为Kendall和谐系数,它表示的是K个指标间相互关联的程度(一致性程度),取值在0~1之间。
☆ Cochrarl's Q:是两相关样本McNemar检验在多样本情形下的推广,只适用于二分类变量。
B、Statistics对话框: Descriplive,描述统计量。Quartiles,四分位数。
二、分布类型检验方法
原理:计算实际分布与理论分布间的差异,根据某种统计量求出P值。
1、Chi-square test
与行×列表卡方检验区别:Chi-square test是检验分类数据样本所在总体分布(各类别所占比例)是否与已知总体分布相同,是一个单样本检验。行×列表卡方检验是比较两个分类资料样本所在的总体分布是否相同,在spss中要用crosstable菜单来完成。
具体做法:先按照已知总体的构成比分布计算出样本中各类别的期望频数,然后求出观测频数与期望频数的差值,最后计算出卡方统计量,利用卡方分布求出P 值,得出检验结论。
例5.1 某地一周内各日死亡数的分布如表所示,请检验一周内各日的死亡危险性是否相同?
周日一二三四五六日
死亡数 11 19 17 15 15 16 19
数据文件为death.sav:day 周日,death 死亡数。
Chi-Square Test对话框:
(1)Test Variable List框,指定检验变量,可为多个变量。
(2)ExpectedRange栏,确定检验值的范围。
Get from data选项,即最小值和最大值所确定的范围,系统默认该项。