秩和检验秩和检验假设检验通常可划分为参数检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十二章秩和检验
假设检验通常可划分为参数检验(parametric test)和非参数检验(nonparametri c test)两大类。
以特定的总体分布为前提,对未知的总体参数作推断的假设检验方法统称为参数检验。
前面章节介绍的t检验和方差分析均要求样本来自正态总体,属于参数检验。
非参数检验不以特定的总体分布为前提,也不对总体参数作推断,故也称为任意分布检验(distribution-free test)。
非参数检验具有广泛的适用性。
由于总体不必服从特定分布,无论资料总体分布形式如何,一端或两端无界,甚至分布未知,都能适用。
在非参数检验中,一般不直接用样本观察值做分析,统计量的计算是基于原始数据在整个样本中按大小所占的位次。
由于非参数检验没有利用观察值的具体数值,而只利用了其大小次序的信息,信息利用不够充分,故凡适合参数检验的资料,应首选参数检验。
但当总体分布不明确时,则应采用非参数检验。
尤其对于那些难以确定分布又出现少量离群值的小样本数据,非参数检验在剔除这些数据前后所得结论显示出了较好的稳健性。
非参数检验方法很多,有秩和检验(rank sum test)、符号检验、游程检验、等级相关分析等。
本章介绍在非参数检验中占有重要地位且检验功效相对较高的秩和检验。
第一节Wilcoxon符号秩和检验
1945年Wilcoxon提出的Wilcoxon符号秩和检验(Wilcoxon singned-rank tes t),亦称符号秩和检验,可用于配对设计计量差值的比较,还可用于单一样本与总体中位数的比较。
一、配对设计的两样本比较
(一) 本法的基本思想与步骤
配对设计资料主要是对差值进行分析。
通过检验配对样本的差值是否来自中位数为0的总体,来推断两个总体中位数有无差别,即推断两种处理的效应是否不同。
现以例12.1说明其基本思想与步骤。
例12.1 某研究用甲、乙两种方法对某地方性砷中毒地区水源中砷含量(mg
/L)进行测定,检测10处,测量值如表12.1的(2)、(3)栏。
问两种方法的测定结果有无差别?
表12.1 甲、乙两种方法测定某地区10处水源中砷含量的结果(mg/L)
测定点序号水中砷含量差值
i
d正差值秩次负差值秩次
(1) 甲法
(2)
乙法
(3) (4)=(2)-(3) (5) (6)
1 0.010 0.015 -0.005 - 2
2 0.060 0.070 -0.010 - 3
3 0.320 0.300 0.020 5.5 -
4 0.150 0.170 -0.020 - 5.5
5 0.005 0.005 0.000 --
6 0.700 0.600 0.100 8 -
7 0.011 0.010 0.001 1 -
8 0.240 0.255 -0.015 - 4
9 1.010 1.245 -0.235 -9
10 0.330 0.305 0.025 7 -
合计---21.5(T+)23.5(T-)本例为定量数据配对设计的小样本资料,其配对差值经正态性检验得
0.717
W=,0.001
P=,即差值不服从正态分布,故不宜选用配对t检验,而应使用Wilcoxon符号秩和检验。
1. 建立检验假设,确定检验水准
H:两种方法测定结果差值的总体中位数等于0
1
H:两种方法测量结果差值的总体中位数不等于0
0.05
α=
2. 计算检验统计量T值
(1) 求差值
i
d,见表12.1第(4)栏。
(2) 编秩依差值的绝对值由小到大编秩。
当差值为0,舍去不计,n随之减少;当差值绝对值相等,若符号不同,求平均秩次;若符号相同,既可顺次编秩,也可求平均秩次,并将各秩次冠以原差值的正、负号。
本例,因5号测定点差值为0,不参与编秩,n随之减1,即有效对子数为9。
编秩时,差值为“0.020”和“-0.020”所占位次为5、6,但由于两个差值符号不同,必须取平均秩次(56)/2 5.5
+=。
(3) 分别求正、负秩和 计算正差值的秩和T +和负差值的秩和T -。
由于总有(1)/2T T n n +-+=+,故T +大时,T -必然小;反之T +小时,T -必然大。
本例,21.5T +=,23.5T =-,9(91)/245T T +-+=+=,表明秩和计算无误。
(4) 确定检验统计量T 任取T +或T -作为检验统计量T 。
本例取21.5T =或23.5T =。
3. 确定P 值,作出统计推断 (1) 查表法:
当50n ≤时,根据n 和T 查附表10,T 界值表(配对比较的符号秩和检验用)。
查表时,自左侧找到n ,用所得统计量T 值与相邻一栏的界值相比较,若T 值在上、下界值范围内,其P 值大于相应的概率;若T 值恰好等于界值,其P 值一般等于相应概率;若T 值在上、下界值范围外,其P 值小于相应概率,此时右移一栏,再做比较,直至较好地估计出P 值。
由附表10可知,按照0.05α=水准,当5n ≤时,配对符号秩和检验不能得出双侧有统计学意义的概率,故n 必须大于5。
本例,由10n = ,21.5T =或23.5T =查附表10,得0.10P >。
按照0.05α=水准不拒绝0H ,差异无统计学意义,尚不能认为甲、乙两种方法测定水源中砷含量有差别。
(2) 正态近似法:
随着n 的增大,T 分布逐渐逼近均数为(1)/4n n +,方差为(1)(21)/24n n n ++的正态分布。
当50n >时,近似程度较满意,可由公式(12.1)计算标准正态统计量:
Z (12.1)
式中0.5为连续性校正数,因为Z 值是连续的,而T 值却不连续。
排序时,出现相同秩次的现象称为相持(tie)。
当相持的情形较多时(如个体数超过25%),按式(12.1)计算的Z 值偏小,可用公式(12.2)计算校正的统计量c Z ,经校正后,c Z 适当增大,P 值相应减小。
c Z (12.2)
式中j t (j=1,2,…)为第j 个相同秩次(即平均秩次)的个数,例如有2个差值为“1.5”,3个差值为“6”,5个差值为“13”,则1t =2,2t =3,3t =5,故有
3333()(22)+(33)+(55)=150j j t t ----∑=,若无相同秩次,则3
()j j t t -∑=0,c Z Z =。
Wilcoxon 配对符号秩和检验的基本思想:在配对样本中,由于随机误差的存在,其对差值的影响不可避免。
假定两种处理的效应相同,则差值的总体分布为对称分布,并且差值的总体中位数为0。
若此假设成立,样本差值的正秩和与负秩和应相差不大,均接近(1)/4n n +;当正负秩和相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝0H 。
二、单一样本与总体中位数比较
Wilcoxon 符号秩和检验的目的是推断样本中位数与已知总体中位数(常为标准值或大量观察的稳定值)有无差别,常用于不满足单样本t 检验应用条件的资料。
单样本资料符号秩和检验的方法步骤见例12.2。
例12.2 某医生从其接诊的不明原因脱发患者中随机抽取14例,测得其发铜含量(μg/g)见表12.2。
已知该地健康人群发铜含量的中位数为11.2μg/g 。
问脱发患者发铜含量是否低于健康人群?
表12.2 14名不明原因脱发患者发铜含量(μg/g)测定结果
发铜含量i x
差值i d 正差值秩次
负差值秩次
(1) (2)=(1)-11.2 (3) (4) 6.11
-5.09 - 14 6.20 -5.00 - 13 6.27 -4.93 - 12 6.58 -4.62 - 11 6.78 -4.42 - 10 7.22 -3.98 - 9 7.31 -3.89 - 8 8.52 -2.68 - 7 9.59 -1.61 - 6 9.72 -1.48 - 5 10.63 -0.57 - 4 11.16 -0.04 - 2 11.23
0.03
1
-
11.32 0.12 3 - 合计
-
4(T +)
101(T -)
根据专业知识可知,发铜含量值呈明显偏态分布,表12.2第(2)栏为样本各观察值与已知总体中位数的差值,对i d 做正态性检验得0.861W =,0.031P =,不满足单样本t 检验条件,故选用Wilcoxon 符号秩和检验。
1. 建立检验假设,确定检验水准
0H :差值的总体中位数等于0,即脱发患者发铜含量与该地健康人群相同 1H :差值的总体中位数小于0,即脱发患者发铜含量低于该地健康人群
单侧0.05α= 2. 计算检验统计量
(1) 求差值 11.2i i d x =-,见表12.2第(2)栏。
(2) 编秩 依差值的绝对值由小到大编秩。
本例,各观察值差值的秩次见表12.2第(3)、(4)栏。
(3) 分别求正、负秩和 本例,4T +=,101T =-,14(141)
1052
T T +-++==,
表明秩和计算无误。
(4) 确定检验统计量T 本例,4T T +==或101T T -==。
3. 确定P 值,作出统计推断
本例,由14n =,4T =或101T =查附表10,得单侧0.01P <。
按照0.05α=水准,拒绝0H ,接受1H ,差异有统计学意义,可以认为脱发患者发铜含量低于该地健康人群 。
第二节 成组设计两样本比较的秩和检验
Wilcoxon 秩和检验(Wilcoxon rank sum test),目的是推断连续型变量资料或有序变量资料的两个独立样本代表的总体分布位置是否有差别。
一、原始数据的两样本比较
原始数据为连续性变量资料,方法步骤见例12.3。
例12.3 某地职业病防治欲比较使用二巯基丙磺酸钠与二巯基丁二酸钠的驱汞效果。
将22例汞中毒患者随机分配到两组,分别测定并计算出两组驱汞的
排汞比值,并将结果列于表12.3。
试问两药驱汞效果有无差别?
表12.3 两种驱汞药物排汞效果比较
丁二酸钠
丙磺酸钠
排汞比值 秩次 排汞比值 秩次 0.93 1.5 0.93 1.5 1.19 3 3.34 8 2.46 4 4.82 12 2.60 5 5.22 13 2.62 6 6.11 14 2.75 7 6.13 15 3.50 9 6.34 16 3.83 10 6.80 17 3.83 11 7.28 18 8.50 19 8.54 20 12.59 21
14.92 22 110n =
175.5T =
212n =
2177.5T =
该资料为比值数据,不服从正态分布,现采用Wilcoxon 秩和检验。
1. 建立检验假设,确定检验水准
0H :两种药物排汞比值的总体分布位置相同 1H :两种药物排汞比值的总体分布位置不同
0.05α=
2. 计算检验统计量T 值
(1) 编秩 将两组数据由小到大统一编秩。
编秩时,遇相同数值在同一组内,可顺次编秩;当相同数值出现在不同组时,则必须求平均秩次。
如本例,两组数值中各有一个0.93,所占位次为1和2,因属于不同组,则必须取平均秩次为(12)/2 1.5+=;而有两个3.83,因出现在同一组中,可顺次编秩为10、11,不必求平均秩次。
(2) 求各组秩和 以样本例数较小者为1n ,其秩和为1T 。
设12N n n =+,则有12(1)/2T T N N +=+。
本例22N =,1222(221)/2253T T +=+=,经验证,秩和计算准确无误。
(3) 确定检验统计量T 值 若12n n ≠,则1T T =;若12n n =,则1T T =或2T T =。
本例,12n n ≠,故175.5T T ==。
3. 确定P 值,作出统计推断
(1) 查表法 当110n ≤,且2110n n -≤时,查附表11,T 界值表(两样本比较的秩和检验用)。
先找到1n 与21n n -相交处所对应的4行界值,将检验统计量T 值与T 界值表中逐行相比。
若T 值在界值范围内,其P 值大于相应概率;若T 值恰好等于界值,其P 值一般是等于相应概率;若T 值在界值范围外,其P 值小于相应概率,此时下移一行,再做比较,直至较好地估计出P 值。
本例,由110n =,21n n -=2,75.5T =查附表11,得双侧0.0050.01P <<。
按照0.05α=水准,拒绝0H ,接受1H ,差异有统计学意义,可认为两种驱汞药物的排汞效果有差别。
丁二酸纳组平均秩次为75.5/10=7.55,丙磺酸钠组平均秩次为177.5/12=14.79,可认为丙磺酸钠驱汞效果好于丁二酸钠。
(2) 正态近似法
当110n >或2110n n ->时,超出附表11的可查范围,根据中心极限定理,这时1T 的分布已接近均数为1(1)/2n N +,方差为12(1)/12n n N +的正态分布,故可由公式(12.3)计算Z 值:
12
/)1(5
.02/)1(211+-+-=
N n n N n T Z (12.3)
式中0.5为连续性校正数,因为T 值不连续,而Z 值是连续的。
当相持出现较多(如超过25%)时,按式(12.3)计算的Z 值偏小,可改用公式(12.4)进行校正:
c
Z Z C =
(12.4)
其中)()13
3N N t t c j j --=∑-(,)21
(⋅⋅⋅=,,j t j 为第j 次相持的秩次个数。
二、等级资料的两样本比较
例12.4 某医生欲比较中西医疗法与西医疗法治疗急性肾盂肾炎的临床疗效,将患者随机分为两组,分别给予中西医疗法或西医疗法治疗,并观察疗效,结果见表8.3,问两种疗法疗效是否有差别?
表12.4 两种疗法治疗急性肾盂肾炎的疗效 疗效
患者数
秩次范围
平均秩次
秩和
中西医疗法
西医疗法
合计
中西医疗
法
西医疗法
(1) (2) (3) (4) (5) (6) (7)=(2)(6)
(8)=(3)(6) 痊愈 36 18 54 1~54 27.5 990 495 显效 18 12 30 55~84 69.5 1251 834 进步 34 30 64 85~148 116.5 3961 3495 无效 4 8 12 149~160
154.5
618 1236 合计
92
68
160
—
—
6820
6060
1. 建立检验假设,确定检验水准
0H :两种疗法治疗急性肾盂肾炎的疗效总体分布位置相同 1H :两种疗法治疗急性肾盂肾炎的疗效总体分布位置不同
0.05α=
2. 计算检验统计量T 值
(1) 编秩 将两组数据按等级顺序由小到大统一编秩。
先按组段计算各等级的合计人数,见表12.4第(4)列,由此确定第(5)列各组段秩次范围,然后计算出各组段的平均秩次,见第(6)列。
如疗效为“痊愈”共54例,秩次范围为1~54,平均秩次为(1+54)/2=27.5,余仿此。
(2) 求各组秩和 以各组段的平均秩次分别与各等级例数相乘,再求和得到T 1,T 2,见第(7)、(8)列。
(3) 确定统计量T 值 本例1n =68,2n =92,检验统计量T =6060。
由于超出了两样本比较的秩和检验用的T 界值表范围,需用Z 检验。
每个等级的人数为相同秩次的个数,即j t ,由于相持较多,故需按式(12.3)和式(12.4)计算C Z 值。
2.0210Z =
=
3333333
1()/()
(5454)(3030)(6464)(1212)
10.8906
160160
j j t t N N c =----+-+-+-=-
=-∑
2.0210 2.1415C Z ===
3. 确定P 值,作出统计推断
查t 界值表(附表3,ν→∞),得0.02<P <0.05,按α=0.05水准拒绝H 0,接受H 1,差异有统计学意义,可认为两种疗法疗效分布不同。
中西医疗法组平均
秩次为6820/92=74.1,西医疗法组平均秩次为6060/68=89.1,可以认为中西医疗法治疗急性肾盂肾炎效果较好。
三、本法的基本思想
Wilcoxon 秩和检验的基本思想:假设含量为1n 与2n 的两个样本(且12n n ≤),来自同一总体或分布相同的两个总体,则1n 样本的秩和1T 与其理论秩和
1(1)/2n N +相差不大,即[11(1)/2T n N -+]仅为抽样误差所致。
当二者相差悬殊,
超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝0H 。
第三节 成组设计多个样本比较的秩和检验
多组独立样本比较的秩和检验是由Kruskal 和Wallis 在Wilcoxon 两样本秩和检验的基础上扩展而来,又称Kruskal -Wallis H 秩和检验,用于推断非正态分布定量变量或有序分类变量的多个总体分布位置有无差别。
一、 原始数据的多个样本比较
例12.5 某医师检测3种卵巢功能异常患者血清中促黄体素的含量(U/L)资料见表12.5第(1)、(3)、(5)栏。
问3种患者血清中促黄体素的含量(U/L)是否有差别?
表12.5 三种卵巢功能异常患者血清中促黄体素的含量(U/L)
卵巢发育不良
丘脑性闭经 垂体性闭经 促黄体素含量 (1) 秩次
(2) 促黄体素含量 (3) 秩次
(4) 促黄体素含量 (5) 秩次
(6) 31.38 17
1.67 1
1.90 3 33.60 18 1.74 2
2.10 4 35.12 19
3.32 6 2.75 5 35.76 20
4.59 7.5 4.59 7.5 38.31 21 6.71 10
5.98 9 40.50 22 9.45 11.5 9.45 11.5 42.50 23 10.21 13 10.86 15 50> 24
10.51 14
11.14 16
i R 164 65 71 i n 8
8 8 i R
20.500
8.125
8.875
这是定量资料多组独立样本的比较,并且该数据属于一端无确切值的资料,不能采用方差分析,现用Kruskal-Wallis H 秩和检验进行分析。
1. 建立检验假设,确定检验水准
0H :3种卵巢功能异常患者血清中促黄体素的含量总体分布位置相同 1H :3种卵巢功能异常患者血清中促黄体素的含量总体分布位置不全相同
0.05α=
2. 计算检验统计量H 值 (1) 编秩 编秩方法同例12.3。
将三组数据由小到大统一编秩,遇相同数值在同一组内,可顺次编秩;当相同数值出现在不同组时,则必须求平均秩次。
见表12.5第(2)、(4)、(6)栏。
本例,三组数值中有两个“4.59”,并在不同组,所占位次为7和8,各取平均秩次为
(78)/27.5+=;同样有两个“9.45”也在不同组,它们的位次为11和12,各取平
均秩次为(1112)/211.5+=。
(2) 求各组秩和i R 分别计算各组秩和i R ,下标i 表示组序(1,2,,i k =⋅⋅⋅)。
本例1164R =,2R =65,3R =71。
(3) 计算检验统计量H 值 用公式(12.5)计算H 值。
∑+-+=)1(3)1(12
2N n R N N H i
i (12.5) 式中i n 为各组例数,k n n n N +⋅⋅⋅++=21,i R 为各组秩和。
本例222
121646571()3(241)15.4124(241)888
H =
++-⨯+=⨯+ 当相持出现较多时,由式(12.5)求得H 值偏小,可用公式(12.6)进行校正得c
H 值。
c
H
H c =
(12.6) 其中)()(13
3N N t t c j j ---=∑,j t 为第j 次相持时相同秩次的个数。
本例相同秩次较少,无需校正。
3. 确定P 值,作出统计推断
(1) 查H 界值表(附表12,三样本比较的秩和检验用) 当组数3k =,且各组例数5i n ≤时,可查H 界值表得到P 值。
因本例3k =,各组例数均为8,超出H 界值表的范围,不能通过查H 界值。