医学统计学 -第10章 基于秩次的非参数检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样品编号
电极法 分光光度法
差值
1
10.5
8.8
1.7
2
21.6
18.8
2.8
3
14.9
13.5
1.4
4
30.2
27.6
2.6
5
8.4
9.1
-0.7
6
7.7
7.0
0.7
7
16.4
14.7
1.7
8
19.5
17.2
2.3
9
127.0
155.0
10
18.7
16.3
-28.0 2.4
11
9.5
9.5
0.0
T+=43.5,
表 3 种方法治疗胰腺癌患者生存月数比较
甲法
乙法
丙法
3
6
2
4
9
3
7
10
5
8
12
7
8
13
8
27
分析步骤
1.建立检验假设,确定检验水准(α)
H0:3种方法疗效的总体分布相同 H1:3种方法疗效的总体分布不全相同 α=0.05
2.混合编秩 将各组数据混合,由小到大编秩。遇有
原始数据相同时,则取它们的平均秩次。
当偏离超出给定的范围时,即P≤a,从而拒绝H0
判断准则:
T在界值范围内
P>α
T在界值范围外或等于界值时 P≤α
确定P值,推断
本例n1=7,n2=7,T=T1=71.5, 查T界值表: T0.05(n1=7,n2=7)=36~69 由于T位于界值范围之外,所以P<0.05,拒绝
H0,接受H1,可以认为两种药物杀灭钉螺的 效果有差别,由于甲药的平均秩次10.2大于 乙药的4.8,因此可以推断甲药的杀灭效果要 比乙药好。
当n≤50时,通过查T界值表来确定是否波动过
大
T在界值范围内,波动不大
P>α
T在界值范围外或等于界值时,波动大,P≤α
11
(4) 查表及推断结论 查T界值表T0.05(16)=29~107 由于T=28在上下界值范围外,所以P≤0.05。 按a=0.05检验水准拒绝H0,接受H1,可以 认为该厂工人尿铅含量不当地正常人有差异, 通过正负秩和的大小可以推断工人的尿铅含 量要高于正常人。
第十章 基于秩次的非参数检验
1
假设检验的方法分为两类
参数检验(parametric test)
已知总体分布类型,对未知参数(μ、π)进行统计推断 依赖于特定分布类型,比较的是参数 一般有严格的适用条件
如:样本来自正态分布、总体方差齐同等 这类方法比如:t检验、F检验等
非参数检验(nonparametric test)
12
例子10.2
对11份工业污水测定氟离子浓度(mg/L),每份水样同 时采用电极法和分光光度法测定,结果如下表。问两 方法的检测结果有无差别?
表 两种方法测定 11 份工业污水中氟离子浓度
样品编号
电极法
分光光度法
差值
1
10.5
8.8
1.7
2
21.6
18.8
2.8
3
14.9
13.5
1.4
4
30.2
表 某地居民夏冬两季体内核黄素含量比较
时间
缺乏
不足
适宜
合计
夏季 冬季
10
14
16
40
22
18
4
44
合计
32
32
20
84
秩次范围 1-32
33-64 65-84
平均秩次 16.5
48.5
74.5
统计量为例数较小的一组(夏季n1=40)秩和: T=16.5×10 + 48.5×14 + 74.5×16
=2036
尿铅 (1) 3.13 3.27 3.54 4.38 4.38 5.05 6.08 11.27
差值 (2)=(1)-2.50
0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
分析步骤与基本思想:
(1)建立检验假设,确定检验水准 Ho:差值总体中位数等于0 H1:差值总体中位数不等于0 α=0.05
2
非参数检验的概念
非参数检验(nonparametric test)又称为任意分 布检验(distribution-free test),这类方法并不 依赖总体分布的具体形式,也不针对总体分布的 参数进行推断,它是对总体的分布或分布位置进 行检验
优点:对总体分布没有要求,适用范围广 缺点:会丢失部分信息;满足参数检验条件时, 非参数检验犯II类错误的可能性大于参数检验方法, 即检验效率有所降低
5
第一节 配对资料的符号秩和检验
Wilcoxon于1945年提出符号秩检验 (Wilcoxon singned-rank test)
主要用于推断: (1)总体中位数是否等于某个指定值 (2)配对样本差值总体中位数是否为0
6
例子10.1
已知某地正常人尿铅含量的中位数为2.50μmol/L。今在该 地随机抽取16名工人,测定尿铅含量如下表,问该厂工人 的尿铅含量是否与当地正常人有差别?
例10.4 为了了解居民体内核黄素营养状况,某研 究人员于夏冬两季测定体内核黄素的含量,结果 如下表,问夏冬两季体内的核黄素含量有无差别?
表 某地居民夏冬两季体内核黄素含量比较
时间
缺乏
不足
适宜
合计
夏季
10
14
16
40
冬季
22
18
4
44
合计
32
32
20
84
23
H0:夏冬两季居民体内核黄素含量总体分布相同(总体中位数相等) H1:夏冬两季居民体内核黄素含量总体分布不同(总体中位数不等) α=0.05
差值 (2)=(1)-2.50
0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
秩次 (3) 7 8 9 12 12 14 15 16
T+=108, T-=28
9
分析步骤与基本思想:
(3)求秩和并确定统计量 差值为正的秩和以T+表示 差值为负的秩和以T-表示。 T++T-=n(n+1)/2
15
第二节两组独立样本比较的秩和检验
Wilcoxon秩和检验(Wilcoxon rank sum test)用于推断两样本代表的总体分布是 否有差别
适用于: (1)两样本均数比较 (2)两等级资料的比较
16
例子10.3
用两种药物杀灭钉螺,每批用200-300只活钉螺, 用药后清点钉螺的死亡数,并计算死亡率(%), 结果如下表,问两种药物杀死钉螺的效果有无差 别?
量要高于冬季的含量。
第三节 多组独立样本比较的秩和检验
多级比较的秩和检验是在两样本比较的Wilcoxon秩和 检验基础上扩展而来,称为Kruskal-Wallis H 检验。
此法的基本思想与两样本比较的Wilcoxon秩和检验相近: 如果各组总体分布相同,混合编秩号后,各组的平均秩次 应近似相等。
统计量为:
T=min(T+,T- )
T=min(T+,T-)=28
10
基本思想
如果H0成立,即差值的总体中位数为0,则理论上样本 的正负秩和应相等,即T值应为总秩和(n(n+1)/2) 的一半,即T=n(n+1)/4。由于存在抽样误差,T应在 理论值n(n+1)/4周围波动,如果T与理论值的差距太 大,超过了正常波动范围,则有理由认为假设不成立, 从而拒绝H0。
差值 (2)=(1)-2.50
-1.88 -1.72 -0.37 -0.02 0.04 0.18 0.23 0.51
秩次 (3) -12 -10 -5 -1 2 3 4 6
工人号
9 10 11 12 13 14 15 16
尿铅 (1) 3.13 3.27 3.54 4.38 4.38 5.05 6.08 11.27
27.6
2.6
5
8.4
9.1
-0.7
6
7.7
7.0
0.7
7
16.4
14.7
1.7
8
19.5
17.2
2.3
9
127.0
155.0
-28.0
10
18.7
16.3
2.4
11
9.5
9.5
0.0
13
H0:差值的总体中位数等于0,即二者测定结果没有差别 H1:差值的总体中位数不等于0 α=0.05
表 两种方法测定 11 份工业污水中氟离子浓度
Z
T n1(N 1) / 2 0.5
n1n2 (N 3 N
12N(N 1)
(t
3 j
t
j
))
2036 40(84 1) / 2 0.5
40 44 (843 84 (323 32) (323 32) (203 20)) 12 40 (84 1)
7.01
由于Z=7.01,大于Z0.05=1.96,所以P<0.05,按照α=0.05 检验水准拒绝H0,接受H1,可以认为夏冬两季居民体 内核黄素含量有差别。根据平均秩次可以知道夏季的含
表 某厂 16 名工人与当地正常人尿铅含量比较
工人号
1 2 3 4 5 6 7 8
尿铅 (1) 0.62 0.78 2.13 2.48 2.54 2.68 2.73 3.01
差值 (2)=(1)-2.50
-1.88 -1.72 -0.37 -0.02 0.04 0.18 0.23 0.51
工人号
9 10 11 12 13 14 15 16
秩次 4.5 9 3 8 -1.5 1.5 4.5 6 -10 7 -
T-=11.5
统计量T: T= min(T+,T-)= 11.5
查T界值表T0.05(10)=8~47 由于T=11.5在上下界值范围内,所以P>0.05。 按a=0.05检验水准不拒绝H0,因此还不能认为二者 检测结果有差异。
21
正态近似法
超出表的范围时按正态近似法采用Z检验
Z T n1(N 1) / 2 0.5 n1n2(N 1) /12
当相同秩次较多时,应进行校正
Z
T n1(N 1) / 2 0.5
n1n2 (N 3 N
12N(N 1)
(t
3 j
t
j
))
tj为第j个平均秩次的个数 22
等级资料两样本比较
13
38.0
51.5
14
40.5
n1=7
T1=71.5
n2=7
秩次 1 2 3 4 5.5 8 10
T2=33.5
统计量T
基本思想
如果H0成立, 即两总体分 布相同
两样本来自同一总体
两组的平均秩次不应相差太大
T 与理论秩和 n1(1 N) / 2 应相差不大,而是在其周围波
动。如果T值偏离太远,从H0得到目前样本的可能性就很小,
3
非参数检验适用的资料
总体分布为偏态或分布未知 等级资料 个别数据偏大或有不确定数据
<0.01mg, >150mg等
各总体方差不齐的样本均数的比较
4
内容提要:
➢ 单样本和配对资料的符号秩和检验 ➢ 两组独立样本比较的秩和检验 ➢ 多组独立样本比较的秩和检验 ➢ 多个独立样本间的多重比较 ➢ 随机化区组设计资料的秩和检验
表 两种药物杀死钉螺死亡率(%)的比较
甲药死亡率
乙药死亡率
32.5
16.0
35.5
22.5
40.5
26.0
40.5
28.5
49.0
32.5
49.5
38.0
51.5
40.5
基本步骤
1、建立假设
H0:两种药物杀灭钉螺死亡率的总体分布相同(中位数相等) H1:两种药物杀灭钉螺死亡率的总体分布不同(中位数不相等) α=0.05
(2)编秩:
•求差值 •编秩方法:依差值的绝对值从小到大编秩。 •编秩时注意两点:
(1)遇差值为0者,舍去不计,n相应减少; (2)差值的绝对值相等,应取平均秩次 •编秩后,按差值的正负给秩次冠上符号。
8
编秩
表 某厂 16 名工人与当地正常人尿铅含量比较
工人号
1 2 3 4 5 6 7 8
尿铅 (1) 0.62 0.78 2.13 2.48 2.54 2.68 2.73 3.01
28
表 3 种方法治疗胰腺癌患者生存月数比较
甲法 秩次 乙法 秩次
丙法
3
2.5
6
6
2
4
4
9
12
3
7
7.5
10
13
5
8
10
12
14
7
8
10
13
15
8
R 甲=34
R 乙=60
秩次 1 2.5 5 7.5 10
R 丙=26
3.计算检验统计量H 检验统计量值H可按下式计算:
H 12
Ri2 ቤተ መጻሕፍቲ ባይዱ3(N 1)
2、编秩,求统计计量
编秩原则:从小到大混合编秩,相同则取平均秩次。
统计量选择: T=样本量较小组n1的秩和(规定n1≤n2)
18
编秩
表 两种药物杀死钉螺死亡率(%)的比较
甲药死亡率 秩次
乙药死亡率
32.5
5.5
16.0
35.5
7
22.5
40.5
10
26.0
40.5
10
28.5
49.0
12
32.5
49.5
N(N 1) ni
式中,Ri为各组的秩和,ni为各组样本含 量,N为总样本含量。
H值近似服从自由度v=k-1的χ2分布,因此 按χ2界值表确定P值
30
H 12
Ri2 3(N 1)
N(N 1) ni
12
342 (
602
262
)
3(15
1)
15(15 1) 5 5 5
6.32
查卡方界值表, χ20.05(2)=5.99, H=6.32>χ20.05(2),所以P<0.05,拒绝H0,接 受H1,可以认为3种方法的疗效有差别。
Kruskal-Wallis H检验,用于推断计量资料或等级资料的 多个独立样本所来自的多个总体分布是否有差别。
H0:多个总体分布相同(或者中位数相等) H1:多个总体分布不同或不全相同(或者中位数不全相等)
26
例10.5
某医院用3种方法治疗15例胰腺癌患者,每种方 法各治疗5例,治疗后生存月数如下表,问3种方法的 疗效有无差别?