统计学 秩和检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
35
Biostatistics
H 的校正
当有相同秩次时,H 需校正:
C 1 ( t t j ) /[ N N )]
3 j 3
HC H / C
36
Biostatistics
例题(page89)
例8.3 某医院用三种复方小叶枇杷治疗老年 性慢性支气管炎,数据见表8.2第(1)~(4)栏, 试比较其疗效有无差异。
检验统计量T值
n1=8,n2=12,检验统计量T=127.5
确定P值和作出推断结论
查附表10得T界值是58~110。则双侧P<0.05,按 =0.05水准, 拒绝H0,接受H1,差异有统计学意义,故可认为在缺氧条件下 猫的生存时间较兔长。
21
Biostatistics
例题(page87)
例8.2 用复方猪胆胶囊治疗老年性慢性支气 管炎患者 403 例,疗效见表 8.1 第 (1)~ (3) 栏。 问该药对此两型支气管炎疗效是否相同?
缺氧条件下猫和兔的生存时间
兔 秩次 1 2 3 4 5 6 7 8 9.5 11 12 14
n1=8
20
T1=127.5
n2=12
T2=82.5
Biostatistics
例题
检验假设
H0 :猫和兔在缺氧条件下生存时间总体分布相同 ;
H1 :猫和兔在缺氧条件下生存时间总体分布不同 。
=0.05。
注:相同观察值不同组时取平均;相同组时,按位置顺序编号
29 Biostatistics
例题
【例】 某医生在研究再生障碍性贫血时,测 得不同程度再生障碍性贫血患者血清中可溶 性CD8抗原水平(U/ml),问不同程度再生 障碍性贫血患者血清中可溶性 CD8抗原水平 有无差别?
30
Biostatistics
建立检验假设
H0 :各组总体的等级分布相同; H1 :各组总体的等级分布不同或不全相同。 =0.05。 计算检验统计量H值
R 12 H 3( N 1) N ( N 1) ni
33 Biostatistics
2 i
多组等级比较的检验假设
12 49.5 2 149.5 2 1792 H ( ) 3(27 1) 16.250 27(27 1) 9
例题 (假设不满足参数检验的要求)
表 不同程度再障患者血清中 CD8 抗原水平(U/ml)
正常组
( 1)
轻度组
( 3)
重度组
( 5)
42 51 98 141 141 318 382 408 620
31
448 555 585 620 712 753 758 845 896
562 631 653 712 762 843 849 896 901
合计 n1=182 n2=221 403
T1=40682.5 T2=40723.5
24
Biostatistics
例题( page88 )
建立检验假设
H0:两型老慢支疗效分布相同 ; H1:两型老慢支疗效分布不同; =0.05。
检验统计量
n1=182, n2=221,检验统计量T=40682.5 。
若组数k=3,每组例数ni≤9,可查附表11,H界值表 得出P值。 若组数k≥3,有ni≥10,则H近似服从 =k1的2分布
。
34
Biostatistics
多组等级比较的检验假设
确定P值和作出推断结论 本 例 k=3 , 查附表 12, 得 P<0.001 。按 = 0.05水准拒绝H0,接受H1,差异有统计学意 义,可认为不同程度再生障碍性贫血患者血 清中可溶性CD8抗原水平有差别。
23
Biostatistics
例题( page87 )
表 8.1 复方猪胆胶囊治疗两型老年性慢性支气管炎疗效比较 人数 秩和 疗效 喘息 单纯 秩次范围 平均秩次 合计 喘息型 单纯型 型 型
( 1) ( 2) ( 3) ( 4) 治愈 显效 好转 无效 23 83 65 11 60 98 51 12 83 181 116 23 ( 5) 1~ 83 84~264 265~380 381~403 ( 6) 42 174 322.5 392 ( 7) 966 14442 20962.5 4312 ( 8) 2520 17052 16447.5 4704
等级资料的秩和检验
Rank Sum Test of Ranked Data
陈涛
Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University
资料的分类
数值变量资料
分类资料
二分类 无序多分类
例题( page88 )
确定P值和作出推断结论
P<0.01,按 =0.05水准,拒绝H0 ,接受H1,差 异有统计学意义。可认为复方猪胆胶囊治疗老年 性慢性支气管炎喘息型与单纯型的疗效有差别。
28
Biostatistics
4 多组比较的秩和检验
Kruskal-Wallis法 先对所有数据编秩,求各组秩和; 计算 H 统计量; 查 H 界值表,或用近似 2 检验, 计算 P 值; 界定 P 值,作出结论。
18 Biostatistics
例题
【例】 某实验室观察在缺氧条件下猫和兔的 生存时间,结果见表,试检验在缺氧条件下 猫和兔的生存时间有无差别?
19
Biostatistics
例题
表
猫 生存时间 (min) 25 34 44 46 46 48 49 50 秩次 9.5 13 15 16 17 18 19 20 生存时间 (min) 14 15 16 17 19 21 21 23 25 28 30 35
Biostatistics
等级相同(tie)取平均秩次!!
7
秩和
A组: - 、、+、+、+、 ++
秩和: 1
2 4.5 4.5 4.5 8.5
TA=25
B组: +、++、++、++、+++、+++ 秩和: 4.5 8.5 8.5 8.5 11.5 11.5 TB=53
TA+TB=N(N+1)/2=78
检验结果
如果H0成立,则按0.05水准, A组秩和之界值为26~52。 现A组的实际秩和为25,在界值之外, 故拒绝 H0 ,接受 H1 ,认为两组的分 布位置不同。
17
Biostatistics
秩和检验的结论判断
A组的实际秩在界值之外, (小于或等于下界,大于或等于上界) 则拒绝H0,接受H1。 A组的实际秩在界值之内, (大于下界且小于上界) 则不拒绝H0。
22
Biostatistics
例题( page87 )
表 8.1 复方猪胆胶囊治疗两型老年性慢性支气管炎疗效比较
疗效 ( 1) 控制 显效 好转 无效 合计
喘息型 ( 2) 23 83 65 11 n1=182
人数 单纯型 ( 3) 60 98 51 12 n2=221
合计 ( 4) 83 181 116 23 403
3 ( t j tj )
3.3669
c 1 1 N3 N 833 83 1813 181 116 3 116 233 23 4033 403
0.8766
uc u
C 3.3669/ 0.8766 3.5961 u 0.01
多分类
有序多分类 (等级资料)
2
Biostatistics
内容提要:
1 医学研究中的等级资料
2 秩次与秩和
3 两样本比较的秩和检验 4 多样本比较的秩和检验 5 配对设计的秩和检验 6 配伍组比较的秩和检验
7 秩和检验的正确应用
3
Biostatistics
1 医学研究中的等级资料
8 Biostatistics
2 秩次与秩和
秩次:在一定程度上反映了等级的高低; 秩和:在一定程度上反映了等级的分布 位置。 对等级的分析,转化为对秩次的分析。 秩和检验就是通过秩次的排列求出秩和, 进行假设检验。
9
Biostatistics
示例
假如两组等级分布相同
理论上两组秩和相近.
分布情况
第1 种情形…
A B
第2种情形…
B A
13
基本思想
如果H0 成立,即两组分布位置相同, 则A组的实际秩和应接近理论秩和n1(N+1)/2; (B组的实际秩和应接近理论秩和n2(N+1)/2). 或相差不大,差值很大的概率应很小 。 如果相差较大,超出了预定的界值,则可认 为H0不成立。
14
Biostatistics
基本思想
A组 实际秩和 25 B组 53 和 78
理论秩和 n1(N+1)/2 n2(N+1)/2 N(N+1)/2 39 差值 -14 39 14 抽样误差? 78
0
如果H0成立,则理论秩和与实际秩和之差 纯粹由抽样误差造成。
15 Biostatistics
秩次 ( 4) 9 10 12 13.5 17.5 19 20 23 25.5
重度组
(5)
562 631 653 712 762 843 849 896 901
秩次 ( 6) 11 15 16 17.5 21 22 24 25.5 27
149.5 9
Biostatistics
179 9
多组等级比较的检验假设
疗 效:痊愈、显效、有效、无效、恶化
化验结果:-、、+、++
体格发育:下等、中下、中等、中上、上等
心功能分级:I、II、III、IV
文化程度:小学、中学、大学、研究生
营养水平:差、一般、好
4
Biostatistics
等级资料的特点
既非呈连续分布的定量资料,也非仅 按性质归属于独立的若干类的定性资 料; 比“定量”粗,而比一般的“定性” 细; 等级间既非等距,亦不能度量。
6
Biostatistics
例1 编秩(page86)
尿白细胞:
A组: - 、、+、+、+、++ B组: +、++、++、++、+++、+++ A:- + + + ++ 1 2 4.5 3 4.5 4 4.5 5 8.5 7 B: + ++ ++ ++ +++ +++ 4.5 4.5 6 8.5 8 8.5 9 8.5 10 11.5 11 11.5 12
两样本秩和检验 T 界值
n1=6,n2-n1=0 28~50 26 24 23 ~ ~ ~ 52 54 55 间距 22 双侧 单侧 0.10 0.05 0.05 0.025 0.02 0.01 0.01 0.005
26 30 32
6(12+1)/2=39(理论值)
16 Biostatistics
Sum of ranks = 37 Sum of ranks = 41
B
A 两样本合并排序
1
10
2
3
4
5
6
7
8
9
10
Biblioteka Baidu11
12
3 两样本比较的秩和检验
检验假设
H0 :A、B两组等级分布相同; H1 :A、B两组等级分布不同。 =0.05。
11
Biostatistics
Distribution of two populations when their locations are same
5
Biostatistics
2 秩次与秩和
Wilcoxon 在1945年首先提出了比较两个总体分布函 数的秩和检验。秩和检验以及其它的秩检验法,都 是建立在秩及秩统计量基础上的非参数方法。
秩次(rank),秩统计量
是指全部观察值按某种顺序排列的位序; 秩和(rank sum) 同组秩次之和。
Biostatistics
例题
表 不同程度再障患者血清中 CD8 抗原水平(U/ml)
正常组
(1)
秩次
(2)
轻度组
(3)
42 51 98 141 141 318 382 408 620 Ri ni
32
1 2 3 4 5 6 7 8 13.5 49.5 9
448 555 585 620 712 753 758 845 896
25
Biostatistics
样本含量较大时,用 u 检验
T n1 ( N 1) / 2 0.5 u n1n2 ( N 1) / 12
相同秩次较多时需要校正
u uC C
26
(t 其中: C 1
3 j
tj )
N3 N
Biostatistics
u
T n1 ( N 1 ) / 2 0.5 n1n2 ( N 1 ) / 12 40682.5 182( 403 1 ) / 2 0.5 ( 182 )( 221 )( 403 1 ) / 12