医学统计-秩和检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12
例1 临床某医生研究白癜风病人的白介素IL-6水 平(u/ml)在白斑部位与正常部位有无差异,调 查的资料如表1。
表1 白癜风病人IL-6结果
正常部位 白斑部位
1 2 3 4 5 6 7 8 合计
40.03 97.13 80.32 25.32 19.61 14.50 49.63 44.56
88.57 80.00 123.72 39.03 24.37 92.75 121.57 89.76
参数检验
非参检验
要求资料服从 正态分布
检验效率高
1. 对资料的分布没有特殊要求,总体为 偏态、总体分布未知的计量资料(尤 其在n<30的情况)
等级资料 有过大或过小值的数据,或数据的某
一端没有具体值 总体方差不齐 检验效率低,容易犯第二类错误 原因:信息丧失或信息利用不足。
7
第二节 配对资料的符号秩检验
13
1 2 3 4 5 6 7 8
合计
表1 白癜风病人IL-6结果
正常部位
40.03 97.13 80.32 25.32 19.61 14.50 49.63 44.56
白斑部位
88.57 80.00 123.72 39.03 24.37 92.75 121.57 89.76
差值d
48.54 -17.13 43.40 13.71
二、非参数检验(Nonparametric test) 又称任意分布检验。 不依赖于总体分布类型,也不对总体参数进 行统计推断的假设检验。
5
三、非参数检验的优缺点 1.优点
适用范围广,且收集资料、统计分析 比较简单。
2.缺点
损失了部分信息,检验效率降低了, 容易犯第二类错误。
6
参数检验与非参数检验比较
两组患者生存时间(月)
无淋巴细胞转移
有淋巴细胞转移
时间 秩次
时间 秩次
12
4.5
5
1
25
10
8
2
27
11
12
4.5
29 12.5
12
4.5
38
17
12
4.5
42
19
17
7
46
20
21
8
46
21
24
9
56
23
29 12.5
60
24
30
14
34
15
36
16
40
18
48
22
n1=10 T1=162
n2=14 T2=138
复习:配对设计 1.两个同质受试对象分别接受两种不同的处理 2.同一受试对象分别接受两种不同的处理 3.同一受试对象处理前后
8
适用条件 1. 配对设计的计量资料,但不服从 正态分布或分布未知 2. 配对设计的等级资料
Wilcoxon符号秩检验,用于推断配对资料的 差值是否来自中位数为0的总体。
9
一般步骤
11
(2)n>50时,可按近似正态分布用Z检验或u检验
T n(n 1) / 4 0.5 u
n(n 1)(2n 1) / 24
若有相同秩次,按校正公式计算统计量uc
T n(n 1) / 4 0.5
t t uc
n(n 1)(2n 1) / 24
( 3 ) / 48
jj
t j 为第j个相同秩次的个数
表6 分娩时孕周与乳量的关系
乳 量
早 产
足月 产
过期 产
合计
(1) (2) (3) (4) (5) 无 30 132 10 172 少 36 292 14 342 多 31 414 34 479
合计 97 838 58 993 35
表7 分娩时孕周与乳量的关系
乳 早 足月 过期 合计 量产 产 产
33
3.查表及结论
现g=4,ν=g-1=4-1=3查2界值表
20.05(3)=7.81, 2>20.05(3),P<0.05
按α=0.05水准,拒绝 H0,接受H1, 故可认为四组DNA含量有差别。
34
2 等级资料多组独立样本的秩和检验
频数表法:属于同一组段的观察值,一律 取平均秩次(组中值),再以该组段频数 加权,计算Hc值。
T+ = 33,T- = 3,
(4)确定统计量:
T = min(T+,T-)=T- = 3。
T++T-=36, n(n+1)/2=8(8+1)/2=36
15
3. 查表及结论 n=8,查附表9,T界值表 T0.05(8)=3-33,T=3正好落在界值上,所以 P≤0.05,拒绝H0,认为白斑部位与正常部 位的白介素IL-6有差异。
R2=134 N2=7
(5)
(6)
9.3
1
10.3
3.5
11.1
11
11.7
14
11.7
15
12.0
16
12.3
18
12.4
20
13.6
25
R3=123.5
N3=9
(7) 9.5
10.3 10.5 10.5 10.5 10.9 11.0 11.5
(8) 2 3.5 5 6 7 9
10 12
R4=54.5 N4=8
21
▪ 两独立样本比较的秩和检验(Wilcoxon Rank-Sum test)
▪ 目的:推断连续型变量资料或有序变量 资料的两个独立样本代表的总体分布位 置是否有差别
▪ 适用范围:完全随机设计的两个样本比 较,若不满足参数检验的应用条件,则 用本法;两个等级资料比较。
基本思想
如果H0成立,则两样本来自分布相同 的总体,两样本的平均秩次T1/n1与T2/n2应 相等或很接近,且都和总体的平均秩次 (N+1)/2相差很小。
非参数检验
复习
四格表资料
2检验
Chi-square
行×列表
test
配对四格表
基本公式 专用公式 校正公式 确切概率法
基本公式 专用公式 确切概率法
差异性
一致性
2
参数统计:
通常要求样本来自正态 总体,或方差齐等,在此基 础上用样本统计量对总体参 数进行推断或作假设检验的 统计分析方法。
非参数统计:
32
假设检验步骤
1.建立假设检验
H0:四组鼠脾DNA含量的总体分布相同。 H1:四组鼠脾DNA含量的总体分布位置不全相同。
α=0.05
2.计算统计量
H
12
R2
j 3(n 1)
n(n 1) n
i
323122 1
2162 8
1342 7
123.52 9
54.52 8
332 1 19.94
表5 四组鼠脾DNA含量
(1) 12.3 13.2 13.7 15.2 15.8 16.9 17.3 17.4
(2) 18 22 26 28 29 30 31 32
R1=216 N1=8
(3) 10.8 11.6 12.3 12.7 13.5 13.5 14.8
(4) 8
13 18 21 23 24 27
有许多资料不符合参数统计的要求,
分布是未知的,不能用参数统计的方法
进行检验,而需要一种不依赖于总体分
布类型,也不对总体参数进行统计推断
的假设检验,而是对总体的分布或分布
位置进行检验,称为非参数检验。
3
参数统计
(parametric statistics)
已知总体分布类型,对 未知参数(μ、π)进行 统计推断
0
5
-1
4
-2
2
-3
2
17
假设检验步骤
⒈ 建立假设 H0:差值总体中位数为0 H1:差值总体中位数不为0; α=0.05
⒉ 计算统计量
d
-
(1)
(2)
1
4
2
2
3
2
合计 8
频数
+
(3)
6 5 4 15
正负秩和计算表
总 秩次范围 平均秩次
负秩和
正秩和
(4)
(5)
( 6 ) (7 )= (2 )×(6 )(8 )= (3 )×(6 )
⒊ 查表及结论 n1=10, n2-n1=14-10=4,查T界值表(附表10) T0.05(4)=91-159, T =162落在界值范围外,所以P <0.05,拒绝 H0,认为两组患者的平均生存时间不同。
28
2 有序分类变量两组独立样本的秩和检验
例4 44 例健康人与24例慢性气管炎病人痰液嗜酸性粒细胞 数的测量值(×106/L),问健康人与慢性气管炎病人痰 液嗜酸性粒细胞数有无显著差别?
• R为各组的秩次之和
• 当组数为3,每组例数不超过5,可查附 表11。
• 当相同秩次较多时,采用校正公式
H c
1
H (ti 3 ti ) n3 n
• t为各组相同秩次的个数
• H布和,H查C近似2界服值从表自确由定度P值为k-1的 分2
1 定量变量多组独立样本的秩和检验
例5 研究白血病时,测定四组鼠脾DNA的含量,结果列于表5,试分析各组 DNA含量有无差别?
第三节
两组独立样本的秩和检验
19
对于计量数据,完全随机设计两独立 样本如果资料方差相等,且服从正态分 布,就可以用t检验比较两样本均数。
如果此假定不成立或不能确定是否成 立,就应采用Wilcoxon秩和检验来分析 两样本是否来自同一总体。
20
适用条件: 1.完全随机设计的两组定量资料,若 不满足参数检验的应用条件,则用 本法 2.有序分类变量两组独立样本比较
16
例2 对28名患有轻度牙周疾病的成年人,指导他们实行 良好的口腔卫生习惯,6个月后,牙周情况好转程度依高到 低给予分数+3,+2,+1;牙周情况变差程度依次给予分数1,-2,-3;没有变化给予0分,试对该项指导结果进行评价。
表2 牙周疾病患者牙周情况变化程度
变化对应的分数
人数
+3
4
+2
5
+1
6
10
1-10
5.5
22
33
7
11-17 14.0
28
70
6
18-23 20.5
41
82
23
T-=91
T+=185
⒊ 查表与结论
查T界值表, T0.05(23) = 73-203,T =91,在界值范围内,P >0.05,不拒绝H0,认为指导后牙周状况无显著好转
注意:差值为零的对子舍去不计,总对子数也要减去其对子数。 18
m
i
n
(
R
1
,
R
2
),
n
1
n2
n2
基本思想
T1 =15
1 2 34
5
6
78
样本1 样本2
T2 =21
1 定量变量两组独立样本的秩和检验
例3 对无淋巴细胞转移与有淋巴细胞转移的胃癌患 者,观察其生存时间,问两组患者的生存时间是否 不同?
表3 两组胃癌患者生存时间
两组患者生存时间(月)
无淋巴细胞转移
依赖于特定分布类 型,比较的是参数
非参数统计
(nonparametric statistics)
对总体的分布类型 不作任何要求
不受总体参数的影响, 比较分布或分布位置
适用范围广;可用于任 何类型资料(等级资料, 或“>50mg” )
4
第一节 非参数检验的概念
一、参数检验(Parametric test) 基于总体为某一特定分布的前提下,对参数 进行的检验。
⒈ 建立假设;
H0:差值的总体中位数为0; H1:差值的总体中位数不为0;
α=0.05。 ⒉计算统计量
⑴ 求差值:算出各对值的代数差;
⑵ 编秩:根据差值的绝对值大小编秩;将秩次冠以正负
号。编秩时,若差值的绝对值相等,符号不同时取其平均
秩次,符号相同时可顺次编秩。差值为零的对子舍去不计, 总对子数也要减去其对子数。
⑶ 求秩和:计算正、负秩和T+,T-; ⑷ 确定统计量T:以绝对值较小者作为统计量T
T=min(T+ ,T-)
正负秩和相加等于总秩和,T++T-= n(n+1)/2 ,
用于验证T+、及T- 的计算是否正确
10
⒊查表及结论 (1)当5<n≤50,可查T界值表
若检验统计量T值在上下界值范围内,其 P值大于相应的概率水平;若T值等于上下 界值或在界值范围外,则P值小于相应的概 率水平。
含量为n1样本的秩和T1应在 n1(N+1)/2的左右变化。若T值偏离此值太远, H0发生的可能性就很小,若偏离出给 定的 值 时,即P ≤ ,拒绝H0。
基本思想
假定:两组样本的总体分布形状相同
如果两 总体分 布相同
两样本来自同一总体
任一组秩和不应太大或太小
T 与平均秩和应相差不大
T
较 小 例 数 组 的 秩 和 ,n1
有淋巴细胞转移
时间
秩次
时间
秩次
12
5
25
8
27
12
29
12
38
12
42
17
46
21
46
24
56
29
Hale Waihona Puke Baidu
60
30
34
36
40
48
26
n1=10
n2=14
假设检验步骤
1. 建立假设:
H0:两总体分布相同, H1:两总体分布不同;
=0.05
⒉ 计算统计量 将两个样本由小到大的顺 序统一编秩,数值相等时 取平均秩次,求出两组秩 和,以样本含量较小组的 秩和作为检验统计量T, T=T1=162
4.76 78.25 71.94 45.20
T+=33
秩次
6 -3 4 2 1 8 7 5
T-=3
14
假设检验步骤
⒈ 建立假设:H0:差值的总体中位数=0, H1:差值的总体中位数0;
=0.05 2. 计算统计量 (1)求差值: (2)编秩:按差值的绝对值由小到大编秩,并冠以原d 的正
负号。 (3)求秩和:分别相加正负秩次,得到秩和
表4 健康人与慢性气管炎病人痰液嗜酸性粒细胞数的测量结果
嗜酸性
频数
粒细胞数
健康人
病人
(1)
(2)
(3)
-
5
11
+
18
10
++ +++ 合计
16
3
5
0
29
44
24
第四节 多个样本比较的秩和检验
• 采用Kruskal-Wallis test • 统计量计算公式:
H 12
Ri2 3(n 1)
n(n 1) ni