医学统计学:定性资料的比较

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
检验H0:π1=π2,H1:π1<π2。
只需计算样本观察值点及更不利于H0而有利于H1 的所有可能结局的概率之和。
P =P1+P2=0.00155+0.02477=0.02632
26
表8-3 末梢血与静脉血检查乙型肝炎抗原结果
静脉血
阳性 阴性 合计
末梢血
阳性
阴性
47
3
7
243
54
246
合计
50 250 300
意义。
30
8.1 定性资料比较原理 8.2 两组二分类资料比较
8.3 独立的多组二分类资料比较
8.4 独立的多组多分类资料比较
31
表 8-5 磷霉素不同制剂对皮肤软组织感染的疗效
制剂 痊愈人数 未愈人数 合计 痊愈率/%
软膏 47(51.6) 19(14.4) 66
71.21
油膏 24(19.6) 1 (5.4) 25
计学意义,可以认为三种制剂的总体痊愈率 有差异。
35
1 对于比较多组独立样本的χ2检验,拒绝假设H0,只能说明 各组总体痊愈率不全相同,并不能得出多组总体痊愈率均不 相同的结论。 2 如果需要明确具体是哪两组间不同,还需进一步做多组间 的两两比较。 3 如果直接对每种情况做四格表的χ2检验,将会增大犯Ⅰ类 错误的机会。 4 在进行多组率的两两比较时,需要用Bonferroni方法校正 检验水平。校正方法为:若原来的检验水平为α,进行R组间 的两两比较,如果需要进行k次比较[k的最大取值为R(R-1)2], 则两两比较的检验水准应取α/k。
须加以校正。英国统计学家Yates F提出将实际频数与理论 频数之差的绝对值减去0.5做连续性校正。
2 ( A T 0.5)2
T
ad bc n 2 n
2
a
bc
d
a
2
cb
d
17
χ2检验的连续性校正
(1)建立检验假设并确定检验水准 H0:π1=π2,两种药物对实验室指标的改善情况相同。 H1:π1≠π2,两种药物对实验室指标的改善情况不同。 α=0.05
(2)计算检验统计量
2 ( A T 0.5)2
T
18
(3)确定P值,作出推断结论,自由度1对应的临界值为 χ20.05,1=3.84 4.078 >3.84,因此 P<0.05
(4)结论:按α=0.05水准,拒绝H0,接受H1,差别有统
计学意义。
A药的改善率为PA=29/34=85.29% B药的改善率为PB=10/18=55.56%
(1)建立假设 H0:无效假设 H1:备择假设
(2)确定检验水准α
(3)选择检验方法,并计算检验统计量
(4)确定P值,作出推断结论
χ2 ≥ χ2 α,P≤α,
拒绝H0,接受H1
χ2 <χ2 α, P>α,
不拒绝H0
9
8.1 定性资料比较原理
8.2 两组二分类资料比较
8.3 独立的多组二分类资料比较 8.4 独立的多组多分类资料比较
12
自由度为:ν=(行数-1)(列数-1)=(2-1)(2-1)=1
(3)确定P值 查附表C5,自由度1对应的临界值为
χ20.05,1 =3.84 1.086<3.84,因此 P>0.05 (4)结论:按α=0.05水准,不能拒绝H0,因此尚不能认
为两药治疗老年抑郁症的痊愈率不同。
13
两组频数分布的四格表一般形式
表8-9 两种药物治疗冠心病患者的实验室指标改善情况
分组
实验室指标改善情况/例数
改善
未改善
合计
A药
29(25.5) 5(8.5)
34
B药
10(13.5) 8(4.5)
18
合计
39
13
52
16
在四格表资料中,当n≥40,但有一个格子的理论频数1≤T< 5时,利用四格表χ2检验公式计算出来的χ2统计量偏大,必
因此A药对实验室指标的改善情况好于B药。
19
基本思想:在四格表边缘合计固定不变的条件下, 利用公式直接计算表内四个格子数据的各种 组合的概率,然后计算单侧或双侧累计概率,并
与检验水准α比较,作出是否拒绝H0的结论。
P
a b
!c d !a c
a!b!c!d!n!
!b d
!
20
计算方法:
(2)计算检验统计量:若H0成立时,不一致的两个格子理 论频数都应该是(b+c)/2
b+c≥40时
2 b c2
bc
2 b c 1 2 b+c<40时 bc
ν=(行数-1)(列数-1)
29
(3)确定P值 查附表 ν=1 查附表C5,自由度1对应的临界值
χ20.05,1=3.84,0.90<3.84,所以P>0.05 (4)结论:按α=0.05水准,不能拒绝H0,差别无统计学
对 于 Fisher 确 切 概 率 法 的 检 验 , P 值 就 是 “出现目前状况和更极端状况的概率”, 其计算方法就是将小于或等于“样本观察 值概率”的所有可能结局的概率求和。
21
例8-6 研究脑卒中患者康复治疗效果,观察了病情近似的22 例患者。问脑卒中患者参加康复治疗与否是否影响其身体健 康。
43
注意事项: 1、χ2 检验要求理论频数不宜太小,一般认为不宜有1/5 以上格子理论频数小于5,或一个格子的理论频数小于1。 对理论频数太小有三种处理方法(1)增大样本例数 (2)删除理论数太小的行或列 (3)合并
36
表8-12 三制剂的总体痊愈率间的两两比较
对比组
四格表
Χ2值 P值 检验结果
软膏组与油膏组 47 19 6.497 0.011
*
24
1
软膏组与粉剂组 47 19 1.405 0.236
-
159 44
油膏组与粉剂组 24
1 3.345 0.067
-
159 44
37
8.1 定性资料比较原理 8.2 两组二分类资料比较 8.3 独立的多组二分类资料比较
表8-10 脑卒中患者是否参加康复治疗效果比较/例数
分组
恢复良好 恢复较差 合计
参加康复治疗组 9(6.4) 1(3.6)
10
未参加康复治疗组 5(7.6) 7(4.4)
12
合计
14
8
22
22
(1)建立检验假设,确定检验水准 H0:π1=π2,即脑卒中患者参加康复治疗与否其身体恢复 的概率相等。 H1: π1≠π2,即脑卒中患者参加康复治疗与否其身体恢 复的概率不等。 α=0.05
(2)计算概率
23
四格表 1 2 3 4 5 6 7 8 9
恢复良好 10 4 9 5 8 6 7 7 6 8 5 9 4 10 3 11 2 12
恢复较差 0 8 1 7 2 6 3 5 4 4 5 3 6 2 7 1 8 0
Pi 0.001 55
0.024 77 0.130 03 0.297 21 0.325 08
α =0.05
(2)选定检验方法,计算检验统计量
41
2 ( A T )2 T 42
(R 1)(C 1) (3 1)(4 1) 6
(3)确定P 值,作出推断结论
查χ2界值表,
=12.59,8.80<12.59,得
P>0.05,按α=0.05水准不拒绝H0,尚不能认
为三个民族的职业总体构成不相同。
27
表8-4 配对设计2×2列联表形式
变量1结果
+ 合计
变量2结果
+
-
a
b
c
d
m1=a+c m2=b+d
合计
n1=a+b n2=c+d n=a+b+c+d
28
(1)建立检验假设并确定检验水准
H0:两总体B=C,即末梢血与静脉血检查的阳性率相同
H1: 两 总 体 B ≠ C , 即 末 梢 血 与 静 脉 血 检 查 的 阳 性 率 不 同 α=0.05
96.00
粉剂 159(158.8) 44(44.2) 203 78.33
合计
230
64
294 78.23
Tij
ni m j n
32
1 建立假设检验,确定检验水准 H0:π1=π2=π3,即三种制剂总体治愈率相同。 H1:π1、π2、π3不等或不全相等,即三种制剂的 总体痊愈率不同或不全相同。 α =0.05
P=P1+P2+P8+P9 =0.03096 <0.05
0.173 37
0.043 34
0.004 50
0.000 14
24
(3)确定P值,作出推断结论
P=P1+P2+P8+P9=0.03096<0.05 所以,在α=0.05的检验水准下,拒绝H0,接受H1。
25
在临床上若有理由认为患者参加康复治疗的恢复 效果只会好于或等于不参加康复治疗患者,而不 会差于不参加康复治疗的患者,则可以采用单侧
有效率(%)
63.33 50.00 56.66
11
(1)建立检验假设并确定检验水准
H0:两组的有效概率相同,π1=π2=π H1:两药的有效概率不同,π1≠π2 α=0.05 (2)计算检验统计量:H0成立时,两组有效概率相 同,近似地等于合并估计的有效概率,由此
得到四格表中每一格的理论数
Tij
ni m j n
实际频数
理论频数
2 (A T )2
T
6
H0:两组的总体分布相同,都是某一个理论分布,
即π1=π2=π H1:两组的总体分布不相同,即π1≠π2
表8-1 万拉法新与氟西汀治疗老年期抑郁症的疗效比较
T11=30×56.66%=17
T12=30×(1-56.66%)=13
分组
疗效
有效
无效
合计 有效率(%)
1
8.1 定性资料比较原理 8.2 两组二分类资料比较 8.3 独立的多组二分类资料比较 8.4 独立的多组多分类资料比较
2
定性变量也称分类变量,根据变量类别之 间是否有顺序、等级、大小的关系,常将 定性变量划分为有序变量、名义变量。 有序变量 文化程度、疾病严重程度 名义变量 职业、分娩方式等
万拉法新组 19(17)
11(13)
30
63.33
氟西汀组
15(17)
15(13)
30
50.00
合计
34
26
60
56.66
T21=30×56.66%=17 2 =∑(A-T)2/T
T22=30×(1-56.66%)=13 ν=(行数-1)(列数-1)
7
χ2分布
图 8-1 χ2分布的概率密度曲线
8
2检验的基本步骤
33
2 计算检验统计量
2 ( A T )2 T
ν=(行数-1)(列数-1)
ν=(3-1)×(2-1)=2
34
3 确定P值,作出推断结论
自 由 度 为 2 对 应 的 临 界 值 为 χ20.05,2=5.99 , 6.545>5.99,因此 P<0.05
按α=0.05水准,拒绝H0,接受H1,差别有统
处理
A B 合计
属性
阳性
阴性
a(T11) c(T21) m1=a+c
b(T12) d(T22) m2=b+d
合计
n1=a+b n2=c+d n=a+b+c+d
14
四格表χ2检验的条件:
(1)当n≥40,且所有T≥5时,用普通的χ2检验
2 ( A T )2 T
2
a
ad bc2 n bc d a cb
10
例8-1 某医生欲比较万拉法新与氟西汀治疗老年期抑郁症 的疗效,将病情相近的60名患者随机分成两组,分别用两 种药物进行治疗,结果见表。
表8-1 万拉法新与氟西汀治疗老年期抑郁症的疗效比较
分组
万拉法新组 氟西汀组
合计
疗效
有效
无效
19(17)
11(13)
15(17)
15(13)
34
26
合计
30 30 60
8.4 独立的多组多分类资料比较
38
例8-4 研究了汉族、回族和满族居民的职业分布情况,调 查结果见表,试比较不同民族居民的职业分布是否相同。
民族
汉族 回族 满族 合计
表8-3 三个民族的职业分布
职业
干部 工人 农民 其他
20
56
62
7
14
40
32
11
18
28
45
8
52
124 139 26
合计
145 97 99 341
39
表8-8 R×C列联表的一般形式
处理分组 1
职业
2

C
第1组 第2组

A11
A12

A1C
A21
A22

A2C




第R组 合计
AR1
AR2

ARC
m1
m2

mc
合计
n1 n2 ┆ nR n
40
(1)建立检验假设,确定检验水准
H0:三个民族职业的概率分布相同 H1:三个民族职业的概率分布不同或不全相同
3
8.1 定性资料比较原理
8.2 两组二分类资料比较 8.3 独立的多组二分类资料比较 8.4 独立的多组多分类资料比较
4
χ2检验的基本思想(1899年,Pearson K)
H0:两组的总体分布相同,即π1=π2=π。 H1:两组的总体分布不相同,即π1≠π2。
5
用χ2统计量来度量实际观察频数与H0成立条 件下的理论频数之间的偏差
d
(2)当n≥40但有1≤T<5时,用校正的χ2检验
2
( A T 0.5)2 T
ad bc n 2 n
2
a
bc
d
a
2
cb
d
(3)当n<40或有T<1时,不能用χ2检验,改用确
切概率法
15
χ2检验的连续性校正
例 8-5 研究两种药物治疗冠心病患者的实验室指标改善效果, 观察了52例患者,结果见表8-9。问两种药物的改善效果是 否相同?
相关文档
最新文档