第十章 分类变量资料的统计分析(卡方检验)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
院内感染情况,随机抽查同一时期各医院住院患者院内
感染情况见表10-10,试比较三家医院院内感染率有无
差别。
表10-10 甲、乙、丙三家医院住院患者院内感染率比较
医院
甲 乙
感染
43 19
未感染
188 170
合计
231 189
丙
合计
15
77
151
509
166
586
(1)建立假设,确定 值 H0:三家医院院内感染率相同; H1:三家医院院内感染率不同或不全相同;
(公式10-13或10-16)
(2) 1≤T<5,而且n ≥ 40 时,用校正公式
(公式10-17或10-18)
(3)T<1 或 n<40 时,需用确切概率法。
例10-10
某医生收集到两种药物治疗白色葡萄球
菌败血症疗效的资料,结果见表10-8,问两种药物 疗效之间的差别有无统计学意义?
表10-8 两种药物治疗急性细菌性肺炎的疗效比较 处 A B 合 理 药 药 计 有 效 无 效 合 42 22 64 计 有效率(%) 95.24 72.73 86.96
④两个率的等效检验。 ⑤频数的拟合优度。
一、 检验的基本思想
2
例10-9 某医生用甲、乙两种药物治疗急 性下呼吸道感染,甲药治疗71例,有效52 例, 乙药治疗42例,有效39例,结果见表 10-7。问两种药的有效率是否有差别?
表10-7 两种药治疗动脉硬化有效率比较
处 理 有效 52(57.18)a 39(33.82)c 无效 19(13.82)b 3 (8.18)d 合计 71 (a+b) 42 (c+d) 有效率 ( %) 73.24 92.86
2
2
1132 882 912 332 3996( 3251236 3251101 3251166 325 493 11232 10132 10752 4602 1) 36711236 36711101 36711166 3671 493 3.25
白内障组
对照组
113
1123
88
1013
91
1075
33
460
325
3671
合计
1236
1101
1166
493
3996
(1)建立假设,确定 值 H0:白内障组与对照组血型分布相同;
H1:白内障组与对照组血型分布不同或不全相同;
0.05
(2)计算统计量
A n( 1) nr nc
2 2
2
( R 1)(C 1) (2 1)(2 1) 1
(3)查 界值表,确定P值,下结论。
2
2 =6.48> 0 ,P <0.05,按 0.05 .05,1 3.84
2
检验水准,拒绝H0,接受H1,差异有统计学意义, 认为两疗法的有效率有差别,乙药疗效优于甲药。
P
0.05
2
0.01 6.63
2.73
3.84
四格表资料的校正公式(公式10-17、18):
2
( A T 0.5) T
2
2
( ad bc n / 2) n
2
(a b)(c d )(a c)(b d )
检验的校正条件(yates)
2
(1)T≥5,且n ≥ 40 时,不用校正检验
P
0.05
2
0.01 6.63
2.73
3.84
四格表专用公式(公式10-16):
(ad bc) n (a b)(c d )(a c)(b d )
2 2
表10-7 两种药治疗动脉硬化有效率比较
处 理 有效 52(57.18)a 39(33.82)c 无效 19(13.82)b 3 (8.18)d 合计 71 (a+b) 42 (c+d) 有效率 ( %) 73.24 92.86
例:10-9
表10-7 两种药治疗动脉硬化有效率比较
处 理 有效 52(57.18)a 无效 19(13.82)b 合计 71 (a+b) 有效率 (%) 73.24
甲药
乙药
合 计
39(33.82)c
91(a+c)
3 (8.18)d
22(b+d)
42 (c+d)
113(n=a+b+c+d)
92.86
时,P>0.05,按 0.05 检验水准,
不拒绝H0,差异无统计学意义,还不能认为……不 同或不等。
≥
2
2 时,P≤0.05,按 0.05,
检验水准,拒绝 0.05
H0,接受H1,差异有统计学意义,可以认为…不同
或不等,谁大谁小。
二、
四格表资料的 检验
2
适用于成组设计的两个率的比较
一、 检验的基本步骤
2
(1)建立假设,确定 值
1 2 H : 1 2
H0:
1
0.05
(2)计算检验统计量
(A T) T
2
2
TRC
nR nC n
(行数 1 (列数 ) 1 )
(3)查
<
2
2
界值表,确定P值,下结论。
2 0.05,
40(36.75) 16 (19.25) 56
2(5.25) 6(2.75) 8
TRC
nR nC n
最小的行合计数×最小的列合计数 总例数
T最小= ——————————— =22×8/64=2.75
(1)建立假设,确定 值
H0: H1:
1 2 ,即两种药物的疗效无差别
1 2 ,即两种药物的疗效有差别
7119 T12 13.82 113
42 3 T22 8.18 113
42 91 T21 33.82 113
(A T) T
2
2
2
(52 57.18) (19 13.82) (39 33.82) (3 8.18) 57.18 13.82 33.82 8.18 6.48
甲药 乙药
合
计
91(a+c)
22(b+d)
113(n=a+b+c+d)
80.53
四格表(fourfold table)资料:四
个格子的数据是表中基本数据,其余
的数据都是从这四个数据推算得来的,
这种资料称之。
52(57.18)a 19(13.82)b
a c
b d
39(33.82)c
3 (8.18)d
(2 1)(2 1) 1
(3)查
2
2
界值表,确定P值,下结论。
3.84,P<0.05,按 0.05
=4.79>
2 0.05,1
检验水准,拒绝H0,接受H1,差异有统计学意 义,认为两种药物的有效率有差别,A药疗效好 于B药。
例 10-11 用两种血清学方法对 100 例肝癌患者进行诊 断,结果见表10-9,问两种方法检测结果有无差别?
二、 基本思想(以例10-9为例)
2
(A T) 检验的基本公式: T
2
2
2
其中: TRC
nR nC n
如果H0成立:则两药的有效率相同,均等于
80.53%(即91/113)
理论上A药的有效人数应为
71×(91/113)=57.18 理论上B药的有效人数应为 42×(91/113)=33.82
TRC
nR nC n
(A T) T 2 值反映了实际频数 由此公式可看出,
2 2
与理论频数的吻合程度,假若H0成立,那么A
与T 应很接近,则 值应较小。反之若计算出
2
来的 值越大,就越有理由拒绝H0
2
值与P 值的对应关系可查 界值表 2值越大,P 越小
2
自由度 =(行数-1)(列数-1)=(R-1)(C-1)
甲药 乙药
合
计
91(a+c)
22(b+பைடு நூலகம்)
113(n=a+b+c+d)
80.53
例:10-9
(1)建立假设,确定 值
1 2 ,即两疗法生存率相等; H : 1 2 ,即两疗法生存率不等;
H0:
1
=0.05
(2)计算检验统计量
(ad bc) n (a b)(a c)(b d )(c d )
2 2
(52 3 19 39) 113 6.48 71 42 91 22
2
(2 1)(2 1) 1
(3)查 界值表,确定P值,下结论。
2
2 =6.48> 0 ,P <0.05,按 0.05 .05,1 3.84
2
检验水准,拒绝H0,接受H1,差异有统计学意义, 认为两疗法的有效率有差别,乙药疗效优于甲药。
表10-9 两种方法检测肺癌的效果比较
乙
法
甲
+
法
合
计
+ 50(a) 15(c) 65
32(b) 3(d)
合
计 82 18
35
100
表10-9 配对四格表格式 甲 + 合 计 法 乙 + 法 合 计
a c a+c
b d b+d
a+b c+d
n
按检测结果可分四种情况:
(a)甲+乙+ (b)甲+乙- (c)甲-乙+ (d)甲-乙其中 (a)与(d)为两种检测结果一致; (b)与(c)为两种检测结果不一致
=6.15>
2 0.05,1
检验水准,拒绝H0,接受H1,差异有统计学意 义,认为两种方法的检出效果有差别,甲法检 出率较高。
第三节
公式:
行×列表的 检验
2
(用于两个以上总体率或构成比的比较)
A n( 1) nR nC
2
2
(行数 1 )(列数 1 )
例10-12 某研究者欲比较甲、乙、丙三家医院住院患者
三、配对四格表资料的 检验
2
适用于配对设计的两个率的比较
普通公式:
(b c) bc
2
2
2
校正公式:
b c 1
bc
2
(b c 40)
( R 1)(C 1) (2 1)(2 1) 1
(1)建立假设,确定 值 H0:B=C,即两种方法检出效果无差别 H1:B≠C,即两种方法检出效果有差别
(3 1)(2 1) 2
0.05
(2)计算统计量
因为: T22 2.75 5 n 2 所以: ( ad bc ) n
2
2 (a b)(c d )(a c)(b d )
64 2 ( 40 6 2 16 ) 64 2 4.79 42 22 56 8
0.05
(2)计算统计量
因为:b+c=32+15=47>40
所以:
(b c) (32 15) 6.15 bc 32 15
2 2 2
(2 1)(2 1) 1
(3)查
2
2
界值表,确定P值,下结论。
3.84,P<0.05,按 0.05
71 91 T11 57.18 113
42 91 T21 33.82 113
理论上A药的无效人数应为
71×(22/113)=13.82 理论上B药的无效人数应为 42×(22/113)=8.18 用更一般的表示方法:
71 22 T12 13.82 113
42 22 T22 8.18 113
0.05
(2)计算统计量
2 A 2 n( 1) nR nC
432 1882 192 1702 586( 231 77 231 509 189 77 189 509 1512 1) 166 509 10.09
(3 1)(2 1) 2
检验 第三节 (Chi-square test)
2
学习要点: 1、掌握 检验的用途
2 2
2、掌握 检验的基本思想 3、掌握几种资料的 2 检验的应用条件、 注意事项,熟悉其检验步骤。
一、用途:
①两个及多个率或构成比之间有无差别的比较。
②两个变量之间有无相关关系。
③多个率的趋势检验。
80.53
(1)建立假设,确定 值
1 2,即两药的有效率相等; H : 1 2 ,即两药的有效率不相等;
H0:
1
=0.05
(2)计算检验统计量
因为: TRC
nR nC n
52(57.18) a
19(13.82) b
39(33.82) c
3 (8.18) d
71 91 所以: T11 57.18 113
(3)查 界值表,确定P值,下结论。
2
2
2 =10.09> 0 ,P<0.01,按 0.05 .01, 2 9.21
检验水准,拒绝H0,接受H1 ,差异有高度统计
学意义,可以认为三家医院院内感染率不相同或 不全形同。
例10-13
表10-11 白内障组与对照组ABO血型分布 组别 A B O AB 合计