卡方检验解释
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其中,a, d 为两法观察结果一致的两种情况,
b, c为两法观察结果不一致的两种情况。 检验统计量为
2 (b c)2 , 1
bc
2 c
( b c 1)2 bc
,
=1
H0:总体四格表中甲+乙- 的对子数与甲-乙+的对子数出现频率相同(两剂量毒性相同) H1:总体四格表中甲+乙- 的对子数与甲-乙+的对子数出现频率不同(两剂量毒性不同)
表7-1 CEA对两组人群的诊断结果*
分组 肺癌组 对照组 合计
阳性 33(16.6) 10(26.4)
43
阴性 39(55.4) 104(87.6)
143
合计 72 114 186
* 括号内为理论频数。
阳性率(%) 45.8 8.8 23.1
(二) 2检验的基本思想
本例资料经整理成表7-1形式,即有 两个处理组,每个处理组的例数由发生数 和未发生数两部分组成。表内有33、39、 10、104 四个基本数据,其余数据均由此 四个数据推算出来的,故称四格表资料。
R ×C表 2 检验
行×列表资料
① 多个样本率比较时,有R行2列,称为R ×2表; ② 两个样本的构成比比较时,有2行C列,称
2×C表; ③ 多个样本的构成比比较,以及双向无序分类资
料关联性检验时,有行列,称为R ×C表。
检验统计量
2 n(
A2 1)
nR nC
(行数 1)(列数 1)
注意:
本法一般用于样本含量不太大的资料。因 为它仅考虑了两法结果不一致的两种情况(b, c), 而未考虑样本含量n和两法结果一致的两种情 况(a, d)。所以,当n很大且a与d的数值很大 (即两法的一致率较高),b与c的数值相对较 小时,即便是检验结果有统计学意义,其实际 意义往往也不大。
第三节
表7-7 两组患者尿路疼痛原因的分布
分组
治 疗 组 对 照 组 合计
尿 路 感 染 34 29 63
尿 路 疼 痛 原 因 器 械 损 伤 29 35 64
其 它 9 8 17
合 计
72 72 144
2. 求检验统计量和自由度。将表 9-7 数据代入公式 9-14,有
2 144(1)13.40222929222923258 726创3创7创2647217726372647217
c2
( AT 0.5)2 T
(|ad-bc|-n)2n
c2
=
2
(a+b)(c+d)(a+c)(b+d)
2 分布是一连续型分布,而四
格表资料属离散型分布,由此计算得
的 2 统计量的抽样分布亦呈离散性 质。为改善 2 统计量分布的连续性,
则进行连续性校正。
四格表资料 2 检验公式选择条件:
24.08, P0.05
结论与之相反。
(四)卡方检验的连续性校正问题
赞成依据是:这样做可使卡方统计量抽样 分布的连续性和平滑性得到改善,可以降 低I类错误的概率,连续性校正后的卡方检 验,其结果更接近于Fisher确切概率法。不 过,校正也不是无条件的,它只适合于自 由度为1时,样本含量较小,如n<40,或 至少有一个格子的理论频数太小,如T<5 的情形。
本例 n116,但 T224.8,故用四格表 资料 2检验的校正公式
c 2(6687 0 4 4 3 6 8 10 14 16 1 2 2 )2 1162.92
1,查 2界值表得 0.0 5P0.1。0按
0.05检验水准不拒绝 H 0 ,尚不能认
为组有效率不等。
本资料若不校正时,
感染率(%)
2.36 0.62 0.26 1.45
二、两组构成比的比较
例7-5为研究某种新药对尿路疼痛的止痛效果, 将有尿路疼痛的患者144例随机分为两组,每组72 例,一组服该新药(治疗组),另一组服安慰剂 (对照组)。两组患者尿路疼痛的原因见表7-7, 问两组患者尿路疼痛原因的分布有无差异?
=0.05
已知样本四格表中,b=12,c=3,因 b+c=15,故将其代入公式 9-13,有
2 c
(12 3 1)2 12 3
4.27
查附表
8,
2 0.025,1
5.02
,
2 0.05,1
3.84
,得
0.025<P<0.05,按
=0.05
水准拒绝
H0,接
受 H1,可以认为两种剂量的毒性有差异,甲剂量组的死亡率较高(因 b>c)。
显著性; • ③检验两个双向无序分类变量是否存在
关联; • ④配对计数资料的比较。
一、两独立样本率检验 (一)两独立样本率资料的四格表形式
例7-1 为研究肿瘤标志物癌胚抗原(CEA)
对肺癌的诊断价值,随机抽取72例确诊为肺癌的 患者为肺癌组,114例接受健康体检的非肺癌患 者为对照组。用CEA对其进行检测,结果呈阳性 反应者病例组中33例,对照组中10例。问两组人 群的CEA阳性率有无差异?
16.6
55.4
26.4
87.6
16.42(161.6551.4261.4871.6)34.32
2(9990.48)2(513.52)2(7583.52)2(2112.48)2
90.48
13.52
83.52
12.48
12.86
(2 1 )2 ( 1 )1
以 = 1 查 附 表 8 的 2 界 值 表 得 P 0 . 005
理论频数 是T 根据检验设
率 来估计 而定的。
H0:,1且2用合并
a c ac (72) ab cd n
TaT11(ab)n (ac) (73)
TcT21(cd)n (ac) (74)
b d bd (75) ab cd n
TbT 12(ab)n (bd) (76) TdT22(cd)n (bd) (77)
α=0.05。
(2)求检验统计量值
T 1 1 7 2 4 3 /1 8 6 1 6 .6 , T 1 2 7 2 1 6 .6 5 5 .4 T 2 1 4 3 1 6 .6 2 6 .4, T 2 2 1 1 4 2 6 .4 8 7 .6。
2(3316.6)2(3955.4)2(1026.4)2(10487.6)2
• 为客观起见,建议将两种结论同时报 告出来,以便他人判断。当然,如果 两种结论一致,如均为或,则只报道 非连续性检验的结果即可。
Biblioteka Baidu
第二节、两相关样本率检验 (McNemar检验)
配对四格表资料的 2 检验
与计量资料推断两总体均数是否 有差别有成组设计和配对设计一样, 计数资料推断两个总体率(构成比) 是否有差别也有成组设计和配对设计, 即四格表资料和配对四格表资料。
n40, T5,不校正的理论或专用公
式; n40, 1T5,校正公式;
n40或 T1,直接计算概率 (Fisher)。
2 连续性校正仅用于 1的四格表资料,当 2 时,一般不作校正。
例7-2 将116例癫痫患者随机分
为两组,一组70例接受常规加高压氧 治疗(高压氧组),另一组46例接受 常规治疗(常规组),治疗结果见表 7-3。问两种疗法的有效率有无差别?
了自由度ν的影响, 2值才能正确地反映实际频数A和理论
频数T 的吻合程度。
检 2验的自由度取决于可以自由取值的格子
数目,而不是样本含量n。四格表资料只有
两行两列,=1,即在周边合计数固定的情
况下,4个基本数据当中只有一个可以自由
取值。
(三) 假设检验
(1) 建立检验假设,确定检验水平。
H0:π1=π2 H1:π1≠π2
(21)(31)2
3.
确定
P
值,下结论。查 2
界值表,
2 0.5,2
1.39 ,
1.018
2 0.5,2
,所以,P>0.50,
以 0.05 水准不拒绝 H0,即尚不能认为两组患者尿路疼痛原因的分布有差异。
三、多组构成比的比较
例7-6 在某项疼痛测量研究中,给160例手术 后疼痛的患者提供四种疼痛测量量表,即 直观模拟量表(VAS),数字评估量表 (NRS),词语描述量表(VDS),面部 表情疼痛量表(FPS),患者首选的量表以 及患者的文化程度见表7-8,问患者首选疼 痛量表与文化程度是否有关?
处理组 发生数 未发生数 合计
甲
a
b
a+b
乙
c
d
c+d
合 计 a+c b+d
n
表7-2 四格表资料的基本形式
基本思想:可通过 检验的基本公式
来理解。
2
2 (A T )2, (行 数 - 1 )(列 数 1 )
T
式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。
一、多个样本率的比较
例7-4用A、B、C三种不同方法分别处理新生儿
脐带,发生感染的情况见表7-6,试比较3种不同方 法的脐带感染率有无差异。
表9-6 三种脐带处理方法的脐带感染情况
处理组
A B C 合计
脐带感染
感染
未感染
76
3143
15
2409
2
762
93
6314
合计
3219 2424 764 6407
理论频数由下式求得:
TRC
nR nC n
式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
检验统计量 2 值反映了实际频数与 理论频数的吻合程度。
若检验假设H0:π1=π2成立,四个格子的实际 频数A 与理论频数T 相差不应该很大,即统计量
不应该很大。如果 2 值很大,即相对应的P 值很
。 按 0 . 05
检 验 水 准 拒 绝 H0 , 接 受H1 , 肺 癌 患 者 癌 胚 抗 原 的
阳性率显著高于健康人,提示可能具有临床诊断价
值。
四格表资料检验的专用公式
2
(adbc)2n
(ab)(ac)(bd)(cd)
2(331041039)218634.10
7243143114
(四)四格表资料检验的校正公式
卡方检验解释
卡方检验解释
主讲内容
第一 第二 第三 第四 第五 第六 第七
2 概述——基本思想 2×2表卡方检验 配对四格表卡方检验 R×C表卡方检验 Fisher确切概率检验 多个样本率的多重比较 有序分组资料的线性趋势检验
卡方检验概述p136
• 研究目的:率 or 构成比的假设检验(大样本率或
小样本率)
• 资料类型:计数资料
•
基本思想: 2
检验中的
2
是希腊字母,称为卡方
检验,是一种用途较广的计数资料的假设检验方法,
属于非参数检验的范畴,主要是比较两个及两个以
上样本率( 构成比)以及两个分类变量的关联性分
析。其根本思想就是在于比较理论频数和实际频数
的吻合程度或拟合优度问题。
检验的应用
2
• ①检验两个样本率之间差别的显著性; • ②检验多个样本率或构成比之间差别的
表7-3 两种疗法治疗癫痫的效果
治 疗 方 法
治 疗 结 果
有 效
无 效
高 压 氧 组 66( 62.8)
4( 7.2)
常 规 组 38( 41.2)
8( 4.8)
合计 104
12
合 计 有 效 率 ( % )
70 46 116
94.3 82.6 89.7
H 0 :1 2 ,H 1 :1 2 , 0 .0 5
小,若 P ,则反过来推断A与T相差太大,超出 了抽样误差允许的范围,从而怀疑H0的正确性, 继而拒绝H0,接受其对立假设H1,即π1≠π2 。
由公式(7-1)还可以看出: 2 值的大小还取决于( A T ) 2
个数的多少(严格地说是自由度ν的大小)。由于各
(
A
T
T
)2
T
皆是正值,故自由度ν愈大, 2 值也会愈大;所以只有考虑
(四)卡方检验的连续性校正问题
反对依据是:经连续性校正后,P值有过分 保守之嫌。此外,Fisher确切概率法建立在 四格表双边固定的假定下,而实际资料则 是单边固定的四格表,连续性校正卡方检 验的P值与Fisher确切概率法的P值没有可 比性。
• 就应用而言,无论是否经过连续性校 正,若两种检验的结果一致,无须在 此问题上纠缠。但是,当两种检验结 果相互矛盾时,如例7-2,就需要谨 慎解释结果了。
乙 剂 量
死 亡 (+ ) 生 存 (- )
6( a) 3( c)
12( b) 18( d)
9
30
合计
18 21 39
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能:
①两只大鼠均死亡(甲+乙+)数(a); ②两只均生存(甲-乙-)数(d); ③其中一只死亡(甲+乙- )数(b); ④其中一只死亡(甲-乙+)数 (c)。
例7-3某抗癌新药的毒理研究中,将
78只大鼠按性别、窝别、体重、年龄等因 素配成39对,每个对子的两只大鼠经随机 分配,分别接受甲剂量和乙剂量注射,试 验结果见表7-4。试分析该新药两种不同剂 量的毒性有无差异。
表7-4 某抗癌新药两种剂量的毒理实验结果
甲 剂 量
死 亡 (+ ) 生 存 (- ) 合计