医学统计学 孙振球 第七章 卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
理论依据:超几何分布
(非 检验 的范畴)
2
105 38
例7-4 某医师为研究乙肝免疫球
蛋白预防胎儿宫内感染HBV的效果,将 33例HBsAg阳性孕妇随机分为预防注射 组和非预防组,结果见表7-4。问两组
新生儿的HBV总体感染率有无差别?
105
39
表7-4 两组新生儿HBV感染率的比较
组别 预防注射组 非预防组 合计 阳性 4 5(3) 9 阴性 18 6 24 合计 22 11 33 感染率 (%) 18.18 45.45 27.27
105
40
一、基本思想
在四格表周边合计数固定不变的条 件下,计算表内4个实际频数变动时的
各种组合之概率 P ;再按检验假设用 i 单侧或双侧的累计概率 P,依据所取
的检验水准 做出推断。
105 41
1.各组合概率Pi的计算 在四格表周边合计数 不变的条件下,表内4个实际频数 a,b,c,d 变 动的组合数共有“周边合计中最小数+1”个。 如例7-4,表内4个实际频数变动的组合数共 有9+1=10个,依次为:
nR nC TRC n
式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
105 14
理论频数 T 是根据检验假设 H0 : 1 2 ,且用合 并率来估计 而定的。 如上例,无效假设是试验组与对照组降低颅内压的 总体有效率相等,均等于合计的有效率87%。那么 理论上,试验组的104例颅内压增高症患者中有效 者应为104(174/200)=90.48,无效者为 104(26/200)=13.52;同理,对照组的96例颅内压增 高症患者中有效者应为96(174/200)=83.52,无效者 为96(26/200)=12.48。
检验统计量为
(b c) , 1 bc
2 2
2 c
( b c 1) bc
105
2
, =1
34
注意:
本法一般用于样本含量不太大的资料。因
为它仅考虑了两法结果不一致的两种情况(b, c),
而未考虑样本含量n和两法结果一致的两种情况 (a, d)。所以,当n很大且a与d的数值很大(即
检验的自由度取决于可以自由取值的格
2
子数目,而不是样本含量n。四格表资料只 有两行两列,=1,即在周边合计数固定的情 况下,4个基本数据当中只有一个可以自由 取值。 105 17
3. 假设检验步骤
(1) 建立检验假设,确定检验水平。
H0:π1=π2 即试验组与对照组降低颅内压的总体有效率相等 H1:π1≠π2 即试验组与对照组降低颅内压的总体有效率不相等
105 16
( A T )2 由公式(7-1)还可以看出: 值的大小还取决于 T 2 个数的多少(严格地说是自由度ν的大小)。由于各 ( A T ) T
2
皆是正值,故自由度ν愈大, 2 值也会愈大;所以只有考虑 2 了自由度ν的影响, 值才能正确地反映实际频数A和理论频 数T 的吻合程度。
2
105 2
第一节 第二节 第三节 第四节 第五节 第六节 第七节
2 检验 四格表资料的
2 检验 配对四格表资料的
四格表资料的 Fisher 确切概率法 行×列表资料的 检验
2
多个样本率间的多重比较 有序分组资料的线性趋势检验(不讲) 频数分布拟合优度的 检验
2
105 3
目的:
推断两个总体率或构成比之间有无差别
第七章
检验
2
Chi-Square Test
105 1
Content
• test of fourfold data • 2 test of paired fourfold data • Fisher probabilities in fourfold data 2 • test of R×C table • Multiple comparison of sample rates 2 • test of goodness of fit
105 30
例7-3 某实验室分别用乳胶凝集
法和免疫荧光法对58名可疑系统红斑
狼疮患者血清中抗核抗体进行测定,
结果见表7-3。问两种方法的检测结果 有无差别?
105 31
表7-3 两种方法的检测结果
免疫荧光法 + - 合计 乳胶凝集法 + 11(a) 2(c) 13 - 12(b) 33(d) 45 合计 23 35 58
两法的一致率较高),b与c的数值相对较小时, 即便是检验结果有统计学意义,其实际意义往
往也不大。
105
35
检验步骤: H 0 : B C , H 1 : B C , 0.05
b c 12 2 14 40 ,用校正公式
c2
( 12 2 1) 2 12 2
( ν1+ν2 )的 分布,即 2
( X1 X ~ 2)
2 。
1 2
2 界值:当 确定后, 2 分布曲线下右侧尾部的 (3) 时,横轴上相应的 2 值,记作 , (见附表 8)。 2 面积为
2 值愈大,P 值愈小;反之, 2 值愈小,P 值愈大。
105 7
疾病的有效率是否相等?
105 25
表7-2 两种药物治疗脑血管疾病有效率的比较
组别 胞磷胆碱组 神经节苷酯组 合计 有效 46 18 64 无效 6 8(4.67) 14 合计 52 26 78 有效率(%) 88.46 69.23 82.05
105
26
H 0 : 1 2 , H1 : 1 2 , 0.05
105 27
本资料若不校正时,
4.35,P 0.05
2
结论与之相反。
105
28
第二节
配对四格表资料的 检验
2
105
29
与计量资料推断两总体均数是否 有差别有成组设计和配对设计一样, 计数资料推断两个总体率(构成比) 是否有差别也有成组设计和配对设计, 即四格表资料和配对四格表资料。
0.5 0.4 0.3
1
f ( 2 )
0.2 0.1 0 0 2 4
6
10
6
8
10
12
14
16
105
2
8
2. 检验的基本思想
2
例7-1 某院欲比较异梨醇口服液(试验组)和
氢氯噻嗪+地塞米松(对照组)降低颅内压的疗 效。将200例颅内压增高症患者随机分为两组,结
果见表7-1。问两组降低颅内压的总体有效率有无
α=0.05。
105 18
(2)求检验统计量值
T11 104 174/ 200 90.48 ,T12 104 90.48 13.52
T21 174 90.48 83.52 ,T22 26 13.52 12.48 。
(99 90.48) 2 (5 13.52) 2 (75 83.52) 2 (21 12.48) 2 2 90.48 13.52 83.52 12.48 12.86
本例 n 78, 但T22 4.67,故用四格表 2 资料 检验的校正公式
2 c
( 46 8 6 18 78 / 2) 78
2
52 26 64 14
3.14
1,查 2 界值表得 0.05 P 0.10 。按
0.05检验水准不拒绝 H 0,尚不能认 为两种药物治疗脑血管疾病的有效率不等。
(2 1)( 2 1) 1
105 19
以 =1 查 附表 8 的 界 值表得
2
P 0.005 。按 0.05 检验水准拒绝 H 0 ,
接受 H 1 ,可以认为两组降低颅内压总体 有效率不等,即可认为异梨醇口服液降 低颅内压的有效率高于氢氯噻嗪+地塞 米松的有效率。
2
n 40, T 5 ,专用公式;
n 40, 1 T 5,校正公式;
,直接计算概率。 n 40 或 T 1
2 连续性校正仅用于 1 的四格表资料,当 2
时,一般不作校正。
105 24
例7-2 某医师欲比较胞磷胆碱与
神经节苷酯治疗脑血管疾病的疗效, 将78例脑血管疾病患者随机分为两组, 结果见表7-2。问两种药物治疗脑血管
105
10
本例资料经整理成图7-2形式,即有两 个处理组,每个处理组的例数由发生数和
未发生数两部分组成。表内有
99 5 75 21
四个
基本数据,其余数据均由此四个数据推算 出来的,故称四格表资料。
105 11
处理组 甲 乙 合 计
发生数
未发生数
合计 a+b c+d n
a c a+c
b d b+d
2
统计量 分布的连续性,则需行连续性
2
校正。
105 22
三、四格表资料检验的校正公式
2 c
( A T 0.5) T
2
n 2 (| ad - bc | - ) n 2 2 c = (a +b)(c + d )(a + c)(b+ d )
105 23
四格表资料 检验公式选择条件:
105
32
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能: ①两种检测方法皆为阳性数(a); ②两种检测方法皆为阴性数(d); ③免疫荧光法为阳性,乳胶凝集法为 阴性数(b); ④乳胶凝集法为阳性,免疫荧光法为 阴性数(c)。
105 33
其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。
5.79
1
,查 2 界值表得 0.01 P 0.025 。
按 0.05 检验水准拒绝 H 0 ,接受 H 1 ,可 以认为两种方法的检测结果不同,免疫荧 光法的阳性检测率较高。
105 36
第三节
四格表资料的Fisher确切概率法
105
37
条件: n 40 ,或T 1 , 或 P 时,
105
15
检验统计量 值反映了实际频数与理 论频数的吻合程度。
2
若检验假设H0:π1=π2 成立,四个格子的实际 频数A 与理论频数T 相差不应该很大,即统计量 2 值很大,即相对应的P 值很 不应该很大。如果 小,若 P ,则反过来推断A与T相差太大,超出 了抽样误差允许的范围,从而怀疑H0的正确性, 继而拒绝H0,接受其对立假设H1,即π1≠π2 。
105 20
二、四格表资料检验的专用公式
2
(ad bc) n (a b)(a c)(b d )(c d )
2
2
(99 21 5 75) 200 12.86 104 96 174 26
2
105 21
分布是一连续型分布,而四格表
2
资料属离散型分布,由此计算得的统计 量 的抽样分布亦呈离散性质。为改善
1. 分布
2
(1) 2 分布是一种连续型分布:按分布的密度函数可给出 自由度=1,2,3,……的一簇分布曲线 (图7-1)。 (2) 2 分布的一个基本性质是可加性: 如果两个独立的 随机变量X1和X2分别服从自由度ν1和ν2的分布,
即 X 1 ~ 21 , X 2 ~ 22 ,那么它们的和( X1+X2 )服从自由度
多个总体率或构成比之间有无差别
多个样本率的多重比较
两个分类变量之间有无关联性
频数分布拟合优度的检验。
检验统计量:
2
ห้องสมุดไป่ตู้
应用:计数资料
第一节 四格表资料的 检验
2
105
5
目的:推断两个总体率(构成比)是 否有差别 (和u检验等价)
要求:两样本的两分类个体数排列成四 格表资料
105
6
2 检验的基本思想 一、
图7-2 四格表资料的基本形式
105 12
基本思想:可通过 检验的基本公式 来理解。
2
2
( AT ) , (行数-1)(列数 1) T
2
式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。
105 13
理论频数由下式求得:
差别?
105 9
表7-1 两组降低颅内压有效率的比较
组 别 试验组 对照组 合 计 有 效 99(90.48) a 75(83.52) c 174(a+c) 无 效 5(13.52) b 21(12.48) d 26(b+d) 合 计 104 (a+ b) 96 (c+d) 200 (n) 有效率(%) 95.20 78.13 87.00
(非 检验 的范畴)
2
105 38
例7-4 某医师为研究乙肝免疫球
蛋白预防胎儿宫内感染HBV的效果,将 33例HBsAg阳性孕妇随机分为预防注射 组和非预防组,结果见表7-4。问两组
新生儿的HBV总体感染率有无差别?
105
39
表7-4 两组新生儿HBV感染率的比较
组别 预防注射组 非预防组 合计 阳性 4 5(3) 9 阴性 18 6 24 合计 22 11 33 感染率 (%) 18.18 45.45 27.27
105
40
一、基本思想
在四格表周边合计数固定不变的条 件下,计算表内4个实际频数变动时的
各种组合之概率 P ;再按检验假设用 i 单侧或双侧的累计概率 P,依据所取
的检验水准 做出推断。
105 41
1.各组合概率Pi的计算 在四格表周边合计数 不变的条件下,表内4个实际频数 a,b,c,d 变 动的组合数共有“周边合计中最小数+1”个。 如例7-4,表内4个实际频数变动的组合数共 有9+1=10个,依次为:
nR nC TRC n
式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
105 14
理论频数 T 是根据检验假设 H0 : 1 2 ,且用合 并率来估计 而定的。 如上例,无效假设是试验组与对照组降低颅内压的 总体有效率相等,均等于合计的有效率87%。那么 理论上,试验组的104例颅内压增高症患者中有效 者应为104(174/200)=90.48,无效者为 104(26/200)=13.52;同理,对照组的96例颅内压增 高症患者中有效者应为96(174/200)=83.52,无效者 为96(26/200)=12.48。
检验统计量为
(b c) , 1 bc
2 2
2 c
( b c 1) bc
105
2
, =1
34
注意:
本法一般用于样本含量不太大的资料。因
为它仅考虑了两法结果不一致的两种情况(b, c),
而未考虑样本含量n和两法结果一致的两种情况 (a, d)。所以,当n很大且a与d的数值很大(即
检验的自由度取决于可以自由取值的格
2
子数目,而不是样本含量n。四格表资料只 有两行两列,=1,即在周边合计数固定的情 况下,4个基本数据当中只有一个可以自由 取值。 105 17
3. 假设检验步骤
(1) 建立检验假设,确定检验水平。
H0:π1=π2 即试验组与对照组降低颅内压的总体有效率相等 H1:π1≠π2 即试验组与对照组降低颅内压的总体有效率不相等
105 16
( A T )2 由公式(7-1)还可以看出: 值的大小还取决于 T 2 个数的多少(严格地说是自由度ν的大小)。由于各 ( A T ) T
2
皆是正值,故自由度ν愈大, 2 值也会愈大;所以只有考虑 2 了自由度ν的影响, 值才能正确地反映实际频数A和理论频 数T 的吻合程度。
2
105 2
第一节 第二节 第三节 第四节 第五节 第六节 第七节
2 检验 四格表资料的
2 检验 配对四格表资料的
四格表资料的 Fisher 确切概率法 行×列表资料的 检验
2
多个样本率间的多重比较 有序分组资料的线性趋势检验(不讲) 频数分布拟合优度的 检验
2
105 3
目的:
推断两个总体率或构成比之间有无差别
第七章
检验
2
Chi-Square Test
105 1
Content
• test of fourfold data • 2 test of paired fourfold data • Fisher probabilities in fourfold data 2 • test of R×C table • Multiple comparison of sample rates 2 • test of goodness of fit
105 30
例7-3 某实验室分别用乳胶凝集
法和免疫荧光法对58名可疑系统红斑
狼疮患者血清中抗核抗体进行测定,
结果见表7-3。问两种方法的检测结果 有无差别?
105 31
表7-3 两种方法的检测结果
免疫荧光法 + - 合计 乳胶凝集法 + 11(a) 2(c) 13 - 12(b) 33(d) 45 合计 23 35 58
两法的一致率较高),b与c的数值相对较小时, 即便是检验结果有统计学意义,其实际意义往
往也不大。
105
35
检验步骤: H 0 : B C , H 1 : B C , 0.05
b c 12 2 14 40 ,用校正公式
c2
( 12 2 1) 2 12 2
( ν1+ν2 )的 分布,即 2
( X1 X ~ 2)
2 。
1 2
2 界值:当 确定后, 2 分布曲线下右侧尾部的 (3) 时,横轴上相应的 2 值,记作 , (见附表 8)。 2 面积为
2 值愈大,P 值愈小;反之, 2 值愈小,P 值愈大。
105 7
疾病的有效率是否相等?
105 25
表7-2 两种药物治疗脑血管疾病有效率的比较
组别 胞磷胆碱组 神经节苷酯组 合计 有效 46 18 64 无效 6 8(4.67) 14 合计 52 26 78 有效率(%) 88.46 69.23 82.05
105
26
H 0 : 1 2 , H1 : 1 2 , 0.05
105 27
本资料若不校正时,
4.35,P 0.05
2
结论与之相反。
105
28
第二节
配对四格表资料的 检验
2
105
29
与计量资料推断两总体均数是否 有差别有成组设计和配对设计一样, 计数资料推断两个总体率(构成比) 是否有差别也有成组设计和配对设计, 即四格表资料和配对四格表资料。
0.5 0.4 0.3
1
f ( 2 )
0.2 0.1 0 0 2 4
6
10
6
8
10
12
14
16
105
2
8
2. 检验的基本思想
2
例7-1 某院欲比较异梨醇口服液(试验组)和
氢氯噻嗪+地塞米松(对照组)降低颅内压的疗 效。将200例颅内压增高症患者随机分为两组,结
果见表7-1。问两组降低颅内压的总体有效率有无
α=0.05。
105 18
(2)求检验统计量值
T11 104 174/ 200 90.48 ,T12 104 90.48 13.52
T21 174 90.48 83.52 ,T22 26 13.52 12.48 。
(99 90.48) 2 (5 13.52) 2 (75 83.52) 2 (21 12.48) 2 2 90.48 13.52 83.52 12.48 12.86
本例 n 78, 但T22 4.67,故用四格表 2 资料 检验的校正公式
2 c
( 46 8 6 18 78 / 2) 78
2
52 26 64 14
3.14
1,查 2 界值表得 0.05 P 0.10 。按
0.05检验水准不拒绝 H 0,尚不能认 为两种药物治疗脑血管疾病的有效率不等。
(2 1)( 2 1) 1
105 19
以 =1 查 附表 8 的 界 值表得
2
P 0.005 。按 0.05 检验水准拒绝 H 0 ,
接受 H 1 ,可以认为两组降低颅内压总体 有效率不等,即可认为异梨醇口服液降 低颅内压的有效率高于氢氯噻嗪+地塞 米松的有效率。
2
n 40, T 5 ,专用公式;
n 40, 1 T 5,校正公式;
,直接计算概率。 n 40 或 T 1
2 连续性校正仅用于 1 的四格表资料,当 2
时,一般不作校正。
105 24
例7-2 某医师欲比较胞磷胆碱与
神经节苷酯治疗脑血管疾病的疗效, 将78例脑血管疾病患者随机分为两组, 结果见表7-2。问两种药物治疗脑血管
105
10
本例资料经整理成图7-2形式,即有两 个处理组,每个处理组的例数由发生数和
未发生数两部分组成。表内有
99 5 75 21
四个
基本数据,其余数据均由此四个数据推算 出来的,故称四格表资料。
105 11
处理组 甲 乙 合 计
发生数
未发生数
合计 a+b c+d n
a c a+c
b d b+d
2
统计量 分布的连续性,则需行连续性
2
校正。
105 22
三、四格表资料检验的校正公式
2 c
( A T 0.5) T
2
n 2 (| ad - bc | - ) n 2 2 c = (a +b)(c + d )(a + c)(b+ d )
105 23
四格表资料 检验公式选择条件:
105
32
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能: ①两种检测方法皆为阳性数(a); ②两种检测方法皆为阴性数(d); ③免疫荧光法为阳性,乳胶凝集法为 阴性数(b); ④乳胶凝集法为阳性,免疫荧光法为 阴性数(c)。
105 33
其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。
5.79
1
,查 2 界值表得 0.01 P 0.025 。
按 0.05 检验水准拒绝 H 0 ,接受 H 1 ,可 以认为两种方法的检测结果不同,免疫荧 光法的阳性检测率较高。
105 36
第三节
四格表资料的Fisher确切概率法
105
37
条件: n 40 ,或T 1 , 或 P 时,
105
15
检验统计量 值反映了实际频数与理 论频数的吻合程度。
2
若检验假设H0:π1=π2 成立,四个格子的实际 频数A 与理论频数T 相差不应该很大,即统计量 2 值很大,即相对应的P 值很 不应该很大。如果 小,若 P ,则反过来推断A与T相差太大,超出 了抽样误差允许的范围,从而怀疑H0的正确性, 继而拒绝H0,接受其对立假设H1,即π1≠π2 。
105 20
二、四格表资料检验的专用公式
2
(ad bc) n (a b)(a c)(b d )(c d )
2
2
(99 21 5 75) 200 12.86 104 96 174 26
2
105 21
分布是一连续型分布,而四格表
2
资料属离散型分布,由此计算得的统计 量 的抽样分布亦呈离散性质。为改善
1. 分布
2
(1) 2 分布是一种连续型分布:按分布的密度函数可给出 自由度=1,2,3,……的一簇分布曲线 (图7-1)。 (2) 2 分布的一个基本性质是可加性: 如果两个独立的 随机变量X1和X2分别服从自由度ν1和ν2的分布,
即 X 1 ~ 21 , X 2 ~ 22 ,那么它们的和( X1+X2 )服从自由度
多个总体率或构成比之间有无差别
多个样本率的多重比较
两个分类变量之间有无关联性
频数分布拟合优度的检验。
检验统计量:
2
ห้องสมุดไป่ตู้
应用:计数资料
第一节 四格表资料的 检验
2
105
5
目的:推断两个总体率(构成比)是 否有差别 (和u检验等价)
要求:两样本的两分类个体数排列成四 格表资料
105
6
2 检验的基本思想 一、
图7-2 四格表资料的基本形式
105 12
基本思想:可通过 检验的基本公式 来理解。
2
2
( AT ) , (行数-1)(列数 1) T
2
式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。
105 13
理论频数由下式求得:
差别?
105 9
表7-1 两组降低颅内压有效率的比较
组 别 试验组 对照组 合 计 有 效 99(90.48) a 75(83.52) c 174(a+c) 无 效 5(13.52) b 21(12.48) d 26(b+d) 合 计 104 (a+ b) 96 (c+d) 200 (n) 有效率(%) 95.20 78.13 87.00