卡方检验PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.四格表χ2的校正公式
χ2 =∑(︱A-TT︱-0.5)2
χ2 =
(︱ad-bc︱-n/2)2 n (a+b)(c+d)(a+c)(b+d)
例2 某医师用两种疗法治疗心绞痛,结果如表2,问 两种疗法的疗效有无差别?
表2
组别
甲疗法 79.31 乙疗法 90.00 合计 84.75
两种疗法治疗心绞痛的效果率
组别
DD
ID
II
合计
DN组 无DN组
合计
42(37.8) 30(21.7) 72(28.9)
48(43.3) 21(18.9) 111 72(52.2) 36(26.1) 138 120(48.2) 57(22.9) 249
H0 :两组2型糖尿病患者ACE基因型的总体构成比相同 H1 :两组2型糖尿病患者ACE基因型的总体构成比不同 α=0.05 按公式(7~10)计算
n
χ2 =(b-c)2/(b+c),
υ=1 (b+c) ≥40
χc2 = ( b-c -1)2/(b+c), υ=1 (b+c) <40
例3 对120名确诊的乳腺癌病人,分别用甲乙两种方
法来检测,甲方法检出阳性率为60%,乙方法检出
阳性率为50%,甲乙一致检出阳性率为35%,问甲
乙两方法检出阳性率有无差别?
(五)、R×C表的分类及其检验方法的选择 1、双向无序R×C表: R×C表中两个分类变量皆为无 序分类变量,如表7-8、表7-9和表7-10。对于该类资 料:
①若研究目的为多个样本率(或构成比)的比较,可用 R×2表资料的χ2检验
②若研究目的为分析两个分类变量之间有无关联性以 及关系的密切程度时,可用R×C表资料的χ 2检验以 及Pearson列联系数进行分析。
恶化
死亡
甲
T< 1
T< 1
乙
(3)改用双向无序表的确切概率法 (4)增大样本含量,重新做实验 2、多个率比较,若所得统计推断为拒绝 H0,接 受H1时,只能认为各总体率之间总的来说有差别。 要进一步推断哪两两总体率之间有差别,需进一 步做多个样本率的多重比较。 3、对于有序的R×C表资料不宜用χ2检验
2、单向有序R×C表: 有两种形式 ①R×C表中的分组变量(如年龄)是有序的,而指标变 量(如传染病的类型)是无序的。其研究目的通常是分 析不同年龄组各种传染病的构成情况,此种单向有序 R×C表资料可用行×列表资料的χ 2检验进行分析。 ②R×C表中的分组变量(如疗法)为无序的,而指标变 量(如疗效按等级分组)是有序的。其研究目的为比较 不同疗效,此种单向有序R×C表资料宜用秩和检验进 行分析。
观察的结果只有阳性、阴性两种可能,清点 成对资料时只有四种情况:
a:甲+乙+ b:甲+乙c:甲-乙+ d:甲-乙列成下面四格表
适用于配对设计的计数资料
配对资料的结果有
甲 乙 结果
++ a +- b -+ c -- d
甲法 + -
合计
配对设计的计数资料
乙法
+
-
a
b
c
d
a+c
b+d
合计
a+b c+d
(ad-bc)2 n (a+b)(c+d)(a+c)(b+d)
a、b、c、d 为四格表的实际频数
(a+b), (c+d), (a+c), (b+d)是四格表周边的合计数
n=a+b+c+d 为总的样本含量
对例10-7的计算
χ2
=
(52×50-34×45)2181 (86×95×97×84) =3.11
有效
无效
合计 有效率(%)
23
6 (4.42) 29
27
3
30
50
9
59
H0: π1= π2 即两种疗法的疗效相等 H1: π1≠ π2 即两种疗法的疗效不等
α=0.05
T=29×9/59=4.42(计算行合计和列合计均为最小的理论数)
χc2
=
(
23×3-6×27 -59/2)2×59 29×30×50×9
行列表检验的专用公式 χ2=n(∑A2/nRnC-1) υ = (R-1)(C-1)
(一)、多个样本率的比较 例5 某医师研究物理疗法、药物治疗和外用膏药三种疗
法治疗周围性面神经麻痹的疗效,资料见表5。问三种疗
法的有效率有无差别?
表5 三种疗法有效率的比较
疗法
有效 无效 合计
(%)
物理疗法组 199
=0.61
υ=1,查χ2界值表得, P>0.05。按α=0.05的水准不拒绝 H0,
尚不能认为两种两种疗法的疗效不等.
三、配对四格表资料的χ2检验
配对四格表资料的χ2检验是对配对设 计研究所获得的资料为计数资料进行比较。
配对设计包括: ①同一批样品用两种不同的处理方法 ②观察对象根据配对条件配成对子,同一对子 内的不同个体分别接受不同的处理 ③在病因或危险因素的研究中,将病人和对照 按配对条件配成对子,研究是否存在某种病因 或危险因素。
表7 某地5801人的血型
ABO 血型
MN血型
合
计
M
N
MN
O 1823
431
490
902
A 1598
Biblioteka Baidu
388
410
800
B 2032
495
587
950
H0 :两种血型系统间无关联 H1 :两种血型系统间有关联 α=0.05 χ2=5801(4322/1823×1451+4902/1823×1666+…
医学统计学
χ2 检验
一、 χ2检验的基本思想 二、一般四格表的χ2检验 三、配对四格表资料的χ2检验 四、行×列表资料的χ2检验
一、χ2检验的基本思想
例1 某医生用两种疗法治疗前列腺癌,出院后 随访3年,甲疗法治疗86例。乙疗法治疗95例, 结果见下表。问两种疗法治疗前列腺癌病人的3 年生存率是否有差别?
53.5946.0 39.9
9
1
表中 50.9 44为.0基本数据,称为实际频数,用AR.C表示,
1
9
若假设两种疗法治疗前列腺癌病人的3年生存率相同,即
H0: 1=2= 53.59%,则
T1.1=86×97/181=46.09 T1.2=86×84/181=39.91 T2.1=95×97/181=50.91 T2.2=95×84/181=44.09
7
206
96.60
药物治疗组 164
18
182
90.11
外用药膏组 118
26
144
有效率
H0 :π1=π2= π3,即三种疗法的有效率相等 H1 :三种疗法的有效率不全相等 α=0.05 χ2 =532(1992/206×481+72/206×51+…+262/144×51-1)
=21.04 υ= ( 3-1)( 2-1) = 2 查χ2界值表:得P<0.005.按 α=0.05 拒绝 H0,接受H1,可
46.09
39.91 50.91
44.09
υ=(2-1) (2-1)=1
查χ2界值表得 χ20.05,1=3.84, χ2< χ20.05,1 ,P>0.05。按α=0.05的水准,不 拒绝H0,还不能认为两种疗法治疗前列腺癌的3年生存率不相同。
(二)、四格表的专用公式
当n≥40,T≥5时,用
χ2 =
表3: 两种方法的检测结果
甲方法
+ — 合计
乙方法
+
—
42(a)
30(b)
18(c)
30(d)
60 (a+c) 60(b+d)
合计
72 (a+b) 48 (c+d) 120 (a+b+c+d)
H0:B=C (π1= π2) H1:B ≠ C (π1≠ π2) α=0.05
b+c= 30+18=48>40 χ2 =(30-18)2/(30+18)=3.0 υ=1,查 χ2界值表得 P>0.05 。按α=0.05水准,不拒绝 H0 ,还不能认为两种方法的检验结果不同。
(四)、行×列表资料检验的注意事项
1、理论频数T不应太小; 不宜有1/5以上的格子1≤T<5; 不宜有一个格子的T<1 若出现上述情况,处理的方法有:
(1)最好是增加样本的含量,使理论频数T增加 (2)根据专业知识,考虑能否删去T太小的行与列,或T 太小的行与列,进行合理的合并
组别
痊愈 好转 无效
χ2=249(422/111×72+482/111×120+…+362/138×57-1) =7.91
υ = (2-1) (3-1)=2 查χ2界值表得0.01<P<0.025。按α=0.05拒绝H0, 接受
H1,认为DN与无DN的2型糖尿病患者的ACE基因型分 布不同。
(三)、双向无序分类资料的关联性检验 例7 测得某地5801人的ABO血型和MN血型结果如表 7,问两种血型系统之间是否有关联?
χ2 =∑(A-T)2
T υ = (R-1)(C-1)
TR.C =nRn×nc
υ = (2-1)(2-1)=1
假如H0: π1= π2成立,则A、T不会相差太大,那么χ2 会小;(A与T的差别是由抽样误差所致)
反之若检验假设H0不成立, 则A、T会相差很大,那 么χ2会大;(抽样误差不能引起A与T有如此大的差别)
3、双向有序属性相同的R×C表: R×C表中的两分
类变量皆为有序且属性相同。实际上是2×2配对设计
的扩展,即水平数≥3的诊断试验配伍设计,如用两种
检测方法同时对同一批样品的测定结果。其研究目的
的通常是分析两种检验方法的一致性,此时宜用一致
H0: π1= π2 即两种疗法治疗前列腺癌的3年生存率相同 H1: π1≠ π2 即两种疗法治疗前列腺癌的3年生存率不相同
α=0.05
T1.1=86×97/181=46.09
T1.2=86×84/181=39.91
T2.1=95×97/181=50.91
T2.2=95×84/181=44.09
χ2 =∑(A-TT)2 =(52-46.09)2+(34-39.91)2+(45-50.91)2+(50-44.09)2=3.11
判断结果,根据自由度υ的大小查χ2界值表
当χ2≥ χ2α,υ时,P≤α,拒绝H0,接受H1 当χ2< χ2α,υ时,P>α ,不拒绝H0. χ2反映了实际频数与理论频数的吻合程度
二、一般四格表的χ2检验
(一)、四格表的一般公式
χ2 =∑(A-T)2
T υ = (R-1)(C-1)
以例1为例做χ2检验
以认为三种疗法治疗周围性面神经麻痹的有效率有差别。
(二)、样本构成比的比较
例6 某医师在研究血管紧张素转化酶(ACE)基因I/D 多态与2型糖尿病肾病(DN)的关系时,将249例Ⅱ型 糖尿病患肾病分为两组,资料见表6。问两组Ⅱ型糖 尿病患者的ACE基因型总体分布有无差别?
表6 DN组与无DN组Ⅱ型糖尿病患者ACE基因型分布
显然,计算结果与前相同,但该法避免了计算理论数的麻繁
(三)、四格表的校正公式 1.χ2检验的应用条件
(1)当n≥40且T≥5时,用χ2检验的基本公式或四格表的专用
公式;当P≈α时,改用四格表的确切概率法。
(2)当n≥40时但有1≤T<5时,用四格表χ2的校正公式或用
四格表的确切概率法
(3)当n<40时,或T<1时,用四格表的确切概率法
表1 甲乙两种疗法治疗前列腺癌的3年生存率
处 理 生存数
死亡数
合 计 生存率
(%)
甲疗法 a52(46.09) b34(39.91) (a+b)86
60.47
乙疗法 c45(50.91) d50(44.09) (c+d)95
47.3752 34
合
4计5
50
(a+c) 97
(b+d) 84
(n)181
b+c=12+4=14<40 χc2 =( 12-2 -1)2/(12+2)=5.79
υ=1,查χ2界值表得 0.01<P<0.025 。按α=0.05水 准拒绝H0 ,接受H1, 认为两种方法的检验结果不同, 免疫荧光法的阳性检出率较高。
四、行×列表资料的χ2检验
可以用于多个率及多个构成比资料的比较。其 基本数据有三种情况: 1、多个样本率比较。有R行2列,称为R×2表 2、两个样本的构成比比较,有2行C列,称为2×C表 3、多个样本的构成比比较,以及双向无序分类资料 关联性检验,有R行C列,称为R×C表
例4 某实验室分别用乳胶凝集法和免疫荧光法对58 名可疑系统红斑狼疮患者血清中抗体进行测定,结 果见表4。问两种方法的检验结果有无差别?
表4 两种方法的检测结果
免疫荧光法
乳胶凝集法
+
—
+ — 合计
11(a) 12(b) 2 (c) 3(d)
13
45
合计 23 35
58
H0:B=C H1:B=C α=0.05
+322/348×2684-1)=213.16 υ = (4-1)(3-1)=6 查χ2界值表得P<0.005。按α=0.05拒绝 H0,接受H1, 认为两种血型系统间有关联。
若需进一步分析关系的密切程度时,可计算Pearson 列联系数C
C=√χ2/(n+ χ2)
C取值范围在0~1之间。0表示独立: 1表示完全相 关; 愈接近于0,关系愈不密切,愈接近于1,关系愈密 切。