第7章卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2) 当n≥40,有任一格1≤T<5时,可用Yates校正公式;
(3) 当n<40或有T<1时,用Fisher’s exact probability。
7.2 配对四格表资料的χ2检验
配对设计包括:(1)同一批样品用两种不同的处理方法;(2)观察 对象根据配对条件配成对子,同一对子内不同的个体分别接受不同的处理; (3)在病因和危险因素的研究中,将病人和对照按配对条件配成对子, 研究是否存在某种病因或危险因素。
合计
282
44
326
二、各实验组与同一对照组比 关键是检验水平的校正
'
2k 1
自学
7.6 双向有序分组资料的线性趋势检验
表7-13年龄与冠状动脉硬化的关系(P125) 不作要求
年龄(岁) (X)
20~ 30~ 40~
≥50 合计
冠状动脉硬化等级(Y)
0
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
1122.59 15
18
卡方值
性质:若 2 (1 ), 2 (2 )互相独立,
则
2 (1 ) 2 (2 ) 服从 2分布, 自由度 1 2 2 (1 ) 2 (2 )服从 2分布, 自由度 1 2
若 a (甲+ 乙+)、 b (甲+ 乙-)、 c (甲- 乙+)、 d (甲- 乙-)。 将a、b、c、d四种情况的对子数填入四格表
P114 例7-3
观察的结果只有阳性、阴性两种可能,清点成对资料时发现 则存在四种情况。
(1)两种方法都出现阳性(共有11例); (2)免疫荧光法阳性而乳胶凝集法却是阴性(共有12例); (3)免疫荧光法阴性而乳胶凝集法却是阳性(共有2例); (4)两种检测方法均为阴性结果(共有33例)。
bc
7.4 行×列表资料的 2检验
1、多个样本率的比较 2、样本构成比的比较 3、双向无序分类资料的关联性检验
专用公式
2 n(
A2 1)
nR nC
自由度ν = (R-1)(C-1)
多个样本率或两个构成比 比较的2检验
表7-8 三种疗法有效率的比较
疗法
物理疗法 药物治疗 外用膏药 合计
有效
B
0.05
检验水准调整:
' =
k(k 1) / 2+1
注:k为被比较率的个数
三种疗法治疗周围性面神经麻痹的实例中,检验
水准调整为:
' 0.05 0.05 / 4 0.0125
3(3 1) / 2 1
对应的临界值:P122 表7-11
2 0.0125,1
6.24
表7-12 三种疗法有效率的两两比较 (P123)
卡方检验
(Chi-square test)
Li Junrong
stat9@126.com
7.1 四格表资料的χ2检验
2 检验(Chi-square test)是现代统计学的创始人之
一K. Pearson提出的一种具有广泛用途的统计方法。 该检验可用于两个及多个率(或者构成比)之间
的比较,计数资料的关联度分析,拟合优度检验等。
称该分布具有可加性。
卡方检验的基本思想
四格表
(fourfold table)
表7-1 两组降低颅内压有效率的比较(P137)
组别
试验组 对照组 合计
有效
99 75 174
无效
5 21 26
合计
104 96 200
有效率(%)
95.20 (p1) 78.13 (p2) 87.00 (pc)
实际频数A (actual frequency) 理论频数T (theoretical frequency)
校正公式:
一般认为: 四格表在n>40时出现有任一格
1 ≤ T<5时,需要校正。
2 c
( A T 0.5)2 T
2 c
(a
( ad bc n / 2)2 n b)(c d)(a c)(b
d)
例7-2 P114
例子
2 c
(
46
8 52
6
18 26
78 2)2 64 14
78
3.14
18231451 18231666
348 2684
213.16
(4 1)(3 1) 6
查界值表(P823)得: P<0.005。按α=0.05检验水准拒绝 H0 ,接受H1 ,认为两种血型系统间有关联。
进一步计算列联系数:
C 2
213.16 0.1883
n 2 5801 213.16
上述几种情况整理成配对四格表(表7-3)
配对四格表资料的χ2检验 (McNemar's test)
H0:b,c来自同一个实验总体(B=C);
注:B=C=(b+c)/2
H1:b,c来自不同的实验总体(B C );α=0.05。
当b c 40时, 2 (b c)2 , 1
bc
b c 40时,需作连续性校正, 2 ( b c 1)2 , 1
3 3.84 6 7.81 9
1122.59 15
18
卡方值
χ2检验的基本公式
2 ( A T )2 , T
(R 1)(C 1)
上述检验统计量由K. Pearson提出,因此许多统计软 件上常称这种检验为Pearson’s Chi-square test,下面将要 介绍的其他卡方检验都是在此基础上发展起来的。
2)属性相同,是配对四格表的扩展,可作一致性检验(Kappa检验)。
7.5 多个样本率比较的 2 分割法
一、多个实验组间的两两比较
(类似于Post-hoc分析中探索性比较)
检验假设: (以P119 例7-6为例,进一步分析)
H0: A
,任两对比组的总体有效率相等
B
H1: A
,任两对比组的总体有效率不等
一、卡方检验的基本思想
首先介绍一个抽样分布:卡方分布 属连续型分布 可加性是其基本性质
唯一参数,即自由度
(1) 自由度为 1 的 2分布
若 Z ~ N (0,1),则 Z 2的分布称为自由度为 1 的 2分布.
(Chi-square
distribution),记为
2 (1)
或
2
(1)
它反映了理论数与实际数的吻合情况,该统计量近似
地服从自由度为ν的卡方分布。
查附表8,P715
χ2分布(Chi-Square distribution)
0.5 0.4
f
( 2)
1
2( / 2)
2
2
( / 21)
e2 / 2
纵高
0.3 0.2 0.1 0.0
0
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
原理:P值为在无效假设成立的前提下,得到现有 样本四格表以及更极端情况下的四格表的概率。
四格表资料分析小结(重要)
Fisher’s exact probability法均适用 卡方检验是一种近似检验
(1)当n≥40,T>5时,可用。然而当P值接近0.05时最好用
Fisher’s exact probability法;
206 481 20651
144 51
21.04
(3 1)(2 1) 2
查2界值表,得p<0.005,按α=0.05水准,拒绝H0 ,接受 H1 ,三种疗法治疗周围性面神经麻痹的有效率有差别。
双向无序分类资料的关联性检验
表7-10 某地5801人的血型
ABO血型
O A B AB 合计
M 431 388 495 137 1451
(a b)(b d )
(c d )(b d )
abcd
abcd
abcd
(ad bc)2 n
(a b)(c d )(a c)(b d )
1 ; (四格表 2检验专用公式)
上面的例子
2 (99 21 5 75)2 200 12.86 , 1
104 96 174 26
(1)增大样本含量(最好!)
(2)根据专业知识将相邻的行或列进行合理合并。(易丢失部分信 息!有时甚至出假象!)
(3)精确概率法。
(4)似然比χ2检验(likelihood ratio Chi-squre test) 2. R×C表χ2检验若有统计学意义,有必要进一步比较时,可考虑多
重比较(本章第5节)。
2 0.005,1
7.88;
P 0.005
查附表8,P715
如果 2
2 0.05,1
3.84;
P
0.05
如果 2
2 0.05,1
3.84;
P 0.05
三、连续性校正公式
χ2分布是一连续型分布,而四格表资料属离散型资料,
对 其 进 行 校 正 称 为 连 续 性 校 正 (correction for continuity),又称Yates校正(Yates' correction)。
,
1
因为有一格1<T<5,且n>40时,所以应用连续性校
正χ2检验。
四、精确概率法(Fisher’s exact probability)
在无效假设成立的前提下且周边合计固定时,产生任意 一个四格表(i)的概率Pi 服从于超几何分布,其计算式为:
a b!c d !a c!b d !
Pi
a!b!c!d !n!
对比组
有效
无效
合计
2值
P值
物理疗法组 199
7
206
药物治疗组 164
18
182
6.76
<0.0125
合计
363
25
388
物理疗法组 199
7
206
外用膏药组 118
26
144
合计Baidu Nhomakorabea
317
33
350
21.32
<0.00313
药物治疗组 164
18
182
外用膏药组 118
26
144
4.59
>0.0125 (NS)
.
图形:
0.3
0.2
0.1
0.0
0
2
4
6
8
10
2 0.05(1)
3.84
(1.96)2
Z2 0.05 / 2
2 0.01(1)
6.63
(2.5758)2
Z2 0.01/ 2
(2) Z1 , Z2 ,..., Z 互相独立,均服从 N (0,1) ,
则 Z12
Z
2 2
...
Z2的分布称自由度为 的
结论:两种血型系统间虽然有关联性(有统计学
意义),但列联系数数值较小,仍可认为关系不太
密切。
R×C表χ2检验的应用注意事项
1. Pearson’s chi-quare test对理论频数有要求。对R×C表,若较 多格子(1/5)的理论频数小于5或有一个格子的理论频数小于1,则易犯 第一类错误。
出现某些格子中理论频数过小时怎么办?
二、四格表资料专用公式
为了省去计算理论频数T, 可由基本公式推导出,直接 由各格子的实际频数(a、b、c、d)计算卡方值的公式:
基本公式: 2 ( A T )2 T
a
(a a
b)(a bc
c) d
2
b
(a a
b)(b bc
d) d
2
L
d
(c a
d b
)(b c
d) d
2
(a b)(a c)
R×C表χ2检验的应用注意事项(续)
3.两组/多组比较时,若效应有强弱的等级(单向有序分类资料),如+ ,++,+++,只能采用非参数检验方法(秩和检验或Ridit分析)。χ2检验
只能反映其构成比有无差异,不能比较效应的平均水平,故不能用!。 4.行列两种属性皆有序时(双向有序分类资料):
1)属性不同,考虑分析目的有三:单向有序行列表分析,线性趋势检 验(本章第六节,下述)或等级相关分析(后述)。
TRC
行(row)合计 列(column)合计 总例数
nR nC n
2
( A T )2 ,
(R 1)(C 1)
T
2 (99 90.48)2 (5 13.52)2 (75 83.52)2 (21 12.48)2
90.48
13.52
83.52
12.48
12.86
v (2 1)(2 1) 1
2 分布,
记为
2 (
)
或
2
(
) ,或简记为
2.
图形:
自由度
很大时,
2 (
)
近似地服从正态分布.有
Z
2 ( )
2
,
2 (
)服从均数为,方差为2的正态分布
χ2分布(Chi-square distribution)
0.5 0.4
f
(
2)
1
2(
/
2)
2
2
(
/ 21)
e2
/2
纵高
0.3 0.2 0.1 0.0
199 164 118 481
无效
7 18 26 51
合计
206 182 144 532
有效率 (%) 96.60
90.11
81.94
90.41
H0:π1 = π2 = π3 ,即三种疗法治疗周围性
面神经麻痹的总体有效率相等 H1:三种疗法治疗周围性面神经麻痹的有效率
不全相等
0.05
2 532( 1992 72 L L 262 1)
MN血型
N
MN
490
902
410
800
587
950
179
32
1666 2684
合计
1823 1598 2032 348 5801
问题:(1)两分类变量(行、列变量)有无关联? (2)关联程度如何?
分析步骤:
H0:两种血型系统间无关联 H1:两种血型系统间有关联
0.05
(独立性检验)
2 5801( 4312 4902 L L 322 1)
(3) 当n<40或有T<1时,用Fisher’s exact probability。
7.2 配对四格表资料的χ2检验
配对设计包括:(1)同一批样品用两种不同的处理方法;(2)观察 对象根据配对条件配成对子,同一对子内不同的个体分别接受不同的处理; (3)在病因和危险因素的研究中,将病人和对照按配对条件配成对子, 研究是否存在某种病因或危险因素。
合计
282
44
326
二、各实验组与同一对照组比 关键是检验水平的校正
'
2k 1
自学
7.6 双向有序分组资料的线性趋势检验
表7-13年龄与冠状动脉硬化的关系(P125) 不作要求
年龄(岁) (X)
20~ 30~ 40~
≥50 合计
冠状动脉硬化等级(Y)
0
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
1122.59 15
18
卡方值
性质:若 2 (1 ), 2 (2 )互相独立,
则
2 (1 ) 2 (2 ) 服从 2分布, 自由度 1 2 2 (1 ) 2 (2 )服从 2分布, 自由度 1 2
若 a (甲+ 乙+)、 b (甲+ 乙-)、 c (甲- 乙+)、 d (甲- 乙-)。 将a、b、c、d四种情况的对子数填入四格表
P114 例7-3
观察的结果只有阳性、阴性两种可能,清点成对资料时发现 则存在四种情况。
(1)两种方法都出现阳性(共有11例); (2)免疫荧光法阳性而乳胶凝集法却是阴性(共有12例); (3)免疫荧光法阴性而乳胶凝集法却是阳性(共有2例); (4)两种检测方法均为阴性结果(共有33例)。
bc
7.4 行×列表资料的 2检验
1、多个样本率的比较 2、样本构成比的比较 3、双向无序分类资料的关联性检验
专用公式
2 n(
A2 1)
nR nC
自由度ν = (R-1)(C-1)
多个样本率或两个构成比 比较的2检验
表7-8 三种疗法有效率的比较
疗法
物理疗法 药物治疗 外用膏药 合计
有效
B
0.05
检验水准调整:
' =
k(k 1) / 2+1
注:k为被比较率的个数
三种疗法治疗周围性面神经麻痹的实例中,检验
水准调整为:
' 0.05 0.05 / 4 0.0125
3(3 1) / 2 1
对应的临界值:P122 表7-11
2 0.0125,1
6.24
表7-12 三种疗法有效率的两两比较 (P123)
卡方检验
(Chi-square test)
Li Junrong
stat9@126.com
7.1 四格表资料的χ2检验
2 检验(Chi-square test)是现代统计学的创始人之
一K. Pearson提出的一种具有广泛用途的统计方法。 该检验可用于两个及多个率(或者构成比)之间
的比较,计数资料的关联度分析,拟合优度检验等。
称该分布具有可加性。
卡方检验的基本思想
四格表
(fourfold table)
表7-1 两组降低颅内压有效率的比较(P137)
组别
试验组 对照组 合计
有效
99 75 174
无效
5 21 26
合计
104 96 200
有效率(%)
95.20 (p1) 78.13 (p2) 87.00 (pc)
实际频数A (actual frequency) 理论频数T (theoretical frequency)
校正公式:
一般认为: 四格表在n>40时出现有任一格
1 ≤ T<5时,需要校正。
2 c
( A T 0.5)2 T
2 c
(a
( ad bc n / 2)2 n b)(c d)(a c)(b
d)
例7-2 P114
例子
2 c
(
46
8 52
6
18 26
78 2)2 64 14
78
3.14
18231451 18231666
348 2684
213.16
(4 1)(3 1) 6
查界值表(P823)得: P<0.005。按α=0.05检验水准拒绝 H0 ,接受H1 ,认为两种血型系统间有关联。
进一步计算列联系数:
C 2
213.16 0.1883
n 2 5801 213.16
上述几种情况整理成配对四格表(表7-3)
配对四格表资料的χ2检验 (McNemar's test)
H0:b,c来自同一个实验总体(B=C);
注:B=C=(b+c)/2
H1:b,c来自不同的实验总体(B C );α=0.05。
当b c 40时, 2 (b c)2 , 1
bc
b c 40时,需作连续性校正, 2 ( b c 1)2 , 1
3 3.84 6 7.81 9
1122.59 15
18
卡方值
χ2检验的基本公式
2 ( A T )2 , T
(R 1)(C 1)
上述检验统计量由K. Pearson提出,因此许多统计软 件上常称这种检验为Pearson’s Chi-square test,下面将要 介绍的其他卡方检验都是在此基础上发展起来的。
2)属性相同,是配对四格表的扩展,可作一致性检验(Kappa检验)。
7.5 多个样本率比较的 2 分割法
一、多个实验组间的两两比较
(类似于Post-hoc分析中探索性比较)
检验假设: (以P119 例7-6为例,进一步分析)
H0: A
,任两对比组的总体有效率相等
B
H1: A
,任两对比组的总体有效率不等
一、卡方检验的基本思想
首先介绍一个抽样分布:卡方分布 属连续型分布 可加性是其基本性质
唯一参数,即自由度
(1) 自由度为 1 的 2分布
若 Z ~ N (0,1),则 Z 2的分布称为自由度为 1 的 2分布.
(Chi-square
distribution),记为
2 (1)
或
2
(1)
它反映了理论数与实际数的吻合情况,该统计量近似
地服从自由度为ν的卡方分布。
查附表8,P715
χ2分布(Chi-Square distribution)
0.5 0.4
f
( 2)
1
2( / 2)
2
2
( / 21)
e2 / 2
纵高
0.3 0.2 0.1 0.0
0
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
原理:P值为在无效假设成立的前提下,得到现有 样本四格表以及更极端情况下的四格表的概率。
四格表资料分析小结(重要)
Fisher’s exact probability法均适用 卡方检验是一种近似检验
(1)当n≥40,T>5时,可用。然而当P值接近0.05时最好用
Fisher’s exact probability法;
206 481 20651
144 51
21.04
(3 1)(2 1) 2
查2界值表,得p<0.005,按α=0.05水准,拒绝H0 ,接受 H1 ,三种疗法治疗周围性面神经麻痹的有效率有差别。
双向无序分类资料的关联性检验
表7-10 某地5801人的血型
ABO血型
O A B AB 合计
M 431 388 495 137 1451
(a b)(b d )
(c d )(b d )
abcd
abcd
abcd
(ad bc)2 n
(a b)(c d )(a c)(b d )
1 ; (四格表 2检验专用公式)
上面的例子
2 (99 21 5 75)2 200 12.86 , 1
104 96 174 26
(1)增大样本含量(最好!)
(2)根据专业知识将相邻的行或列进行合理合并。(易丢失部分信 息!有时甚至出假象!)
(3)精确概率法。
(4)似然比χ2检验(likelihood ratio Chi-squre test) 2. R×C表χ2检验若有统计学意义,有必要进一步比较时,可考虑多
重比较(本章第5节)。
2 0.005,1
7.88;
P 0.005
查附表8,P715
如果 2
2 0.05,1
3.84;
P
0.05
如果 2
2 0.05,1
3.84;
P 0.05
三、连续性校正公式
χ2分布是一连续型分布,而四格表资料属离散型资料,
对 其 进 行 校 正 称 为 连 续 性 校 正 (correction for continuity),又称Yates校正(Yates' correction)。
,
1
因为有一格1<T<5,且n>40时,所以应用连续性校
正χ2检验。
四、精确概率法(Fisher’s exact probability)
在无效假设成立的前提下且周边合计固定时,产生任意 一个四格表(i)的概率Pi 服从于超几何分布,其计算式为:
a b!c d !a c!b d !
Pi
a!b!c!d !n!
对比组
有效
无效
合计
2值
P值
物理疗法组 199
7
206
药物治疗组 164
18
182
6.76
<0.0125
合计
363
25
388
物理疗法组 199
7
206
外用膏药组 118
26
144
合计Baidu Nhomakorabea
317
33
350
21.32
<0.00313
药物治疗组 164
18
182
外用膏药组 118
26
144
4.59
>0.0125 (NS)
.
图形:
0.3
0.2
0.1
0.0
0
2
4
6
8
10
2 0.05(1)
3.84
(1.96)2
Z2 0.05 / 2
2 0.01(1)
6.63
(2.5758)2
Z2 0.01/ 2
(2) Z1 , Z2 ,..., Z 互相独立,均服从 N (0,1) ,
则 Z12
Z
2 2
...
Z2的分布称自由度为 的
结论:两种血型系统间虽然有关联性(有统计学
意义),但列联系数数值较小,仍可认为关系不太
密切。
R×C表χ2检验的应用注意事项
1. Pearson’s chi-quare test对理论频数有要求。对R×C表,若较 多格子(1/5)的理论频数小于5或有一个格子的理论频数小于1,则易犯 第一类错误。
出现某些格子中理论频数过小时怎么办?
二、四格表资料专用公式
为了省去计算理论频数T, 可由基本公式推导出,直接 由各格子的实际频数(a、b、c、d)计算卡方值的公式:
基本公式: 2 ( A T )2 T
a
(a a
b)(a bc
c) d
2
b
(a a
b)(b bc
d) d
2
L
d
(c a
d b
)(b c
d) d
2
(a b)(a c)
R×C表χ2检验的应用注意事项(续)
3.两组/多组比较时,若效应有强弱的等级(单向有序分类资料),如+ ,++,+++,只能采用非参数检验方法(秩和检验或Ridit分析)。χ2检验
只能反映其构成比有无差异,不能比较效应的平均水平,故不能用!。 4.行列两种属性皆有序时(双向有序分类资料):
1)属性不同,考虑分析目的有三:单向有序行列表分析,线性趋势检 验(本章第六节,下述)或等级相关分析(后述)。
TRC
行(row)合计 列(column)合计 总例数
nR nC n
2
( A T )2 ,
(R 1)(C 1)
T
2 (99 90.48)2 (5 13.52)2 (75 83.52)2 (21 12.48)2
90.48
13.52
83.52
12.48
12.86
v (2 1)(2 1) 1
2 分布,
记为
2 (
)
或
2
(
) ,或简记为
2.
图形:
自由度
很大时,
2 (
)
近似地服从正态分布.有
Z
2 ( )
2
,
2 (
)服从均数为,方差为2的正态分布
χ2分布(Chi-square distribution)
0.5 0.4
f
(
2)
1
2(
/
2)
2
2
(
/ 21)
e2
/2
纵高
0.3 0.2 0.1 0.0
199 164 118 481
无效
7 18 26 51
合计
206 182 144 532
有效率 (%) 96.60
90.11
81.94
90.41
H0:π1 = π2 = π3 ,即三种疗法治疗周围性
面神经麻痹的总体有效率相等 H1:三种疗法治疗周围性面神经麻痹的有效率
不全相等
0.05
2 532( 1992 72 L L 262 1)
MN血型
N
MN
490
902
410
800
587
950
179
32
1666 2684
合计
1823 1598 2032 348 5801
问题:(1)两分类变量(行、列变量)有无关联? (2)关联程度如何?
分析步骤:
H0:两种血型系统间无关联 H1:两种血型系统间有关联
0.05
(独立性检验)
2 5801( 4312 4902 L L 322 1)