第六章_卡方检验(2)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学
主编 余松林
第六章
2
χ2 检验(2)
2
Ai Ti
Ti
(6 2)
第一节 χ2分布 第二节 拟合优度检验 第三节 独立性检验
(1)四格表资料: (2)行×列表资料,2分割法. (3)配对资料:
第四节 第五节 第六节 第七节
趋势检验 多个四格表的联合分析 四格表的费歇尔精确概率检验 SAS程序
2 2
2 (1)
wenku.baidu.com
Z: 工龄等级分,如为连续性变量的等级划分,用组中值 t: 分组的阳性例数, T: 阳性总例数 n: 分组的观察例数, N: 观察总例数
Z Z–5.0 工龄(年) 总人数(n) 患病人数(t) 患病率(%)
0.5
1.5 3.0
-4.5
-3.5 -2.0
<1
1~ 2~
54
120 255
11 5 T (c) 2.037 5, n 27 40 27
Fisher精确检验的基本思想:
在四格表周边合计数固定不变的条件下,计算表内4个 实际频数变动时的各种组合之概率Pi;再按检验假设用 单侧或双侧的累计概率 Pi ,依据所取的检验水准 做 出统计学推断.
(a b)! d )!(a c)!(b d )! (c Pi a !b !c !d !n !
ad bc / n
i
efgh / n 1 / n 2
i 2
131 380 353 158 / 511 1 / 5112 161 421 491 91(582 1) / 5822
58 280 73 100 / 511 50 380 111 41 / 582
2 2
1. 患病人数(t) 2. 不患病数© 3. 总人数(n) 4. 患病率(%) 5. 分数(Z) 6. TZ=1×5 7. nZ=3×5 8. nZ2=3×52
2
6~ 32 137 169 18.93 2 64 338 676
8~12 28 110 138 20.29 5 140 690 3450
2 2
合计 123(T) 920(N)
125 -145 7709.5
T N T N nZ nZ
2
N N tZ T nZ
920 920 125 123 145
123 920 123 920 7709.5 145
292 801 1093
158
ORi
2.22
4.17
2.75
根据式(6-18)计算年龄调整后的优势比:
ORMH ad / n i / bc / n i 58 280 / 511 50 380 / 582 2.91 73 100 / 511 111 41/ 582
根据式 (6-19)对ORMH进行假设检验.
ORMH进行假设检验的步骤.
1. 建立检验假设和确定检验水准: H0:年龄调整后的吸烟与肺癌关系的优势比: OR=0. H1:年龄调整后的吸烟与肺癌关系的优势比: OR≠0
给定检验水准: =0.05。
2. 选择检验方法并计算检验统计量2值: Mantel-Haenszel 2 检验: 分组
第六章
Χ2检验的基本公式:
χ2 检验小结
2
Ai Ti
2
Ti Χ2检验的适用范围:N≥40, T≥5, 1≤T<5时作校正 1.实际资料与理论分布的拟合优度检验 2.离散性分类资料的差异显著性检验 --独立性检验. (1)四格表资料. (2)行×列表资料, 2分割法. (3)配对资料. 3. 等级资料的趋势检验. 4. 多个四格表的分析:Mantel Haenszel 分层分析法)
49.65
3.
确定概率P并作出统计推论:
查附表3:χ2界值表,得:χ20.05(1)=3.84<49.65, P<0.05。按 α=0.05水准,拒绝H0, 故可认为调整年龄后, 吸烟1包/天 及以上者与吸烟1包/天以下者相比, 患肺癌的优势比为 2.91,且具有统计学意义。
第六节 四格表资料的Fisher确切概率法
第 i 层四格表的形式:
分析指标为优势比:
a
b
e
c
g
d
h
f
n
ORMH ad / n i / bc / n i
检验统计量:
2 MH
(6-18)
ad bc / n
i 2
2
efgh / n 1 / n
i
2 (1)
(6-19)
适用条件:n<40 或T<1
理论依据:利用超几何分布直接计算事件出
现的概率.
不属于 2 检验的范畴。
例6-11. 为了比较新药与旧药的疗效,试验结果见 表6-12,试问两组疗效有无差别?
表6-12 新药与旧药的疗效比较 处 旧 新 合 理 药 药 计 改善 2(a) 3(c) 5 无效 14(b) 8(d) 22 合计 16 11 27 改善率 0.125 0.273 0.227
序号 改 善 1 无 效 改 善 2 无 效 改 善 3 无 效 改 善 4 无 效 改 善 5 无 效 6 改 无 善 效 合 计
旧药
新药 合计 Pi
0
5 5
16
6 22
1
4 5
15
7 22
2
3 5
14
8 22
3
2 5
13
9 22
4
1 5
12
10 22
5
0 5
11
11 0.054
16
11
22 27
Terminology in Statistics
Trend test for rates Stratified analysis Adjusted odds ratio test for independence Chi square component Fourfold table Row ×column table actual frequency theoretical frequency Fisher’s exact probability. Contingency table 率的趋势检验 分层分析 调整优势比 独立性检验 卡方分量 四格表(2×2表) 行列表 实际频数 理论频数 费歇尔精确概率法 列联表
0.006
0.065
0.245
0.382
0.248
Pi=0.006+0.065+0.245+0.382+0.248+0.054=1.0
序号 旧药 新药 Pi 0 5
1 16 6 1 4
2 15 7 2 3
3 14 8 3 2
4 13 9 4 1
5 12 10 5 0
6 11 11 0.054
0.006
表6-12 新药与旧药的疗效比较
分组 旧药组 改善 无效 2 14 合计 16
!为阶乘符号
新药组
合计
3
5
8
22
11
27
16 11!5!22! ! Pi 2!14!3!8!27! 0.245
(1)各种组合概率 Pi 的计算: 在四格表周边合计数不变 的条件下,表内4个实际频数 a,b,c,d 变动的组合数共 有“周边合计中最小数+1”个。如例6-11,表内4个实际 频数变动的组合数共有5+1=6个,依次为:
3.
确定概率P并作出统计推论:
试验目的: 为比较新药与旧药的疗效,试问两组疗效有无 差别?----属双侧检验,用累计概率: P = P(X)(≤P(a)) =0.006+0.065+0.245+0.054=0.37 P=0.37>0.05, 按α=0.05水准, 不拒绝H0, 故可认为新药与 旧药的疗效差别无统计学意义。
1
7 25
1.85
5.83 9.80
5.0 7.0
10.0
0 2
5
4~ 6~
8~12 合计
184 169
138 920(N)
30 32
28 123(T)
16.30 18.93
20.29 13.39
表6-10 趋势检验计算用表
<1 1 53 54 1.85 -4.5 -4.5 -243 1093.5 工龄(年) 1~ 2~ 4~ 7 25 30 113 230 154 120 255 184 5.83 9.80 16.30 -3.5 -2.0 0 -24.5 -50 0 -420 -510 0 1470.0 1020.0 0
23.42
查附表3:χ2界值表,得:χ20.05(1)=3.84<23.42, P<0.05。 按α=0.05水准,拒绝H0, 纺织女工神经衰弱患病率有随 工龄增加而增加的趋势.
第五节 多个四格表的联合分析
(Mantel Haenszel 分层分析法) 为排除混杂因素干扰,常需按混杂因素分层,每一层一个 四格表。常需对多个四格表进行联合分析。其中第 i 层的 简表形式如下
第四节 率的Cochran Armitage趋势检验
用于分析概率是否有随等级分组而变化的趋势
表6-10 不同工龄的纺织女工中神经衰弱的患病率(原始资料)
工龄(年) <1 1~ 2~ 4~ 6~ 8~12 总人数(n) 54 120 255 184 169 138 患病人数(t) 1 7 25 30 32 28 患病率(%) 1.85 5.83 9.80 16.30 18.93 20.29
Fisher’s exact probability test: 应用条件N<40 或T<1.
The End
练习题
《医学统计学》实习册
实习六 卡方检验(pp. 19-22)
三、计算题:1, 3, 5, 6. 四、问答题:1, 2.
附表3: 2界值表
自由度 1 2 3 4 5 6 7 0.500 0.45 1.39 2.37 3.36 4.35 5.35 6.35 0.250 1.32 2.77 4.11 5.39 6.63 7.84 9.04 0.100 2.71 4.61 6.25 7.78 9.24 10.64 12.02 概率 P 0.050 3.84 5.99 7.81 9.49 11.07 12.59 14.07 0.025 5.02 7.38 9.35 11.14 12.83 14.45 16.01 0.010 6.63 9.21 11.34 13.28 15.09 16.81 18.48 0.005 7.88 10.60 12.84 14.86 16.75 18.55 20.28
0.065
0.245
0.382
0.248
(2) 累计概率的计算: ①双侧检验时累计概率的计算: H0:1=2; H1: 1≠2 在所有四格表中,将概率小于或等于原四格表概率 的值相加得到双尾概率之和. P = P(X)(≤P(a)) a=2: 实际观察数 =0.006+0.065+0.245+0.054=0.37 ②左侧概率的计算: H0:1≥2; H1: 1<2 PL = P(X≤a) =0.006+0.065+0.245=0.320 ③右侧概率的计算: H0:1≤2; H1: 1>2 PR= P(X≥a) =0.245+0.382+0.248+0.054=0.929
8
9 10 11 12 13 14 15
7.34
8.34 9.34 10.34 11.34 12.34 13.34 14.34
合计
920
123
13.39
问题: 神经衰弱患病率是否有随工龄增加而增加的趋势 ?
纺织女工神经衰弱患病率(%) 25
患病率(%)
20 15 10 5 0 0 2 4 6 8 工龄(年) 10 12
2
T N T N nZ nZ
2
N N tZ T nZ
表6-11 两个年龄组吸烟与肺癌的病例对照研究结果 分组
<40岁
≥1包 <1包
合计
40岁及以上
≥1包 <1包
合计
合并
≥1包 <1包 合计
病例组 58 对照组 100 合计
73 280 353
131 380 511
50 41 91
111 380 491
161 421 582
108 141 249
184 660 844
病例组 对照组 合计
<40岁
≥1包 <1包
合计
40岁及~
≥1包 <1包
合计
合并
≥1包 <1包 合计
58 100 158
73 280 353
131 380 511
2
50 41 91
111 380 491
161 421 582
108 141 249
184 660 844
292 801 1093
2 MH
主编 余松林
第六章
2
χ2 检验(2)
2
Ai Ti
Ti
(6 2)
第一节 χ2分布 第二节 拟合优度检验 第三节 独立性检验
(1)四格表资料: (2)行×列表资料,2分割法. (3)配对资料:
第四节 第五节 第六节 第七节
趋势检验 多个四格表的联合分析 四格表的费歇尔精确概率检验 SAS程序
2 2
2 (1)
wenku.baidu.com
Z: 工龄等级分,如为连续性变量的等级划分,用组中值 t: 分组的阳性例数, T: 阳性总例数 n: 分组的观察例数, N: 观察总例数
Z Z–5.0 工龄(年) 总人数(n) 患病人数(t) 患病率(%)
0.5
1.5 3.0
-4.5
-3.5 -2.0
<1
1~ 2~
54
120 255
11 5 T (c) 2.037 5, n 27 40 27
Fisher精确检验的基本思想:
在四格表周边合计数固定不变的条件下,计算表内4个 实际频数变动时的各种组合之概率Pi;再按检验假设用 单侧或双侧的累计概率 Pi ,依据所取的检验水准 做 出统计学推断.
(a b)! d )!(a c)!(b d )! (c Pi a !b !c !d !n !
ad bc / n
i
efgh / n 1 / n 2
i 2
131 380 353 158 / 511 1 / 5112 161 421 491 91(582 1) / 5822
58 280 73 100 / 511 50 380 111 41 / 582
2 2
1. 患病人数(t) 2. 不患病数© 3. 总人数(n) 4. 患病率(%) 5. 分数(Z) 6. TZ=1×5 7. nZ=3×5 8. nZ2=3×52
2
6~ 32 137 169 18.93 2 64 338 676
8~12 28 110 138 20.29 5 140 690 3450
2 2
合计 123(T) 920(N)
125 -145 7709.5
T N T N nZ nZ
2
N N tZ T nZ
920 920 125 123 145
123 920 123 920 7709.5 145
292 801 1093
158
ORi
2.22
4.17
2.75
根据式(6-18)计算年龄调整后的优势比:
ORMH ad / n i / bc / n i 58 280 / 511 50 380 / 582 2.91 73 100 / 511 111 41/ 582
根据式 (6-19)对ORMH进行假设检验.
ORMH进行假设检验的步骤.
1. 建立检验假设和确定检验水准: H0:年龄调整后的吸烟与肺癌关系的优势比: OR=0. H1:年龄调整后的吸烟与肺癌关系的优势比: OR≠0
给定检验水准: =0.05。
2. 选择检验方法并计算检验统计量2值: Mantel-Haenszel 2 检验: 分组
第六章
Χ2检验的基本公式:
χ2 检验小结
2
Ai Ti
2
Ti Χ2检验的适用范围:N≥40, T≥5, 1≤T<5时作校正 1.实际资料与理论分布的拟合优度检验 2.离散性分类资料的差异显著性检验 --独立性检验. (1)四格表资料. (2)行×列表资料, 2分割法. (3)配对资料. 3. 等级资料的趋势检验. 4. 多个四格表的分析:Mantel Haenszel 分层分析法)
49.65
3.
确定概率P并作出统计推论:
查附表3:χ2界值表,得:χ20.05(1)=3.84<49.65, P<0.05。按 α=0.05水准,拒绝H0, 故可认为调整年龄后, 吸烟1包/天 及以上者与吸烟1包/天以下者相比, 患肺癌的优势比为 2.91,且具有统计学意义。
第六节 四格表资料的Fisher确切概率法
第 i 层四格表的形式:
分析指标为优势比:
a
b
e
c
g
d
h
f
n
ORMH ad / n i / bc / n i
检验统计量:
2 MH
(6-18)
ad bc / n
i 2
2
efgh / n 1 / n
i
2 (1)
(6-19)
适用条件:n<40 或T<1
理论依据:利用超几何分布直接计算事件出
现的概率.
不属于 2 检验的范畴。
例6-11. 为了比较新药与旧药的疗效,试验结果见 表6-12,试问两组疗效有无差别?
表6-12 新药与旧药的疗效比较 处 旧 新 合 理 药 药 计 改善 2(a) 3(c) 5 无效 14(b) 8(d) 22 合计 16 11 27 改善率 0.125 0.273 0.227
序号 改 善 1 无 效 改 善 2 无 效 改 善 3 无 效 改 善 4 无 效 改 善 5 无 效 6 改 无 善 效 合 计
旧药
新药 合计 Pi
0
5 5
16
6 22
1
4 5
15
7 22
2
3 5
14
8 22
3
2 5
13
9 22
4
1 5
12
10 22
5
0 5
11
11 0.054
16
11
22 27
Terminology in Statistics
Trend test for rates Stratified analysis Adjusted odds ratio test for independence Chi square component Fourfold table Row ×column table actual frequency theoretical frequency Fisher’s exact probability. Contingency table 率的趋势检验 分层分析 调整优势比 独立性检验 卡方分量 四格表(2×2表) 行列表 实际频数 理论频数 费歇尔精确概率法 列联表
0.006
0.065
0.245
0.382
0.248
Pi=0.006+0.065+0.245+0.382+0.248+0.054=1.0
序号 旧药 新药 Pi 0 5
1 16 6 1 4
2 15 7 2 3
3 14 8 3 2
4 13 9 4 1
5 12 10 5 0
6 11 11 0.054
0.006
表6-12 新药与旧药的疗效比较
分组 旧药组 改善 无效 2 14 合计 16
!为阶乘符号
新药组
合计
3
5
8
22
11
27
16 11!5!22! ! Pi 2!14!3!8!27! 0.245
(1)各种组合概率 Pi 的计算: 在四格表周边合计数不变 的条件下,表内4个实际频数 a,b,c,d 变动的组合数共 有“周边合计中最小数+1”个。如例6-11,表内4个实际 频数变动的组合数共有5+1=6个,依次为:
3.
确定概率P并作出统计推论:
试验目的: 为比较新药与旧药的疗效,试问两组疗效有无 差别?----属双侧检验,用累计概率: P = P(X)(≤P(a)) =0.006+0.065+0.245+0.054=0.37 P=0.37>0.05, 按α=0.05水准, 不拒绝H0, 故可认为新药与 旧药的疗效差别无统计学意义。
1
7 25
1.85
5.83 9.80
5.0 7.0
10.0
0 2
5
4~ 6~
8~12 合计
184 169
138 920(N)
30 32
28 123(T)
16.30 18.93
20.29 13.39
表6-10 趋势检验计算用表
<1 1 53 54 1.85 -4.5 -4.5 -243 1093.5 工龄(年) 1~ 2~ 4~ 7 25 30 113 230 154 120 255 184 5.83 9.80 16.30 -3.5 -2.0 0 -24.5 -50 0 -420 -510 0 1470.0 1020.0 0
23.42
查附表3:χ2界值表,得:χ20.05(1)=3.84<23.42, P<0.05。 按α=0.05水准,拒绝H0, 纺织女工神经衰弱患病率有随 工龄增加而增加的趋势.
第五节 多个四格表的联合分析
(Mantel Haenszel 分层分析法) 为排除混杂因素干扰,常需按混杂因素分层,每一层一个 四格表。常需对多个四格表进行联合分析。其中第 i 层的 简表形式如下
第四节 率的Cochran Armitage趋势检验
用于分析概率是否有随等级分组而变化的趋势
表6-10 不同工龄的纺织女工中神经衰弱的患病率(原始资料)
工龄(年) <1 1~ 2~ 4~ 6~ 8~12 总人数(n) 54 120 255 184 169 138 患病人数(t) 1 7 25 30 32 28 患病率(%) 1.85 5.83 9.80 16.30 18.93 20.29
Fisher’s exact probability test: 应用条件N<40 或T<1.
The End
练习题
《医学统计学》实习册
实习六 卡方检验(pp. 19-22)
三、计算题:1, 3, 5, 6. 四、问答题:1, 2.
附表3: 2界值表
自由度 1 2 3 4 5 6 7 0.500 0.45 1.39 2.37 3.36 4.35 5.35 6.35 0.250 1.32 2.77 4.11 5.39 6.63 7.84 9.04 0.100 2.71 4.61 6.25 7.78 9.24 10.64 12.02 概率 P 0.050 3.84 5.99 7.81 9.49 11.07 12.59 14.07 0.025 5.02 7.38 9.35 11.14 12.83 14.45 16.01 0.010 6.63 9.21 11.34 13.28 15.09 16.81 18.48 0.005 7.88 10.60 12.84 14.86 16.75 18.55 20.28
0.065
0.245
0.382
0.248
(2) 累计概率的计算: ①双侧检验时累计概率的计算: H0:1=2; H1: 1≠2 在所有四格表中,将概率小于或等于原四格表概率 的值相加得到双尾概率之和. P = P(X)(≤P(a)) a=2: 实际观察数 =0.006+0.065+0.245+0.054=0.37 ②左侧概率的计算: H0:1≥2; H1: 1<2 PL = P(X≤a) =0.006+0.065+0.245=0.320 ③右侧概率的计算: H0:1≤2; H1: 1>2 PR= P(X≥a) =0.245+0.382+0.248+0.054=0.929
8
9 10 11 12 13 14 15
7.34
8.34 9.34 10.34 11.34 12.34 13.34 14.34
合计
920
123
13.39
问题: 神经衰弱患病率是否有随工龄增加而增加的趋势 ?
纺织女工神经衰弱患病率(%) 25
患病率(%)
20 15 10 5 0 0 2 4 6 8 工龄(年) 10 12
2
T N T N nZ nZ
2
N N tZ T nZ
表6-11 两个年龄组吸烟与肺癌的病例对照研究结果 分组
<40岁
≥1包 <1包
合计
40岁及以上
≥1包 <1包
合计
合并
≥1包 <1包 合计
病例组 58 对照组 100 合计
73 280 353
131 380 511
50 41 91
111 380 491
161 421 582
108 141 249
184 660 844
病例组 对照组 合计
<40岁
≥1包 <1包
合计
40岁及~
≥1包 <1包
合计
合并
≥1包 <1包 合计
58 100 158
73 280 353
131 380 511
2
50 41 91
111 380 491
161 421 582
108 141 249
184 660 844
292 801 1093
2 MH