第九章 卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
疗效 愈合 未愈合 21 33 85(固定值) 84(固定值) 169 75.29% 60.71% 68.05% 合计 有效率
洛赛克 雷尼替丁 合计
64 51
115
54
四格表资料的2检验
建立假设,确定检验水准
H0:两药物治疗消化道溃疡的愈合率相同, 1 2 H1:两药物治疗消化道溃疡的愈合率不相同,1 2 =0.05
衡量实际频数(A)和理论频数(T)的吻合程度
2
( AT ) T
2
v=k-1-(计算Ti时利用样本资料估计的参数个数)
第九章
2
检验
2
2
分布和 检验的基本思想** 2 独立样本2×2列联表资料的 检验** 2 独立样本R×C列联表资料的 检验*
配对设计资料的 检验** 四格表的确切概率法*
n≥40,T≥5,用2
四格表资料的2检验
应用条件
2
(| A T | 0 . 5 ) T
2
连续性校正
2
2
(| ad bc | n / 2 ) n ( a b )( c d )( a c )( b d )
n≥40,但1≤T<5,用校正2 n < 40,或T<1,用确切概率法
66.67 49.06
多个独立样本资料的2检验
检验目的 多个独立样本率是否相同
多个独立样本资料的2检验
建立假设,确定检验水准
H0:三种剂量镇痛有效的概率相同 H1:三种剂量镇痛有效的概率不同或不全相同 =0.05
多个独立样本资料的2检验
计算检验统计量
表 7-7 处理 1 2 … R 合计
2+
0
0.5 0.4 0.3 0.2 0.1 0.0 0.5 0.4 0.3 0.2 0.1 0.0
0.4
1
2
Z2
2…+
Zk ~
2
2
0.3
v=1 v=4 v=6 v=9
( v= k)
0.2
0.1
0.0 0 3 6 9 12 15
2
附表8 自由度v 0.975 0.950 0.900
1 2 3 4 5 0.05 0.22 0.48 0.83 0.10 0.35 0.71 1.15
0.02 0.21 0.58 1.06 1.61
0.10 0.58 1.21 1.92 2.67
0.45 1.39 2.37 3.36 4.35
1.32 2.77 4.11 5.39 6.63
2.71 4.61 6.25 7.78
3.84 5.99
5.02 7.38
7.81 7.819.35 9.49 11.14
9.24 11.07 12.83
R×C列联表资料的2检验
作出结论 2 2=151.0995, 本例,
0 . 05 ,3 7 . 81 , P 0 . 05
2
拒绝H0,差别有统计学意义,可认为城市和农村 已婚妇女避孕方法的总体概率分布不同。
表 多个独立样本资料频数分布的R×C表 完全随机设计下多组频数分布的 R×C 表
属性(水平) 1
A11 A 21
2
A12
A 22
… … … … … …
C
A1 C
合计
T 21
85 行合计 列合计 54 27 . 16 85 115 T 57 . 84 169 169 84 68 . 05 % 总合计 84 (1 68 . 05 %) T 22 84 115 169 57 . 16 84 54 169 26 . 84
2 界值表
0.750 0.500 0.250 0.100 0.050 0.025
1 2 3 4 5 0.05 0.22 0.48 0.83 0.10 0.35 0.71 1.15
0.02 0.21 0.58 1.06 1.61
0.10 0.58 1.21 1.92 2.67
0.45 1.39 2.37 3.36 4.35
24
40
40.0
研究目的? 资料类型? 设计类型? n,T?
第七章
2
检验
2
2
分布和 检验的基本思想** 2 独立样本2×2列联表资料的 检验**
独立样本R×C列联表资料的 2检验* 2 配对设计资料的 检验** 四格表的确切概率法*
某研究者调查某地1986年城市和农村20至40 岁已婚妇女避孕方法(节育器,服避孕药, 避孕套,其它)使用情况(表5),试分析该地 城市和农村采用的避孕方法是否有差别。
表5 某地城市和农村已婚妇女避孕方法情况(原始资料)
编号 1 2 ┇ 847 居住地 城市 农村 ┇ 农村 避孕方法 节育器 避孕套 ┇ 服避孕药
表5
某地城市和农村已婚妇女避孕方法情况(原始资料) 编号 1 2 ┇ 847 居住地 避孕方法
城市 农村
┇ 农村
节育器 避孕套
┇ 服避孕药
R×C列联表
地区
R×C列联表资料的2检验
计算检验统计量
表 7-6两个独立样本资料频数分布的2×C表 表 完全随机设计下两组频数分布的 2×C 表
处理 1 1 2
A 21
A 22
属性(水平) 2 …
A12
合计 C
A1 C
A11
… … …
n 1 (固定值) n 2 (固定值)
A2 C
mC
合计
m1
m2
n
2
(A T ) T
1.32 2.77 4.11 5.39 6.63
2.71 4.61 6.25 7.78
3.84 5.99 7.81
5.02 7.38 9.35
9.49 11.14
9.24 11.07 12.83
自由度为1的2分布
0.5 0.4
0.3
0.2
0.05
0.1
0.0
3.84 =1.962
2检验的基本思想
思考题
将病情相似的淋巴系肿瘤患者随机分成两组, 分别做单纯化疗与复合化疗,两组的缓解率见 下表,问两疗法的总体缓解率是否不同?
表4 两种疗法缓解率的比较
属性 组别 单纯化疗 复合化疗 缓解率(%)
缓解
2(4.8) 14
未缓解
10 14
合计 12(固定值) 28(固定值) 16.7 50.0
合计
16
第九章
2
ቤተ መጻሕፍቲ ባይዱ
检验
2
2
定性资料
分布和 检验的基本思想** 2 独立样本2×2列联表资料的 检验** 2 独立样本R×C列联表资料的 检验*
配对设计资料的 检验** 四格表的确切概率法*
2
分布
2
Z~N(0,1) Z2~ 2(v=1) Z12+ Z22 ~ 2( v= 2) Z1
表7
剂量 1.0mg 有效 3 (7.36)
某药不同剂量的镇痛效果
无效 12 ( 7.64) 合计 15(固定值) 有效率(%) 20.00
镇痛效果
2.5mg
5.0mg 合计
11 (9.81)
12 (8.83) 26
9 (10.19)
6 ( 9.17) 27
20(固定值)
18(固定值) 53
55.00
2
n (
2 i 1
R
j 1
C
A ij
2
1)
ni m j
R×C列联表资料的2检验
计算检验统计量
n (
2 i 1 R
j 1
C
A ij
2
1)
2
ni m j
153 33
2
847 (
473 391
108 391
18
2
58 456
1)
151 . 0995
=(2-1)×(4-1)=3
R×C列联表资料的2检验
确定P值 查2界值表,比较检验统计量2和2界值, 确定P值。
R×C列联表资料的2检验
附表8 自由度v 0.975 0.950 0.900
2
2 界值表
0.750 0.500 0.250 0.100 0.050 0.025
思考题
测得某地区426名健康输血员的血型,见表8。 问男性和女性的血型分布有无不同?
表8 某地区健康输血员的血型分布(频数表资料)
血型
性别 男性 A 47 B 66 AB 20 O 106 合计 239
女性
合计
52
99
54
120
19
39
62
168
187
426
为研究某镇痛药的不同剂量镇痛效果是否有差别, 研究人员在自愿的原则下,将条件相似的53名产 妇随机分成三组, 分别按三种不同剂量服用该药, 镇痛效果如表7。
避孕方法 地区
节育器 153
320 473
服避孕药 33
75 108
避孕套 165
43 208
其他 40
18 58
合计
城市
农村 合计
391
456 847
R×C列联表资料的2检验
建立假设,确定检验水准
H0:城市和农村已婚妇女避孕方法的总体概率分布相同 H1:城市和农村已婚妇女避孕方法的总体概率分布不同 =0.05
四格表资料的2检验
计算检验统计量
治疗消化道溃疡两种药物疗效频数表资料
疗效 愈合 未愈合 21 33 54 85(固定值) 84(固定值) 169 75.29% 60.71% 68.05% 合计 有效率 药物
表3
洛赛克 雷尼替丁 合计
64 51 115
2
( AT ) T
2
表3
药物 洛赛克
城市 农村 合计
统计描述
避孕方法
表6 某地城市和农村已婚妇女避孕方法情况(频数表资料)
节育器 153 320 473 服避孕药 33 75 108 避孕套 165 43 208 其他 40 18 58
合计
391 456 847
R×C列联表资料的2检验
检验目的 多个独立样本频率分布是否相同
表6 某地城市和农村已婚妇女避孕方法情况(频数表资料)
第九章 检验
2
资料 定量资料
统计分析 统计描述
定性资料
参数估计 统计推断 假设检验
第七章 t检验
单样本资料的t检验 配对设计资料的t检验 两独立样本资料的t检验
定量资料
第八章 方差分析
定量资料
多个独立样本资料的方差分析** 随机区组设计资料的方差分析** 多个样本均数的两两比较* 多个样本的方差齐性检验和数据变换
四格表资料专用公式
a c
2
b d
2
(A T ) T
2
( ad bc ) n
2
( a b )( c d )( a c )( b d )
四格表资料的2检验
应用条件
2
(A T ) T
2
2
( ad bc ) n
2
( a b )( c d )( a c )( b d )
四格表资料的2检验
2
计算检验统计量
(A T ) T
2
( 64 57 . 84 ) 57 . 84
2
( 21 27 . 16 ) 27 . 16
2
( 51 57 . 16 ) 57 . 16
2
( 33 26 . 84 ) 26 . 84
2
4 . 13
=(行数-1)×(列数-1)=1
未愈合 21 33 85(固定值) 84(固定值) 169 75.29% 60.71% 68.05%
115
54
四格表资料的2检验
a
c
b
d
四格表又称2×2列联表(contingency table)
四格表资料的2检验
检验目的 两总体概率分布是否相同
表3
药物
治疗消化道溃疡两种药物疗效频数表资料
洛赛克(n1=85) 雷尼替丁(n2=84)
表2
两种药物治疗消化道溃疡疗效原始资料
愈合,愈合,未愈合,…,未愈合 未愈合,愈合,愈合,…,未愈合
洛赛克(n1=85) 雷尼替丁(n2=84)
四格表
表3
药物 愈合 洛赛克 雷尼替丁 合计 64 51 疗效
统计描述
合计 有效率
治疗消化道溃疡两种药物疗效频数表资料
四格表资料的2检验
确定P值 查2界值表,比较检验统计量2和2界值, 确定P值。
自由度为1的2分布
0.5 0.4 0.3 0.2 0.1 0.0
0.05
P
3.84
4.13
四格表资料的2检验
作出结论 本例,2=4.13,P
0 . 05
拒绝H0,差别有统计学意义,可认为两药物总 体有效概率不同。
治疗消化道溃疡两种药物疗效频数表资料
疗效 有效 无效
合计 85
84 169
有效率 75.29%
60.71% 68.05%
雷尼替丁 合计
64 (57.84) 21(27.16) 51 (57.16) 33(26.84)
115 54
T11 85 68 . 05 %
T12 85 (1 68 . 05 %)
2
两独立样本资料2检验
二分类情形-2×2列联表
四格表
将病情相似的169名消化道溃疡患者随机分 成两组,分别用洛赛克与雷尼替丁两种药 物治疗。4周后结果原始记录如下。问两种 药物治疗消化道溃疡的愈合率有无差别?
表2 两种药物治疗消化道溃疡疗效原始资料
愈合,愈合,未愈合,…,未愈合 未愈合,愈合,愈合,…,未愈合
洛赛克 雷尼替丁 合计
64 51
115
54
四格表资料的2检验
建立假设,确定检验水准
H0:两药物治疗消化道溃疡的愈合率相同, 1 2 H1:两药物治疗消化道溃疡的愈合率不相同,1 2 =0.05
衡量实际频数(A)和理论频数(T)的吻合程度
2
( AT ) T
2
v=k-1-(计算Ti时利用样本资料估计的参数个数)
第九章
2
检验
2
2
分布和 检验的基本思想** 2 独立样本2×2列联表资料的 检验** 2 独立样本R×C列联表资料的 检验*
配对设计资料的 检验** 四格表的确切概率法*
n≥40,T≥5,用2
四格表资料的2检验
应用条件
2
(| A T | 0 . 5 ) T
2
连续性校正
2
2
(| ad bc | n / 2 ) n ( a b )( c d )( a c )( b d )
n≥40,但1≤T<5,用校正2 n < 40,或T<1,用确切概率法
66.67 49.06
多个独立样本资料的2检验
检验目的 多个独立样本率是否相同
多个独立样本资料的2检验
建立假设,确定检验水准
H0:三种剂量镇痛有效的概率相同 H1:三种剂量镇痛有效的概率不同或不全相同 =0.05
多个独立样本资料的2检验
计算检验统计量
表 7-7 处理 1 2 … R 合计
2+
0
0.5 0.4 0.3 0.2 0.1 0.0 0.5 0.4 0.3 0.2 0.1 0.0
0.4
1
2
Z2
2…+
Zk ~
2
2
0.3
v=1 v=4 v=6 v=9
( v= k)
0.2
0.1
0.0 0 3 6 9 12 15
2
附表8 自由度v 0.975 0.950 0.900
1 2 3 4 5 0.05 0.22 0.48 0.83 0.10 0.35 0.71 1.15
0.02 0.21 0.58 1.06 1.61
0.10 0.58 1.21 1.92 2.67
0.45 1.39 2.37 3.36 4.35
1.32 2.77 4.11 5.39 6.63
2.71 4.61 6.25 7.78
3.84 5.99
5.02 7.38
7.81 7.819.35 9.49 11.14
9.24 11.07 12.83
R×C列联表资料的2检验
作出结论 2 2=151.0995, 本例,
0 . 05 ,3 7 . 81 , P 0 . 05
2
拒绝H0,差别有统计学意义,可认为城市和农村 已婚妇女避孕方法的总体概率分布不同。
表 多个独立样本资料频数分布的R×C表 完全随机设计下多组频数分布的 R×C 表
属性(水平) 1
A11 A 21
2
A12
A 22
… … … … … …
C
A1 C
合计
T 21
85 行合计 列合计 54 27 . 16 85 115 T 57 . 84 169 169 84 68 . 05 % 总合计 84 (1 68 . 05 %) T 22 84 115 169 57 . 16 84 54 169 26 . 84
2 界值表
0.750 0.500 0.250 0.100 0.050 0.025
1 2 3 4 5 0.05 0.22 0.48 0.83 0.10 0.35 0.71 1.15
0.02 0.21 0.58 1.06 1.61
0.10 0.58 1.21 1.92 2.67
0.45 1.39 2.37 3.36 4.35
24
40
40.0
研究目的? 资料类型? 设计类型? n,T?
第七章
2
检验
2
2
分布和 检验的基本思想** 2 独立样本2×2列联表资料的 检验**
独立样本R×C列联表资料的 2检验* 2 配对设计资料的 检验** 四格表的确切概率法*
某研究者调查某地1986年城市和农村20至40 岁已婚妇女避孕方法(节育器,服避孕药, 避孕套,其它)使用情况(表5),试分析该地 城市和农村采用的避孕方法是否有差别。
表5 某地城市和农村已婚妇女避孕方法情况(原始资料)
编号 1 2 ┇ 847 居住地 城市 农村 ┇ 农村 避孕方法 节育器 避孕套 ┇ 服避孕药
表5
某地城市和农村已婚妇女避孕方法情况(原始资料) 编号 1 2 ┇ 847 居住地 避孕方法
城市 农村
┇ 农村
节育器 避孕套
┇ 服避孕药
R×C列联表
地区
R×C列联表资料的2检验
计算检验统计量
表 7-6两个独立样本资料频数分布的2×C表 表 完全随机设计下两组频数分布的 2×C 表
处理 1 1 2
A 21
A 22
属性(水平) 2 …
A12
合计 C
A1 C
A11
… … …
n 1 (固定值) n 2 (固定值)
A2 C
mC
合计
m1
m2
n
2
(A T ) T
1.32 2.77 4.11 5.39 6.63
2.71 4.61 6.25 7.78
3.84 5.99 7.81
5.02 7.38 9.35
9.49 11.14
9.24 11.07 12.83
自由度为1的2分布
0.5 0.4
0.3
0.2
0.05
0.1
0.0
3.84 =1.962
2检验的基本思想
思考题
将病情相似的淋巴系肿瘤患者随机分成两组, 分别做单纯化疗与复合化疗,两组的缓解率见 下表,问两疗法的总体缓解率是否不同?
表4 两种疗法缓解率的比较
属性 组别 单纯化疗 复合化疗 缓解率(%)
缓解
2(4.8) 14
未缓解
10 14
合计 12(固定值) 28(固定值) 16.7 50.0
合计
16
第九章
2
ቤተ መጻሕፍቲ ባይዱ
检验
2
2
定性资料
分布和 检验的基本思想** 2 独立样本2×2列联表资料的 检验** 2 独立样本R×C列联表资料的 检验*
配对设计资料的 检验** 四格表的确切概率法*
2
分布
2
Z~N(0,1) Z2~ 2(v=1) Z12+ Z22 ~ 2( v= 2) Z1
表7
剂量 1.0mg 有效 3 (7.36)
某药不同剂量的镇痛效果
无效 12 ( 7.64) 合计 15(固定值) 有效率(%) 20.00
镇痛效果
2.5mg
5.0mg 合计
11 (9.81)
12 (8.83) 26
9 (10.19)
6 ( 9.17) 27
20(固定值)
18(固定值) 53
55.00
2
n (
2 i 1
R
j 1
C
A ij
2
1)
ni m j
R×C列联表资料的2检验
计算检验统计量
n (
2 i 1 R
j 1
C
A ij
2
1)
2
ni m j
153 33
2
847 (
473 391
108 391
18
2
58 456
1)
151 . 0995
=(2-1)×(4-1)=3
R×C列联表资料的2检验
确定P值 查2界值表,比较检验统计量2和2界值, 确定P值。
R×C列联表资料的2检验
附表8 自由度v 0.975 0.950 0.900
2
2 界值表
0.750 0.500 0.250 0.100 0.050 0.025
思考题
测得某地区426名健康输血员的血型,见表8。 问男性和女性的血型分布有无不同?
表8 某地区健康输血员的血型分布(频数表资料)
血型
性别 男性 A 47 B 66 AB 20 O 106 合计 239
女性
合计
52
99
54
120
19
39
62
168
187
426
为研究某镇痛药的不同剂量镇痛效果是否有差别, 研究人员在自愿的原则下,将条件相似的53名产 妇随机分成三组, 分别按三种不同剂量服用该药, 镇痛效果如表7。
避孕方法 地区
节育器 153
320 473
服避孕药 33
75 108
避孕套 165
43 208
其他 40
18 58
合计
城市
农村 合计
391
456 847
R×C列联表资料的2检验
建立假设,确定检验水准
H0:城市和农村已婚妇女避孕方法的总体概率分布相同 H1:城市和农村已婚妇女避孕方法的总体概率分布不同 =0.05
四格表资料的2检验
计算检验统计量
治疗消化道溃疡两种药物疗效频数表资料
疗效 愈合 未愈合 21 33 54 85(固定值) 84(固定值) 169 75.29% 60.71% 68.05% 合计 有效率 药物
表3
洛赛克 雷尼替丁 合计
64 51 115
2
( AT ) T
2
表3
药物 洛赛克
城市 农村 合计
统计描述
避孕方法
表6 某地城市和农村已婚妇女避孕方法情况(频数表资料)
节育器 153 320 473 服避孕药 33 75 108 避孕套 165 43 208 其他 40 18 58
合计
391 456 847
R×C列联表资料的2检验
检验目的 多个独立样本频率分布是否相同
表6 某地城市和农村已婚妇女避孕方法情况(频数表资料)
第九章 检验
2
资料 定量资料
统计分析 统计描述
定性资料
参数估计 统计推断 假设检验
第七章 t检验
单样本资料的t检验 配对设计资料的t检验 两独立样本资料的t检验
定量资料
第八章 方差分析
定量资料
多个独立样本资料的方差分析** 随机区组设计资料的方差分析** 多个样本均数的两两比较* 多个样本的方差齐性检验和数据变换
四格表资料专用公式
a c
2
b d
2
(A T ) T
2
( ad bc ) n
2
( a b )( c d )( a c )( b d )
四格表资料的2检验
应用条件
2
(A T ) T
2
2
( ad bc ) n
2
( a b )( c d )( a c )( b d )
四格表资料的2检验
2
计算检验统计量
(A T ) T
2
( 64 57 . 84 ) 57 . 84
2
( 21 27 . 16 ) 27 . 16
2
( 51 57 . 16 ) 57 . 16
2
( 33 26 . 84 ) 26 . 84
2
4 . 13
=(行数-1)×(列数-1)=1
未愈合 21 33 85(固定值) 84(固定值) 169 75.29% 60.71% 68.05%
115
54
四格表资料的2检验
a
c
b
d
四格表又称2×2列联表(contingency table)
四格表资料的2检验
检验目的 两总体概率分布是否相同
表3
药物
治疗消化道溃疡两种药物疗效频数表资料
洛赛克(n1=85) 雷尼替丁(n2=84)
表2
两种药物治疗消化道溃疡疗效原始资料
愈合,愈合,未愈合,…,未愈合 未愈合,愈合,愈合,…,未愈合
洛赛克(n1=85) 雷尼替丁(n2=84)
四格表
表3
药物 愈合 洛赛克 雷尼替丁 合计 64 51 疗效
统计描述
合计 有效率
治疗消化道溃疡两种药物疗效频数表资料
四格表资料的2检验
确定P值 查2界值表,比较检验统计量2和2界值, 确定P值。
自由度为1的2分布
0.5 0.4 0.3 0.2 0.1 0.0
0.05
P
3.84
4.13
四格表资料的2检验
作出结论 本例,2=4.13,P
0 . 05
拒绝H0,差别有统计学意义,可认为两药物总 体有效概率不同。
治疗消化道溃疡两种药物疗效频数表资料
疗效 有效 无效
合计 85
84 169
有效率 75.29%
60.71% 68.05%
雷尼替丁 合计
64 (57.84) 21(27.16) 51 (57.16) 33(26.84)
115 54
T11 85 68 . 05 %
T12 85 (1 68 . 05 %)
2
两独立样本资料2检验
二分类情形-2×2列联表
四格表
将病情相似的169名消化道溃疡患者随机分 成两组,分别用洛赛克与雷尼替丁两种药 物治疗。4周后结果原始记录如下。问两种 药物治疗消化道溃疡的愈合率有无差别?
表2 两种药物治疗消化道溃疡疗效原始资料
愈合,愈合,未愈合,…,未愈合 未愈合,愈合,愈合,…,未愈合