第七章 X2检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
某研究者欲比较甲、乙两城市空气质量状况,在甲乙两 城市各测定了300个采样点,试比较两城市空气质量有无 差别?(13.84)
组别
空 优
气 良 67
94
质 轻度 污染 28
28
量 重度 污染 7
18
类别 重度 污染 5
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
χ2分布(chi-square distribution)
0.5 0.4 0.3
2 2 f ( ) 2( / 2) 2 1
( / 21)
e
2
/2
ß ×· Ý
× Ô Ó É ¶ È £ ½ 1
n1
H 0 : 1 2 (分别为样本率P 、P2、P的总体率) 1
0.05
n 近似地代替 ,理论上应有:
n1 n1 T11 n1 n
T21 n2 n2 n1 n
T12
n1 n2 n1 (1 ) n
n2 n2 n
实例
表 两零售点猪肉表层沙门氏菌带菌情况检查结果 沙门氏菌 零售点 合计 带菌率(%) 阳性 阴性 甲 2(4.17) 26 (23.33) 28 7.14 乙 5(2.33) 9 (11.67) 14 35.71 合计 7 35 42 16.67
2 42 ( 2 9 5 26 ) 5.49 , 1 2 28 14 7 35
比)的检验。 基本公式:x2 = (A-T)2/T 专用公式:x2 =n ×(A2 /n R× n C -1 ) 自由度:=(R-1)×(C-1) 适用条件:表中不宜有1/5以上格子的理 论频数小于5,或有一个格子的理论频数小 于1 。
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
AB 型 18(16.22) 8(9.78) 26 184 111 295
合计
H0: 急 性 白 血 病 患 者 与 慢 性 患 者 的 血 型 分 布 构 成 比 相 同
=0.05
2 2 2 2 2 2 58 49 59 18 43 27 2 295 184 101 184 76 184 92 184 26 111 101 111 76 1.839
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
2013-1-15
本章内容
第一节 第二节 第三节 第四节 第五节
χ2分布和拟合优度检验 四格表资料的χ2检验 行×列(R×C)表资料的χ2检验 配对设计四格表资料的χ2检验
四格表资料的确切概率法
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
40 16 56
2
(b c) , bc
2
1
(| b c | 1) 2 , bc
2Leabharlann Baidu
1
当 b+c40 时 可 不 校 正 , 而 b+c<40 时 则 一 定 要 校 正 。 本 例 b+c=18+2=20<40, 需 作 连 续 性 校 正 ,
2 ( 18 2 1 ) 2 11.25 , 10 31
2 c 2 ( 2 9 5 26 42 2) 42 28 14 7 35 3.62 , 1
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
第三节 行×列(R×C) 2 表资料的χ 检验
行×列表的x2检验是对多个样本率(或构成
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
卡方检验的基本原理
若检验假设H0:π1=π2成立,四个格子 的实际频数A与理论频数T相差不应该很 2 2 大,即统计量 不应该很大。如果 值很大,即相对应的P值很小,若 , P 则反过来推断 A与T相差太大,超出了抽 样误差允许的范围,从而怀疑H0的正确 性,继而拒绝H0,接受其对立假设H1, 即π1≠π2。
6
合计
甲城 市
乙城 市 合计
2013-1-15
193
154
300
300
347
161
56
25
11
600
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
第五节 四格表资料的确切概率法
由R.A.Fisher(1934年)提出,理论依据为超几何分布, 简称Fisher 确切概率法(Fisher exact probability). T<1或n<40及χ2检验后P值接近α时使用本法。 在有计算机和统计软件的条件下,大样本也可使用本法。 基本思想:在四格表周边合计不变的条件下,直接计算 表内4 个格子数据的各种组合的概率,然后根据实际情 况计算单侧或双侧累计概率,与α比较,作出结论。
2
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
四格表专用公式
( A T )2 2 基本公式: T (a b)(a c) 2 (a b)(b d ) 2 (c d )(b d ) 2 a b d abcd abcd abcd (a b)(a c) (a b)(b d ) (c d )(b d ) abcd abcd abcd (ad bc) 2 n 1 ; (四格表专用公式) (a b)(c d )(a c)(b d )
分析急性白血病与慢性白血病患者的血型分布构成比有无差别?
表 急 性 白 血 病 患 者 与 慢性 白 血 病 患 者 的 血 型 分 布
分组 急性组 慢性组 合计
A 型 58(63.0) 43(38.0) 101 H1: 不 相 同 ,
B 型 49(47.40) 27(34.62) 76
O 型 59(57.38) 33(34.62) 92
上述基本公式由Pearson提出,因此软件 上常称这种检验为Pearson卡方检验
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
连续性校正公式
χ2 分布是一连续型分布,而行×列表资料属离散型
分布,对其进行校正称为连续性校正 (correction for continuity),又称Yates校正(Yates' correction)。 ⑴当n ≥40,而1≤T<5时,用连续性校正公式 ⑵当n <40或T<1时,用Fisher精确检验(Fisher exact test )
=(2- 1)(4- 1)=3, P>0.5。 按 =0.05 水 准 , 不 拒 绝 H0。
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
行×列表x2资料检验的注意事项
表中不宜有1/5以上格子的理论频
数小于5,或有一个格子的理论频 数小于1。 增加样本含量以增大理论数 根据专业知识删减或合并 计算确切概率
样本 1 样本 2 合计
A11
A21
A12
A22 n 2
n1 ( 给 定 )
P 1 A 11 n1 P2 A21 n2
n 1
n2 ( 给 定 ) n (给 定 )
P n1 n
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
(1)检验 H1 : 1 2 (2)用 P
药物
有效
无效
合 计 45 35
有效率 (% ) 91.1 68.6
兰芩口服液 41(36.56) 4(8.44) 银黄口服液 24(28.44) 11(6.56)
合
2013-1-15
计
65
15
80
81.3
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
表
反应变量按二项分类的两个独立样本资料 反应结果 阳性 阴性 观察 总频数 阳性 频率
(a b)!(c d )!(a c)!(b d )! a!b!c!d!n!
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
第七章
2 χ 检验
χ2检验(Chi-square test)也称卡方检验, 常用于分类变量资料的统计推断,以χ2分布为 理论基础,是现代统计学的创始人之一,英国 人K . Pearson(1857-1936)于1900年提出的 一种具有广泛用途的统计方法,可用于两个或 多个率间的比较,计数资料的关联度分析,拟 合优度检验等等。
0.2 0.1 0.0 0 3 6 9 12 ¿ ¨· ½ Ö µ
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6
15
18
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
第二节 四格表资料的χ2检验
表 两种疗法的心血管病病死率比较
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
第四节 配对设计四格表资料的χ2检验
两种培养基白喉杆菌生长情况
甲 培养基 + + - 合 计
H0: B=C H1: BC 连续性校正:
乙 培养基 - 18(b) 14(d) 32
合计
22 (a) 2 (c) 24
=0.05。
( AT ) , (行数-1)(列数 1) T
2 ( A T ) 2 T 2 2 2 2 (41 36.56) (4 8.44) (24 28.44) (11 6.56) 6.565 36.56 8.44 28.44 6.56
2013-1-15
图形 :从纵轴某个点开始单调下降,先凸后凹.
0.3
0.2
0.1
2 2 0.05(1) 3.84 (1.96) 2 Z 0.05/ 2 2 2 0.01(1) 6.63 (2.5758) 2 Z 0.01/ 2
0.0
0
2
4
6
8
10
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
T22 n2 (1 )
一般地,
理论频数
n n (行合计)(列合计) = R C 总计 n
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
2 χ 检验的基本公式
A11 T11 2 T11
2
( A12 T12 )2 ( A21 T21 )2 ( A22 T22 )2 T12 T21 T22 2
第一节 2 χ 分布和拟合优度检验
一、 χ2分布 二、拟合优度检验
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
2013-1-15
一、
(1) 自由度为 1的
2
2 χ 分布
分布
2 2 若 Z ~ N ( 0,1), 则 Z 的分布称为自由度为1的 分布 . 2 2 (chi-square distribution),记为 (1) 或 (1) .
Z1 , Z 2 ,..., Z 互相独立,均服从 N ( 0,1) , 2 2 Z2 ... Z2 的分布称自由度为 的 2 分布, 则 Z1 2 2 ( ) 记为 (2 或 , 或简记为 . )
2 ( )
当自由度〉2 时,随着 得增加,曲线逐渐趋于对称, 当自由度 很大时, 近似地服从正态分布.有 (2 ) Z , (2 的正态分布 ) 服从均数为 ,方差为2 2
校正公式 :
c2
( A T 0.5) 2 T
,(也适合其它行 列表资料)
c2
2013-1-15
( ad bc n / 2) 2 n (a b)(c d )( a c)(b d )
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作