卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
甲法
+ + - - … -
乙法
- + + + … +
甲法
编号 结果
1- 2- 3+ … n1 +
乙法
编号 结果
1+ 2- 3+ … n2 +
配对四格表的χ2检验(McNemar's test)
例7-3 分析目的:两法有无差别 假设(+,-)与(-,+)两格子理
论频数相等均为:
Q. McNemar 1900-1986 美国心理学家 统计学家
b+c <25——确切概率法 例7-9 原理:二项分布 公式:
k
单侧
P(X k)
Ci bc
0.5bc
i0
双侧
k
P(X k) 2
Ci bc
0.5bc
i0
例7-9 P(X≤3)=0.0176<0.05
第四节 行×表资料的χ2检验
一 多个率比较的卡方检验
配对四格表的χ 2检验
H0:B=C 或两种方法检出率相同
H1:B≠C 或两种方法检出率不同
α=0.05。 b+c≥40:
2 (b c)2
b
25≤b+c<40:连续性校正
c 2
(
b
c 1)2 bc
b+c <25
确切概率法
本例b+c=86 2 (75 11)2 47.63
pc
(1
pc
)(
1 n1
1 n2
)
pc
X1 X2 n1 n2
n1 p1 n2 p2 n1 n2
适用条件:n1p1 和n1(1- p1)与 n2p2 和n2(1- p2)均>5
u 2 仅在自由度为1时
适用条件
普通四格表资料的适用条件:
1. n≥40,且T≥5 专用公式勿需校正 2. n≥40,而1≤T<5时,用连续性校正公式
分组
疗效
有效
无效
合计
A
73
9
82
B
52
22
74
合计
125
31
156
实际频数A :a、b、c、d
理论频数T:H0:π1=π2=π假设为pc=(a+c.)/ n
T
行(row)合计 列(column)合计 总例数
nR nC n
nim j n
T11= (a+b)×pc= (a+b)×[(a+c.)/ n]=nRnC/n =65.7
f
( 2)
1
2(
/
2)
2
2
(
/ 21)
e2 / 2
第二节 普通四格表χ 2检验与专用公式
简化的专用公式:
2 (A T )2
(ad bc)2 n
T (a b)(c d)(a c)(b d)
推断结论:
2
2 0.05,1
χ 2检验是现代统计学的创始人 之一,英国统计学家K . Pearson (1857-1936)于1900年提出的一 种具有广泛用途的统计方法,常称 为Pearson卡方检验,可用于:
两个或多个率间的比较; 两组或多组频数分布(或构成)的比较 两分类变量的关联性分析 拟合优度检验等等。
第一节 卡方检验的基本思想——以四格表为例
例7-6:方法同上 列联系数或关联系数
Pearson列联系数 Cramér列联系数
取值范围:0~√1-1/min(R,C)
行×表分析注意事项
适用条件:不宜有1/5以上格子的理论 频数小于5,且T>1
条件不满足
1. 合并:将相邻组合并 2. 删除:将不满足条件的行或列删除 3. Fisher精确概率或Monte Carlo模拟 4. 增加样本含量
小结
1. 资料类型与统计方法
两个样本率对比的卡方检验 配对设计两个率对比的卡方检验 多个率对比的R×C表的卡方检验 两组或多组构成比的R×C表的卡方检验
2. 适用条件
普通四格表 n? T? 配对四个表 b+c? R×C表 T?
校正公式:
通用公式的校正 专用公式的校正
2 c
( A T 0.5)2 T
2 c
(a
( ad bc n / 2)2 n b)(c d)(a c)(b
d)
卡方检验完整的分析步骤
例7-2
1. 建立假设,确定检验水准
H0:π1=π2 H1:π1≠π2
3.84;
P 0.05,拒绝H0,即1 2
2
2 0.05,1
3.84;
则P 0.05,即不拒绝H0
本例: 2
2 0.05,1
3.84;
P 0.05
两个独立样本率比较的正态近似法 —— z 检验
计算公式:z p1 p2
S p1 p2
p1 p2
T12=16.3 T21=59.3 T22=14.7
如果假设检验成立,A与T不应该相差太大。 理论上可以证明:
2 (A T )2 T
服从χ2分布(附后)。 计算出χ2值后,查χ2界值表判断这么大的χ2
是否为小概率事件,以判断假设检验是否 成立。
χ2分布(chi-square distribution)
α=0.05
2. 计算检验统计量
判断适用条件:n? Tmin?
正确选用公式
c2
(a
( ad bc n / 2)2 n b)(c d )(a c)(b
d)
3.28
3. 确定P值,作出推断结论
Fisher确切概率法
以7-8为例 1. 建立假设,确定检验水准 2. 检验统计量——直接计算概率
步骤:例7-4 1. 建立假设,确定检验水准 H0:π1=π2=π3 , 总体率相等 H1:π1,π2,π3 不等或不全相等 α=0.05 2. 计算检验统计量
3. 确定P值,作出推断结论
二 两组或多组构成比的比较 例7-5:推论多个组的总体分布是否相 同——方法原理同上
三 两个分类变量关联性分析
——Yates校正公式 一种建议:条件(1)亦做校正。 3. 当n<40或T<1时,Fisher精确检验 (Fisher exact test) 4. χ2接近χ2界值时或P≈0.05时, 亦用Fisher精确概率法
连续性校正公式
χ 2分布是一连续型分布,而行×列表资料属离散
型分布,对其进行校正称为连续性校正 (correction for continuity) 又称Yates(耶茨)校正(Yates’ correction)
卡方检验
Chi-square test
内容摘要
两组二分类资料对比 普通四格表的χ 2检验
Fisher确切概率法
配对设计四格表资料的χ 2检验
行×列(R×C)表资料的χ 2检验
多组二分类(多个率)——χ 2检验 多组多分类(无序)——χ 2检验 关联性分析
卡方检验(Chi-square test)
4. SNK检验:参照定量资料的原理
χ2检验的其它应用
拟合优度检验(goodness of fit)
判断实际频数与理论频数的吻合程度 应用:
判断分布类型(正态分布、二项分布……) 评价多元回归分析中回归方程的拟合效果
线性趋势检验
资料类型:不同等级分层的百分率 分析目的:百分率虽等级增加而增加的趋势 分析方法:参见相关与回归分析
判断适用条件:n? Tmin? 正确选用公式——确切概率法
超几何分布原理直接计算周边合计不变的 条件下各种组合的概率
P=∑Pi(Pi≤P样本)
作出推断结论
第三节 配对四格表资料的χ2检验
设计类型:配对设计
例7-3:
配对设计与完全随机设计的区别
配对设计
完全随机设计
配对号
1 2 3 4 … n
75 11
2
; 2 0.005,1
P 0.005
配对设计多分类R×C表
McNemar-Bowker 检验
配对号 甲法 乙法
1
+-
2 ++
3 ++ +
4 -+
5 + ++
… ……
n -+
甲法 乙法
- + ++
- 23 45 56 + 34 23 67 ++ 12 34 21
配对四格表的确切概率法
表7-1 两种疗法疗效的比较的四格表(four-fold table)
分组
疗效 有效 无效
合计 有效率
A
73
9
B
52
22
合计
125
百度文库
31
82
89.02%
74
70.27%
156 80.13%
πA = πB
pA ≠ pB
pA = pB?
πA ≠ πB ?
表7-1 两种疗法疗效的比较的四格表(four-fold table)
当其中一个变量为等级资料,且分析 目的为比较处理效应时,用秩和检验 如表8-3
第四节 两两比较
1. 卡方分割
两两比较计算卡方 无统计学意义的合并
2. Scheffè可信区间法 3. Bonferroni法:调整检验水准
k=R(R-1)/2,α’=α/k
例7-4: α’=0.05 / 3=0.0167 结果保守