统计学8 卡方检验课件

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
nR nC
ν=(3-1)(2-1)=2
(3)查表得,P<0.005,按α=0.05水准,拒绝H0,接受H1, 差异具有统计学意义,可认为3种疗法的疗效不全相 同。
卡方分割
二、多个样本构成比的比较
例5 随机选择239例胃、十二指肠疾病患者和187例健康 输血员,其血型分布见表6。问胃、十二指肠疾病患者和 健康输血员血型分布有无差异?
z 推算理论频数 T = nRRnCC
n
表1 两种药物治疗牙科术后疼痛控制有效率的比较
处理
有效
无效
合计 有效率(%)
A药 68(63.71) 22(26.29) 90
75.56
B药 合计
58(62.29) 30(25.71) 88
126
52
178
65.91 70.79
卡方检验的基本公式:
χ 2 = ∑ (A − T )2
T
A:实际频数 T:理论频数
T = nRRnCC n
上 式 由 Pearson 提 出 , 因 此 常 称 这 种 检 验 为 Pearson卡方检验。
χ 2 = ∑ (A − T )2
T
χ2值反映了实际频数和理论频数吻合程度。A与T相差越大,则∑(AT)2越大,反之越小。
若H0成立,则4个格子的实际频数与理论频数相差不应很大,即χ2值不 应很大。χ2值越大,相应的P值就越小,若P<α,则A与T相差太大, 即推断H0成立是小概率事件,故拒绝H0,接受H1,认为π1≠π2。 同时,单元格越多,χ2值也会越大,因此,考虑χ2值的意义时,应同 时考虑到格子数(自由度)的影响。这样χ2值才能反映A与T的吻合程 度。
表6 239例胃、十二指肠疾病患者和187例健康输血员血型分布
分组
A
B AB O 合 计
胃、十二指肠疾病患者 47 66 20 106 239
健康输血员
52 54 19 62 187
合计
99 120 39 168 426
(1) H0 :胃、十二指肠疾病患者与健康输血员血型分布的构成相同 H1 :胃、十二指肠疾病患者与健康输血员血型分布的构成不同 α=0.05
校正公式: χ 2 = ∑ ( A − T − 0.5)2
T
χ 2 = ( ad − bc − n / 2)2 n
(a + b)(c + d )(a + c)(b + d )
例2 为观察甲、乙两药对治疗胃溃疡的疗效,将 70名患者随机分为两组,一组30人服用甲药,另 一组40人服用乙药,结果如表2。问两药的胃溃 疡治愈率有无差别?
63.71
26.29
62.29
25.71
= 2.00
ν =(2−1)(2−1) =1
(3)确定P值,做出推论
χ20.05,1 =3.84, χ20.01,1 =6.63
χ2=2.00 < χ20.05,1 =3.84,故P>0.05,不拒绝H0 ,差 异无统计学意义,尚不能认为两药疗效不同。
四格表专用公式:
§1 四格表资料的卡方检验
一. 卡方检验概述 (卡方分布、基本思想)
二. 四格表卡方检验的专用公式 三. 四格表卡方检验的校正公式
1、卡方分布
♦ 卡方分布是一种连续型随机变量的概率分布。 ♦ 卡方分布的形状依赖于自由度υ的大小。当υ>2
时,随着υ的增加,曲线逐渐趋于对称,当υ趋于 ∞时,卡方分布逼近于正态分布。 ♦ 各种自由度的卡方分布右侧尾部面积为α时的临界 值记为χ2α,υ 。
一、多个样本率的比较
行列表卡方检验的通式:
χ 2 = n(∑ A2 −1)
nR nC
ν =(R-1)(C-1)
例4 将133例尿路感染患者随机分为3组,甲组44例,乙 组45例,丙组44例,分别接受治疗。一个疗程后观察疗 效,结果如表5,问3种疗法的尿培养阴转率有无差别?
表5 三种疗法对尿路感染患者的治疗效果比较
由 R.A.Fisher 提 出 , 其理论依据是超几何 分 布 。 简 称 为 Fisher 确切概率法。
适用情况
z 适用条件:四格表中有理论频数小于1或n 小于40的情况;特别是用其它检验方法所
得的P值接近检验水准α时。
z 注意:不属于卡方检验,但是四格表卡方 检验的补充。
例 将23名精神抑郁症患者随机分到两组,分别接 受两种药物治疗,结果如下表,问两种药物的治疗 效果是否不同。
(1)写出统计分析的方法 (2)统计量值 (3)P值及结论
案例2
(1)该资料类型是什么?设计类型呢? (2)本研究是否需要进行连续性校正?为什么? (3)两组降低颅内压的总体有效率有无差别?(写出详细 假设检验步骤)
H1 :两种药物的治疗效果不等 α=0.05
(2)计算概率:在四格表边缘合计不变的情况下, 用依次增减样本四格表第一个格子的数据可得 到各种组合的四格表。
(3)确定P值,做出推断结论。 本例P=0.214>0.05,不拒绝H0,尚不能认为两 药的疗效不同。
§4 行列表资料的卡方检验
一. 多个样本率的比较 二. 多个样本构成比的比较 三. 双向无序分类资料的关联性检验 四. 行列表卡方检验的注意事项
注意:
本法一般用于样本含量不太大的资料。因为它仅考 虑了两法结果不一致的两种情况(b, c),而未考虑样 本含量n和两法结果一致的两种情况(a, d)。所以, 当n很大且a与d的数值很大(即两法的一致率较 高),b与c的数值相对较小时,即便是检验结果有 统计学意义,其实际意义往往也不大。
§3 Fisher确切概率法
(2)
χ 2 = n(∑ A2 −1) = 6.76
nR nC
ν=(4-1)(2-1)=3
(3) P>0.05,按α=0.05水准,不拒绝H0,差别无统计学意 义,尚不能认为胃、十二指肠疾病患者与健康输血 员血型分布的构成不同。
四、行列表卡方检验的注意事项
z 理论数不宜太小。(不能有1/5以上格子的理论频数小于5或者 有一个格子的理论频数小于1)
表 2 两种药物治疗胃溃疡的比较
药物 治愈
未愈 合计 有效率(%)
甲 2(2 25.29) 8(4.71) 30
73.33
乙 3(7 33.71) 3(6.29) 40
92.50
合计
59
11
70
84.29
1. 建立检验假设,确定检验水准 2. 计算检验统计量和自由度
(先计算理论频数T,根据T值选择计算公式)
《M《eMdiecdailcsatlastitsattiicssti》cs
χ2 检验
精选案例:injury.sav
χ2检验(Chi-square test)
是现代统计学的创始人之 一,英国统计学家 K.Pearson于1900年提出。 常用于分类变量资料的统 计推断。
理论依据:卡方分布和拟合优度检验
(1) H0 :两种方法检出率相同,即B = C H1 :两种方法检出率不同,即B ≠ C α=0.05
(2)
b+c =118>40
χ 2 = (110 − 8)2 = 88.17
(110 + 8)
(3)查表得,P<0.005,按α=0.05水准,拒绝H0,接受H1, 差别有统计学意义,可以认为两种方法的检出率不 同,甲法较高。
两种药物治疗精神抑郁症疗效比较
药物
甲药 乙药 合计
疗效
有效
无效
7
5
3
8
10
13
合计
12 11 23
在四格表的边缘合计不变的条件下,直 接计算各种事件发生的概率。
P(a) = (a + b)! (c + d )! (a + c)! (b + d )! a! b! c! d! n!
(1) H0 :两种药物的治疗效果相等
卡方检验的用途
♦ 两个总体率或构成比之间的比较 ♦ 多个总体率或构成比之间的比较 ♦ 两个分类变量之间的关联性检验 ♦ 趋势检验 ♦ 拟合优度检验等
内容提要
§ 1 四格表资料的卡方检验 § 2 配对四格表资料的卡方检验 § 3 Fisher确切概率法 § 4 行列表资料的卡方检验 § 5 多个样本率间的多重比较
χ2 =
(ad − bc)2 n
(a + b)(c + d )(a + c)(b + d )
本例, χ 2 = (68× 30 − 22× 58)2 ×178 = 2.00
90×88×126× 52
适用条件
♦ 当 n≥40 且 T≥5时,用基本公式或专用公式;若 P≈α,则改用四格表确切概率法;
z 对于单项有序行列表,在比较各处理组的效应有无差别时,应 该用秩和检验或Ridit检验;
z 多个样本率(构成比)比较的卡方检验,结论为拒绝H0时, 只能认为各总体率(总体构成比)有差别,但不能说明哪两者 之间有差别;若要进一步了解哪两者之间有差别,可用卡方分 割法,或者借鉴均数多重比较的原理。
理论频数太小的3种处理方法
(b + c) b + c < 40, χ 2 = ( b − c − 1)2
(b + c)
例3 某研究室用甲、乙两种血清学方法检查410 例确诊的鼻咽癌患者,结果如表4,问两种方法 检出率有无差别?
表4 两种血清学方法检验结果

+ 合计

+
-
261
110
8
31
269
141
合计
371 39 410
处理 有效 无效 合计 有效率(%)
A药 68 22 90 B药 58 30 88
75.56 65.91
合计 126 52 178
70.79
z 实际情况:
A药-75.56%;B药-65.91%
z 两样本率不同的可能原因:
差别仅由抽样误差所致 两种药物有效率确有不同
z 假 设 H0 成 立 , 即 两 药 物 有 效 率 相 同 , π 1= π2,即假设差别是由抽样所致。
3. 确定P 值,做出推论
不校正公式计算结果:
χ2 = 4.75
结 论


连续性校正卡方检验结果:
χ2 = 3.42
所以,一定要注意卡方检验的应用条件,这样才 不至于得出错误的结论。
结果表达:
A、B两组之间痊愈率比较,采用四格表卡方检验, 结 果 显 示 , χ 2 = 0.95 , P = 0.33 , 差 异 无 统 计 学 意 义,尚不能认为两组总体痊愈率有差异。
χ20.05,1 =3.84, χ20.01,1 =6.63
卡方分布
2、卡方检验的基本思想
例1 在某项治疗牙科术后疼痛控制的双盲临床研究中,将 178例患者随机分为两组,A药组90人,有效人数68人。 B组88人,有效人数58人。问两药有效率是否有差别?
表1 两种药物治疗牙科术后疼痛控制有效率的比较
疗法 阴转人数 阳性人数 合计 阴转率(%)

30
14
44
68.2

9
36
45
20.0

32
12
44
wenku.baidu.com
72.7
合计 71
62 133
53.4
(1) H0 :3种疗法阴转率相同,即π1=π2 =π3 H1 :3种疗法阴转率不全相同,即π1,π2 ,π3不全相同 α=0.05
(2) χ 2 = n(∑ A2 −1) = 30.64
1) 增大样本含量,以达到增大理论频数的目 的;
2) 删去理论频数太小的格子对应的行或列; 3) 合理合并:结合专业,将理论频数太小的行
或列与性质相近的行或列合并。
§5 多个样本率间的多重比较
♦ 基本思想:重新规定检验水准,使得第一类错 误的概率保持不变。
α’=
α
比较的次数
案例讨论
案例1
♦ 为观察某新药的疗效,某厂家进行了随机双盲对 照临床实验,40例肝炎患者接受新药治疗,而30 例患者接受传统药物的治疗,对两组患者进行疗 效观察,结果见下表。
四格表资料
处理
+
A
a
B
c
合计
a+c
-
合计
b
a+b
d
c+d
b+d
n(a+b+c+d)
(1) 建立检验假设,确定检验水准
H0 :两药有效率相同,即π1=π2 H1 :两药有效率不同,即π1 ≠ π2 α=0.05
(2)计算检验统计量和自由度
n>40,Tmin>5
χ2 = (68−63.71)2 + (22−26.29)2 + (58−62.29)2 + (30−25.71)2
案例:湛江海大教职工脂肪肝患病情况调查
§2 配对四格表资料的卡方检验
原始数据
Id A B 1+ + 2+ …… j -+ …… n- -
表 3 配对四格表形式


合计
+
-
+
a
b
a+b
-
c
d
c+d
合计 a+c b+d
n
配对卡方检验又称McNemar检验:
b + c ≥ 40, χ 2 = (b − c)2
♦ 当n≥40且1≤T<5时,用校正公式; ♦ 当n<40或T<1时,不能用卡方检验,应当用四格
表确切概率法。
校正的目的: 英国统计学家(Yates)认为χ2分布是一种连续性分布,而四 格表中的资料属离散性分布,得到的χ2统计量的抽样分布 也是离散的。因此,为改善χ2统计量分布的连续性,建议 进行校正,又称Yates校正。
相关文档
最新文档