第九章卡方检验2
合集下载
卫生统计学-第九章 卡方检验

11
2检验的基本思想
• 如果H0成立,则男女生感染率的差异仅是抽样误
差引起的,相差不会太大,由此而计算出来的T与 A也不会相差很大,即2值不会相差很大
• 如果两样本率相差过大,即T与A相差较大,2值
也会相差较大,相应的P值也就越小。
• 因此,由实际样本资料求得一个较小的P,而且
P≤,就有理由怀疑H0的真实性,因而拒绝H0,
18.55
66.45
(3)确定自由度和P值
四格表的自由度=1,卡方界值为3.84 卡方值>卡方界值,所以 P<0.05
(4)作出推断性的结论
按α =0.05水准,拒绝H0,接受H1,可认为该小学男女生 蛔虫感染率不同,男生的感染率高于女生.
18
四格表除了可用基本公式外,更多用四格表专用公 式计算卡方值.
假设四格的数字分别为a,b,c,d,如图,
则用下式来计算卡方值:
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
23 57 a 13 72
此式不必计算理论数,比较方便,结果也更为准确.
19
某小学男女生蛔虫感染率的比较
• 实际工作常用于检验两个或多个样本率及构成比
之间差别有无统计学意义,两种属性或特征之间 是否有关系以及拟合优度检验等。
5资料的2检验 • RC表的2检验 • 配对四格表的2检验 • 精确概率法
6
§1 2检验的基本思想
例:某小学男女生蛔虫的感染率如下表,试判断男女 蛔虫感染率是否有差别?
从而作出接受H1的统计推断;如果P>,则没有
理由拒绝H0。
12
性别 男 女 合计
虫卵阳性人数 阴性人数 合计 感染率(%)
医学统计课件人卫6版 第九章 卡方检验ppt课件

R行与C列中,行合计数中的最小值与列合计
数中的最小值所对应格子的理论频数最小。
➢ 两样本率比较的资料,既可用Z检验也可用 检2
验来推断两总体率是否有差别,且在不校正的 条件下两种检验方法是等价的,对同一份资料
有
Z2 2
讨论:计算与分析1.2.
.
11
补充:
两大样本率的假设检验
1)样本率与总体率比较: Z p0 0(10)/n
➢ 基本公式:
2
(AT)2
T
.
3
➢ T值是在假设H0 成立的条件下,求得的理论频数
TR C
nR .nC n
➢ TRC 表示R行C列的理论频数
➢ nR 为相应行的合计,nC 为相应列的合计
➢ n 为总例数
.
4
求得χ2 值,按ν =(R - 1)(C - 1)
➢ 查附表7,得P值。 同一自由度下,χ2值越大, ➢ 相应的概率P值越小。
• 此类设计可作两方面的统计分析:
.
13
1.两法检验结果有无差别: (阳性检出率是否不同)
2 (b c)2
bc
ν=1
若观察频数b+c < 40,需对χ2值进行校正
2(b | c|1)2
bc
.
14
2.两法检验结果有无关系(联)(了解) H0 :两法结果无关联 H1 :两法结果有关联
α = 0.05
.
18
行×列表资料检验的专用公式:
2 n(
A2 1)
nRnC
(行数-1)(列数-1)
例9-5;9-6
.
19
行×列表资料 检2 验的注意事项
1.一般认为,行×列表中的理论频数不应小于1, 或 的1格T子5 数不宜超过格子总数的1/5。若 出现上述情况,可通过以下方法解决:①最好 是增加样本含量,使理论频数增大;②根据专 业知识,考虑能否删去理论频数太小的行或列, 能否将理论频数太小的行或列与性质相近的邻 行或邻列合并;③改用双向无序 R×C列表的 Fisher确切概率法。
数中的最小值所对应格子的理论频数最小。
➢ 两样本率比较的资料,既可用Z检验也可用 检2
验来推断两总体率是否有差别,且在不校正的 条件下两种检验方法是等价的,对同一份资料
有
Z2 2
讨论:计算与分析1.2.
.
11
补充:
两大样本率的假设检验
1)样本率与总体率比较: Z p0 0(10)/n
➢ 基本公式:
2
(AT)2
T
.
3
➢ T值是在假设H0 成立的条件下,求得的理论频数
TR C
nR .nC n
➢ TRC 表示R行C列的理论频数
➢ nR 为相应行的合计,nC 为相应列的合计
➢ n 为总例数
.
4
求得χ2 值,按ν =(R - 1)(C - 1)
➢ 查附表7,得P值。 同一自由度下,χ2值越大, ➢ 相应的概率P值越小。
• 此类设计可作两方面的统计分析:
.
13
1.两法检验结果有无差别: (阳性检出率是否不同)
2 (b c)2
bc
ν=1
若观察频数b+c < 40,需对χ2值进行校正
2(b | c|1)2
bc
.
14
2.两法检验结果有无关系(联)(了解) H0 :两法结果无关联 H1 :两法结果有关联
α = 0.05
.
18
行×列表资料检验的专用公式:
2 n(
A2 1)
nRnC
(行数-1)(列数-1)
例9-5;9-6
.
19
行×列表资料 检2 验的注意事项
1.一般认为,行×列表中的理论频数不应小于1, 或 的1格T子5 数不宜超过格子总数的1/5。若 出现上述情况,可通过以下方法解决:①最好 是增加样本含量,使理论频数增大;②根据专 业知识,考虑能否删去理论频数太小的行或列, 能否将理论频数太小的行或列与性质相近的邻 行或邻列合并;③改用双向无序 R×C列表的 Fisher确切概率法。
课程九章卡方检验2ppt课件

一、配对2×2列联表资料的2检验
例9-6 设有132份食品标本,把每份标 本一分为二,分别以甲、乙两种方法做 沙门菌检验。结果见9-8表,问两种方 法的阳性结果有无差别?
表9-8 两种检验方法检验结果比较
乙
甲
+
-
合计
+
80(a) 10(b)
90
-
31 (c) 11(d)
42
合计
111
21
132
分析
治疗效果
有效
无效
7
5
3(4. 8)
8
10
13
合计
12 11 23
有效率 (%)
58.3 27.3 43.5
本例n<40,不应用四格表卡方检验, 应用确切概率计算法。
H0:两种类型阳性率相等,即π1=π2 H1:两种类型阳性率不等,即π1≠π2
α=0.05
从原四格表组合得知:
按条件要求列出
周边合计不动时,大于等于1.8的所有组合数。
三、确切概率计算法的设计基本思想
四格表周边合计不变,只变a、b、c、 d四个实际数,这样的组合有几个,就用公 式计算几个p值,求全部p值之和 与所定 α比较,若∑p> α则无统计学意义,否则相 反。
周边合计不变,共有“周边合计最小数+1” 种组合。
条件: 1. 周边合计不变
2. 只求
所有p值和即可。
—
R×C列联表资料χ2 检验注意问题
关于R×C列联表资料2检验的条件
使用2检验在任何情况下都要注意理论频数 T
不能太小。一般要求各格的理论频数均应大于1, 且T<5的格子数不宜多于格子总数R×C的1/5 (1) 增加样本含量 (2)合理合并行列 (3) 改用确切概率计算法
例9-6 设有132份食品标本,把每份标 本一分为二,分别以甲、乙两种方法做 沙门菌检验。结果见9-8表,问两种方 法的阳性结果有无差别?
表9-8 两种检验方法检验结果比较
乙
甲
+
-
合计
+
80(a) 10(b)
90
-
31 (c) 11(d)
42
合计
111
21
132
分析
治疗效果
有效
无效
7
5
3(4. 8)
8
10
13
合计
12 11 23
有效率 (%)
58.3 27.3 43.5
本例n<40,不应用四格表卡方检验, 应用确切概率计算法。
H0:两种类型阳性率相等,即π1=π2 H1:两种类型阳性率不等,即π1≠π2
α=0.05
从原四格表组合得知:
按条件要求列出
周边合计不动时,大于等于1.8的所有组合数。
三、确切概率计算法的设计基本思想
四格表周边合计不变,只变a、b、c、 d四个实际数,这样的组合有几个,就用公 式计算几个p值,求全部p值之和 与所定 α比较,若∑p> α则无统计学意义,否则相 反。
周边合计不变,共有“周边合计最小数+1” 种组合。
条件: 1. 周边合计不变
2. 只求
所有p值和即可。
—
R×C列联表资料χ2 检验注意问题
关于R×C列联表资料2检验的条件
使用2检验在任何情况下都要注意理论频数 T
不能太小。一般要求各格的理论频数均应大于1, 且T<5的格子数不宜多于格子总数R×C的1/5 (1) 增加样本含量 (2)合理合并行列 (3) 改用确切概率计算法
医学统计学 -第09章 卡方检验

0.4 f(x)
v=1
0.3
2分布
0.2
v=4
v=6 v=9
0.1
0.0
0
3
6
9
12
15 x
(2)计算检验统计量
2 (A T )2
T
(41 36.5625)2 (4 8.4375)2 (24 28.4375)2 (11 6.5625)2
36.5625
8.4375
28.4375
6.5625
理论基础:超几何分布,不属于卡方检验
谢谢
表 慢性咽炎两种药物疗效资料
分组
兰芩口服液 银黄口服液
合计
有效
41 24 65
无效
4 11 15
有效率 (%) 91.11
68.57 81.25
合计
45 35 80
问题: 两个总体有效率是否相等?
(1)建立检验假设 H0:π1=2 两药的总体有效率相同 H1:π1≠π2 两药的总体有效率不同 检验水准=0.05
bc
= 1
若b+c<40,采用以下校正公式
2 (| b c | 1)2
= 1
bc
第三节 行×列表资料的2检验
(一)R×C表 最常见的形式是
2×C列联表(一般为2个构成比的比较) R ×2列联表(一般为多个样本率的比较)
R×C列联表2检验的原理与2×2列联表2 检验的原理完全一样
统计量计算公式
合计 40 30 32 102
有效率(%) 87.50 66.67 21.88 60.78
(1)建立检验假设,确定检验水准
H0 :1 2 3
H1
:
1
,
第九章 卡方检验

2
T
离散用连续近似
2 ( ad bc n / 2)2 n
(a b)(c d )(a c)(b d )
注:(1)这种校正称为连续性校正。 (2)如检验所得P值近于检验水准α时, 最 好改用四格表确切概率法。
例 9-3 将病情相似的淋巴系肿瘤患 者随机分布两组,分别做单纯化疗与复 合化疗,两组的缓解率见表9-4,问两疗 法的总体缓解率是否不同?
2分布
如果Z服从标准正态分布,那么Z2服从自 由度为1的 2 分布,其分布图见156。
如果Z1,Z2,…,Zv是v个独立的标准正
态分布随机变量,
z12
Z
2 2
Zv2
的分布
服从自由度为v的 2 分布。
1.962=3.84
例9-2 具体步骤
建立检验假设
H0:1=2 假设两药的愈合率相同 H1:12 假设两药的愈合率不同
第二节 独立样本2×2 列联
表资料的2检验
提出问题
研究目的:比较洛赛克与雷尼替丁疗效有无差 别?
能否说明洛赛克比雷尼替丁效果好?
已知
≠ P1=75.29%
P2=60.71%
推断
π1
?
π2
2 检验的基本思想
假设: 洛赛克与雷尼替丁治疗消化道溃疡的效果相同。
1 2
计算两组合计的愈合率为68.05%(即115/169) 作为 总体率的估计
3 确定P值,做出结论
查附表,
2 0.1(1)
2.71
2.64 2.71, P 0.1
按 0.05 的水准下,不能拒绝H0,即差别无 统计学意义。还不能认为两种方案的总体缓概率
09卡方检验(医学统计学)

1.建立检验假设并确定检验水准
H
:
0
1
2
,即两组新生白兔HBV的总体感染率相等
H1:1 2 ,即两组新生白兔HBV的总体感染率不相等
0.05
2.计算概率 根据公式计算各种组合的四格表概率,结果见表
9-4。例如实际观察到的四格表资料的概率为
P* 9!8!8!9! 0.041464 7!2!2!6!17!
构成比之间有无差别。
Karl Pearson
第一节 四格表资料的 2检验
例9-1 吲达帕胺片治疗原发性高血压疗效,将患者随 机分为两组,试验组用吲达帕胺片加辅助治疗,对 照组用安慰剂加辅助治疗。试分析有效性。
2 检验的基本思想可通过其基本公式来解释:
2 观察值 理论值 2 A T 2
死亡 3 6 9
合计 44 24 68
四、四格表资料的Fisher确切概率法
当四格表资料中出现n<40 或T <1,需改用四格表 资料的Fisher确切概率法。该法是一种直接计算概 率的假设检验方法,其理论依据是超几何分布( hypergeometric distribution)。四格表的确切概率 法不属于检验的范畴,但常作为四格表资料假设 检验的补充。
=0.05
2.计算检验统计量
2 259(2 3212 3692 ...... 4442 1) 297.38
9871080 5181080
9 3 3 9 5 5
(3 1)(4 1) 6
3.确定P值,作出推断结论 查 2 界值表得P<0.05,认为三个不同地区的人群血型分布 总体构成比有差别。
C 各样本率均不相等
D 各样本率不等或不全相等
E 各总体率相差很大 3.四格表资料 2 检验中,出现下列哪种情况需进行校正
最新【基础医学】第九章 卡方检验幻灯片课件

/611696569
表9-8 不同文化程度患者首选疼痛量表的类型
文 化 程 度
高 中 以 下 高 中
高 中 以 上 合 计
V AS 3(3.5) 0(1.6) 4(1.8)
7
首 选 测 痛 量 表
V DS
NRS
16(18.7) 10(8.6)
18(19.7) 9(9.0)
11(9.7)
12(10.2)
37
39
FPS 44(39.0) 18(17.8) 15(20.2)
时,一般不作校正。
例9-2 将116例癫痫患者随机分
为两组,一组70例接受常规加高压氧 治疗(高压氧组),另一组46例接受 常规治疗(常规组),治疗结果见表 7-4。问两种疗法的有效率有无差别?
表9-3 两种疗法治疗癫痫的效果
治 疗 方 法
治 疗 结 果
有 效
无 效
高 压 氧 组 66( 62.8)
四格表资料检验的专用公式
2
(adbc)2n
(ab)(ac)(bd)(cd)
2(331041039)218634.10
7243143114
(四)四格表资料检验的校正公式
c2
( AT 0.5)2 T
(|ad-bc|-n)2n
c2
=
2
(a+b)(c+d)(a+c)(b+d)
2 分布是一连续型分布,而四格
合 计
乙 剂 量
死 亡 (+ )
生 存 (- )
6( a) 3( c)
12( b) 18( d)
9
30
合 计
18 21 39
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能:
表9-8 不同文化程度患者首选疼痛量表的类型
文 化 程 度
高 中 以 下 高 中
高 中 以 上 合 计
V AS 3(3.5) 0(1.6) 4(1.8)
7
首 选 测 痛 量 表
V DS
NRS
16(18.7) 10(8.6)
18(19.7) 9(9.0)
11(9.7)
12(10.2)
37
39
FPS 44(39.0) 18(17.8) 15(20.2)
时,一般不作校正。
例9-2 将116例癫痫患者随机分
为两组,一组70例接受常规加高压氧 治疗(高压氧组),另一组46例接受 常规治疗(常规组),治疗结果见表 7-4。问两种疗法的有效率有无差别?
表9-3 两种疗法治疗癫痫的效果
治 疗 方 法
治 疗 结 果
有 效
无 效
高 压 氧 组 66( 62.8)
四格表资料检验的专用公式
2
(adbc)2n
(ab)(ac)(bd)(cd)
2(331041039)218634.10
7243143114
(四)四格表资料检验的校正公式
c2
( AT 0.5)2 T
(|ad-bc|-n)2n
c2
=
2
(a+b)(c+d)(a+c)(b+d)
2 分布是一连续型分布,而四格
合 计
乙 剂 量
死 亡 (+ )
生 存 (- )
6( a) 3( c)
12( b) 18( d)
9
30
合 计
18 21 39
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能:
第九章 卡方检验

为客观起见,建议将两种结论同时报 告出来,以便他人判断。当然,如果 两种结论一致,如均为或,则只报道 非连续性检验的结果即可。
2020年3月4日
2020年3月4日
二、两相关样本率检验(McNemar)
1.资料类型
两个相关样本率资料又称配对计数资料,顾名 思义,是采用配对设计,且结果以频数方式表 达的资料,见例9-3。
3.合并理论频数太小的格子所相邻的行或
列。这样做同样会损失信息及损害样本的
随机性,但损失的信息比第②种方法小一
些。不过,应注意合并得是否合理,如不
同年龄组是可以合并的,但不同血型就不
能合并。
2020年3月4日
第三节、Fisher确切概率检验*
确切概率检验是由Fisher 1934年提出的一种用 于两个独立样本率比较的方法,故又称Fisher 确切概率法。有人认为,当样本量n和理论频数 T太小时,如n<40而且T<5,或T<1,或n< 20,应该用确切概率检验。这一观点所基于的 理论是,当样本量太小时,二项分布的正态逼 近性较差,因而不宜用基于正态分布的检验。 提出上述条件的另外一种考虑是确切概率法的 计算量偏大,但随着计算工具的大大改进,确 切概率法的应用不一定限于上述条件。
2020年3月4日
P
2020年3月4日
2020年3月4日
2020年3月4日
理论频数太小的三种处理方法
1. 增大样本量。以达到增大理论频数的目 的,属首选方法,只是有些研究无法增大 样本量,如同一批号试剂已用完等。
2. 删去理论频数太小的格子所对应的行或 列。这样做会损失信息及损害样本的随机 性。
2020年3月4日
2020年3月4日
2020年3月4日
2020年3月4日
2020年3月4日
2020年3月4日
二、两相关样本率检验(McNemar)
1.资料类型
两个相关样本率资料又称配对计数资料,顾名 思义,是采用配对设计,且结果以频数方式表 达的资料,见例9-3。
3.合并理论频数太小的格子所相邻的行或
列。这样做同样会损失信息及损害样本的
随机性,但损失的信息比第②种方法小一
些。不过,应注意合并得是否合理,如不
同年龄组是可以合并的,但不同血型就不
能合并。
2020年3月4日
第三节、Fisher确切概率检验*
确切概率检验是由Fisher 1934年提出的一种用 于两个独立样本率比较的方法,故又称Fisher 确切概率法。有人认为,当样本量n和理论频数 T太小时,如n<40而且T<5,或T<1,或n< 20,应该用确切概率检验。这一观点所基于的 理论是,当样本量太小时,二项分布的正态逼 近性较差,因而不宜用基于正态分布的检验。 提出上述条件的另外一种考虑是确切概率法的 计算量偏大,但随着计算工具的大大改进,确 切概率法的应用不一定限于上述条件。
2020年3月4日
P
2020年3月4日
2020年3月4日
2020年3月4日
理论频数太小的三种处理方法
1. 增大样本量。以达到增大理论频数的目 的,属首选方法,只是有些研究无法增大 样本量,如同一批号试剂已用完等。
2. 删去理论频数太小的格子所对应的行或 列。这样做会损失信息及损害样本的随机 性。
2020年3月4日
2020年3月4日
2020年3月4日
2020年3月4日
第九章 卡方检验

• 独立性检验主要用于两个或两个以上因素多项分类的 计数资料分析。主要研究两个因素或两个以上因素之 间是否有独立性或有无关联的存在。所对应的资料为 列联表的形式,对于R×C的列联表独立性的检验用 χ2检验。具体方法如下:
自由度: df (r 1)(c 1)
理论次数 : f
统计量 :
e
fr fc N
2 ( f f ) 2 0 e fe
• 实得数据为百分数的无差检验
1、将百分数转化为次数,然后确定期待次数, 2 求 值。
2 2、直接用百分数计算,然后将 百分数乘以
总次数N。
2 • 无差假设 检验的校正
当实得数据f0为次数形式,自由度df=1,且
期待次数fe<10时,需要校正。
2 ( f f ) e 2 0 fe
结果及解释:用χ2分布的概率解释,两变量不同分类间是否存在
显著差异或相关。即对于给定的显著性水平α,查自由度为(R-1) (C-1)的卡方分布,得临界值
2 ,如果 2 ,则说明两因素 2
相互关联;反之,两个因素之间相互独立。
2×2表的独立性检验
2 N ( ad bc ) 2 (a b)(c d )(a c)(b d )
独立性检验应用举例
• 例4:今随机抽取90人,按男女不同性别 分类,将学生成绩分为中等以上和中等 以下两类。结果如下表,问男女生在学 业水平上是否有关联?或男女生在学业 中等以上的比率差异是否显著?
第九章
χ2检验
2 一、χ 检验的基本概念
• 数据形式
属于非连续变量性质的计数量数。
• 基本原理
实得数据与期待数据相比
χ2检验的基本公式Biblioteka ( f0 fe ) fe
自由度: df (r 1)(c 1)
理论次数 : f
统计量 :
e
fr fc N
2 ( f f ) 2 0 e fe
• 实得数据为百分数的无差检验
1、将百分数转化为次数,然后确定期待次数, 2 求 值。
2 2、直接用百分数计算,然后将 百分数乘以
总次数N。
2 • 无差假设 检验的校正
当实得数据f0为次数形式,自由度df=1,且
期待次数fe<10时,需要校正。
2 ( f f ) e 2 0 fe
结果及解释:用χ2分布的概率解释,两变量不同分类间是否存在
显著差异或相关。即对于给定的显著性水平α,查自由度为(R-1) (C-1)的卡方分布,得临界值
2 ,如果 2 ,则说明两因素 2
相互关联;反之,两个因素之间相互独立。
2×2表的独立性检验
2 N ( ad bc ) 2 (a b)(c d )(a c)(b d )
独立性检验应用举例
• 例4:今随机抽取90人,按男女不同性别 分类,将学生成绩分为中等以上和中等 以下两类。结果如下表,问男女生在学 业水平上是否有关联?或男女生在学业 中等以上的比率差异是否显著?
第九章
χ2检验
2 一、χ 检验的基本概念
• 数据形式
属于非连续变量性质的计数量数。
• 基本原理
实得数据与期待数据相比
χ2检验的基本公式Biblioteka ( f0 fe ) fe
第9章 卡方检验

增加样本含量,这是最好的方法; 结合专业知识考虑是否可以将该格所在行或列与
别的行或列合并; 改用R ×C表的Fisher确切概率法,可以用计算
机软件实现。
第三节 配对设计资料的2检验
配对2×2列联表资料的2检验 配对R × R列联表资料的2检验
一、配对2×2列联表资料的2检验
3、确定P值,做出推断
=(2―1)×(4―1)=3 , 2 0.695 2 1.21 0.75 , 3
P>0.75,在 =0.05水平上不拒绝H0,所以尚不能
认为儿童急性白血病患者与成年人急性白血病患 者的血型分布不同。
(四)R×C列联表的分割
对于多个率或多个频率分布比较的2检验,结论
统计量 T 服从自由度为 k-1 的2分布。
例9-7 对150名冠心病患者用两种方法检查室壁收 缩运动的情况,检测结果见表9-11 。试分析两种方 法测定结果的概率分布是否相同。
表9-11 两种方法检查室壁收缩运动情况
甲法测定结
乙法测定结果
果
正常
减弱
异常
合计
正常
60
3
2
65
减弱
0
42
9
51
异常
8
表9-2 两种药物治疗消化道溃疡4周后疗效
处理
洛赛克 雷尼替丁
合计
愈合
64(57.84) 51(57.16)
115
未愈合
21(27.16) 33(26.84)
54
合计
85 84 169
愈合率 (%) 75.29 60.71 68.05
第二节 独立样本R×C列联表资料的2检验
比较三种不同治疗方法治疗慢性支气管炎的有效率 分析儿童急性白血病患者与成年人急性白血病患者
别的行或列合并; 改用R ×C表的Fisher确切概率法,可以用计算
机软件实现。
第三节 配对设计资料的2检验
配对2×2列联表资料的2检验 配对R × R列联表资料的2检验
一、配对2×2列联表资料的2检验
3、确定P值,做出推断
=(2―1)×(4―1)=3 , 2 0.695 2 1.21 0.75 , 3
P>0.75,在 =0.05水平上不拒绝H0,所以尚不能
认为儿童急性白血病患者与成年人急性白血病患 者的血型分布不同。
(四)R×C列联表的分割
对于多个率或多个频率分布比较的2检验,结论
统计量 T 服从自由度为 k-1 的2分布。
例9-7 对150名冠心病患者用两种方法检查室壁收 缩运动的情况,检测结果见表9-11 。试分析两种方 法测定结果的概率分布是否相同。
表9-11 两种方法检查室壁收缩运动情况
甲法测定结
乙法测定结果
果
正常
减弱
异常
合计
正常
60
3
2
65
减弱
0
42
9
51
异常
8
表9-2 两种药物治疗消化道溃疡4周后疗效
处理
洛赛克 雷尼替丁
合计
愈合
64(57.84) 51(57.16)
115
未愈合
21(27.16) 33(26.84)
54
合计
85 84 169
愈合率 (%) 75.29 60.71 68.05
第二节 独立样本R×C列联表资料的2检验
比较三种不同治疗方法治疗慢性支气管炎的有效率 分析儿童急性白血病患者与成年人急性白血病患者
卡方检验

第二节 完全随机设计两组频数分布2检验 一、二分类情形——2×2列联表
例9-2 某医师研究用兰芩口服液与银黄口服液治疗 慢性咽炎疗效有无差别,将病情相似的80名患者随 机分成两组,分别用两种药物治疗,结果见表。
表 9-2 慢性咽炎两种药物疗效资料 药物 兰芩口服液 银黄口服液 合计 疗效 有效 无效 合计
2
(A T ) T
2
(41 36.56) 2 (4 8.44) 2 (24 28.44) 2 (11 6.56) 2 6.565 36.56 8.44 28.44 6.56
自由度
=(2-1)(2-1)=1
(3)确定P值
查附表8, =1对应的临界值 , P<0.025。
(1)建立检验假设 H0:三种剂量镇痛有效的概率相同。 H1:不同剂量镇痛有效的概率不全相同。 检验水准=0.05 (2)按公式(9-8)计算2统计量
32 122 112 92 122 62 53( 1) 7.584 15 26 15 27 20 26 20 27 18 26 18 27
2
( A T 0.5)
2
例9-3 将病情相似的淋巴系肿瘤患者随机分成两
组,分别做单纯化疗与复合化疗,两组的缓解率见
表7-4,问两疗法的总体缓解率是否不同?
表 9-3 两种疗法缓解率的比较
疗效 合计 缓解率(%) 缓解 未缓解 单纯化疗 2 ( 4.8) 10 ( 7.2) 12(固定值) 16.7 复合化疗 14 (11.2) 14 (16.8) 28(固定值) 50.0 合计 16 24 40 40.0 组别
步骤
1.建立检验假设
第9章 .卡方检验 PPT课件

f (2)
e k 1 22
2 2
2
k 2
(
k
)
,(0
2
)
2
F ( 2 )
P( 2)
2
n 2
(
1 n
1)!
j
(2Biblioteka )(n 2
1)
2
e 2
d 2
2
2 -分布的形状
0.6 df 2
0.5
df 3
0.4
0.3
df 4
0.2
df 5
2
_
(n
1)S 2
2
, (因:
S
2
(x x)2 )
n 1
x1 x2 xn
zi
xi
, zi2
( xi )2 ,,
2
zi2
( xi )2
统计量 2的定义
_
以 x 估计
2
(n
1)S
2
2
2 2 -分布的概率密度函数和累积分布函数:
差异性检验,其作用与t-检验、F-检验 等相似。
9.2 2 -分布
2 -分布由Helmert(1875)发表,Karl
Pearson(1898)重新发现。
2 的定义:标准正态分布中那些相互独立
的随机变量的平方和。
n
N(, 2)
n
n
_
_
( x x)2
(x x)2
[1]理论比率模型检验(外因模型)
H 0 : Oi Ei
医学统计学-第九章计数资料的参数估计与卡方检验

率的标准误的计算公式:
p
(1-)
n
式中,δp 为率的标准误,π为总体率,n为样本含量
在实际工作中,由于总体率π很难知道,常用样本率P来代 替,故公式变为:
sp
Sp为率的标准误的估计值
p(1 p)
n
p为样本率
n为样本含量
方法: 1.查表法:当样本含量较小(如n≤50),特别是np或n(1-p)较小时,p呈偏态 分布, 可根据样本含量n和阳性数x,查相关统计学教材“百分率的可信区间” 表,求得总体率可信区间。 2.正态近似法:当样本含量足够大(如n﹥50),且样本率p或1-p均不太小, 如np和n(1-p)均≥5时,样本率的分布近似正态分布,可按下列公式计算 :
第二步:计算检验统计量
2 ( A T )2
T
式中: A 为实际频数(actual frequency)T 为理论频数(theoretical frequency)
第三步:确定 P 值,得出结论
x2=9.32
ν=(R-1)(C-1)=(2-1)(2-1) 由 2界值表查得 20.05,1 = 3.84 ,
组别 有效 无效 合计
H0成立下的有效率(%)
中药
T11
T12
160
西药
T21
T22
140
72.7% 72.7%
合计 218
82
300
72.7%
T11 =160 ×72.7%= 160×(218/300)=116.3 T12 =160 ×(1-72.7%)= 160×(82/300)=43.7 T21 =140 ×72.7%= 140×(218/300)=101.8 T22 =140×(1-72.7%)= 140×(82/300)=38.2
第九章卡方检验

2
R C
n i1 j1
A2 ij
ni m j
1
➢建立检验假设,确立检验水准:
❖ H0:儿童和成人急性白血病患者血型总体分布相同 ❖ H1:总体分布不同
❖ 检验水准=0.05
➢计算检验统计量
分组
A型 B型
O 型 AB 型
合计
儿童
30
38
32
12
1
ij
j1 nim j
❖ 持不校正的观点:连续性校正后P值有过分保 守之嫌
❖ 当结果矛盾时下结论要慎重.
第三节 独立样本R×C
列联资料的2检验
表9-5 独立样本R*C列联表
处理
属性
合计
1
2
┅
C
1
A11(T11) A12(T12) ┅ A1C(T1C) n1(固定值)
2
A21(T21) A22(T22) ┅ A2C(T2C) n2(固定值)
❖ H0:π1=π2=π3 三种治疗方法的疗效相同 ❖ H1:三种治疗方法的疗效不同或不全相同
❖ 检验水准=0.05
2
R C
n i1 j1
A2 ij
ni m j
1 =32.74
(3 1)(2 1) 2 P<0.005
……可以认为三种药物的疗效不同或不 全相同
多个样本率比较的2分割
当2检验结论为拒绝H0,只能说明各组总体
概率不全相同,即多组中至少两组的有效概 率不同,但并不是多组有效概率彼此之间均 不相同。因此需进行两两比较。本例有3个 处理组,共需要3种对比。 若检验水准还取 为0.05,将增大I型错误。 α’=α/3=0.017
R×C列联表检验时的注意事项
卫生统计学9——卡方检验

在上例中, 64 21 的数据是基本的,
51 33
其余数据都是由以上四个数据计算出来的。
这四个数叫实际频数,简称实际数
(actual freqency, A)
12
理论频数(theoretical freqency,T)
对于洛赛克组的64人,按照合并愈合率Pc=68.05%治疗 的话,理论上: 64×68.05%=57.84人愈合,用T11表示,
?
(1)先假设H0成立,按特定分布的规律(概率函数)
计算理论频数,进而计算 2值。
(2)若 2值小,可认为现有资料服从某一分布;
若 2值大,尚不能认为现有资料服从某一分布。
自由度=K-参数个数-1 K:组段数 参数个数:正态分布和二项分布有2个参数,poisson分布有1个
30
例9-1 对数据作正态分布拟合优度检验。120名 男孩身高的测量值, 均数=139.48cm;标准差=7.30cm
为v 。
2 u12 u22 u2
ui
Xi
5
2 分布的拓展与应用
卡方检验基本思想
2 分布的概念
1875年,F. Helmet得出:来自正态总体的样
本方差的分布服从 2分布;
1900年K. Pearson又从检验分布的拟合优度
(goodness of fit)中也发现了这一相同的 2 分
统计量2值。
33
计算统计量:
计算T I 时的参数有2 个(均数和标准差)
2
(A T )2 6.27
T
推断结论:自由度=10-1-2=7,查Leabharlann 表8,得到2 0.50,7
6.35
P>0.50,可以认为该样本服从正态分布。
51 33
其余数据都是由以上四个数据计算出来的。
这四个数叫实际频数,简称实际数
(actual freqency, A)
12
理论频数(theoretical freqency,T)
对于洛赛克组的64人,按照合并愈合率Pc=68.05%治疗 的话,理论上: 64×68.05%=57.84人愈合,用T11表示,
?
(1)先假设H0成立,按特定分布的规律(概率函数)
计算理论频数,进而计算 2值。
(2)若 2值小,可认为现有资料服从某一分布;
若 2值大,尚不能认为现有资料服从某一分布。
自由度=K-参数个数-1 K:组段数 参数个数:正态分布和二项分布有2个参数,poisson分布有1个
30
例9-1 对数据作正态分布拟合优度检验。120名 男孩身高的测量值, 均数=139.48cm;标准差=7.30cm
为v 。
2 u12 u22 u2
ui
Xi
5
2 分布的拓展与应用
卡方检验基本思想
2 分布的概念
1875年,F. Helmet得出:来自正态总体的样
本方差的分布服从 2分布;
1900年K. Pearson又从检验分布的拟合优度
(goodness of fit)中也发现了这一相同的 2 分
统计量2值。
33
计算统计量:
计算T I 时的参数有2 个(均数和标准差)
2
(A T )2 6.27
T
推断结论:自由度=10-1-2=7,查Leabharlann 表8,得到2 0.50,7
6.35
P>0.50,可以认为该样本服从正态分布。
教育统计学第九章 卡方检验-文档资料

3、列联相关
ห้องสมุดไป่ตู้
2 C N 2
关于配合度检验
一、它主要用于实际观察次数与某理论次数是否有差 别的分析。它适用于一个因素多项分类的计数资料。 二、配合度检验的一般问题:(1)统计假设:Ho:fo=fe H1: fo≠fe (2)应用基本公式计算χ2值,若计算的χ 2值大于表中 的χ 20.05或χ 20.01值,就拒绝Ho ,推论fo与fe之间 差异显著。若χ 2值小于χ 20.05或χ 20.01值 ,则接受 Ho ,认为fo与fe之间差异不显著。
2
( f0 fe ) (16 8) (24 34) (10 8) 11.44 fe 8 34 8
2 2 2
2
配合度检验的应用举例(四) ——检验假设分布的概率
某校长的经验:高中生升学的男女比例为2:1, 今年的升学情况是男生85人,女生35人,问今年 升学的男女生比例是否符合该校长的经验?
(3)自由度的确定:通常为资料的分类或分 组的数目,减去计算理论次数时所用统计量的个数。
关于连续性校正
当卡方检验用于计数资料时,所计算出的卡方值实际上是非连续性的, 尤其当自由度=1,理论次数小于5时,其离散性更明显,而卡方分布 本质上是连续性随机变量的分布形式,因此,当df=1,fe<5时,必须 对连续性进行修正。
0.4984
各组的 正态面 积(4) 0.0084 0.0238 0.0612 0.1214 0.1865 0.2090 0.1807 0.1205 0.0584 0.0221 0.0064 0.0016 1.0000
各组理 论频数 (fe) (5) 1.008 2.856 7.344 14.568 22.380 25.080 21.684 14.460 7.008 2.652 0.768 0.192 120.00
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Chi-square test Statistics Statistic Statistician Population rate Sample rate Pooled rate Sample size Sampling error Hypothesis testing 卡方检验 统计学 统计量 统计学家 总体率 样本率 合并率 样本含量 抽样误差 假设检验
chi-square test for 2×2 table
If , then reject H0。There is statistically significant difference between 2 sample rates. Or the difference between 2 sample rates is statistically significant. Otherwise, no reason to reject H0。 There is no statistically significant difference between 2 sample rates.
chi-square test for paired 2×2 table
For example 9-3,
(160 48 32 9) 2 249 2 91.95 192 57169 80
1
P 0.005
The outcomes of 2 methods are not independent of one another.Or there is association between the outcomes of 2 methods.
192 80 192 80 T ( A B ) np ( A B ) 249 249 249 249
chi-square test for paired 2×2 table
Chi-square statistic and degree of freedom are both same as those of section 1. However, the design and purpose of study as well as the explanation of results are still different.
chi-square test for paired 2×2 table
关联的方向:
ad-bc > 0: 正相关 ad-bc < 0: 负相关
关联的程度:
Pearson列联系数:
Cp 91.95 0.5193 249 91.95
Cramer列联系数(修正)
Cc 91.95 0.6077 249
4. Analysis of data
H0 :
1 2
H1 :
1 2
0.05
chi-square test for 2×2 table
To apply chi-square test, the sample size should be large enough. Experience: n≥40 and all T≥5 nR nC ( A T )2 2 TRC T n
Vocabulary of chapter 9
Association Independence Categorical variable Distribution Goodness of fit test General formula Specific formula Continuity correction Completely randomized design Paired design 关联 独立 分类变量 分布 拟合优度检验 基本公式 专用公式 连续性校正 完全随机设计 配对设计
chi-square test for paired 2×2 table
4. Analysis of data Purpose 1: testing for the difference between 2 methods. Which is better for high positive rate? Note: The 2 samples are not independent. The above chi-square test does not work.
chi-square test for 2×2 table
2. Collection of data 3. Sorting data: 2×2 table Success Failure Sample 1 a b Sample 2 c d Total a+c b+d
Total a+b c+d n
chi-square test for 2×2 table
练习题: 用两种方法检查已确诊的乳腺癌患者120 名,甲法检出率为60%,乙法检出率为 50%,甲乙两法一致的检出率为35%,问 两种方法检出率有无差别?两种方法有无 关联?
chi-square test for R×C table
R×C table: R numbers of rows C numbers of columns
0.05
Question: if H0 is true, how much is the expected frequency of each cell?
chi-square test for paired 2×2 table
概率乘法定理:互相独立事件同时出现的概率等 于各事件单独出现时概率的乘积。
Vocabulary of chapter 9
Null hypothesis Alternative hypothesis Significance level Table of critical value P value Fourfold table Actual (observed) frequency Theoretical (expected) frequency Row total Column total 无效假设(零假设) 备择假设 检验水准 界值表 P值 四格表 实际(观察)频数 理论(期望)频数 行合计 列合计
2 2 0.05,
chi-square test for 2×2 table
n≥40 but any 1≤T<5 Yates correction (continuity correction)
2
( A T 0.5) 2 T
n 2 ( ad bc ) n 2 2 (a b)( c d )( a c)( b d )
( R 1)(C 1)
(ad bc) n (a b)(c d )(a c)(b d )
2 2
chi-square test for 2×2 table
If H0 is true, A and T should be close each other and chi-square statistic will tend to be small. If H0 is not true, chi-square statistic will tend to be large.
chi-square test for paired 2×2 table
1. Design Paired design. Each food sample has to be detected by method A and method B. 2. Collection of data
chi-square test for paired 2×2 table
2 2
For example 9-3, b+c=32+9=41>40,
b c
2
2
1
bc
32 9
32 9
2
12.90
P 0.005
chi-square test for paired 2×2 table
Conclusion: reject H0. There is statistically significant difference in positive rates of 2 methods. Since pA (77.11%) > pB (67.87%), method A is better. This test is called McNemar’s test.
卫生统计学Health Statistics
第九章
检验(II)
2
chi-square test(II)
余红梅
Department of Health Statistics
School of Public Health, Shanxi Medical University
Vocabulary of chapter 9
3. Sorting data: paired 2×2 table
Outcomes of method A and method B Method A Method B Total + - + 160 (a) 32 (b) 192 (a+b) - 9 (c) 48 (d) 57 (c+d) Total 169 (a+c) 80 (b+d) 249 (n)
2 2
chi-square test for paired 2×2 table
If b+c<40, chi-square needs correction.
bc bc 0.5 0.5 b c 2 2 2 b c 1 2 bc bc bfor paired 2×2 table
chi-square test for 2×2 table
If , then reject H0。There is statistically significant difference between 2 sample rates. Or the difference between 2 sample rates is statistically significant. Otherwise, no reason to reject H0。 There is no statistically significant difference between 2 sample rates.
chi-square test for paired 2×2 table
For example 9-3,
(160 48 32 9) 2 249 2 91.95 192 57169 80
1
P 0.005
The outcomes of 2 methods are not independent of one another.Or there is association between the outcomes of 2 methods.
192 80 192 80 T ( A B ) np ( A B ) 249 249 249 249
chi-square test for paired 2×2 table
Chi-square statistic and degree of freedom are both same as those of section 1. However, the design and purpose of study as well as the explanation of results are still different.
chi-square test for paired 2×2 table
关联的方向:
ad-bc > 0: 正相关 ad-bc < 0: 负相关
关联的程度:
Pearson列联系数:
Cp 91.95 0.5193 249 91.95
Cramer列联系数(修正)
Cc 91.95 0.6077 249
4. Analysis of data
H0 :
1 2
H1 :
1 2
0.05
chi-square test for 2×2 table
To apply chi-square test, the sample size should be large enough. Experience: n≥40 and all T≥5 nR nC ( A T )2 2 TRC T n
Vocabulary of chapter 9
Association Independence Categorical variable Distribution Goodness of fit test General formula Specific formula Continuity correction Completely randomized design Paired design 关联 独立 分类变量 分布 拟合优度检验 基本公式 专用公式 连续性校正 完全随机设计 配对设计
chi-square test for paired 2×2 table
4. Analysis of data Purpose 1: testing for the difference between 2 methods. Which is better for high positive rate? Note: The 2 samples are not independent. The above chi-square test does not work.
chi-square test for 2×2 table
2. Collection of data 3. Sorting data: 2×2 table Success Failure Sample 1 a b Sample 2 c d Total a+c b+d
Total a+b c+d n
chi-square test for 2×2 table
练习题: 用两种方法检查已确诊的乳腺癌患者120 名,甲法检出率为60%,乙法检出率为 50%,甲乙两法一致的检出率为35%,问 两种方法检出率有无差别?两种方法有无 关联?
chi-square test for R×C table
R×C table: R numbers of rows C numbers of columns
0.05
Question: if H0 is true, how much is the expected frequency of each cell?
chi-square test for paired 2×2 table
概率乘法定理:互相独立事件同时出现的概率等 于各事件单独出现时概率的乘积。
Vocabulary of chapter 9
Null hypothesis Alternative hypothesis Significance level Table of critical value P value Fourfold table Actual (observed) frequency Theoretical (expected) frequency Row total Column total 无效假设(零假设) 备择假设 检验水准 界值表 P值 四格表 实际(观察)频数 理论(期望)频数 行合计 列合计
2 2 0.05,
chi-square test for 2×2 table
n≥40 but any 1≤T<5 Yates correction (continuity correction)
2
( A T 0.5) 2 T
n 2 ( ad bc ) n 2 2 (a b)( c d )( a c)( b d )
( R 1)(C 1)
(ad bc) n (a b)(c d )(a c)(b d )
2 2
chi-square test for 2×2 table
If H0 is true, A and T should be close each other and chi-square statistic will tend to be small. If H0 is not true, chi-square statistic will tend to be large.
chi-square test for paired 2×2 table
1. Design Paired design. Each food sample has to be detected by method A and method B. 2. Collection of data
chi-square test for paired 2×2 table
2 2
For example 9-3, b+c=32+9=41>40,
b c
2
2
1
bc
32 9
32 9
2
12.90
P 0.005
chi-square test for paired 2×2 table
Conclusion: reject H0. There is statistically significant difference in positive rates of 2 methods. Since pA (77.11%) > pB (67.87%), method A is better. This test is called McNemar’s test.
卫生统计学Health Statistics
第九章
检验(II)
2
chi-square test(II)
余红梅
Department of Health Statistics
School of Public Health, Shanxi Medical University
Vocabulary of chapter 9
3. Sorting data: paired 2×2 table
Outcomes of method A and method B Method A Method B Total + - + 160 (a) 32 (b) 192 (a+b) - 9 (c) 48 (d) 57 (c+d) Total 169 (a+c) 80 (b+d) 249 (n)
2 2
chi-square test for paired 2×2 table
If b+c<40, chi-square needs correction.
bc bc 0.5 0.5 b c 2 2 2 b c 1 2 bc bc bfor paired 2×2 table