卫生统计学卡方检验课件
合集下载
卫生统计学-第九章 卡方检验
11
2检验的基本思想
• 如果H0成立,则男女生感染率的差异仅是抽样误
差引起的,相差不会太大,由此而计算出来的T与 A也不会相差很大,即2值不会相差很大
• 如果两样本率相差过大,即T与A相差较大,2值
也会相差较大,相应的P值也就越小。
• 因此,由实际样本资料求得一个较小的P,而且
P≤,就有理由怀疑H0的真实性,因而拒绝H0,
18.55
66.45
(3)确定自由度和P值
四格表的自由度=1,卡方界值为3.84 卡方值>卡方界值,所以 P<0.05
(4)作出推断性的结论
按α =0.05水准,拒绝H0,接受H1,可认为该小学男女生 蛔虫感染率不同,男生的感染率高于女生.
18
四格表除了可用基本公式外,更多用四格表专用公 式计算卡方值.
假设四格的数字分别为a,b,c,d,如图,
则用下式来计算卡方值:
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
23 57 a 13 72
此式不必计算理论数,比较方便,结果也更为准确.
19
某小学男女生蛔虫感染率的比较
• 实际工作常用于检验两个或多个样本率及构成比
之间差别有无统计学意义,两种属性或特征之间 是否有关系以及拟合优度检验等。
5资料的2检验 • RC表的2检验 • 配对四格表的2检验 • 精确概率法
6
§1 2检验的基本思想
例:某小学男女生蛔虫的感染率如下表,试判断男女 蛔虫感染率是否有差别?
从而作出接受H1的统计推断;如果P>,则没有
理由拒绝H0。
12
性别 男 女 合计
虫卵阳性人数 阴性人数 合计 感染率(%)
第九讲 卫生统计学 卡方检验
结果与前相同。
例9-2:将病情相似的169名消化道溃疡患者随机分成两组, 分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见表92。问某两种药物治疗消化道溃疡的疗效有无差别?
表9-2 两种药物治疗消化道溃疡4周后疗效 疗 愈合 64 (57.84) 115 效 未愈合 21(27.16) 33 (26.84) 54
五年级
合计
5(2.33)
7
9(11.69)
35
14
42
35.71
16.67
(1)建立假设,确定检验水准 H0:π1=π2 H1:π1≠π2 α=0.05
(2)计算检验χχ2值 本例n=42,最小的理论数为:T21=(14×7)/42=2.33, 故对2 值作校正。
2
(3)确定P值
( 2 9 26 5 42 / 2) 2 42 7 35 28 14
2
(64 33 21 51) 2 169 2 4.13 85 84 115 54
(3)确定p值:
=(2-1)(2-1)=1,查2界值表得2 0.05(1) =3.84,因2 >3.84 , 故P<0.05。
(4)判断结果 在α=0.05水准上,因P<0.05,所以拒绝H0,接受H1, 说明两药疗效的差别具有统计学意义。
图9-1, 2分布的形状依赖于自由度υ的 大小,当自由度υ>2时,随着υ的增加,曲 线逐渐趋于对称,当自由度υ趋于∞时,2分 布逼近正态分布。各种自由度的2分布右侧尾 2 , 部面积为α时的临界值记为 列于附表8。
第二节
四格表资料的2检验
例9-1:用某中药预防流感,获得如下资料,问用药者 流感发病率是否不同于不用药者?
1、建立假设,确定检验水准 H0: b=c(两种检验方法的阳性概率相等) H1: b≠c(两种检验方法的阳性概率不相等)
例9-2:将病情相似的169名消化道溃疡患者随机分成两组, 分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见表92。问某两种药物治疗消化道溃疡的疗效有无差别?
表9-2 两种药物治疗消化道溃疡4周后疗效 疗 愈合 64 (57.84) 115 效 未愈合 21(27.16) 33 (26.84) 54
五年级
合计
5(2.33)
7
9(11.69)
35
14
42
35.71
16.67
(1)建立假设,确定检验水准 H0:π1=π2 H1:π1≠π2 α=0.05
(2)计算检验χχ2值 本例n=42,最小的理论数为:T21=(14×7)/42=2.33, 故对2 值作校正。
2
(3)确定P值
( 2 9 26 5 42 / 2) 2 42 7 35 28 14
2
(64 33 21 51) 2 169 2 4.13 85 84 115 54
(3)确定p值:
=(2-1)(2-1)=1,查2界值表得2 0.05(1) =3.84,因2 >3.84 , 故P<0.05。
(4)判断结果 在α=0.05水准上,因P<0.05,所以拒绝H0,接受H1, 说明两药疗效的差别具有统计学意义。
图9-1, 2分布的形状依赖于自由度υ的 大小,当自由度υ>2时,随着υ的增加,曲 线逐渐趋于对称,当自由度υ趋于∞时,2分 布逼近正态分布。各种自由度的2分布右侧尾 2 , 部面积为α时的临界值记为 列于附表8。
第二节
四格表资料的2检验
例9-1:用某中药预防流感,获得如下资料,问用药者 流感发病率是否不同于不用药者?
1、建立假设,确定检验水准 H0: b=c(两种检验方法的阳性概率相等) H1: b≠c(两种检验方法的阳性概率不相等)
第八章卡方检验ppt课件
2 (A T )2
T
2
(ad bc)2 n
(a b)(c d)(a c)(b d)
当n ≥40 ,且某格子出现1≤ T<5时,用校正公式:
2 ( A T 0.5)2 T
( ad bc n)2 n
2
2
(a b)(c d )(a c)(b d )
如果样本例数不是很大,计算时应先估计表中最小的T值。
17
设有k个相互独立的标准正态分布随机变量Z1、Z2…..Zν ,则Z12+Z22+…+Zν2的分 布服从自由度为ν的x2分布,记为x2(v)。 ν是指上式中包含的独立变量的个数。
当ν趋于∞时, x2分布逼近正态分布。各种自由度的x2分布右侧尾部面积为α时 的临界值记为x2(α,v)
=1 =2
=3 =4
组对象其它方面“同质”的前提下才能比较两个频率,才能进行2×2列联表 的x2检验。
26
小结
1、2检验的基本思想
2、四格表资料2检验,通常规定: (1) n ≥ 40,且T ≥ 5时,用2 检验基本公式和专用公式 (2) n ≥ 40,但有1≤ T<5时,用四格表2检验校正公式 (3) n< 40,或T<1时,改用fisher确切概率法 (4)连续性校正仅用于ν=1的四格表资料。
表 8-6 儿童急性白血病患者与成年人急性白血病患者的血型分布
分组 A 型 B 型 O 型 AB 型
合计
儿童 30 38 32 12
112
成人
19 30 19
9
77
合计 49 68 51 21
2 0.005,2
10.60
32.74 2
2
• 认为因三而种P<药0物.0的05治,在疗α效=0果.05不水全准相上同拒。绝H0.00,05接,2受H1,差别有统计学意义。可以
医学统计方法之卡方检验PPT课件
3、查界值表,确定P值,做出推断结论
查χ2界值表,υ=6,χ20.05(6)=12.59, χ2 > χ20.05(1) ,则 P<0.05,在α=0.05的水准下,拒绝H0,认为三个不同地区 的人群血型分布总体构成比有差别。
.
38
二、多个样本率间多重比较
行×列表χ2检验的结果说明差异有统计学意义,需作两 两比较时,先调整α值,再进行率的两两比较。
配对检验公式推导:
bc
(+,)和(,+)两个格子中的理论频数均为
2
b c 40时
2
(AT)2(b b c )2 2(c b c)22
T
bc
bc
2
2
(b c)2
bc
~ 2 分布
同理可得b c 40时
1
校正公式: 2 (| A T | 0.5)2 (| b c | 1)2
表8-5 两种培养基的培养结果
B培养基
A培养基
+
-
合计
+
48
24
72
-
20
106
126
合计
68
130
198
A 培养基 B培养基
痰标本 1 2 3 4 5 6 7 8 9 10 11 12 13 14
结果统计
A培养基 + + + + + + + + + + -
B培养基 + + + + + + + -
合计
145 109 254 57.09
1.建立检验假设并确定检验水准
第九章 卡方检验 PPT课件
地区 城市
避孕方法 节育器 服避孕药 避孕套
153
33
165
农村 320
75
43
合计 473
108
208
其他 40 18 58
合计 431 518 949
2021/2/23
第七章 χ2检验χ2检验
27
(二)多分类情形— 2 × C列联表
2 × C列联表χ2检验的基本思想
2 × C列联表χ2检验公式
2
adbc
n22
n
abcdacbd
2021/2/23
第七章 χ2检验χ2检验
20
▪完全随机设计四格表资料χ2检验适用条件
当n≥40且Tmin ≥ 5时,χ2检验基本公式或四格表专用公式;
2 A TT2
2abc a d d b a c 2c nbd
当n≥40,1≤Tmin<5时,需对χ2值进行校正;
2021/2/23
第七章 χ2检验χ2检验
3
一、χ2分布和拟合优度检验
χ2分布(chi square distribution ) χ2分布的特征 χ2分布的图形形状取决于自由度ν χ2界值表
▪ 不同自由度ν下右侧尾部面积(概率)为α时临界值,
记为χ2 α,(ν)
▪ χ2界值表的特点 ▪ χ2界值表的作用
第九章 卡方检验 PPT课件
第九章 χ2检验
χ2检验(chi square test) 常用于分类变量资料的统计推断
χ2检验是以χ2分布和拟合优度检验为理论依 据的
2021/2/23
第七章 χ2检验χ2检验
2
第九章 χ2检验
χ2检验的用途
单个频数分布的拟合优度检验 完全随机设计两组或多组频数分布χ2检验 配对设计两组频数分布χ2检验 推断两个变量或特征之间有无关联性
医学统计学第版卡方检验课件
Φ(X1) (3) 0.00069 0.00466 0.02275 0.08076 0.21186 0.42074 0.65542 0.84134 0.94520 0.98610 —
Φ(X2) (4) 0.00466 0.02275 0.08076 0.21186 0.42074 0.65542 0.84134 0.94520 0.98610 0.99744 —
阴性 39 104 143
合计 72 114 186
阳性率(%) 45.8 8.8 23.1
处理组 发生数 未发生数 合计
甲
a
b
a+b
乙
c
d
c+d
合计
a+c
b+d
n
四格表医资学统料计学的第版基卡方本检验形式
23
二、 χ2 检验的基本思想
分组 肺癌组 对照组
合计
例 8.1 CEA 对两组人群的诊断结果
45356515
医学统计学第版卡方检验
30
• 当n≥40时,如果有某个格子出现1≤T<5,一般需
x2 统计量的含义
TRC
对应P 值
(R 1 )C ( 1 )
各种情形下,理论频数与实际频数偏离的总和即为χ2值(chi-
square value),它服从自由医度学统为计学ν第的版卡χ方2检分验 布。
24
一、二分类情形——2×2列联表
例7-2 某医师研究用兰芩口服液与银黄口服液治疗 慢性咽炎疗效有无差别,将病情相似的80名患者 随机分成两组,分别用两种药物治疗,结果见表 7-2。
28
( 4 3 1 .5 6 ) 2 6 ( 4 8 .4 ) 2 4 ( 2 2 4 .4 8 ) 2 4 ( 1 6 1 .5 ) 2 6 6 .565 3 .5 66 8 .44 2 .4 84 6 .56
第10章--卡方检验-(Chi-PPT课件
备择假设:两变量之间有关联或差异显著,一般用文 字叙述,不用统计符号。
例题:某学校对学生的课外活动内容进行调查,结果 整理成下表:
-
18
应用举例一
女性 男性 总和
自我知觉
总和
过轻
过重
419
1995
2414
(786.78)(1627.22)
959
855
1814
(591.22)(1222.78)
1378
1995 1938.67
56.33 3173.41
1.37
5816 5816
0
2297.1 3
df=3-1=2 查表,0.05水平上临界值为5.99,故……
df=3-1=2 查表, 0.01水平上临界值为9.21
-
15
三、卡方独立性检验
(一)适用材料 主要用于两个或两个以上因素多项分类的计数资料
分析。如果要研究的两个自变量之间是否具有独 立性或有无关联或有无“交互作用”的存在,就 要应用卡方独立性检验。 如果两个子变量是独立的,无关联的,就意味着对 其中一个自变量来说,另一个自变量的多项分类 次数上的变化是在取样误差的范围之内。假如两 个因素是非独立,则称两变量有交互作用。
第十二章 非参数检验
-
1
一、参数与非参数检验
参数检验 用于等比/等距型数据 参数检验的前提:正态分布和方差同质
非参数检验 不用对参数进行假设 对分布较少有要求,也叫distributionfree tests 用于名义/顺序型数据
-
2
参数统计和非参数统计优缺点
• 参数统计 优点:
对资料的分析利用充分 统计分析的效率高
于等与临界值才显著),使用9或3均可 • 接受虚无假设
例题:某学校对学生的课外活动内容进行调查,结果 整理成下表:
-
18
应用举例一
女性 男性 总和
自我知觉
总和
过轻
过重
419
1995
2414
(786.78)(1627.22)
959
855
1814
(591.22)(1222.78)
1378
1995 1938.67
56.33 3173.41
1.37
5816 5816
0
2297.1 3
df=3-1=2 查表,0.05水平上临界值为5.99,故……
df=3-1=2 查表, 0.01水平上临界值为9.21
-
15
三、卡方独立性检验
(一)适用材料 主要用于两个或两个以上因素多项分类的计数资料
分析。如果要研究的两个自变量之间是否具有独 立性或有无关联或有无“交互作用”的存在,就 要应用卡方独立性检验。 如果两个子变量是独立的,无关联的,就意味着对 其中一个自变量来说,另一个自变量的多项分类 次数上的变化是在取样误差的范围之内。假如两 个因素是非独立,则称两变量有交互作用。
第十二章 非参数检验
-
1
一、参数与非参数检验
参数检验 用于等比/等距型数据 参数检验的前提:正态分布和方差同质
非参数检验 不用对参数进行假设 对分布较少有要求,也叫distributionfree tests 用于名义/顺序型数据
-
2
参数统计和非参数统计优缺点
• 参数统计 优点:
对资料的分析利用充分 统计分析的效率高
于等与临界值才显著),使用9或3均可 • 接受虚无假设
医学统计学(6) 卡方检验145页PPT
37、我们唯一不会改正的缺点是软弱。——拉罗什福科
xiexie! 38、我这个人走得很慢,但是我从不后退。——亚伯拉罕·林肯
39、勿问成功的秘诀为何,且尽全力做你应该做的事吧。——美华纳
40、学而不思则罔,思而不学则殆。——孔子
医学统计学(6) 卡方检验
16、自己选择的路、跪着也要把它走 完。 17、一般情况下)不想三年以后的事, 只想现 在的事 。现在 有成就 ,以后 才能更 辉煌。
18、敢于向黑暗宣战的人,心里必须 充满光 明。 19、学习的关键--重复。
20、懦弱的人只会裹足不前,莽撞的 人只能 引为烧 身,只 有真正 勇敢的 人才能 所自己知道紧在哪里。——西班牙
医学统计学卡方检验 PPT
药物 甲药 乙药 合计
有效
无效
合计
有效率(%)
52(57.18)a 19(13.82)b 39(33.82)c 3(8.18)d
71 (a+b) 42 (c+d)
73.24 92.86
91(a+c)
22(b+d) 113(n=a+b+c+d)
80.53
⑴设H0 :π1=π2 ,即两药有效率相同;H1 : π1≠π2 α=0.05
165609
⑶
2 0.0,5 2
5.9
92
,则P<0.05,拒绝H0
,接受H1
,
故可认为甲、乙、丙三家医院院内感染率总体有差别。
多个样本率间多重比较
进行多个样本率比较时,如果拒绝H0 ,多个样本 率间差异有统计学意义,表明至少有某两个率之间 有差异。为了获得哪两个率之间有差异,需要进行 多个率的两两比较。
2 ( A TT) 2, ( 行-1 数 )列 ( -1 数 )
χ2值反映了实际频数与理论频数的吻合程度。 • 若假设成立,实际频数与理论频数的差值较小, χ2值
也较小; • 若假设不成立,实际频数与理论频数的差值较大, χ2
值也较大。
χ2检验的自由度
χ2值的大小取决于 (A T )2 的个数多少,即自由度的
一致:a(+)和 d(-);不一致:b(甲+,乙-) 和 c(甲-,乙+)。
概述
配对四格表资料的χ2检验,又称为McNemar test检验。
(b c) 4, 02 (bbcc)2 , 1
(b c)<4, 0 2
(b c 1)2 b c
,
1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2/19/2021
卫生统计学卡方检验
7
若H0成立,则理论上:
奥美拉唑组愈合人数:
115
T11
85 57.84 169
奥美拉唑组未愈合人数:
T12
8554 27.16 169
雷尼替丁组愈合人数:
T21
8411557.16 2/19/2012619
T nRnC n
雷尼替丁组未愈合人数:
T22
8454 26.84 169
2/19/2021
卫生统计学卡方检验
3
表1 两药治疗消化道溃疡4周后疗效
两组的愈合率不同有两种可能:
1. 两药的总体愈合率无差别,两样本率的差别仅由抽 样误差所致。
2. 两种药物的总体愈合率确有不同。
2/19/2021
卫生统计学卡方检验
4
一、卡方检验的基本思想
表1中,64、21、51、33 是整个表的基本数据,其余
卫生统计学卡方检验
8
TRC
nR nC n
n R 为相应行的合计
n C 为相应列的合计
n 为总例数。
2/19/2021
卫生统计学卡方检验
9
表1 两药治疗消化道溃疡4周后疗效
2/19/2021
卫生统计学卡方检验
10
2 检验的基本公式:
2 (AT)2
T
2/19/2021
从基本公式可以看出, 2 统计量值反映了实际频数和理 论频数的吻合程度。如果假设检验H0 (π1=π2)成立,则 实际频数和理论频数之差一 般不会相差太大, 2值相 应也不会太大; 反之,实际频数和理论频数之差相差 很大卫,生则统计 学2 值卡相方检应验也会很大,11 相应的P值也就越小,
疡的愈合率有差别,其中奥美拉唑的愈合率比雷 尼替丁愈合率高。
卫生统计学卡方检验
16
(二) 四格表的专用公式
2
(ad-bc)2n
(ab)(cd)(ac)(b2d/1)9/2021
a、b、c、d 分别为四格表中的四个实际频数,n为总
例数。 本例:
2(6433-2151)216卫9生 统4 计.1 学3 卡方检验 858411554
v k 1 s (R 1 )(C 1 )
式中,k为格子数,s为估计的参数个数,R为行数, C为列数。
如本例中,4个格子,估计甲乙两药的有效率,则k=4, s=2,v=4-1-2=(2-1)(2-1)=1。
2/19/2021
卫生统计学卡方检验
12
2 分布是一种连续型随机变量的概率分布。
如果Z服从标准正态分布,那么Z2服从自由度为1的 2
数据都是从这四个基本数据相加而得的,这种资料是两 组两分类资料,称为四格表(fourfold table),亦称2×2 表(2×2 table)。
2/19/2021
卫生统计学卡方检验
5
表 两独立样本率比较的四格表
2/19/2021
卫生统计学卡方检验
6
无效假设H0为 π1=π2,即两种药物治疗消化道溃疡的愈 合率相同,两样本的愈合率的差别仅有抽样误差所致。 由于此时总体情况未知,故用样本合计愈合率对总体愈 合率进行估计,即H0为π1=π2=68.05%,在此基础上, 可以推算每个格子的期望频数,称为理论频数(actual frequency),用符号T表示;从样本观察到的频数称为 实际频数(theoretical frequency),用符号A表示。
5 7 .8 4 2 7 .1 6 5 7 .1 6 2 6 .8 4
④ 确定P值
自由度=(行数-1)(列数-1)=(2-1)(2-1)=1,
查 2 界值表得P<0.05。 2/19/2021
⑤ 下结论
因为P<0.05,按α=0.05的水准,拒绝H0,接受H1, 差异有统计学意义。即可认为两药治疗消化 道溃
卡方检验是英国统计学家K. Pearson于1900年提出的 ,以卡方分布和拟合优度为理论依据,一种用途较广 的假设检验方法。常用于检验完全随机设计下两个或 多个样本率(或构成比)之间有无差别,也可用于检验 配对设计下两组频数分布差异,或者线性趋势卡方检 验,推断两变量间有无相关2关/1系9/2等021。
① 建立假设 H0: π1=π2 H1 : π1≠π2
② 确定检验水准 α=0.05
③ 计算统计量 2 值
2/19/2021
卫生统计学卡方检验
15
2 (AT)2
T (6 4 5 7 .8 4 )2 (2 1 2 7 .1 6 )2 (5 1 5 7 .1 6 ) 2 (3 3 2 6 .8 4 ) 2 4 .1 3
分布,其概率密度在(0,+∞)区间上表现为L型,取较 小值的可能性较大,取较大值的可能性较小。
设有v 个相互独立的标准正态分布随机变量Z1, Z2, Zv
ቤተ መጻሕፍቲ ባይዱ
, Z12Z22Zv2
2
则
2 v
的分布称为自由度为v的 分布,
记 2为 。
分布的形状依赖于自由度v的大小,当自由度v>1时
,随着v的增加,曲线逐渐趋于对称,当自由度v趋于∞
当P≤,则有理由认为无效假设不成立,继而拒绝H0
,作出统计推断。
由 2 统计量的公式(11.2)可以看出, ( A T )2 0 ,格
T
子数越多,非负数之和,则卡方值越大,即卡方值的 大小除了与A与T的差别大小有关外,还与格子数量 有关。因而考虑卡方值大小的同时,应同时考虑格子 数的多少。引入自由度v。
17
(三) 四格表 2 统计量的连续性校正
1. 当n≥40,且T≥5时,不须校正,直接用基本公式 (8-2)或专用公式(8-3)计算。
2. 任一格子的1≤T<5,且n≥24/01时9/2,021需计算校正 2 值,
2/19/2021
卫生统计学卡方检验
13
时, 2 分布逼近正态分布。各种自由度的 2分布右侧尾
部面积为时的临界值记为
2 a ,v
,列于附表8。
2/19/2021
卫生统计学卡方检验
14
二、2×2列联表资料的 2 检验。 (一) 2×2列联表资料 2 检验的步骤
现以例1说明2×2列联表资料 2 检验的步骤
卫生统计学卡方检验
1
第一节 完全随机设计(独立样本)列联表资
料的 2 检验
在抽样研究中,由于个体间存在变异,必然存在着抽
样误差,率(或构成比)的抽样误差与均数的抽样误差
概念相同。
2/19/2021
卫生统计学卡方检验
2
例1 将病情相似的169名消化道溃疡患者随机分成两组, 分别用奥美拉唑与雷尼替丁两种药物治疗,4周后评价 其疗效,结果见表1。问两药治疗消化道溃疡的愈合率 有无差别?