卫生统计学卡方检验课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卫生统计学卡方检验
1
第一节 完全随机设计(独立样本)列联表资
料的 2 检验
在抽样研究中,由于个体间存在变异,必然存在着抽
样误差,率(或构成比)的抽样误差与均数的抽样误差
概念相同。
2/19/2021
卫生统计学卡方检验
2
例1 将病情相似的169名消化道溃疡患者随机分成两组, 分别用奥美拉唑与雷尼替丁两种药物治疗,4周后评价 其疗效,结果见表1。问两药治疗消化道溃疡的愈合率 有无差别?
卫生统计学卡方检验
8
TRC
nR nC n
n R 为相应行的合计
n C 为相应列的合计
n 为总例数。
2/19/2021
卫生统计学卡方检验
9
表1 两药治疗消化道溃疡4周后疗效
2/19/2021
卫生统计学卡方检验
10
2 检验的基本公式:
2 (AT)2
T
2/19/2021
从基本公式可以看出, 2 统计量值反映了实际频数和理 论频数的吻合程度。如果假设检验H0 (π1=π2)成立,则 实际频数和理论频数之差一 般不会相差太大, 2值相 应也不会太大; 反之,实际频数和理论频数之差相差 很大卫,生则统计 学2 值卡相方检应验也会很大,11 相应的P值也就越小,
卡方检验是英国统计学家K. Pearson于1900年提出的 ,以卡方分布和拟合优度为理论依据,一种用途较广 的假设检验方法。常用于检验完全随机设计下两个或 多个样本率(或构成比)之间有无差别,也可用于检验 配对设计下两组频数分布差异,或者线性趋势卡方检 验,推断两变量间有无相关2关/1系9/2等021。
2/19/2021
卫生统计学卡方检验
3
表1 两药治疗消化道溃疡4周后疗效
两组的愈合率不同有两种可能:
1. 两药的总体愈合率无差别,两样本率的差别仅由抽 样误差所致。
2. 两种药物的总体愈合率确有不同。
2/19/2021
卫生统计学卡方检验
4
一、卡方检验的基本思想
表1中,64、21、51、33 是整个表的基本数据,其余
① 建立假设 H0: π1=π2 H1 : π1≠π2
② 确定检验水准 α=0.05
③ 计算统计量 2 值
2/19/2021
卫生统计学卡方检验
15
2 (AT)2
T (6 4 5 7 .8 4 )2 (2 1 2 7 .1 6 )2 (5 1 5 7 .1 6 ) 2 (3 3 2 6 .8 4 ) 2 4 .1 3
当P≤,则有理由认为无效假设不成立,继而拒绝H0
,作出统计推断。
由 2 统计量的公式(11.2)可以看出, ( A T )2 0 ,格
T
子数越多,非负数之和,则卡方值越大,即卡方值的 大小除了与A与T的差别大小有关外,还与格子数量 有关。因而考虑卡方值大小的同时,应同时考虑格子 数的多少。引入自由度v。
疡的愈合率有差别,其中奥美拉唑的愈合率比雷 尼替丁愈合率高。
卫生统计学卡方检验
16
(二) 四格表的专用公式
2
(ad-bc)2n
(ab)(cd)(ac)(b2d/1)9/2021
a、b、c、d 分别为四格表中的四个实际频数,n为总
例数。 本例:
2(6433-2151)216卫9生 统4 计.1 学3 卡方检验 858411554
2/19/2021
卫生统计学卡方检验
7
若H0成立,则理论上:
奥美拉唑组愈合人数:
115
T11
85 57.84 169
奥美拉唑组未愈合人数:
T12
8554 27.16 169
雷尼替丁组愈合人数:
T21
8411557.16 2/19/2012619
T nRnC n
雷尼替丁组未愈合人数:
T22
8454 26.84 169
2/19/2021
卫生统计学卡方检验
13
时, 2 分布逼近正态分布。各种自由度的 2分布右侧尾
部面积为时的临界值记为
2 a ,v
,列于附表8。
2/19/2021
卫生统计学卡方检验
14
二、2×2列联表资料的 2 检验。 (一) 2×2列联表资料 2 检验的步骤
现以例1说明2×2列联表资料 2 检验的步骤
5 7 .8 4 2 7 .1 6 5 7 .1 6 2 6 .8 4
④ 确定P值
自由度=(行数-1)(列数-1)=(2-1)(2-1)=1,
查 2 界值表得P<0.05。 2/19/2021
⑤ 下结论
因为P<0.05,按α=0.05的水准,拒绝H0,接受H1, 差异有统计学意义。即可认为两药治疗消化 道溃
17
(三) 四格表 2 统计量的连续性校正
1. 当n≥40,且T≥5时,不须校正,直接用基本公式 (8-2)或专用公式(8-3)计算。
2. 任一格子的1≤T<5,源自文库n≥24/01时9/2,021需计算校正 2 值,
v k 1 s (R 1 )(C 1 )
式中,k为格子数,s为估计的参数个数,R为行数, C为列数。
如本例中,4个格子,估计甲乙两药的有效率,则k=4, s=2,v=4-1-2=(2-1)(2-1)=1。
2/19/2021
卫生统计学卡方检验
12
2 分布是一种连续型随机变量的概率分布。
如果Z服从标准正态分布,那么Z2服从自由度为1的 2
数据都是从这四个基本数据相加而得的,这种资料是两 组两分类资料,称为四格表(fourfold table),亦称2×2 表(2×2 table)。
2/19/2021
卫生统计学卡方检验
5
表 两独立样本率比较的四格表
2/19/2021
卫生统计学卡方检验
6
无效假设H0为 π1=π2,即两种药物治疗消化道溃疡的愈 合率相同,两样本的愈合率的差别仅有抽样误差所致。 由于此时总体情况未知,故用样本合计愈合率对总体愈 合率进行估计,即H0为π1=π2=68.05%,在此基础上, 可以推算每个格子的期望频数,称为理论频数(actual frequency),用符号T表示;从样本观察到的频数称为 实际频数(theoretical frequency),用符号A表示。
分布,其概率密度在(0,+∞)区间上表现为L型,取较 小值的可能性较大,取较大值的可能性较小。
设有v 个相互独立的标准正态分布随机变量Z1, Z2, Zv
, Z12Z22Zv2
2
则
2 v
的分布称为自由度为v的 分布,
记 2为 。
分布的形状依赖于自由度v的大小,当自由度v>1时
,随着v的增加,曲线逐渐趋于对称,当自由度v趋于∞