卫生统计学 卡方检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

当P≤,则有理由认为无效假设不成立,继而拒绝H0,
作出统计推断。


2
子数越多,非负数之和,则卡方值越大,即卡方值的
( A T )2 0 ,格 统计量的公式(11.2)可以看出, T
大小除了与A与T的差别大小有关外,还与格子数量
有关。因而考虑卡方值大小的同时,应同时考虑格子 数的多少。引入自由度v。
2 ③ 计算统计量 值
2
( 26 2 - 7 36 - 71 / 2)2 71 33 38 62 9
2.75
④ 确定P值
2 υ=(2-1) (2-1)=1,查 界值表得P>0.05。
⑤ 下结论
因为P>0.05,按α=0.05的水准,不拒绝H0,差 异无统计学意义。尚不能认为甲、乙两疗法对小 儿单纯性消化不良的治愈率不等。
2
1. 当n≥40,且T≥5时,不须校正,直接用基本公式 (8-2)或专用公式(8-3)计算。 2. 任一格子的1≤T<5,且n≥40时,需计算校正 值,
2
或使用四格表的确切概率法。
2
2
( A T 0.5)2 T
2
( ad - bc - n / 2) n (a b)(c d)(a c)(b d)
2 (ad bc) n 2 (a b)(c d)(a c)(b d)
a、b、c、d 分别为四格表中的四个实际频数,n为总 例数。 本例:
(64 33 - 21 51) 169 4.13 85 84 115 54
2 2
(三 )
四格表 统计量的连续性校正
完全随机设计(独立样本)列联表资
料的 检验
2
在抽样研究中,由于个体间存在变异,必然存在着抽 样误差,率(或构成比)的抽样误差与均数的抽样误差 概念相同。
例1 将病情相似的169名消化道溃疡患者随机分成两组, 分别用奥美拉唑与雷尼替丁两种药物治疗,4周后评价
其疗效,结果见表1。问两药治疗消化道溃疡的愈合率
部面积为时的临界值记为

2 a ,v ,列于附表8。
二、2×2列联表资料的 检验。
2 2 (一) 2×2列联表资料 检验的步骤
现以例1说明2×2列联表资料 检验的步骤
2
① 建立假设
H0: π1=π2 H1 : π1≠π2 ② 确定检验水准 α=0.05
③ 计算统计量 值
2
2 (A T) 2 T (64 57.84)2 (21 27.16)2 (51 57.16)2 (33 26.84)2 4.13 57.84 27.16 57.16 26.84
v k 1 s ( R 1)(C 1)
式中,k为格子数,s为估计的参数个数,R为行数, C为列数。 如本例中,4个格子,估计甲乙两药的有效率,则k=4, s=2,v=4-1-2=(2-1)(2-1)=1。
2分布是一种连续型随机变量的概率分布。
如果Z服从标准正态分布,那么Z2服从自由度为1的 小值的可能性较大,取较大值的可能性较小。 设有v 个相互独立的标准正态分布随机变量Z1, Z2, Zv,
2 则 Z Z Z 的分布称为自由度为v的 分布,

2
分布,其概率密度在(0,+∞)区间上表现为L型,取较
记为 v 。
2
2 1
2 2
2 v

2
分布的形状依赖于自由度v的大小,当自由度v>1时,
随着v的增加,曲线逐渐趋于对称,当自由度v趋于∞
2 2 时, 分布逼近正态分布。各种自由度的 分布右侧尾
2
2 2 4.777 0.05,1 3.84 ,则P<0.05,按α=0.05的水
准,拒绝H0,接受H1,差异有统计学意义。结论相反。
例 某医师用甲 、乙两疗法治疗单纯消化不良 ,结
果如下表,问两种疗法的治愈率有无差别? 表 两种疗法对单纯消化不良的治愈率比较
① 建立假设 H0:π1=π2 H1:π1≠π2 ② 确定检验水准 α=0.05
者未住院原因构成比是否不同?
表4
甲、乙两县应住院者未住院原因构成比(%)
① 建立假设 H0:甲、乙两县应住院者未住院原因总体构成比相同同 H1:甲、乙两县应住院者未住院原因总体构成比不同 ② 确定检验水准 α=0.05
2 ③ 计算统计量 值
2 A 2 n( 1) nR nC
2932 102 62 639 ( ... 1) 4.170 333 575 333 19 306 19
2 三、R×C列联表资料的 检验。
当基本数据的行数或列数大于2时,统称为行列表或 RC表。
2 RC表的 检验主要用于多个样本率(或构成比)的比
较。 行列资料 检验的专用公式
2
A n( 1) nR nC
2
2
n为总例数,A为每个格子的实际频数,nR为与A同
行的行合计,nC为与A同列的列合计。
n R nC T n
nR nC TRC n
n R为相应行的合计
nC为相应列的合计
n 为总例数。
表1 两药治疗消化道溃疡4周后疗效
2检验的基本公式:
(A T) T
2
2
2 统计量值反映了实际频数和理 从基本公式可以看出,
论频数的吻合程度。如果假设检验H0 (π1=π2)成立,则 2 实际频数和理论频数之差一 般不会相差太大, 值相 应也不会太大; 反之,实际频数和理论频数之差相差 2 很大,则 值相应也会很大,相应的P值也就越小,
① 建立假设 H0:π1=π2=π3 H1: 三种方案治疗轻、中度高血压的有效率不等或 不全等
② 确定检验水准 α=0.05
2 ③ 计算统计量 值
2 A 2 n( 1) nR nC
742 62 92 240 ( ... 1) 13.868 80 203 80 37 80 37
① 建立假设 H0:三种剂量的镇痛效果相同 H1:三种剂量的镇痛效果不同或不全相同 ② 确定检验水准 α=0.05
③ 计算统计量 值
2
2 A 2 n( 1) nR nC
32 122 62 53 ( ... 1) 7.584 15 26 15 27 18 27
④ 确定P值 2 υ=(3-1)(2-1)=2,查 界值表得P<0.01。
⑤ 下结论 因为P<0.01,按α=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为三个地区的出
生婴儿的致畸率有差别。
例 为研究某镇痛药的不同剂量镇痛效果是否有差别,研 究人员在自愿的原则下,将条件相似的53名产妇随机分成 三组,分别按三种不同剂量服用该药,镇痛效果如下表。 试分析该药不同剂量的镇痛效果有无差别? 表 某药不同剂量的镇痛效果
(一) 多个样本率的比较 例3 某研究者欲比较A、B、C 三种方案治疗轻、中度
高血压的疗效,将年龄在50~70岁的240例轻、中度高血
压患者随机等分为3组,分别采用三种方案治疗。一个 疗程后观察疗效,结果见表11.4。问三种方案治疗轻、 中度高血压的有效率有无差别?
表3 三种方案治疗轻、中度高血压的效果
别? 表 某市三个地区出生婴儿的致畸率比较
① 建立假设 H0:π1=π2=π3 H1:π1,π2,π3之间不等或不全等。 ② 确定检验水准 α=0.05 ③
2 计算统计量 值
2 A 2 n( 1) nR nC
Leabharlann Baidu
1142 32782 82752 52281 ( ... 1) 3392 585 3392 51696 8342 51696 167.11
④ 确定P值 2 υ=(3-1)(2-1)=2,查 界值表得P<0.01。 ⑤ 下结论 因为P<0.01,按α=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为三种方案治疗轻、 中度高血压的有效率不等或不全等
例 某市重污染区、一般污染区和农村的出生婴儿的致
畸情况如下表,问三个地区的出生婴儿的致畸率有无差
④ 确定P值 2 υ=(3-1)(2-1)=2,查 界值表得P<0.05。
⑤ 下结论 因为P<0.05,按α=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为三种剂量的镇
痛效果不同或不全相同。
(二) 两个或多个构成比的比较
例4 为了解新型农村合作医疗对于农村贫困居民住院
服务利用的影响,在经济条件相似的甲、乙两个国家 级贫困县(其中甲县2006年已开展新型农村合作医疗, 乙县2006年尚未开展)分别进行抽样调查,得到2006年 应住院者未住院原因,见表11.5。问甲、乙两县应住院
④ 确定P值 2 υ=(2-1)(4-1)=3,查 界值表得P>0.05。
3. 任一格子的T<1或n<40时,需改用四格表确切概率法。
例2 某研究欲比较甲、乙两药治疗下呼吸道感染的疗
效,将65例下呼吸道感染者随机分为两组,进行随机双
盲试验,结果见表2。两组纳入分析的病例数分别为32
和33人。问两药治疗下呼吸道感染的有效率有无差别? 表2 两药治疗下呼吸道感染的效果
① 建立假设 H0: π1=π2 H1 : π1≠π2 ② 确定检验水准 α=0.05 ③ 计算统计量 值
④ 确定P值 自由度=(行数-1)(列数-1)=(2-1)(2-1)=1, 2 查 界值表得P<0.05。
⑤ 下结论
因为P<0.05,按α=0.05的水准,拒绝H0,接受H1, 差异有统计学意义。即可认为两药治疗消化 道溃 疡的愈合率有差别,其中奥美拉唑的愈合率比雷 尼替丁愈合率高。
(二) 四格表的专用公式

2
检 验
卡方检验是英国统计学家K. Pearson于1900年提出的,
以卡方分布和拟合优度为理论依据,一种用途较广的 假设检验方法。常用于检验完全随机设计下两个或多 个样本率(或构成比)之间有无差别,也可用于检验配 对设计下两组频数分布差异,或者线性趋势卡方检验,
推断两变量间有无相关关系等。
第一节
有无差别?
表1 两药治疗消化道溃疡4周后疗效
两组的愈合率不同有两种可能:
1. 两药的总体愈合率无差别,两样本率的差别仅由抽 样误差所致。 2. 两种药物的总体愈合率确有不同。
一、卡方检验的基本思想 表1中,64、21、51、33 是整个表的基本数据,其余 数据都是从这四个基本数据相加而得的,这种资料是两 组两分类资料,称为四格表(fourfold table),亦称2×2 表(2×2 table)。
实际频数(theoretical frequency),用符号A表示。
若H0成立,则理论上:
奥美拉唑组愈合人数:
115 T11 85 57.84 169
54 奥美拉唑组未愈合人数: T12 85 27.16 169 115 雷尼替丁组愈合人数: T21 84 57.16 169 54 雷尼替丁组未愈合人数: T22 84 26.84 169
2
32 10 4.92, 1 T12 5,而n>40, 本例 Tmin =T12 65
故应计算校正的卡方值。
2 2 ( ad-bc -n/2) n ( 24 2 8 31 65 / 2) n 2 χ = = 3.140 (a+b)(c+d)(a+c)(b+d) 32 33 55 10
表 两独立样本率比较的四格表
无效假设H0为 π1=π2,即两种药物治疗消化道溃疡的愈
合率相同,两样本的愈合率的差别仅有抽样误差所致。
由于此时总体情况未知,故用样本合计愈合率对总体愈 合率进行估计,即H0为π1=π2=68.05%,在此基础上, 可以推算每个格子的期望频数,称为理论频数(actual frequency),用符号T表示;从样本观察到的频数称为
④ 确定P值
自由度=(行数-1)(列数-1)=(2-1)(2-1)=1,
2 查 界值表得P>0.05。
⑤ 下结论 因为P>0.05,按α=0.05的水准,还不拒绝H0,即
差异没有统计学意义。即还不能认为两药治疗下
呼吸道感染的有效率有差别。 注意:如果本例不校正,直接用公式(8-2)计算 值,
相关文档
最新文档