第9章卡方检验1(新)精品PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
(AT0.5)2
T
2 (|adbc|n/2)2n
(ab)c(d)a (c)b(d)
(3)T<1或n<40时,需用确切概率法。
注:对于两个率的比较,2检验和z检验 是等价的,2=z2。
例2 某医生观察冠心软胶囊治疗冠心病心绞痛的临床疗 效。用冠心软胶囊(治疗组)与复方丹参片(对照组)作对 比治疗,以临床症状及心电图疗效等为观察指标。所有 冠心病心绞痛患者均为门诊患者,均符合世界卫生组织 (WHO)制定的《缺血性心脏病的命名及诊断标准》,将 患者随机分为两组,其中患者性别、年龄、病情、病 程等在两组间是均衡的。两组病人临床症状改善效果 见下表,试比较两种药物治疗冠心病心绞痛的总体有 效率有无差别?
二、四格表的专用公式
对于四格表资料,通过推导可将式9-4转换 成四格表的专用公式:
2
(ad b)c2n
(ab)c(d)a (c)b (d)
表9-2 某市2008年城乡居民的两周患病率
分组 城区 农村 合并
两周患病情况
有
无
合计
95(a) 148(c) 243(a+c)
585(b)
680
(a+b)
512(d)
第九章
定性资料的假设检验
教师:李红美
复习
• 定量资料的统计推断:t检验及方差分析。 其基本目的是通过样本均数推断总体均数 是否相等。
分类变量资料的描述指标:率、构成比、 相对比,怎样由样本所提供的信息来推断 两个或者多个总体率(或构成比)是否相 等呢?
定性资料的比较:
1.样本率和总体率的比较:直接计算概率法 (二项分布)和z检验
表93 两组治疗心绞痛疗效比较
组别 有效人数 无效人数
治疗组 32(28.64)
对照组 13(16.36)
合计
45
3(6.36) 7(3.64)
10
合计
有Hale Waihona Puke Baidu率 (%)
35 91.43
20 65.00
55 80.82
1.建立检验假设
H0:1=2 H1:12 =0.05
2.计算检验统计量 因本例n>40且有一个格子的1<T<5,需要用校正公式。
1.第一种情况:
城区1=农村2
P1=0.1397 P2=0.2242
抽样误差 2.第二种情况:
城区1 农村2
P1=0.1397
P2=0.2242
H0:1=2 H1:1≠2
=0.05
条件:当n较大,n11、n1(1-1) 、n22、n2(1-2) 均大于等于5时
(p 1 p 2)~ N (1 2,sp 1 p 2)
9 5 148 9 5 1481 1
Sp 1p26
(1
)( )0.021
8 606068 6060 n 1 n2
z|0.13 90.7 22|442.01 0.02105
因为z0.05/2=1.96,z>z0.05/2,P<0.05,所以拒绝H0。
第一节 完全随机设计两样本 率比较的2检验
z检验
2 检 验
两个率(或两类 构成)是否相等
两个或多个两类构成(或 率)或 两个或多个多类 构成总体的构成比(或率) 或行变量和列变量是否独 立
将例1的资料整理成表格如下:
表9-1某市2008年城乡居民的两周患病率
分组
两周患病情况
合计
有
无
城区 95(123.31) 585(556.69) 680
农村 148(119.69) 512(540.31) 660
查附表9可知,自由度=1时,20.05,1=3.84, 20.001,1=10.83,本例值16.12>10.83, 因此 P<0.001。按照=0.05的检验水准,拒绝H0假 设,接受H1假设。即该市城乡居民的总体两 周患病率不同。根据现有资料看出,农村的 患病率高于城区。
注意:z检验等价于2检验
2.两样本率的比较:z检验、卡方检验和确 切概率法
3.多个样本率、两组或多组构成比的比较: 卡方检验、确切概率法
分类变量的关联性检验:计算列联系数、一致
性检验等
完全随机设计两个样本率 比较的z检验(补充)
例1 某市在2008年6月实施了第四次国家卫 生服务抽样调查,以近两周患病情况作为 调查指标。分别在城区和农村进行了抽样 调查,其中城区调查了680人,有95人近两 周患病,农村调查了660人,有148人近两 周患病,问两组人群的两周患病率是否相 同?
660
(a+c)
1097(b+d) 1340(n)
2(9 5 5 1 2 5 8 5 1 4 8 )2 1 3 4 0 1 6 .1 2
6 8 0 6 6 0 2 4 3 1 0 9 7
三、四格表资料校正
1.2值的校正
x1、x2……xk~N
zk
xi
2z12z22 zk2i k1xi2
分类资料为间断的,不连续分布。故计算的
|pp||| |pp|
z 1 2
1 2
12
Sp1p2
Sp1p2
Sp 1p 2
X 1X 2(1X 1X 2)1 (1)
n 1n 2
n 1n 2 n 1 n 2
当n较小时,则可以利用校正的z检验:
zc|
p1p2|(1/n11/n2)/2 Sp1p2
本 例:
X1=95,n1=680,X2=148, n2=660 p1=95/680=0.1397,p2=148/660=0.2242
2值不连续,尤其是自由度为1的四格表,求
出的概率可能偏小,因此需进行连续性校正:
2 (AT0.5)2
T
2.四格表2检验的条件
(1) 当n≥40,且每个格子的理论频数 T≥5 时,可用基本公式:
2 (AT)2
T
2
(ad b)c2n
(ab)c(d)a (c)b (d)
(2)当总合计数n≥40,而有1T<5 时,用校 正公式或确切概率法。校正公式:
2 (AT)2 =(R-1)(C-1)
T
2( AT) 2
T
( 95123.31 ) 2 ( 585556.69) 2 ( 148119.69) 2 ( 512540.31)216.12
123.31
556.69
119.69
540.31
f
=1
=3
=5
2
4
6
8
10
图9-1 2分布的概率密度曲线
0
3.查表,判断结果,下结论
合计
243
1097
1340
患病率 (%) 13.97 22.42 18.13
基本步骤
1.建立假设
H0:该市城乡居民的两周总体患病率相同 即1=2=
H1:该市城乡居民的两周总体患病率不同 即1≠2
理论频数TRC的计算公式为: TRC=nR×nC/n
2.实际频数与理论频数的差值服从2分布
计算2值的基本公式: