卫生学 10分类变量资料的统计推断PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体率95%的可信区间为:
查表法
p1.96sp
总体率99%的可信区间为:
正态近似法
p2.58sp
p1.96sp
例 试估计例10-6中结核菌素试验阳性 率的95%和99%的置信区间。 已知阳性率0. 3847,标准误为0.0116
( 0 .3 8 4 7 1 .9 6 0 .0 1 1 6 ) , ( 0 .3 8 4 7 1 .9 6 0 .0 1 1 6 ) 0 .3 6 2 0 ~ 0 .4 0 7 4
一、率的抽样分布
• 在医学领域中,有一些随机事件是只具有两种 互斥结果的离散型随机事件,称为二项分类变 量(dichotomous variable),如对病人治疗结 果的有效与无效,某种化验结果的阳性与阴性 ,接触某传染源的感染与未感染等。二项分布 (binomial distribution)就是对这类只具有两 种互斥结果的离散型随机事件的规律性进行描 述的一种概率分布。
1 n2
)
0.08540.1486
0.0046
0.1258(10.1258)
1 8207
145185
查t界值表中υ为∝对应的界值得, P< 0.01,按α=0.05水准,拒绝H0,接受H1, 可认为该人群HBV感染率有性别差异。
第三节 x2 检 验
卡方检验(Chi-square test )主要用于分 类资料的统计分析,研究的变量是分类变量, 而观察值以频数表示。
P(X) n! X(1)(nX)
X!(nX)!
• 例10-5 已知①π=0.3,n=5; ②π=0.3, n=10; ③π=0.3,n=15; ④ π=0.5,n=10 。求阳性事件的概率并作概率分布图。
P (0) 5! 0.30(10.3 )(5 0)0.1681 0!(50)!
P (1 ) 5! 0.31(10.3)(5 1)0.3602 1!(51 )!
p
(1)
nቤተ መጻሕፍቲ ባይዱ
sp
p(1 p) n
例
结核菌素试验阳性率,检测1773人,结核菌 属阳性者682人,阳性率为38.47%,试计算标准 误。
spp (1 n p )0 .3 8 4 7 1 (1 7 7 3 0 .3 8 4 7 )0 .0 1 1 6
适用于小样本资料
三、总体率的估ran和计t足( 分 间en)(够(n布 表1≤-大pe参5)s,0均pt数)i或,大mπ1于查a置-pt5均i二信)o不n项区太of小(np
第十章 分类变量资料的统计分析
统统计计分分析析
统计描述
统计推断
内容
• 率的抽样分布 • 率的抽样误差与标准误 • 总体率的置信区间估计 • 两个率比较的U检验 • X2检验
要求
掌握: •U检验适用条件 •x2检验的用途、四格表资料(配对资料)的x2检验应 用条件 •行×列表资料的x2检验及其注意事项; 熟悉: •U检验计算方法 •x2检验计算方法 了解: •率的抽样分布、x2分布
( 0 .3 8 4 7 2 .5 8 0 .0 1 1 6 ) , ( 0 .3 8 4 7 2 .5 8 0 .0 1 1 6 ) 0 .3 5 4 8 ~ 0 .4 1 4 6
四、两率比较的u检验
一、样本率与总体率的比较
u p0 p0
p
0(10)
n
例10-7 一般情况下,直肠癌围术期并发症发生率 为30%,现某医院手术治疗了385例直肠癌患者, 围术期出现并发症有100例,并发症发生率为26%,
P(2)=0.3087 P(3)=0.1323 P(4)=0.0283 P(5)=0.0024
• 二项分布的形状取决于π和n的大小,高 峰在m=np处。当p接近0.5时,图形是对 称的;p离0.5愈远,对称性愈差,但随着 n的增大,分布趋于对称。当n→∞时, 只要p不太靠近0或1,特别是当nP和n(1 -P)都大于5时,二项分布近似于正态分 布。
该方法可用于推断两个及多个总体率(或构 成比)之间有无差别、分类资料的关联度分 析以及频数分布的拟合优度检验等。
一 、x2 检验的基本思想 (chi-square test for fourfold data)
四格表x2检验的基本结构
发生数
未发生数
合计
A组
a
b
a+b
B组
c
d
c+d
合计
a+c
b+d
n
无差H异0:。π1= π2 H1:π1≠ π2 α=0.05
本例:n1=8207,X1=701,P1=0.0854 n2=14585,X2=2167,P2=0.1486
pcX n1 1 n X 2287 20 01 7 1 24 15 68 750.1258
u
p1 p2
pc
(1
pc
)( 1 n1
率的抽样分布特征:
1、为离散型分布 2、π为0.5时,呈对称分布 3、当n不断增大时,二项分布逐渐逼近正
态分布 • 当nP和n(1-P)都大于5时,二项分布近
似于正态分布。
二、率的抽样误差和总体率的估计
一、率的抽样误差和标准误(sampling error and standard error of rate)
问该院直肠癌患者围术期并发症发生率与一般情况 有无差异。
H0:π= π0 H1:π≠ π0 α=0.05
P=0.26
u p0
0.300.26
1.713
0(10) 0.3(10.3)
n
385
查t界值表中υ为∝对应的界值,得P> 0.05,按α=0.05水准,不拒绝H0,尚不 能认为该院认为该院直肠癌患者围术期 并发症发生率与一般情况不同
二、两样本率的比较
1、正态近似法
n足够大,p或1-p均不太小(np和n(1-p)均 大于5)。
up1p2
p1p2
Sp1p2
pc(1pc)(n11
1) n2
pc
X1 n1
X2 n2
例10-8
为了解某地小学生蛔虫感染率的城乡差异,抽样调查 了该地小学生,其中城镇小学生8207人,粪检蛔虫卵 阳性数701人,蛔虫感染率为8.54%,乡村小学生 14585人,粪检蛔虫卵阳性数2167人,蛔虫感染率为 14.86%,试比较该地小学生蛔虫感染率城乡之间有
X2检验的基本思想
例10-9 某医生欲比较甲、乙两种药物对动脉 粥样硬化的疗效,甲药治疗71例,有 效52例,乙药治疗42例,有效39例。 问两种药物的有效率是否有差别?
查表法
p1.96sp
总体率99%的可信区间为:
正态近似法
p2.58sp
p1.96sp
例 试估计例10-6中结核菌素试验阳性 率的95%和99%的置信区间。 已知阳性率0. 3847,标准误为0.0116
( 0 .3 8 4 7 1 .9 6 0 .0 1 1 6 ) , ( 0 .3 8 4 7 1 .9 6 0 .0 1 1 6 ) 0 .3 6 2 0 ~ 0 .4 0 7 4
一、率的抽样分布
• 在医学领域中,有一些随机事件是只具有两种 互斥结果的离散型随机事件,称为二项分类变 量(dichotomous variable),如对病人治疗结 果的有效与无效,某种化验结果的阳性与阴性 ,接触某传染源的感染与未感染等。二项分布 (binomial distribution)就是对这类只具有两 种互斥结果的离散型随机事件的规律性进行描 述的一种概率分布。
1 n2
)
0.08540.1486
0.0046
0.1258(10.1258)
1 8207
145185
查t界值表中υ为∝对应的界值得, P< 0.01,按α=0.05水准,拒绝H0,接受H1, 可认为该人群HBV感染率有性别差异。
第三节 x2 检 验
卡方检验(Chi-square test )主要用于分 类资料的统计分析,研究的变量是分类变量, 而观察值以频数表示。
P(X) n! X(1)(nX)
X!(nX)!
• 例10-5 已知①π=0.3,n=5; ②π=0.3, n=10; ③π=0.3,n=15; ④ π=0.5,n=10 。求阳性事件的概率并作概率分布图。
P (0) 5! 0.30(10.3 )(5 0)0.1681 0!(50)!
P (1 ) 5! 0.31(10.3)(5 1)0.3602 1!(51 )!
p
(1)
nቤተ መጻሕፍቲ ባይዱ
sp
p(1 p) n
例
结核菌素试验阳性率,检测1773人,结核菌 属阳性者682人,阳性率为38.47%,试计算标准 误。
spp (1 n p )0 .3 8 4 7 1 (1 7 7 3 0 .3 8 4 7 )0 .0 1 1 6
适用于小样本资料
三、总体率的估ran和计t足( 分 间en)(够(n布 表1≤-大pe参5)s,0均pt数)i或,大mπ1于查a置-pt5均i二信)o不n项区太of小(np
第十章 分类变量资料的统计分析
统统计计分分析析
统计描述
统计推断
内容
• 率的抽样分布 • 率的抽样误差与标准误 • 总体率的置信区间估计 • 两个率比较的U检验 • X2检验
要求
掌握: •U检验适用条件 •x2检验的用途、四格表资料(配对资料)的x2检验应 用条件 •行×列表资料的x2检验及其注意事项; 熟悉: •U检验计算方法 •x2检验计算方法 了解: •率的抽样分布、x2分布
( 0 .3 8 4 7 2 .5 8 0 .0 1 1 6 ) , ( 0 .3 8 4 7 2 .5 8 0 .0 1 1 6 ) 0 .3 5 4 8 ~ 0 .4 1 4 6
四、两率比较的u检验
一、样本率与总体率的比较
u p0 p0
p
0(10)
n
例10-7 一般情况下,直肠癌围术期并发症发生率 为30%,现某医院手术治疗了385例直肠癌患者, 围术期出现并发症有100例,并发症发生率为26%,
P(2)=0.3087 P(3)=0.1323 P(4)=0.0283 P(5)=0.0024
• 二项分布的形状取决于π和n的大小,高 峰在m=np处。当p接近0.5时,图形是对 称的;p离0.5愈远,对称性愈差,但随着 n的增大,分布趋于对称。当n→∞时, 只要p不太靠近0或1,特别是当nP和n(1 -P)都大于5时,二项分布近似于正态分 布。
该方法可用于推断两个及多个总体率(或构 成比)之间有无差别、分类资料的关联度分 析以及频数分布的拟合优度检验等。
一 、x2 检验的基本思想 (chi-square test for fourfold data)
四格表x2检验的基本结构
发生数
未发生数
合计
A组
a
b
a+b
B组
c
d
c+d
合计
a+c
b+d
n
无差H异0:。π1= π2 H1:π1≠ π2 α=0.05
本例:n1=8207,X1=701,P1=0.0854 n2=14585,X2=2167,P2=0.1486
pcX n1 1 n X 2287 20 01 7 1 24 15 68 750.1258
u
p1 p2
pc
(1
pc
)( 1 n1
率的抽样分布特征:
1、为离散型分布 2、π为0.5时,呈对称分布 3、当n不断增大时,二项分布逐渐逼近正
态分布 • 当nP和n(1-P)都大于5时,二项分布近
似于正态分布。
二、率的抽样误差和总体率的估计
一、率的抽样误差和标准误(sampling error and standard error of rate)
问该院直肠癌患者围术期并发症发生率与一般情况 有无差异。
H0:π= π0 H1:π≠ π0 α=0.05
P=0.26
u p0
0.300.26
1.713
0(10) 0.3(10.3)
n
385
查t界值表中υ为∝对应的界值,得P> 0.05,按α=0.05水准,不拒绝H0,尚不 能认为该院认为该院直肠癌患者围术期 并发症发生率与一般情况不同
二、两样本率的比较
1、正态近似法
n足够大,p或1-p均不太小(np和n(1-p)均 大于5)。
up1p2
p1p2
Sp1p2
pc(1pc)(n11
1) n2
pc
X1 n1
X2 n2
例10-8
为了解某地小学生蛔虫感染率的城乡差异,抽样调查 了该地小学生,其中城镇小学生8207人,粪检蛔虫卵 阳性数701人,蛔虫感染率为8.54%,乡村小学生 14585人,粪检蛔虫卵阳性数2167人,蛔虫感染率为 14.86%,试比较该地小学生蛔虫感染率城乡之间有
X2检验的基本思想
例10-9 某医生欲比较甲、乙两种药物对动脉 粥样硬化的疗效,甲药治疗71例,有 效52例,乙药治疗42例,有效39例。 问两种药物的有效率是否有差别?