率的抽样误差及可信区间
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、两个独立样本率比较的u 检验
表5-1 两种疗法的心血管病病死率比较
疗法 盐酸苯乙双胍
安慰剂 合计
死亡
26 (X1) 2 (X2) 28
生存 178 62 240
合计 病死率(%)
204(n1) 64(n2) 268
12.75 (p1) 3.13 (p2) 10.45 (pc)
u 检验的条件:
n1p1 和n1(1- p1)与
1.正态近似法; (1)条件:a. n>100(50) b. np与 n(1-p)>5 (2)公式:1)总体率95%可信区间为:P±1.96SP.
2)总体率99%可信区间为:P±2.58SP 2.查表法:
适用于n≤50; P很接近0或100%时,可查百分率的可信 限表,求得百分率可信限
第二节 率的统计学推断
第三节 卡方检验
χ2检验(Chi-square test)是现代统计学的创始人 之一,英国人K . Pearson(1857-1936)于1900年提 出的一种具有广泛用途的统计方法,可用于两个或 多个率间的比较,计数资料的关联度分析,拟合优 度检验等等。
本章仅限于介绍两个和多个率或构成比比较的χ2 检验。
小结
1.样本率也有抽样误差,率的抽样误差的
大小用σp或Sp来衡量。
2.率的分布服从二项分布。
当n足够大,π和1-π均不太小, 有nπ≥5和n(1-π)≥5时,
近似正态分布。
3.总体率的可信区间是用样本率估计总体
率的可能范围。当p 分布近似正态分布
时,可用正态近似法估计率的可信区间
4.根据正态近似原理,可进行样本率与总
一、样本率与总体率比较u检验 二、两个样本率的比较u检验
u 检验的条件: n p 和n(1- p)均大于5时
例如,一般高血压患病率为13.26%,农村抽样
=43/460=0.0935,即π0=0.1326
p
u
0
p
p 0
(1 )
0
0
n
0.0935 0.1326 2.4727 0.1326 (1 0.1326 ) 460
理论频数与自由度的计算:
A是实际频数,T是根据假设检验来确定的, 当H0成立时,计算出的格子中的数。每个格子中的理论 频数计算公式为:TRC = NR × NC /N, NR所在的行合计, NC所在的列合计,代入公式中求x2值。
表5-1 两种疗法的心血管病病死率的比较 2×2表或四格表(fourfold table)
疗法
死亡
生存
合计
病死率(%)
盐酸苯乙双胍 26 (a) 178 (b)
204(a+b)
安慰剂
2 (c)
62 (d)
64(c+d)
合计
28 (a+c.) 240(b+d.) 268(a+b+c+d=n)
12.75 (p1)
3.13 (p2)
10.45 (pc)
实际频数A (actual frequency) ( a、b、c、d)
n2p2 和n2(1- p2)均 >5
u p1 p2 S p1 p2
p1 p2
pc
(1
pc
)(
1 n1
1 n2
)
pc
X1 X2 n1 n2
n1 p1 n2 p2 n1 n2
u
0.1275 0.0313
2.1949 1.96
0.1045(1 0.1045)( 1 1 )
204 64
四格表资料的χ2检验
什么是四格表资料?凡是两个率或构成比资
料都可以看做四格表资料。举例。
组别 实验组 对照组 合计
发病人数 14 30 44
未 发 病人数 86 90 176
观察例数 100 120 220
发病率(%) 14 25 20
14 86 30 90
一、卡方检验的基本思想
四格表资料的χ2检验 什么是四格表资料?凡是两个率或构成比资
料都可以看做四格表资料。例如
组别 实验组 对照组 合计
发病人数 14 30 44
未 发 病人数 86 90 176
观察例数 100 120 220
发病率(%) 14 25 20
14 86 30 90
四格表的一般形式
组别
1 2 合计
阳性
a c a+c
阴性
b d b+d
合计
a+b c+d a+b+c+d
第一节 率的抽样误差及可信区间
计数资料的统计学推断
第一节 率的抽样误差与可信区间 第二节 率的统计学推断
一、样本率与总体率比较的u 检验 二、两个样本率比较的u 检验
第三节 卡方检验 一、卡方检验的基本思想 二、四格表专用公式 三、连续性校正公式
四、配对四格表资料的χ2检验 五、行×列(R×C)表资料的χ2检验
体率以及两样本率比较的u 检验。
率的u 检验能解决以下问题吗?
率的反应为生与死、阳性与阴性、发生与不 发生等二分类变量,如果二分类变量为非正反关 系(如治疗A、治疗B);反应为多分类,如何进 行假设检验?
率的u 检验要求:n足够大,且nπ≥5和 n(1-π)≥5。
如果条件不满足,如何进行假设检验?
第一节 率的抽样误差与可信区间
一、 率的抽样误差与标准误
样本率(p)和总体率(π)的差异称为率的 抽样误差(sampling error of rate) ,用率的标 准误(standard error of rate)度量。
p
(1 )
n
标准误的计算
如果总体率π未知,用样本率p估计
sp
p(1 p) n
其对应的理论频数T( theoretical frequency)为
(H0:π1=π2=π):
T
行(row)合计 列(column)合
a的理论频数= (a+b)×pc=(a+b)×[(a+c.)/ n] =nRnC/n =21.3
b的理论频数= (a+b)×(1-pc)= (a+b)×[(b+d.)/ n] =nRnC/n =182.7
Sp
p(1 p) n
0.625 (1 0.625 ) 0.0252 2.52% 368
SP的意义:反映率的抽样误差大小. SP小表示率 的抽样误差小,即样本率的可靠性大.
二、 总体率的可信区间
总体率的可信区间 (confidence interval of rate):根据样本率推算总体率可能所在的范围
c的理论频数= (c+d)×pc=(c+d)×[(a+c)/ n] =nRnC/n =6.7
d的理论频数= (c+d)×(1-pc)= (c+d)×[(b+d.)/ n] =nRnC/n =57.3