生物统计第三节 样本含量的估计与检验效能1
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
δ为允许误差 (x m,) 可根据调查要求的准确性确定;
1-a为置信度。
上一张 下一张 主 页 退 出
在首次计算时,可先用df =∞时 (当置信度 为95%时,zα= z0.05=1.96;置信度为99%时, zα = z0.01=2.58)值代入,若算得n<30,再用df=n-1 的za代入计算,直到n稳定为止。
即至少需要调查1025只鸡,才能以95%的 置信度使调查所得的样本百分数与总体百分数 相差不超过0.03。
此 外 , 当 样 本 百 分 数 接 近 0% 或 100% 时 , 分布呈偏态,应对x作 sin 1 x 转换。此时估算 公式为:
n [57.3z / sin 1( / 1 )]2 (9-23)
式中:n为每组试验的动物头数; p为合并百分数,由样本百分数计算, q 1 p;
为预期达到差异显著的百分数差值;
ua为自由度等于∞、两尾概率为a的临界u值: u0.05=1.96, u0.01=2.58;
1-a 为置信度。
上一张 下一张 主 页 退 出
【例9.13】 两种痢疾菌苗对鸡白痢病的免疫 效果,初步试验表明,甲菌苗有效率为22/50 = 44%,乙菌苗有效率为28/50 = 56%,今欲 以95%的置信度在样本的百分数差值达到10% 时检验出两种菌苗免疫效果有显著差异,问试 验时每组至少需接种多少只鸡?
已知 π=0.08,α=0.05,Z0.05/2=1.96,δ=0.02 代入公式(6.2)得
n
1.96 0.02
2
0.08
(1
0.08)
707
即需调查707人。 如果采用单侧z0.05=1.645,则n= 498
总体百分数如果事先未知,可先从总体中 调查一个样本估计。或令z=0.5进行估算。
【例9.18】某菌种接种于甲、乙两种培养基的结果如下: π+-=0.04,π-+=0.24,取双侧α=0.05,β=0.1, 现要研究一种与该菌种相似的新菌种,问需观察多 少对子数?
πc=(0.04+0.24) /2=0.14
n 1.96
2
0.14
1.282 2 0.04 0.24
0.04
0.24
H0 H1 临界点
74
75
X 76
二 、 样本含量的估计
如果我们要求调查研究或试验结果精确性 高,则样本含量就要大,并且越大越好。但若 样本太大 ,就会花费过多的人力 、物力 和 时 间。特别是破坏性试验,如畜牧试验中猪、牛 羊等动物的屠宰试验。即使不是破坏性试验, 如在农村进行活猪体重调查时,抓猪、拴猪也 容易发生掉膘现象。所以,在实际调查与试验 研究中,却要求样本越小越好。但样本太小必 然影响精确性。因此,需要研究在一次调查或 试验中如何确定适宜样本含量的问题。
n =1.962×4.072 / 0.52 = 254.54 ≈ 255 (头) 即对南阳黄母牛体高进行调查 ,至 少 需 要 调查 255头,才能以95%的置信度使调查所得样本平均数与 总平均数相差不超过0.5cm。
上一张 下一张 主 页 退 出
【例9.9】要调查某社区居民白细胞数,已知该社区人 口总数为2.5万人,从以往测定结果得知白细胞数的标 准差s=1000个/mm3,若取α=0.05,δ=100个/mm3,问 用单纯随机抽样方法需调查多少人?
已知 pˆ=1 22/50 = 44%, p=ˆ 228/50 = 56%, 则两个样本百分数的合并百分数为:
p = (22+28) /(50+50)= 0.50, q 1 p=1-0.50=0.50 将 u0.05 1.96, p 0.50, q 0.50, 0.10 代入 (6-4) 式算得: n=2×1.962×0.50×0.50/0.102=192 .08193(只) 即在正式接种试验时,每组至少需接种193 只鸡方可满足试验要求。
即至少需要调查1505头牛,才能以95%的置信 度使估计出的牛结膜炎发病率误差不超过0.1%。
上一张 下一张 主 页 退 出
(3) 两个百分数比较试验中样本含量估计 设两样本含量相等:n1=n2=n,n的计算公式可由两个 样本百分数差异显著性检验u检验公式推得:
n 2u2 pq / 2 (9-24)
上一张 下一张 主 页 退 出
由样本平均数与总体平均数差异显著性检验的t检验公式 推出的样本含量计算公式为:
n
z / 2
2
(9-21)
式中:n为样本含量;
zα 为 检 验 水 准 所 对 应 的 z 值 , 单 侧 z0.05=1.645 , 双 侧 z0.05=1.96;
s为标准差,由经验或小型调查估得;
上一张 下一张 主 页 退 出
2、样本均数与总体均数比较
n
( z / 2
z
)
2
(9-25)
【例9.14】 用某药治疗矽肺患者可增加尿矽的排 出量,标准差为89.0mmol/L,取α=0.05,β=0.10, 能辨别出尿矽排出量平均增加35.6mmol/L,需观 察多少例矽肺患者?
已知:s=89.0,δ=35.6,单侧α=0.05,
总体百分数作出估计,由样本百分数与总体百 分数差异显著性检验检验公式推出样本含量计 算公式为:
n
z / 2
2
(1 ()9-22)
式中: n为样本含量; π为总体的百分数;
上一张 下一张 主 页 退 出
【例9.10】从参考文献得知高血压得患病率为 8%,研究者拟研究某地高血压患病率,估计 客观差值不超过2%,即δ=0.02,取α=0.05,问 需调查多少人?
已知:δ=1,σd=1.2,Z0.05/2=1.96, Z0.1=1.282
n
(1.96
1.282) 1
1.22
15
即需15例患者参加试验。
如果采用单侧,则需观察12人。
5、两样本率比较
n1
n2
2
z
1
z
2
2 c (1 c )
π1和π2:分别表示两组的总体率 πc :两组的合并率
(9-28)
样本含量少,研究结论不可靠。 样本含量过多,造成人财物的不必要浪费。
检验效能(power)
也叫把握度,即1-(第二类错误的
概率)。如果两总体参数实际有差异
(H1成立),按水准,假设检验能发现
这种差异的能力(真阳性)。通常要求
达到80%或90%(即=0.2 或=0.1 ),
不得低于75%。
样本含量与检验效能
样本含量估计与检验效能分析是研 究设计必须考虑的问题。
这两者之间关系密切,样本含量越 大,检验效能越高;样本含量越小,检 验效能就越低。
Z
X
m0
n
X 0.05 74 6 100
1.645
Z0.05 , X 0.05
73.01
0.8
0.6
0.4
0.2
0 70
H1 : m m0
71
72
73
H0 : m m0 74(次/分)
【例9.12】 某地需抽样调查牛结膜炎发病
率,已知通常发病率为2%,若规定允许误差为
0.1%,取置信度1-a=0.95,问至少需要调查多
少头牛?
上一张 下一张 主 页 退 出
将 z=0.02, δ=0.001, ta=1.96, 代入(9-23)式,
得:
n {57.31.96 / sin 1[0.001/ 0.02 (1 0.02)]}2 1505
【例9.11】 欲了解某地区鸡新城疫感染率, 已知道通常感染率约60%,若规定允许误差为 3%,取置信度1-a=0.95,问至少需要调查多少 只鸡?
将 π=0.6, δ=0.03, ta=1.96, 代入 (9-22) 式, 得:
n =1.962×0.6×0.4/0.033≈1025 (只)
上一张 下一张 主 页 退 出
【例9.8】 进行南阳黄母牛体高调查,已测 得南阳黄母牛的体高的标准差s=4.07cm,今欲 以95%的置信度使调查所得的样本平均数与总 体平均数的允许误差不超过0.5cm,问需要抽取 多少头黄牛组成样本才合适?
上一张 下一张 主 页 退 出
已知:s = 4.07, δ= 0.5, 1-α = 0.95, 先 取z0.05=1.96, 代入(6-1)式,得:
/
0.14
2
57
即需观察57对样本。
7、根据相对危险度进行估计 8、相关分析
样本含量的影响因素
n
(z z ) m m0
2
( z
zLeabharlann )2 见p87
1. 检验水准 :
,则n
2. 检验效能1-β: (1-),则n ,
(1-)> 0.75,通常取0.8或0.9。
3. 客观差异δ (delta),即比较总体参数间的差值(如m1m2, 12)。
【例9.17】用旧药治疗慢性肾炎的近控率为30%, 现试验新药疗效,新药的近控率必须达到50%才 认为有推广价值,问每组各需要多少例患者?
已知:π1=0.5,π2=0.3,πc=(0.5+0.3)/2=0.4 单侧α=0.05,Z0.05=1.645,β=0.1,Z0.1=1.282
n1
n2
2
1.604.55
4、配对计量资料比较
n
( z / 2
z
) d
2
σd:每对观察对象差值的标准差 n: 所求的观察对子数
(9-27)
【例9.16】研究碳酸铝对白细胞减少症的治疗效果。 已知治疗后比治疗前平均增加1×109/L,标准差为 1.2×109/L,取双侧α=0.05,把握度(1-β)=0.9, 求样本含量。
已知:N=25000,s=1000个/mm3,δ=100个/mm3,
α=0.05,z0.05/2=1.96
代入公式(6.12)得
n
1.961010000
2
384.16
385
即需要从该社区随机抽取385人。 如果采用单侧z0.05=1.645,则n=271
(2) 百分数抽样调查样本含量估计 如果我们调查的目的是对服从二项分布的
δ ,则n
第九章第三节
样本含量的估计与检验效能
显著性检验中的两类错误
真实结果
H0成立 H0不成立
由样本推断的结果
拒绝H0
Ⅰ型错误
不拒绝H0
推断正确(1- )
推断正确(1-) Ⅱ型错误
I型概错率误记(为弃α。真()1:-拒a)绝即实置际信正度确:的重H复0,抽I样型时错,误样的
本区间包含总体参数(m)的百分数。
单侧z0.05=1.645,β=0.10, 单侧z 0.10=1.282
n
(1.645 1.282)
35.6
89.02
54
即需观察54例矽肺患者。
如果采用双侧,则需观察66例矽肺患者。
3、两样本均数比较
n1
n2
2
(
z
/
2
z )
2
(9-26)
【例9.15】为研究某地正常成年男、女末稍血液的红细 胞的差别,据文献报道,男性红细胞均数为465万/mm3 , 女性红细胞均数为422万/mm3,标准差为52万/mm3, 取双侧α=0.05,把握度(1-β)=0.9,问要抽查多少人才能 发现男女间红细胞的差别?
II型误错的误概(率纳记伪为)β。:(不1-拒β绝)实即际把不握正度确(的或H检0,验效II型错 能):两总体确有差别,被检出有差别的能力。
两类错误图示
m=m0 m0
m>m0
H1: m=m1>m0 m1
一、 概述
样本含量(sample size)
为了保证研究结论的可靠性,确定的实验研究或调 查研究所需要的最低观察对象的数量。
1.282 0.3
2
0.4 (1
0.4)
103
即试验组和对照组各应观察103人。
6、配对计数资料比较
配对资料分析形式 甲乙两法比较
乙法
合计
+-
甲
+
ab
a+b
法
-
cd
c+d
合计
a+c b+d
n
n z
2 c
z
2
/c
2
π+-=b/(a+b), π-+=c/(a+c),πc=(π+-+π-+) /2
上一张 下一张 主 页 退 出
1、调查研究中样本含量的估计 (1) 平均数抽样调查的样本含量估计
目前对调查研究所需样本含量,还没有一个精 确的估计方法。根据以往研究,一般要求样本含量 占抽样总体的5%为最小量,对变异较小的群体, 则可低于5%。斯丹(C. Stein)认为,调查样本含量 与调查要求的准确性高低及所研究对象的变异度大 小有关。因此,需要提出我们能够接受的允许误差, 并初步了解调查指标变异度的大小。
已知: 1=465, 2=422, δ=| 1- 2|=|465-422|=43,σ=52 双侧α=0.05,Z0.05/2=1.96,
β=0.1,Z0.1=1.282
n1
n2
2(1.96
1.282) 43
522
31
即成年男女性各需抽查31人才能发现其红细胞
间的差别。
如果采用单侧,则男女各需观察25人。