抽样原理与方法.pptx
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对于以频率表示统计结果的资料,其样本 容量的计算公式改变为:
n
4 pq L2
其中L的单位应与p、q一致。
例题3
某医生的按摩疗法预计对患者的治愈率为 75%,若允许的误差为5%,则应调查多 少位患者才能验证这一结论(α=0.05)?
n
4 pq L2
4
0.75 0.25 0.052
300
(位)
成对资料和非成对资料样本容量的确定
随机抽样
分层随机抽样的方法 分层随机抽样具体可分两步:1、将总 体按变异原因与程度划分成若干区层, 使区层内变异尽可能小或变异原因相同, 而区层间的变异比较大或变异原因不同; 2、在每个区层按一定的抽样分数独立 随机抽样。
n
4s2 L2
4 102 22
100
(棵)
例题2
条件同例题1,若要求估计误差不超过5 kg,问应抽取多少果树做样本?
n
4s2 L2
4 102 52
16
(棵)
n
t2
0.05
s2
L2
2.1312 102 52
18 (棵)
n
t2
0.05
s2
2.112 102
18
(棵)
L2
52
频率资料样本容量的确定
样本统计数与总体参数的差别主要由“抽 样误差”所引起。抽样误差与总体参数的 估计有着密切关系。
样本平均数的标准误和置信区间
从理论上说,各样本平均数的平 均数是对总体平均数的最好估计 值,即:
x
且容量为n的样本平均数的方差 等于总体方差的1/n,即:
2 x
2
n
x
n
样本平均数的标准误和置信区间
在实际工作中,从总体中抽出多个样本计
生物统计学
第九章
抽样原理与方法
LOGO
主要内容
抽样误差的估计 样本容量的确定 抽样的基本方法 抽样方案的制定
LOGO
1抽样误差的估计
假设有一正态总体,对其进行k次抽样, 每个样本包含n个观测值,则可得到样本1、 样本2、……、样本k。
这k个样本的平均数可能各不相同,且其 中某个样本的平均数刚好等于总体平均数 的几率也很小。
例题5
某科学家对一定年龄女童的体重差异进行 了测量,结果显示其差异的标准差为1.5 kg。若要使测量结果的误差为0.2 kg,则 应对多少组女童进行调查?
n 2t02.05s2 81.52 450(组) (x1 x2 )2 0.22
补充:两样本频率比较时样本容量的确定
两样本频率比较时,样本容量的计算公式 为:
n t02.05sd2 4 202 64 (只)
d2
52
成对资料和非成对资料样本容量的确定
非成对资料样本容量的确定 对于非成对试验,相应的公式为:
n
2t2 s2 (x1 x2 )2
其中: 为试验各组间差异的方差
s2 为各组平均数的差异值。
x1 x2
若计算所得n <16,则将df=2(n-1)带入,直 到计算出的n为稳定数值为止。
随机抽样
随机抽样要求在进行抽样的过程中,应该 使总体内所有个体均有同等机会被抽取。
由于抽样的随机性,可正确地估计试验误 差,从而得出科学合理的结论。
随机抽样可分为:简单随机抽样、分层随 机抽样、整体抽样、双重抽样。
随机抽样
简单随机抽样 是最简单、最常用的抽样方法,要求被 抽总体内每一个体被抽的机会均等。即 采用随机的方法直接从总体中抽出若干 抽样单位构成样本。
sp
pq n
样本频率的标准误和置信区间
则总体频率在(1-α)置信水平上的置信区间 为:
( p uasp , p uasp )
2平均数资料样本容量的确定
确定样本容量前,必须先明确能够接受误差的 范围,并了解两类错误的概率和变量标准差的 大小,并根据试验和经验作出估计。
L t0.05sx
sx
随机抽样
简单随机抽样的方法 将总体内所有抽样单位全部编号,采用 随机方法确定被抽单位编号,构成样本。
随机抽样
简单随机抽样的注意事项 简单随机抽样适用于个体间差异较小、 所需抽取的样本单位数较小的情况。对 于那些具有某种趋向或差异明显和点片 式差异的总体不宜使用简单随机抽样。
随机抽样
分层随机抽样 是一种混合抽样,特点在于将总体按变 异原因或程度划分成若干区层,然后再 用简单随机抽样方法,从各区层按照一 定的抽样分数(即一个样本所包括抽样 单位数与其总体所包括的抽样单位数的 比值)抽选抽样单位。
算均值和标准误往往是不现实的。故常采
用一个样本的标准差来估计平均数的标准
误,即:
sx
s n
x
样本平均数的标准误和置信区间
则总体平均数在(1-α)置信水平上的置信区 间为:
(x ua x , x ua x )
(x ta x , x ta x )
样本频率的标准误和置信区间
对于以频率表示的资料,当资料的观测值 个数相当大时,其分布也接近正态分布, 其标准误的计算公式为:
0.04
0.05
n
8 0.93 0.07 0.042
326
3抽样的基本方法
抽样调查是从总体中抽取一定数量的观察 单位组成样本。其目的就是由样本指标来 推断总体的特征。抽样方法正确与否,关 系到样本是否具有代表性,也直接影响到 由样本所得估计值的准确性。
根据研究情况的不同,抽样方法可分为: 随机抽样、顺序抽样、典型抽样。
成对资料样本容量的确定
对于成对资料中样本容量的计算,相应 的公式为:
n
t2 sd2 d2
其中:sd2 为试验所得各对间差异的方差; d 为各对间差异平均数。
例题4
某药物试验以大鼠为对象,治疗前后大 鼠体重差异标准差一般在20 g左右。
若要使治疗前后对大鼠体重差异的估计 精确到5 g,则需要多少只大鼠做试验 (α=0.05) ?
n
2u2 pq L2
8 pq L2
其中:p 为合并百分率;q (1 p)。
例题7
对两个食品厂进行抽查后,发现甲厂产品 合格率为95%,乙厂为91%,若要推断 两厂间食品的合格率是否确实相差4%, 取α=0.05时至少要检验多少批食品? p 0.95 0.91 0.93 2
q 1 0.93 0.07
s n
L t0.05s n
平均数资料样本容量的确定
在L(置信半径)的计算公式中,s一
般根据前人经验或小型试验取得;n
一般取无穷大,则t0.05=1.96≈2。 可得:
n
t2 0.05
s
2
L2
Baidu Nhomakorabea
4s2 L2
若计算所得n<30,则将df= n-1带 入,直到计算出的n为稳定数值为止。
例题1
某果园内果树的平均果实产量标准差 s为10 kg。若以95%的可靠性估计 果树产量,要求误差不超过2 kg,问 应抽取多少果树做样本?