多阶段抽样

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多阶段抽样每一阶段的抽样可以相同,也 可以不同,它通常与整群抽样、分层抽样、 系统抽样结合使用.
实际工作中,多阶段抽样通常与整群抽 样结合使用,即前几阶是多阶段抽样, 最后一阶为整群抽样。
多阶段抽样时,抽样是分步进行的,因此, 讨论估计量 ˆ 的均值及方差时需要分阶 段进行,则用到下面的性质:
估计量p的方差为: V(p)的无偏估计为:
v( p n 1 -f - ) (1 1n i n ) 1(p i p )2 n f1 2 (( 1 m - f1 2)i n ) 1p iq i
类似于前面总体方差的表达形式,有:
S12 N11iN 1(Pi P)2
S22
M N(M1)
N i1
PiQi
均值 Y 的无偏估计为:
Yˆy1 ni n1yi n1m i n1
m
yij
j1
其方差为:
V(y)1 nf1S121n fm 2S22
方差 V ( y ) 的无偏估计为:
v(y)1 nf1s12f1(1 nm f2)s22
估计量的方差由两个分量组成:
其中源由第一阶抽样的第一项主要取决于第 一阶抽样的样本量n与初级单元间的方差S12
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
2、对抽中的次级单元进行再抽样,提高了效率
多阶段抽样能充分发挥抽样的效率,克服了整群抽样的缺点,即 避免了对小单元过多调查造成的浪费。
3、抽样框编制得以简化 多阶段抽样是分阶段实施的,因此抽样框也可以分 级进行准备:在第一阶抽样中,仅需准备总体中关 于初级单元的抽样框;在第二阶抽样中,仅需对那 些被抽中的初级单元准备二级单元的抽样框。更高 阶的也是如此,每次只需要对被抽中的单元准备下 一级抽样单元抽样框。
性质1可推广到多阶段抽样的情形,如三 阶段抽样:
E(ˆ) E1E2E3(ˆ) V(ˆ) V1[E2E3(ˆ)]E1{V2[E3(ˆ)]} E1E2[V3(ˆ)]
第二节 初级单元大小相等的二阶抽样
一、符号 二、总体均值的估计量及其性质 三、关于总体比例的估计
引:本节先讨论初级单元大小(即所包含的 次级单元数目)相等情形的二阶抽样。
源由第二阶抽样的第二项主要取决于第二阶 抽样的总样本量mn与初级单元内的方差S22
在通常情况下,第一项占总方差的绝大 部分,因此在固定次级单元样本量mn的 条件下,n愈大( m愈小),则方差就愈小。
【例8.1】
欲调查4月份100家企业的某项指标,首先 从100家企业中抽取了一个含有5家样本企业的 简单随机样本,由于填报一个月的数据需要每天 填写流水帐,为了减轻样本企业的负担,调查人 员对这5家企业分别在调查月内随机抽取3天作 为调查日,要求样本企业只填写这3天的流水帐. 调查的结果如下,要求根据这些数据推算100家 企业该指标的总量,并给出估计的95%置信区间.
i1
s22n(m 11)i n1
m
2
(yijyi)
i1
若记
S2i2
M 11jM 1(Yij
2
Yi)
则有
S22
1 N
N
S2i2
j1
同理 s22是s2i2的平均值。
二、总体均值 Y 的估计量及其性质
性质2 如果二阶抽样中的每一阶抽样都是简单随机的,
且对每个初级单元,第二阶抽样是相互独立的,则对总体
第一阶段和第二阶段的样本量:n,m;
第i个初级单元中第j个二级单元的观测 值:Yij(i=1,2,…N;j=1,2,…M)
样本中第i个初级单元中的第j个二级单元的观测 值:yij(i=1,2,…n;j=1,2,…m)
第一阶段和第二阶段的抽样比:
f1
n, N
f2
m M
总体和样本中第i个初级单元按二级单元的平均 值:
要求:根据这些数据推算居民家庭装潢聘请专业装潢公司的比例。
f2
4 12
5 f 1 15
p 1 n
nmi1
ai
1 (21101) 54
解 则14记:为聘0.“请250专”业装潢公司的居民户为“1”,否
N=15 M=12 n=5 m=4
v(p)
1- f1 n(n-1)
n i1
(pi
p)2百度文库
Mi
Yij
j1
Yi Mi
yi
1 mi
mi j1
yij
yi mi
总体及样本二级单元的平均值:
第九章 多阶段抽样
第一节 引言 第二节 初级单元大小相等的二阶抽样 第三节 初级单元大小不相等的二阶抽样 第四节 其他问题
第一节 概述
一、概述 二、多阶段抽样的定义及其与其他抽样的关系 二、多阶段抽样的特点和作用 三、抽选方法与推断原理
一、引言
采用整群抽样的主要理由是整群样本比较集中, 实施便利,每个基本单元的调查费用较低。
第一阶和第二阶的抽样比:
N
n
总M体0 及样M 本i指标总m和0 : mi
i1
i 1
总Y体及N 样Mi本Yij第i个初y级 单n 元mi指yi标j 总和:
i1 j1
i1 j1
M i
mi
总体Yi及 样本Y第ij i个初y i 级 单元y按ij 二级单元的平均值
j1
j1
Yi M 1i
4、多阶段抽样可用于散料的抽样.
所谓散料是指连续松散的不易区分为个体或 抽样单元的材料.如:矿石、煤、粮食、水泥、 化肥等等。
例如:对贮藏在仓库中的小麦中农药残留量 的监测.
首先,从仓库中抽若干麻袋
然后,再从每个抽中的麻袋中的不同部位抽取一 定数量的小麦样品(称为份样)进行测试。
三、抽选方法与推断原理
5家企业的调查结果
样本企业 第一日
1
57
2
38
3
51
4
48
5
62
第二日
59 41 60 53 55
第三日
64 50 63 49 54
样本企业
yi
s2i2
1
60
13
2
43
39
解:已知3N=100, M=5380, n=5,m=339
f1= n/N4 =5/100=0.5005,
7
f2= m/5M=3/30=0.1507
0.251.960.081 即9.1%40.9%之间 .
第三节 初级单元大小不等的 二阶抽样
一、一般说明及符号 二、估计量及其性质 三、估计量是自加权的条件及对初级单元的PPS抽样
一、一般说明及记号
与整群抽样类似,当初级单元大小不相等时的二 阶抽样有两种处理方法:
一种是将初级单元按大小分层,使层内的初级单元大 小大致相同,从而可用上一节的方法处理。
性质1 对于两阶段抽样,有
E(ˆ)E( 1 E2(ˆ)) V(ˆ)V1[E2(ˆ)]E1[V2(ˆ)]
• 式中,E2、V2为在固定初级单元时对第 二阶抽样求均值和方差;E1 、 V1为对第 一阶抽样求均值和方差.
上述1式是显然的。
2式证明如下:
V() E(ˆ2) [E(ˆ)]2 E1[E2(ˆ2)]{E1 [E2(ˆ)]}2 E1[E2(ˆ2)]{E1[E2(ˆ)]2 V1[E2(ˆ)]} V1[(E2(ˆ)]{E1[E2(ˆ2) E1[E2(ˆ)]2} V1[E2(ˆ)] E1[V2(ˆ)]
Yi M 1jM 1Yij,
yi m 1jm 1yij
总体和样本按二级单元的平均值:
1 N
YNi1Yi,
1n
yni1yi
总体和S样12 本N 初1级1单iN 1元(Y间i 的Y方)2,差:
s12
1 n n1i1
(yi
2
y)
初级S单22元N 内(M 的1 方1)差iN 1:
M
2
(YijYi)
p ni1
pi
nmi1ai
式中:ai为第i个样本初级单元中具有所研究特征的二级单元数。
E(p)P
性质3: 对于二阶抽样,如果两个阶段都是简 单随机抽样,则有
V ( 1 - n f p 1N 1 )1 iN 1(P i P )2 1 n f2m N (M M 1 )iN 1P iQ i
在社会经济调查中,多阶抽样常用于抽样单元 为各级行政单位的情况。例如,在一项全国性 调查中,往往将省、地市、县、街道(乡、 镇)、居(村)民委员会、居(村)民小组及 住户作为各级南样单元。在此,采用多阶段抽 样显然十分方便。
再如,在一个城市中,可以将区作为其中一级 单元,也可直接将街道作为一级单元;可以将 居委会作为街道下一级的单元,也可以将居民 小组作为街道下一级的单元。
置信区间:
1608010.969216 即1427.6361788.46之 3 间。
三、对总体的比例的估计
总体中具有所研究特征的二级单元占全体二级 单元数的比例为:
1 N
1N
PNi1Pi NM i1Ai
式中:Ai为第i个初级单元中具有所研究特征的二级单元数。
对总体比例P的估计是:
1 n
1n
样本单元 一栋A座
第一户 是
第二户 是
第三户 否
第四户 否
二栋C座




三栋C座




【例四8栋.2C】座 欲调查否某个新小区否居民户家庭否装潢聘请否专业装 潢公司的比例。在15个单元中随机抽取了5个单元,在这 5个五单栋元B中座分别随是机抽取了4户否 居民并进否行了调查否,对这 20户调查结果如下:
(二)多阶段抽样与其他抽样的关系
整群抽样可以看作是多阶段抽样的一种特殊情 形,即最后一阶抽样是100%的抽样。
分层抽样也可看作是多阶抽样的特例:此时每 个初级单元即是层,第一阶抽样是100%抽样, 而层内抽样是第二阶抽样。当然,层内抽样本 身也可能是多阶的。
在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
19
首先计算样本初级单元的均值和方差:
1 n 1
y n i1 yi 5(6043...57) 53.6
s12n1 1i n1(yi y)249 .3
s22
1 n
n i1
s2i2
23.4
v(y)1 nf1s12f1(1 nfm 2)s229.4372
Yˆ NMy 1003053.6160800 v(Yˆ) N2M2v(y) 84934800 s(Yˆ) 921.60078
它的最大缺点是由于群内小单元存在一定程度 的相似性(群内相关系数大于0),其抽样误 差高于同样样本量的简单随机抽样。
事实上,在多数情形,特别是当群的规模比较 大时,确实没有必要对群内所有次级单元都进 行调查。因此很自然地想到可以对每个被抽到 的群中的次级单元再次进行抽样。
二、多阶段抽样的定义及其与其他抽样的关系 (一)二阶段抽样
设总体由N个初级单元组成,每个初级单元又 由若干二级(次级)单元组成,若在总体中按 一定方法抽取n个初级单元,对每个被抽中的 初级单元再抽取若干二级单元进行调查,则这 种抽样称为二阶抽样,或二级抽样(two-stage sampling)
在二阶抽样中,全部抽样是分两步实施的:
第一步是从总体中抽初级单元,称为第一阶抽样;
f1(1f2) n2(m-1)
n i1
piqi
1 5 15
2
1
2
1
1
2
1
1
2
0
1
2
1
1
2
5(51) 4 4 4 4 4 4 4 4 4 4
5 1 4 15 12
5241
2 4
2 4
1 4
3 4
...
1 4
3 4
0.00657
标准差为s(p)=0.081
若以95%的概率估计居民户装潢聘请专业公司的 比例在:
此时两阶抽样中的每一阶都可采用简单随机 抽样:第一阶抽样从总体N个初级单元中抽 取n个初级单元,第二阶抽样则是从每个被 抽中的初级单元(设每个包含M个次级单元) 中抽取m个次级单元。
假定:在抽中的若干初级单元中作第二阶抽 样是相互独立地进行的。
初一级、单符元号的个说数明:N
二级单元的个数:M
另一种方法是考虑用不等概率抽样抽取初级单元。
符号说明:
总体中初级单元的个数以及第一阶抽取的样本量:N,
n
第i个初级单元中二级单元的个数Mi
第第样ii本个个中初初第级级i单单个f元元初1 中中级Nn第第单二元j个阶中二抽的级f 2样第单 的jMm元个样ii 的二本观级量测单m值元i :的观Yij测值:yij
第二步是从每个被抽中的初级单元中抽二级单元, 称为第二阶抽样。
如果每个二级单元又由更小的三级单元 组成,那么第二阶抽样后,若对每个被 抽中的二级单元中的三级单元再进行抽 样,则是三阶抽样。
如果对每个被抽中的二级单元不再抽样, 调查其中每个三级单元,则称为二阶整 群抽样。
以此类推,可定义更高阶的多阶抽样 (multi-stage sampling)或多阶整群抽 样(multi-stage cluster sampling)。
相关文档
最新文档