多阶段抽样

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


多阶段抽样每一阶段的抽样可以相同,也 可以不同,它通常与整群抽样、分层抽样、 系统抽样结合使用. 实际工作中,多阶段抽样通常与整群抽 样结合使用,即前几阶是多阶段抽样, 最后一阶为整群抽样。

多阶段抽样时,抽样是分步进行的,因此, ˆ 的均值及方差时需要分阶 讨论估计量 段进行,则用到下面的性质:
第九章 多阶段抽样

第一节 第二节 第三节 第四节
引言 初级单元大小相等的二阶抽样 初级单元大小不相等的二阶抽样 其他问题
第一节 概述


一、概述 二、多阶段抽样的定义及其与其他抽样的关系 二、多阶段抽样的特点和作用 三、抽选方法与推断原理
一、引言



采用整群抽样的主要理由是整群样本比较集中, 实施便利,每个基本单元的调查费用较低。 它的最大缺点是由于群内小单元存在一定程度 的相似性(群内相关系数大于0),其抽样误 差高于同样样本量的简单随机抽样。 事实上,在多数情形,特别是当群的规模比较 大时,确实没有必要对群内所有次级单元都进 行调查。因此很自然地想到可以对每个被抽到 的群中的次级单元再次进行抽样。
1 n 1 p ai (2 1 1 0 1) nm i 1 5 4 1 0.25 4
12
1
15
1 - f1 n f1 (1 f 2 ) n 2 v(p) ( p i p) 2 piq i n(n - 1) i 1 n (m - 1) i 1 5 2 2 2 2 2 1 2 1 1 1 1 1 0 1 1 1 15 5(5 1) 4 4 4 4 4 4 4 4 4 4 5 4 1 1 3 15 12 2 2 1 3 2 ... 5 4 1 4 4 4 4 4 4 0.00657

【例8.1】 欲调查4月份100家企业的某项指标,首先 从100家企业中抽取了一个含有5家样本企业的 简单随机样本,由于填报一个月的数据需要每 天填写流水帐,为了减轻样本企业的负担,调查 人员对这5家企业分别在调查月内随机抽取3天 作为调查日,要求样本企业只填写这3天的流水 帐.调查的结果如下,要求根据这些数据推算 100家企业该指标的总量,并给出估计的95%置 信区间.


第一步是从总体中抽初级单元,称为第一阶抽样; 第二步是从每个被抽中的初级单元中抽二级单元, 称为第二阶抽样。



如果每个二级单元又由更小的三级单元 组成,那么第二阶抽样后,若对每个被 抽中的二级单元中的三级单元再进行抽 样,则是三阶抽样。 如果对每个被抽中的二级单元不再抽样, 调查其中每个三级单元,则称为二阶整 群抽样。 以此类推,可定义更高阶的多阶抽样 (multi-stage sampling)或多阶整群抽 样(multi-stage cluster sampling)。



(二)多阶段抽样与其他抽样的关系 整群抽样可以看作是多阶段抽样的一种特殊情 形,即最后一阶抽样是100%的抽样。 分层抽样也可看作是多阶抽样的特例:此时每 个初级单元即是层,第一阶抽样是100%抽样, 而层内抽样是第二阶抽样。当然,层内抽样本 身也可能是多阶的。 在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。

4、多阶段抽样可用于散料的抽样.


所谓散料是指连续松散的不易区分为个体或 抽样单元的材料.如:矿石、煤、粮食、水泥、 化肥等等。 例如:对贮藏在仓库中的小麦中农药残留量 的监测.


首先,从仓库中抽若干麻袋 然后,再从每个抽中的麻袋中的不同部位抽取一 定数量的小麦样品(称为份样)进行测试。
三、抽选方法与推断原理
1 S1 (Yi Y ) , N 1 i 1
2
N
2
s
2 1
1 ( yi y ) n 1 i 1
n
2

初级单元内的方差:
1 S2 N (M 1) i 1
2 N
(Y
i 1
M
2
ij
Yi )
2
1 s2 n(m 1) i 1
2
n
( y
ˆ NMy 100 30 53.6 160800 Y ˆ ) N 2 M 2v( y ) 84934800 v(Y ˆ ) 9216 s(Y .0078
置信区间:
160800 1.96 9216 即 142736 .6 178863 .4之间。
三、对总体的比例的估计
i 1
m
ij
yi )

若记
S2i
2

1 (Yij Yi ) M 1 j 1
N 1 2 2 S 2 S 2i N j 1
M
2

则有

同理
s2 是s2i 的平均值。
2
2
二、总体均值 Y 的估计量及其性质

性质2 如果二阶抽样中的每一阶抽样都是简单随机的, 且对每个初级单元,第二阶抽样是相互独立的,则对总体 均值 Y 的无偏估计为:
一、符号说明


初级单元的个数:N 二级单元的个数:M 第一阶段和第二阶段的样本量:n,m; 第i个初级单元中第j个二级单元的观测 值:Yij(i=1,2,…N;j=1,2,…M) 样本中第i个初级单元中的第j个二级单元的观测 值:yij(i=1,2,…n;j=1,2,…m)

第一阶段和第二阶段的抽样比:
ˆ 1 n 1 n m Y y yi yij n i 1 nm i 1 j 1

其方差为:
1 f1 2 1 f 2 2 V ( y) S1 S2 n nm
1 f1 ቤተ መጻሕፍቲ ባይዱ f1 (1 f 2 ) 2 v( y ) s1 s2 n nm

方差 V ( y ) 的无偏估计为:
类似于前面总体方差的表达形式,有:
N 1 2 S12 ( P P ) i N 1 i 1 N M 2 S2 Pi Qi N(M 1) i 1

【例8.2】欲调查某个新小区居民户家庭装潢聘请专业装 潢公司的比例。在15个单元中随机抽取了5个单元,在这5 个单元中分别随机抽取了4户居民并进行了调查,对这20 户调查结果如下:

性质3: 对于二阶抽样,如果两个阶段都是简 单随机抽样,则有
E ( p) P

估计量p的方差为:
N 1 - f1 1 N 1 f M 2 2 V(p) ( P P ) Pi Qi i n N 1 i 1 nm N(M 1) i 1
V(p)的无偏估计为:
n 1 - f1 n f (1 f ) 2 1 2 v(p) ( p p ) pi q i i 2 n(n - 1) i 1 n (m - 1) i 1

3 4 5
58 50 57
39 7 19
1 n 1 y yi (60 43 ... 57) 53.6 n i 1 5
s
2 1
1 ( yi y ) 49.3 n 1 i 1
n
2
s2
2
1 n 2 s2i 23.4 n i 1
1 f1 2 f1 (1 f 2 ) 2 v( y ) s1 s2 9.4372 n nm

5家企业的调查结果
样本企业 第一日 第二日 第三日
1 2 3 4
57 38 51 48
59 41 60 53
64 50 63 49
5
62
55
54
解:已知 N=100, M=30, n=5,m=3 f1= n/N=5/100=0.05, f2= m/M=3/30=0.10 首先计算样本初级单元的均值和方差: 2 yi 样本企业 s2 i 1 60 13 2 43 39

估计量的方差由两个分量组成:


其中源由第一阶抽样的第一项主要取决于第 一阶抽样的样本量n与初级单元间的方差S12 源由第二阶抽样的第二项主要取决于第二阶 抽样的总样本量mn与初级单元内的方差S22

在通常情况下,第一项占总方差的绝大 部分,因此在固定次级单元样本量mn的 条件下,n愈大( m愈小),则方差就愈小。


在社会经济调查中,多阶抽样常用于抽样单元 为各级行政单位的情况。例如,在一项全国性 调查中,往往将省、地市、县、街道(乡、 镇)、居(村)民委员会、居(村)民小组及 住户作为各级南样单元。在此,采用多阶段抽 样显然十分方便。 再如,在一个城市中,可以将区作为其中一级 单元,也可直接将街道作为一级单元;可以将 居委会作为街道下一级的单元,也可以将居民 小组作为街道下一级的单元。
n m f1 , f2 N M

总体和样本中第i个初级单元按二级单元的平 均值:
1 Yi M
Y ,
j 1 ij
M
1 m yi yij m j 1

总体和样本按二级单元的平均值:
1 N Y Yi , N i 1 1 n y yi n i 1

总体和样本初级单元间的方差:
性质1 对于两阶段抽样,有
ˆ) E ˆ)) E ( ( E ( 1 2 ˆ) V [ E ( ˆ)] E [V ( ˆ)] V ( 1 2 1 2
• 式中,E2、V2为在固定初级单元时对第 二阶抽样求均值和方差;E1 、 V1为对 第一阶抽样求均值和方差.
上述1式是显然的。 2式证明如下:
样本单元
一栋A座 二栋C座 三栋C座 四栋C座
第一户
是 否 否 否 是
第二户
是 是 否 否 否
第三户
否 否 否 否 否
第四户
否 否 是 否 否
五栋B座
要求:根据这些数据推算居民家庭装潢聘请专业装潢公司的比例。

解:聘请专业装潢公司的居民户为“1”,否 则记为“0” 4 5 f N=15 M=12 n=5 m=4 2 f

总体中具有所研究特征的二级单元占全体二级 单元数的比例为:
N 1 N 1 P Pi Ai N i 1 NM i 1
式中:Ai为第i个初级单元中具有所研究特征的二级单元数。 对总体比例P的估计是:
1 n 1 n p pi ai n i 1 nm i 1
式中:ai为第i个样本初级单元中具有所研究特征的二级单元数。
ˆ 2 ) [ E ( ˆ)]2 V ( ) E ( ˆ 2 )] {E [ E ( ˆ)]}2 E1[ E2 ( 1 2 ˆ 2 )] {E [ E ( ˆ)]2 V [ E ( ˆ)]} E1[ E2 ( 1 2 1 2 ˆ)] {E [ E ( ˆ 2 ) E [ E ( ˆ)]2 } V [(E (
1 2 3
第二节 初级单元大小相等的二阶抽样

一、符号 二、总体均值的估计量及其性质 三、关于总体比例的估计



引:本节先讨论初级单元大小(即所包含的 次级单元数目)相等情形的二阶抽样。 此时两阶抽样中的每一阶都可采用简单随机 抽样:第一阶抽样从总体N个初级单元中抽 取n个初级单元,第二阶抽样则是从每个被 抽中的初级单元(设每个包含M个次级单元) 中抽取m个次级单元。 假定:在抽中的若干初级单元中作第二阶抽 样是相互独立地进行的。
1 2 1 2 1 2
ˆ)] E [V ( ˆ)] V1[ E2 ( 1 2

性质1可推广到多阶段抽样的情形,如三 阶段抽样:
ˆ) E E E ( ˆ) E ( 1 2 3 ˆ) V [ E E ( ˆ)] E {V [ E ( ˆ)]} V ( 1 2 3 1 2 3 ˆ)] E E [V (
三、多阶段抽样的特点及作用

1、实施方便,节省费用

保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;. 多阶段抽样能充分发挥抽样的效率,克服了整群抽样的缺点, 即避免了对小单元过多调查造成的浪费。

2、对抽中的次级单元进行再抽样,提高了效率


3、抽样框编制得以简化 多阶段抽样是分阶段实施的,因此抽样框也可以分 级进行准备:在第一阶抽样中,仅需准备总体中关 于初级单元的抽样框;在第二阶抽样中,仅需对那 些被抽中的初级单元准备二级单元的抽样框。更高 阶的也是如此,每次只需要对被抽中的单元准备下 一级抽样单元抽样框。
二、多阶段抽样的定义及其与其他抽样的关系


(一)二阶段抽样 设总体由N个初级单元组成,每个初级单元又 由若干二级(次级)单元组成,若在总体中按 一定方法抽取n个初级单元,对每个被抽中的 初级单元再抽取若干二级单元进行调查,则这 种抽样称为二阶抽样,或二级抽样(two-stage sampling) 在二阶抽样中,全部抽样是分两步实施的:
相关文档
最新文档