第九章(多阶段抽样)教学提纲
多阶段抽样(PPT69页)
2.比率估计量 为了减小方差,可以考虑将初级单元的大小
Mi作为辅助变量,采用比率估计量对总体总 和进行估计。 对总体总和的比率估计量:
这个比率估计量是有偏的,但随着样本量的增加,其偏倚将趋于0。
• 其近似均方误差为:
• 因为 的差异一般不会很大,因此,当Mi相
差很大时,
要比无偏估计量 的方差
在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
2、对抽中的次级单元进行再抽样,提高了效率
多阶段抽样能充分发挥抽样的效率,克服了整群抽样的缺点,即 避免了对小单元过多调查造成的浪费。
• 估计量p的方差为: V(p)的无偏估计为:
类似于前面总体方差的表达形式,有:
• 【例8.2】欲调查某个新小区居民户家庭装潢聘请专业装潢 公司的比例。在15个单元中随机抽取了5个单元,在这5个 单元中分别随机抽取了4户居民并进行了调查,对这20户 调查结果如下:
样本单元 一栋A座 二栋C座 三栋C座 四栋C座
样本企业
1
60
13
2
43
39
3
58
39
4
50
7
5
57
19
置信区间:
三、对总体的比例的估计
总体中具有所研究特征的二级单元占全体二级 单元数的比例为:
式中:Ai为第i个初级单元中具有所研究特征的二级单元数。 对总体比例P的估计是:
式中:ai为第i个样本初级单元中具有所研究特征的二级单元数 。
• 性质3: 对于二阶抽样,如果两个阶段都是简单 随机抽样,则有
第九章 多阶段抽样
第九章 多阶段抽样第一节 多阶抽样概述一、 多阶抽样的概念1、单阶抽样:从总体中通过一次抽样就能够产生一个完整的样本,这类抽样即为单阶抽样。
前面介绍的几种抽样方式均为单阶抽样。
适合用于总体单元数相对较少的抽样过程。
2、多阶抽样:将整个抽样过程分成若干个阶段,一个阶段一个阶段地进行抽样以完成整个抽样过程,这种抽样即为多阶抽样。
当我们面对的总体单元数很庞大,而且分布范围很广时,如果使用前面所学习的单阶抽样方法,不仅工作量大,而且在精度上很难把握,此时如果改用多阶抽样方法,就会避免上述困难,从而达到理想的抽样效果。
3、关于多阶抽样的具体描述:如果我们面对的一阶单元内总体基本单元数相当大,作全面的调查就会比较困难,或者一阶单元内各二阶单元可以给出相近的结果,作全面的调查又无必要。
此时从费用和抽样估计效率考虑,便可以从总体中随机抽取一部分一阶单元,然后再从被抽中的一阶单元内,随机抽取部分二阶单元并对他们作全面调查,我们把这种抽样技术称为两阶抽样。
如果在被抽中的二阶单元中,再抽取部分三阶单元组成样本,并对抽中的三阶单元进行全面的调查,这就是三阶抽样。
类似地,可以定义四阶抽样或更高阶的抽样,通常将两阶以上的抽样称为多阶抽样。
需要指出的是,多阶抽样中,各阶可以采用不同的抽样方法,也可采用同一种抽样方法,要视具体情况和要求而定。
在两阶抽样中,总体各一阶单元所包含的二阶单元数,有相等和不相等的两种情况。
前者无论在样本的抽取还是在指标的估算方面都相对比较简单,然而在抽样实践中却很少有这种情况的存在,但作为基本方法仍然有其实际意义;后种情况在抽样和指标的估算方法上都较为复杂,然而在实际中普遍存在此种情况。
4、两阶抽样与分层抽样和整群抽样的关系:将总体分为若干个一阶单元,如果在每一个一阶单元中,都随机抽取部分二阶单元,由这些二阶单元中的总体基本单元组成的样本,在抽样的方式上,就相当于分层抽样;如果在全部的一阶单元中,只抽取了部分一阶单元,并对抽中的一阶单元中的所有的基本单元都做全面调查,这就是整群抽样。
第8-9章-多阶段抽样和二重抽样
ˆ ˆ E E E E
2
2
1
2
E 2 E E 2 V E ˆ ˆ E1 2 ˆ 1 2 1 2
E 2 E E 2 ˆ ˆ V1 E2 E1 2 ˆ 1 2 ˆ ˆ V1 E2 E1 V2
2 S2 V ( y ) S12 m
2 当n=1时, V1 (Yi ) S1
这时, 若以n个
yi 的均值 y 推断 Y
,其方差为
2 2 S1 S2 V ( y) n nm
再考虑fpc,则(1)式成立。
V y 的无偏估计为:
证明:
2 1
E (s ) S
2 2
1 f1 2 f1 1 f 2 2 v y s1 s2 n nm
1 1 n 1 1 E1 M iYi M n i 1 MN
M iYi Y i 1
N
估计量的方差为:
1 f1 M i 1 V y M Yi Y nNM 2 nN i 1 i 1
N N
二.按不等概抽初级单元
1.按PPS抽取初级单元 N 第i个单元被选中概率 Z i ,( Z i 1 ) i 1 以总量估计为例,利用Hansen-Hurwitz估计量 ˆ Y的估计: 1 n Y 1 n M y
ˆ YHH
z n
i 1
i
i
n
i 1
i
i
zi
ˆ 可以证明 YHH是Y的无偏估计
多阶抽样
多阶抽样第九章 多阶段抽样第一节 多阶抽样概述一、 多阶抽样的概念将整个抽样过程分成若干个阶段,一个阶段一个阶段地进行抽样以完成整个抽样过程,这种抽样即为多阶抽样。
分层抽样实际是第一阶抽样比为100%时的一种特殊的两阶抽样;而整群抽样实际上是第二阶抽样比为100%时的一种特殊的两阶抽样,故也称单级整群抽样。
多阶抽样的特征:便于组织抽样;抽样方式灵活,有利于提高抽样的估计效率;多阶段抽样对基本调查单元的抽选不是一步到位的;多阶段抽样实质上是分层抽样与整群抽样的有机结合;多阶抽样在抽样时并不需要二阶或更低阶单元的抽样框;多阶抽样还可用于“散料”的抽样,即散料抽样。
第二节 一阶单元等大小的二阶抽样第一阶段在总体N 个初级单元中,以简单随机抽样抽取n 个初级单元,第二阶段在被抽取的初级单元包含的M 个二级单元中,以简单随机抽样抽取m 个二级单元,即最终接受调查的单元。
(一)估计量及其方差对于二阶抽样,若两个阶段的抽样都是简单随机的,则其总体均值Y 的无偏估计量为0111ˆ1n mnij i i j i Y y y m y n ======∑∑∑.由于在每个一阶单元中的第二阶抽样是相互独立进行的,所以,在二阶段都用不放回方法抽样时,其总体均值估计量的方差可构造为22221111)(S mnf S n f y V -+-==NS mn S M SS n 21222221)(1-+- 可以证明其方差的无偏估计量为2221211)1(1)(ˆs mnf f s n f y V -+-=其中,22s 为22S 的无偏估计,21s 不属于21S 的无偏估计,21S 的无偏估计为22221211ˆs mf s S --=式中右边第一部分相当于第一阶段抽样的误差,它只与各一阶单元间差异大小有关;第二部分相当于第二阶段抽样的误差,它只与各一阶单元内(即各二阶单元间)差异有关。
(二)最佳抽样比的确定在总费用一定时,考虑下述简单的线性费用函数:nm C n C C C 210++=若一阶级单元间的旅费不占重要位置,则上述费用函数被证明是适用的。
第九章(多阶抽样)
copyright©princebf,2006-2007
f2=m/M 第二阶段抽样比
copyright©princebf,2006-2007
#二阶抽样图示
总 体
样本
copyright©princebf,2006-2007
• 在上述过程中,如果次级单元又由若干三级单元组成,在抽样 时对每个被抽中的次级单元内的三级单元再进行抽样,则是三 阶抽样。更高阶的抽样以此类推。 • 如果对三级单元不再抽样,而是进行全面调查,则称为二阶整 群抽样。更高阶的多阶整群抽样以此类推。 • 可见,整群抽样可以看作是二阶抽样的特例:第一阶抽取群,
§9.2 初级单元大小相等时的二阶抽样
一、相应符号 二、总体均值的估计和性质
三、总体总量的估计和性质
四、总体比例的估计和性质
copyright©princebf,2006-2007
• 初级单元大小相等是指初级单元内包含的次级单元数目相同, 不妨设每个初级单元包含M个次级单元
• 此时,两阶抽样中的每一阶抽样都可采用简单随机抽样
1 n 2 s2 i n i 1
样本中初级单元内的方差
copyright©princebf,2006-2007
二、总体均值的估计和性质
• 按前述抽样方式(每一阶抽样都是简单随机的;第二阶抽样是 相互独立的),则有:样本按次级单元的均值是总体均值的无偏 估计。即:
ˆ 1 1 Y y yij n yi nm i 1 j 1 i 1
多阶段抽样ppt课件
n
m
f1 N , f2 M
16
总体和样本中第i个初级单元按二级单元的平均 值:
Yi
1 M
MYij ,j来自1它的最大缺点是由于群内小单元存在一定程度 的相似性(群内相关系数大于0),其抽样误 差高于同样样本量的简单随机抽样。
事实上,在多数情形,特别是当群的规模比较 大时,确实没有必要对群内所有次级单元都进 行调查。因此很自然地想到可以对每个被抽到 的群中的次级单元再次进行抽样。
3
二、多阶段抽样的定义及其与其他抽样的关系
第九章 多阶段抽样
第一节 引言 第二节 初级单元大小相等的二阶抽样 第三节 初级单元大小不相等的二阶抽样 第四节 其他问题
1
第一节 概述
一、概述 二、多阶段抽样的定义及其与其他抽样的关系 二、多阶段抽样的特点和作用 三、抽选方法与推断原理
2
一、引言
采用整群抽样的主要理由是整群样本比较集中, 实施便利,每个基本单元的调查费用较低。
个初级单元即是层,第一阶抽样是100%抽样, 而层内抽样是第二阶抽样。当然,层内抽样本 身也可能是多阶的。 在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
6
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
第一步是从总体中抽初级单元,称为第一阶抽样; 第二步是从每个被抽中的初级单元中抽二级单元,
称为第二阶抽样。
4
如果每个二级单元又由更小的三级单元 组成,那么第二阶抽样后,若对每个被 抽中的二级单元中的三级单元再进行抽 样,则是三阶抽样。
如果对每个被抽中的二级单元不再抽样, 调查其中每个三级单元,则称为二阶整 群抽样。
抽样技术(第5版)课件PPT课件第9章
i
Y ) nN 具有无偏估计:
v( y )
n
(y
i 1
i
y ) 2 n(n 1)
n
y
i 1
i
n 是 Y 的无偏估计。其方差 V ( y )
2.放回的PPS抽样
假设按放回的 PPS 抽样方式抽取一个样本量为 n 的样本,第 j 个单元每次入样的概率
为 Z j ,则总体总和 Y 的估计及其方差为:
ത
就不独立了。令መ = 由于其为线性形式,故总体均值
ത
的刀切法估计量即
መ
为其本身:
1
መ
ҧ = መ = ത
=1
መҧ
的方差估计为:
1
መҧ =
=1
=1
1
−1
መ
2
(መ − )ҧ =
[ത − ]
ത2
( − 1)
4.用于比率估计
假定要估计比值 = /,其中Y与X是总体总和。通常的估计量 =
1
ҧ 2
( − )
( − 1)
=1
随机组的划分和组数的确定
独立随机组不存在随机组的划分问题
非独立随机组情形,需要考虑如何进行随机组
的划分
随机组的划分的一个基本原则:
每个随机组本质上具有与原始样本相同的抽
样设计
在各种抽样方法下,如何进行随机组的划分?
1.
2.
3.
不放回简单随机抽样或抽样:将原始样本进行随
将1 放回总体,按相同的方式抽取样本2
重复上述过程,直至获得k个样本
令为目标参数, ( = 1, … , )表示第j个
多阶段抽样方法培训讲义(PPT69页)
多阶段抽样方法培训讲义(PPT69页)
性质1可推广到多阶段抽样的情形,如三 阶段抽样:
E(ˆ) E1E2 E3 (ˆ) V (ˆ) V1[E2 E3 (ˆ)] E1{V2[E3 (ˆ)]} E1E2[V3 (ˆ)]
3、抽样框编制得以简化 多阶段抽样是分阶段实施的,因此抽样框也可以分 级进行准备:在第一阶抽样中,仅需准备总体中关 于初级单元的抽样框;在第二阶抽样中,仅需对那 些被抽中的初级单元准备二级单元的抽样框。更高 阶的也是如此,每次只需要对被抽中的单元准备下 一级抽样单元抽样框。
多阶段抽样方法培训讲义(PPT69页)
多阶段抽样方法培训讲义(PPT69页)
多阶段抽样方法培训讲义(PPT69页)
多阶段抽样时,抽样是分步进行的,因此, 讨论估计量 ˆ的均值及方差时需要分阶段 进行,则用到下面的性质:
性质1 对于两阶段抽样,有
E(ˆ) E(1 E2 (ˆ)) V (ˆ) V1[E2 (ˆ)] E1[V2 (ˆ)]
多阶段抽样方法培训讲义(PPT69页)
多阶段抽样方法培训讲义(PPT69页)
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
2、对抽中的次级单元进行再抽样,提高了效率
多阶段抽样能充分发挥抽样的效率,克服了整群抽样的缺点,即 避免了对小单元过多调查造成的浪费。
(二)多阶段抽样与其他抽样的关系 整群抽样可以看作是多阶段抽样的一种特殊情
形,即最后一阶抽样是100%的抽样。 分层抽样也可看作是多阶抽样的特例:此时每
个初级单元即是层,第一阶抽样是100%抽样, 而层内抽样是第二阶抽样。当然,层内抽样本 身也可能是多阶的。 在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
第九章(多阶段抽样)
抽样调查
原理与方法
性质1可以推广到分多步抽样的情形,例如 对于三阶段抽样,有
Eˆ E1E2E3 ˆ
V ˆ V 1 E 2 E 3ˆ E 1 V 2 E 3ˆ E 1 E 2 V 3ˆ
抽样调查
原理与方法
第二节 初级单元大小相 等时的二阶抽样
采用 srs,从 N 中抽 n 个初级单元 采用 srs 从每个中选初级单元中抽取 m 个次级单元
M
或S
2 1
S
2 2
M
0 ,则取
。
抽样调查
原理与方法 第三节 初级单元大小不等时的二阶抽样
一、一 般 说 明
几种处理方法 * 先 分 层 ,再 抽 样 *不等概抽样
必要符号补充
N
M 0 : M 0 M i
抽样调查
原理与方法
f 2 i: f 2 i M m i i
S 2 2 i M 1 i 1 M i( Y i j Y i ) 2
C2m)
其中:
S
2
S
2 1
S
2 2
M
抽样调查
原理与方法
使上式达到极小的充要条件是
S S2
m
C1 C2m
从而 mopt 满足
mopt
S2 S
C1 C2
抽样调查
原理与方法
由上式看出,m与
S
2 2
,C
1
成正比,与
S
2 1
,C 2
成反比。
求出m后,利用(4),(5)式,即可求出n.
抽样调查
原理与方法
抽样调查
原理与方法
如果每个二级单元又由更小的三级单元组 成,那么在第二阶段抽样后,若在每个 被抽中的二级单元中再进行三级单元的 抽样,则是三阶段抽样(三阶抽样)。 同样的道理,还可以定义更高阶段抽样 。对于二阶段以上的抽样,称为多阶段 抽样(多阶抽样)。
社会调查方法多阶段抽样
每个区抽20所学校 每所学校抽6名教师 每个区抽12所学校 每所学校抽20名教师 每个区抽10所学校 每所学校抽40名教师
方案5
从10个区中抽1个区
每个区抽12所学校 每所学校抽100名教师
不难发现,这5种抽样方案中,方案2的精确性是最高的,因为它在前两个阶段抽取的 子样本的数量最多,抽样的范围最广;方案5的精确性最低,也是最简便易行的,因为其在 第一个阶段就限定了抽样的范围在一个区内进行。
然后按照随机原则从第一级单位中随机抽取若干单位作为第一级单位样本再从第一级单位样本中随机抽取若干单位作为第二级单位样本以此类推直至获得所需要的样本
任务三 抽样方案的制定
(五)多 阶 段 抽 样
定 义
多阶段抽样是一种分阶段从调查对象的总体中抽取样本 进行调查的方法。 • 多阶段抽样首先要将总体单位按照一定的标准划分为若 干群体,作为抽样的第一级单位;再将第一级单位分为若 干小的群体,作为抽样的第二级单位;以此内推,可根据 需要分为第三级或第四级单位。然后,按照随机原则从第 一级单位中随机抽取若干单位作为第一级单位样本,再从 第一级单位样本中随机抽取若干单位作为第二级单位样本, 以此类推,直至获得所需要的样本。 •
图3-4 五种概率抽样方法比较图
简单随机抽样
系统抽样
分层抽样(不按比例分层)
分层抽样(按比例分层)
ቤተ መጻሕፍቲ ባይዱ
整群抽样
多阶段抽样
夯实基础
• 总体(population)总体一般与构成它的元素共同来定义, 总体就是构成它的所有元素的集合,而元素是构成总体的 最基本单位。社会调查中,我们通常用N表示。 • 样本(sample)样本就是按照一定的方式从总体中抽取出 来的那一部分元素的集合。用n来表示。 • 抽样框(Sampling Frame)抽样框也称抽样范围,是一 次直接抽样的总体中所有抽样单位的名单。
抽样调查09
9.3初级单元大小不等时的二阶抽样(I)
• 9.3.1记号
N
记:Yiji=1,K , N,j=1,K , Mi, M0 Mi
i 1
为总体中第i个初级单元中第j个次级单元的指标值,
记:yiji=1,K , n,j=1,K , mi 为样本中第i个初级单元中第j个次级单元的指标值
f1
n N
,f2i
Yˆ HH =
1 n
n i=1
Miyi zi
Var(Yˆ HH )=
1 n
N i=1
Zi
Yi Zi
2
Y
1 n
N
M
2 i
i=1
1 f2i Zi
S22i
v(Yˆ HH )=
1
n n-1
n i=1
Miyi zi
Yˆ HH
2
(9.22) (9.23) (9.24)
9.3初级单元大小不等时的二阶抽样(I)
nm
n i=1
m
yij
j=1
1 n
n
yi
i=1
作为总体均值的估计
Y= 1
NM
N i=1
M
Yij
j=1
1 N
N
Yi
i=1
的估计,有如下性质:
1. Ey Y
2.
Var(y)= 1-f1 n
S12
1-f2 mn
S22
(9.3) (9.4)
9.2初级单元大小相等时的二阶抽样
• 9.2.2总体均值的估计及其性质
一般意义而言,两次抽样的期望和方差公式为:
1. 期望: Eˆ=E1E2ˆ
(9.5)
2.方差:
Var(ˆ)=V1 E2
抽样方法-多段抽样
多段抽样的优势
调 查 位 对 象 、 。 况 复 范 杂 的 、 大 适 围 别 可 抽 的 情 总 体 它 特 就 位 一 般 情 , 解 级 单 , 体 外 调 查 物 从 , 多 调 查 此 所 下 了 一 低 查 总 另 。 佳 人 财 , 综 用 点 各 的 , 较 调 于 。 因 有 对 要 求 解 目 的 得 最 最 小 以 利 的 优 以 把 法 出 可 方 了 单 用 样 况 情 只 要 况 的 对 果 的 耗 到 获 以 加 方 法 它 抽 样 以 看 可 , 它 效 消 达 来 样 是 机 例 力 而 起 抽 合 种 优 点 段 随 上 多 • 从
多段抽样
定义
• 多段抽样(多级抽样或分段抽样),是按 抽样元素的隶属关系,把抽样过程分为几 个阶段抽样。
具体做法
• :(1)先将调查总体各单位按一定标志分成若干集 体,作为抽样的第一级单位。然后将第一级单位 又分成若干小的集体,作为抽样的第二级单位。 依此类推,还可分为第三级、第四级单位。 • (2)依照随机原则,先在第一级单位中抽出若干 单位作为第一级样本,然后再在第一级样本中抽 出第二级样本,依此类推,还可抽出第三级样本、 第四级样本。调查对象至第二级样本者,为两段 随机抽样;至第三级、第四级样本者,为三段或 四段随机抽样。
需要说明的注意点
• 在每个阶段的抽样,都要采取简单随机 简单随机 抽样或等距抽样或分层抽样的方法进行。 抽样 • 要在类别与个体之间保持平衡(保持适当 比例)
举例说明
• 为了了解河南大学大一新生上半学期学习与生活 状况,需要从全校大一新生这一总体中抽取样本 进行访谈。我们可以把抽样过程分为几个阶段。 • 1.确定抽样单位 ,我们可以根据学校的情况确定 四个阶段,确定各学院作为第一级单位,专业作 为第二级单位,班级为第三级单位。学生作为第 四级单位。然后,采取不同抽样方法,分四段逐 步抽取样本。 • 2.以院为单位抽样,从新老区中随机抽一部分学 院。然后在抽中的学院中,以专业为抽样单位, 从中在抽取部分专业。接着由专业抽班级,最后 由班级抽学生。
多阶段抽样(抽样技术__蒋妍)
C2m)
(S2
S22 m
)(C1
C2m)
其中:
S
2
S
2 1
S
2 2
M
使上式达到极小的充要条件是
S S2 m
C1 C2m
从而 mopt 满足
mopt
S2 S
C1 C2
由上式看出,m与
S
2 2
,C1 成正比,与
S12
,C2
成反比。
求出m后,利用(4),(5)式,即可求出n.
分层二阶段抽样时的估计
要求根据这些数据推算100家企业该指标 的总量,并给出估计的95%置信区间。
样本企业 1 2 3 4 5
第一日 57 38 51 48 62
第二日 59 41 60 53 55
第三日 64 50 63 49 54
f1
n N
5 100
0.05
样本企业 1 2 3 4 5
m3 f2 M 30 0.10
第一阶段:分层抽样,同一层内初级单元
大小相等 总体均值的估计
NhM h yh
yst h
NhMh
ˆ Wh yh
h
h
V ( yst )
h
Wh2
1
f1h nh
S12h
1 f2h nhmh
S22h
v( yst )
h
Wh2
1
f1h nh
s12h
f1h
(1 f2h nh mh
)
s22h
V ( y)
S12
S
2 2
n nm
再考虑fpc,则(1)式成立。
V
y
1 n
f1
S12
z-CH9多阶段抽样-第1、2节
MS的优点
(P189)
1、简化抽样框的编制工作,便于组织抽样 对范围较大、分布较广、单元数多的目标总体,实 施MS,按现有的行政区划(或地理区域)划分各阶段 抽样单元,从而简化抽样框的编制工作,便于样本 单元的抽取 2、可以使抽样方式更加灵活和多样 MS中,各阶段可根据具体情况分别设计和采用不同 的抽样组织方式(MS经常与st、cl、sy、PPS等相结 合),从而充分发挥各种抽样方式的优势 同时,各阶段也可以自行采用不同的估计方法
2019/2/11
统计学专业必修课3学分
9
MS的优点(续)
3、能够提高估计精度 与CL相比,相同的n,MS的样本在总体中的分布更广,因 而也更具代表性 同时,MS可以通过对方差较大的阶段设定高一点的抽样比, 来进一步提高样本的代表性,从而提高抽样估计精度 4、可以提高抽样的经济效益 与CL相比,MS虽然看起来抽样过程更为复杂,但实际上操 作起来非常简便(可操作性强),组织管理和实测调查的工作 量也不大,因此MS的费用将更节省,经济效益更高 5、可以为各级机构提供相应的信息 MS可以满足各阶段(不同层次)的需要,这与st有些类似 比如,中国城镇居民住户调查
2019/2/11
统计学专业必修课3学分
13
总体
可能的抽样结果 PU
BU (a,c) (a,d) (b,c) (b,d) (c,e) (c,f) (d,e) (d,f) (a,e) (a,f) (b,e) (b,f)
ˆ ˆ E ( ) E E ( 1 2 )
ˆ
PU A B C
2个
BU (a,b) (c,d) (e,f)
多阶段抽样-详解
多阶段抽样-详解多级抽样(multi-stage sampling)、多阶段抽样(multi-level. sampling)、套抽样(cascade sampling 或nested sampling)目录• 1 什么是多阶段抽样• 2 多阶段抽样的应用• 3 关于多阶段抽样的具体描述• 4 多阶抽样与分层抽样和整群抽样的关系• 5 多阶段抽样的特征什么是多阶段抽样多阶段抽样,也称为多级抽样、多阶抽样、套抽样,是指在抽取样本时,分为两个及两个以上的阶段从总体中抽取样本的一种抽样调查方法。
多阶段抽样的应用当我们面对的总体单元数很庞大,而且分布范围很广时,如果使用前面所学习的单阶抽样方法,不仅工作量大,而且在精度上很难把握,此时如果改用多阶段抽样方法,就会避免上述困难,从而达到理想的抽样效果。
多阶段抽样具体操作过程是:第一阶段,将总体分为若干个一级抽样单位,从中抽选若干个一级抽样单位入样;第二阶段,将入样的每个一级单位分成若干个二级抽样单位,从入样的每个一级单位中各抽选若干个二级抽样单位入样……,依此类推,直到获得最终样本。
关于多阶段抽样的具体描述如果我们面对的一阶单元内总体基本单元数相当大,作全面的调查就会比较困难,或者一阶单元内各二阶单元可以给出相近的结果,作全面的调查又无必要。
此时从费用和抽样估计效率考虑,便可以从总体中随机抽取一部分一阶单元,然后再从被抽中的一阶单元内,随机抽取部分二阶单元并对他们作全面调查,我们把这种抽样技术称为两阶抽样。
如果在被抽中的二阶单元中,再抽取部分三阶单元组成样本,并对抽中的三阶单元进行全面的调查,这就是三阶抽样。
类似地,可以定义四阶抽样或更高阶的抽样,通常将两阶以上的抽样称为多阶段抽样。
需要指出的是,多阶段抽样中,各阶可以采用不同的抽样方法,也可采用同一种抽样方法,要视具体情况和要求而定。
在两阶抽样中,总体各一阶单元所包含的二阶单元数,有相等和不相等的两种情况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样调查
原理与方法
4.可用于散料的抽样 所谓“散料”,是指连续松散的、不易区分
的个体或抽样单元的材料。例如一堆煤、 一车水泥、储藏在一个仓库的粮食等。进 行散料的抽样时,抽样单元可以人为划分 ,也可以取其自然的单位。例如,一级单 元是自然或人为划分的分装(例如一袋水 泥),二级单元则是从分装中抽取一定数 量(如一千克)的份样作调查。
抽样调查
原理与方法
如果每个二级单元又由更小的三级单元组 成,那么在第二阶段抽样后,若在每个 被抽中的二级单元中再进行三级单元的 抽样,则是三阶段抽样(三阶抽样)。 同样的道理,还可以定义更高阶段抽样 。对于二阶段以上的抽样,称为多阶段 抽样(多阶抽样)。
抽样调查
原理与方法
以上述我国农户调查为例,可以定义全国 的县为初级单元,乡镇为二级单元,自 然村为三级单元,户为四级单元。在全 国抽取若干样本县,在样本县中再抽若 干样本乡镇,在样本乡镇中,抽取若干 自然村,在自然村中抽取样本户,这是 一个四阶段抽样。
抽样调查
原理与方法
性质1可以推广到分多步抽样的情形,例如 对于三阶段抽样,有
Eˆ E1E2E3 ˆ
V ˆ V 1 E 2 E 3ˆ E 1 V 2 E 3ˆ E 1 E 2 V 3ˆ
抽样调查
原理与方法
第二节 初级单元大小相 等时的二阶抽样
采用 srs,从 N 中抽 n 个初级单元 采用 srs 从每个中选初级单元中抽取 m 个次级单元
抽样调查
原理与方法
3.行政上便于组织,某些条件可满足各级需要 全国范围内的调查一般都用到多阶段抽样技术
,尤其是根据我国目前政治、经济体制的特 点,各级党政机关为了宏观控制经济,都需 要统计数字,而全国的抽样调查数字往往不 能满足各级政府的需要,如果把多阶段抽样 和各地的需要结合起来,可以利用现成的行 政区划或组织系统来划分阶段,为抽样调查 的组织工作提供方便,满足各级政府的数据 需求。
抽样调查
原理与方法
5.划分阶段不宜过多
抽样调查
原理与方法
三、推断原理 多阶段抽样属于分步抽样,对分步抽样,讨论估计量
ˆ 的均值及其方差要分步进行。 性质1 对于二步抽样,有
EˆE1E2ˆ
Vˆ V 1 E 2 ˆ E 1 V 2 ˆ
式中和,方E 2 差、;V 2 E为1 、在V 固1 为定对初第级一单步元抽时样对求第均二值步和抽方样差求。均二值 阶段抽样的抽样是分两步进行的,所以具有上述性 质。
抽样调查
原理与方法第一节 概述一.什么是多阶段抽样分多个阶段抽到最终接受调查的样本。 初级单元(PSU)----Primary Sampling Unit 二级单元 (SSU)----Second-stage Sampling Unit 三级单元(TSU)----Third-stage Sampling Unit 最终单元 (SSU)----Ultimate Sampling Unit
原理与方法
即使是在某个城市范围内的居民调查,也 不可能且没有必要编制全市的居民名单 抽样框,多阶段抽样方法就可以解决这 一问题。
此外,对于有些调查问题,抽样框的变动 非常频繁,待抽样框整理完毕后,可能 与实际情况相去甚远,多阶段抽样也是 解决这类问题的办法。
抽样调查
原理与方法
2.节省人力、物力,发挥了抽样的效率
Y i M Y i
抽样调查
原理与方法
y i m y i
Y N Y i N
y n y i
抽样调查
原理与方法
假设总体由 N 个初级单元组成,每个初级单元又由若
干个二级(次级)单元组成,若在总体中按一定方 法抽取 n 个初级单元,对每个抽中的初级单元再抽 取若干二级单元进行调查,这种抽样方法称为二阶 段抽样(two-stage sampling)(也称二阶抽样、 二级抽样)。
在二阶段抽样中,全部抽样是分两步实施的:第一步 是从总体中抽初级单元,称为第一阶段抽样(第一 阶抽样);第二步是从每个被抽中的初级单元中抽 二级单元,称为第二阶段抽样(第二阶抽样)。
多阶段抽样保持了整群抽样样本单元相对集中的特 点,因此与简单随机抽样相比,实施方便,每个 基本单元的调查费用较低;另一方面,它并不像 整群抽样那样对入样群的所有单元进行调查,而 是在中选的初级单元中抽取二级单元,避免了一 阶整群抽样由于调查过多的小单元而造成人力、 物力与财力的浪费,充分发挥了抽样的效率。因 此,多阶段抽样既保持了样本相对集中的优点, 又克服了样本信息相似重复、降低抽样效率的缺 点。
抽样调查
原理与方法
二、多阶段抽样特点
1.构造抽样框相对容易
多阶段抽样的一优点是不需要编制所有小 单元的抽样框。抽取初级单元时,只需 编制初级单元的抽样框,对被抽中的初 级单元,再去编制二级单元抽样框,依 此类推,每阶段只需编制该阶段的抽样 框,从而大大降低编制抽样框的工作量 ,实际中非常方便。
抽样调查
抽样调查
原理与方法
第九章(多阶段抽样)
抽样调查
原理与方法
当总体单元的数目大、分布广时,若采用简单随机抽样,则 需要编制包含全部总体单元的抽样框,工作量相当大; 若采用系统抽样,则需将全部总体单元按一定标志进行 有序排列,实施起来仍然很麻烦;若采用分层抽样,则 需掌握一定的辅助信息进行分层,而实际应用中并不一 定能找到合适的辅助变量;若采用单级整群抽样,则必 需掌握全部总体单元的有关资料后进行分群,并在入样 群内进行全面调查,工作量也是极其庞大的。例如,欲 做农户家计调查,我国约有两亿农户,如果按上述几种 方式进行抽样,其工作量之大难以想象。此时若采用多 阶段抽样,可以简化抽样框的编制,便于最终样本单元 的抽取,使得组织工作容易进行,避免上述抽样设计过 程中的麻烦。
一、符号
Yij ,总体中第 i 个初级单元中第 j 个次级单元指标值
i =1,2,….N, j=1,2,….M
yij ,样本中第 i 个初级单元中第 j 个次级单元观测值
i =1,2,…n, j=1,2,….m
抽样调查
原理与方法
f 1 N n , f 2 M m
M
Y i Y ij
m
y i y ij