多阶段抽样PPT课件
第八章 二阶及多阶抽样课件
n
M
i 2V
( yi)
V1
N
i1
n
E
1
N
2
i1
n2
V1
N
n
Y
i
i1
n
E
1
N
2
n i1
M
2 i
1 f2i mi
S
2 2i
n2
PPT学习交流
15
(2)比估计:
N
Yi
Y M0
i1 N
, 可用比估计
Mi
i1
,以
M
为辅助变量:
i
n
Yˆi
YˆR M 0
i1 n
Mi
PPT学习交流
2
性质l 对于两阶抽样,有
(1)E(ˆ)E1E2(ˆ)
(2 )V (ˆ) V 1 E 2 (ˆ) E 1 V 2 (ˆ)
式中,E2,V2为在固定初级单元时对第二阶抽样 求均值和方差;E1,V1为对第一阶抽样求均值和 方差。
PPT学习交流
3
8.2 初级单元大小相等时的二阶抽样
9.2.1总体均值的估计量: 假定总体由N个初级单元组成,每个初级单元都含有M个次级单元。 从N个初级单元中按简单随机抽样抽取n个初级单元, 在每个被抽中的初级单元中按简单随机抽样抽取m个次级单元。
142 5[1 ( 51.8 4)2(16.15.8 4)2(1 61.8 4)2(1 31.8 4)2(1.5 31.8 4)2] 5(51)
97.6 72 65
PPT学习交流
21
估计量的标准差为 s(Y ˆPP ) S v(Y ˆPP ) S 97.672 6 9 5.8 88 因此,小区居民数为2146人,在置信度为 95%时,估计的相对误差为
多阶段抽样(PPT69页)
2.比率估计量 为了减小方差,可以考虑将初级单元的大小
Mi作为辅助变量,采用比率估计量对总体总 和进行估计。 对总体总和的比率估计量:
这个比率估计量是有偏的,但随着样本量的增加,其偏倚将趋于0。
• 其近似均方误差为:
• 因为 的差异一般不会很大,因此,当Mi相
差很大时,
要比无偏估计量 的方差
在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
2、对抽中的次级单元进行再抽样,提高了效率
多阶段抽样能充分发挥抽样的效率,克服了整群抽样的缺点,即 避免了对小单元过多调查造成的浪费。
• 估计量p的方差为: V(p)的无偏估计为:
类似于前面总体方差的表达形式,有:
• 【例8.2】欲调查某个新小区居民户家庭装潢聘请专业装潢 公司的比例。在15个单元中随机抽取了5个单元,在这5个 单元中分别随机抽取了4户居民并进行了调查,对这20户 调查结果如下:
样本单元 一栋A座 二栋C座 三栋C座 四栋C座
样本企业
1
60
13
2
43
39
3
58
39
4
50
7
5
57
19
置信区间:
三、对总体的比例的估计
总体中具有所研究特征的二级单元占全体二级 单元数的比例为:
式中:Ai为第i个初级单元中具有所研究特征的二级单元数。 对总体比例P的估计是:
式中:ai为第i个样本初级单元中具有所研究特征的二级单元数 。
• 性质3: 对于二阶抽样,如果两个阶段都是简单 随机抽样,则有
第九章 多阶段抽样
第九章 多阶段抽样第一节 多阶抽样概述一、 多阶抽样的概念1、单阶抽样:从总体中通过一次抽样就能够产生一个完整的样本,这类抽样即为单阶抽样。
前面介绍的几种抽样方式均为单阶抽样。
适合用于总体单元数相对较少的抽样过程。
2、多阶抽样:将整个抽样过程分成若干个阶段,一个阶段一个阶段地进行抽样以完成整个抽样过程,这种抽样即为多阶抽样。
当我们面对的总体单元数很庞大,而且分布范围很广时,如果使用前面所学习的单阶抽样方法,不仅工作量大,而且在精度上很难把握,此时如果改用多阶抽样方法,就会避免上述困难,从而达到理想的抽样效果。
3、关于多阶抽样的具体描述:如果我们面对的一阶单元内总体基本单元数相当大,作全面的调查就会比较困难,或者一阶单元内各二阶单元可以给出相近的结果,作全面的调查又无必要。
此时从费用和抽样估计效率考虑,便可以从总体中随机抽取一部分一阶单元,然后再从被抽中的一阶单元内,随机抽取部分二阶单元并对他们作全面调查,我们把这种抽样技术称为两阶抽样。
如果在被抽中的二阶单元中,再抽取部分三阶单元组成样本,并对抽中的三阶单元进行全面的调查,这就是三阶抽样。
类似地,可以定义四阶抽样或更高阶的抽样,通常将两阶以上的抽样称为多阶抽样。
需要指出的是,多阶抽样中,各阶可以采用不同的抽样方法,也可采用同一种抽样方法,要视具体情况和要求而定。
在两阶抽样中,总体各一阶单元所包含的二阶单元数,有相等和不相等的两种情况。
前者无论在样本的抽取还是在指标的估算方面都相对比较简单,然而在抽样实践中却很少有这种情况的存在,但作为基本方法仍然有其实际意义;后种情况在抽样和指标的估算方法上都较为复杂,然而在实际中普遍存在此种情况。
4、两阶抽样与分层抽样和整群抽样的关系:将总体分为若干个一阶单元,如果在每一个一阶单元中,都随机抽取部分二阶单元,由这些二阶单元中的总体基本单元组成的样本,在抽样的方式上,就相当于分层抽样;如果在全部的一阶单元中,只抽取了部分一阶单元,并对抽中的一阶单元中的所有的基本单元都做全面调查,这就是整群抽样。
第8-9章-多阶段抽样和二重抽样
ˆ ˆ E E E E
2
2
1
2
E 2 E E 2 V E ˆ ˆ E1 2 ˆ 1 2 1 2
E 2 E E 2 ˆ ˆ V1 E2 E1 2 ˆ 1 2 ˆ ˆ V1 E2 E1 V2
2 S2 V ( y ) S12 m
2 当n=1时, V1 (Yi ) S1
这时, 若以n个
yi 的均值 y 推断 Y
,其方差为
2 2 S1 S2 V ( y) n nm
再考虑fpc,则(1)式成立。
V y 的无偏估计为:
证明:
2 1
E (s ) S
2 2
1 f1 2 f1 1 f 2 2 v y s1 s2 n nm
1 1 n 1 1 E1 M iYi M n i 1 MN
M iYi Y i 1
N
估计量的方差为:
1 f1 M i 1 V y M Yi Y nNM 2 nN i 1 i 1
N N
二.按不等概抽初级单元
1.按PPS抽取初级单元 N 第i个单元被选中概率 Z i ,( Z i 1 ) i 1 以总量估计为例,利用Hansen-Hurwitz估计量 ˆ Y的估计: 1 n Y 1 n M y
ˆ YHH
z n
i 1
i
i
n
i 1
i
i
zi
ˆ 可以证明 YHH是Y的无偏估计
第4章-等概率整群抽样和多阶段抽样
4.1.1 定义
整群抽样(cluster sampling)是将总体 划分为若干群,然后以群(cluster)为抽 样单元,从总体中随机抽取一部分群,对 被选群内的所有单元进行调查的一种抽样 技术。
2024/7/17
3
例
欲估计某高校大学生拥有手机数量,大学共有40000 名学生,10000个宿舍(每个宿舍4名学生)。
V (ˆ) E1 E2 (ˆ)2 E1 V2 (ˆ ) E1E2 (ˆ)2 V1 E2 (ˆ) E1 V2 (ˆ )
4.3.3 等概率两阶段抽样的符号说明
表4-5
4.3.4 初级单元(PSU)规模相等的 两阶段抽样
定理4.5 对于初级单元规模相等的两阶段抽样 ,如果两个阶段都是简单随机抽样,且对每个 初级单元,第二阶抽样是相互独立进行的,则 对总体均值 Y 的无偏估计为:
定理 4.1:y 是 Y 的无偏估计,即
Ey Y
定理 4.2: y 的方差为:
V ( y) 1 f n
1N N 1 i1
Yi Y
2
1 f nM
Sb2
定理 4.3:V ( y) 的样本估计为:
v( y) 1 f nM
sb2
Yˆ NMy V (Yˆ) V (NMy) N 2M 2V ( y) v(Yˆ) N 2M 2v( y)
(NM 1)(M 1)S 2
用简单随机抽样方法抽取n个群,每个群内的M个
单元全部进入样本,则等群抽样均值估计量 y 的方
差可用群内相关系数近似表示
N
2
V (y)
1 V(y) 1 f
Yi Y
i 1
M2
nM 2 N 1
1 f n
(NM 1) M 2 (N 1)
第八章 二阶及多阶抽样课件
n
M
i 2V
( yi)
V1
N
i1
n
E
1
N
2
i1
n2
V1
N
n
Y
i
i1
n
E
1
N
2
n i1
M
2 i
1 f2i mi
S
2 2i
n2
PPT学习交流
15
(2)比估计:
N
Yi
Y M0
i1 N
, 可用比估计
Mi
i1
,以
M
为辅助变量:
i
n
Yˆi
7
(2)V(y)1 nf1S1 21m f2n S2 2
证明:
V
(
y
)
V1
E
2
(
1 n
n i1
y
i
)
1
E
1
V
2
n
n i1
yi
V
1
1 n
n i1
Yi
E
1
1 n
2
n 1 f2 i1 m
•
M
( Y ij
Yi)2
i1
M 1
1 f1 n
S
2 1
1
f2 nm
E
1
1 n
m
(yijyi)2
j1
PPT学习交流
6
(1) y是Y 的无偏估计量;
证明: E ( y ) E 1 E 2 ( y )
nm
y ij
n
yi
E
1
E
2
(
i1 j1
nm
二阶与多阶抽样抽样调查理论与方法ppt课件
v(yst)h k 1W h 2(1 n h f1hs1 2 hf1h n (1 h m h f2h)s2 2 h) (9.12)
其中
f1h
N nhh、f2h
mh Mh
分别为第
h
层中的两个抽样比。
精选ppt课件
16
S
2 1
h
和S
2 2
h是第
h
层中的群间和群内方差,s
2 1
h
与
s
2 2
h是第
h
层中
(9.9)
nh m h
y hij而yh 源自i1 j1nhm h
(9.10)
由于各层的抽样相互独立,而由二阶抽样的有关讨论, y h 的
方差及其方差估计是已知的,因此:
V ar(yst)h k 1W h 2(1 n h f1hS 1 2 h1 n h m f2 h hS 2 2 h)
(9.11)
y
2 ij
j 1
11280.25
yi 25.02
s
2 2
i
135.02
2 408.30 12115.99
27.22
71.58
3 323.40 8752.76
21.56
127.16
4 502.50 17833.75
33.50
71.43
5 234.00 3953.00
15.60
21.61
6 387.75 11302.50
(y 1 .9 6 v(y),y 1 .9 6 v(y))
精选ppt课件
(9.1) (9.2)
7
例9.1:新华书店某柜台上月共用去发票70本,每本100张, 现随机从中抽出10本,每本随机抽出15张发票,得到数据 如下表:给出上月柜台营业总额的估计及其方差。
抽样调查-第8节多阶段抽样
1 1
性质1可以推广到多阶段抽样的情形,例如
对于三阶段抽样,有
E ( ) E1 E2 E3 ( ) V ( ) V1[ E2 E3 ( )] E1{V2 [ E3 ( )]} E1 E2 [V3 ( )]
N n 1 1 按二级单元的平均值: Y Y i , y y i N i 1 n i 1 N 1 2 2 ( Y Y ) , 初级单元间的方差: S1 i N 1 i 1
1 n 2 s ( y y ) i n 1 i 1
2 1
返回
N M 1 2 S ( Y Y ) i ij N ( M 1) i 1 j 1 初级单元内的方差: 2 2 n m 1 2 s ( yij y i ) n(m 1) i 1 j 1 2 2
n
第i个初级单元二级单元间的方差:
mi 1 2 2 1 2 2 s ( y y ) S 2i (Yij Y i ) , 2i ij i mi 1 j 1 M i 1 j 1 Mi
号
9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12 返回
式中,
Qi 1 Pi ; qi 1 pi.
返回
【例8.2】 欲调查某个新小区居民家庭装潢聘请装潢
ch8讲课二阶及多阶抽样课件
为如下的结果:
v
ch8讲课二阶及多阶抽样
二、常用符号
总体
样本
初级单元(psu)个数
N
n
初级单元拥有的二级单元个数
M
m
第i个psu中的第j个二级单元值 第i个初级单元按二级单元的平
均值 按二级单元的平均值
初级单元(psu)均值间的方差
第i个psu内ssu间的方差
Yij
yij
1 M
Yi M
Yij
j 1
1 m
yi
ch8讲课二阶及多阶抽样
由题意,N=100,M=30,n=5,m=3
f1
n N
5 100
0.05
f2
m M
3 30
0.1
首先计算样本初级单元的均值
yi
、方差
s
2 2i
样本企业
yi
s
2 2i
1
60
13
2
43
39
3
58
39
4
50
7
5
57
19
ch8讲课二阶及多阶抽样
于是得到:
1 n
1
y
n
i 1
yi
ch8讲课二阶及多阶抽样
( 3 ) V ( y ) 的 无 偏 估 计 为 v ( y ) 1 n f 1 s 1 2 f 1 ( 1 m n f 2 ) s 2 2
证明:
E
(
s
2 2
)
E
1E
2
(s
2 2
)
1
E
1
E
2
n
(
m
1)
n i1
m
多阶段抽样ppt课件
n
m
f1 N , f2 M
16
总体和样本中第i个初级单元按二级单元的平均 值:
Yi
1 M
MYij ,j来自1它的最大缺点是由于群内小单元存在一定程度 的相似性(群内相关系数大于0),其抽样误 差高于同样样本量的简单随机抽样。
事实上,在多数情形,特别是当群的规模比较 大时,确实没有必要对群内所有次级单元都进 行调查。因此很自然地想到可以对每个被抽到 的群中的次级单元再次进行抽样。
3
二、多阶段抽样的定义及其与其他抽样的关系
第九章 多阶段抽样
第一节 引言 第二节 初级单元大小相等的二阶抽样 第三节 初级单元大小不相等的二阶抽样 第四节 其他问题
1
第一节 概述
一、概述 二、多阶段抽样的定义及其与其他抽样的关系 二、多阶段抽样的特点和作用 三、抽选方法与推断原理
2
一、引言
采用整群抽样的主要理由是整群样本比较集中, 实施便利,每个基本单元的调查费用较低。
个初级单元即是层,第一阶抽样是100%抽样, 而层内抽样是第二阶抽样。当然,层内抽样本 身也可能是多阶的。 在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
6
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
第一步是从总体中抽初级单元,称为第一阶抽样; 第二步是从每个被抽中的初级单元中抽二级单元,
称为第二阶抽样。
4
如果每个二级单元又由更小的三级单元 组成,那么第二阶抽样后,若对每个被 抽中的二级单元中的三级单元再进行抽 样,则是三阶抽样。
如果对每个被抽中的二级单元不再抽样, 调查其中每个三级单元,则称为二阶整 群抽样。
多阶段抽样
样本企业
第一日
第二日
第三日
1
57
59
64
2
38
41
50
3
51
60
63
4
48
53
49
5
62
55
54
要求根据这些数据推算100家企业该指标的总量,并给出估计
的95%置信区间。
19
解:对这个问题,我们可以利用两阶段的思路解决。首先将企
业作为初级单位,将每一天看作二级单位,每个企业在调查月内都 拥有30天(即拥有30个二级单位)。
SE(Yµ) V (Yµ) 84934800 9216.0078
在置信度95%的条件下,对应的t=1.96,因此,置信区间为: 60800±9216.0078,或者说在142736.6~178863.4之间。
21
三、总体比例及其估计量方差
初级单位大小相等的两阶段抽样的总体比例及其方差问题 在均值估计的基础上是比较容易理解的。
M
Yij 为总体第i个初级单位中具有某种属性的二级单位数
j 1
Pi
1 M
M
Yij
j1
为总体第i个初级单位中各二级单位的比例
则总体比例为: P
1 AM
A i1
M
Yij
j 1
1 A
A 1
Pi
而二阶段抽样的样本比例为:
p
1 am
a i1
m j 1
yij
1 a
a 1
pi
显然,样本比例p是总体比例 P的无偏估计。
yij 第i个初级样本单位中的第j个二阶样本单位的标志值。
m
y i y ij 为第i个初级样本单位中各二阶样本单位的标志总量。 j 1
抽样调查-第8章多阶段抽样
S 2 2i
1 M 1
M
(Yij
j 1
Y i )2
则有
S22
1 N
N
S2 2i j 1
即
S
2 2
是
S2 2i
的平均值。同理有
s 2 2i
1 m 1
m
( yij
j 1
yi )2
s22
1 n
n j 1
s2 2i
返回
二、估计量及其性质
(一)总体均值的估计
性质2 对于初级单元大小相等的二阶抽样,如果两个阶
例如:某个新开发的小区拥有相同户型的15个 单元的楼盘,居民已经陆续搬入新居,每个单元住 有12户居民,为调查居民家庭装修情况,准备从 180户居民户中抽取20户进行调查。如下表:
返回
编号 单 元
房
号
1 一栋A座 1 2 3 4 5 6 7 8 9 10 11 12 2 一栋B座 1 2 3 4 5 6 7 8 9 10 11 12 3 一栋C座 1 2 3 4 5 6 7 8 9 10 11 12 4 二栋A座 1 2 3 4 5 6 7 8 9 10 11 12 5 二栋B座 1 2 3 4 5 6 7 8 9 10 11 12 6 二栋C座 1 2 3 4 5 6 7 8 9 10 11 12 7 三栋A座 1 2 3 4 5 6 7 8 9 10 11 12 8 三栋B座 1 2 3 4 5 6 7 8 9 10 11 12 9 三栋C座 1 2 3 4 5 6 7 8 9 10 11 12 10 四栋A座 1 2 3 4 5 6 7 8 9 10 11 12 11 四栋B座 1 2 3 4 5 6 7 8 9 10 11 12 12 四栋C座 1 2 3 4 5 6 7 8 9 10 11 12 13 五栋A座 1 2 3 4 5 6 7 8 9 10 11 12 14 五栋B座 1 2 3 4 5 6 7 8 9 10 11 12 15 五栋C座 1 2 3 4 5 6 7 8 9 10 11 12 返回
社会调查方法多阶段抽样-PPT精选文档
图3-4 五种概率抽样方法比较图
简单随机抽样
系统抽样
分层抽样(不按比例分层)
分层抽样(按比例分层)
整群抽样
多阶段抽样
举例说明
例3-5:某地有2.4万名教师,他们分布在全市10个区的200所学校 里,现在要抽取一个由1200名教师组成的样本,按照三级抽样 的方法,有以下几种抽样方案(见表3-5): ------出自于《社会调查方法》赵淑兰主编 P59
表3-5 某地教师样本抽取方案
不难发现,这5种抽样方案中,方案2的精确性是最高的,因为它在前两个阶段抽取的 子样本的数量最多,抽样的范围最广;方案5的精确性最低,也是最简便易行的,因为其在 第一个阶段就限定了抽样的范围在一个区内进行。
任务三 抽样方案的制定
(五)多 阶 段 抽 样
定 义
多阶段抽样是一种分阶段从调查对象的总体中抽取样本 进行调查的方法。 • 多阶段抽样首先要将总体单位按照一定的标准划分为若 干群体,作为抽样的第一级单位;再将第一级单位分为若 干小的群体,作为抽样的第二级单位;以此内推,可根据 需要分为第三级或第四级单位。然后,按照随机原则从第 一级单位中随机抽取若干单位作为第一级单位样本,再从 第一级单位样本中随机抽取若干单位作为第二级单位样本, 以此类推,直至获得所需要的样本。 •
夯实基础
• 总体(population)总体一般与构成它的元素共同来定义, 总体就是构成它的所有元素的集合,而元素是构成总体的 最基本单位。社会调查中,我们通常用N表示。 • 样本(sample)样本就是按照一定的方式从总体中抽取出 来的那一部分元素的集合。用n来表示。 • 抽样框(Sampling Frame)抽样框也称抽样范围,是一 次直接抽样的总体中所有抽样单位的名单。
抽样技术(第三版)PPT 讲稿4
合计 209
作物总产量(乡) 种植面积(乡)
yi(万公斤)
xi(亩)
22.0
800
22.8
780
30.2
1000
21.7
700
25.3
880
31.2
1100
26.0
850
20.5
800
33.8
1200
23.6
830
257.1
8940
yi yi M i
S 2 : 总体方差
S 2 1 N Mt 1 i
M j
2
Yij Y
S
2 b
:
总体群间方差
Sb2
M N 1
N i
(Yi Y )2
S
2 w
:
总体群内方差
S
2 w
1 N (M
1)
N i
M j
Yij Yi 2
第一节 概述
s 2 : 样本方差
s2 1 n nM 1
M
yij y 2
第三节 等概率两阶段抽样节 概述
一、多阶段抽样
1. 什么是多阶段抽样?
分多个阶段抽到最终接受调查的样本。 初级单元(PSU)----Primary Sampling Unit 二级单元 (SSU)----Second-stage Sampling Unit 三级单元(TSU)----Third-stage Sampling Unit 最终单元 (USU)----Ultimate Sampling Unit
i1 jk
NM (M 1) 2
第二节 等概率整群抽样
上式中的分母为:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Yi M 1jM 1Yij,
yi m 1jm 1yij
总体和样本按二级单元的平均值:
1 N
YNi1Yi,
1n
yni1yi
总体和样本初级单元间的方差:
S12 N11iN 1(Yi Y)2,
4、多阶段抽样可用于散料的抽样.
所谓散料是指连续松散的不易区分为个体或 抽样单元的材料.如:矿石、煤、粮食、水泥、 化肥等等。
例如:对贮藏在仓库中的小麦中农药残留量 的监测.
首先,从仓库中抽若干麻袋
然后,再从每个抽中的麻袋中的不同部位抽取一 定数量的小麦样品(称为份样)进行测试。
三、抽选方法与推断原理
此时两阶抽样中的每一阶都可采用简单随机 抽样:第一阶抽样从总体N个初级单元中抽 取n个初级单元,第二阶抽样则是从每个被 抽中的初级单元(设每个包含M个次级单元) 中抽取m个次级单元。
假定:在抽中的若干初级单元中作第二阶抽 样是相互独立地进行的。
一、符号说明
初级单元的个数:N
二级单元的个数:M
性质1可) V(ˆ) V1[E2E3(ˆ)]E1{V2[E3(ˆ)]} E1E2[V3(ˆ)]
第二节 初级单元大小相等的二阶抽样
一、符号 二、总体均值的估计量及其性质 三、关于总体比例的估计
引:本节先讨论初级单元大小(即所包含的 次级单元数目)相等情形的二阶抽样。
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
2、对抽中的次级单元进行再抽样,提高了效率
多阶段抽样能充分发挥抽样的效率,克服了整群抽样的缺点,即 避免了对小单元过多调查造成的浪费。
3、抽样框编制得以简化
多阶段抽样是分阶段实施的,因此抽样框也可以分 级进行准备:在第一阶抽样中,仅需准备总体中关 于初级单元的抽样框;在第二阶抽样中,仅需对那 些被抽中的初级单元准备二级单元的抽样框。更高 阶的也是如此,每次只需要对被抽中的单元准备下 一级抽样单元抽样框。
它的最大缺点是由于群内小单元存在一定程度 的相似性(群内相关系数大于0),其抽样误 差高于同样样本量的简单随机抽样。
事实上,在多数情形,特别是当群的规模比较 大时,确实没有必要对群内所有次级单元都进 行调查。因此很自然地想到可以对每个被抽到 的群中的次级单元再次进行抽样。
二、多阶段抽样的定义及其与其他抽样的关系
(一)二阶段抽样
设总体由N个初级单元组成,每个初级单元又 由若干二级(次级)单元组成,若在总体中按 一定方法抽取n个初级单元,对每个被抽中的 初级单元再抽取若干二级单元进行调查,则这 种抽样称为二阶抽样,或二级抽样(two-stage sampling)
在二阶抽样中,全部抽样是分两步实施的:
第一步是从总体中抽初级单元,称为第一阶抽样;
在社会经济调查中,多阶抽样常用于抽样单元 为各级行政单位的情况。例如,在一项全国性 调查中,往往将省、地市、县、街道(乡、 镇)、居(村)民委员会、居(村)民小组及 住户作为各级南样单元。在此,采用多阶段抽 样显然十分方便。
再如,在一个城市中,可以将区作为其中一级 单元,也可直接将街道作为一级单元;可以将 居委会作为街道下一级的单元,也可以将居民 小组作为街道下一级的单元。
多阶段抽样每一阶段的抽样可以相同,也 可以不同,它通常与整群抽样、分层抽样、 系统抽样结合使用.
实际工作中,多阶段抽样通常与整群抽 样结合使用,即前几阶是多阶段抽样, 最后一阶为整群抽样。
多阶段抽样时,抽样是分步进行的,因此, 讨论估计量 ˆ的均值及方差时需要分阶段 进行,则用到下面的性质:
第九章 多阶段抽样
第一节 引言 第二节 初级单元大小相等的二阶抽样 第三节 初级单元大小不相等的二阶抽样 第四节 其他问题
第一节 概述
一、概述 二、多阶段抽样的定义及其与其他抽样的关系 二、多阶段抽样的特点和作用 三、抽选方法与推断原理
一、引言
采用整群抽样的主要理由是整群样本比较集中, 实施便利,每个基本单元的调查费用较低。
(二)多阶段抽样与其他抽样的关系
整群抽样可以看作是多阶段抽样的一种特殊情 形,即最后一阶抽样是100%的抽样。
分层抽样也可看作是多阶抽样的特例:此时每 个初级单元即是层,第一阶抽样是100%抽样, 而层内抽样是第二阶抽样。当然,层内抽样本 身也可能是多阶的。
在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
第一阶段和第二阶段的样本量:n,m;
第i个初级单元中第j个二级单元的观测 值:Yij(i=1,2,…N;j=1,2,…M)
样本中第i个初级单元中的第j个二级单元的观测 值:yij(i=1,2,…n;j=1,2,…m)
第一阶段和第二阶段的抽样比:
f1
n, N
f2
m M
总体和样本中第i个初级单元按二级单元的平均 值:
性质1 对于两阶段抽样,有
E(ˆ)E( 1 E2(ˆ)) V(ˆ)V1[E2(ˆ)]E1[V2(ˆ)]
• 式中,E2、V2为在固定初级单元时对第 二阶抽样求均值和方差;E1 、 V1为对第 一阶抽样求均值和方差.
上述1式是显然的。
2式证明如下:
V() E(ˆ2) [E(ˆ)]2 E1[E2(ˆ2)]{E1 [E2(ˆ)]}2 E1[E2(ˆ2)]{E1[E2(ˆ)]2 V1[E2(ˆ)]} V1[(E2(ˆ)]{E1[E2(ˆ2) E1[E2(ˆ)]2} V1[E2(ˆ)] E1[V2(ˆ)]
第二步是从每个被抽中的初级单元中抽二级单元, 称为第二阶抽样。
如果每个二级单元又由更小的三级单元 组成,那么第二阶抽样后,若对每个被 抽中的二级单元中的三级单元再进行抽 样,则是三阶抽样。
如果对每个被抽中的二级单元不再抽样, 调查其中每个三级单元,则称为二阶整 群抽样。
以此类推,可定义更高阶的多阶抽样 (multi-stage sampling)或多阶整群抽 样(multi-stage cluster sampling)。