抽样调查-第8章 多阶段抽样

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用到下面的性质。
返回
性质1 对于两阶段抽样,有


E( ) E1E2 ( )



V ( ) V1[E2 ( )] E1[V2 ( )]
式中,E2,V2 为在固定初级单元时对第二阶抽样求均 值和方差; E1,V1 为对第一阶抽样求均值和方差。
性质1可以推广到多阶段抽样的情形,例如 对于三阶段抽样,有
返回
(二)对总体比例的估计
如果要估计总体中具有所研究特征的二级单元数占全 体全体二级单元数的比例,则
P
1 N
N
Pi
i1

1 NM
N i1
Ai
式中,Ai 为第i个初级单元中具有所研究特征的二级单元
数,则对P的估计为:
p

1 n
n i1
pi

1 nm
n i1
ai
式中,为第i个初级单元中具有所研究特征的二级单元 数。
N i1
(Y i
Y )2 ,
s12

1 n 1
n i1
( yi

y)2,
第i个初级单元二级单元间的方差:
S 2 2i

1 Mi
Mi
1
(Yij
j 1
Y i )2,
s2 2i

1 mi 1
mi
( yij
j 1

yi )2
返回
二、估计量及其性质
(一)对初级单元进行简单随机抽样
Y

1 N
N
Yi, y
i1

1 n
n i1
yi
初级单元间的方差:
S12

1
N
(Y i Y )2 ,
N 1 i1
s12

1 n 1
n i1
( yi

y)2
返回
初级单元内的方差:
S22

1 N (M
1)
N i1
M
(Yij
j 1
Y i )2
s22

1 n(m 1)
这种抽样方法称为二阶段抽样。同样的道 理,还可以有三阶段抽样、四阶段抽样等。对于 二阶段以上的抽样, 统称为多阶段抽样。
返回
二、多阶段抽样的优点
(1)多阶段抽样保持了整群抽样的样本比较集中、 便于调查、节约费用等优点。
(2)多阶段抽样不需要编制所有小单元的样本框。
三、抽选方法与推断原理
多阶段抽样时,每一个阶段的抽样可以相同,也 可以不同。它通常与分层抽样、整群抽样、系统抽样 结合使用。多阶段抽样时,抽样是分步进行的,因此, 讨论估计量的均值及其方差时,需要分阶段进行这要
5
53

Y NM y 100 30 53.6 160800

v(Y ) N 2M 2v( y) 1002 302 9.4372 84934800


s(Y ) v(Y ) 84934800 9216.0078
置信度为95%的置信区间为:160800±1.96×9216 在上面的方差估计式中,第一项是主要的,第二项 要小得多!
返回
第一阶和第二阶的抽样比:
f1

n N
;
f2i

mi Mi
二级单元个数:
N
n
M 0 M i , m0 mi
i 1
i 1
N
指标总和: Y
Mi
Yij , y
n
mi
yij
i1 j1
i1 j1
Mi
mi
第i个初级单元指标总和: Yi Yij , yi yij
例如:某个新开发的小区拥有相同户型的15个 单元的楼盘,居民已经陆续搬入新居,每个单元住 有12户居民,为调查居民家庭装修情况,准备从 180户居民户中抽取20户进行调查。如下表:
返回
编号 单 元


1 一栋A座 1 2 3 4 5 6 7 8 9 10 11 12 2 一栋B座 1 2 3 4 5 6 7 8 9 10 11 12 3 一栋C座 1 2 3 4 5 6 7 8 9 10 11 12 4 二栋A座 1 2 3 4 5 6 7 8 9 10 11 12 5 二栋B座 1 2 3 4 5 6 7 8 9 10 11 12 6 二栋C座 1 2 3 4 5 6 7 8 9 10 11 12 7 三栋A座 1 2 3 4 5 6 7 8 9 10 11 12 8 三栋B座 1 2 3 4 5 6 7 8 9 10 11 12 9 三栋C座 1 2 3 4 5 6 7 8 9 10 11 12 10 四栋A座 1 2 3 4 5 6 7 8 9 10 11 12 11 四栋B座 1 2 3 4 5 6 7 8 9 10 11 12 12 四栋C座 1 2 3 4 5 6 7 8 9 10 11 12 13 五栋A座 1 2 3 4 5 6 7 8 9 10 11 12 14 五栋B座 1 2 3 4 5 6 7 8 9 10 11 12 15 五栋C座 1 2 3 4 5 6 7 8 9 10 11 12 返回
样本单元 第一户 第二户 第三户 第四户
一栋A座




二栋C座




三栋C座




四栋C座




五栋B座




要求根据这些数据推算居民家庭装潢聘请装潢
公司的比例。
返回
解:记聘请装潢公司的居民户为“1”,否则记为“0”。
这里,N=15,M=12,n = 5, m = 4
,
f1
5, 15
返回
二、估计量及其性质
(一)总体均值的估计
性质2 对于初级单元大小相等的二阶抽样,如果两个阶
段都是简单随机抽样,且对每个初级单元,第二阶抽样
是相互独立进行的,则对总体均值 Y 的无偏估计为:

Y

y

1 n
n i1
yi

1n nm i1
m j 1
yij
其方差为:
V
(
y)

1 n
f1
对每个样本的二级单元分别独立抽取一个m=3的简单 随机样本
由题意,N=100,M=30,n=5, m=3
f1

n N
5 100

0.05,
f2

m M

3 30

0.10
首先计算样本初级单元的均值 yi 、方差 s22i:
返回
样本企业
yi
s2 2i
1
60
13
2
43
39
3
58
39
4
50
7
5
57
19
j 1
j 1
第i个初级单元按二级单元的平均值:
Y i
1 Mi
Mi
Yij
j 1

Yi M
i
,
yi
1 mi
mi
yij
j 1
yi mi
返回
按二级单元的平均值:
Y

1 M0
N i1
Mi
Yij
j 1

Y ,y M0

y
n
mi
i1
初级单元间的方差:
S12

1 N 1
采用比率估计量对总体总和进行估计。


E( ) E1E2E3( )




V ( ) V1[E2E3( )] E1{V2[E3( )]} E1E2[V3( )]
返回
§8.2 初级单元大小相等的二阶抽样
第一阶段在总体N个初级单元中,以简单随机 抽样抽取n个初级单元,第二阶段在被抽中的初级 单元包含的M个二级单元中,以简单随机抽样抽取 m个二级单元,即最终接受调查的单元。
且它的方差为:
返回

V (Yu )
来自百度文库
N 2 (1 n
f1)
1 N 1
N i1
(Yi
Y )2

N n
N i1
M
2 i
(1

mi
f2i )S22i

V (Yu )
的一个无偏估计为:

v(Yu )

N 2 (1 n
f1) 1
n
(Y i
n 1 i1

Y u )2
返回
§8.3 初级单元大小不等的二阶抽样
一般而言,初级单元的大小是不相等的,如果按初 级单元的大小分层后,层内初级单元的大小差别仍很大, 则需用本节介绍的方法来处理二阶抽样的问题。当初级 单元大小不等时,一般采用不等概抽样。
一、符号说明
总体中初级单元个数及第一阶抽取的样本量:N,n
第i个初级单元中二级单元数: M i 第i个初级单元中第二阶抽样的样本量:mi 第i个初级单元中第j个二级单元的观测值:Yij 样本中第i个初级单元中第j个二级单元的观测值:yij
p)2

f1(1 f2 ) n2 (m 1)
n

i1
pi qi
式中, Qi 1 Pi ; qi 1 pi.
返回
【例8.2】 欲调查某个新小区居民家庭装潢聘请装潢
公司的比例。我们在15个单元中随机抽取了5个单元,在 这5个单元分别随机抽取了4户居民进行调查,对这20户 的调查结果如下表:
§8.1 引 言
前面提到的整群抽样虽然 有很多优点,但是由于群内单 元通常具有相似性(表现为群 内相关系数大于零)。尤其是 当群比较大时,人们自然会想 到没有必要对群内所有单元都 进行调查,而只要对群内单元 进行再抽样,对被抽中的单元 进行调查,这就是常用的多阶 段抽样。
返回
一、多阶段抽样的定义
先在总体单元(初级单元)中抽出样本单 元,并不对这个样本单元中的所有下一级单元 (二级单元)都进行调查,而是在其中再抽出若 干个二级单元并进行调查。
于是得到:
y

1 n
n

i1
yi

1 (60 5
43
58
50 57)

53.6
s12

1 n 1
n i1
( yi

y)2

49.3
s22

1 n
n i1
s2 2i

23.4
返回
v( y) 1 0.05 49.3 0.05(1 0.10) 23.4 9.4372
样本企业
第一日
第二日
第三日
1
57
59
64
2
38
41
50
3
51
60
63
4
48
53
49
5
62
55
54
要求根据这些数据推算不100家企业该指标的总量,并
给出估计的95%置信区间。
返回
解 将企业作为初级单元,将每一天看着二级单元。
调查月内拥有30天(即拥有30个二级单元)。 首先在初级单元中抽取一个n=5的简单随机样本再
f2
4 12
因此,
p

1
nm
n i1
ai

1 (2 11 0 1) 54

0.25
其方差的估计为:
v(
p)

1 f1 n(n 1)
n
(
i1
pi

p)2

f1(1 f2 ) n2 (m 1)
n

i1
pi qi
0.00657
s( p) v( p) 0.081
P的置信区间为: 0.25 1.96 0.081
表中红字为抽中的房号。 这时,初级单元有15个,每个初级单元拥有二级单元 12个。首先将单元从1到15编号,在15单元中随机抽取 5个单元,分别是1,6,9,12,13号;然后在被抽中的 单元中,进行第二次抽样,即分别在12户居民户中随机 抽取4户。
一、符号说明
初级单元和初级单元拥有的二级单元个数:N,M 第一阶段和第二阶段抽样的样本量:n ,m

N n
n i1
M
2 i
(1

mi
f2i )s22i
式中,

Yu
1
n

Yi
n i1
返回
2.比率估计量
由于初级单元的大小
M
不同,往往
i
造成初级单元的观测值

Yi
差异很大,使得估计量方差
V (Y u )的第一项很大,从而估计量的方差也就变得很大。
这时,可以考虑将初级单元的大小 M i 作为辅助变量,
如果二阶抽样中每个阶段都采用简单随机抽样,并且 每个初级单元中二级单元的抽样是相互独立的,则对 总体总和的估计可以采用简单估计,也可以考虑采用 比率估计。
1.简单估计量 对总体总和的简单估计为:

Yu

N n
n i1
Mi
yi

N n
n
Yi
i1
根据性质1,不仅可以证明这个估计量是无偏的,并
n i1
m
( yij
j 1

yi )2

S
2 2
的表达式可知,若记
S 2 2i

1 M 1
M
(Yij
j 1
Y i )2
则有
S22

1 N
N
S2 2i j 1

S 22 是
S2 2i
的平均值。同理有
s 2 2i

1 m 1
m
( yij
j 1

yi )2
s22

1 n
n
s2 2i j 1
第i个初级单元中的第j个二级单元的观测值:Yij 样本中第i个初级单元中的第j个二级单元的观测值:yij
返回
第一阶段和第二阶段的抽样比:f1

n N
,
f2

m M
第i个初 级 单 元 按
二级单元的平均 值:
Yi
1 M
M
Yij , yi
j 1

1 m
m j 1
yij
按二级单元的平均值:
S12

1 f2 nm
S
2 2
V
(
y)的无偏估计为:v(
y)

1 n
f1
s12
1 f2 nm
s22
返回
【例8.1】欲调查4月份100家企业的某项指标,首先
从100家企业中抽取了一个有板有5家样本企业的简单随 机样本,调查人员对5家企业分别在调查月内随机抽取3 天作为调查日,要求样本企业只填写这3天的流水帐。 调查的结果如下。
返回
性质3 对于二阶抽样,如果两个阶段都是简单随机 抽样,则有 E( p) P
估计量 p 的方差为:
V
(
p)

1 n
f1
1
N
1
N i1
(
Pi

P)2
1 f2 nm
M N(M
N

1) i1
PiQi
V ( p) 的无偏估计为:
v(
p)

1 f1 n(n 1)
n
(
i1
pi

相关文档
最新文档