第八章(多阶段抽样)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样调查
原理与方法
第八 章 多阶段抽样
抽样调查
原理与方法
第一节 概述
一.什么是多阶段抽样
分多个阶段抽到最终接受调查的样本。 初级单元(PSU)----Primary Sampling Unit 二级单元 (SSU)----Second-stage Sampling Unit 三级单元(TSU)----Third-stage Sampling Unit 最终单元 (SSU)----Ultimate Sampling Unit
n
s12
f1 (1 nm
f2
)
s22
f1 f2 (1 nmk
f3 ) s32
抽样调查
原理与方法
三、总体比例的估计
ai,第i 个初级单元中具有某特征的次级单元数。
1 n
1 nm
p n
pi nm
ai
V(P) 1 f1 n
1 N 1
N
(Pi
P)2
1 f2 nm
mn
m
yij
1 n
n
yi
抽样调查
原理与方法
V(YˆPPS) 与V(y) 的无偏估计为:
(YˆPPS)
M02 n(n1)
n
(yi y)2
(y) 1 n(n 1)
n
(yi y)2
抽样调查
原理与方法
第四节 不等概抽样在 多阶段抽样中的应用
为简化,以三阶抽样为例,给出结论。
抽样调查
原理与方法
二、多阶段抽样特点
1. 构造抽样框相对容易 2. 节省人力、物力 3. 行政上便于组织 4. 某些条件可满足各级需要 5. 可用于散料的抽样 6. 划分阶段不宜过多
抽样调查
原理与方法
第二节 初级单元大小相 等时的二阶抽样
采用srs,从N中抽n个初级单元 采用srs 从每个中选初级单元中抽取m个次级单元
1 n
n
Mi yi Zi
1 n
n
Mi Zi mi
mi
yij
抽样调查
原理与方法
所以,它成为自加权估计量的条件是
Mi nZimi
1 ,或n.Zimi
f0
Mi
f0
第二阶段抽样比
f2i
mi Mi
f0 nZ i
f 0 为常数
抽样调查
原理与方法
在自加权条件下
YˆPPS M0y
y 1 n
n
( yi
y)2
(2)
即
s
2 2
是
S
2 2
的无偏估计
不是 S12
1 N 1
N
(Yi
Y )的2 无偏估计
计算 S12时 Yi 不受二阶抽样影响,计算s12 的 yi 则不然。
即:
抽样调查
原理与方法
E(s12) E1[E2(s12)]
n
n
E1[
(Yi Yn)2 n1
]1 f2 m
于是有:
V ( y) 1 f1 n
S12
1 f2 mn
S22
(1)
抽样调查
原理与方法
假定n=1, 第二阶段抽取m个单位
用
yi
估计 Yi
,
误差大小取决于
S
2 2
和m,即
V2 ( yi )
S
2 2
m
其次,用 Yi 推断 Y 时,第二次推断误差大小取决于 S12 和n,
当n=1时,V1(Yi ) S12 ,这时
M N(M 1)
N
PiQi
抽样调查
原理与方法
v(p) 1 f1 n(n 1)
n
(
pi
p)2
f1(1 f2) n2(m1)
n
piqi
四、最优样本量 m 与 n 的确定 目标:
CT 给定条件下,如何确定m与n,从而使V(y) 最小。
抽样调查
原理与方法
二阶抽样费用函数
CT C0 C1n C2 nm
二、Y的估计
N
入选概率 Z i , Z i 1
估计过程 先估计Yi , 然后利用Yˆi 估计Y 汉森—赫维茨估计量
抽样调查
原理与方法
YˆHH
1 n
n
Yˆi Zi
E(YˆHH) Y
V(YˆHH)
1[ n
N
Zi
(Yi Zi
Y)2
N
V2(Yˆi ) Zi
V(YˆHH)的无偏估计量为:
在 PPS 抽样中
Zi
Mi M0
,代入上式,得
YˆPPS
M0 n
n
yi
抽样调查
原理与方法
若进一步令mi=m,这时估计量是自加权的。
自加权含义:
各最终单元入选样本的概率相同, 如果一个估计量可以表达为样本观测值的常倍数, 则称这种估计量是自加权的。 对汉森—赫维茨估计量而言
YˆHH
抽样过程
前二阶采用PPS,最后一阶按等概率抽取最终单元,且各阶 段样本量对不同单元都等于常数,则所得样本是自加权的。 此时有:
Zi
Mi M0
, Zij
Kij Mi
, Zij
1 Kij
抽样调查
原理与方法
N
N Mi
M 0 Mi
Kij
Yˆ M0 n nmk
m
k
n
M i yi Zi
V
(YˆHH
)
1 n
N
Z
i
(
Yi Zi
Y)2 1 n
M
2 i
(1
mi
Z
i
f
2i
) S
2 2i
(YˆHH
)
1 n(n 1)
n
( M i yi Zi
YˆHH )2
抽样调查
原理与方法
三、初级单元的 PPS 抽样
由前知: YˆHH
1 n
n
M i yi Zi
V ( y)
S12
S
2 2
m
若以n个 yi 的均值 y 推断 Y ,其方差为
V(y)
S12
S
2 2
n nm
再考虑fpc,则(1)式成立。
抽样调查
原理与方法
V (y)的无偏估计为
v( y) 1 f1 n
s12
f1
(1 nm
f
2
)
s22
证明:
E(s22
)
S
2 2
wenku.baidu.com但
s12
1 n 1
一、符号
Yij ,总体中第i 个初级单元中第j 个次级单元指标值
i =1,2,….N, j=1,2,….M
yij ,样本中第i 个初级单元中第j 个次级单元观测值 i =1,2,…n, j=1,2,….m
抽样调查
原理与方法
f1
n N
,
f2
m M
M
Yi Yij
m
yi yij
Yi
C2m)
(S2 Sm22 )(C1 C2m)
其中:
S
2
S
2 1
S
2 2
M
抽样调查
原理与方法
使上式达到极小的充要条件是
S S2 m
C1 C2m
从而mopt 满足
mopt
S2 S
C1 C2
抽样调查
原理与方法
由上式看出,m与
S
2 2
,C1成正比,与
S12
,C2
成反比。
求出m后,利用(4),(5)式,即可求出n.
E1[
S22i ]
n
S12
1 f2 m
S22
抽样调查
原理与方法
所以S12 的无偏估计为
Sˆ12
s12
1
f2
m
s22
将(2)、(3)式结合,得到
(y)
1 f1 n
s12
f1(1 f nm
2
)
s22
(3)
抽样调查
原理与方法
类似的,可以构造三阶抽样 y 的估计方差
( y) 1 f1
抽样调查
原理与方法
(YˆHH
)
1 n(n 1)
n
( Yˆi Zi
YˆHH )2
若二阶抽样采用 srs,即
Yˆi M i yi 是 Yi 的无偏估计
而:
V 2(Yˆi )
M i2V2 ( yi )
M
2 i
mi
(1
f
2i
)S
2 2i
抽样调查
原理与方法
于是有
YˆHH
1 n
yij M 0 y
y 1 n nmk
m
k
yij
抽样调查
原理与方法
(Yˆ) M 02
n(n 1)
n
( yi y)2
yi
1 mk
m
k
yiju
抽样调查
原理与方法 第三节 初级单元大小不等时的二阶抽样
一、一 般 说 明
几种处理方法 * 先 分 层 ,再 抽 样 * 不等概抽样
必要符号补充
N
M0 :M0 Mi
抽样调查
原理与方法
f 2i
:
f 2i
mi Mi
S
2 2i
1 Mi 1
Mi
(Yij
Yi )2
抽样调查
原理与方法
原理与方法
二、Y 估计量的性质
ˆ
1n
1 nm
Y y n
yi nm
yij
E(y) Y
抽样调查
原理与方法
E(
y)
E1 E 2
(
1 n
n
yi )
E1[
1 n
n
E2 ( yi )]
E1[
1 n
n
Yi ] Y
抽样调查
原理与方法
估计量方差一般公式为:
V (ˆ) V1 E2(ˆ) E1 V2(ˆ)
(4)
V ( y)
1 f1 n
S12
1 f2 mn
S
2 2
(1 n
1 N
)S12
1 n
(1 m
1 M
)S
2 2
1 n
(S12
S
2 2
M
)
S
2 2
mn
S12 N
(5)
抽样调查
原理与方法
极小化
(V
1 N
S12)(CT
C0)
[(S12
S22 ) M
Sm22 ](C1
Yi M
抽样调查
原理与方法
yi
yi m
Y N Yi N
y n yi
n
抽样调查
原理与方法
S12
1 N1
N
(Yi
Y
)2
s12
1 n1
n
(yi
y
)2
S22
1 N(M1)
N
M
(Yij Yi)2
s22
1 n(m1)
n
m
(yij yi)2
抽样调查
原理与方法
第八 章 多阶段抽样
抽样调查
原理与方法
第一节 概述
一.什么是多阶段抽样
分多个阶段抽到最终接受调查的样本。 初级单元(PSU)----Primary Sampling Unit 二级单元 (SSU)----Second-stage Sampling Unit 三级单元(TSU)----Third-stage Sampling Unit 最终单元 (SSU)----Ultimate Sampling Unit
n
s12
f1 (1 nm
f2
)
s22
f1 f2 (1 nmk
f3 ) s32
抽样调查
原理与方法
三、总体比例的估计
ai,第i 个初级单元中具有某特征的次级单元数。
1 n
1 nm
p n
pi nm
ai
V(P) 1 f1 n
1 N 1
N
(Pi
P)2
1 f2 nm
mn
m
yij
1 n
n
yi
抽样调查
原理与方法
V(YˆPPS) 与V(y) 的无偏估计为:
(YˆPPS)
M02 n(n1)
n
(yi y)2
(y) 1 n(n 1)
n
(yi y)2
抽样调查
原理与方法
第四节 不等概抽样在 多阶段抽样中的应用
为简化,以三阶抽样为例,给出结论。
抽样调查
原理与方法
二、多阶段抽样特点
1. 构造抽样框相对容易 2. 节省人力、物力 3. 行政上便于组织 4. 某些条件可满足各级需要 5. 可用于散料的抽样 6. 划分阶段不宜过多
抽样调查
原理与方法
第二节 初级单元大小相 等时的二阶抽样
采用srs,从N中抽n个初级单元 采用srs 从每个中选初级单元中抽取m个次级单元
1 n
n
Mi yi Zi
1 n
n
Mi Zi mi
mi
yij
抽样调查
原理与方法
所以,它成为自加权估计量的条件是
Mi nZimi
1 ,或n.Zimi
f0
Mi
f0
第二阶段抽样比
f2i
mi Mi
f0 nZ i
f 0 为常数
抽样调查
原理与方法
在自加权条件下
YˆPPS M0y
y 1 n
n
( yi
y)2
(2)
即
s
2 2
是
S
2 2
的无偏估计
不是 S12
1 N 1
N
(Yi
Y )的2 无偏估计
计算 S12时 Yi 不受二阶抽样影响,计算s12 的 yi 则不然。
即:
抽样调查
原理与方法
E(s12) E1[E2(s12)]
n
n
E1[
(Yi Yn)2 n1
]1 f2 m
于是有:
V ( y) 1 f1 n
S12
1 f2 mn
S22
(1)
抽样调查
原理与方法
假定n=1, 第二阶段抽取m个单位
用
yi
估计 Yi
,
误差大小取决于
S
2 2
和m,即
V2 ( yi )
S
2 2
m
其次,用 Yi 推断 Y 时,第二次推断误差大小取决于 S12 和n,
当n=1时,V1(Yi ) S12 ,这时
M N(M 1)
N
PiQi
抽样调查
原理与方法
v(p) 1 f1 n(n 1)
n
(
pi
p)2
f1(1 f2) n2(m1)
n
piqi
四、最优样本量 m 与 n 的确定 目标:
CT 给定条件下,如何确定m与n,从而使V(y) 最小。
抽样调查
原理与方法
二阶抽样费用函数
CT C0 C1n C2 nm
二、Y的估计
N
入选概率 Z i , Z i 1
估计过程 先估计Yi , 然后利用Yˆi 估计Y 汉森—赫维茨估计量
抽样调查
原理与方法
YˆHH
1 n
n
Yˆi Zi
E(YˆHH) Y
V(YˆHH)
1[ n
N
Zi
(Yi Zi
Y)2
N
V2(Yˆi ) Zi
V(YˆHH)的无偏估计量为:
在 PPS 抽样中
Zi
Mi M0
,代入上式,得
YˆPPS
M0 n
n
yi
抽样调查
原理与方法
若进一步令mi=m,这时估计量是自加权的。
自加权含义:
各最终单元入选样本的概率相同, 如果一个估计量可以表达为样本观测值的常倍数, 则称这种估计量是自加权的。 对汉森—赫维茨估计量而言
YˆHH
抽样过程
前二阶采用PPS,最后一阶按等概率抽取最终单元,且各阶 段样本量对不同单元都等于常数,则所得样本是自加权的。 此时有:
Zi
Mi M0
, Zij
Kij Mi
, Zij
1 Kij
抽样调查
原理与方法
N
N Mi
M 0 Mi
Kij
Yˆ M0 n nmk
m
k
n
M i yi Zi
V
(YˆHH
)
1 n
N
Z
i
(
Yi Zi
Y)2 1 n
M
2 i
(1
mi
Z
i
f
2i
) S
2 2i
(YˆHH
)
1 n(n 1)
n
( M i yi Zi
YˆHH )2
抽样调查
原理与方法
三、初级单元的 PPS 抽样
由前知: YˆHH
1 n
n
M i yi Zi
V ( y)
S12
S
2 2
m
若以n个 yi 的均值 y 推断 Y ,其方差为
V(y)
S12
S
2 2
n nm
再考虑fpc,则(1)式成立。
抽样调查
原理与方法
V (y)的无偏估计为
v( y) 1 f1 n
s12
f1
(1 nm
f
2
)
s22
证明:
E(s22
)
S
2 2
wenku.baidu.com但
s12
1 n 1
一、符号
Yij ,总体中第i 个初级单元中第j 个次级单元指标值
i =1,2,….N, j=1,2,….M
yij ,样本中第i 个初级单元中第j 个次级单元观测值 i =1,2,…n, j=1,2,….m
抽样调查
原理与方法
f1
n N
,
f2
m M
M
Yi Yij
m
yi yij
Yi
C2m)
(S2 Sm22 )(C1 C2m)
其中:
S
2
S
2 1
S
2 2
M
抽样调查
原理与方法
使上式达到极小的充要条件是
S S2 m
C1 C2m
从而mopt 满足
mopt
S2 S
C1 C2
抽样调查
原理与方法
由上式看出,m与
S
2 2
,C1成正比,与
S12
,C2
成反比。
求出m后,利用(4),(5)式,即可求出n.
E1[
S22i ]
n
S12
1 f2 m
S22
抽样调查
原理与方法
所以S12 的无偏估计为
Sˆ12
s12
1
f2
m
s22
将(2)、(3)式结合,得到
(y)
1 f1 n
s12
f1(1 f nm
2
)
s22
(3)
抽样调查
原理与方法
类似的,可以构造三阶抽样 y 的估计方差
( y) 1 f1
抽样调查
原理与方法
(YˆHH
)
1 n(n 1)
n
( Yˆi Zi
YˆHH )2
若二阶抽样采用 srs,即
Yˆi M i yi 是 Yi 的无偏估计
而:
V 2(Yˆi )
M i2V2 ( yi )
M
2 i
mi
(1
f
2i
)S
2 2i
抽样调查
原理与方法
于是有
YˆHH
1 n
yij M 0 y
y 1 n nmk
m
k
yij
抽样调查
原理与方法
(Yˆ) M 02
n(n 1)
n
( yi y)2
yi
1 mk
m
k
yiju
抽样调查
原理与方法 第三节 初级单元大小不等时的二阶抽样
一、一 般 说 明
几种处理方法 * 先 分 层 ,再 抽 样 * 不等概抽样
必要符号补充
N
M0 :M0 Mi
抽样调查
原理与方法
f 2i
:
f 2i
mi Mi
S
2 2i
1 Mi 1
Mi
(Yij
Yi )2
抽样调查
原理与方法
原理与方法
二、Y 估计量的性质
ˆ
1n
1 nm
Y y n
yi nm
yij
E(y) Y
抽样调查
原理与方法
E(
y)
E1 E 2
(
1 n
n
yi )
E1[
1 n
n
E2 ( yi )]
E1[
1 n
n
Yi ] Y
抽样调查
原理与方法
估计量方差一般公式为:
V (ˆ) V1 E2(ˆ) E1 V2(ˆ)
(4)
V ( y)
1 f1 n
S12
1 f2 mn
S
2 2
(1 n
1 N
)S12
1 n
(1 m
1 M
)S
2 2
1 n
(S12
S
2 2
M
)
S
2 2
mn
S12 N
(5)
抽样调查
原理与方法
极小化
(V
1 N
S12)(CT
C0)
[(S12
S22 ) M
Sm22 ](C1
Yi M
抽样调查
原理与方法
yi
yi m
Y N Yi N
y n yi
n
抽样调查
原理与方法
S12
1 N1
N
(Yi
Y
)2
s12
1 n1
n
(yi
y
)2
S22
1 N(M1)
N
M
(Yij Yi)2
s22
1 n(m1)
n
m
(yij yi)2
抽样调查