第8-9章-多阶段抽样和二重抽样

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 2
(2)
1 N 1 n 2 2 (Yi Y ) 2的无偏估计 s ( yi y ) 不是 S1 但 N 1 n 1
计算 S
2 1 时, i
Y 不受二阶抽样影响,用 s
2 1 计算
yi 则不然。

E ( s12 ) E1 [ E 2 ( s12 )] E1 [ (Yi Yn ) 2
2
M i2 1 f 2i mi
n 2 i
2 S 2i
M 1 f 2i 2 1 f1 1 Mi v y s2i M yi y nNM 2 m n n 1 i 1 i 1 i
n 2
加权的总量估计
ˆN Y n
N M i yi n
mi
S
同理有:
2 2
1 N
S
j 1
N
2 2i
1 n 2 2 s2 s2i n j 1
四.推断原理
ˆ ˆ E E1E2

2
ˆ ˆ ˆ V V1 E2 E1 V2
证明:
ˆ ˆ ˆ V E E
2 ˆ N N V Y Yi 估计量方差 2 i 1 ˆ V YHH Zi Z Y Z n i 1 i i 1 i n ˆ Yi ˆ 2 1 ˆ ˆ YHH 的无偏估计为: v(YHH ) = ( z YHH ) n(n 1) i








第二节 初级单元相等的情况
以此说明多阶抽样原理 M1 M 2 M N , 1 ,M 2 ,… , N 相等, M M f 2i 相等,直接用 f 2 表示 一.估计量 1 均值 的无偏估计为: y
Y
1 n m yi nm yij n i 1 i 1 j 1
2 S2 V ( y ) S12 m
2 当n=1时, V1 (Yi ) S1
这时, 若以n个
yi 的均值 y 推断 Y
,其方差为
2 2 S1 S2 V ( y) n nm
再考虑fpc,则(1)式成立。
V y 的无偏估计为:
证明:
2 1
E (s ) S
2 2
1 f1 2 f1 1 f 2 2 v y s1 s2 n nm
第八章 多阶段抽样(Multi Stage Sampling) 第一节 概述
一、什么是多阶抽样 分多个阶段抽到最终接受调查的单元

初级单元(PSU)----Primary Sampling Unit 二级单元 (SSU)----Second-stage Sampling Unit 三级单元(TSU)----Third-stage Sampling Unit 最终单元 (SSU)----Ultimate Sampling Unit
n
mi
ij
m
i 1
n
y m0
i
2 2 1 n 1 N 初级单元间的方差:12 ,s 2 S Yi Y 1 n 1 yi y N 1 i 1 i 1



N M 2 1 初级单元内的方差:S 2 Yij Yi 2 N M 1 i 1 j 1
ˆ MSE YR

N 2 1 f1 n
1 N M i2 Yi Y N 1 i 1


2
2 N N M i 1 f 2i 2 S 2i n i 1 mi
2 n N 2 1 f1 1 n M i2 1 f 2i 2 ˆ N 2 ˆ v YR M i yi YR n m s2i n n 1 i 1 i 1 i
n
n 1 1 f2 2 2 S1 S2 m
1 f2 ] E1 [ m
2 S2 i
n
n
]
所以
s
2 1 的无偏估计为
ˆ 2 s2 1 f2 s2 S1 1 2 m
(3)
结合(2)、(3)式 ,得到
1 f1 2 f1 (1 f 2 ) 2 ( y) s1 s2 n nm

i
M i2 (1 f 2i ) 2 N 2 (1 f1 ) 1 N ˆ V (Y ) (Yi Y ) 2 S 2i n N 1 n mi
M i2 (1 f 2i ) 2 N 2 (1 f1 ) 1 N ˆ ˆ ˆ v(Y ) (Yi Y ) 2 s2 i n n 1 n mi
二.多阶抽样特点
1.抽样框构造相对容易 2.节省人力、物力 3.保持了整群抽样相对集中的优点,又克服了群内同质性 强的弱点 4.误差与阶段多少有关
三.符号
总体初级单元数:N
第一阶段样本量(初级单元数):n 第i个初级单元中基本单元数: M i 第i个初级单元中第二阶样本量: mi 第i个初级单元中第j个二级单元观测值: ij Y 样本中第i个初级单元第j个二级单元的观测值: yij


证明:
ˆ v YHH

yi ˆ ˆ 1 1 z YHH n n 1 i 1 i
n
2
ˆ 对 V (YHH ) 两个分量分别估计
ˆ 1 N V2 (Yi ) 第二阶段方差分量 的无偏估计为 n Zi
ˆ 1 n v2 (Yi ) ˆ v2 (YHH ) 2 2 n zi Y 1 N 第一阶段方差分量 Z i ( i Y ) 2 的无偏估计为 n Zi n ˆ ˆ Yi ˆ 2 1 n v2 (Yi ) 1 ˆ v1 (YHH ) ( z YHH ) n 2 z 2 n(n 1) i i
ai 为第i个初级单元中具有所研究特征的二级单元数
N 1 f1 1 N 1 f2 M 2 V p Pi P nm N M 1 PQi i n N 1 i 1 i 1
f1 1 f 2 n 1 f1 n 2 v p pi p n2 m 1 pi qi n n 1 i 1 i 1
n m 2 1 2 s2 yij yi n m 1 i 1 j 1
第i个初级单元内的方差:
2 1 Mi 2 S2i Yij Yi M i 1 j 1
2 1 s yij yi mi 1 j 1 2 2i
2 2 S 2 是所有 S 2i 的平均值,即:

二.按不等概抽初级单元
1.按PPS抽取初级单元 N 第i个单元被选中概率 Z i ,( Z i 1 ) i 1 以总量估计为例,利用Hansen-Hurwitz估计量 ˆ Y的估计: 1 n Y 1 n M y
ˆ YHH
z n
i 1
i

i
n
i 1
i
i
zi
ˆ 可以证明 YHH是Y的无偏估计
2 1 2




源自文库
ˆ ˆ E E E E
2
2
1
2
E 2 E E 2 V E ˆ ˆ E1 2 ˆ 1 2 1 2

E 2 E E 2 ˆ ˆ V1 E2 E1 2 ˆ 1 2 ˆ ˆ V1 E2 E1 V2
j 1
Mi
mi
j 1
第i个初级单元均值: i 1 Y Mi
Yi , 1 Yij M yi j 1 mi i
Mi
yi yij m j 1 i
mi
1 总体均值: Y M0
Y Yij M , y i 1 j 1 0
N
Mi
y
i 1 j 1
⒉ 加权估计
总体均值
1 初级单元的平均规模: M N
Y
的估计为:
M0 Mi N i 1
N
1 n Mi 1 y yi n i 1 M nM
n
M y
i 1 i
n
i
该估计量无偏 证明: 1 E y E1 E2 nM
M i yi i 1
二.样本的最优分配 即n和m的关系, 最优分配指,费用一定方差最小,或方差一定费用最省 设费用函数: C c0 nc1 nmc2 (4)
1 f1 2 1 f 2 2 V ( y) S1 S2 n mn
1 1 2 1 1 1 2 ( ) S1 ( ) S 2 n N n m M 2 2 S 2 S12 1 2 S2 ( S1 ) n M mn N
使上式达到极小的充要条件是: S C1 S2 C2 m
m
从而 mopt满足
mopt
S2 Su
2 S2 c1 2 2 其中, Su S1 。 M c2
由上式看出,m与 S 2 , c1 成正比,与 S1 ,c2 成反比 求出m后,利用(4)式,即可求出n
第三节 初级单元不等的情况
1 1 n 1 1 E1 M iYi M n i 1 MN
M iYi Y i 1
N
估计量的方差为:
1 f1 M i 1 V y M Yi Y nNM 2 nN i 1 i 1
N N
2 M i mi S 2i M i2 ( ) Mi mi N
1 nNM 2
2 M i mi s2i M i2 ( ) Mi mi n
总量估计
ˆ YR M 0
M y
i 1 n i
n
i
M
i 1
M0

i 1 n i 1
n
i
i
M
i
该估计量是有偏的,当样本量较大时
3.比率估计
ˆ YR
M i yi M
n i


n
n
i
M
i
该估计量是有偏的,
1 f1 V ( yR ) nM 2 M i (Yi Y ) 2
n
N
N 1
1 nNM 2
1 f1 v( y R ) nM 2
( M i yi M i y ) 2 N 1
对初级单元进行分层,使层内初级单元规模相仿 按初级单元规模不等处理 加权处理 不等概抽样 一、等概抽样,加权估计 简单随机抽样抽初级单元,估计使用加权思想
⒈ 简单平均估计
1 yi mi
y
j 1
mi
ij

1 y n
y
i 1
n
i
ˆ Y M0 y
此时没有考虑权数,估计量有偏 遗憾的是,现实中这种情况常出现
n mi 第一阶段和第二阶段的抽样比: f1 , f 2i N Mi
二阶单元个数: M 0 M i , m0 mi
i 1
i 1
N
n
指标总和:Y Yij , y yij
i 1 j 1
N
Mi
n
mi
i 1 j 1
第i个初级单元指标总和:Y Y , yi yij i ij
n
其方差为:
1 f1 2 1 f 2 2 V y S1 S2 (1) n nm
假定n=1, 第二阶段抽取m个单位
其次,用
2 S2 用 yi 估计 Y ,误差大小取决于 S 2 和m,即 V2 ( yi ) 2 i m 2
Yi 推断 Y 时,推断误差大小取决于 S1 和n,

类似地,可以得到三阶抽样的估计方差
1 f1 2 f1 (1 f 2 ) 2 f1 f 2 (1 f 3 ) 2 ( y) s1 s2 s3 n nm nmk
总量Y的估计
ˆ v Y N 2 M 2v y
比例P的估计

ˆ Y NMy
1 n 1 n p pi ai n i 1 nm i 1
相关文档
最新文档