第8-9章-多阶段抽样和二重抽样
多阶段抽样
设总体由N个初级单元组成,每个初级单元又 由若干二级(次级)单元组成,若在总体中按 一定方法抽取n个初级单元,对每个被抽中的 初级单元再抽取若干二级单元进行调查,则这 种抽样称为二阶抽样,或二级抽样(two-stage sampling)
在二阶抽样中,全部抽样是分两步实施的:
第一步是从总体中抽初级单元,称为第一阶抽样; 第二步是从每个被抽中的初级单元中抽二级单元,
1
Yi
Mi
Mi j1
Yij
Yi Mi
yi
ai
1 (21101) 54
10.25 4
v(p)
1- f1 n(n-1)
n i1
(pi
p)2
f1(1f2) n2(m-1)
n i1
piqi
1 5 15
2
1
2
1
1
2
1
1
2
0
1
2
1
1
2
5(51) 4 4 4 4 4 4 4 4 241
2 4
多阶段抽样每一阶段的抽样可以相同,也 可以不同,它通常与整群抽样、分层抽样、 系统抽样结合使用.
实际工作中,多阶段抽样通常与整群抽 样结合使用,即前几阶是多阶段抽样, 最后一阶为整群抽样。
多阶段抽样时,抽样是分步进行的,因此, 讨论估计量 ˆ的均值及方差时需要分阶段 进行,则用到下面的性质:
性质1 对于两阶段抽样,有
E(ˆ)E( 1 E2(ˆ)) V(ˆ)V1[E2(ˆ)]E1[V2(ˆ)]
• 式中,E2、V2为在固定初级单元时对第 二阶抽样求均值和方差;E1 、 V1为对第 一阶抽样求均值和方差.
上述1式是显然的。
2式证明如下:
第九章二阶与多阶抽样抽样调查理论与方法北京商学院
2、能够满足各级政府部门对抽样调查资料的需求。因为各 级政府领导都关心全国和本地区、本部门的社会经济发展状
况,希望抽样调查能同时满足全国性和地方性的需要。因而
采用二阶或多阶抽样,在一定程度上能够满足各级政府、部
门对调查资料的需求。
3、有利于减少抽样误差、提高抽样估计精度。这种抽样调查 方法,可以使每个一阶样本单位分布比较均匀,具有很好的
方差及其方差估计是已知的,因此:
Var( yst )
k h1
Wh2
(
1
f1h nh
S12h
1 f2h nhmh
S22h )
(9.11)
v(
yst
)
k h1
Wh2
(
1
f1h nh
s12h
f1h (1 f2h nhmh
)
s22h
)
(9.12)
其中
f1h
nh Nh
、f2h
mh Mh
分别为第 h 层中的两个抽样比。
S0
S2 c1
m
c2m
或者m的最优取值为:
mopt
S2 S0
c1 c2
(9.7)
一般地, mopt不是整数,记 [mopt ]为 mopt的最小整数部分,那 么 mopt [mopt ] a ( a 为 mopt的小数部分,且 a 0 )。
如果a2 (1 2a)[mopt ] ,则取 m [mopt ] 1
S22i
1 Mi 1
Mi
(Yij
j 1
Yi )2
—第
i 初级单元内方差
Байду номын сангаас
1、只抽取一个初级单元情形(n=1)
先考虑从 N 个初级单元中随机选取 1 个以推断总体. 这种情形看起来似乎很特殊,但在生活中也不少见,例如在 随机地选的一个班级中抽取几个人进行考试以测试全年级的 教育质量。只选取 1 个单元,仍有等概率与不等概率之分.
《抽样技术》第八章-二阶及多阶抽样
m
Yi Yi / M ,
yi yi / m
Y Yij / NM Yi / N ,
i 1 j 1 n m i 1
N
M
N
y yij / nm yi / n
i 1 j 1 i 1 N n 2 1 1 2 2 2 S1 Yi Y , s1 yi y N 1 i 1 n 1 i 1 N M 2 1 1 N 2 S Yij Yi S 2i N M 1 i 1 j 1 N i 1 2 2 M 2 1 2 其中S 2i Yij Yi M 1 j 1 n m 2 1 s yij yi n(m 1) i 1 j 1 2 2
n
二、总体均值Y 的估计量及其性质
如果二阶抽样中的每一阶抽样都是简单随机的,且 对每个初级单元,第二阶抽样是相互独立的,则样 本按次级单元的均值 1 n m 1 n y yij yi nm i 1 j 1 n i 1
是总体均值
1 N M 1 N Y Yij Yi NM i 1 j 1 N i 1 的无偏估计,即E y Y ,且
其中Qi =1−Pi。故p是P的无偏估计,其方差为 N 1 f1 1 N 1 f2 M 2 V p PQ Pi P i i n N 1 i 1 nm N M 1 i 1 V(p)的一个无偏估计为 n n f 1 f 1 f 2 1 2 1 s2 p p p pi qi i 2 n n 1 i 1 n m 1 i 1 其中qi =1−pi。
ˆ Y 1 2 ˆ i ˆ s YHH YHH n n 1 i 1 zi ˆ M y 是Yi 的无偏估计 如果第二阶抽样是简单随机的,则 Y i i i ,而 1 2 2 ˆ V2 Yi M i V2 yi M i2 1 f 2i S 2 i mi 于是有 n M i yi 1 ˆ YHH n i 1 zi
第8-9章-多阶段抽样和二重抽样
ˆ ˆ E E E E
2
2
1
2
E 2 E E 2 V E ˆ ˆ E1 2 ˆ 1 2 1 2
E 2 E E 2 ˆ ˆ V1 E2 E1 2 ˆ 1 2 ˆ ˆ V1 E2 E1 V2
2 S2 V ( y ) S12 m
2 当n=1时, V1 (Yi ) S1
这时, 若以n个
yi 的均值 y 推断 Y
,其方差为
2 2 S1 S2 V ( y) n nm
再考虑fpc,则(1)式成立。
V y 的无偏估计为:
证明:
2 1
E (s ) S
2 2
1 f1 2 f1 1 f 2 2 v y s1 s2 n nm
1 1 n 1 1 E1 M iYi M n i 1 MN
M iYi Y i 1
N
估计量的方差为:
1 f1 M i 1 V y M Yi Y nNM 2 nN i 1 i 1
N N
二.按不等概抽初级单元
1.按PPS抽取初级单元 N 第i个单元被选中概率 Z i ,( Z i 1 ) i 1 以总量估计为例,利用Hansen-Hurwitz估计量 ˆ Y的估计: 1 n Y 1 n M y
ˆ YHH
z n
i 1
i
i
n
i 1
i
i
zi
ˆ 可以证明 YHH是Y的无偏估计
第八章 二阶及多阶抽样课件
n
M
i 2V
( yi)
V1
N
i1
n
E
1
N
2
i1
n2
V1
N
n
Y
i
i1
n
E
1
N
2
n i1
M
2 i
1 f2i mi
S
2 2i
n2
PPT学习交流
15
(2)比估计:
N
Yi
Y M0
i1 N
, 可用比估计
Mi
i1
,以
M
为辅助变量:
i
n
Yˆi
7
(2)V(y)1 nf1S1 21m f2n S2 2
证明:
V
(
y
)
V1
E
2
(
1 n
n i1
y
i
)
1
E
1
V
2
n
n i1
yi
V
1
1 n
n i1
Yi
E
1
1 n
2
n 1 f2 i1 m
•
M
( Y ij
Yi)2
i1
M 1
1 f1 n
S
2 1
1
f2 nm
E
1
1 n
m
(yijyi)2
j1
PPT学习交流
6
(1) y是Y 的无偏估计量;
证明: E ( y ) E 1 E 2 ( y )
nm
y ij
n
yi
E
1
E
2
(
i1 j1
nm
计量经济学第九章二重抽样
第九章二重抽样前面各章介绍的几种抽样技术中,大都需要事先了解一些关于总体的信息,例如分层抽样需要事先知道各层权重,比率估计和回归估计中需要知道总体的某些辅助信息但在一些情况下,这些资料在调查前无法预知。
这时,我们可以先从总体中抽取一个大的初始样本,从而获得总体的辅助信息,然后再从初始样本或从总体中再抽一个子样本,这种方法就是二重抽样。
本章第一节介绍二重抽样的定义、作用及其与两阶段抽样的区别,第二节介绍为分层抽样进行的二重抽样,第三节介绍为比率估计进行的二重抽样,第四节介绍为回归估计进行的二重抽样。
§9.1 引言一、定义二重抽样(double sampling),也称二相抽样或两相抽样(two-phase sampling),是指在抽样时分两步抽取样本。
一般情况下,先从总体N中抽取一个较大的样本'n,称为第一重(相)样本(the first phase sample),对之进行调查以获取总体的某些辅助信息,为下一步的抽样估计提供条件;然后进行第二重(相)抽样(the second phase sample)。
第二重抽样所抽的样本n相对较小,但是第二重抽样调查才是主调查。
一般地,第二重样本(the second phase sample)是从第一重样本中抽取的,也即第一重样本的子样本,但有时也可以从总体中独立地抽取。
由于样本是分两次抽取的,因此称做二重抽样。
例如,欲对某城市体育场馆的营业状况进行抽样调查,鉴于不同场馆功能和面积差异较大,拟采用分层抽样,但由于缺乏分层资料,故先随机抽选一个较大的样本,对该样本仅进行分层及进行层权估计,费用相对较低;然后利用第一次调查获得的分层资料,进行一次较小样本的分层抽样,对该样本进行一次正式调查。
这就是二重抽样。
显然,二重抽样方法也可以推广到多次抽取样本,然后结合起来对总体的有关标志值进行估计,这就是多重抽样或多相抽样。
本章主要讨论二重抽样。
二、二重抽样与两阶段抽样二重抽样和两阶段抽样,在名称上很容易引起混淆。
抽样调查-第9章 二重抽样
二、二重抽样与两阶段抽样的区别
1.两阶段抽样是先从总体N个单元中抽出n个样本 单元,却并不对n个样本都进行调查,而是从中再抽出 若干个二级单元进行调查。
返回
2。两阶段抽样的第二阶段抽样单元与第一阶段抽样 单元往往是不同的。而二重抽样的第二重样本往往是 第一重样本的子样本。
三、二重抽样的作用
(一)有利于筛选主调查对象 (二)节约调查费用 (三)提高抽样效率
80 60 40 20 200 2 7 15 40
2 yij j
2 j
s
400 3100 9600 45120
1.01 2.71 15.38 690.53
解
w1
根据上表可计算各层的权重:
540 0.32, w3 0.10, w4 0.04 0.54, w2 1000
第一重样本第h层方差:sh
2
nh 1 2 2 第二重样本第h层方差:sh ( y y ) hj h nh 1 j 1
二、抽样方法
第一步: 利用简单随机抽样,从总体的N个单元中随机 抽取第一重样本,样本单元数为 n ;根据已知的分层标 n 志将第一重样本分层,令 wh h , (h 1,2,, L) ,则 n 是总体层权 W 的无偏估计。 wh
L
而总体均值估计量的方差为:
1 1 2 L Wh S h2 1 V ( y stD ) ( ) S ( 1) n N n f hD h 1
返回
要在一定的费用约束下使估计方差最小化,则有
L V ( y stD ) (C c1n n c2 h f hDWh )
§9.1 引言
一、二重抽样的定义
二重抽样(double sampling),也称二相抽样,是指分 两步抽取样本。先从总体N中抽样一个较大的 样本 n ,称为第一重样本,对其进行调查以获 取总体的某些信息,为下一步的抽样估计提供 条件;然后在第一重样本中再进行第二次抽样。 这种抽样方法称为二重抽样。
多阶抽样——精选推荐
第九章 多阶段抽样第一节 多阶抽样概述一、 多阶抽样的概念1、单阶抽样:从总体中通过一次抽样就能够产生一个完整的样本,这类抽样即为单阶抽样。
前面介绍的几种抽样方式均为单阶抽样。
适合用于总体单元数相对较少的抽样过程。
2、多阶抽样:将整个抽样过程分成若干个阶段,一个阶段一个阶段地进行抽样以完成整个抽样过程,这种抽样即为多阶抽样。
当我们面对的总体单元数很庞大,而且分布范围很广时,如果使用前面所学习的单阶抽样方法,不仅工作量大,而且在精度上很难把握,此时如果改用多阶抽样方法,就会避免上述困难,从而达到理想的抽样效果。
3、关于多阶抽样的具体描述:如果我们面对的一阶单元内总体基本单元数相当大,作全面的调查就会比较困难,或者一阶单元内各二阶单元可以给出相近的结果,作全面的调查又无必要。
此时从费用和抽样估计效率考虑,便可以从总体中随机抽取一部分一阶单元,然后再从被抽中的一阶单元内,随机抽取部分二阶单元并对他们作全面调查,我们把这种抽样技术称为两阶抽样。
如果在被抽中的二阶单元中,再抽取部分三阶单元组成样本,并对抽中的三阶单元进行全面的调查,这就是三阶抽样。
类似地,可以定义四阶抽样或更高阶的抽样,通常将两阶以上的抽样称为多阶抽样。
需要指出的是,多阶抽样中,各阶可以采用不同的抽样方法,也可采用同一种抽样方法,要视具体情况和要求而定。
在两阶抽样中,总体各一阶单元所包含的二阶单元数,有相等和不相等的两种情况。
前者无论在样本的抽取还是在指标的估算方面都相对比较简单,然而在抽样实践中却很少有这种情况的存在,但作为基本方法仍然有其实际意义;后种情况在抽样和指标的估算方法上都较为复杂,然而在实际中普遍存在此种情况。
4、两阶抽样与分层抽样和整群抽样的关系:将总体分为若干个一阶单元,如果在每一个一阶单元中,都随机抽取部分二阶单元,由这些二阶单元中的总体基本单元组成的样本,在抽样的方式上,就相当于分层抽样;如果在全部的一阶单元中,只抽取了部分一阶单元,并对抽中的一阶单元中的所有的基本单元都做全面调查,这就是整群抽样。
第9章 二重抽样
第9章二重抽样§9.1 引言一、定义在设计和实施某些抽样调查时,需要事先掌握有关总体的一些信息。
但在许多场合下,总体的这些有关信息是事先未知的,或者不完全知道,如分层抽样的各层权重、比率估计和回归估计中的辅助信息等。
为此,人们提出了二重或多重抽样的方法,以掌握有关总体信息,然后实施抽样调查。
如何实施抽样呢?其基本做法是:对于一个大总体,先从总体中随机抽取一个较大的样本(第一重样本),由此估计有关总体的结构或辅助指标以及其他有关信息,为第二重抽样估计提供条件;然后再从第一重样本中随机抽取一个较小的样本(第二重样本),利用这第二重样本,对总体所研究变量进行抽样推断。
二重抽样(double sampling),也称二相抽样或两相抽样。
是指在抽样时分两步抽取样本。
一般来说,先从总体N中抽取一个较大的样本n’,称为第一重样本,对之进行调查以获取总体的某些辅助信息,为下一步的抽样估计提供条件;然后进行第二重抽样。
第二重抽样所抽的样本n相对小。
第二重抽样有两种方式:一是从第一重样本中抽取,也即第一重样本的子样本;二是从总体中独立抽取。
二、二重抽样与两阶段抽样三、二重抽样的作用四、二重抽样的原理§9.2 为分层的二重抽样在分层抽样中,我们要求总体各层的层权应事先已知,如果层权未知或不能事先确定,则分层抽样在精度上的得益可能会在很大程度上被抵消掉,此时,选择二重分层抽样可以较好地解决层权问题。
二重分层抽样是先在总体中随机抽取第一重样本n′,对这个样本各单元进行分层后求各层的层权,然后从第一重样本中用分层随机抽样法抽取第二重样本n,用于估计总体指标。
由于第一重简单随机抽样,第二重分层抽样,故其误差同二重的抽样都有关二、估计量及其性质(一)均值估计量(二)估计量方差∑==Lhhh stDywy1'•四、二重分层抽样样本量的分配∑=+==Lh hhD h T TW f c n n c C E C 12''1*)(§ 9.3 为比率估计的二重抽样• 一、二重抽样的比率估计量及方差 •(一)二重抽样的比率估计量(二)二重抽样比率估计的方差的平均数为第一重样本辅助变量’x xx y RD '=xyR s R s R nn s n y v RS S R n n S n y V yx x y RD yx x y RD =--+≈--+≈∧∧∧其中)2)(11(1)()2)(11(1)(22'222'2•三、二重抽样比率估计是样本量的最优分配••§ 9.4 为回归估计的二重抽样• 一、二重抽样回归估计的抽样方法• 第一,从总体中的N 个单元中随机抽取第一重样本,样本单元数为n’;获取辅助变量xi’,计算• ,估计总体均值fc c C n S R RS c RS S R S c f T x yx yx x y 21*'2222221)2()2(+=--+=∑=='1''1n i xn x X• 第二,从第一重样本中随机抽出第二重样本,样本单元数为n;观测变量yi 与辅助变量xi ,计算,•三、二重抽样回归估计是样本量的最优分配§ 9.5 连续抽样中的样本轮换及其估计 一、样本轮换的必要性b 和、x y ∑∑==---==i ini ii xyxx x x y s s b 1212)())(()('x x b y y lrD -+=的估计值为相关系数其中ρρr s r nn s n y v S n n S n y V yy lrD y y lrD 22'222'2)11(1)()11(1)(-+≈-+≈)1()1(2211*21*'2221ρρρρρ-+=+=-=c c c C f c c C n c c f T T二、样本拼配与二重回归估计的应用。
第八章 二阶及多阶抽样
i 1
估计该柜台上个月的营业总额及标准差。
解: i 1 2 3 4
yi 11.05 9.22 7.93 8.94
2 s2 i 58.90 16.00 19.10 37.76
1 n m 1 4 40 y yij yij 9.28 nm i j 160 i j
n 1 2 s ( y y ) 1.69 i n 1 i 1 2 1
1 n 2 s s2 i 32.94 n i 1 n 4 m 40 f1 , f2 N 18 M 200 1 f1 2 f (1 f 2 ) 2 v( y ) s1 1 s2 0.37 n mn
2 2
ˆ NMy Y 18 200 9.28 33408 .00 ˆ ) NM v( y ) s (Y 18 200 0.37 2189.79
方差
总体 初级单元数 次级单元数 总和 初级单元的均值 N M 0 NM
N N i 1
样本 n m0 nm
n
Y Yi Yij
i 1 j 1
M
y yi yij
i 1 i 1 j 1
n
m
Y Y / N
y yi / n y
n
次级单元的均值
性质l 对于两阶抽样,有
ˆ) E E ( ˆ) (1)E( 1 2
ˆ) V E ( ˆ) E V ( ˆ) (2)V ( 1 2 1 2
式中,E2,V2为在固定初级单元时对第二阶抽样 求均值和方差;E1,V1为对第一阶抽样求均值和 方差。
~ ˆ 记E() ~ 2 ~ 2 ˆ ˆ ˆ V ( ) E( ) E1 E2 ( ) ~ 2 ~ ~2 2 ˆ ˆ ˆ 由E2 ( ) E2 ( ) 2 E2 ( ) ~ ~2 2 ˆ ˆ ˆ [ E ( )] V ( ) 2 E ( )
《应用抽烟技术》第八章 二阶与多阶抽样
Yi Yi M i
Y Y M0
yy
m
iபைடு நூலகம்1
n
i
y i yi mi
Y Y N
yy n
二.总体总和Y的估计
实施方法:
对每个初级单元,设定一个概率 Z i ( Z i 1) , i 1 进行n次独立放回抽样,每次抽到第i个初级单元的 概率为 Z i (i 1,2,, N ) 。
304.25 717.67 500.25 168.25 368.92 1418.25 752.92 1124.33 430.92 1682.00 628.92 514.92
(二)总体比例的估计
1.如果要估计总体中具有所研究特征的二级单元数占全 体二级单元数的比例P,则P的一个无偏估计为:
1 n 1 n p pi ai n i 1 nm i 1
将初级单元按大小分层使层内的初级单元大小大致相同用不等概率抽样抽取初级单元或虽仍用简单随机抽样抽取初级单元但改变估计量的形式放回不等概率抽样分别表示第一阶抽样与第二阶抽样的样本量分别表示抽样比其他记号如下
第八章 二阶与多阶抽样
第一节 概述 第二节 初级单元大小相等时的二阶抽样 第三节 初级单元大小不等时的二阶抽样
例2:某部委对所属企事业单位就一项改革方案进 行抽样调查,采用二阶抽样。先在全部 N =1250 个单位(平均每个单位职工人数 M =250)中按简 单随机抽样抽取 n =350个单位,然后对抽中的每 个单位再按简单随机抽样抽取 m =8个职工进行调 查。样本单位中赞成此项改革方案人数为 k 的单 位频数 nk (k 0,1,2,,8) ,及赞成比例 p k 如下表所 示。试估计该部委全体职工赞成该项方案的比 例 P ,给出估计量的方差估计,并估计此项二阶 抽样的设计效应(P249)。
多阶抽样
多阶抽样————————————————————————————————作者:————————————————————————————————日期:第九章 多阶段抽样第一节 多阶抽样概述一、 多阶抽样的概念将整个抽样过程分成若干个阶段,一个阶段一个阶段地进行抽样以完成整个抽样过程,这种抽样即为多阶抽样。
分层抽样实际是第一阶抽样比为100%时的一种特殊的两阶抽样;而整群抽样实际上是第二阶抽样比为100%时的一种特殊的两阶抽样,故也称单级整群抽样。
多阶抽样的特征:便于组织抽样;抽样方式灵活,有利于提高抽样的估计效率;多阶段抽样对基本调查单元的抽选不是一步到位的;多阶段抽样实质上是分层抽样与整群抽样的有机结合;多阶抽样在抽样时并不需要二阶或更低阶单元的抽样框;多阶抽样还可用于“散料”的抽样,即散料抽样。
第二节 一阶单元等大小的二阶抽样第一阶段在总体N个初级单元中,以简单随机抽样抽取n 个初级单元,第二阶段在被抽取的初级单元包含的M 个二级单元中,以简单随机抽样抽取m 个二级单元,即最终接受调查的单元。
(一)估计量及其方差对于二阶抽样,若两个阶段的抽样都是简单随机的,则其总体均值Y 的无偏估计量为0111ˆ1n mnij i i j i Y y y m y n ======∑∑∑.由于在每个一阶单元中的第二阶抽样是相互独立进行的,所以,在二阶段都用不放回方法抽样时,其总体均值估计量的方差可构造为22221111)(S mnf S n f y V -+-==NS mn S M SS n 21222221)(1-+- 可以证明其方差的无偏估计量为2221211)1(1)(ˆs mnf f s n f y V -+-= 其中,22s 为22S 的无偏估计,21s 不属于21S 的无偏估计,21S 的无偏估计为22221211ˆs mf s S --= 式中右边第一部分相当于第一阶段抽样的误差,它只与各一阶单元间差异大小有关;第二部分相当于第二阶段抽样的误差,它只与各一阶单元内(即各二阶单元间)差异有关。
抽样调查-第8章多阶段抽样
利用第五章的方法,事先规定每个初级单元被抽中的
概率
N
Zi ( Zi
1). 对被抽中的初级单元,再抽取mi
PiQi
V ( p) 的无偏估计为:
v(
p)
1 f1 n(n 1)
n
i1
(
pi
p)2
f1(1 f2 ) n2 (m 1)
n
i1
pi qi
式中, Qi 1 Pi 欲调查某个新小区居民家庭装潢聘请装潢
公司的比例。我们在15个单元中随机抽取了5个单元,在 这5个单元分别随机抽取了4户居民进行调查,对这20户 的调查结果如下表:
S 2 2i
M
1 i
1
Mi j 1
(Yij
Y i )2,
s 2 2i
1 mi 1
mi
( yij
j 1
yi )2
返回
二、估计量及其性质
(一)对初级单元进行简单随机抽样
如果二阶抽样中每个阶段都采用简单随机抽样,并且 每个初级单元中二级单元的抽样是相互独立的,则对 总体总和的估计可以采用简单估计,也可以考虑采用 比率估计。
1.简单估计量 对总体总和的简单估计为:
Yu
N n
n i1
Mi
yi
N n
n
Yi
i1
根据性质1,不仅可以证明这个估计量是无偏的,并
且它的方差为:
返回
V (Yu )
N 2 (1 n
f1)
1 N
1
N i1
(Yi
Y )2
N n
N i1
M
2 i
(1
mi
f2i )S22i
V (Yu ) 的一个无偏估计为:
第九章(多阶段抽样)
抽样调查
原理与方法
性质1可以推广到分多步抽样的情形,例如 对于三阶段抽样,有
Eˆ E1E2E3 ˆ
V ˆ V 1 E 2 E 3ˆ E 1 V 2 E 3ˆ E 1 E 2 V 3ˆ
抽样调查
原理与方法
第二节 初级单元大小相 等时的二阶抽样
采用 srs,从 N 中抽 n 个初级单元 采用 srs 从每个中选初级单元中抽取 m 个次级单元
M
或S
2 1
S
2 2
M
0 ,则取
。
抽样调查
原理与方法 第三节 初级单元大小不等时的二阶抽样
一、一 般 说 明
几种处理方法 * 先 分 层 ,再 抽 样 *不等概抽样
必要符号补充
N
M 0 : M 0 M i
抽样调查
原理与方法
f 2 i: f 2 i M m i i
S 2 2 i M 1 i 1 M i( Y i j Y i ) 2
C2m)
其中:
S
2
S
2 1
S
2 2
M
抽样调查
原理与方法
使上式达到极小的充要条件是
S S2
m
C1 C2m
从而 mopt 满足
mopt
S2 S
C1 C2
抽样调查
原理与方法
由上式看出,m与
S
2 2
,C
1
成正比,与
S
2 1
,C 2
成反比。
求出m后,利用(4),(5)式,即可求出n.
抽样调查
原理与方法
抽样调查
原理与方法
如果每个二级单元又由更小的三级单元组 成,那么在第二阶段抽样后,若在每个 被抽中的二级单元中再进行三级单元的 抽样,则是三阶段抽样(三阶抽样)。 同样的道理,还可以定义更高阶段抽样 。对于二阶段以上的抽样,称为多阶段 抽样(多阶抽样)。
抽样调查-第9章 二重抽样
j 1 ,2 , ,n h ;h 1 ,2 , ,L
第二重样本第h层样本单元的平均数:
总体方差:S 2
,第h层精的选完总整p体pt课方件 差:
S
2 h
yh
1 nh
nh
yhj
j1
返回 4
第一重样本第h层方差:s h 2
第二重样本第h层方差:sh2nh11jnh1(yhjyh)2
二、抽样方法
第一步: 利用简单随机抽样,从总体的N个单元中随机
1.两阶段抽样是先从总体N个单元中抽出n个样本
单元,却并不对n个样本都进行调查,而是从中再抽出
若干个二级单元进行调查。 精选完整ppt课件
返回 1
2。两阶段抽样的第二阶段抽样单元与第一阶段抽样 单元往往是不同的。而二重抽样的第二重样本往往是 第一重样本的子样本。
三、二重抽样的作用
(一)有利于筛选主调查对象 (二)节约调查费用 (三)提高抽样效率 (四)可用于研究样本轮换中的某些问题 (五)降低无回答偏倚
yh
80
2
60
7
40
15
20
40
200
y2 ij j
400 3100 9600 45120
sj
2
1.01 2.71 15.38 690.53
解 根据上表可计算各层的权重:
w 1 1 50 4 0 . 5 0 0 ,w 2 4 0 0 . 3 ,w 3 2 0 . 1 ,w 4 0 0 . 04
精选完整ppt课件
返回11
假设第一重抽样的单元平均调查费用为c 1 ,第二重 抽样第 h 层的单元平均费用为c 2 h 。忽略其他费用,则
费用函数可以表示为:
L
CT c1n c2hnh
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二.样本的最优分配 即n和m的关系, 最优分配指,费用一定方差最小,或方差一定费用最省 设费用函数: C c0 nc1 nmc2 (4)
1 f1 2 1 f 2 2 V ( y) S1 S2 n mn
1 1 2 1 1 1 2 ( ) S1 ( ) S 2 n N n m M 2 2 S 2 S12 1 2 S2 ( S1 ) n M mn N
2 S2 V ( y ) S12 m
2 当n=1时, V1 (Yi ) S1
这时, 若以n个
yi 的均值 y 推断 Y
,其方差为
2 2 S1 S2 V ( y) n nm
再考虑fpc,则(1)式成立。
V y 的无偏估计为:
证明:
2 1
E (s ) S
2 2
1 f1 2 f1 1 f 2 2 v y s1 s2 n nm
ai 为第i个初级单元中具有所研究特征的二级单元数
N 1 f1 1 N 1 f2 M 2 V p Pi P nm N M 1 PQi i n N 1 i 1 i 1
f1 1 f 2 n 1 f1 n 2 v p pi p n2 m 1 pi qi n n 1 i 1 i 1
⒉ 加权估计
总体均值
1 初级单元的平均规模: M N
Y
的估计为:
M0 Mi N i 1
N
1 n Mi 1 y yi n i 1 M nM
n
M y
i 1 i
n
i
该估计量无偏 证明: 1 E y E1 E2 nM
M i yi i 1
对初级单元进行分层,使层内初级单元规模相仿 按初级单元规模不等处理 加权处理 不等概抽样 一、等概抽样,加权估计 简单随机抽样抽初级单元,估计使用加权思想
⒈ 简单平均估计
1 yi mi
y
j 1
mi
ij
,
1 y n
y
i 1
n
i
ˆ Y M0 y
此时没有考虑权数,估计量有偏 遗憾的是,现实中这种情况常出现
n
其方差为:
1 f1 2 1 f 2 2 V y S1 S2 (1) n nm
假定n=1, 第二阶段抽取m个单位
其次,用
2 S2 用 yi 估计 Y ,误差大小取决于 S 2 和m,即 V2 ( yi ) 2 i m 2
Yi 推断 Y 时,推断误差大小取决于 S1 和n,
,
2 2
(2)
1 N 1 n 2 2 (Yi Y ) 2的无偏估计 s ( yi y ) 不是 S1 但 N 1 n 1
计算 S
2 1 时, i
Y 不受二阶抽样影响,用 s
2 1 计算
yi 则不然。
即
E ( s12 ) E1 [ E 2 ( s12 )] E1 [ (Yi Yn ) 2
证明:
ˆ v YHH
yi ˆ ˆ 1 1 z YHH n n 1 i 1 i
n
2
ˆ 对 V (YHH ) 两个分量分别估计
ˆ 1 N V2 (Yi ) 第二阶段方差分量 的无偏估计为 n Zi
ˆ 1 n v2 (Yi ) ˆ v2 (YHH ) 2 2 n zi Y 1 N 第一阶段方差分量 Z i ( i Y ) 2 的无偏估计为 n Zi n ˆ ˆ Yi ˆ 2 1 n v2 (Yi ) 1 ˆ v1 (YHH ) ( z YHH ) n 2 z 2 n(n 1) i i
Yˆ
i
M i2 (1 f 2i ) 2 N 2 (1 f1 ) 1 N ˆ V (Y ) (Yi Y ) 2 S 2i n N 1 n mi
M i2 (1 f 2i ) 2 N 2 (1 f1 ) 1 N ˆ ˆ ˆ v(Y ) (Yi Y ) 2 s2 i n n 1 n mi
2 1 2
ˆ ˆ E E E E
2
2
1
2
E 2 E E 2 V E ˆ ˆ E1 2 ˆ 1 2 1 2
E 2 E E 2 ˆ ˆ V1 E2 E1 2 ˆ 1 2 ˆ ˆ V1 E2 E1 V2
2 ˆ N N V Y Yi 估计量方差 2 i 1 ˆ V YHH Zi Z Y Z n i 1 i i 1 i n ˆ Yi ˆ 2 1 ˆ ˆ YHH 的无偏估计为: v(YHH ) = ( z YHH ) n(n 1) i
使上式达到极小的充要条件是: S C1 S2 C2 m
m
从而 mopt满足
mopt
S2 Su
2 S2 c1 2 2 其中, Su S1 。 M c2
由上式看出,m与 S 2 , c1 成正比,与 S1 ,c2 成反比 求出m后,利用(4)式,即可求出n
第三节 初级单元不等的情况
n m 2 1 2 s2 yij yi n m 1 i 1 j 1
第i个初级单元内的方差:
2 1 Mi 2 S2i Yij Yi M i 1 j 1
2 1 s yij yi mi 1 j 1 2 2i
2 2 S 2 是所有 S 2i 的平均值,即:
类似地,可以得到三阶抽样的估计方差
1 f1 2 f1 (1 f 2 ) 2 f1 f 2 (1 f 3 ) 2 ( y) s1 s2 s3 n nm nmk
总量Y的估计
ˆ v Y N 2 M 2v y
比例P的估计
ˆ Y NMy
1 n 1 n p pi ai n i 1 nm i 1
二.按不等概抽初级单元
1.按PPS抽取初级单元 N 第i个单元被选中概率 Z i ,( Z i 1 ) i 1 以总量估计为例,利用Hansen-Hurwitz估计量 ˆ Y的估计: 1 n Y 1 n M y
ˆ YHH
z n
i 1
i
i
n
i 1
i
i
zi
ˆ 可以证明 YHH是Y的无偏估计
n mi 第一阶段和第二阶段的抽样比: f1 , f 2i N Mi
二阶单元个数: M 0 M i , m0 mi
i 1
i 1
N
n
指标总和:Y Yij , y yij
i 1 j 1
N
Mi
n
mi
i 1 j 1
第i个初级单元指标总和:Y Y , yi yij i ij
mi
S
同理有:
2 2
1 N
S
j 1
N
2 2i
1 n 2 2 s2 s2i n j 1
四.推断原理
ˆ ˆ E E1E2
2
ˆ ˆ ˆ V V1 E2 E1 V2
证明:
ˆ ˆ ˆ V E E
二.多阶抽样特点
1.抽样框构造相对容易 2.节省人力、物力 3.保持了整群抽样相对集中的优点,又克服了群内同质性 强的弱点 4.误差与阶段多少有关
三.符号
总体初级单元数:N
第一阶段样本量(初级单元数):n 第i个初级单元中基本单元数: M i 第i个初级单元中第二阶样本量: mi 第i个初级单元中第j个二级单元观测值: ij Y 样本中第i个初级单元第j个二级单元的观测值: yij
第八章 多阶段抽样(Multi Stage Sampling) 第一节 概述
一、什么是多阶抽样 分多个阶段抽到最终接受调查的单元
初级单元(PSU)----Primary Sampling Unit 二级单元 (SSU)----Second-stage Sampling Unit 三级单元(TSU)----Third-stage Sampling Unit 最终单元 (SSU)----Ultimate Sampling Unit
j 1
Mi
mi
j 1
第i个初级单元均值: i 1 Y Mi
Yi , 1 Yij M yi j 1 mi i
Mi
yi yij m j 1 i
mi
1 总体均值: Y M0
Y Yij M , y i 1 j 1 0
N
Mi
y
i 1 j 1
ˆ MSE YR
N 2 1 f1 n
1 N M i2 Yi Y N 1 i 1
2
2 N N M i 1 f 2i 2 S 2i n i 1 mi
2 n N 2 1 f1 1 n M i2 1 f 2i 2 ˆ N 2 ˆ v YR M i yi YR n m s2i n n 1 i 1 i 1 i
2 M i mi S 2i M i2 ( ) Mi mi N
1 nNM 2
2 M i mi s2i M i2 ( ) Mi mi n
总量估计
ˆ YR M 0
M y
i 1 n i
n
i
M
i 1
M0
Yˆ
i 1 n i 1
n
i
i