第九章(多阶段抽样)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

f2i
?
mi Mi
? S22i
?
1 Mi ? 1
Mi
(Yij
? Yi )2
抽样调查
原理与方法
如果初级单元之间的规模差异不是很明显 ,并不能将其严格分层,仍然可以采用 简单随机抽样抽取初级单元。若二阶抽 样中每个阶段都采用简单随机抽样,并 且每个初级单元中二级单元的抽样是相 互独立的
抽样调查
原理与方法
抽样调查
原理与方法
Chapter 8 Multi--Stage sapmling
抽样调查
原理与方法
当总体单元的数目大、分布广时,若采用简单随机抽样,则 需要编制包含全部总体单元的抽样框,工作量相当大; 若采用系统抽样,则需将全部总体单元按一定标志进行 有序排列,实施起来仍然很麻烦;若采用分层抽样,则 需掌握一定的辅助信息进行分层,而实际应用中并不一 定能找到合适的辅助变量;若采用单级整群抽样,则必 需掌握全部总体单元的有关资料后进行分群,并在入样 群内进行全面调查,工作量也是极其庞大的。例如,欲 做农户家计调查,我国约有两亿农户,如果按上述几种 方式进行抽样,其工作量之大难以想象。此时若采用多 阶段抽样,可以简化抽样框的编制,便于最终样本单元 的抽取,使得组织工作容易进行,避免上述抽样设计过 程中的麻烦。
? ? ? ? V(??) ? V1 E2(??) ? E1 V2(??)
于是有:
V(y) ? 1? f1 n
S12
?
1? f2 mn
S22
(1)
抽样调查
原理与方法
V ?y?的无偏估计为:
? ? v
y
?
1? n
f1
s12
?
f1
?1?
nm
f2
?s22
式中估计量的方差由两项组成:第一项源于第一阶段
抽样,主要取决于第一阶段抽样的样本量 n 与初级
抽样调查
原理与方法
二、多阶段抽样特点
1.构造抽样框相对容易
多阶段抽样的一优点是不需要编制所有小 单元的抽样框。抽取初级单元时,只需 编制初级单元的抽样框,对被抽中的初 级单元,再去编制二级单元抽样框,依 此类推,每阶段只需编制该阶段的抽样 框,从而大大降低编制抽样框的工作量 ,实际中非常方便。
抽样调查
,则方差越小,即提高 n 、减小 m 可以大大
提高估计的精度。此外,可以证明(见附录)
初级单元内样本方差S
2 2
仍是总体相应方差
s
2 2

无偏估计,但样本初级单元间的方差
s
2 1
并不
是总体相应方差S
2 1
的无偏估计。
抽样调查
原理与方法
如果第一阶的抽样比 f1 可以忽略,则方差估计式可以简 单为如下的结果:
原理与方法
即使是在某个城市范围内的居民调查,也 不可能且没有必要编制全市的居民名单 抽样框,多阶段抽样方法就可以解决这 一问题。
此外,对于有些调查问题,抽样框的变动 非常频繁,待抽样框整理完毕后,可能 与实际情况相去甚远,多阶段抽样也是 解决这类问题的办法。
抽样调查
原理与方法
2.节省人力、物力,发挥了抽样的效率
? ?
式中,E2 、V2为在固定初级单元时对第二步抽样求均值 和方差;E1 、V1 为对第一步抽样求均值和方差。二 阶段抽样的抽样是分两步进行的,所以具有上述性
质。
抽样调查
原理与方法
性质1可以推广到分多步抽样的情形,例如 对于三阶段抽样,有
? ? ? ? E ?? ? E1E 2 E3 ??
?? ? ??? ? ??? ? ??? V??
M N(M ?1)
N
PiQi
抽样调查
原理与方法
? ? v( p) ? 1? f1
n(n ? 1)
n
( pi
?
p)2
?
f1(1? f2) n2 (m ? 1)
n
pi qi
四、最优样本量 m 与 n 的确定 目标:
CT 给定条件下,如何确定 m 与 n,从而使V(y) 最小。
抽样调查
原理与方法
二阶抽样费用函数
抽样调查
原理与方法
4.可用于散料的抽样 所谓“散料”,是指连续松散的、不易区分
的个体或抽样单元的材料。例如一堆煤、 一车水泥、储藏在一个仓库的粮食等。进 行散料的抽样时,抽样单元可以人为划分 ,也可以取其自然的单位。例如,一级单 元是自然或人为划分的分装(例如一袋水 泥),二级单元则是从分装中抽取一定数 量(如一千克)的份样作调查。
?
[(S12
?
S22 ) M
?
Sm22 ](C1
?Байду номын сангаас
C2m)
? (S?2 ? Sm22 )(C1 ? C2m)
其中:
S
2 ?
?
S12
?
S
2 2
M
抽样调查
原理与方法
使上式达到极小的充要条件是
S? ? S2
m
C1 C 2m
从而 m opt 满足
m opt
?
S2 S?
C1 C2
抽样调查
原理与方法
由上式看出,m与 S22 ,C1成正比,与 S12 ,C2 成反比。 求出m后,利用(4),(5)式,即可求出n.
抽样调查
原理与方法
一般说来,mopt 不为整数,而在实际应用时,要取整 数,为此,Cameron(1951)给出了下面的取值 规则:
若令 m? 是 m opt 的整数部分,即m?? ??mopt ?? ,则有:
(1)若
m2 opt
?
m??m?? 1?,取m?m??1

(2)若
m2 opt
?
m??m??
? ? ? ? ? v y
? s12 ? 1 1 n n n n ? 1 i?1
yi ? y 2
这个结果在实际工作中可以作为参考,因为当第二阶段
采用等距抽样或某些复杂抽样时,方差
S
2 2
的无偏估计
很难得到,当 f1可以忽略时,只需要初级单元的均值
y i就可以得到方差近似估计。当然,从另一个方面看
,f1 可以忽略,意味着总体中初级单元 N 很大而抽选
C T ? C 0 ? C1 n ? C 2 nm
(4)
V( y)
?
1 ? f1 n
S12
?
1 ? f2 mn
S
2 2
?
(1 n
?
1 N
)
S
2 1
?
1(1 nm
?
1 M
)
S
2 2
?
1 n
( S12
?
S
2 2
)
?
M
S
2 2
mn
?
S
2 1
N
(5)
抽样调查
原理与方法
极小化
(V?
1 N
S12)(CT
?
C0)
当初级单元大小不等,且按初级单元的规 模分层后,各层级初级单元的大小差别 仍很大,或者合理的分层是按其他指标 进行的,对初级单元抽样一般采用不等 概抽样。这个过程可以通过放回不等概 率抽样(PPS)或者不放回不等概率抽 样(∏PS)实现。
?V1
E2 ??E3
??
? ?
? E1
V2 ??E3
??
? ?
? E1
E2 ??V3
??
? ?
抽样调查
原理与方法
第二节 初级单元大小相 等时的二阶抽样
采用 srs, 从 N 中抽 n 个初级单元 采用 srs 从每个中选初级单元中抽取
一、符号
m 个次级单元
Yij ,总体中第 i 个初级单元中第 j 个次级单元指标值
单元间的方差 s12 ;第二项源于第二阶段抽样,主
要取决于第二阶段抽样的总样本量 nm与初级单元
内的方差 S22 。
抽样调查
原理与方法
一般而论,第一项占总方差的绝大部分,第二项
的分母是第一项的 m 倍,且要乘以小于1的因
子 f1,相对于第一项要小得多,因此在二级单
元样本量 mn 固定的条件下,n越大( m 越小)
多阶段抽样保持了整群抽样样本单元相对集中的特 点,因此与简单随机抽样相比,实施方便,每个 基本单元的调查费用较低;另一方面,它并不像 整群抽样那样对入样群的所有单元进行调查,而 是在中选的初级单元中抽取二级单元,避免了一 阶整群抽样由于调查过多的小单元而造成人力、 物力与财力的浪费,充分发挥了抽样的效率。因 此,多阶段抽样既保持了样本相对集中的优点, 又克服了样本信息相似重复、降低抽样效率的缺 点。
抽样调查
原理与方法
3.行政上便于组织,某些条件可满足各级需要 全国范围内的调查一般都用到多阶段抽样技术
,尤其是根据我国目前政治、经济体制的特 点,各级党政机关为了宏观控制经济,都需 要统计数字,而全国的抽样调查数字往往不 能满足各级政府的需要,如果把多阶段抽样 和各地的需要结合起来,可以利用现成的行 政区划或组织系统来划分阶段,为抽样调查 的组织工作提供方便,满足各级政府的数据 需求。
? y ? n yi
n
抽样调查
原理与方法
? S12
?
1 N?1
N
(Yi ? Y )2
? s12
?
1 n?1
n
( yi ?
y
)2
?? S22
?
1 N(M ? 1)
N
M
(Yij ? Yi )2
?? s22 ?
1 n(m ? 1)
n
m
( yij ? yi )2
抽样调查
原理与方法
第 i 个初级单元二级单元内的方差:
? ? ? S22i ?
1 Mi Mi ? 1 j?1
Yij ? Yi
2
? ? ? s22i
?
1 mi ? 1
mi j ?1
yij ? yi
2
抽样调查
原理与方法

S
2 2
的表达式注意到
S
2 2
是所有
S22i
的平均
值,即:
S
2 2
?
1 N
N
?S
2 2i
j?1
同理有:
? s
2 2
?
1 n
n
s
2 2
i
j?1
抽样调查
原理与方法
5.划分阶段不宜过多
抽样调查
原理与方法
三、推断原理
多阶段抽样属于分步抽样,对分步抽样,讨论估计量 ?? 的均值及其方差要分步进行。
性质1 对于二步抽样,有
? ? ? ? E ?? ? E 1 E 2 ??
? ? ? ? ? ? V
??
?
V1
? ?
E
2
??
? ?
?
E1
??V2
??
1?
,取 m ?
m? ;
m ? M (3)若
mo2pt
?
或 M
S12
?
S
2 2
M
?
0,则取

抽样调查
原理与方法 第三节 初级单元大小不等时的二阶抽样
一、一 般 说 明
几种处理方法 * 先 分 层 ,再 抽 样 *不等概抽样
必要符号补充
N
? M 0 : M 0 ? M i
抽样调查
原理与方法
f2i
:
抽样调查
原理与方法
第一节 概述
一.什么是多阶段抽样
分多个阶段抽到最终接受调查的样本。 初级单元(PSU)----Primary Sampling Unit 二级单元 (SSU)----Second-stage Sampling Unit 三级单元(TSU)----Third-stage Sampling Unit 最终单元 (SSU)----Ultimate Sampling Unit
抽样调查
原理与方法
假设总体由 N 个初级单元组成,每个初级单元又由若
干个二级(次级)单元组成,若在总体中按一定方
法抽取 n 个初级单元,对每个抽中的初级单元再抽
取若干二级单元进行调查,这种抽样方法称为二阶 段抽样( two-stage sampling)(也称二阶抽样、 二级抽样)。 在二阶段抽样中,全部抽样是分两步实施的:第一步 是从总体中抽初级单元,称为第一阶段抽样(第一 阶抽样);第二步是从每个被抽中的初级单元中抽 二级单元,称为第二阶段抽样(第二阶抽样)。
i =1,2,….N, j=1,2,….M
yij ,样本中第 i 个初级单元中第 j 个次级单元观测值
i =1,2,…n, j=1,2,….m
抽样调查
原理与方法
f1
?
n N
,
f2
?
m M
M
? Yi ? Yij
m
? yi ? yij
Yi
?
Yi M
抽样调查
原理与方法
yi
?
yi m
? Y ? N Yi N
出的 n却很小,结果是样本分布相对集中,势必增大
抽样误差,因此应用时要多加斟酌。
抽样调查
原理与方法
相应地,总体总量 Y及方差 V ?Y?的无偏估
计量分别为:
Y? ? NMy
? ? v Y? ? N 2M 2v?y ?
抽样调查
原理与方法
类似的,可以构造三阶抽样 y 的估计方差
?
(
y)
?
1? n
f1
抽样调查
原理与方法
如果每个二级单元又由更小的三级单元组 成,那么在第二阶段抽样后,若在每个 被抽中的二级单元中再进行三级单元的 抽样,则是三阶段抽样(三阶抽样)。 同样的道理,还可以定义更高阶段抽样 。对于二阶段以上的抽样,称为多阶段 抽样(多阶抽样)。
抽样调查
原理与方法
以上述我国农户调查为例,可以定义全国 的县为初级单元,乡镇为二级单元,自 然村为三级单元,户为四级单元。在全 国抽取若干样本县,在样本县中再抽若 干样本乡镇,在样本乡镇中,抽取若干 自然村,在自然村中抽取样本户,这是 一个四阶段抽样。
抽样调查
原理与方法
二、 Y 估计量的性质
? ?? Y? ?
y? 1 n
n
yi ?
1 nm
n
m
yij
E( y) ? Y
抽样调查
原理与方法
? E( y)
?
1 E1E2 ( n
n
yi )
? ?
1 E1[ n
n
E2 ( yi )]
? ?
1 E1[ n
n
Yi ] ? Y
抽样调查
原理与方法
估计量方差一般公式为:
s12
?
f1(1 ? f2 ) nm
s22
?
f1
f2 (1? nmk
f3 )
s32
抽样调查
原理与方法
三、总体比例的估计
ai,第 i 个初级单元中具有某特征的次级单元数。
? ?? p ? 1 n n
pi
?
1 nm
n
m
ai
? ? V(P) ? 1? f1 n
1 N?1
N
(Pi
? P)2 ? 1? f2 nm
相关文档
最新文档