第九章(多阶段抽样)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

S S2 m

C1 C2 m
从而 mopt 满足
mopt
S2 S
C1 C2
抽样调查
原理与方法
C1 成正比,与 S1 , C 2 成反比。 由上式看出,m与 S 22 ,
2
求出m后,利用(4),(5)式,即可求出n.
抽样调查
原理与方法
一般说来,mopt 不为整数,而在实际应用时,要取整 数,为此,Cameron(1951)给出了下面的取值 规则: 若令 m 是 mopt 的整数部分,即 m mopt ,则有: 2 m (1)若 opt m m 1 ,取m m 1 ; 2 m m 1 ,取 m m ; (2)若 mopt 2 (3)若 mopt 。 0,则取 m M M 或S S M


V ˆ V1 E2 E3 ˆ E1 V2 E3 ˆ E1 E2 V3 ˆ


抽样调查
原理与方法
第二节 初级单元大小相 等时的二阶抽样
采用 srs,从 N 中抽 n 个初级单元 采用 srs 从每个中选初级单元中抽取 m 个次级单元
抽样调查
原理与方法
第一节 概述
一.什么是多阶段抽样
分多个阶段抽到最终接受调查的样本。
初级单元(PSU)----Primary Sampling Unit
二级单元 (SSU)----Second-stage Sampling Unit 三级单元(TSU)----Third-stage Sampling Unit 最终单元 (SSU)----Ultimate Sampling Unit
抽样调查
原理与方法
二、多阶段抽样特点
1.构造抽样框相对容易 多阶段抽样的一优点是不需要编制所有小 单元的抽样框。抽取初级单元时,只需 编制初级单元的抽样框,对被抽中的初 级单元,再去编制二级单元抽样框,依 此类推,每阶段只需编制该阶段的抽样 框,从而大大降低编制抽样框的工作量 ,实际中非常方便。
抽样调查
m M
抽样调查
原理与方法
yi yi m Yi Y N
N
y
n
yi n
抽样调查
原理与方法
N 1 2 S12 ( Y Y ) i N 1
n 1 2 s12 ( y y ) i n 1
N M 1 2 S ( Y Y ) ij i N ( M 1) 2 2
抽样调查
原理与方法
如果每个二级单元又由更小的三级单元组 成,那么在第二阶段抽样后,若在每个 被抽中的二级单元中再进行三级单元的 抽样,则是三阶段抽样(三阶抽样)。 同样的道理,还可以定义更高阶段抽样 。对于二阶段以上的抽样,称为多阶段 抽样(多阶抽样)。
抽样调查
原理与方法
以上述我国农户调查为例,可以定义全国 的县为初级单元,乡镇为二级单元,自 然村为三级单元,户为四级单元。在全 国抽取若干样本县,在样本县中再抽若 干样本乡镇,在样本乡镇中,抽取若干 自然村,在自然村中抽取样本户,这是 一个四阶段抽样。
多阶段抽样保持了整群抽样样本单元相对集中的特 点,因此与简单随机抽样相比,实施方便,每个 基本单元的调查费用较低;另一方面,它并不像 整群抽样那样对入样群的所有单元进行调查,而 是在中选的初级单元中抽取二级单元,避免了一 阶整群抽样由于调查过多的小单元而造成人力、 物力与财力的浪费,充分发挥了抽样的效率。因 此,多阶段抽样既保持了样本相对集中的优点, 又克服了样本信息相似重复、降低抽样效率的缺 点。
抽样调查
原理与方法
假设总体由 N 个初级单元组成,每个初级单元又由若 干个二级(次级)单元组成,若在总体中按一定方 法抽取 n 个初级单元,对每个抽中的初级单元再抽 取若干二级单元进行调查,这种抽样方法称为二阶 段抽样(two-stage sampling)(也称二阶抽样、 二级抽样)。 在二阶段抽样中,全部抽样是分两步实施的:第一步 是从总体中抽初级单元,称为第一阶段抽样(第一 阶抽样);第二步是从每个被抽中的初级单元中抽 二级单元,称为第二阶段抽样(第二阶抽样)。
CT C 0 C1 n C 2 nm
(4)
1 f1 2 1 f 2 2 V ( y) S1 S2 n mn
1 1 1 1 1 2 2 ( ) S1 ( )S 2 n N n m M 2 2 2 S S S 1 2 ( S1 2 ) 2 1 n M mn N
抽样调查
原理与方法
3.行政上便于组织,某些条件可满足各级需要 全国范围内的调查一般都用到多阶段抽样技术 ,尤其是根据我国目前政治、经济体制的特 点,各级党政机关为了宏观控制经济,都需 要统计数字,而全国的抽样调查数字往往不 能满足各级政府的需要,如果把多阶段抽样 和各地的需要结合起来,可以利用现成的行 政区划或组织系统来划分阶段,为抽样调查 的组织工作提供方便,满足各级政府的数据 需求。
抽样调查
原理与方法
5.划分阶段不宜过多
抽样调查
原理与方法
三、推断原理 多阶段抽样属于分步抽样,对分步抽样,讨论估计量 ˆ 的均值及其方差要分步进行。 性质1 对于二步抽样,有
ˆ E E ˆ E 1 2

ˆ V E ˆ E V ˆ V 1 2 1 2
原理与方法
即使是在某个城市范围内的居民调查,也 不可能且没有必要编制全市的居民名单 抽样框,多阶段抽样方法就可以解决这 一问题。 此外,对于有些调查问题,抽样框的变动 非常频繁,待抽样框整理完毕后,可能 与实际情况相去甚远,多阶段抽样也是 解决这类问题的办法。
抽样调查
原理与方法
2.节省人力、物力,发挥了抽样的效率
抽样调查
原理与方法
4.可用于散料的抽样 所谓“散料”,是指连续松散的、不易区分 的个体或抽样单元的材料。例如一堆煤、 一车水泥、储藏在一个仓库的粮食等。进 行散料的抽样时,抽样单元可以人为划分 ,也可以取其自然的单位。例如,一级单 元是自然或人为划分的分装(例如一袋水 泥),二级单元则是从分装中抽取一定数 量(如一千克)的份样作调查。
(5)
抽样调查
原理与方法
极小化
2 2 S S 1 2 (V S1 )(CT C0 ) [(S12 2 ) 2 ](C1 C2m) N M m 2 S 2 (S 2 )(C1 C2m) m
其中:
2 S
2 S S 12 2 M
抽样调查
原理与方法
使上式达到极小的充要条件是
于是有:



(1)
1 f1 2 1 f 2 2 V ( y) S1 S2 n mn
抽样调查
原理与方法
V y
的无偏估计为:
1 f1 2 f1 1 f 2 2 v y s1 s2 n nm
式中估计量的方差由两项组成:第一项源于第一阶段 抽样,主要取决于第一阶段抽样的样本量 n 与初级 单元间的方差 s12 ;第二项源于第二阶段抽样,主 要取决于第二阶段抽样的总样本量 nm与初级单元 内的方差 S22 。
mi
抽样调查
原理与方法
2 2 S 由 2 的表达式注意到 S2 是所有 S22i 的平均
值,即:
S
2 2
1 N
2 S 2i j 1
N
同理有:
2 s2
1 n
2 s 2i j 1
n
抽样调查
原理与方法
二、 Y 估计量的性质
n n m ˆ 1 1 Y y yi y ij n nm
一、符号
Yij ,总体中第 i 个初级单元中第 j 个次级单元指标值
i =1,2,….N, j=1,2,….M
yij ,样本中第 i 个初级单元中第 j 个次级单元观测值
i =1,2,…n,
j=1,2,….m
抽样调查
原理与方法
n m f1 , f 2 N M Yi Yij y i y ij Yi Yi M
2 2
2 2
2 1
抽样调查
原理与方法
如果第一阶的抽样比 f1 可以忽略,则方差估计式可以简 单为如下的结果: 2 s12 1 1 n v y yi y n n n 1 i 1
这个结果在实际工作中可以作为参考,因为当第二阶段 2 采用等距抽样或某些复杂抽样时,方差 S2 的无偏估计 很难得到,当 f1可以忽略时,只需要初级单元的均值 y 就可以得到方差近似估计。当然,从另一个方面看 ,f1 可以忽略,意味着总体中初级单元 N 很大而抽选 出的 n却很小,结果是样本分布相对集中,势必增大 抽样误差,因此应用时要多加斟酌。
E( y) Y
抽样调查
原理与方法
1 n E ( y ) E1 E 2 ( y i ) n 1 n E1 [ E 2 ( y i )] n 1 n E1 [ Yi ] Y n
抽样调查
原理与方法
估计量方差一般公式为:
ˆ) V E ( ˆ) E V ( ˆ) V ( 1 2 1 2
抽样调查
原理与方法
一般而论,第一项占总方差的绝大部分,第二项 的分母是第一项的 m 倍,且要乘以小于1的因 子 f1,相对于第一项要小得多,因此在二级单 元样本量 mn 固定的条件下,n越大( m 越小) ,则方差越小,即提高 n 、减小 m 可以大大 提高估计的精度。此外,可以证明(见附录) 初级单元内样本方差S 仍是总体相应方差 s 的 2 s 无偏估计,但样本初级单元间的方差 1 并不 是总体相应方差S 的无偏估计。
n m 1 2 s ( y y ) ij i n( m 1) 2 2
抽样调查
原理与方法
第 i 个初级单元二级单元内的方差:
2 1 S Yij Yi M i 1 j 1 2 2i Mi
2 1 s yij yi mi 1 j 1 2 2i
抽样调查
原理与方法
三、总体比例的估计 ai,第 i 个初级单元中具有某特征的次级单元数。
1 n 1 n m p pi ai n nm
N 1 f1 1 N 1 f M 2 2 V (P) ( P P ) P i iQ i n N 1 nm N(M 1)
抽样调查
i
抽样调查
原理与方法
相应地,总体总量 Y 及方差 V Y 的无偏估 计量分别为:
ˆ NMy Y
2 2 ˆ v Y N M v y

Biblioteka Baidu 抽样调查
原理与方法
类似的,可以构造三阶抽样
y 的估计方差
1 f1 2 f1 (1 f 2 ) 2 f1 f 2 (1 f 3 ) 2 ( y) s1 s2 s3 n nm nmk
原理与方法
n 1 f1 n f ( 1 f ) 2 1 2 v( p) ( p p ) pi qi i 2 n(n 1) n (m 1)
四、最优样本量 m 与 n 的确定 目标:
CT 给定条件下,如何确定 m 与 n,从而使 V ( y) 最小。
抽样调查
原理与方法
二阶抽样费用函数




式中, E2 、V2为在固定初级单元时对第二步抽样求均值 和方差;E1 、V1 为对第一步抽样求均值和方差。二 阶段抽样的抽样是分两步进行的,所以具有上述性 质。
抽样调查
原理与方法
性质1可以推广到分多步抽样的情形,例如 对于三阶段抽样,有
ˆ EE E ˆ E 1 2 3
抽样调查
原理与方法
Chapter 8 Multi--Stage sampling
抽样调查
原理与方法
当总体单元的数目大、分布广时,若采用简单随机抽样,则 需要编制包含全部总体单元的抽样框,工作量相当大; 若采用系统抽样,则需将全部总体单元按一定标志进行 有序排列,实施起来仍然很麻烦;若采用分层抽样,则 需掌握一定的辅助信息进行分层,而实际应用中并不一 定能找到合适的辅助变量;若采用单级整群抽样,则必 需掌握全部总体单元的有关资料后进行分群,并在入样 群内进行全面调查,工作量也是极其庞大的。例如,欲 做农户家计调查,我国约有两亿农户,如果按上述几种 方式进行抽样,其工作量之大难以想象。此时若采用多 阶段抽样,可以简化抽样框的编制,便于最终样本单元 的抽取,使得组织工作容易进行,避免上述抽样设计过 程中的麻烦。
相关文档
最新文档