【课件】09第九章二重抽样PPT

合集下载

计量经济学第九章二重抽样

计量经济学第九章二重抽样

第九章二重抽样前面各章介绍的几种抽样技术中,大都需要事先了解一些关于总体的信息,例如分层抽样需要事先知道各层权重,比率估计和回归估计中需要知道总体的某些辅助信息但在一些情况下,这些资料在调查前无法预知。

这时,我们可以先从总体中抽取一个大的初始样本,从而获得总体的辅助信息,然后再从初始样本或从总体中再抽一个子样本,这种方法就是二重抽样。

本章第一节介绍二重抽样的定义、作用及其与两阶段抽样的区别,第二节介绍为分层抽样进行的二重抽样,第三节介绍为比率估计进行的二重抽样,第四节介绍为回归估计进行的二重抽样。

§9.1 引言一、定义二重抽样(double sampling),也称二相抽样或两相抽样(two-phase sampling),是指在抽样时分两步抽取样本。

一般情况下,先从总体N中抽取一个较大的样本'n,称为第一重(相)样本(the first phase sample),对之进行调查以获取总体的某些辅助信息,为下一步的抽样估计提供条件;然后进行第二重(相)抽样(the second phase sample)。

第二重抽样所抽的样本n相对较小,但是第二重抽样调查才是主调查。

一般地,第二重样本(the second phase sample)是从第一重样本中抽取的,也即第一重样本的子样本,但有时也可以从总体中独立地抽取。

由于样本是分两次抽取的,因此称做二重抽样。

例如,欲对某城市体育场馆的营业状况进行抽样调查,鉴于不同场馆功能和面积差异较大,拟采用分层抽样,但由于缺乏分层资料,故先随机抽选一个较大的样本,对该样本仅进行分层及进行层权估计,费用相对较低;然后利用第一次调查获得的分层资料,进行一次较小样本的分层抽样,对该样本进行一次正式调查。

这就是二重抽样。

显然,二重抽样方法也可以推广到多次抽取样本,然后结合起来对总体的有关标志值进行估计,这就是多重抽样或多相抽样。

本章主要讨论二重抽样。

二、二重抽样与两阶段抽样二重抽样和两阶段抽样,在名称上很容易引起混淆。

09-第九章 二阶及多阶抽样

09-第九章 二阶及多阶抽样
2 S2 i =
1 M å (Yij - Y i ) 2 M - 1 j =1

2 S2 =
1 N
åS
i =1
N
2 2i
9.2.2 总体均值 Y 的估计量及其性质 如果二阶抽样中的每一阶抽样都是简单随机的, 且对每个初级单元, 第 二阶抽样是相互独立的,则样本按次级单元的均值
y=
1 n m 1 n yij = å y i åå nm i =1 j =1 n i =1
=W 2å =W 2å
N
1- f 2 Si m i =1 1- f m i =1
é 1 M ù (Yij - Y i )2 ú å ê ë M - 1 j =1 û N M 1- f 1 (Yij - Y i ) 2 =W 2 åå m M - 1 i =1 j =1 = 1 N2 1m N M M 1 (Yij - Y i ) 2 åå m M - 1 i =1 j =1
(9.1)
作为总体均值
Y=
1 NM
åå Yij =
i =1 j =1
N
N
1 N
åY
i =1
N
i
(9.2)
3
的估计,有如下性质:
E( y) = Y V ( y) = 1 - f1 2 1 - f 2 2 S1 + S2 n mn
(9.3) (9.4)
为证明上述性质, 注意到二阶抽样是分两步进行的, 因此对估计量求均 值与方差需按第六章给出的下述一般公式进行,即:
V ( y) =
将 n = N 代入,有
1 - f2 2 S2 mn 1 - f2 2 S2 mN
V ( y) =
其中 f 2 =
m ,则 M

二阶与多阶抽样抽样调查理论与方法ppt课件

二阶与多阶抽样抽样调查理论与方法ppt课件

v(yst)h k 1W h 2(1 n h f1hs1 2 hf1h n (1 h m h f2h)s2 2 h) (9.12)
其中
f1h
N nhh、f2h
mh Mh
分别为第
h
层中的两个抽样比。
精选ppt课件
16
S
2 1
h
和S
2 2
h是第
h
层中的群间和群内方差,s
2 1
h

s
2 2
h是第
h
层中
(9.9)
nh m h
y hij而yh 源自i1 j1nhm h
(9.10)
由于各层的抽样相互独立,而由二阶抽样的有关讨论, y h 的
方差及其方差估计是已知的,因此:
V ar(yst)h k 1W h 2(1 n h f1hS 1 2 h1 n h m f2 h hS 2 2 h)
(9.11)
y
2 ij
j 1
11280.25
yi 25.02
s
2 2
i
135.02
2 408.30 12115.99
27.22
71.58
3 323.40 8752.76
21.56
127.16
4 502.50 17833.75
33.50
71.43
5 234.00 3953.00
15.60
21.61
6 387.75 11302.50
(y 1 .9 6 v(y),y 1 .9 6 v(y))
精选ppt课件
(9.1) (9.2)
7
例9.1:新华书店某柜台上月共用去发票70本,每本100张, 现随机从中抽出10本,每本随机抽出15张发票,得到数据 如下表:给出上月柜台营业总额的估计及其方差。

抽样调查-第9章 二重抽样

抽样调查-第9章 二重抽样

二、二重抽样与两阶段抽样的区别
1.两阶段抽样是先从总体N个单元中抽出n个样本 单元,却并不对n个样本都进行调查,而是从中再抽出 若干个二级单元进行调查。
返回
2。两阶段抽样的第二阶段抽样单元与第一阶段抽样 单元往往是不同的。而二重抽样的第二重样本往往是 第一重样本的子样本。
三、二重抽样的作用
(一)有利于筛选主调查对象 (二)节约调查费用 (三)提高抽样效率
80 60 40 20 200 2 7 15 40
2 yij j
2 j
s
400 3100 9600 45120
1.01 2.71 15.38 690.53

w1
根据上表可计算各层的权重:
540 0.32, w3 0.10, w4 0.04 0.54, w2 1000
第一重样本第h层方差:sh
2
nh 1 2 2 第二重样本第h层方差:sh ( y y ) hj h nh 1 j 1
二、抽样方法
第一步: 利用简单随机抽样,从总体的N个单元中随机 抽取第一重样本,样本单元数为 n ;根据已知的分层标 n 志将第一重样本分层,令 wh h , (h 1,2,, L) ,则 n 是总体层权 W 的无偏估计。 wh
L
而总体均值估计量的方差为:
1 1 2 L Wh S h2 1 V ( y stD ) ( ) S ( 1) n N n f hD h 1
返回
要在一定的费用约束下使估计方差最小化,则有
L V ( y stD ) (C c1n n c2 h f hDWh )
§9.1 引言
一、二重抽样的定义
二重抽样(double sampling),也称二相抽样,是指分 两步抽取样本。先从总体N中抽样一个较大的 样本 n ,称为第一重样本,对其进行调查以获 取总体的某些信息,为下一步的抽样估计提供 条件;然后在第一重样本中再进行第二次抽样。 这种抽样方法称为二重抽样。

多阶段抽样ppt课件

多阶段抽样ppt课件

n
m
f1 N , f2 M
16
总体和样本中第i个初级单元按二级单元的平均 值:
Yi
1 M
MYij ,j来自1它的最大缺点是由于群内小单元存在一定程度 的相似性(群内相关系数大于0),其抽样误 差高于同样样本量的简单随机抽样。
事实上,在多数情形,特别是当群的规模比较 大时,确实没有必要对群内所有次级单元都进 行调查。因此很自然地想到可以对每个被抽到 的群中的次级单元再次进行抽样。
3
二、多阶段抽样的定义及其与其他抽样的关系
第九章 多阶段抽样
第一节 引言 第二节 初级单元大小相等的二阶抽样 第三节 初级单元大小不相等的二阶抽样 第四节 其他问题
1
第一节 概述
一、概述 二、多阶段抽样的定义及其与其他抽样的关系 二、多阶段抽样的特点和作用 三、抽选方法与推断原理
2
一、引言
采用整群抽样的主要理由是整群样本比较集中, 实施便利,每个基本单元的调查费用较低。
个初级单元即是层,第一阶抽样是100%抽样, 而层内抽样是第二阶抽样。当然,层内抽样本 身也可能是多阶的。 在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
6
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
第一步是从总体中抽初级单元,称为第一阶抽样; 第二步是从每个被抽中的初级单元中抽二级单元,
称为第二阶抽样。
4
如果每个二级单元又由更小的三级单元 组成,那么第二阶抽样后,若对每个被 抽中的二级单元中的三级单元再进行抽 样,则是三阶抽样。
如果对每个被抽中的二级单元不再抽样, 调查其中每个三级单元,则称为二阶整 群抽样。

二重抽样

二重抽样
主要内容: 主要内容 1概述 概述 2 为分层的二重抽样 3为比估计与回归估计的二重抽样 为比估计与回归估计的二重抽样
6.1概述 概述
6.1.1二重抽样的定义 二重抽样的定义 二重抽样(也叫二相抽样),抽样过程分两 二重抽样(也叫二相抽样),抽样过程分两 ),抽样过程分 进行: 步进行:
第一步称为第一 第一步称为第一重(相)抽样,是从总体中抽取 抽样, 一个比较大的样本,称为第一重( 比较大的样本 样本。 一个比较大的样本,称为第一重(相)样本。目 的是获取有关总体的某些辅助信息 辅助信息, 的是获取有关总体的某些辅助信息,为下一步的 第二重抽样估计提供条件。 第二重抽样估计提供条件。 第二步称为第二 抽样, 第二步称为第二重(相)抽样,是从第一重样本 中抽取的相对较小的样本,称为第二重( 较小的样本 中抽取的相对较小的样本,称为第二重(相)样 它是第一重样本的一个子样本, 本。它是第一重样本的一个子样本,对它进行的 调查是主调查。 调查是主调查。
Y
′ ystD = ∑ wh yh
h =1
L
性质: 性质:
(1)
E ( ystD ) = Y
1 1 1 2 2 1 (2)V ( ystD ) = − S + ∑ Wh S h − 1 n′ N h n′ γh
V 的一个近似无偏估计: (3) ( ystD ) 的一个近似无偏估计:
1 1 22 1 1 2 ′ v ( ystD ) = ∑ − w′h sh + − ∑ wh ( yh − ystD ) ′ nh n′ N h h nh
证明: 证明:
K (1)E( y ) = E E ( y ) = E E ′ 1 2 ∑ wh yh stD 1 2 stD h=1

二重抽样

二重抽样

表7-1
某银行客户的样本数据
2 2 2 (2 6.42) 0.32 (7 6.42) 0.1 ( 15 6.42) 1 1 L ' 1 1 0.54 2 ( ' ) h ( y h y stD ) ( ) 2 n N h 1 1000 800 0 . 04 ( 40 6 . 42 )
h
y h )] E ( y stD ) E1 [ E 2 ( y stD )] E1 [ E 2 ( wh
h 1
L
y h ) E1 ( y ) Y E1 ( wh
h 1
L

定理7.2
y stD 的方差为:

2 1 1 2 L Wh S h 1 V ( y stD ) ( )S ( 1) n N n f hD h 1 2 f hD 是第二重样本第h 式中,S2是总体方差;S h 是第h层的总体方差;
6.3 不等概率系统抽样
行政村编号 1
人数 134
累计人数 134
抽中代码 100
2 3
4
376 202
106
510 712
818
5
6 7 8 9 10
634
397 306 247 95 588
1452
1849 2155 2402 2497 3085
1128
2156
7.1 二重抽样
前面介绍的抽样技术中,大多需要事先了解关于总体的 信息,例如分层抽样需要事先知道各层权重,比率估计 和回归估计需要知道总体的某些辅助信息,但在有些情 况下,这些信息在调查前无法预知。这时,可以先从总 体中抽取一个大的初始样本,获得总体的辅助信息,然 后再从初始样本或总体中抽取一个子样本,这种方法就 是二重抽样。

第九章抽样与抽样估计ppt文档

第九章抽样与抽样估计ppt文档
第九章抽样与抽样估计
2、特点 (1) 抽样调查建立在随机取样的基础上。
(2)它是由部分推断整体的一种认识方 法。
(3)抽样调查的误差可以事先计算并加以 控制。
3、抽样调查的适用范围
抽样调查方法是市场经济国家在 调查方法上的必然选择,和普查相比, 它具有准确度高、成本低、速度快、 应用面广等优点。
参数估计 二、抽样推断的内容
假设检验 三、有关抽样的基本概念
(一)总体和样本
总体:也称全及总体。指所要认识的研究对 象全体。总体单位总数用“N”表示。
样本: 也称抽样总体,是抽出的单位组成 的整体。样本单位总数用“n”表示。
(二)参数和统计量 1、针对总体计算的指标叫总体参数,也叫全及 指标。参数的值是定值
2、非概率抽样:也叫非随机抽样,是指从 研究目的出发,根据调查者的经验或判 断,从总体中有意识地抽取若干单位构 成样本。重点调查、典型调查、配额调 查等属于非随机抽样。
(六)、抽样框
1、抽样框是包括全部抽样单位的名单框架。编 制抽样框是实施抽样的基础。抽样框的好坏通常 会直接影响到抽样调查的随机性和调查的效果。 2、抽样框主要有三种形式:
以 N 1 代表N个总体单位中具 有某种特征的单位数,N 0 代表N 个
总体单位中不具有某种特征的单位
数,N=N1+N0。有 P N 1 N
从总体中随机抽出容量为n的样本,
n 具有某种特征的单位数为 ,则样本的成
数为 p n1 。
1
例如,n 某工厂生产某种电子元件,某
批产品共10000件,其中不合格品100件,
①系统误差是非随机因素引起的误差, 它系统性偏高或偏低,也称偏差。
② 随机误差也叫偶然误差。它是由偶 然性因素引起的代表性误差。它不可 避免,但可计算与控制。抽样估计中 的抽样误差,就是指这种随机误差。

二重抽样ppt

二重抽样ppt
' nh ' wh ' , h 1, 2,..., L n
是总体层权 Wh 的一个无偏估计。 2.进行第二重抽样,是在第一重抽样中进行样本量为n的分 层随机抽样,即在属于第h层的nh '个第一重样本单元中 简单随机抽取nh个作为第二重样本单元,调查目标量Y。 易知每层的抽样比
f hD n h ' nh
本。
n
h
,对这200户个体户作了详细的调查 n 200
h 核实,取得有关数据如下。试估计该城市全年个体户的
销售总额及其抽样标准误差。
分层
第一重样本 量 n
h
第二重样本 量 n
h
样本均值 (万元) 2 7 15 40
yh
2 yhj j
s
2 h
3万元以下 3万元至10万 元以下 10万元至20万 元以下 20万元以上 合计
ˆ 销售总额 Y NystD 8000*6.42 51360 万元
估计量的方差估计: 1 1 1 1 2 v( ystD ) ( ' ) w'2 sh ( ) w'h ( yh ystD ) 2 h nh n h n N h h 0.036822 0.055239 0.092061
调查. 分层抽样的前提:总体中所有单元已按某种分层标志明确的分成若干 层,且层权已知。如果层不明确,分层抽样就无法进行。二重分层抽 样可用以处理此类问题。
7.2.1步骤:
1.用简单随机抽样在总体N个单位中抽取一个样本量为n'的 第一重样本,调查辅助变量X,根据已知的分层标志将第 一重样本中的所有单元归入不同的层,记nh '是属于第h 层的单元数(h=1,2,…,L;L是层数),则

抽样调查-第9章 二重抽样

抽样调查-第9章 二重抽样

j 1 ,2 , ,n h ;h 1 ,2 , ,L
第二重样本第h层样本单元的平均数:
总体方差:S 2
,第h层精的选完总整p体pt课方件 差:
S
2 h
yh
1 nh
nh
yhj
j1
返回 4
第一重样本第h层方差:s h 2
第二重样本第h层方差:sh2nh11jnh1(yhjyh)2
二、抽样方法
第一步: 利用简单随机抽样,从总体的N个单元中随机
1.两阶段抽样是先从总体N个单元中抽出n个样本
单元,却并不对n个样本都进行调查,而是从中再抽出
若干个二级单元进行调查。 精选完整ppt课件
返回 1
2。两阶段抽样的第二阶段抽样单元与第一阶段抽样 单元往往是不同的。而二重抽样的第二重样本往往是 第一重样本的子样本。
三、二重抽样的作用
(一)有利于筛选主调查对象 (二)节约调查费用 (三)提高抽样效率 (四)可用于研究样本轮换中的某些问题 (五)降低无回答偏倚
yh
80
2
60
7
40
15
20
40
200
y2 ij j
400 3100 9600 45120
sj
2
1.01 2.71 15.38 690.53
解 根据上表可计算各层的权重:
w 1 1 50 4 0 . 5 0 0 ,w 2 4 0 0 . 3 ,w 3 2 0 . 1 ,w 4 0 0 . 04
精选完整ppt课件
返回11
假设第一重抽样的单元平均调查费用为c 1 ,第二重 抽样第 h 层的单元平均费用为c 2 h 。忽略其他费用,则
费用函数可以表示为:
L
CT c1n c2hnh

抽样调查-第9节二重抽样

抽样调查-第9节二重抽样

s(Y ) Ns( ystD ) N v( ystD ) 2427.32 (百万元)
四、二重分层抽样样本量的最优分配
二重分层抽样中有两次抽样,这两次抽样的样本量
即n和n ,直接影响估计的精度。第一重抽样n越大,
对分层信息的了解和估计就越精确,从而可以减少估计
量的误差;同样,第二重抽样 n 越大,估计量的方差越
采用二重分层抽样,对总体均值Y 的估计量为:
Байду номын сангаас
L
ystD wh yh
h1
(二)均值估计量 ystD 的性质
性质1 估计量 y stD是 Y的无偏估计。即 E( ystD ) Y
因为
E(yh)
y
h
L
所以有 E( ystD ) E1[E2 ( ystD )] E1[E2 ( wh yh )]
h1
j 1,2, , nh;h 1,2, , L
第二重样本第h层样本单元的平均数: yh
总体方差:S 2
,第h层的总体方差:
S
2 h
1 nh
nh
yhj
j 1
返回
第一重样本第h层方差:sh 2
第二重样本第h层方差:sh2
1 nh 1
nh
( yhj
j 1
yh )2
二、抽样方法
第一步: 利用简单随机抽样,从总体的N个单元中随机
h1
(1 nh
1 nh
)wh 2sh2
(1 n
1 N
L
)
h1
wh
(
yh
y stD
)2
式中,v( ystD )为V ( ystD ) 的近似无偏估计;sh2为第二重样

二重分层抽样概述

二重分层抽样概述

End!
26
4 、分层抽样常比回归和比率均值有特殊的优越 性,特别是在调查变量与辅助变量为非线性关 系时,按比例分层能得到更大的得益;若分层 变量不是数值型时,分层方法仍然可以使用, 而回归和比估计方法则不能用。 5 、如果辅助变量的总体均值是已知的,则回归 和比估计可以在独立于辅助变量的 n 次抽选的 样本上进行,而在分层抽样中,样本 n 必须是 第一重样本n′的子样本。
i
(x
i 1
x)2
性质1: YˆlrD 是一个有偏估计量,其偏倚随着 样本量的增大而缩小。当地二重样本的样 ˆ y b( X ' x ) 是近似无偏 本量足够大时, Y lrD 估计量。即
ˆ )Y E (Y lrD
当n充分大时
ˆ )Y E (Y lrD
性质2 若n′和n均为简单随机样本,则估 计量的方差为



第二节 为分层的二重抽样

一、二重分层抽样概述 二、估计量及其性质

一、二重分层抽样概述

在分层抽样中,我们要求总体各层的 层权应事先已知,如果层权未知或不 能事先确定,则分层抽样在精度上的 得益可能会在很大程度上被抵消掉, 此时,选择二重分层抽样可以较好地 解决层权问题。
符号说明
:第一重样本第h层的单元数 nh :第二重样本第h层的单元数 N Wh h :总体单元第h层的权重 N :第一重样本第h层的权重 nh h
第一步:从总体的中随机抽取第一重样本,对于 第一重样本,仅观测辅助变量信息,用辅助变 量的样本均值估计其总体均值。 第二步:从第一重样本中随机抽取出第二重样本, 对于第二重样本,观测目标变量与辅助变量, 并计算样本回归系数,构造回归估计。 二重回归估计可以采用多种形式,我们这里只 涉及一元线性回归估计。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
h1
S
2 h

L
Wh
S
2 h
h1 vh

所以,样本量的最优分配(即 n′与 vh 的选择)应使函数
Q C * (V S 2 ) N
[C'
Chvh ][S 2Βιβλιοθήκη L Whh1
S
2 h

L
Wh
S
2 h
v h1
h
]
达到极小。
根据柯西—施瓦茨不等式,可以得出符合上述要求的条件是
二重抽样也称二相抽样。其基本做法是:对于一个大 总体,先从总体中随机抽取一个较大的样本(第一重样 本),由此估计有关总体的结构或辅助指标以及其他有 关信息,为第二重抽样估计提供条件;然后再从第一 重样本中随机抽取一个较小的样本(第二重样本),利 用这第二重样本,对总体所研究变量进行抽样推断。
在某些情况下,也可在第二重样本中再抽第三 重、第四重样本,由此形成多重抽样。其中二 重抽样是最为常用的。
二、二重抽样的作用 在社会经济抽样调查中,二重抽样的主要作用
有下列几方面: 第一,用于从总体所有基本单元中筛选确定出
主调查对象。 第二,用于经常性调查。对于诸如居民的某些
收入、居民基本生活支出、某些商品价格等指 标,统计部门需经常了解。
第三,用于了解陌生总体内在结构或分布的大 致情况,为抽样方法和抽样组织形式的选择提 供依据。

C'

L
S 2
Wh
S
2 h
h 1
ChWh vh
Wh
S
2 h
/
vh
也即
L
1
vh Sh[C' / Ch (S 2
Wh
S
2 h
)]2
h1
将其代入费用函数(当C* 给定时)或方差函数(当 V 给定时),即可求出
n′的最优值。
在最优分配条件下,若给定C* ,则可得出方差的极小值为
ˆ
一、二重分层抽样概述
在分层抽样中,我们要求总体各层的层权应事先已 知,如果层权未知或不能事先确定,则分层抽样在 精度上的得益可能会在很大程度上被抵消掉,此时, 选择二重分层抽样可以较好地解决层权问题。
二重分层抽样是先在总体中随机抽取第一重样本n′, 对这个样本各单元进行分层后求各层的层权,然后 从第一重样本中用分层随机抽样法抽取第二重样本n, 用于估计总体指标。由于第一重简单随机抽样,第 二重分层抽样,故其误差同二重的抽样都有关。
以各层的样本方差代替各•层的总体方差,以 样本各层间方差代替总体方差,则可得方差 的近似无偏估计量为

ˆ (YstD
)
(1 n'
1L N ) h1 wh ( yh

ystD ) 2

L h1
wh2
s
2 h
(
1 nh
1 )
n'h
三、样本容量的最优分配 •
在二重分层抽样中,样本量最优分配的目的是按在费用一定 时使方差达到极小,或在方差一定时使费用最省的原则确定
另一方面,由于方差函数
ˆ
V (YstD )

S2(1 n'

1) N
L
Wh
S
2 h
h1 n'
1 ( vh
1)
S 2

L
Wh
S
2 h
L

Wh
S
2 h
S2
n' h1 n' vh h1 n'
N
因此,当V

V
ˆ (YstD
)
时,

n'(V

S2 N
)

(S 2

L
Wh
及方差, E1 、 V1 则是对第一重抽样的均值与方差。 据此,可以构造出二重分层抽样的总体均值估计量为
ˆ
YstD

y stD

L
wh yh
h 1
其中
1 nh
yh nh
yhj
j 1
为第一重样本第 h 层均值的无偏估计。
可以证明
y stD
是总体均值
YstD
的无偏估计量。 •
如果第一重样本是随机样本,第二重样本为第一重样本的随
机子样本,则估计量的方差为
ˆ V (YstD ) V1 ( y') E1[V2 ( y)]

S2 n'
(1
n' ) N
L
Wh2
h1
S
2 h
n'
(nh ' nh
1)
S 2 ( 1
1)
L
Wh
S
2 h
(
1
1)
n' N h1 n' vh
其中V1(y') 为第一重抽样之方差,V2( y) 为第二重抽样之方差。
在二重分层抽样中,
wh

n'h n'
为第
h
层估计层权,

n 第一重样本量,
n'h 第一重样本中第 h 层单元数, n 第二重样本量,
N 总体单元数,
nh 第二重样本中第 h 层单元数(第 h 层第二重样本量), vh nk / n'h 为第二重抽样第 h 层的抽样比, yhj 第二重样本中第 h 层第 j 单元观测值,
第九章 二重抽样
第一节 第二节 第三节 第四节
二重抽样概述 二重分层抽样 二重比估计 二重回归估计
第一节 二重抽样概述
一、二重抽样的概念
在设计和实施某些抽样调查时,需要事先掌握有关总 体的一些信息。但在许多场合下,总体的这些有关信 息是事先未知的,或者不完全知道。为此,人们提出 了二重或多重抽样的方法,以掌握有关总体信息,然 后实施抽样调查。
L 总体层数。
二、估计量及其方差 •
在讨论二重分层抽样估计量的性质之前,我们先给出二重抽
样中对估计量ˆ 求均值与方差的一般公式如下
E(ˆ) E1[E2 (ˆ)], V (ˆ) V1[E2 (ˆ)] E1[V2 (ˆ)]
其中, E2 、V2 为第一重抽样结果条件下对第二重抽样的均值
第四,为分层抽样推断提供层权资料。分层抽 样推断的前提是总体各单元能按分层标志进行 归类并事先已知各层的层权。
第五,为比率估计和回归估计提供辅助资料。
第六,在经常性的多项目抽样调查中,用于解 决不同调查项目需要不同样本容量的问题。
第七,用于研究样本轮换中的某些问题。
第二节 二重分层抽样
Vmin (YstD
)

1 C*
[
Wh Sh
Ch
(S 2

L
Wh
S
2 h
)C'
]2
h1

S
2 h
N
第三节 二重比估计
在使用比估计量时,要求作为辅助变量 的总体均值或总和应事先已知,但在实 际中可能并
第一重样本量 n′和第二重每层样本量 nh 。
为此,可以考虑费用函数
C C'n' Chnh
其中,C′为第一重抽样平均每一单元的调查费用; Ch 是第 二重样本中 h 层平均每个单元的调查费用。
由于
nh
是随机的,因此,我们考虑选择的 •
n′与
vh
的期望费用
C* E(C) C'n'n' ChvhWh
相关文档
最新文档