09第九章二重抽样-文档资料
计量经济学第九章二重抽样
第九章二重抽样前面各章介绍的几种抽样技术中,大都需要事先了解一些关于总体的信息,例如分层抽样需要事先知道各层权重,比率估计和回归估计中需要知道总体的某些辅助信息但在一些情况下,这些资料在调查前无法预知。
这时,我们可以先从总体中抽取一个大的初始样本,从而获得总体的辅助信息,然后再从初始样本或从总体中再抽一个子样本,这种方法就是二重抽样。
本章第一节介绍二重抽样的定义、作用及其与两阶段抽样的区别,第二节介绍为分层抽样进行的二重抽样,第三节介绍为比率估计进行的二重抽样,第四节介绍为回归估计进行的二重抽样。
§9.1 引言一、定义二重抽样(double sampling),也称二相抽样或两相抽样(two-phase sampling),是指在抽样时分两步抽取样本。
一般情况下,先从总体N中抽取一个较大的样本'n,称为第一重(相)样本(the first phase sample),对之进行调查以获取总体的某些辅助信息,为下一步的抽样估计提供条件;然后进行第二重(相)抽样(the second phase sample)。
第二重抽样所抽的样本n相对较小,但是第二重抽样调查才是主调查。
一般地,第二重样本(the second phase sample)是从第一重样本中抽取的,也即第一重样本的子样本,但有时也可以从总体中独立地抽取。
由于样本是分两次抽取的,因此称做二重抽样。
例如,欲对某城市体育场馆的营业状况进行抽样调查,鉴于不同场馆功能和面积差异较大,拟采用分层抽样,但由于缺乏分层资料,故先随机抽选一个较大的样本,对该样本仅进行分层及进行层权估计,费用相对较低;然后利用第一次调查获得的分层资料,进行一次较小样本的分层抽样,对该样本进行一次正式调查。
这就是二重抽样。
显然,二重抽样方法也可以推广到多次抽取样本,然后结合起来对总体的有关标志值进行估计,这就是多重抽样或多相抽样。
本章主要讨论二重抽样。
二、二重抽样与两阶段抽样二重抽样和两阶段抽样,在名称上很容易引起混淆。
09-第九章 二阶及多阶抽样
1 M å (Yij - Y i ) 2 M - 1 j =1
则
2 S2 =
1 N
åS
i =1
N
2 2i
9.2.2 总体均值 Y 的估计量及其性质 如果二阶抽样中的每一阶抽样都是简单随机的, 且对每个初级单元, 第 二阶抽样是相互独立的,则样本按次级单元的均值
y=
1 n m 1 n yij = å y i åå nm i =1 j =1 n i =1
=W 2å =W 2å
N
1- f 2 Si m i =1 1- f m i =1
é 1 M ù (Yij - Y i )2 ú å ê ë M - 1 j =1 û N M 1- f 1 (Yij - Y i ) 2 =W 2 åå m M - 1 i =1 j =1 = 1 N2 1m N M M 1 (Yij - Y i ) 2 åå m M - 1 i =1 j =1
(9.1)
作为总体均值
Y=
1 NM
åå Yij =
i =1 j =1
N
N
1 N
åY
i =1
N
i
(9.2)
3
的估计,有如下性质:
E( y) = Y V ( y) = 1 - f1 2 1 - f 2 2 S1 + S2 n mn
(9.3) (9.4)
为证明上述性质, 注意到二阶抽样是分两步进行的, 因此对估计量求均 值与方差需按第六章给出的下述一般公式进行,即:
V ( y) =
将 n = N 代入,有
1 - f2 2 S2 mn 1 - f2 2 S2 mN
V ( y) =
其中 f 2 =
m ,则 M
第九章抽样统计分析的基本知识演示文稿ppt
随机抽样 样本 检测 整理
二、质量数据的收集方法★
(一)全数检验 (二)随机抽样检验
(一)全数检验
全数检验是对总体中的全部个体逐一 观察、测量、计数、登记,从而获得对总 体质量水平评价结论的方法。
(二)随机抽样检验★
抽样检验是按照随机抽样的原则,从 总体中抽取部分个体组成样本,根据对样 品进行检测的结果,推断总体质量水平的 方法。
(三) 质量数据分布的规律性
以质量标准为中心的质量数据分布, 可用一个“中间高、两端低、左右对称” 的几何图形表示,即一般服从正态分布
整群抽样一般是将总体按自然存在的 状态分为若干群,并从中抽取样品群,组 成样本,然后在中选群内进行全数检验的 方法。
如对原材料质量进行检测,可按原包 装的箱、盒为群随机抽取,对中选箱、盒 做全数检验;每隔一定时间抽出一批产品 进行全数检验等。
5. 多阶段抽样
多阶段抽样又称多级抽样,是将各种 单阶段抽样方法结合使用,通过多次随机 抽样来实现的抽样方法。
标准差小说明数据分布的集中程度高, 离散程度小,均值对总体的代表性好。
标准差的平方是方差,能确切地说明数 据的离散程度和波动规律,是最常用的反映 数据变异程度的特征值。
(3) 变异系数(离散系数)
1) 总体的变异系数
Cv
2) 样本的变异系数 Rxmaxxmin
变异系数又称离散系数,是用标准差除以算术 平均数得到的相对数。它表示数据的相对离散波动 程度。变异系数小,说明分布集中程度高,离散程 度小,均值对总体(样本)的代表性好。
1. 简单随机抽样 2. 分层抽样 3. 等距抽样 4. 整群抽样 5. 多阶段抽样
1. 简单随机抽样
简单随机抽样又称纯随机抽样、完全随机 抽样,是对总体不进行任何加工,直接进行随 机抽样,获取样本的方法。
抽样调查-第9章 二重抽样
s(Y ) Ns( ystD ) N v( ystD ) 2427.32 (百万元)
四、二重分层抽样样本量的最优分配
二重分层抽样中有两次抽样,这两次抽样的样本量
即n和n ,直接影响估计的精度。第一重抽样n越大,
对分层信息的了解和估计就越精确,从而可以减少估计
量的误差;同样,第二重抽样 n 越大,估计量的方差越
h1
得有关数据如下表,试估计该银行所有客户的资产总额 及其抽样标准误差。
返回
分层
300万元以下 300~1000 1000~2000 2000万元以上 合计
第一重 样本
540 320 100 40 1000
第二重 样本均值
样本
yh
80
2
60
7
40
15
20
40
200
y2 ij j
400 3100 9600 45120
j 1,2, , nh;h 1,2, , L
第二重样本第h层样本单元的平均数: yh
总体方差:S 2
,第h层的总体方差:
S
2 h
1 nh
nh
yhj
j 1
返回
第一重样本第h层方差:sh 2
第二重样本第h层方差:sh2
1 nh 1
nh
( yhj
j 1
yh )2
二、抽样方法
第一步: 利用简单随机抽样,从总体的N个单元中随机
L
CT E(CT ) c1n n c2h f W hD h
h1
而总体均值估计量的方差为:
V
( y stD
)
(1 n
1 N
)S
2
L
Wh
S
第8-9章-多阶段抽样和二重抽样
ˆ ˆ E E E E
2
2
1
2
E 2 E E 2 V E ˆ ˆ E1 2 ˆ 1 2 1 2
E 2 E E 2 ˆ ˆ V1 E2 E1 2 ˆ 1 2 ˆ ˆ V1 E2 E1 V2
2 S2 V ( y ) S12 m
2 当n=1时, V1 (Yi ) S1
这时, 若以n个
yi 的均值 y 推断 Y
,其方差为
2 2 S1 S2 V ( y) n nm
再考虑fpc,则(1)式成立。
V y 的无偏估计为:
证明:
2 1
E (s ) S
2 2
1 f1 2 f1 1 f 2 2 v y s1 s2 n nm
1 1 n 1 1 E1 M iYi M n i 1 MN
M iYi Y i 1
N
估计量的方差为:
1 f1 M i 1 V y M Yi Y nNM 2 nN i 1 i 1
N N
二.按不等概抽初级单元
1.按PPS抽取初级单元 N 第i个单元被选中概率 Z i ,( Z i 1 ) i 1 以总量估计为例,利用Hansen-Hurwitz估计量 ˆ Y的估计: 1 n Y 1 n M y
ˆ YHH
z n
i 1
i
i
n
i 1
i
i
zi
ˆ 可以证明 YHH是Y的无偏估计
抽样调查-第9章 二重抽样
二、二重抽样与两阶段抽样的区别
1.两阶段抽样是先从总体N个单元中抽出n个样本 单元,却并不对n个样本都进行调查,而是从中再抽出 若干个二级单元进行调查。
返回
2。两阶段抽样的第二阶段抽样单元与第一阶段抽样 单元往往是不同的。而二重抽样的第二重样本往往是 第一重样本的子样本。
三、二重抽样的作用
(一)有利于筛选主调查对象 (二)节约调查费用 (三)提高抽样效率
80 60 40 20 200 2 7 15 40
2 yij j
2 j
s
400 3100 9600 45120
1.01 2.71 15.38 690.53
解
w1
根据上表可计算各层的权重:
540 0.32, w3 0.10, w4 0.04 0.54, w2 1000
第一重样本第h层方差:sh
2
nh 1 2 2 第二重样本第h层方差:sh ( y y ) hj h nh 1 j 1
二、抽样方法
第一步: 利用简单随机抽样,从总体的N个单元中随机 抽取第一重样本,样本单元数为 n ;根据已知的分层标 n 志将第一重样本分层,令 wh h , (h 1,2,, L) ,则 n 是总体层权 W 的无偏估计。 wh
L
而总体均值估计量的方差为:
1 1 2 L Wh S h2 1 V ( y stD ) ( ) S ( 1) n N n f hD h 1
返回
要在一定的费用约束下使估计方差最小化,则有
L V ( y stD ) (C c1n n c2 h f hDWh )
§9.1 引言
一、二重抽样的定义
二重抽样(double sampling),也称二相抽样,是指分 两步抽取样本。先从总体N中抽样一个较大的 样本 n ,称为第一重样本,对其进行调查以获 取总体的某些信息,为下一步的抽样估计提供 条件;然后在第一重样本中再进行第二次抽样。 这种抽样方法称为二重抽样。
抽样检验中的双重抽样方法与效果评估
抽样检验中的双重抽样方法与效果评估抽样检验是统计学中一种重要的数据分析方法,用于判断样本数据是否代表总体,并进行统计推断。
抽样检验的精确性和准确性对研究结果的可靠性起着至关重要的作用。
为了增加抽样检验的效果评估,双重抽样方法被广泛采用。
本文将探讨双重抽样方法及其在抽样检验中的效果评估。
一、双重抽样方法的概念和原理双重抽样方法指的是采用两次独立的抽样过程,通过分别对两个抽样集合进行统计分析,来对总体进行推断。
这样的双重抽样方法能够在保证数据的可靠性的同时提高推断的准确性。
在使用双重抽样方法时,第一次抽样通常是从总体中随机选择样本,这个样本称为一级样本。
然后,从一级样本中再次随机选择一部分样本,形成二级样本。
通过对一级样本和二级样本的统计分析,可以得到更加精确的估计结果。
双重抽样方法的基本原理就是通过两次独立的抽样,减小抽样误差,提高估计的准确性。
二、双重抽样方法的应用双重抽样方法被广泛应用于各个领域的统计研究中。
下面将介绍其中两个常见的应用案例。
1.医学研究中的双重抽样方法在医学研究中,为了对新药的疗效进行评估,常常采用对患者进行双重随机抽样的方法。
首先,在一级样本中随机选择一部分患者,将其分为实验组和对照组。
然后,在实验组和对照组中再次随机选择一部分患者进行观察和数据采集。
通过对数据的统计分析,可以判断新药的疗效和安全性。
2.社会调查中的双重抽样方法在社会调查中,为了保证样本的多样性和代表性,常常采用双重抽样方法。
首先,在一级样本中随机选择一部分个体,然后在这些个体中进行二级随机抽样,得到用于调查的最终样本。
通过对最终样本的数据分析,可以对总体进行推断,得出调查结果。
三、双重抽样方法的效果评估为了评估双重抽样方法的效果,需要进行有效的效果评估。
下面将介绍两种常见的双重抽样方法的效果评估方式。
1.重抽样法重抽样法是一种用于评估双重抽样效果的常用方法。
在重抽样法中,通过对已有数据进行重复随机抽样,得到同等大小的样本,然后利用这些样本进行统计分析。
二重抽样
6.1概述 概述
6.1.1二重抽样的定义 二重抽样的定义 二重抽样(也叫二相抽样),抽样过程分两 二重抽样(也叫二相抽样),抽样过程分两 ),抽样过程分 进行: 步进行:
第一步称为第一 第一步称为第一重(相)抽样,是从总体中抽取 抽样, 一个比较大的样本,称为第一重( 比较大的样本 样本。 一个比较大的样本,称为第一重(相)样本。目 的是获取有关总体的某些辅助信息 辅助信息, 的是获取有关总体的某些辅助信息,为下一步的 第二重抽样估计提供条件。 第二重抽样估计提供条件。 第二步称为第二 抽样, 第二步称为第二重(相)抽样,是从第一重样本 中抽取的相对较小的样本,称为第二重( 较小的样本 中抽取的相对较小的样本,称为第二重(相)样 它是第一重样本的一个子样本, 本。它是第一重样本的一个子样本,对它进行的 调查是主调查。 调查是主调查。
Y
′ ystD = ∑ wh yh
h =1
L
性质: 性质:
(1)
E ( ystD ) = Y
1 1 1 2 2 1 (2)V ( ystD ) = − S + ∑ Wh S h − 1 n′ N h n′ γh
V 的一个近似无偏估计: (3) ( ystD ) 的一个近似无偏估计:
1 1 22 1 1 2 ′ v ( ystD ) = ∑ − w′h sh + − ∑ wh ( yh − ystD ) ′ nh n′ N h h nh
证明: 证明:
K (1)E( y ) = E E ( y ) = E E ′ 1 2 ∑ wh yh stD 1 2 stD h=1
二重抽样
表7-1
某银行客户的样本数据
2 2 2 (2 6.42) 0.32 (7 6.42) 0.1 ( 15 6.42) 1 1 L ' 1 1 0.54 2 ( ' ) h ( y h y stD ) ( ) 2 n N h 1 1000 800 0 . 04 ( 40 6 . 42 )
h
y h )] E ( y stD ) E1 [ E 2 ( y stD )] E1 [ E 2 ( wh
h 1
L
y h ) E1 ( y ) Y E1 ( wh
h 1
L
定理7.2
y stD 的方差为:
2 1 1 2 L Wh S h 1 V ( y stD ) ( )S ( 1) n N n f hD h 1 2 f hD 是第二重样本第h 式中,S2是总体方差;S h 是第h层的总体方差;
6.3 不等概率系统抽样
行政村编号 1
人数 134
累计人数 134
抽中代码 100
2 3
4
376 202
106
510 712
818
5
6 7 8 9 10
634
397 306 247 95 588
1452
1849 2155 2402 2497 3085
1128
2156
7.1 二重抽样
前面介绍的抽样技术中,大多需要事先了解关于总体的 信息,例如分层抽样需要事先知道各层权重,比率估计 和回归估计需要知道总体的某些辅助信息,但在有些情 况下,这些信息在调查前无法预知。这时,可以先从总 体中抽取一个大的初始样本,获得总体的辅助信息,然 后再从初始样本或总体中抽取一个子样本,这种方法就 是二重抽样。
第九章抽样与抽样估计ppt文档
2、特点 (1) 抽样调查建立在随机取样的基础上。
(2)它是由部分推断整体的一种认识方 法。
(3)抽样调查的误差可以事先计算并加以 控制。
3、抽样调查的适用范围
抽样调查方法是市场经济国家在 调查方法上的必然选择,和普查相比, 它具有准确度高、成本低、速度快、 应用面广等优点。
参数估计 二、抽样推断的内容
假设检验 三、有关抽样的基本概念
(一)总体和样本
总体:也称全及总体。指所要认识的研究对 象全体。总体单位总数用“N”表示。
样本: 也称抽样总体,是抽出的单位组成 的整体。样本单位总数用“n”表示。
(二)参数和统计量 1、针对总体计算的指标叫总体参数,也叫全及 指标。参数的值是定值
2、非概率抽样:也叫非随机抽样,是指从 研究目的出发,根据调查者的经验或判 断,从总体中有意识地抽取若干单位构 成样本。重点调查、典型调查、配额调 查等属于非随机抽样。
(六)、抽样框
1、抽样框是包括全部抽样单位的名单框架。编 制抽样框是实施抽样的基础。抽样框的好坏通常 会直接影响到抽样调查的随机性和调查的效果。 2、抽样框主要有三种形式:
以 N 1 代表N个总体单位中具 有某种特征的单位数,N 0 代表N 个
总体单位中不具有某种特征的单位
数,N=N1+N0。有 P N 1 N
从总体中随机抽出容量为n的样本,
n 具有某种特征的单位数为 ,则样本的成
数为 p n1 。
1
例如,n 某工厂生产某种电子元件,某
批产品共10000件,其中不合格品100件,
①系统误差是非随机因素引起的误差, 它系统性偏高或偏低,也称偏差。
② 随机误差也叫偶然误差。它是由偶 然性因素引起的代表性误差。它不可 避免,但可计算与控制。抽样估计中 的抽样误差,就是指这种随机误差。
二重抽样ppt
是总体层权 Wh 的一个无偏估计。 2.进行第二重抽样,是在第一重抽样中进行样本量为n的分 层随机抽样,即在属于第h层的nh '个第一重样本单元中 简单随机抽取nh个作为第二重样本单元,调查目标量Y。 易知每层的抽样比
f hD n h ' nh
本。
n
h
,对这200户个体户作了详细的调查 n 200
h 核实,取得有关数据如下。试估计该城市全年个体户的
销售总额及其抽样标准误差。
分层
第一重样本 量 n
h
第二重样本 量 n
h
样本均值 (万元) 2 7 15 40
yh
2 yhj j
s
2 h
3万元以下 3万元至10万 元以下 10万元至20万 元以下 20万元以上 合计
ˆ 销售总额 Y NystD 8000*6.42 51360 万元
估计量的方差估计: 1 1 1 1 2 v( ystD ) ( ' ) w'2 sh ( ) w'h ( yh ystD ) 2 h nh n h n N h h 0.036822 0.055239 0.092061
调查. 分层抽样的前提:总体中所有单元已按某种分层标志明确的分成若干 层,且层权已知。如果层不明确,分层抽样就无法进行。二重分层抽 样可用以处理此类问题。
7.2.1步骤:
1.用简单随机抽样在总体N个单位中抽取一个样本量为n'的 第一重样本,调查辅助变量X,根据已知的分层标志将第 一重样本中的所有单元归入不同的层,记nh '是属于第h 层的单元数(h=1,2,…,L;L是层数),则
抽样调查-第9节二重抽样
s(Y ) Ns( ystD ) N v( ystD ) 2427.32 (百万元)
四、二重分层抽样样本量的最优分配
二重分层抽样中有两次抽样,这两次抽样的样本量
即n和n ,直接影响估计的精度。第一重抽样n越大,
对分层信息的了解和估计就越精确,从而可以减少估计
量的误差;同样,第二重抽样 n 越大,估计量的方差越
采用二重分层抽样,对总体均值Y 的估计量为:
Байду номын сангаас
L
ystD wh yh
h1
(二)均值估计量 ystD 的性质
性质1 估计量 y stD是 Y的无偏估计。即 E( ystD ) Y
因为
E(yh)
y
h
L
所以有 E( ystD ) E1[E2 ( ystD )] E1[E2 ( wh yh )]
h1
j 1,2, , nh;h 1,2, , L
第二重样本第h层样本单元的平均数: yh
总体方差:S 2
,第h层的总体方差:
S
2 h
1 nh
nh
yhj
j 1
返回
第一重样本第h层方差:sh 2
第二重样本第h层方差:sh2
1 nh 1
nh
( yhj
j 1
yh )2
二、抽样方法
第一步: 利用简单随机抽样,从总体的N个单元中随机
h1
(1 nh
1 nh
)wh 2sh2
(1 n
1 N
L
)
h1
wh
(
yh
y stD
)2
式中,v( ystD )为V ( ystD ) 的近似无偏估计;sh2为第二重样
第九章二阶及多阶抽样(抽样理论与方法河南财政学院)
1 441.95 7180.00
2 368.92 4026.59
3 317.24 3260.77
4 357.40 4665.84
估计该柜台上个月的营业总额及标准差。
河南财经学院
解: i yi
s
2 2i
1 11.05 58.90
2 9.22 16.00
3 7.93 19.10
4 8.94 37.76
Mi j1
(Yij
Yi
)2
m0 nm
n
nm
y yi yij
i1
i1 j1
n
y yi /n
i1
nm
yij
y i1 j1 m0
s12
1 n1
n i1
(yi
y)2
s 2i 2
1 mi 1
mi j1
( y ij
yi )2
定理:若两阶段的抽样都是简单随机抽样的,则
河南财经学院
记E(ˆ ) ~
V(ˆ ) E(ˆ ~)2 E1 E2 (ˆ ~)2
由E2 (ˆ ~)2 E2 (ˆ )2 2~E2 (ˆ ) ~2 [E2 (ˆ )]2 V2 (ˆ ) 2~E2 (ˆ ) ~2 对上式两边求E1,得
(1)y是Y的无偏估计量;
(2)V(y)
1 f1 n
S12
1 f2 mn
S
2 2
,
其中S12
1 N1
N i1
(Yi
Y)2,
S
2 2
1 N
N
S2i2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
C C'n' Chnh
其中,C′为第一重抽样平均每一单元的调查费用; Ch 是第 二重样本中 h 层平均每个单元的调查费用。
由于 nh 是随机的,因此,我们考虑选择的 n′与 vh 的期望费用
C* E(C) C'n'n' ChvhWh
另一方面,由于方差函数
ˆ
V (YstD )
不掌握关于辅助变量的资料,此时,就 要考虑采用二重比估计的方法。
二重比估计的基本思路是先在总体中抽 第一重样本用以估计总体辅助变量指标, 再在一重样本中抽第二重样本按比估计 法推断总体调查变量的数值。
二重抽样也称二相抽样。其基本做法是:对于一个大 总体,先从总体中随机抽取一个较大的样本(第一重样 本),由此估计有关总体的结构或辅助指标以及其他有 关信息,为第二重抽样估计提供条件;然后再从第一 重样本中随机抽取一个较小的样本(第二重样本),利 用这第二重样本,对总体所研究变量进行抽样推断。
在某些情况下,也可在第二重样本中再抽第三 重、第四重样本,由此形成多重抽样。其中二 重抽样是最为常用的。
09第九章二重抽样-文档资料
此处添加副标题内容
第九章 二重抽样
第一节 第二节 第三节 第四节
二重抽样概述 二重分层抽样 二重比估计 二重回归估计
第一节 二重抽样概述
一、二重抽样的概念
在设计和实施某些抽样调查时,需要事先掌握有关总 体的一些信息。但在许多场合下,总体的这些有关信 息是事先未知的,或者不完全知道。为此,人们提出 了二重或多重抽样的方法,以掌握有关总体信息,然 后实施抽样调查。
ˆ
L
YstD y stD
wh yh
h 1
其中
1 nh
yh nh
yhj
j 1
为第一重样本第 h 层均值的无偏估计。
可以证明 ystD 是总体均值YstD 的无偏估计量。 如果第一重样本是随机样本,第二重样本为第一重样本的随
机子样本,则估计量的方差为
ˆ V (YstD ) V1 ( y') E1[V2 ( y)]
L 总体层数。
二、估计量及其方差
在讨论二重分层抽样估计量的性质之前,我们先给出二重抽
样中对估计量ˆ 求均值与方差的一般公式如下
E(ˆ) E1[E2 (ˆ)], V (ˆ) V1[E2 (ˆ)] E1[V2 (ˆ)]
其中, E2 、V2 为第一重抽样结果条件下对第二重抽样的均值 及方差, E1 、 V1 则是对第一重抽样的均值与方差。 据此,可以构造出二重分层抽样的总体均值估计量为
在二重分层抽样中,
wh
n'h n'
为第
h
层估计层权,
n 第一重样本量,
n'h 第一重样本中第 h 层单元数, n 第二重样本量,
N 总体单元数,
nh 第二重样本中第 h 层单元数(第 h 层第二重样本量), vh nk / n'h 为第二重抽样第 h 层的抽样比, yhj 第二重样本中第 h 层第 j 单元观测值,
第四,为分层抽样推断提供层权资料。分层抽 样推断的前提是总体各单元能按分层标志进行 归类并事先已知各层的层权。
第五,为比率估计和回归估计提供辅助资料。
第六,在经常性的多项目抽样调查中,用于解 决不同调查项目需要不同样本容量的问题。
第七,用于研究样本轮换中的某些问题。
第二节 二重分层抽样
一、二重分层抽样概述
S2(1 n'
1) N
L
Wh
S
2 h
h1 n'
1 ( vh
1)
S 2
L
Wh
S
2 h
L
Wh
S
2 h
S2
n' h1 n' vh h1 n'
N
因此,当V
V
ˆ (YstD
)
时,
n'(V
S2 )
N
(S 2
L
Wh
h1
S
2 h
L
Wh
S
2 h
h1 vh
)
所以,样本量的最优分配(即 n′与 vh 的选择)应使函数
Vˆ
ˆ (YstD
)
(
1 n'
1L N ) h1 wh ( yh
ystD ) 2
L h1
wh2
s
2 h
(
1 nh
1) n'h
三、样本容量的最优分配
在二重分层抽样中,样本量最优分配的目的是按在费用一定 时使方差达到极小,或在方差一定时使费用最省的原则确定
第一重样本量 n′和第二重每层样本量 nh 。
Q C * (V S 2 ) N
[C'
Chvh ][S 2
L
Wh
h1
S
2 h
L
h1
Wh
S
2 h
vh
]
达到极小。
根据柯西—施瓦茨不等式,可以得出符合上述要求的条件是
也即
C'
L
S 2
Wh
S
2 h
h 1
ChWh vh
Wh
S
2 h
/
vh
L
1
vh Sh[C' / Ch (S 2
Wh
S
二、二重抽样的作用 在社会经济抽样调查中,二重抽样的主要作用
有下列几方面: 第一,用于从总体所有基本单元中筛选确定出
主调查对象。 第二,用于经常性调查。对于诸如居民的某些
收入、居民基本生活支出、某些商品价格等指 标,统计部门需经常了解。
第三,用于了解陌生总体内在结构或分布的大 致情况,为抽样方法和抽样组织形式的选择提 供依据。
2 h
)]2
h1
将其代入费用函数(当C* 给定时)或方差函数(当 V 给定时),即可求出
n′的最优值。
在最优分配条件下,若给定C* ,则可得出方差的极小值为
ˆ
Vmin (YstD
)
1 C*
[
Wh Sh
Ch
(S 2
L
Wh
S
2 h
)C
'
]2
h1
S
2 hNBiblioteka 第三节 二重比估计在使用比估计量时,要求作为辅助变量 的总体均值或总和应事先已知,但在实 际中可能并
在分层抽样中,我们要求总体各层的层权应事先已 知,如果层权未知或不能事先确定,则分层抽样在 精度上的得益可能会在很大程度上被抵消掉,此时, 选择二重分层抽样可以较好地解决层权问题。
二重分层抽样是先在总体中随机抽取第一重样本n′, 对这个样本各单元进行分层后求各层的层权,然后 从第一重样本中用分层随机抽样法抽取第二重样本n, 用于估计总体指标。由于第一重简单随机抽样,第 二重分层抽样,故其误差同二重的抽样都有关。
S2 n'
(1
n' ) N
L
Wh2
h1
S
2 h
n'
(nh ' nh
1)
S 2 ( 1
1)
L
Wh
S
2 h
(
1
1)
n' N h1 n' vh
其中V1(y') 为第一重抽样之方差,V2( y) 为第二重抽样之方差。
以各层的样本方差代替各层的总体方差,以 样本各层间方差代替总体方差,则可得方差 的近似无偏估计量为