04分层抽样
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如果每层中的抽样都是简单随机的,则这种抽样就叫做 分层随机抽样。由此所得到的样本称做分层随机样本。
分层时应遵循“尽可能使层内差异小,而使层间差异大” 的原则,同时要使分层的结果既无重复又无遗漏。
进行分层抽样时应注意:①层内抽样设计的选择;②分 层变量的选择;③各层样本量的分配;④层数;⑤层的 分界。以前只重视③,近年来,④和⑤引起了越来越多 的关注。
N h 第h 层总体中的单位数; nh 第h 层样本中的单位数;
Yh 第h 层的总体总量;
yh 第h 层的样本总量;
Yhi 第h 层第i 个总体单元(单位)的取值;
i yhi 第h 层第 个样本单元(单位)的取值;
Wh
Nh N
第h 层的总体层权;
fh
nh Nh
第h 层的抽样比;
1 Nh
第四章 分层抽样
第一节 第二节 第三节 第四节
分层抽样概述 总体参数的估计 总样本量的分配 分层与提高精度
第一节 分层抽样概述
分层抽样是在抽样之前,先将总体按一定标志划分为若 干个层(组),然后在各层内分别独立地进行抽样。由 此所抽得的样本称之为分层样本。各层所抽的样本也是 互相独立的。
⑥分层抽样中除了可以推断总体参数外,还可以推断各不 同层的数量特征,并进一步作对比分析,从而满足不同方 面的需要,也能帮助人们对总体作更全面、更深入的了解。 但对各层的估计缺乏精度保证。
⑦分层抽样调查实施中的组织管理及数据收集和汇总处理 可以分别在各层内独立地进行,因此较之简单随机抽样更 方便。
Yh
Nh
Yhi
i 1
第h 层的总体均值;
yh
1 nh
nh
yhi
i1
第h 层的样本均值;
S
2 h
1 Nh 1
Nh i1
(Yhi
Yh )2
第h 层的总体方差;
sh2
1 nh 1
nh i1
( yhi
yh )2
第h 层的样本方差。
L Nh
Y = yhi 为总体总量; h 1 i1
L表示分层的层数; h表示层的编号(h=1,2,3,…,L);
满足下述条件时,分层在精度上会有很大的得益: ①总体是由一些大小差异很大的单元组成的,即总体差异
大; ②分层后,每层所包含的总体单元数应是可知的,也即分
层后各层的权重是确知的或可以精确估计的; ③要调查的主要变量(标志)与单元的大小是密切相关的; ④对单元的大小有很好的测量资料可用于分层,也即分层
分层抽样具有以下特点:
①分层抽样能够充分地利用关于总体的各种已知信息进行 分层,因此抽样的效果一般比简单随机抽样要好。但当对 总体缺乏较多的了解时,则无法分层或不能保证分层的效 果。
②在分层抽样中,总体的方差一般可以分解为层间方差和 层内方差两部分。由于分层抽样的误差只与层内差异有关, 而与层间差异无关,因此,分层抽样可以提高估计量的精 度。
变量容易确定。
第二节 总体参数的估计
一、分层抽样相关符号说明 在分层抽样中,先将含有 N个单位的总体分成分别含有
N1, N2 ,个 单, N位L 的 层,这L 些层之间互不重复,且有:
N1 N2 NL N
从每层中抽取一个子样本,而且抽样在各层中独立进行, 若各层内样本量分别用n1, n2 ,表, n示L ,则将这些子样本合起来 就是从总体中所抽取的一个样本。其样本容量 显然n满 足: n1 n2 ,对nL于分n 层抽样,经常使用下列一些符号:
L
Yˆst Nyst N h yh
h
3、总体比例P的估计量
按照总体均值估计量的公式,可推出总体比例(成数)P 的估计量为:
L
L
Pˆst Wh Pˆh Wh ph
h
h
可以证明,在分层随机抽样中,yst是Y 的无偏估计量,Yˆ是 Y 的无偏估计量,Pˆs是t P的无偏估计量。
三、估计量的方差 1、总体均值估计量的方差 对于一般的分层抽样,由于各层的抽样是相互独立的,诸
二、估计量
1、总体均值的估计量
在分层抽样中,总体均值 Y的估计量一般用 y表st 示,它是各 层总体均值 的Y估h 计量按层权 的W加h 权平均,即:
Yˆst
y st
L WhYˆh
h 1
1 N
L N hYˆh
h 1
如果得到的是分层随机样本,则总体均值 Y的简单估计为:
一般情况下:
y st
也Yˆh 相互独立,因此总体均值 估Y计量的方差是总体各层均 值估计量方差的加权平均,即
式中
V (Yˆst ) V ( yst ) L Wh2V (Yˆh )
h
V是(Yˆ第h ) h层总体均值估计量的方差。
对于分层随机抽样,则有:
V ( yst )
L h
Wh
2
1
n
f
h
h
Sh2
L h
Wh
③由于分层抽样是在每层内独立地进行抽样,因此,使得 分层样本能够比简单随机样本更加均匀地分布于总体之内, 所以其代表性也更好些。
④分层抽样的随机性具体体现在层内各单元的抽取过程之 中,也即在各层内部的每一个单元都有相同的机会被抽中, 而在层与层之间则是相互独立的。
⑤分层抽样适合于调查标志在各单元的数量分布差异较大 的总体。因为对这样的总体进行合理的分层后可将其差异 较多地转化为层间差异,从而使层内差异大大减弱。
⑧分层抽样中,由于各层的抽样相互独立,互不影响,且 各层间可能有显著的不同,因此,对不同层可以按照具体 情况和条件分别采用不同的抽样和估计方法进行处理,从 而提高估计的精确度。
⑨当总体有周期现象时,用分层比例抽样法可以减少抽样 方差。
⑩分层抽样中在进行分层时,需收集可用于分层的必要的 各种资料,因此可能会增加一定的额外费用。同时,分层 抽样中,总体参数的估计以及各层间样本量的分配、总样 本量的确定等都更为复杂化。
L
Wh yh
h1
1 N
L
Nh yh
h1
y st
y
wenku.baidu.com
1 n
L
nh yh
h 1
原果这因每种在层情于都况权有称数为yst问n按h题/比n。或例在N分hy/中配stN ,的,每分nhn即h/层层N都抽h ,有样n /则精,N 确各完的层全权的fh 相数抽等f样N于h比。/ N相如y。
同。
2、总体总和Y的估计量 有了总体均值的估计量,就可推出总体总和的估计量:
2
(
1 nh
1 Nh
)Sh
2
L Wh 2 Sh 2 1
分层时应遵循“尽可能使层内差异小,而使层间差异大” 的原则,同时要使分层的结果既无重复又无遗漏。
进行分层抽样时应注意:①层内抽样设计的选择;②分 层变量的选择;③各层样本量的分配;④层数;⑤层的 分界。以前只重视③,近年来,④和⑤引起了越来越多 的关注。
N h 第h 层总体中的单位数; nh 第h 层样本中的单位数;
Yh 第h 层的总体总量;
yh 第h 层的样本总量;
Yhi 第h 层第i 个总体单元(单位)的取值;
i yhi 第h 层第 个样本单元(单位)的取值;
Wh
Nh N
第h 层的总体层权;
fh
nh Nh
第h 层的抽样比;
1 Nh
第四章 分层抽样
第一节 第二节 第三节 第四节
分层抽样概述 总体参数的估计 总样本量的分配 分层与提高精度
第一节 分层抽样概述
分层抽样是在抽样之前,先将总体按一定标志划分为若 干个层(组),然后在各层内分别独立地进行抽样。由 此所抽得的样本称之为分层样本。各层所抽的样本也是 互相独立的。
⑥分层抽样中除了可以推断总体参数外,还可以推断各不 同层的数量特征,并进一步作对比分析,从而满足不同方 面的需要,也能帮助人们对总体作更全面、更深入的了解。 但对各层的估计缺乏精度保证。
⑦分层抽样调查实施中的组织管理及数据收集和汇总处理 可以分别在各层内独立地进行,因此较之简单随机抽样更 方便。
Yh
Nh
Yhi
i 1
第h 层的总体均值;
yh
1 nh
nh
yhi
i1
第h 层的样本均值;
S
2 h
1 Nh 1
Nh i1
(Yhi
Yh )2
第h 层的总体方差;
sh2
1 nh 1
nh i1
( yhi
yh )2
第h 层的样本方差。
L Nh
Y = yhi 为总体总量; h 1 i1
L表示分层的层数; h表示层的编号(h=1,2,3,…,L);
满足下述条件时,分层在精度上会有很大的得益: ①总体是由一些大小差异很大的单元组成的,即总体差异
大; ②分层后,每层所包含的总体单元数应是可知的,也即分
层后各层的权重是确知的或可以精确估计的; ③要调查的主要变量(标志)与单元的大小是密切相关的; ④对单元的大小有很好的测量资料可用于分层,也即分层
分层抽样具有以下特点:
①分层抽样能够充分地利用关于总体的各种已知信息进行 分层,因此抽样的效果一般比简单随机抽样要好。但当对 总体缺乏较多的了解时,则无法分层或不能保证分层的效 果。
②在分层抽样中,总体的方差一般可以分解为层间方差和 层内方差两部分。由于分层抽样的误差只与层内差异有关, 而与层间差异无关,因此,分层抽样可以提高估计量的精 度。
变量容易确定。
第二节 总体参数的估计
一、分层抽样相关符号说明 在分层抽样中,先将含有 N个单位的总体分成分别含有
N1, N2 ,个 单, N位L 的 层,这L 些层之间互不重复,且有:
N1 N2 NL N
从每层中抽取一个子样本,而且抽样在各层中独立进行, 若各层内样本量分别用n1, n2 ,表, n示L ,则将这些子样本合起来 就是从总体中所抽取的一个样本。其样本容量 显然n满 足: n1 n2 ,对nL于分n 层抽样,经常使用下列一些符号:
L
Yˆst Nyst N h yh
h
3、总体比例P的估计量
按照总体均值估计量的公式,可推出总体比例(成数)P 的估计量为:
L
L
Pˆst Wh Pˆh Wh ph
h
h
可以证明,在分层随机抽样中,yst是Y 的无偏估计量,Yˆ是 Y 的无偏估计量,Pˆs是t P的无偏估计量。
三、估计量的方差 1、总体均值估计量的方差 对于一般的分层抽样,由于各层的抽样是相互独立的,诸
二、估计量
1、总体均值的估计量
在分层抽样中,总体均值 Y的估计量一般用 y表st 示,它是各 层总体均值 的Y估h 计量按层权 的W加h 权平均,即:
Yˆst
y st
L WhYˆh
h 1
1 N
L N hYˆh
h 1
如果得到的是分层随机样本,则总体均值 Y的简单估计为:
一般情况下:
y st
也Yˆh 相互独立,因此总体均值 估Y计量的方差是总体各层均 值估计量方差的加权平均,即
式中
V (Yˆst ) V ( yst ) L Wh2V (Yˆh )
h
V是(Yˆ第h ) h层总体均值估计量的方差。
对于分层随机抽样,则有:
V ( yst )
L h
Wh
2
1
n
f
h
h
Sh2
L h
Wh
③由于分层抽样是在每层内独立地进行抽样,因此,使得 分层样本能够比简单随机样本更加均匀地分布于总体之内, 所以其代表性也更好些。
④分层抽样的随机性具体体现在层内各单元的抽取过程之 中,也即在各层内部的每一个单元都有相同的机会被抽中, 而在层与层之间则是相互独立的。
⑤分层抽样适合于调查标志在各单元的数量分布差异较大 的总体。因为对这样的总体进行合理的分层后可将其差异 较多地转化为层间差异,从而使层内差异大大减弱。
⑧分层抽样中,由于各层的抽样相互独立,互不影响,且 各层间可能有显著的不同,因此,对不同层可以按照具体 情况和条件分别采用不同的抽样和估计方法进行处理,从 而提高估计的精确度。
⑨当总体有周期现象时,用分层比例抽样法可以减少抽样 方差。
⑩分层抽样中在进行分层时,需收集可用于分层的必要的 各种资料,因此可能会增加一定的额外费用。同时,分层 抽样中,总体参数的估计以及各层间样本量的分配、总样 本量的确定等都更为复杂化。
L
Wh yh
h1
1 N
L
Nh yh
h1
y st
y
wenku.baidu.com
1 n
L
nh yh
h 1
原果这因每种在层情于都况权有称数为yst问n按h题/比n。或例在N分hy/中配stN ,的,每分nhn即h/层层N都抽h ,有样n /则精,N 确各完的层全权的fh 相数抽等f样N于h比。/ N相如y。
同。
2、总体总和Y的估计量 有了总体均值的估计量,就可推出总体总和的估计量:
2
(
1 nh
1 Nh
)Sh
2
L Wh 2 Sh 2 1