第4章分层随机抽样-精品文档
抽样调查-Ch4 分层抽样-1-029
. Solution (Continued) . ¯ yst 与 ¯ y 的比较 ¯ y = (15180 × 300 + 9856 × 250)/(300 + 250) = 12760, ¯ yst = 10585.39.
.
判断哪个估计更合理? 为什么?
15 / 18
4.1 分层随机抽样及实施方法 4.2 简单估计及其性质
2 / 18
4.1 分层随机抽样及实施方法 4.2 简单估计及其性质
4.1.1 定义与实施方法 4.1.2 特点
4.1 分层随机抽样及实施方法
背景 简单随机抽样是最基本的抽样手段, 在一些小型的抽样调查 (总体容量N 较小) 中被人们采纳. 当总体容量 N 较大时, 不 便采用简单随机抽样方法. 这时, 分层抽样将起到作用. 定义 将总体按一定的原则分成若干互不重叠且穷尽的子总体, 每 个子总体称为层 (stratum), 在每个层内进行抽样, 不同层的 抽样相对独立, 称为分层抽样(stratified sampling). 若每层中的抽样都是按简单随机抽样进行的, 称为分层随机 抽样.
W1 = N1 /N = 0.137, W2 = N2 /N = 0.863. . ¯ yst y2 = 0.137 × 15180 + 0.863 × 9856 = 10585.39. y1 + W 2 ¯ = W1¯
13 / 18
4.1 分层随机抽样及实施方法 4.2 简单估计及其性质
4.2.1 参数估计 4.2.2 估计的性质 4.2.3 例题
若实际调查了 18 个工人, 10 个技术人员, 2 个行政人员, 其损失的工时 数如下: 工人 8,24,0,0,16,32,6,0,16 7,4,4,9,5,8,18,2,0 技术人员 4,5,0,24,8, 12,3,2,1,8 行政管理人员 1,8
第4章 抽样估计
• 解:根据题意,在重复抽样条件下,合格 率的抽样平均误差为:
p=
P(1-P)= n
0.9 0.1 50
=4.24%
在不重复抽样的条件下,合格率的抽样平均误差为:
p
P(1 P)(1 n )
n
N
0.9 0.1(1 50 )
50
5000
4.22%
答:抽取50件产品进行检验,该产品合格率的抽样平均误差 为4.22%。
• 例:2008年我国谷物平均产量为5548千克/公顷, 假如通过抽样调查得到的平均产量为5580千克/ 公顷或5534千克/公顷,则样本平均每公顷产量 与实际平均每公顷产量之间的误差分别为32千克 或−14千克。
1、抽样误差的种类
• 统计调查误差按产生的原因可以分为登记性误差和代 表性误差两大类。
• 例如在省抽县、县抽乡、乡抽村、村抽户的农产量 四阶抽样中,凡未被抽中的县、乡、村、户就不必 编制关于乡、村、户的抽样框。
4、整群抽样(Cluster sampling)
• 在二阶抽样中如果把初级抽样单元称作由次级抽样单 元组成的群,在抽中的群内不再对次级单元进行抽样 而是进行普查,那么这种抽样方法就称为整群抽样。
• 时间表抽样框:把总体的时间过程分为若干个小的时 间单位,并按时间顺序对总体单位进行抽样。如流水 线产品质量检查。
二、抽样误差及其度量
• 一般地说,抽样误差是指样本指标与被它估计未 知的总体参数(总体特征值)之差。具体地是指样 本平均数 x 与总体平均数μ的差,样本成数P与总 体成数π的差(P-π)。
2、抽样误差的度量
• 实际抽样误差:某一具体样本的样本估计值 与ˆ 总 体参数的真实值 之差( -ˆ )。
第4章-等概率整群抽样和多阶段抽样
4.1.1 定义
整群抽样(cluster sampling)是将总体 划分为若干群,然后以群(cluster)为抽 样单元,从总体中随机抽取一部分群,对 被选群内的所有单元进行调查的一种抽样 技术。
2024/7/17
3
例
欲估计某高校大学生拥有手机数量,大学共有40000 名学生,10000个宿舍(每个宿舍4名学生)。
V (ˆ) E1 E2 (ˆ)2 E1 V2 (ˆ ) E1E2 (ˆ)2 V1 E2 (ˆ) E1 V2 (ˆ )
4.3.3 等概率两阶段抽样的符号说明
表4-5
4.3.4 初级单元(PSU)规模相等的 两阶段抽样
定理4.5 对于初级单元规模相等的两阶段抽样 ,如果两个阶段都是简单随机抽样,且对每个 初级单元,第二阶抽样是相互独立进行的,则 对总体均值 Y 的无偏估计为:
定理 4.1:y 是 Y 的无偏估计,即
Ey Y
定理 4.2: y 的方差为:
V ( y) 1 f n
1N N 1 i1
Yi Y
2
1 f nM
Sb2
定理 4.3:V ( y) 的样本估计为:
v( y) 1 f nM
sb2
Yˆ NMy V (Yˆ) V (NMy) N 2M 2V ( y) v(Yˆ) N 2M 2v( y)
(NM 1)(M 1)S 2
用简单随机抽样方法抽取n个群,每个群内的M个
单元全部进入样本,则等群抽样均值估计量 y 的方
差可用群内相关系数近似表示
N
2
V (y)
1 V(y) 1 f
Yi Y
i 1
M2
nM 2 N 1
1 f n
(NM 1) M 2 (N 1)
《统计分析与SPSS的应用(第五版)》课后练习答案
《统计分析与SPSS的应用(第五版)》课后练习答案第一章练习题答案1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案)英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions)2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。
●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据;●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。
3、SPSS的数据集:●SPSS运行时可同时打开多个数据编辑器窗口。
每个数据编辑器窗口分别显示不同的数据集合(简称数据集)。
●活动数据集:其中只有一个数据集为当前数据集。
SPSS只对某时刻的当前数据集中的数据进行分析。
4、SPSS的三种基本运行方式:●完全窗口菜单方式、程序运行方式、混合运行方式。
●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简洁和直观。
●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。
该方式适用于大规模的统计分析工作。
●混合运行方式:是前两者的综合。
5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名.spv是结果查看器窗口中的SPSS分析结果文件的扩展名.sps是语法窗口中的SPSS程序6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。
7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。
最新统计分析与SPSS课后习题课后习题答案汇总(第五版)
《统计分析与SPSS的应用(第五版)》课后练习答案第一章练习题答案1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案)英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions)2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。
●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据;●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。
3、SPSS的数据集:●SPSS运行时可同时打开多个数据编辑器窗口。
每个数据编辑器窗口分别显示不同的数据集合(简称数据集)。
●活动数据集:其中只有一个数据集为当前数据集。
SPSS只对某时刻的当前数据集中的数据进行分析。
4、SPSS的三种基本运行方式:●完全窗口菜单方式、程序运行方式、混合运行方式。
●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简洁和直观。
●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。
该方式适用于大规模的统计分析工作。
●混合运行方式:是前两者的综合。
5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名.spv是结果查看器窗口中的SPSS分析结果文件的扩展名.sps是语法窗口中的SPSS程序6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。
7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。
04 第四章 分层随机抽样
第四章分层随机抽样第一节分层随机抽样概述分层抽样也叫做类型抽样,它是实际工作中最常用的抽样技术之一。
分层抽样是在抽样之前,先将总体按一定标志划分为若干个层(组),后在各层内分别独立地进行抽样。
由此所抽得的样本称之为分层样本。
各层所抽的样本也是互相独立的。
如果每层中的抽样都是简单随机的,则这种抽样就叫做分层随机抽样。
由此所得到的样本称做分层随机样本。
从以上概念可以看出,分层抽样的实质是在各层间作全面调查,而在各层内作抽样调查。
因此,分层抽样的误差只与各层内的差异有关,而同各层间的差异无关。
所以,为了能有效地降低抽样误差,提高抽样效果,在分层时应遵循“尽可能使层内差异小,而使层间差异大”的原则,同时要使分层的结果既无重复又无遗漏。
进行分层抽样时应注意:①层内抽样设计的选择;②分层变量的选择;③各层样本量的分配;④层数;⑤层的分界。
以前只重视③,近年来,④和⑤引起了越来越多的关注。
同简单随机抽样相比,分层抽样具有以下特点:①分层抽样能够充分地利用关于总体的各种已知信息进行分层,因此抽样的效果一般比简单随机抽样要好。
但当对总体缺乏较多的了解时,则无法分层或不能保证分层的效果。
②在分层抽样中,总体的方差一般可以分解为层间方差和层内方差两部分。
由于分层抽样的误差只与层内差异有关,而与层间差异无关,因此,分层抽样可以提高估计量的精度。
③由于分层抽样是在每层内独立地进行抽样,因此,使得分层样本能够比简单随机样本更加均匀地分布于总体之内,所以其代表性也更好些。
④分层抽样的随机性具体体现在层内各单元的抽取过程之中,也即在各层内部的每一个单元都有相同的机会被抽中,而在层与层之间则是相互独立的。
⑤分层抽样适合于调查标志在各单元的数量分布差异较大的总体。
因为对这样的总体进行合理的分层后可将其差异较多地转化为层间差异,从而使层内差异大大减弱。
⑥分层抽样中除了可以推断总体参数外,还可以推断各不同层的数量特征,并进一步作对比分析,从而满足不同方面的需要,也能帮助人们对总体作更全面、更深入的了解。
抽样调查第4章分层抽样
分层抽样的步骤
分层:将总(体 N)分成互不K个 相子 交总 的体
K
K
(N) (Ni) N N i
i1
i 1
抽样:从每层抽取一个样本构成总的样本
K
y i 1 ,y i2 , ,y iin ,i 1 ,2 , ,K n ni
i 1
采用分层抽样的理由
可同时对子总体进行参数估计 便于组织实施,可根据各层特点采用不同抽样方式
第四章 分层抽样
§4.1 估值法(一) §4.2 估值法(二)—— 组合比估计和回归估计 §4.3 样本量的分配 §4.4 与简单随机抽样之比较 §4.5 如何适当分层 §4.6 后分层估计和定额抽样
抽样调查第4章分层抽样
4.1 估值法(一)
分层抽样的提法 估值法(一)
抽样调查第4章分层抽样
分层抽样的提法 (Stratified sampling)
组合比估计 (Ratio combined)
组合比估计的含义
有辅助变量X用于估值分析的,先分别对各层进 行简单估计,再用比估值法获得目标指标量的估计
K
yst Wi yi i1
K
xst Wi xi i1
yRC
yst xst
X
rC X
组合比估计只体需的 X或 知 X,道 无总 需知道 Xi或Xi
抽样调查第4章分层抽样
组合比估计
估值定理
定理4.2.1 对分层抽样的组合比估计,有
| E(yRCY)| V(xst)
V(yRC)
| X|
其V中 (yR)C , V(xs)t分别是 yR, Cx 估 s的 t 计 均量 .
抽样调查第4章分层抽样
组合比估计
当分层抽样 合 的 ,理 且 x样 st本 0(分 不配 依n赖 )时
分层随机抽样 PPT
[例 1] 一个单位共有职工 200 人,其中不超过 45 岁的有 120 人,超过 45 岁的有 80 人.为了调查职工的健康状况,用分层抽 样的方法从全体职工中抽取一个容量为 25 的样本,应抽取超过 45 岁的职工________人.
[思路点拨] 由分层抽样的概念,按比例抽取.
[解析] 抽样比为 25∶200=1∶8,而超过 45 岁的职工有 80 人,则从中应抽取的个体数为 80×18=10.
的层,然后按照所占比例,从各层独立地抽取 一定数量的个体,将各层取出的个体合在一起
作为样本,这种抽样的方法叫分层抽样。
【说明】分层抽样应遵循以下要求: (1)分层:将相似的个体归为一类,即分为一层,分
层要求每层的各个个体互不交叉,即遵循不重复、不遗 漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在 各层中进行简单随机抽样或系统抽样,每层样本数量与 每层个体数量的比与样本容量与总体容量的 比相等。
[练习 1] 某工厂生产 A,B,C 三种不同型号的产品,产品 数量之比依次为 2∶3∶5,现用分层抽样方法抽出一个容量为 n 的样本,样本中 A 种型号产品有 16 件,那么此样本的容量 n= ______.
答案:80 解析:因为 A 种产品在总体中占了2+23+5=15, 又因为每个个体被抽到的可能性都相等,故样本容量为 16÷15= 80.
思考:(4)三个年级同学有较大差别,应如何提 高样本的代表性? 应考虑他们在样本中所占的比例。
(5)如何确定各年级所要抽取的人数? 计算每一部分占总体个体数的比例,
在各年级中按比例分配样本,得各年级所
要抽取的个体数。
某校小学六年级、初中三年级和高中三年级分别
有1000,800和700名同学,为了了解全校毕业班学生 的视力情况,从以上三个年级中抽取容量为100的样本, 你认为应当怎样抽取样本较为合理?
抽样调查-分层随机抽样培训课件
【例4.6】(续例4.4)利用回归估计量估计该市港口
生产单位1997年完成的吞吐量。
解:样本回归系数:
h=1,非国有
1.07017
h=2,国有 0.856402
则按分别回归估计量估计:(见P85)
1.分别比率估计 总体均值 总体总量 的分层比率估计为: 总体均值:
总体总量:
层权 L: 层数
为 的比率估计,
为 比率估计
比率估计量的方差:
式中,
分别为第 i层指标
Y,X的方差及相关系数.
分别比率估计量要求每一层的样本量 都比较大,否则,偏倚可能比较大.
2.联合比率估计(combined ratio estimator) 总体均值:
户总
数
1 23 456 7 8
1 200
0 00 100 0 1
9 10
00
2 400 0 1 0 0 0 0 0 0 1 0
3 750 1 1 0 0 0 0 1 0 1 0
4 1500 1 0 0 0 0 0 0 0 0 0
解:由上表可得 该地区居民拥有家庭电脑比例的估计为:
估计量的方差为:
§3.3 比率估计量及其性质
1、比估计是有偏估计量,当各层样本量都较大时 两种比估计都近似无偏;当某些层的样本量不够大, 而总样本量较大时,联合比率估计近似无偏。
2、在回归估计中,若事先设定回归系数,其估计量 无偏;若用样本回归系数作为回归估计系数,其估计 量有偏,但在大样本情况下近似无偏。
3、当主要变量Y和辅助变量X高度相关时,比率估 计和回归估计都是有效的,且能大幅度地提高估计 精度。
高中数学必修二课件:分层随机抽样
(2)分层随机抽样的特点: ①适用于总体由差异明显的几部分组成的情况; ②更充分地反映了总体的情况; ③等可能抽样,每个个体被抽到的可能性都相等. (3)分层随机抽样的公平性: 在分层随机抽样的过程中每个个体被抽到的可能性是相同的,与层数及分 层无关.
4.分层随机抽样的一个前提和遵循的两个原则 (1)前提:分层随机抽样的适用前提是总体可以分层,层与层之间有明显区 别,而层内个体间差异较小. (2)遵循的两个原则 ①将相似的个体归为一类,即为一层,分层要求每层的各个个体互不交 叉,即遵循不重复、不遗漏的原则; ②分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随 机抽样,每层样本数量与每层个体数量的比等于抽样比.
(2)某地区的高一新生中,来自东部平原地区的学生有2 400人,中部丘陵地
区的学生有1 600人,西部山区的学生有1 000人.计划从中选取100人调查学生
的视力情况,现已了解到来自东部、中部、西部三个地区学生的视力情况有较
大差异,而这三个地区男女生视力情况差异不大,在下面的抽样方法中,最合
理的抽样方法是( D ) A.随机数法
A.24
女生 373
x
y
男生 377
370
z
B.48
C.16
D.12
【解析】 用分层随机抽样的方法先求出三年级的总人数.由题意知二年 级女生有2 000×0.19=380(人),所以三年级共有2 000-(373+377)-(380+370) =500(人).所以应在三年级抽取学生2 60400×500=16(人).故选C.
பைடு நூலகம்
探究2 (1)在利用分层随机抽样抽取样本时,要保证每层的个体被抽到的可 能性相等,所以涉及求样本容量、某一层的样本容量、总体或各层的个体数 时,都要用到抽样比.
9.1.2分层随机抽样课件(人教版)
新知探索
在实际抽样调查中,由于实际问题的复杂性,除了要考虑获得的样本的代表性
,还要考虑调查实施中人力、物力、时间等因素,因此通常会把多种抽样方法组合
起来使用.例如,在分层抽样中,不同的层内除了用简单随机抽样外,还可以用其他
的抽样方法,有时层内还需要再进行分层,等等.
思考2:如果想要了解某电视节目在你所在的地区(城市、乡镇或村庄)的收视率,
例3.随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层
的样本量为30,样本平均数为8,则该样本的平均数为_____.
答案:6.
20
30
ഥ=
×3+
× 8 = 6.
20 + 30
20 + 30
练习
方法技巧:
进行分层随机抽样的相关计算时,常用到的3个关系
(1)
样本容量
该层抽取的个体数
答案:×,×,×.
)
新知探索
辨析2:某校高三一班有学生54人,二班有学生42人,现在要用分层随机抽样的
方法从两个班抽取16人参加军训表演,则一班和二班分别被抽取的人数是(
A.9,7
答案:A.
B.10,6
C.8,8
D.12,4
).
练习
题型一:分层随机抽样的概念
例1.下列问题中,最适合用分层随机抽样抽取样本的是(
可以计算出男生、女生中分别应抽取的人数为:
326
386
男 =
× 50 ≈ 23,女 =
× 50 ≈ 27.
712
712
我们按上述方法抽取了一个容量为50的样本,其观测数据(单位:)如下:
男生
173.0
人教A版9.1.2分层随机抽样课件(27张)
方法技巧
1.使用分层随机抽样的前提
分层随机抽样的总体按一个或多个变量划分成若干个子总体,并且每
一个个体属于且仅属于一个子总体,而层内个体间差异较小.
2.使用分层随机抽样应遵循的原则
(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉, 即遵循不重复、不遗漏的原则; (2)分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随 机抽样,每层样本数量与每层个体数量的比等于抽样比.
课前预习
预习课本P181~184,思考并完成以下问题
(1)什么是分层随机抽样?分层随机抽样的总体具有什么特性? (2)简单随机抽样和分层随机抽样有什么区别和联系?
课前小测
1.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,
采用分层随机抽样的方法抽取一个容量为150的样本,则样本中松树苗
分层随机抽样
本节目标
学习目标
核心素养
1. 通过实例,了解分层随机抽样的特点和 1.通过对分层随机抽样的学习,
适用范围.(重点)
培养学生数学抽象素养.
2.了解分层随机抽样的必要性,掌握各层样 2.通过对分层随机抽样的应用,
本量比例分配的方法.(重难点)
3.会计算分层随机抽样的样本均值.(重点) 培养学生数据分析素养.
情况,对甲、乙、丙、丁四个社区做分层随机抽样调查,假设四个社区驾驶员的
总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶
员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( B )
A.101
B.808
C.1212
D.2012
(2)将一个总体分为A,B,C三层,其个体数之比为5∶3∶2. 若用分层随 机抽样方法抽取容量为100的样本,则应从C中抽取___2_0____个个体.
第4章_分层抽样
是第h层总体及样本中具有所考虑特征的单元数, 是第 h 层总体及样本中具有所考虑特征的单元数 ,
则总体比例P的估计为: 则总体比例P的估计为:
pst = ∑ h P W h
h= 1
L
第二节
简单估计量及其性质
(二)估计量的性质 如果定义
, i 单 具 所 虑 特 1 第个 元 有 考 的 征 Yi = , i =1 ,2, , N 他 0, 其
L 2 h
第二节
简单估计量及其性质
为调查某地区住户的平均家庭成员数, 【例4.1】为调查某地区住户的平均家庭成员数,将该地区 分成城市和乡村2 每层按简单随机抽样抽取10 10户 分成城市和乡村2层,每层按简单随机抽样抽取10户,调查所 获得的数据如表4 获得的数据如表4-1。请估计该地区住户的平均家庭成员数及 95%的置信区间。 其95%的置信区间。
( )
st
值得强调的是,在分层抽样中只要对各层估计是无偏的, 值得强调的是,在分层抽样中只要对各层估计是无偏的,则对 总体的估计也是无偏的。因此,各层可以采用不同的抽样方法, 总体的估计也是无偏的。因此,各层可以采用不同的抽样方法, 只要相应的估计量是无偏的,则对总体的推算也是无偏的。 只要相应的估计量是无偏的,则对总体的推算也是无偏的。
st
Y
的无偏估计, 的无偏估计,
ˆ V Y = N2V Yst = ∑ Yh V ˆ
h=1 L L 2 2 h h 2 h
( ) ( ) ˆ ˆ = N ∑ V (Y ) = ∑N V (Y ) W
( )
L
h=1
h=1
h
第二节
简单估计量及其性质
性质 5
对于分层随机抽样, 的方差为: 对于分层随机抽样,Y 的方差为:
04-第四章_分层随机抽样
L
下面讨论估计量的期望与方差。 (1)对于一般分层抽样
ˆ )也 对于一般的分层抽样,若 Y h 是 Y h 的无偏估计量,则 Y st (或 Y st
是 Y (或 Y )的无偏估计:
Ù
Ù
E (Y st ) = å Wh E (Y h ) = Y
h =1
Ù
L
Ù
ˆst ) = NE (Y st ) = N Y = Y E (Y
L
2 L Sh S2 - å Wh2 h nh h =1 Nh
=å
简便公式
2 L Wh2 Sh W S2 -å h h nh N h =1 h =1
V ( y st ) = V (å Wh y h )
h =1
L
= å Wh2V ( y h )
h =1 L
L
= å Wh2
h =1
Sh2 (1 - f h ) nh
åN
h =1
L
h
=N。
Wh =
Nh 称为层权,它也是已知的。 N
以 Yhi 表示第 h 层总体的第 i 个单元的指标值,以 yhi 表示第 h 层样本的 第 i 个单元的指标值。
Yh =
1 Nh 1 nh
åY
i =1 nh i =1
Nh
hi
表示第 h 层的总体均值,
yh =
åy
hi
表示第 h 层的样本均值(其中 nh 是第 h 层的样本量) ,
h =1 h =1 h =1 L L Ù L Ù Ù
Ù
3
(2)对于分层随机抽样
Ù
特别对于分层随机抽样,Y h 一般均取为简单估计:层样本均值 y h ,因 此 Y 的简单估计为:
【抽样调查】分层随机抽样
【抽样调查】分层随机抽样第2部分:分层随机抽样⽬录概述分层随机抽样的思路:当N ,n 都较⼤,总体单元之间的差异也较⼤时,简单随机抽样会出现⾼成本、低精度情形,解决⽅法是将总体划分为若⼲个⼦总体、减少总体单元之间的差异。
假设在各个⼦总体内已经满⾜实施简单随机抽样的条件,则可以在各个⼦总体内独⽴地进⾏简单随机抽样,再将各个⼦总体参数的估计值进⾏加权,得到总体参数的估计。
分层抽样的概念:层:如果⼀个包含N 个单位的总体可以分成不重不漏的L 个⼦总体,即每个单元必定属于且仅属于⼀个⼦总体,则这样的⼦总体称为层。
有N 1+⋯+N L =N 。
分层抽样:在每⼀层中独⽴进⾏抽样,总的样本由各层样本组成,总体参数⼜按照各层样本参数的汇总作出估计。
有n 1+⋯+n L =n 。
分层随机抽样:每层的样本,都独⽴地按照简单随机抽样进⾏,这样的分层抽样称为分层随机抽样。
符号规定:h :层。
从⽽N h 代表第h 层的单位总数,n h 代表第h 层的样本数。
i :层内单位号。
从⽽Y hi 代表第h 层第i 个总体单元,y hi 代表第h 层第i 个样本单元。
W h :层权,即W h =N h N 。
f h :层内抽样⽐,即f h =n hN h 。
¯Yh,Y h,S 2h:层内总体参数(均值、总值与⽅差)。
¯y h ,y h ,s 2h:层内样本参数(样本均值、样本总值与样本⽅差)。
简单估计量分层抽样⾸先根据各层的样本,计算出各层均值¯Y h的适当估计值ˆ¯Y h ,然后再使⽤总体层权加权平均,得到总体均值¯Y 的估计,即ˆ¯Y st =L∑h =1W h ˆ¯Y h =1N L∑h =1N h ^¯Y h .对于分层随机抽样,每⼀层的ˆ¯Y h就是h 层的样本均值¯y h ,即ˆ¯Y st =L∑h =1W h ¯y h =1N L∑h =1N h ¯y h .注意这⾥的线性形式。
初级1 -第四章分层随机抽样
抽样调查
原理与方法
第四章
分层随机抽样
二、特点 1. 提高估计精度
分层抽样如果实施的好,将可以提高整体估计的精度,即抽 样效率较高。这是因为分层抽样估计量的方差只和层内方差 有关,和层间方差无关。因此,人们可以通过对总体分层, 尽可能地降低层内差异,使层间差异尽可能大,从而提高估 计的精度。比如,不同年龄的人血压值通常存在很大差异, 因此在研究血压的时候,按照不同的年龄分类是很有意义的 。在研究地区农作物产量的时候,按照地形的不同分类也是 很有意义的,沼泽地里的农作物和森林里的农作物就有很大
抽样调查
原理与方法
3. 便于组织
分层抽样实施起来灵活方便,也便于组织。一方面,由于抽样在各层 独立进行,因而允许我们视层内的具体情况采用不同的抽样方 法。例如,在一个商业调查中,规模较大的公司可能采取邮寄 的方式调查,而小的公司可能采用入户调查或者电话调查的方 式。再比如,对于某些调查,针对城市和农村可能要采用不同 的调查方法。另一方面,分层抽样的数据处理比较简单,各层 的数据处理可以单独进行,而层间汇总方式又非常简单,对估 计量而言仅是对均值估计的加权平均或是对总量估计的简单相 加,相应的精度估计也不复杂。
如果得到的是分层随机样本,则总体总量 的简单估计为:
Y Nyst
抽样调查
原理与方法
2.估计量的性质
性质4:对于一般的分层抽样,如果 Y st ˆ 是 Y 的无偏估 是 Y 的无偏估计,则 Y ˆ 的方差为: 计。 Y
2 ˆ ˆ ˆ V Y N V Yst V Y h
2 L 2 h
抽样调查
原理与方法
第二节 估 计 量
一、对总体均值的估计 分层样本,总体均值 Y 的估计
第4章 抽样调查作业答案(1)
第4章抽样调查作业答案一.单项选择题1.抽样调奁的主要目的在于( 3 )。
①计算和控制误差:②了解总体单位情况③用样本来推断总体:④对调查单位作深入的研究2.抽样调查所必须遵循的基本原则是( 4 )。
①随意原则:②可比性原则:③准确性原则:④随机原则。
3.极限误差与抽样平均误差数值之间的关系为( 4 )①前者一定小于后者②前者一定大于后者③前者一定等于后者④前者既可以大于后者,也可以小于后者4.无偏性是指( 1 )。
①抽样指标等于总体指标:②样本平均数的平均数等于总体平均数:③样本平均数等于总体平均数;④样本成数等于总体成数。
5.一致性是指当样本的单位数充分大时,抽样指标( 4 )。
①小于总体指标;②等于总体指标:③大予总体指标:④充分靠近总体指标6.有效性是指作为优良估计量的方差与其他估计量的方差相比有( 1 )。
①前者小于后者;②前者大于后者:③两者相等;④两者不等。
7.能够事先加以计算和控制的误差是( 1 )。
①抽样误差:②登记误差:③代表性误差;④系统性误差。
8.从总体N个不同单位每次抽取n个单位作为样本。
如果采用考虑顺序的重复抽样方法,则样本的可能数目为( 3 )。
③N n9.从总体N个不同单位每次抽取n个单位作为样本,如果采用不考虑顺序的不重复抽样方法,则样本的可能数目为( 4 )。
④()(N+n-1)!/(N-1)!n!1O.对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样,两工厂工人工资方差相同,但第二个厂工人数比第一个厂工人数整整多一倍。
抽样平均误差( 2 )。
①第一个工厂大;②第二个工厂大:③两工厂一样大;④无法做出结论。
(不重复抽样的:抽样平均平均误差=方差*(1-n/N)1/2/n1/2)11.?抽样平均误差是指抽样平均数(或抽样成数)的()。
①平均数:②平均差③标准差④标准差系数12.在同样情况F,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比,是( 3 )。
9.1.2分层随机抽样课件(人教版)(1)
分层——计算抽样比——定数——抽样——成样
分层:按照某一种或多种特征将总体分层;
样本容量
计算抽样比:抽样比=
;
总体容量
定数:按抽样比确定每层抽取个体数;
抽样:各层按简单随机抽样的方法抽取样本;
成样:综合各层样本,组成总样本.
二、探究本质得新知
问题5:为什么分层随机抽样能用样本平均数估计总体平均数?
在分层随机抽样中,不妨设层数为两层,第一层和第二层包含个体数
分别为M和N,抽取的样本量分别为m和n,我们用X1,X2,…,XM表示
第一层各个个体的变量值,用x1,x2,…,xm表示第一层样本的各个个
体的变量值;用Y1,Y2,…,YN表示第一层各个个体的变量值,用y1,
y2,…,yn表示第一层样本的各个个体的变量值,
第九章 统计
9.1.2 分层随机抽样
一、创设情境 引入新课
树人中学高一年级有学生1 800人,高二年级1 600人,高
三年级1 400人,为了了解该校学生的某项心理状况(此项
状况与学生所处年级有关),打算从树人中学学生中抽取
2%进行调查.该如何进行抽样呢?
二、探究本质得新知
探究一:分层抽样的有关概念
年级抽取人数为600×0.05=30.
四、学生练习,加深理解
3.某中学有老年教师20人,中年教师65人,青年教师95人,
为了调查他们的健康状况,需从他们中抽取一个容量为
分层抽样
36的样本,则合适的抽样方法是____________.
解析:由于老年人、中年人和青年人的身体情
况会有明显的差异,所以要用分层抽样.
收入的家庭280个,低收入的家庭95个,为了了解生活购
买力的某项指标,要从中抽取一个容量为100的样本;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ˆ ˆ ˆ ˆ Yu sY ( ), Yu sY ( ) 1 1 2 2
9
例4.2 调查某地区的居民奶制品年消费支出,以居民户为 抽样单元,根据经济及收入水平将居民户分为4层,每层 按简单随机抽样抽取 10 户,调查数据如下,估计该地区 居民奶制品年消费总支出及估计的标准差。 样本户奶制品年消费支出
5
例4.1 总体由1000人组成,按以往的收入情况将总体分成两 层:第一层(高收入层),20人;第二层(低收入层), 980人。从第一层随机抽取2人,调查上月收入,得数据 (单位:元)1200及1600;从第二层随机抽取8人,调查上 月收入,得数据(单位:元)220、230、180、320、400、 340、280、360。估计这1000人上月平均收入。 解: ˆ ˆ Ny Ny Y ˆ 1 Y 2 2 2 Y 11 W Wy 1y 1 2 2 N N 2 0 9 8 0 1 4 0 0 2 9 1 .2 53 1 3 .4 3 1 0 0 0 1 0 0 0
Y 的 置 信 度 为 1 的 置 信 区 间 为 : u s (y , y u s (y y s t s t) s t s t) 1 1 2 2
2 . 总 体 总 和的 Y 估 计 : ˆ Ny ˆ Y ˆ NY Y h h h h st
h 1 h 1 h 1 L L L
f 21 h 2 ˆ ˆ 方 差 V ( Y ) V ( Y ) N V ( y ) N S h s t h h n h 1 h 1 h 1 h
L L 2 h L
1 f 2 2 h ˆ ˆ 方 差 V ( Y ) 的 无 偏 估 计 : v ( Y ) N s h h n h 1 h Y 的 置 信 度 为 1 的 置 信 区 间 为 :
第四章 分层随机抽样
1
4.1 概述
一、分层抽样(stratified sampling)、分层随机抽样 (stratified random sampling) 分层抽样:将容量为N的总体分成L个不相重叠的子总 体,子总体的大小分别为N1, N2 , ∙∙∙ , NL,皆已知,且
N
h1
L
h
h 1 h 1 L
L
L
ˆ) 2 ˆ) V ˆ ) N 方 差 V (Y ( Y V ( Y h h h
h 1 h 1
L
L L L N 1 ˆ ˆ h ˆ ˆ (2 ) Y Y Y W Y s t Nh1 h h1 N h h1 h h
ˆ ) W ˆ) 2 方 差 V (Y V ( Y h h s t
n n
i 1 h
L
N h 层 权 ( W ) : W h N h
4
总 体 第 h 层 有 N 个 总 体 单 元 : Y , , Y , , Y h h 1 h i h N h 第 h 层 样 本 有 n 个 样 本 单 元 : y , , y , , y h h 1 h i h n h
h 1
L
7
ˆ 分 层 随 机 抽 样 , 则 Y 的 简 单 估 计 为 y h h
ˆ ˆ 1 . Y 的 无 偏 简 单 估 计 Y 为 : y W Y W y , s t s t h h h h
h 1 h 1 L L
ˆ 记为y . Y st st
1 f h2 y 的 方 差 为 V () y W V () y W S . s t s t h h n h 1 h 1 h
L 2 h L 2 h
L f ˆ 21 h2 Y 的 方 差 V ( y ) 的 估 计 : vy ( ) W s , s t s t s t h h n h 1 h 2 2 且 为 V ( y ) 的 无 偏 估 计 . 因 为 , E ( s ) = S . s t h h
8
对比:
1 2 0 0 1 6 0 0 2 2 0 3 6 0 y 5 1 3 1 0
6
一、分层抽样中,
ˆ, ˆ 若 对 任 一 层 , 假 设 为 第 h 层 , 都 有 Y N Y h hh Y Y h
h 1 L
ˆ ˆ Y ˆ NY (1 ) Y h h h
3
4.2 简单估计量及其性质
对总体均值或总值的估计:
设 总 体 分 为 L 层 , 以 h 表 示 层 的 编 号 , h 1 , 2 , , L
ห้องสมุดไป่ตู้
总 体 () N :N , , N , N N 1 L h
i 1
L
样 本 ( n ) :n , , n , 1 L
N
则每个子总体就称为层。从每层中独立地进行抽样, 这样的抽样方法称为分层抽样。
分层随机抽样:在分层抽样中,如果每层中的抽样都是 简单随机抽样,则这样的分层抽样称为分层随机抽样。
2
二、分层抽样的适用场合 不仅需要估计总体参数,也需要估计各层参数。 便于管理,按现成的地理分布或行政划分来分层。 希望样本中能包含各个部分,以增加代表性。 把一个内部差异很大的总体分成几个内部比较相似的 子总体(层)进行分层抽样,可以提高估计量的精度。 如果有极端值,也可以把它们分离出来形成一层。即 “层间方差大,层内方差小”。 三、进行分层抽样时,应注意的方面 层内抽样设计的选择。 分层变量的选择。 各层样本量的分配,样本总量的确定。 层数。 层的分界。
总体第h层 Yh Yhi
i 1 Nh
第h层样本 yh yhi
i 1 nh
1 Nh Yh Yhi Nh i1
Nh 1 2 2 Sh ( Y Y ) h Nh 1 i1 hi
1 nh yh yhi nh i1
nh 1 2 2 sh ( y y ) h nh 1 i1 hi