分层随机抽样概述(PPT 148页)_8284
第4章分层随机抽样-精品文档
ˆ ˆ ˆ ˆ Yu sY ( ), Yu sY ( ) 1 1 2 2
9
例4.2 调查某地区的居民奶制品年消费支出,以居民户为 抽样单元,根据经济及收入水平将居民户分为4层,每层 按简单随机抽样抽取 10 户,调查数据如下,估计该地区 居民奶制品年消费总支出及估计的标准差。 样本户奶制品年消费支出
5
例4.1 总体由1000人组成,按以往的收入情况将总体分成两 层:第一层(高收入层),20人;第二层(低收入层), 980人。从第一层随机抽取2人,调查上月收入,得数据 (单位:元)1200及1600;从第二层随机抽取8人,调查上 月收入,得数据(单位:元)220、230、180、320、400、 340、280、360。估计这1000人上月平均收入。 解: ˆ ˆ Ny Ny Y ˆ 1 Y 2 2 2 Y 11 W Wy 1y 1 2 2 N N 2 0 9 8 0 1 4 0 0 2 9 1 .2 53 1 3 .4 3 1 0 0 0 1 0 0 0
Y 的 置 信 度 为 1 的 置 信 区 间 为 : u s (y , y u s (y y s t s t) s t s t) 1 1 2 2
2 . 总 体 总 和的 Y 估 计 : ˆ Ny ˆ Y ˆ NY Y h h h h st
h 1 h 1 h 1 L L L
f 21 h 2 ˆ ˆ 方 差 V ( Y ) V ( Y ) N V ( y ) N S h s t h h n h 1 h 1 h 1 h
L L 2 h L
1 f 2 2 h ˆ ˆ 方 差 V ( Y ) 的 无 偏 估 计 : v ( Y ) N s h h n h 1 h Y 的 置 信 度 为 1 的 置 信 区 间 为 :
抽样技术-分层随机抽样概述
19
W1
N1 N
200 2850
0.07018
f1
n1 N1
10 200
0.05
1 n1
y1 n1 i1 y1i 39.5
s12
1 n1 1
n1 i 1
y1i y1 2 1624.722
同理,求得: y2 105
s22 2166.667
y3 165
2020/3/10
17
性质3:对于分层随机抽样, 的一个无偏估计为:
V Yˆ
v Yˆ
L
N
2 h
v
yh
h1
L h1
N
2 h
1 fh nh
s
2 h
2020/3/10
18
例3.1
调查某地区的居民奶制品年消费支出,以居民户为抽样 单元,根据经济及收入水平将居民户划分为4层,每层 按简单随机抽样抽取10户,调查获得如下数据(单位: 元),要估计该地区居民奶制品年消费总支出及其 95%的置信区间。
Wh
Nh N 第 h 层的
层权
fh
nh Nh
第 h 层的
抽样比
Yh
1 Nh
Nh
Yhi
i 1
第 h 层的
总体均值
yh
1 nh
nh i1 yhi
第 h 层的
样本均值
6
记号
Yh
yh
S
2 h
s h2
公式
Nh
Yhi NhYh
i 1
代表的含 义
第 h 层的
9.1.2分层随机抽样课件(人教版)
问题1 树人中学高一年级共有712名学生,男生有326名,女生有386名, 若要抽取50名学生的身高作为样本,用简单随机抽样可以吗?为什么? 如何去抽取比较合理?
影响身高因素有很多,性别是其中的一个主要因素.高中男生的身 高普遍高于女生的身高,而相同性别的身高差异相对较小.
可以将男生和女生看作两个群体,分别进行简单随机抽样,然后汇总作 为总体的一个样本,由于在男生和女生两个群体中都抽取了相应的个体, 这样就能有效地避免“ ”样本.
解 初中部人数为 60×1855000=34, 高中部人数为 60×1655000=26,
学校平均视力为6304×1.0+2660×0.8≈0.91,
所以在初中部、高中部各抽34,26人,学校平均视力约为0.91.
反思感悟 求总体平均数的方法有
M (1)M+N
X
+M+N N
Y
;
(2)MM+N x +M+N N y ;
2.最常用的简单随机抽样
抽签法 随机数法(随机实验、信息技术)
3.总体均值与样本均值
Y
Y1 Y2 YN N
1 N
N
Yi
i1
y
y1 y2 n
yn
1 n
n i1
yi
导语
抽样调查最核心的问题是样本的代表性.简单随机抽样是使总体 中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能 会出现比较“极端”的样本.例如,在对树人中学高一年级学生身高 的调查中,可能出现样本中50个个体大部分来自高个子或矮个子的情 形.这种“极端”样本的平均数会大幅度地偏离总体平均数,从而使 得估计出现较大的误差.能否利用总体中的一些额外信息对抽样方法 进行改进呢?
选择抽样方法的规律: (1)当总体的个体数和样本量都较小时,可采用抽签法. (2)当总体的个体数较大,样本量较小时,可采用随机数法. (3)当总体按一个或多个变量可划分为若干个层时,采用分层随机抽样.
9.1.2分层随机抽样课件高一下学期数学人教A版
问题三:为什么会出现这种“极端样本”? 抽样结果的随机性个体差异较大
问题四:如何避免这种“极端样本”?
分组抽样,减少组内差距
背景:在高一年级的712名学生中, 男生有326名、女生有 386 名,抽取50人
思考:样本量在男生、女生中应如何分配?
男生样本量=
×总样本量
女生样本量=
×总样本量
人数多的群体应多抽一些,人数少的群体应少抽一些
在比例分配的分层随机抽样中,
对应成比例
我们可以直接用样本平均数 估计总体平均数 .
练习册P106
例3 某校有初中、高中两个部门,其中初中有学生850人,高中有学生650 人,小军想要进行一个视力调查,对学校按部门进行按比例分配分层随机抽 样,得到初中生、高中生平均视力分别为1.0,0.8,其中样本量为60,则在 初中部、高中部各抽取多少人?整个学校平均视力是多少?
D.105
课堂小结 分层随机抽样适用于:总体由差异明显的几个部分组成的情况。 分层随机抽样的步骤:
分层随机抽样中如何用样本估计总体平均值
可以直接用样本平均数 估计总体平均值
课后作业
1、课时作业P235:第1-9、11-15题 2、预习:教材书P185-187《9.1.3获取数据的途径》
9.1.2分层随机抽样
学习目标
1、理解分层随机抽样的概念; 2、掌握用分层随机抽样从总体中抽取样本的方法; 3、掌握两种抽样的区别与联系。
复习回顾
简单随机抽样
放回简单随机抽样 不放回简单随机抽样
简单随机抽样的特点
①总体个数有限 ②逐个进行抽取 ③机会均等抽样
简单随机抽样的常用方法 ①抽签法 ②随机数表法
方法总结
使用分层随机抽样的前提
分层随机抽样概论(PPT 50张)
2019/2/15
例题
例如,对全国范围汽车运输的抽样调查,调查目的不 仅要推算全国货运汽车完成的运量,还要推算不同经 济成分(国有、集体、个体)汽车完成的运量。 为组织的方便,首先将货运汽车总体按省分层,由 各省运输管理部门负责省内的调查工作。 各省再将省内拥有的汽车按经济成分分层。 为提高抽样效率,再对汽车按吨位分层。 例如,某高校对学生在宿舍使用电脑的情况进行调查, 根据经验,本科生和研究生拥有电脑的状况差异较大。 因此,在抽样前对学生按本科生和研究生进行分层 是有必要的。
st
W 2 VY VY h h s t
h 1
L
只要对各层估计无偏,则总体估计也无偏。
各层可以采用不同的抽样方法,只要相应的估计量 是无偏的,则对总体的推算也是无偏的。
8
2019/2/15
证明性质1
由于对每一层有 L L ˆ ˆ ˆ E Y E W Y W E Y st hh h h 因此, h 1 1 h L L L 1 1 Y W Y N Y Y Y h h h h h N N N h 1 h 1 h 1 估计量的方差 L L L L ˆ ˆ ˆ ˆ 2ˆ V Y V W Y W V Y 2 W W Cov Y , Y st h h h h h k hk h 1 h 1 h 1 k h 由于各层是独立抽取的,因此上式第二项中的协方差全 L 为0,从而有
二、分层原则:
总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个 层或不属于任何一个层。
1.估计:层内单元具有相同性质,通常按调查对 象的不同类型进行划分。 2.精度:尽可能使层内单元的指标值相近,层间 单元的差异尽可能大,从而达到提高抽样估计精 度的目的。 3.估计和精度:既按类型、又按层内单元指标值 相近的原则进行多重分层,同时达到实现估计类 值以及提高估计精度的目的。 4.实施:抽样组织实施的方便,通常按行政管理 机构设置进行分层。
抽样技术第三章_分层随机抽样
4
4
4
ˆ v Y ˆ 23208 s Y
ˆ 209650 2 23208 ˆ ts Y Y
2015/11/6
23
三、对总体比例的估计
总体比例P的估计为:pst Wh ph
h 1
L
估计量的性质
对于一般的分层抽样,如果 ph是 P h 的无偏估计 (h 1,2,, L ),则 pst 是 P的无偏估计。 p 的方差为:
W 2V Y V Y h h st
h1
L
只要对各层估计无偏,则总体估计也无偏。
各层可以采用不同的抽样方法,只要相应的估计量是无 偏的,则对总体的推算也是无偏的。
11
2015/11/6
证明性质1
由于对每一层有
ˆ Y EY h h
L L ˆ ˆ ˆ E Y E W Y W E Y st h h h h 因此, h1 h1
L
L
N Y hh
h 1
L
分层随机样本,总体均值 Y 的简单估计
1 y st Wh y h N h 1
N
h 1
L
h
yh
10
2015/11/6
估计量的性质
是 Yh 的无 性质1&2:对于一般的分层抽样,如果 Y h 偏估计( h 1,2, , L ),则 Y 是Y 的无偏估计。 st Yst 的方差为:
7
三、符号
所有总体参数的估计量都采用下标“st”以示区别:
记 号 代表的含义
h
下标
i
分层抽样-PPT
③按照学校分类:重点、非重点两个层次。
7
为了了解高一年级12000名学生的数学成绩,需要抽 取容量为120的样本,请用合适的方法抽取.
解:(1)对全体学生的数学成绩进行编号:1,2,3……,12000.
(2)分段:由于样本容量与总体容量的 比是1:100,我们 将总体平均分为100个部分,其中每一部分包含100个 个体.
数学必修3
分层抽样
1
数理统计是研究如何有效地收集,整理,分 析受随机影响的数据,并对所考虑的问题作出推断 或预测,直至为采取决策和行动提供依据和建议的 一门学科。它是一门应用性很强的学科,凡是有大 量数据出现的地方,都要用到数理统计。现在,数 理统计的内容已异常丰富,成为数学中最活跃的学 科之一。教科书选择了数理统计中最基本问题来介 绍这门学科的思想与方法。
由于分层抽样的要求不同,各层的抽样的样本容量也不相同, 所以,应当按照实际情况,合理地将样本容量分配到各个层, 以确保抽样的合理性,研究时可以根据不同的要求来分层抽样。
分层抽样适用于总体由差异明显的几部分组成的情况, 每一部分称为层,在每一层中实行简单随机抽样。这种方法较 充分地利用了总体己有信息,是一种实用、操作性强的方法。
(4)按照规则抽取样本:l;l+k;l+2k;……l+nk
系统抽样时,将总体中的个体均分后的每一段进 行抽样时,采用简单随机抽样;系统抽样每次抽样时, 总体中各个个体被抽取的概率也是相等的;如总体的个体 数不能被样本容量整除时,可以先用简单随机抽样从总 体中剔除几个个体,然后再按系统抽样进行。需要说明 的是整个抽样过程中每个个体被抽到的概率仍然相等。11
数理统计所要解决的问题是如何根据样本来推 断总体,第一个问题就是采集样本,然后才能作统 计推断。
第三章 分层随机抽样
NL ,则有:
2014-12-12
2
定义 4.2 分层抽样(stratified sampling) :又称为类型 抽样或分类抽样。即抽样在每一层中独立进行,总的样 本由各层样本组成, 总体参数则根据各层样本参数的汇 总做出估计,这种抽样就称为分层抽样,所得样本称为 分层样本。设总的样本量为 n ,从 L 个子总体中所抽取的 样本量分别为 n1 , n2 , nL ,则有: n1 n2
W 2V Y V Y h h st
h1
L
只要对各层估计无偏,则总体估计也无偏。
各层可以采用不同的抽样方法,只要相应的估计量是无 偏的,则对总体的推算也是无偏的。
11
2014-12-12
证明性质1
由于对每一层有
ˆ Y EY h h
L L ˆ ˆ ˆ E Y E W Y W E Y st h h h h 因此, h1 h1
L
如果得到的是分层随机样本,则总体总 量的简单估计为:
h 1
Ny Y st
2014-12-12 17
2.估计量的性质
性质1:对于一般的分层抽样,如果 ˆ 是 Y 的无偏估 Yst 是 Y 的无偏估计,则 Y ˆ 的方差为: 计。Y
2 ˆ ˆ ˆ V Y N V Yst V Y h
L
1 L 1 L Y WhYh N hYh Yh Y N h1 N h1 N h 1 估计量的方差 L L L L 2 ˆ ˆ ˆ ˆ ,Y ˆ V Yst V WhYh Wh V Yh 2WhWk Cov Y h k h 1 k h h1 h1 由于各层是独立抽取的,因此上式第二项中的协方差全 L ˆ W 2V Y ˆ 为0,从而有 V Y
ch3--分层随机抽样
sh2
1 nh 1
nh i 1
yhi yh 2
3.2分层抽样旳简朴估计量及其性质
总体均值:
L
Yst Wh Yh
h1
L
对总体均值旳估计: Yst Wh Yh h 1
^
分层随机抽样,则Y h 的简单且无偏的估计为yh
^
1.对于分层随机抽样,Y的无偏简单估计Y st 为:
^
L
^
L
1L
2 4705 50 147 62 87 84 158 170 104 56 160 3 2558 228 262 110 230 139 178 334 0 63 220 4 14997 17 34 25 34 36 0 25 7 15 31
请估计该地域养牛总头数及其估计量旳95%旳置信区间 。
留做作业,代入公式计算,并用软件验证
v( yst )
L
Wh 2
h 1
1
f nh
h
sh
2
且为V(y)的无偏估计。
Yst的置信度为1 的置信区间近似为:
yst u v( yst ), yst u v( yst )
2
2
2.总体总和Y的估计:
L
Y NYst Yh , h 1
L
^
L
^
L
L
Yˆst NYst N Wh Y h Nh Y h Nh yh Yh
h 1
h 1
L
p
的方差
st
V(p
st)
Wh 2 V(p h)
h1
v(
ph
)
1 fh nh 1
ph
qh
pst的方差V ( pst )的估计:
第四章分层随机抽样
第四章分层随机抽样第一节分层随机抽样概述分层抽样也叫做类型抽样,它是实际工作中最常用的抽样技术之一。
分层抽样是在抽样之前,先将总体按一定标志划分为若干个层(组),后在各层内分别独立地进行抽样。
由此所抽得的样本称之为分层样本。
各层所抽的样本也是互相独立的。
如果每层中的抽样都是简单随机的,则这种抽样就叫做分层随机抽样。
由此所得到的样本称做分层随机样本。
从以上概念可以看出,分层抽样的实质是在各层间作全面调查,而在各层内作抽样调查。
因此,分层抽样的误差只与各层内的差异有关,而同各层间的差异无关。
所以,为了能有效地降低抽样误差,提高抽样效果,在分层时应遵循“尽可能使层内差异小,而使层间差异大”的原则,同时要使分层的结果既无重复又无遗漏。
进行分层抽样时应注意:①层内抽样设计的选择;②分层变量的选择;③各层样本量的分配;④层数;⑤层的分界。
以前只重视③,近年来,④和⑤引起了越来越多的关注。
同简单随机抽样相比,分层抽样具有以下特点:①分层抽样能够充分地利用关于总体的各种已知信息进行分层,因此抽样的效果一般比简单随机抽样要好。
但当对总体缺乏较多的了解时,则无法分层或不能保证分层的效果。
②在分层抽样中,总体的方差一般可以分解为层间方差和层内方差两部分。
由于分层抽样的误差只与层内差异有关,而与层间差异无关,因此,分层抽样可以提高估计量的精度。
③由于分层抽样是在每层内独立地进行抽样,因此,使得分层样本能够比简单随机样本更加均匀地分布于总体之内,所以其代表性也更好些。
④分层抽样的随机性具体体现在层内各单元的抽取过程之中,也即在各层内部的每一个单元都有相同的机会被抽中,而在层与层之间则是相互独立的。
⑤分层抽样适合于调查标志在各单元的数量分布差异较大的总体。
因为对这样的总体进行合理的分层后可将其差异较多地转化为层间差异,从而使层内差异大大减弱。
⑥分层抽样中除了可以推断总体参数外,还可以推断各不同层的数量特征,并进一步作对比分析,从而满足不同方面的需要,也能帮助人们对总体作更全面、更深入的了解。
分层抽样 完整版课件PPT
知识探究(一):分层抽样的操作步骤
某单位有职工500人,其中35岁以下的 有125人,35岁~49岁的有280人,50岁 以上的有95人.为了调查职工的身体状 况,要从中抽取一个容量为100的样本.
思考1:该项调查应采用哪种抽样方法 进行?
思考2:按比例,三个年龄层次的职 工分别抽取多少人? 35岁以下25人,35岁~49岁56人, 50岁以上19人.
思考1:从5件产品中任意抽取一件,则 每一件产品被抽到的概率是多少?一般
地,从N个个体中任意抽取一个,则每一
个个体被抽到的概率是多少?
思考2:从6件产品中随机抽取一个容量 为3的样本,可以分三次进行,每次从中 随机抽取一件,抽取的产品不放回,这 叫做逐个不放回抽取.在这个抽样中,某 一件产品被抽到的概率是多少?
用简单随机抽样 抽取起始号码
总体中的个 体数较多
分层 抽样
将总体分成几层 ,按比例分层抽 取
用简单随机抽 样或系统抽样 对各层抽样
总体由差异 明显的几部 分组成
理论迁移
例1 某公司共有1000名员工,下设 若干部门,现用分层抽样法,从全体员 工中抽取一个容量为80的样本,已知策 划部被抽取4个员工,求策划部的员工人 数是多少?
思考3:在各年龄段具体如何抽样?怎 样获得所需样本?
思考4:一般地,分层抽样的操作步骤 如何? 分成互不交叉的层,按 比例确定各层要抽取的个体数.
第三步,用简单随机抽样或系统抽样在 各层中抽取相应数量的个体.
第四步,将各层抽取的个体合在一起 ,就得到所取样本.
第四步,按照一定的规则抽取样本.
2.设计科学、合理的抽样方法,其 核心问题是保证抽样公平,并且样本具 有好的代表性.如果要调查我校高一学 生的平均身高,由于男生一般比女生高 ,故用简单随机抽样或系统抽样,都可 能使样本不具有好的代表性.对于此类 抽样问题,我们需要一个更好的抽样方 法来解决.
04 第四章 分层随机抽样
第四章分层随机抽样第一节分层随机抽样概述分层抽样也叫做类型抽样,它是实际工作中最常用的抽样技术之一。
分层抽样是在抽样之前,先将总体按一定标志划分为若干个层(组),后在各层内分别独立地进行抽样。
由此所抽得的样本称之为分层样本。
各层所抽的样本也是互相独立的。
如果每层中的抽样都是简单随机的,则这种抽样就叫做分层随机抽样。
由此所得到的样本称做分层随机样本。
从以上概念可以看出,分层抽样的实质是在各层间作全面调查,而在各层内作抽样调查。
因此,分层抽样的误差只与各层内的差异有关,而同各层间的差异无关。
所以,为了能有效地降低抽样误差,提高抽样效果,在分层时应遵循“尽可能使层内差异小,而使层间差异大”的原则,同时要使分层的结果既无重复又无遗漏。
进行分层抽样时应注意:①层内抽样设计的选择;②分层变量的选择;③各层样本量的分配;④层数;⑤层的分界。
以前只重视③,近年来,④和⑤引起了越来越多的关注。
同简单随机抽样相比,分层抽样具有以下特点:①分层抽样能够充分地利用关于总体的各种已知信息进行分层,因此抽样的效果一般比简单随机抽样要好。
但当对总体缺乏较多的了解时,则无法分层或不能保证分层的效果。
②在分层抽样中,总体的方差一般可以分解为层间方差和层内方差两部分。
由于分层抽样的误差只与层内差异有关,而与层间差异无关,因此,分层抽样可以提高估计量的精度。
③由于分层抽样是在每层内独立地进行抽样,因此,使得分层样本能够比简单随机样本更加均匀地分布于总体之内,所以其代表性也更好些。
④分层抽样的随机性具体体现在层内各单元的抽取过程之中,也即在各层内部的每一个单元都有相同的机会被抽中,而在层与层之间则是相互独立的。
⑤分层抽样适合于调查标志在各单元的数量分布差异较大的总体。
因为对这样的总体进行合理的分层后可将其差异较多地转化为层间差异,从而使层内差异大大减弱。
⑥分层抽样中除了可以推断总体参数外,还可以推断各不同层的数量特征,并进一步作对比分析,从而满足不同方面的需要,也能帮助人们对总体作更全面、更深入的了解。
分层随机抽样 PPT
[例 1] 一个单位共有职工 200 人,其中不超过 45 岁的有 120 人,超过 45 岁的有 80 人.为了调查职工的健康状况,用分层抽 样的方法从全体职工中抽取一个容量为 25 的样本,应抽取超过 45 岁的职工________人.
[思路点拨] 由分层抽样的概念,按比例抽取.
[解析] 抽样比为 25∶200=1∶8,而超过 45 岁的职工有 80 人,则从中应抽取的个体数为 80×18=10.
的层,然后按照所占比例,从各层独立地抽取 一定数量的个体,将各层取出的个体合在一起
作为样本,这种抽样的方法叫分层抽样。
【说明】分层抽样应遵循以下要求: (1)分层:将相似的个体归为一类,即分为一层,分
层要求每层的各个个体互不交叉,即遵循不重复、不遗 漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在 各层中进行简单随机抽样或系统抽样,每层样本数量与 每层个体数量的比与样本容量与总体容量的 比相等。
[练习 1] 某工厂生产 A,B,C 三种不同型号的产品,产品 数量之比依次为 2∶3∶5,现用分层抽样方法抽出一个容量为 n 的样本,样本中 A 种型号产品有 16 件,那么此样本的容量 n= ______.
答案:80 解析:因为 A 种产品在总体中占了2+23+5=15, 又因为每个个体被抽到的可能性都相等,故样本容量为 16÷15= 80.
思考:(4)三个年级同学有较大差别,应如何提 高样本的代表性? 应考虑他们在样本中所占的比例。
(5)如何确定各年级所要抽取的人数? 计算每一部分占总体个体数的比例,
在各年级中按比例分配样本,得各年级所
要抽取的个体数。
某校小学六年级、初中三年级和高中三年级分别
有1000,800和700名同学,为了了解全校毕业班学生 的视力情况,从以上三个年级中抽取容量为100的样本, 你认为应当怎样抽取样本较为合理?
第九章 9.1.2 分层随机抽样 课件
1
2
3
4
5
6
7
8
9
10
男生样本的平均数 170.0
170.7
169.8
171.7
172.7
171.9
161.6
170.6
172.6
170.9
女生样本的平均数 162.2
160.3
159.7
158.1
161.1
158.4
159.7
160.0
160.6
160.2
总体样本的平均数 165.8
165.1
抽样比k=
样本量
总体个数
定数
按抽样比确定每层抽取的个体数
抽样
各层分别按简单随机抽样的方法抽取样本
成样
综合各层抽样,组成样本
知新探究
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和
N,抽取的样本量分别为m和n.我们用X1,X2,…,XM表示第1层各个体的变量值,用
x1,x2,…,xm表示第1层样本的各个体的变量值;用Y1,Y2,…,YN表示第2层各个体的变
2.分层抽样是等可能抽样,用分层抽样从个体数为N的总体中抽取一个容量为n的样
本时,在整个抽样过程中,每个个体被抽到的可能性相等,都等于 .
3.分层抽样是建立在简单随机抽样的基础之上的,由于它充分利用了已知信息,因
此利用它获取的样本更具有代表性,更能充分反映总体的情况,在实践中的应用也
更广泛.
知新探究
154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0
172.0 162.5 158.0 155.5 157.0 163.0 172.0
分层随机抽样概论
因此,在抽样前对学生按本科生和研究生进行分层 是有必要的。
2020/11/29
5
三、符号说明 (关于第h层的记号 )
层号
h 1,2,, L
1 Nh
Yh N h i1 yhi
S
2 h
1 Nh 1
4
例题
例如,对全国范围汽车运输的抽样调查,调查目的不 仅要推算全国货运汽车完成的运量,还要推算不同经 济成分(国有、集体、个体)汽车完成的运量。
为组织的方便,首先将货运汽车总体按省分层,由 各省运输管理部门负责省内的调查工作。
各省再将省内拥有的汽车按经济成分分层。
为提高抽样效率,再对汽车按吨位分层。
Nh i1
2
yhi Yh
2020/11/29
单元总数
Nh
样本单元数
nh
第 i个单元的值
yhi
层权 抽样比 总体均值
Wh
Nh N
fh
h
1 nh
nh
y hi
i1
样本方差
sh2
1 nh 1
nh i1
yhi yh 2
6
第二节 估 计 量
一、对总体均值的估计
分层样本,总体均值 Y 的估计
1 fh nh
sh2
2020/11/29
13
二、对总体总量的估计
总体总量 Y 的估计为:
Yˆ NYˆst L Yˆh h1
如果得到的是分层随机样本,则总体总 量的简单估计为:
Y Nyst
2020/11/29
14
2.估计量的性质
性质4:对于一般的分层抽样,如果
第四章分层抽样精选精品PPT
y prop 的 方 差 为
V ( y prop )
L
W h2V ( y h )
h 1
L
Wh
h 1
nh n
1 fh nh
S
2 h
1 f n
L
W
h
S
2 h
h 1
p
的
prop
方
差
为
1 f
V ( p prop ) N n
L
N
2 h
Ph
Q
h
h1 N h 1
1 f n
L
W h Ph Q h
(1)用简单随机抽样的公式估计登记原始凭证的差错率,并估计抽样标准误 2某学院4个专业的新生举行元旦晚会,组织者为了活跃气氛,欲在200名学生中抽出10名作为幸运星,为了以示公平,要求每位学生
• 总体总值Y的估计量为 被抽中的概率相同,组织者知道利用简单随机抽样的方法可以满足要求,你能否帮助组织者再设计几种方案?
样本量、总体大小、总体方差
按各层单位数占总体单位数的比例,即按各层的层权进行分配。
2某学院4个专业的新生举行元旦晚会,组织者为了活跃气氛,欲在200名学生中抽出10名作为幸运星,为了以示公平,要求每位学生
被抽中的概率相同,组织者知道利用简单随机抽样的方法可以满足要求,你能否帮助组织者再设计几种方案? L 尽可能使层内单位的标志值相近,层间单位的差异尽可能大,从而达到提高抽样估计精度的目的。
根
据
前
面
对
各
层
层
权
W
h
及
抽
样
比
f
的
h
计
算
结
果
,
数学人教A版必修第二册9.1.2分层随机抽样课件
层随机抽样的方法,得到男生、女生的平均身高分别为170.2cm和160.8 cm.
(1)如果张华在各层中按比例分配样本,总样本量为100,那么在男生、女
生中分别抽取了多少名?在这种情况下,请估计高二年级全体学生的平均身
高.
(2)如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况
下,ቤተ መጻሕፍቲ ባይዱ何估计高二年级全体学生的平均身高更合理?
随机抽样方法抽取容量为100的样本,则A,B,C三层的样本的平均数分别
为15,30,20.
(1)求样本的平均数;
解析:(1)样本平均数
ഥ=
(2)总体平均数约为20.5.
(2)估计总体平均数.
5
5+3+2
× 15 +
3
5+3+2
× 30 +
2
5+3+2
× 20 = 20.5.
小试牛刀
教材P184
1、高二年级有男生490人,女生510人,张华按男、女生进行分层,通过分
与层的大小成比例,那么称这种样本量的分
配方式为比例分配.
新知探究
分层随机抽样的步骤:
分层
计算
抽样比
定数
抽样
汇总
按某种特征将总体分成若干部分(层)
抽样比=
样本容量
总体容量
样本容量
按抽样比确定每层抽取的个体数=每层数量×
总体容量
各层分别按简单随机抽样的方法抽取样本
综合各层抽样,组成样本
小试牛刀
练 习 : 某中学有老年教师20人,中年教师65人,青年教师95人,为了调查
小试牛刀
100
解:(1)男生应抽取
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
估计为:
L
1L
yst Whyh
h1
Nh1Nhyh
(二)估计量的性质
性质1 对于一般的分层随机抽样,如果 Yˆh 是 Y h
的无偏估计(h=1,2,…L),则 Yˆst 是Y 的无偏估计。
即对各层估计是无偏的,则对总体的估计也是无
偏的。
Yˆst 的方差为:
VYˆst L Wh2VYˆh
L
合起来就是整个总体(N=
N h )。
h 1
然后,在每个层中分别独立进行抽样,这种抽样就是分层抽样,
所得到的样本称为分层样本。如果每层都是简单随机抽样,则 称为分层随机抽样,所得到的样本称为分层随机样本。
2021/2/27
3
各层中的抽样是独立进行的,因此,在各 层中所采取的抽样手段完全可以不相同, 在一个层进行简单随机抽样,在另一层则 可采用更复杂一些的抽样,完全视各层的 情况不同而定,这种因地制宜的手段将使 样本尽可能反映总体的特性以及子总体的 特性。 分层抽样有时也称为类型抽样或分类抽样。
从该层中抽取的样本的单元值为: yh(ii1,2,..n .h,)
层权:
Wh
Nh N
抽样比: f h
nh Nh
总体均值:Yh
1 Nh
Nh
Yhi
i1
2021/2/27
样本均值:yh
1 nh
nh i1
yhi
10
▪
层内方差:
Sh2
1 Nh
2
Nh1i1(YhiYh)
▪ 样本方差: sh2 nh11inh1(yhiyh)2
2021/2/27
4
分层随机抽样三原则: (1)每层都抽样; (2)各层都独立地抽样; (3)各层的抽样都是简单随机抽样。
2021/2/27
5
(二)特点:
1.分层抽样的抽样效率较高,也就是说分层 抽样的估计精度较高。
注意:
分层抽样估计量的方差只和层内方差有关, 和层间方差无关。
2.分层抽样不仅能对总体指标进行推算, 而且能对各层指标进行推算。
分层随机抽样概述(PPT 148页)
▪ 简单随机抽样只适合小型的抽样调查: 1. 抽样框 2. 代表性 如:了解中国各民族的情况:(鄂伦春族)
2021/2/27
2
第一节 概述
Байду номын сангаас
一.定义与作用 (一)分层抽样和分层随机抽样
不重 不漏
先将总体N个单元划分成L个互不重复的子总体,每个子
总体称为层,它们的大小分为别 N1,N2,..N .L,这L个层
也适用于正态近似其置信区间。
2021/2/27
17
二.总体总量的估计
(一)简单估计量的定义
总体总量Y的估计为: Yˆ NYˆst L Yˆh h1
分层随机样本: Yˆ Nyst
(二)估计量的性质
性质4 对于一般的分层抽样,如果Yˆst 是 Y 偏估计,则Yˆ
是Y的无偏估计。
Yˆ 的方差为:
2021/2/27
11
第二节 简单估计量及其性质
一.总体均值的估计
(一)简单估计量的定义
对于分层样本,对总体均值Y 的估计是通过对
各层的Y h 公式为:
的估计,按层权 W h 加权平均得到的。
YˆstL WhYˆh h1
N 1hL 1NhYˆh
2021/2/27
12
如果得到的是分层随机样本,则总体均值 Y 的简单
行划分,这时,分层抽样能够对每一类的目标量进行估 计。 2.尽可能使层内单元的标志值相近,层间单元的差异尽可 能大,从而达到提高抽样估计精度的目的。 3.既按类型又按层内单元标志值相近的原则进行多重分 层,同时达到实现估计类值以及提高估计精度的目的。 4.为了抽样组织实施的方便,通常按行政管理机构设置进 行分层。
h1
由于各层的抽样
2021/2/27
是相互独立的
13
证明:因各层抽样是相互独立,则Yˆh 也相互独立,
则有 covYˆh,Y ˆj 0
VYˆst
VhL1WhY ˆhhL 1Wh2VY ˆh
L
2
L WhWjcoY vˆh,Y ˆj
h1 jh
L Wh2VYˆh h1
2021/2/27
性质6 对于分层随机抽样, V (Yˆ ) 的一个无偏估计为:
v(Y ˆ)hL 1N h2v(yh)hL 1N h21 nhfhsh2
2021/2/27
20
P69
【例3.1】调查某地区的居民奶制品年 消费支出,以居民户为抽样单元,根据经 济及收入水平将居民户划分为4层,每层 按简单随机抽样抽取10户,调查获得如 下数据(单位:元),估计该地区居民奶
2021/2/27
18
V (Yˆ ) V
N Y st
N 2V (Yˆst )
L
V (Yˆh )
N2LW h2V(Yˆh)L
h 1
Nh2V(Yˆh)
h1
h1
2021/2/27
19
性质5 对于分层随机抽样,Yˆ 的方差为:
V (Y ˆ)hL 1N h2 V (Y ˆh)hL 1N h21 nhfhSh2
14
性质2 对于分层随机抽样 , y st 是 Y y st 的方差为:
的无偏估计,
V ( yst )
L
Wh2V ( yh )
h1
L
Wh 2
h1
1 fh nh
Sh2
L Wh2
h1
1 nh
1 Nh
Sh
2
L Wh2Sh2 L WhSh2
h1 nh
h1 N
2021/2/27
15
性质3 对于分层随机抽样, V ( yst ) 的一个无偏估 计为:
2021/2/27
8
如:对全国汽车货运量调查,目的是不仅要 了解全国货运量,而且推算不同经济成分 货运量。
首先为组织方便,按省分层;各省再按 经济成分分层;为提高抽样效率,再按吨位 分层。
2021/2/27
9
三.符号说明
层号:h(h=1,2…,L) 第h层的记号如下: 单元总数:N h 样本单位数:n h 第i个单元标志值为: Yh(ii1,2,..N .h ,)
L
v ( y st ) W h 2 v ( y h ) h 1
L h 1
W
2 h
1
fh nh
sh
2
L W h 2 s h 2 L W h s h 2
h1 n h
h1 N
2021/2/27
16
▪ 注:
当 Nh, nh与 Nhnh适当的大,各层样本
平均数 y h 均可适用正态近似,因此一般地 y st
如:消费物价指数(全国和各省) 3.层内抽样方法可以不同,而且便于抽样
工作的组织。
2021/2/27
6
(三)作用
可以对各层的参数进行估计, 有助于提
高估计精度。
2021/2/27
7
二.使用场合
应用条件: 适合于各层差异较大,有进行分层的辅助信息。
层的划分原则: 1.层内单元具有相同性质,通常按调查对象的不同类型进