分层抽样1
分层抽样
分层抽样
抽样技术作为现代统计学科体系的重要组成部分,被广泛运用到社会实践当 中。自从 1895 年挪威首任中央统计局局长凯尔在伯尔尼第五届国际统计学会会议 上提出所谓“代表性调查”的抽样方法以来,经过 100 多年的理论探讨和时间积 累,抽样理论更加科学,抽样技术日臻完善。抽样又称取样。其原理是从研究的 全部样品中抽取一部分样品单位。从被抽取样品单位的分析、研究结果来估计和 推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效 的工作和研究方法。基本的抽样技术包括简单随机抽样,系统抽样,分层抽样, 多阶段抽样等。在实际的抽样调查中我们常常会根据调查成本,调查规模等结合 运用各种抽样方法进行实践。
然后,在每个层中分别独立地进行抽样。
1-1、分层抽样的总体均值估计
在分层抽样中,对总体均值Y 的估计是通过对各层Yh 的估计,安权层Wh 加权
平均得到的,公式为
Yˆst l WhYˆh 1 l NhYˆh
h1
N h1
如果得到的是分层随机样本,则总体均值Y 的简单估计为
yˆst l Whyh 1 l Nhyh
3
Whsh 0.4920+1.2543+3.0744=4.8207
h1
因此按尼曼分配时,各层应分配的样本量为
n1 n
W1s1
3
Wh sh
40 0.4920 4.0824 4.8207
h1
故
n2 12.290
n3 23.8235
即各层的样本量分别为 4,12,24.
此时的样本估计量的方差为
3 WhSh
Vopt( yst) h1
ch
3
WhSh
n
h1
上课版 2.1.3分层抽样 (1) - 副本
系统抽样的步骤:(总体个数为N,样本容量为n)
①先将总体的N个个体编号
将对编号分成n(段)个部分,确定间隔k。
当 N N 是整数时,k= ;当 不是整数时,通过从总 n n 体中剔除一些个体使剩下的总体中个体的个数N, N 能被n整除,这时k= n ; ③在第一段用简单随机抽样确定起始的个体编号L; ④按照事先确定的规则抽取样本(通常是将L加上 间隔k,得到第2个编号L+k,第3个编号L+2k,这样 继续下去,直到获取整个样本)。
1.简单随机抽样:
设一个总体含有N个个体 ,从中逐个不放回地抽 取n个个体作为样本 (n≤N),如果每次抽取时总体内 的各个个体被抽到的机会都相等,这种抽样方法叫做 简单随机抽样。
抽签法(抓阄法) 随机数表法
2.系统抽样:
当总体中的个体数较多时,将总体分成均衡的几 个部分,然后按照预先定出的规则,从每一部分抽 取一个个体,得到所需要的样本,这种抽样叫做系 统抽样.系统抽样的步骤是怎样的?
(4)分段.取分段间隔 k=5,将总体均分成 50 段.每段含 5 名学生. (5)以第一段即 1~5 号中随机抽取一个号作为起始号,如 l. (6)从后面各段中依次取出 l+5,l+10,l+15,…, l+245 这 49 个号. 这样就抽取了一个样本容量为 50 的样本.
2.1.3 分层抽样
解:(1)确定样本容量与总体的个体数之比100:500=1:5
n (2)利用抽样比确定各年龄段应抽取的个体 抽样比= N 数,依次 即为25,56,19
(3)利用简单随机抽样或系统抽样的方法,从各年 龄段分别抽取25,56,19人 (4)将各层抽取个体放在一起,就是所抽取的样本
每层抽取个数=每层总数×抽样比
分层抽样统计知识点总结
分层抽样统计知识点总结一、引言统计学是研究数据收集、整理、分析和解释的学科,而分层抽样是统计学中非常重要的概念之一。
分层抽样是指在进行抽样调查时,按照总体中不同层次的特点将总体分成若干层,然后分层抽取每个层中的一部分个体作为样本的方法。
分层抽样方法可以更好地保证样本的代表性,提高统计的精确度和可靠性。
下面将对分层抽样的一些基本概念和相关知识进行总结和介绍。
二、分层抽样的基本概念1. 总体和样本在统计学中,总体是指研究对象的全体,样本是指从总体中抽取出来的一部分个体。
总体通常是不可能完全观测或测量的,因此需要通过抽样的方法获取样本,并通过对样本的研究来推断总体的特征和规律。
2. 分层抽样的定义分层抽样是指在进行抽样调查时,首先根据总体的某些特征将总体分成若干个层,然后在每个层中独立地进行简单随机抽样,最终得到的样本称为分层抽样。
分层抽样是一种多阶段抽样的特例,通过分层可以更好地保证抽样的代表性和随机性。
3. 分层抽样的优点分层抽样的优点主要包括:(1)提高统计的精确度。
由于每个层内部的差异较小,可以更准确地估计每个层的特征和总体的特征。
(2)更好地保证抽样的代表性。
通过分层可以保证每个层都有机会被抽到,从而代表了总体的各种特征。
(3)在调查实践中较为容易实施。
相对于其他复杂的抽样方法,分层抽样的实施相对简单,容易控制和管理。
4. 分层抽样的适用条件分层抽样适用于总体中有明显层次差异的情况,例如不同地区、不同行业、不同人群等,层内的差异较小,层间的差异较大。
当总体中的层次差异较大时,分层抽样可以更准确地估计总体的特征。
三、分层抽样的具体方法1. 分层的原则在进行分层抽样时,需要根据总体的特点确定分层的原则,主要包括以下几点:(1)层次划分合理。
根据调查的目的和需要,将总体划分成若干个层次,层次之间的差异足够大,层内的差异足够小。
(2)层次间的关联较小。
不同层次之间的相关性较小,层次之间的差异性较大。
抽样方法之分层抽样
• 提出问题1:• 某市来自大型、中型、小型的商店共1500 家,它们的家数之比为1:5:9.
• 要调查商店的每日零售额情况,要求抽 取其中的15家商店进行调查,应当采取 怎样的抽样方法?
1.分层抽样(类型抽样)
当总体由差异明显的几部分组成时,为 了使样本充分地反映总体的情况,常将总 体分成互不交叉的层,然后按照各层所占 的比例进行抽样,在每一层中实行简单随机抽样, 这种抽样方法叫分层抽样。分层抽样中分多少层,
要视具体情况而定。总的原则是:层内样本的差 异要小,而层与层之间的差异尽可能地大,否则 将失去分层的意义。
分层抽样的实施步骤: (1)总体与样本容量确定抽取的比例k= n 。 (2)由分层情况,确定各层抽取的样本N数。
(3)各层的抽取数之和应等于样本容量。 (4)对于不能取整的数,求其近似值。
思考
用 简单随机抽样方法先从总体中剔除 5 个个体,然后按编 号顺序每间隔__2_0__个号码抽取一个.
请归纳系统抽样方法的步骤:
1. 编号; 2 . 确定组距k; 3 .在第一组用简单随机抽样方法确定第一个编号x;
4 . 编号为 x 、 x+k、 x+2k、…… 、x +(n-1)k作为样
本.
例3 :某校小礼堂举行心理讲座,有500人参加听课, 坐满小礼堂,现从中选取25名同学了解有关情况,选 取怎样的抽样方式更为合适.
分析:这总体具有某些特征,它可以分成几个不同的部 分:不到35岁;35~49岁;50岁以上,把每一部分称为一个 层,因此该总体可以分为3个层。由于抽取的样本为100,所 以必须确定每一层的比例,在每一个层中实行简单随机抽样。
解:抽取人数与职工总数的比是100:500=1:5,则各 年龄段(层)的职工人数依次是125:280:95=25:56:19, 然后分别在各年龄段(层)运用简单随机抽样方法抽取。
2.1.3 分层抽样 课件1
学以致用
例.某校小学六年级、初中三年级和高中三年级分 别有1000,800和700名同学,为了了解全校毕业班学 生的视力情况,从以上三个年级中抽取容量为100的样 本,你认为应当怎样抽取样本较为合理?
解:
100 100 1 抽样比例K= 1000 800 700 2500 25
1 40(名) 六年级抽取的人数为 1000 25 1 初中三年级抽取的人数为 800 32 (名) 25 1 28(名) 高中三年级抽取的人数为 700 25
候选人 罗斯福 兰顿 预测结果 43 57 选举结果 62 38
知识探究(一):分层抽样的基本思想
某地区共有学生24 300人,其中高中生2 400人,初 中生10 900人,小学生11 000人.当地教育部门为了了解 本地区中小学生的近视率及其形成原因,要从本地区的中 小学生中抽取1%的学生进行调查.你认为应当怎样抽取样 本?
知识探究(一):分层抽样的基本思想
分别利用系统抽样在高中生中抽取 2 400×1%=24人, 在初中生中抽取10 900×1%=109人, 在小学生中抽取11 000×1%=110人. 这种抽样方法称为分层抽样.
想一想为什么这样取各个学段的个体数?
含有个体多的层,在样本中的代表也应该多,即 样本从该层中抽取的个体数也应该多.这样的样 本才有更好的代表性.
类 别 共同点 各自特点 从总体中逐个 抽取 (1)抽样过 程中每个个体 被抽到的可能 性相等 (2)每次抽 出个体后不再 将它放回,即 不放回抽样 联 系 适 用 范 围 总体个 数较少
简 单 随 机 抽 样
系 统 抽 样
将总体平均分 成几部分,按 在起始部 总体个 预先制定的规 分时采用简 数较多 则在各部分抽 随机抽样 取
第四章分层随机抽样
第四章分层随机抽样第一节分层随机抽样概述分层抽样也叫做类型抽样,它是实际工作中最常用的抽样技术之一。
分层抽样是在抽样之前,先将总体按一定标志划分为若干个层(组),后在各层内分别独立地进行抽样。
由此所抽得的样本称之为分层样本。
各层所抽的样本也是互相独立的。
如果每层中的抽样都是简单随机的,则这种抽样就叫做分层随机抽样。
由此所得到的样本称做分层随机样本。
从以上概念可以看出,分层抽样的实质是在各层间作全面调查,而在各层内作抽样调查。
因此,分层抽样的误差只与各层内的差异有关,而同各层间的差异无关。
所以,为了能有效地降低抽样误差,提高抽样效果,在分层时应遵循“尽可能使层内差异小,而使层间差异大”的原则,同时要使分层的结果既无重复又无遗漏。
进行分层抽样时应注意:①层内抽样设计的选择;②分层变量的选择;③各层样本量的分配;④层数;⑤层的分界。
以前只重视③,近年来,④和⑤引起了越来越多的关注。
同简单随机抽样相比,分层抽样具有以下特点:①分层抽样能够充分地利用关于总体的各种已知信息进行分层,因此抽样的效果一般比简单随机抽样要好。
但当对总体缺乏较多的了解时,则无法分层或不能保证分层的效果。
②在分层抽样中,总体的方差一般可以分解为层间方差和层内方差两部分。
由于分层抽样的误差只与层内差异有关,而与层间差异无关,因此,分层抽样可以提高估计量的精度。
③由于分层抽样是在每层内独立地进行抽样,因此,使得分层样本能够比简单随机样本更加均匀地分布于总体之内,所以其代表性也更好些。
④分层抽样的随机性具体体现在层内各单元的抽取过程之中,也即在各层内部的每一个单元都有相同的机会被抽中,而在层与层之间则是相互独立的。
⑤分层抽样适合于调查标志在各单元的数量分布差异较大的总体。
因为对这样的总体进行合理的分层后可将其差异较多地转化为层间差异,从而使层内差异大大减弱。
⑥分层抽样中除了可以推断总体参数外,还可以推断各不同层的数量特征,并进一步作对比分析,从而满足不同方面的需要,也能帮助人们对总体作更全面、更深入的了解。
分层抽样遵循的原则
分层抽样遵循的原则分层抽样是一种常用的抽样方法,其主要原则有以下几点:1.统一目标群体:分层抽样的前提是将总体划分为不同的层次,每个层次内部具有相似的特征。
在确定分层抽样的原则时,首先需要确立一个明确的目标群体,并将其划分为不同的层次。
2.确定合适的层次:分层抽样需要依据目标群体的特征和研究目标来确定合适的层次划分。
划分的层次应能充分反映总体的特征,并能够与研究目标相关联。
例如,在对一个城市的居民进行问卷调查时,可以将其划分为不同的层次,如年龄、性别、教育程度等。
3.合理确定每层的样本量:在分层抽样中,每个层次都需要确定相应的样本量。
样本量的确定应考虑到研究目标的要求、总体规模、层次特征等因素。
通常情况下,较小的层次可能需要较多的样本量,以保证统计结果的可靠性。
4.保证层次内的代表性:每个层次内的样本应该能够充分代表该层次的特征。
这就要求在每个层次内进行抽样时,要采用随机抽样的方法,确保样本的代表性。
随机抽样可以通过抽签、使用随机数表等方法实现。
5.确保跨层次的差异性:分层抽样的目的是充分利用总体内不同层次的差异性。
因此,在确定每个层次样本量时,应考虑到不同层次之间的差异。
例如,如果一些层次的样本量太小,可能无法反映整体样本的特征。
6.调整和控制抽样误差:在进行分层抽样时,可能会产生一些误差,如抽样误差、非抽样误差等。
为了减小抽样误差,可以采用多阶段抽样、分组抽样等方法进行调整和控制。
例如,可以在每层内进行分组抽样,然后再对不同层次的样本进行抽样,以增加样本的多样性。
总之,分层抽样的原则是在确定目标群体的基础上,根据总体特征划分合适的层次,并根据每个层次的特征确定相应的样本量。
同时,还需要保证样本的代表性、跨层次的差异性,以及控制抽样误差。
这样可以较好地反映总体的特征,提高研究的可靠性和有效性。
人教课标版《分层抽样》PPT精美版1
2.某单位有老年人27人,中年人55人, 青年人81人,为了调查他们的身体情况, 需从他们中抽取一个容量为36的样本, 则适合的抽取方法是( )
A.简单随机抽样 B.普查抽样 C.分层抽样 D.先从中年人中剔除1人,然后再分层抽样
4.对某单位1000名职工进行某项专门调查, 调查的项目与职工任职年限有关,人事部门提
搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得 到一个容量为n的样本。 抽签法抽样的一般步骤:
(1)将总体的个体编号。 (2)写号制签,把制好的签放在箱中摇匀; (3)连续抽签获取样本号码。 2、随机数表法
利用随机数表、随机数骰子或计算机产生的随机数
进行抽样,叫随机数表法,这里仅介绍随机数表法。
知识运用
1.某校有1000名学生,其中O型血的有 400人,A型血的人有250人,B型血的 有250人,AB型血的有100人,为了研 究血型与色弱的关系,要从中抽取一个 40人的样本,按分层抽样,O型血应抽 取的人数为___人,A型血应抽取的人数 为___人,B型血应抽取的人数为___人, AB型血应抽取的人数为___人。
样比k= n:N;
求比
步骤3:确定每一层应抽取的个体数目,使每一层 应抽取的个体数目之和为样本容量n;
定数
步骤4:按步骤3确定的数目在各层中随机抽取个 体,合在一起得到容量为n样本。
抽样
例4.广州某中学高一、高二、高三三个年级的学生数分别为 1500人, 1200人, 1000人,现采用按年级分层抽样的方法抽取 参加 2010全运会的宣传活动,已知在高一年级抽取了 75人, 则这次活动共抽取了多少人?
随机数表法抽样的步骤:
(1)将总体的个体编号。 (2)在随机数表中选择开始数字。 (3)读数获取样本号码。
分层抽样
分层抽样————————————————————————————————作者: ————————————————————————————————日期:ﻩ分层抽样抽样技术作为现代统计学科体系的重要组成部分,被广泛运用到社会实践当中。
自从1895年挪威首任中央统计局局长凯尔在伯尔尼第五届国际统计学会会议上提出所谓“代表性调查”的抽样方法以来,经过100多年的理论探讨和时间积累,抽样理论更加科学,抽样技术日臻完善。
抽样又称取样。
其原理是从研究的全部样品中抽取一部分样品单位。
从被抽取样品单位的分析、研究结果来估计和推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法。
基本的抽样技术包括简单随机抽样,系统抽样,分层抽样,多阶段抽样等。
在实际的抽样调查中我们常常会根据调查成本,调查规模等结合运用各种抽样方法进行实践。
分层抽样是通过对总体单位进行分类,即分成若干子总体,子总体之间比较相似,使每一个字总体的方差变小,这样只需要在子总体中抽取少量样本单位,就能很好地代表子总体的特征,从而提高对整个总体估计的精度。
分层抽样需要事先知道各层权重,但在现实情况下有些资料无法提前预知。
这时我们可以先从总体中抽取一个大的初始样本,从而获得有关的辅助信息,然后再从初始样本中抽取一个字样本,这种方法就是双重抽样。
其定义为,当简单性状与复杂性状存在关系时可用抽取简单性状来间接估计复杂性状的抽样方法。
结合分层抽样的双重抽样方法即为分层的双重抽样。
分层抽样,的主要特点就是可以提高估计精度,它不但能对总体进行估计。
同时可以对各层子总体进行估计。
如此便于实际中抽样的组织和实施。
下面我们就分层抽样方法展开讨论,运用实例分析进行比较。
一、分层抽样的原理简介在抽样之前,先将总体N 个单位划分成L个互不重复的子总体,每个子总体成为层,他们的大小分别为L N N N N ...,,,321,这L 层构成整个总体(1lh N Nh ==∑)。
2.1.3分层抽样
2.1.3分层抽样考点学习目标核心素养分层抽样的概念理解分层抽样的概念数学抽象分层抽样的使用条件和操作步骤掌握分层抽样的使用条件和操作步骤,会用分层抽样法进行抽样逻辑推理、数学运算问题导学(1)什么叫分层抽样?(2)分层抽样适用于什么情况?(3)分层抽样时,每个个体被抽到的机会是相等的吗?1.分层抽样的概念一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的特点(1)适用于总体由差异明显的几部分组成的情况.(2)更充分地反映了总体的情况,使样本具有较强的代表性.(3)等可能抽样,每个个体被抽到的可能性都是n N.3.分层抽样中分层原则(1)层内样本的差异要小,各层之间样本的差异要大.(2)分层后总体中的每个个体互不重叠,也不遗漏.4.抽样比(1)分层抽样也称“按比例抽样”,这里的“按比例”是指:①样本中第n层的个体数总体中第n层的个体数=样本容量总体容量;②总体中第m层的个体数总体中第n层的个体数=样本中第m层的个体数样本中第n层的个体数.(2)分层抽样中,每个个体被抽到的可能性是相等的,与层数、分层情况无关.■名师点拨如果总体的个数为N,样本容量为n,N i为第i层的个体数,则第i层抽取的个体数n i=n ·N i N ,每个个体被抽到的可能性是n i N i =1N i ·n ·N i N =n N.判断正误(对的打“√”,错的打“×”)(1)系统抽样时,将总体分成均等的几部分,每部分抽取一个,符合分层抽样,故系统抽样就是一种特殊的分层抽样.( )(2)在分层抽样时,每层可以不等可能抽样.( )(3)在分层抽样的过程中,每个个体被抽到的可能性是相同的,与层数及分层有关.( ) 解析:(1)因为分层抽样是从各层独立地抽取个体,而系统抽样各段上抽取时是按事先定好的规则进行的,各层编号有联系,不是独立的,故系统抽样不同于分层抽样.(2)分层抽样时,每层仍然要等可能抽样. (3)与层数及分层无关. 答案:(1)× (2)× (3)×(2020·江西省临川第一中学期末考试)为创建文明城市,共建美好家园,某市教育局拟从3 000名小学生,2 500名初中生和1 500名高中生中抽取700人参与“城市文明知识”问卷调查活动,应采用的最佳抽样方法是( )A .简单随机抽样法B .分层抽样法C .系统抽样法D .简单随机抽样法或系统抽样法解析:选B.根据题意,所有学生明显分成互不交叉的三层,即小学生,初中生,高中生,故采用分层抽样法.故选B.分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等可能抽样,必须进行( )A .每层等可能抽样B .每层可以不等可能抽样C .所有层按同一抽样比等可能抽样D .所有层抽取个体数量相同解析:选C.保证每个个体等可能的被抽取是三种基本抽样方式的共同特征,为了保证这一点,分层抽样时必须在所有层都按同一抽样比等可能抽样.一个班共有54人,其中男同学、女同学之比为5∶4,若抽取9人参加教改调查会,则每个男同学被抽取的可能性为________,每个女同学被抽取的可能性为________.解析:男、女每人被抽取的可能性是相同的,因为男同学共有54×59=30(人),女同学共有54×49=24(人),所以每个男同学被抽取的可能性为530=16,每个女同学被抽取的可能性为424=16.答案:16 16分层抽样的判断某社区有500户家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户.为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本,记作①;某学校高一年级有18名女排运动员,要从中选出4人调查学习负担情况,记作②.那么完成上述两项调查应采用的抽样方法是( )A .①用简单随机抽样法,②用系统抽样法B .①用分层抽样法,②用简单随机抽样法C .①用系统抽样法,②用分层抽样法D .①用分层抽样法,②用系统抽样法【解析】 ①因家庭收入不同其社会购买力也不同,宜用分层抽样的方法.②因总体个数较小,宜用简单随机抽样法.【答案】 B判断一个抽样方法是不是分层抽样的条件(1)看它是否具有分层抽样的特点,如总体中个体差异是否明显.(2)是否按照相同比例从各层中抽取.至于各层内用什么方法抽样是灵活的,可采用简单随机抽样,也可采用系统抽样.(3)在分层抽样中,无论哪一层的个体,被抽中的机会都是相等的,体现了抽样的公平性.(2018·高考全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异,为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.解析:因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.答案:分层抽样分层抽样中的有关计算(1)某单位共有老、中、青年职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为________.(2)某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:高一年级高二年级高三年级泥塑 a b c 剪纸xyz其中x ∶y ∶z =5∶3∶2,且“泥塑”社团的人数占两个社团总人数的35,为了了解学生对两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取________人.【解析】 (1)设该单位老年职工人数为x ,由题意得3x =430-160,解得x =90.则样本中的老年职工人数为90×32160=18.(2)法一:因为“泥塑”社团的人数占总人数的35,故“剪纸”社团的人数占总人数的25,所以“剪纸”社团的人数为800×25=320;因为“剪纸”社团中高二年级人数比例为y x +y +z =32+3+5=310,所以“剪纸”社团中高二年级人数为320×310=96.由题意知,抽样比为50800=116,所以从高二年级“剪纸”社团中抽取的人数为96×116=6.法二:因为“泥塑”社团的人数占总人数的35,故“剪纸”社团的人数占总人数的25,所以抽取的50人的样本中,“剪纸”社团中的人数为50×25=20.又“剪纸”社团中高二年级人数比例为y x +y +z =32+3+5=310,所以从高二年级“剪纸”社团中抽取的人数为20×310=6.【答案】 (1)18 (2)6分层抽样中有关计算的方法(1)抽样比=样本容量n 总体容量N =该层抽取的个体数该层的个体数.(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解.1.为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为8,16,24.若用分层抽样的方法抽取12个城市,则应抽取的中型城市数为( )A .3B .4C .5D .6解析:选 B.根据分层抽样的特点可知,抽样比例为1248=14,则应抽取的中型城市数为16×14=4.2.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,则应抽取超过45岁的职工为________人.解析:抽样比为25∶200=1∶8,而超过45岁的职工有80人,则从中应抽取的个体数为80×18=10.答案:10分层抽样的设计与应用一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?【解】 用分层抽样来抽取样本,步骤如下:(1)分层,按年龄将500名职工分成三层:不到35岁的职工;35至49岁的职工;50岁及50岁以上的职工.(2)确定每层抽取个体的个数.抽样比为100500=15,则在不到35岁的职工中抽取125×15=25(人);在35岁至49岁的职工中抽取280×15=56(人);在50岁及50岁以上的职工中抽出95×15=19(人).(3)在各层分别按系统抽样或随机数法抽取样本. (4)汇总每层抽样,组成样本.分层抽样的操作步骤第一步,计算样本容量与总体的个体数之比.第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数. 第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体. 第四步,将各层抽取的个体合在一起,就得到所取样本.在100个产品中,有一等品20个,二等品30个,三等品50个,现要抽取一个容量为30的样本,请说明抽样过程.解:先将产品按等级分成三层:第一层,一等品20个;第二层,二等品30个;第三层,三等品50个.然后确定每一层抽取的个体数,因为20∶30∶50=2∶3∶5,所以应在第一层中抽取产品6个,在第二层中抽取产品9个,在第三层中抽取产品15个.再分别给这些产品编号并贴上标签,用抽签法或随机数表法在各层中抽取,取到一等品6个,二等品9个,三等品15个,这样就通过分层抽样得到了一个容量为30的样本.三种抽样方法的选择及应用为了考察某学校的教学水平,将抽取这个学校高三年级的部分学生本学年的考试成绩进行统计分析,为了全面反映实际情况,采取以下三种方式进行抽查(已知该学校高三年级共有20个教学班,并且每个班内的学生按随机方式编好了学号,假定该校每班学生人数都相同):①从全年级20个班中任意抽取一个班,再从该班任意抽取20人,考察他们的学习成绩;②每个班都抽取1人,共计20人,考察这20个学生的成绩;③把学生按成绩分成优秀、良好、普通三个级别,从中共抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人).根据上面的叙述,回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用何种抽样方法?【解】(1)三种抽取方式中,其总体都是高三全体学生本学年的考试成绩,个体都是指高三年级每个学生本学年的考试成绩.第一种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第二种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第三种抽取方式中,样本为所抽取的100名学生本学年的考试成绩,样本容量为100.(2)三种抽取方式中,第一种方式采用的是简单随机抽样法;第二种方式采用的是系统抽样法和简单随机抽样法;第三种方式采用的是分层抽样法和简单随机抽样法.选择抽样方法的思路(1)判断总体是否由差异明显的几部分组成,若是,则选用分层抽样;否则,考虑用简单随机抽样或系统抽样.(2)判断总体容量和样本容量的大小.当总体容量较小时,采用抽签法;当总体容量较大、样本容量较小时,采用随机数表法;当总体容量较大、样本容量也较大时,采用系统抽样.某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各岗位中的人数情况如下表所示:管理技术开发营销生产合计老年40404080200 中年80120160240600 青年40160280720 1 200 合计160320480 1 040 2 000(2)若要开一个有25人参与的讨论单位发展与薪金调整方案的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对某运动会筹备情况的了解程度,则应怎样抽样?解:(1)用分层抽样法,并按老年职工4人,中年职工12人,青年职工24人抽取.(2)用分层抽样法,并按管理岗位2人,技术开发岗位4人,营销岗位6人,生产岗位13人抽取.(3)用系统抽样法,对全部2 000人随机编号,号码为0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,所得到的号码对应的20人即为要抽取的人.1.(2020·贵州省铜仁市第一中学期末考试)某高校有男学生3 000名,女学生7 000名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取男学生300名,女学生700名进行调查,则这种抽样方法是()A.抽签法B.随机数法C.系统抽样法D.分层抽样法解析:选D.总体由男生和女生组成,比例为3 000∶7 000=3∶7,所抽取的比例也是3∶7,这种抽样方法是分层抽样法.故选D.2.(2020·广西钦州市期末考试)某中学共有1 000名学生,其中高一年级350人,该校为了了解本校学生视力情况,用分层抽样的方法从该校学生中抽出一个容量为100的样本进行调查,则应从高一年级抽取的人数为()A.20 B.25C.30 D.35解析:选D.高一年级抽取的人数为3501 000×100=35.故选D.3.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人进行某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案.使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,3,…,270;使用系统抽样时,将学生统一随机编号为1,2,3,…,270,并将整个编号平均分为10段.如果抽得的号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④36,62,88,114,140,166,192,218,244,270. 关于上述样本的下列结论中,正确的是( ) A .②③都不能为系统抽样 B .②④都不能为分层抽样 C .①④都可能为系统抽样 D .①③都可能为分层抽样解析:选D.系统抽样又名“等距抽样”,做到等距的有①③④,但只做到等距还不一定是系统抽样,还应做到10段中每段要抽1个,检查这一点只需看第一个元素是否在1~27 范围内,结果发现④不符合,同时,若为系统抽样,则分段间隔k =27010=27,④也不符合这一要求,所以可能是系统抽样的为①③,因此排除A ,C ;若采用分层抽样,一、二、三年级的人数比例为4∶3∶3,由于共抽取10人,所以三个年级应分别抽取4人、3人、3人,即在1~108范围内要有4个编号,在109~189和190~270范围内要分别有3个编号,符合此要求的有①②③,即它们都可能为分层抽样(其中①③在每一层内采用了系统抽样,②在每一层内采用了简单随机抽样),所以排除B.4.某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.解析:设应抽取的男生人数为x ,则x 900-400=45900,解得x =25.答案:25[A 基础达标]1.为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样解析:选C.我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理,故选C.2.(2020·黑龙江省哈尔滨市第六中学期末考试)某校共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,用分层抽样抽取一个容量为20的样本,则应抽取的后勤人员人数是() A.3 B.2C.15 D.4解析:选A.因为160人抽取20人,所以抽取的比例为20160=18,因为后勤人数为24,所以应抽取24×18=3.故选A.3.(2020·河北省枣强中学期末考试)某中学高二年级共有学生2 400人,为了解他们的身体状况,用分层抽样的方法从中抽取一个容量为80的样本,若样本中共有男生42人,则该校高二年级共有女生()A.1 260 B.1 230C.1 200 D.1 140解析:选D.设女生总人数为x人,由分层抽样的方法,可得抽取女生人数为80-42=38(人),所以802 400=38x,解得x=1 140.故选D.4.(2020·河北省石家庄市期末考试)某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中取一个容量为36的样本,则老年人、中年人、青年人依次抽取的人数是()A.7,11,19 B.7,12,17C.6,13,17 D.6,12,18解析:选D.由题意,老年人27人,中年人54人,青年人81人的比例为1∶2∶3,所以抽取人数:老年人:16×36=6,中年人:26×36=12,青年人:36×36=18.故选D.5.某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为() A.100 B.150C.200 D.250解析:选A.抽样比为703 500=150,该校总人数为1 500+3 500=5 000,则n5 000=150,故n=100.6.(2020·四川省遂宁市期末考试)已知某地区中小学生人数如图所示,用分层抽样的方法抽取200名学生进行调查,则抽取的高中生人数为________.解析:某地区中小学生人数如图所示,用分层抽样的方法抽取200名学生进行调查,则抽取的高中生人数为200×2 0003 500+2 000+4 500=40.答案:407.某校对全校共1 800名学生进行健康调查,选用分层抽样法抽取一个容量为200的样本,已知女生比男生少抽了20人,则该校的女生人数应是________.解析:设抽取的女生人数为x,则x+(x+20)=200,解得x=90,则抽取的女生人数为90,抽取的男生人数为200-90=110,据此可知该校的女生人数应是1 800×90200=810.答案:8108.(2020·湖南省张家界市期末联考)我国古代数学算经十书之一的《九章算术》中有一“衰分”问题“今有北乡八千七百五十人,西乡七千二百五十人,南乡八千三百五十人,凡三乡,发役四百八十七人,则西乡遣____________人”.解析:今有北乡八千七百五十人,西乡七千二百五十人,南乡八千三百五十人,凡三乡,发役四百八十七人,则西乡遣487×7 2508 750+7 250+8 350=145(人).答案:1459.某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作为样本,用系统抽样法将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).(1)若第5组抽出的号码为22,则第8组抽出的号码应是多少? (2)若用分层抽样法,则应从40岁以下年龄段的职工中抽取多少名?解:(1)由分组可知,分段的间隔为5.又第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.(2)由题意知,40岁以下年龄段的职工人数为200×50%=100.若用分层抽样法,则应从40岁以下年龄段的职工中抽取40200×100=20(名).10.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例; (2)游泳组中,青年人、中年人、老年人分别应抽取的人数.解:(1)设登山组人数为x ,游泳组中,青年人、中年人、老年人所占比例分别为a 、b 、c ,则有x ×40%+3xb 4x =47.5%,x ×10%+3xc4x =10%,解得b =50%,c =10%,故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人所占比例分别为40%、50%、10%.(2)游泳组中,抽取的青年人人数为200×34×40%=60(人);抽取的中年人人数为200×34×50%=75(人);抽取的老年人人数为200×34×10%=15(人).即游泳组中,青年人、中年人、老年人分别应抽取的人数为60人,75人,15人.[B能力提升]11.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()A.4 B.5C.6 D.7解析:选C.四类食品的种数比为4∶1∶3∶2,则抽取的植物油类的种数为20×110=2,抽取的果蔬类的种数为20×210=4,二者之和为6种,故选C.12.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.解析:由分层抽样中各层的抽样比相同.样本中甲设备生产的有50件,则乙设备生产的有30件,所以在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品总数为4 800×35+3=1 800(件).答案:1 80013.某单位有工程师6人、技术员12人、技工18人.要从这些人中抽取一个容量为n 的样本,如果采用系统抽样和分层抽样的方法抽取,那么不用剔除个体;如果样本容量增加一个,那么在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n.解:依题意,知总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为36n ,分层抽样的抽样比是n36,抽取工程师的人数为n 36×6=n 6,技术员的人数为n 36×12=n 3,技工的人数为n 36×18=n2,所以n 应是36的约数且是6的倍数,即n =6,12,18. 当样本容量为n +1时,系统抽样的间隔为35n +1.因为35n +1必须为整数,所以n 只能取6,即样本容量n =6.14.(选做题)为了对某课题进行讨论研究,用分层抽样的方法从三所高校A ,B ,C 的相关人员中,抽取若干人组成研究小组,有关数据见下表(单位:人).(2)若从高校B 相关人员中选2人作专题发言,应采用什么抽样法,请写出合理的抽样过程.解:(1)分层抽样是按各层相关人数和抽取人数的比例进行的,所以有x 54=13⇒x =18,3654=y3⇒y =2.故x =18,y =2. (2)总体容量和样本容量较小,所以应采用抽签法,过程如下: 第一步,将36人随机编号,号码为1,2,3,…,36; 第二步,将号码分别写在相同的纸片上,揉成团,制成号签;第三步,将号签放入一个不透明的容器中,充分搅匀,依次不放回地抽取2个号码,并记录上面的编号;第四步,把与号码相对应的人抽出,即可得到所要的样本.。
分层抽样名词解释
分层抽样名词解释分层抽样是指从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法,分层抽样是怎么解释的?以下是为大家整理的分层抽样的名词解释,希望对大家有帮助分层抽样的意思分层抽样(stratified sampling)是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。
可以提高总体指标估计值的精确度。
先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本的方法。
一般地,在抽样时,将总体分成互不交叉的层,然后按一定的比例,从各层次独立地抽取一定数量的个体,将各层次取出的个体合在一起作为样本,这种抽样方法是一种分层抽样。
又称分类抽样或类型抽样。
将总体划分为若干个同质层,再在各层内随机抽样或机械抽样,分层抽样的特点是将科学分组法与抽样法结合在一起,分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。
分层抽样的区别与多阶抽样关系多阶段抽样区别于分层抽样,其优点在于适用于抽样调查的面特别广,没有一个包括所有总体单位的抽样框,或总体范围太大,无法直接抽取样本等情况,可以相对节省调查费用。
其主要缺点是抽样时较为麻烦,而且从样本对总体的估计比较复杂。
将总体分为若干个一阶单元,如果在每一个一阶单元中,都随机抽取部分二阶单元,由这些二阶单元中的总体基本单元组成的样本,在抽样的方式上,就相当于分层抽样;如果在全部的一阶单元中,只抽取了部分一阶单元,并对抽中的一阶单元中的所有的基本单元都做全面调查,这就是整群抽样。
因此,分层抽样实际是第一阶抽样比为100%时的一种特殊的两阶抽样;而整群抽样实际上是第二阶抽样比为100%时的一种特殊的两阶抽样,故也称单级整群抽样。
主要区别多阶抽样与分层抽样的主要区别在于:一、分层抽样是对总体中的每个一级样本群体进行全面入样,再对所有的样本进行抽查;而两阶抽样则把总体中所有的群体视为一阶单元,对这些一阶单元进行抽样,将抽出的样本再次进行抽样(两次都不是进行全面的调查),产生两级样本,最后综合估算出总的一级样本指标。
新人教版高中数学《分层抽样》PPT教学课件1
系统抽样的步骤:
第一步,编号分段(即分成几个部分),要确定分段 的间隔k,当N/n是整数时,k= N/n;当N/n不是整数时, 通过从总体中剔除一些个体使剩下的总体中个体的个 数N'被n整除,这时k=N'/n
第二步,在第一段用简单随机抽样确定起始 的个体编号 l
例1 某社区有700户家庭,其中高收入家庭225户,中等收入家
庭400户,低收入家庭75户,为了调查社会购买力的某项指标,
要从中抽取一个容量为100户的样本,记作①;某中学高二年级
有12名足球运动员,要从中选出3人调查学习负担情况,记②;
从某厂生产的802辆轿车中抽取8辆测试某项性能,记作③.则完
成上述3项应采用的抽样方法是
A 种零件被抽取 20 个,C 种零件被抽取 10 个,则此 三种零件共有___9_0_0___个.
5.已知某单位有职工 120 人,男职工有 90 人,现采
用分层抽样(按男、女分层)抽取一个样本,若已
ቤተ መጻሕፍቲ ባይዱ
知样本中有 27 名男职工,则样本容量为( B )
A.30
B.36
C.40
D.无法确定
三、解答题 6.某校高一年级 500 名学生中,血型为 O 型的有 200
例4:某初级中学有学生270人,其中一年级108人,二、三年级 各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简 单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样 和分层抽样时,将学生按一、二、三年级依次统一编号为1, 2,…,270;使用系统抽样时,将学生统一随机编号1,2,…, 270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:
分层抽样1
1.分层抽样的概念 一般地, 在抽样时,将总体分成互不交叉 的层,然后按照一定的比例,从各层独立地抽 取一定数量的个体,将各层取出的个体合在 一起作为样本,这种抽样的方法就叫做分层 抽样
2.分层抽样的操作步骤
(1)将总体按一定标准进行分层; (2)计算各层的个体数与总体的个体数的比; (3)按各层个体数占总体的比确定各层应抽取 的样本容量; (4)在每一层进行抽样(可用简单随机抽样或系 统抽样)
[分析]因为300:200:400=3:2:4,于是将 45分成3:2:4的三部分。设三部分各抽取的 个体数分别为3x,2x,4x,由3x+2x+4x=45,得 x=5,故高一、高二、高三各年级抽取的人数 分别为15,10,20,故选D。
• 一个地区共有5个乡镇,人口3万人,其 中人口比例为3:2:5:2:3,从3万人 中抽取一个300人的样本,分析某种疾病 的发病率,已知这种疾病与不同的地理 位置及水土有关,问应采取什么样的方 法?并写出具体过程。
3.分层抽样的特点
(1)适用于总体由差异明显的几部分组成 的情况; (2)更充分的反映了总体的情况; (3)等可能抽样,每个个体被到的可能性都 n 是 .
N
三种抽样方法的比较
类别 简单随 机抽样 共同点 各自特点 从总体中逐 个抽取 相互联系 适应范围 总体中 的个体 数较少 总体中 的个体 数较多 总体由 差异明 显的几 部分组 成
抽样过 将总体均分 在起始部 成几部分, 程中每 分抽样时, 系统抽 按事先确定 个个体 样 采用简单 被抽取 的规则在各 随机抽样 的概率 部分抽取 各层抽样 相等 将总体分成 时采用简 分层抽 几层,分层 单随机抽 样 样或系统 进行抽取 抽样
课件4:5.1.1 第2课时 分层抽样
A.40
B.30
C.20
D.36
解析:选 A.抽样比为360+29700+180=19, 则应从甲社区中抽取低收入家庭的户数为 360×19=40,故选 A.
本课结束
更多精彩内容请登录:
【达标反馈】
1.下列试验中最适合用分层抽样法抽样的是( ) A.从一箱 3 000 个零件中抽取 5 个入样 B.从一箱 3 000 个零件中抽取 600 个入样 C.从一箱 30 个零件中抽取 5 个入样 D.从甲厂生产的 100 个零件和乙厂生产的 200 个零件中抽取 6 个入样 解析:选 D.D 中总体有明显差异,故用分层抽样.
解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发 病情况差异明显,因而采用分层抽样的方法. 具体过程如下: (1)将 3 万人分为 5 层,其中一个乡镇为一层. (2)按照样本容量的比例求得各乡镇应抽取的人数分别为 60 人、 40 人、100 人、40 人、60 人. (3)按照各层抽取的人数随机抽取各乡镇应抽取的样本. (4)将 300 人合到一起,即得到一个样本.
2.当前,国家正分批修建经济适用房以解决低收入家庭住房紧张
的问题.已知甲、乙、丙三个社区现分别有低收入家庭 360 户,270
户,180 户,若第一批经济适用房中有 90 套住房用于解决这三个社
区中 90 户低收入家庭的住房问题,先采用分层抽样的方法决定各
社区户数,则应从甲社区中抽取低收入家庭的户数为( )
【跟踪训练】某学校有男、女学生各 500 名,为了解男、女学 生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学 生中抽取 100 名学生进行调查,则宜采用的抽样方法是______. 解析:由于被抽取的个体属性有明显的差异,因此宜采用分层 抽样. 答案:分层抽样
分层抽样1
分析步骤:
一、分层:高一、高二、高三共三层。 二、求比: k n 1 N 10
24 三、定数: 高一45人 男生: 人 21 女生: 人
24 男生: 人 高二44人 20 女生: 人 24 男生: 人 高三46人 22 女生: 人 四、抽样。
例4:
某大学共有全日制学生15000人,其中专科 生3788人、本科生9874人、研究生1338人 ,现为了调查学生上网查找资料的情况, 欲从中抽取225人,为了使样本具有代表性 ,问如何抽样才合适?
问题1:你认为不同年龄段的学生的视力有差异吗?
设计抽样方法时需要考虑这些因素吗? 问题2:请问例1中的总体是什么?总体中的个 体数是多少?样本的容量是多少? 问题3:1%的样本是什么含义? 问题4:请问例1中总体可看成几部分组成?样本 可看成由几部分组成? 问题5:你怎么从各部分 中抽取样本?请动笔试试。 为什么要这样取各个学段 的个体数?
分层抽样的具体步骤是什么?
步骤1:根据已经掌握的信息,将总体分 成互不相交的层 分层 步骤2:根据总体的个体数N和样本容量n 计算抽样比k=n:N 求比 步骤3:确定每一层应抽取的个体数目,并使 每一层应抽取的个体数目之和为样本容量n 定数 步骤4:按步骤3确定的数目在各层中随机 抽取个体,合在一起得到容量为n样本 抽样
目标检测 (1)某校有1000名学生,其中O型血的 有400人,A型血的人有250人,B型血 的有250人,AB型血的有100人,为了 研究血型与色弱的关系,要从中抽取 一个40人的样本,按分层抽样,O型 16 血应抽取的人数为___人,A型血应抽 取的人数为___人,B型血应抽取的人 10 10 数为___人,AB型血应抽取的人数为 ___人。 4
分层抽样
抽样调查-Ch4 分层抽样-1-029
. Solution (Continued) . ¯ yst 与 ¯ y 的比较 ¯ y = (15180 × 300 + 9856 × 250)/(300 + 250) = 12760, ¯ yst = 10585.39.
.
判断哪个估计更合理? 为什么?
15 / 18
4.1 分层随机抽样及实施方法 4.2 简单估计及其性质
2 / 18
4.1 分层随机抽样及实施方法 4.2 简单估计及其性质
4.1.1 定义与实施方法 4.1.2 特点
4.1 分层随机抽样及实施方法
背景 简单随机抽样是最基本的抽样手段, 在一些小型的抽样调查 (总体容量N 较小) 中被人们采纳. 当总体容量 N 较大时, 不 便采用简单随机抽样方法. 这时, 分层抽样将起到作用. 定义 将总体按一定的原则分成若干互不重叠且穷尽的子总体, 每 个子总体称为层 (stratum), 在每个层内进行抽样, 不同层的 抽样相对独立, 称为分层抽样(stratified sampling). 若每层中的抽样都是按简单随机抽样进行的, 称为分层随机 抽样.
W1 = N1 /N = 0.137, W2 = N2 /N = 0.863. . ¯ yst y2 = 0.137 × 15180 + 0.863 × 9856 = 10585.39. y1 + W 2 ¯ = W1¯
13 / 18
4.1 分层随机抽样及实施方法 4.2 简单估计及其性质
4.2.1 参数估计 4.2.2 估计的性质 4.2.3 例题
若实际调查了 18 个工人, 10 个技术人员, 2 个行政人员, 其损失的工时 数如下: 工人 8,24,0,0,16,32,6,0,16 7,4,4,9,5,8,18,2,0 技术人员 4,5,0,24,8, 12,3,2,1,8 行政管理人员 1,8
分层抽样 (1)
分层 抽 样
引例:假设某地区有高中生2400人,初中生 10900人,小学生11000人。教育部门为了了 解本地区中小学生的近视情况及其形成原因, 决定从这些人中抽取1%的学生进行调查。你 认为怎样抽取样本才能很好地体现抽样的公 平性呢? 近视率%
80 60 40 20 0
小学 初中
高中
分层抽样
分层抽样
• 2、为什么这样抽取各个学段的个体数?
答:这样做样本更具有代表性
分层抽样
• 3、请归纳分层抽样的定义?
答:一般的,在抽样时,将总体分成互不交 叉的层,然后按照一定的比例,从各层独立 地抽取一定数量的个体,将各层取出的个体 合在一起作为样本,这种抽样的方法叫分层 抽样.
分层抽样
• 4、请归纳分层抽样的步骤?
• 5、分层抽样适用于什么样的总体?
答:总体由差异比较明显的几部分组成
分层 抽 样
分层抽样特点:
(1)分层抽样适于总数较大,且部分间有 明显差异的总体。
(2)分层抽样是等可能抽样,也是公平的。 (3)分层抽样是建立在简单随机抽样或系统 抽样的基础上的,在实用中更为广泛。
分层 抽 样
知识点二 例2
分组讨论下列问题:
• • • • • 1、你认为应当怎样抽取样本? 2、为什么这样抽取各个学段的个体数? 3、请归纳分层抽样的定义? 4、分层抽样的步骤有哪些? 5、分层抽样适用于什么样的总体?
分层抽样
• 1、你认为应当怎样抽取样本?
答:分别利用简单随机抽样在 高中生中抽取2400*1%=24 在初中生中抽取10900*1%=109 在小学生中抽取11000*1%=110
分层抽样法的应用
某学校有在编人员 160 人,其中行政人员 16
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
f4
n4 10 0.0067 N 4 1500
2 s4 193.333
ˆ Y N h yh
h 1
4
200 39 .5 400 105 750 165 1500 24 209650
ˆ N 2 W 2v y N 2 1 f h s 2 5.93 108 v Y h h h h nh h 1 h 1
3.2.1 总体均值的简单估计量
3.2.2 总体总量的简单估计量
3.2.3 总体比例的简单估计量
对总体均值或总量的简单估计
ˆ ˆ Yst WhYh Wh yh y st
h 1 L h 1
L
L
ˆ ˆ ˆ Yst Yh NYst N Wh yh N h yh
而 ( N 1) S (Yi Y ) (Yhi Y )2
2 2
N
k
Nh
(Yhi Yh Yh Y )2 (Yhi Yh )2 N h (Yh Y )2
2 ( N h 1) Sh N h (Yh Y )2 h 1 h 1
证明见p68-69,th3.3和推论3.1
只要对各层估计无偏,则总体估计也无偏。 各层可以采用不同的抽样方法,只要相应的估计量是 无偏的,则对总体的推算也是无偏的。
对于分层随机抽样,V y st 的一个无偏估计为
1 fh 2 v y st W v y h W sh nh h 1 h 1
4
4
ˆ s Y
ˆ v Y 23208
ˆ ˆ Y ts Y 209650 2 23208
对总体比例的估计
pst Wh ph
h 1
L
1 2 V ( pst ) Wh V ( ph ) 2 N Wh2 PhQh (1 f h ) nh L Wh2 ph qh v( pst ) (1 f h ) nh 1 L
第三章 分层随机抽样
授课教师:陈燕
本章主要内容
3.1 3.2 3.3 3.4 3.5 3.6 3.7
概述 简单估计量及其性质 比率估计量及其性质 回归估计量及其性质 各层样本量的分配 总样本量的确定 分层抽样的其他方面
3.1 概述
3.1.1 定义
3.1.2 符号
层、分层抽样、分层随机抽样
符号说明
总体分为L层,h表示层的编号 第h层单位总数:Nh
第h层的样本单位数:nh
N 第h层的层权: h h W N
nh 第h层的抽样比: f h Nh
第h层子总体第i个单位标志值:Yhi
第h层样本中第i个单位标志值:yhi
符号说明
第h层的总体均值:
1 Yh Nh
nh
Y
也即至少当 nh/n=Wh时,分层抽样的误差比简单随机 抽样的误差小。相差的部分几乎恰恰只与各层之间的 差异平方和有关。 分层抽样的优点在于通过各层的独立抽样过程而减 少了由于各层之间的差异所造成的误差。 这个事实告诉我们: 为了取得分层的效果,必须注意层与层之间要有较 显著的差异。 当然并不是讲在总体中分辨不出各有特色的层时就一定 不用分层抽样不过那时的得益在于组织管理上的方便而 不表现在精度上。
总体总值的置信区间
Y u ˆ ˆ ˆ ˆst 1 / 2 v(Yst ) , Yst u1 / 2 v(Yst )
例1
调查某地区的居民奶制品年消费支出,以居民户为抽样 单元,根据经济及收入水平将居民户划分为4层,每层 按简单随机抽样抽取10户,调查获得如下数据(单位: 元),要估计该地区居民奶制品年消费总支出及估计 的标准差。
层 居民户 总数 1 1 2 3 4 200 400 750 1500 10 50 180 50 2 40 130 260 35 3 0 60 110 15 4 110 80 0 0 样本户奶制品年消费支出 5 15 100 140 20 6 10 55 60 30 7 40 160 200 25 8 80 85 180 10 9 90 160 300 30 10 0 170 220 25
不重 不漏
在抽样之前,先将总体N个单元划分成L个互不 重复的子总体,每个子总体称为层,它们的大 小分别为 N1 , N 2 , , N L ,这个层合起来就是 L N N h ,然后,在每个层中分别 整个总体 h 1 独立地 进行抽样,这种抽样就是分层抽样,所 得到的样本称为分层样本。 如果每层都是独立按照简单随机抽样进行,则 称为分层随机抽样
是V ( yst ) 的无偏估计量
证明见p68-69,th3.3和th3.4
分层随机样本的总体总量的简单估计量的性质
ˆ E (Yst ) Y
S h2 ˆ ˆ V (Yst ) N 2V (Yst ) N 2V ( yst ) N h ( N h nh ) nh
第h层的样本方差s2
2 1
f2
f3
n2 10 0.025 N 2 400
n3 10 0.0133 N3 750
y2 105
2 s2 2166.667
W3
N3 750 0.26316 N 2850
y3 165
y4 24
2 s3 8205.556
W4
N 4 1500 0.52632 N 2850
(2)式花括弧内第一项为各个单个样本方差的加权和,而第二 项则表示了各小盒子之间的差异平方和。比较( 1 )和( 2 ), 若取 nh n Wh ,那么易见(1)式变为
2 2 L Wh2 S h Wh S h V ( y st ) nh N h 1 h 1 L
1 1 k 2 Var ( yst ) ( ) Wh Sh n N h1 1 1 k 因此 Var ( y ) Var ( yst ) ( ) Wh (Yh Y )2 0 n N h 1
L L 2 h 2 h
ˆ 对于分层随机抽样,V Yst 的一个无偏估计为
2 sh ˆ v(Yst ) N h ( th3.4和推论3.1
总体均值和总体总值的置信区间
总体均值的置信区间
y
st
u1 / 2 v( yst ) ,
yst u1 / 2 v( yst )
2 N h ( N h nh ) PhQh N 1 n h h
Nh很大
对总体总数的估计
ˆ Ast Npst N ( N h nh ) PhQh ˆ V ( Ast ) Nh 1 nh L
2 h
N h ( N h nh ) ˆ ) v( Ast n 1 ph qh L h
分层抽样又称为类型抽样或分类抽样
分层抽样的优点
分层抽样不仅可估计总体参数,还可估计层的 参数 实施方便,便于组织 分层样本比简单随机样本在总体中分布更均匀 分层抽样能较大地提高调查地精度
分层原则
1.估计:层内单元具有相同性质,通常按调查对象的 不同类型进行划分。 2.精度:尽可能使层内单元的指标值相近,层间单元 的差异尽可能大,从而达到提高抽样估计精度的目的。 3.估计和精度:既按类型、又按层内单元指标值相近 的原则进行多重分层,同时达到实现估计类值以及提 高估计精度的目的。 4.实施:抽样组织实施的方便,通常按行政管理机构 设置进行分层。
i 1
Nh
hi
1 第h层的样本均值: yh yhi n i 1
第h层的总体方差:
1 Nh 2 2 Sh Yhi Yh N h 1 i 1
1 nh 2 2 第h层的样本方差:sh yhi yh nh 1 i 1
3.2 简单估计量及其性质
h 1 4
f h 的计算结果,可得各层估计量的方差:
p1q1 0.0169 n1 1 pq v p3 1 f3 3 3 0.0263 n3 1 v p1 1 f1
因此,该地区居民拥有家庭电脑比例的估计为:
1 N
N
h 1
4
h
ph
1 200 0.2 400 0.2 750 0.4 1500 0.1 2850
2 sh ˆ v(Yst ) N h ( N h nh ) nh
ˆ 是V (Yst ) 的无偏估计量
易证,见p69推论3.1
总结:分层随机样本简单估计量的性质
对于分层随机抽样,总体均值和总体总量的简 单估计量都是无偏的。即
E ( y st ) Yst ˆ E (Y ) Y
st st
估计量的标准差为:
分层抽样与简单抽样的效率比较
分层随机抽样的总体均值的估计方差为:
2 2 L Wh2 S h Wh S h V ( y st ) (1) nh N h 1 h 1 简单随机抽样的总体均值的估计方差为: 1 1 Var ( y ) ( ) S 2 n N L
例子
例如,对全国范围汽车运输的抽样调查,调查目的不 仅要推算全国货运汽车完成的运量,还要推算不同经 济成分(国有、集体、个体)汽车完成的运量。 为组织的方便,首先将货运汽车总体按省分层,由 各省运输管理部门负责省内的调查工作。 各省再将省内拥有的汽车按经济成分分层。 为提高抽样效率,再对汽车按吨位分层。 例如,某高校对学生在宿舍使用电脑的情况进行调查, 根据经验,本科生和研究生拥有电脑的状况差异较大。 因此,在抽样前对学生按本科生和研究生进行分层 是有必要的。