分层抽样(计算详解)
分层抽样
分层抽样
抽样技术作为现代统计学科体系的重要组成部分,被广泛运用到社会实践当 中。自从 1895 年挪威首任中央统计局局长凯尔在伯尔尼第五届国际统计学会会议 上提出所谓“代表性调查”的抽样方法以来,经过 100 多年的理论探讨和时间积 累,抽样理论更加科学,抽样技术日臻完善。抽样又称取样。其原理是从研究的 全部样品中抽取一部分样品单位。从被抽取样品单位的分析、研究结果来估计和 推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效 的工作和研究方法。基本的抽样技术包括简单随机抽样,系统抽样,分层抽样, 多阶段抽样等。在实际的抽样调查中我们常常会根据调查成本,调查规模等结合 运用各种抽样方法进行实践。
然后,在每个层中分别独立地进行抽样。
1-1、分层抽样的总体均值估计
在分层抽样中,对总体均值Y 的估计是通过对各层Yh 的估计,安权层Wh 加权
平均得到的,公式为
Yˆst l WhYˆh 1 l NhYˆh
h1
N h1
如果得到的是分层随机样本,则总体均值Y 的简单估计为
yˆst l Whyh 1 l Nhyh
3
Whsh 0.4920+1.2543+3.0744=4.8207
h1
因此按尼曼分配时,各层应分配的样本量为
n1 n
W1s1
3
Wh sh
40 0.4920 4.0824 4.8207
h1
故
n2 12.290
n3 23.8235
即各层的样本量分别为 4,12,24.
此时的样本估计量的方差为
3 WhSh
Vopt( yst) h1
ch
3
WhSh
n
h1
系统抽样和分层抽样
简单随机抽样、系统抽样、分层抽样的比较
类别 简单 随机 抽样 系统 抽样 共同点 各自特点 从总体中逐个 抽取 (1)抽样过 程中每个个体 被抽到的可能 性相等 (2)每次抽 出个体后不再 将它放回,即 不放回抽样 联 系 适用 范围 总体中 个体 较少
2.书59第3题
3.一个总体中有100个个体,随机编号为0,1,2,…,99, 依编号顺序平均分成10个小组,组号分别为 1,2,3,…,10.现用系统抽样方法抽取一个容量为10的 样本,规定如果在第1组随机抽取的号码为m,那么在第 k组抽取的号码个位数字与m+k的个位数字相同.若 m=6,则在第7组中抽取的号码是______. 63
(1)总体、个体、样本、样本容量分别是什么?
(2)能否在2500名学生中随机抽取100名学生?为什么?
不能
不具有好的代表性 不具有好的代表性
(3)能否在三个年级中平均抽取?
不能
创设情景:
某校高一、高二和高三年级分别有1000,800和700名, 为了了解全校学生的视力情况,从中抽取容量为100的样 本,你认为应当怎样抽取样本较为合理?
解析:依编号顺序平均分成的10个小组分别为 0~9, 10~19, 20~29, 30~39, 40~49,50~59,60~69,70~79,80~89,90~9 9.因第7组抽取的号码个位数字应是3,所以抽取 的号码是63. 这个样本的号码依次是 6,18,29,30,41,52,63,74,85,96这10个号.
例2:一个地区共有5个乡镇,人口15万人,其中人口 比例为3:2:5:2:3,现从15万人中抽取一个1500 人的样本,分析某种疾病的发病率,已知这种疾病与不 同的地理位置及水土有关,问应采取什么样的方法?并 写出具体过程。
【抽样调查】分层随机抽样
【抽样调查】分层随机抽样第2部分:分层随机抽样⽬录概述分层随机抽样的思路:当N ,n 都较⼤,总体单元之间的差异也较⼤时,简单随机抽样会出现⾼成本、低精度情形,解决⽅法是将总体划分为若⼲个⼦总体、减少总体单元之间的差异。
假设在各个⼦总体内已经满⾜实施简单随机抽样的条件,则可以在各个⼦总体内独⽴地进⾏简单随机抽样,再将各个⼦总体参数的估计值进⾏加权,得到总体参数的估计。
分层抽样的概念:层:如果⼀个包含N 个单位的总体可以分成不重不漏的L 个⼦总体,即每个单元必定属于且仅属于⼀个⼦总体,则这样的⼦总体称为层。
有N 1+⋯+N L =N 。
分层抽样:在每⼀层中独⽴进⾏抽样,总的样本由各层样本组成,总体参数⼜按照各层样本参数的汇总作出估计。
有n 1+⋯+n L =n 。
分层随机抽样:每层的样本,都独⽴地按照简单随机抽样进⾏,这样的分层抽样称为分层随机抽样。
符号规定:h :层。
从⽽N h 代表第h 层的单位总数,n h 代表第h 层的样本数。
i :层内单位号。
从⽽Y hi 代表第h 层第i 个总体单元,y hi 代表第h 层第i 个样本单元。
W h :层权,即W h =N h N 。
f h :层内抽样⽐,即f h =n hN h 。
¯Yh,Y h,S 2h:层内总体参数(均值、总值与⽅差)。
¯y h ,y h ,s 2h:层内样本参数(样本均值、样本总值与样本⽅差)。
简单估计量分层抽样⾸先根据各层的样本,计算出各层均值¯Y h的适当估计值ˆ¯Y h ,然后再使⽤总体层权加权平均,得到总体均值¯Y 的估计,即ˆ¯Y st =L∑h =1W h ˆ¯Y h =1N L∑h =1N h ^¯Y h .对于分层随机抽样,每⼀层的ˆ¯Y h就是h 层的样本均值¯y h ,即ˆ¯Y st =L∑h =1W h ¯y h =1N L∑h =1N h ¯y h .注意这⾥的线性形式。
分层抽样(计算详解)
实验题目:1、某居委会辖有三个居民新村,居委会欲对居民购买彩票的情况进行调查。
调查者考虑以新村分层,在每个新村中随机抽取了10个居民户并进行了调查每户最近一个月购买彩票花费的金额(元),下表为每个新村及调查的情况:请估计该小区居民户购买彩票的平均支出,并给出估计的标准差。
给出95%的置信区间,并与简单随机抽样进行精度比较。
2、随着经济发展,某市居民正在悄悄改变过年的习惯,虽然大多数居民除夕夜在家吃年夜饭、看电视节目,但是有些家庭到饭店吃年夜饭,或逛夜市,或用过年的假期到外地旅游。
为研究这种现象,某研究机构以市中心165万居民户作为研究对象,将居民户按6个行政区分层,每个行政区随机抽取了30户居民户进行了调查(各层抽样比可以忽略),每个行政区的情况以及在家吃年夜饭、看电视节目的居民户比例如下表:试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。
9.030273011===a p933.030283022===a p9.030273033===a p 867.030263044===a p933.030283055===a p 967.030293066===a p867.0*09.09.0*14.0933.0*21.09.0*18.0+++==∑pw p hHhst923.0967.0*22.0933.0*16.0≈++06.0*933.0*301*1.0*9.0*301*)1(1)(ˆ21.018.0222+=--=∑p p nf w p hhhhhhstV067.0*933.0*301*133.0*867.0*301*1.0*9.0*301*16.009.014.0222+++838.322.042033.0*967.0*301*-=+P:[)(ˆ96.1p pststV±]=[0.923±1.96*838.34-]=[0.866,0.979]。
分层抽样的案例(文档3篇)
分层抽样的案例(文档3篇)以下是网友分享的关于分层抽样的案例的资料3篇,希望对您有所帮助,就爱阅读感谢您的支持。
第一篇某市有300所小学,共有240000名学生,这些小学分布在全市5个行政区中,其中重点小学有30所,一般小学有240所,较差的小学有30所。
现在要从全市小学生中抽取1200名学生进行调查,以了解全市小学生的学习情况。
请设计一份抽样方案。
答:分层抽样方案:1、因为有300所小学,240000名学生,假设每所小学的学生人数相同,所以每所小学有学生人数800名。
2、又因为有重点小学30所,一般小学240所,较差小学30所,所以重点小学有学生人数24000名,一般小学有学生人数192000名,较差小学有学生人数24000名。
3、因为要从240000名学生中抽取1200名学生进行调查,所以1200:240000=1:200,即每200名学生中抽取1名学生进行调查,所以由第2步得出24000×1/200=120名;192000×1/200=960名;24000×1/200=120名,然后按照简单随机抽样的方法分别抽取相应的人数。
4、综上所述,要从240000名学生中抽取1200名学生进行调查,应当从30所重点小学中抽取120名学生,从240所一般小学中抽取960名学生,从30所较差小学中抽取120名学生,共计1200名学生。
第二篇作者:金勇进石可统计研究2000年02期一、问题的提出分层抽样中样本量在各层中如何分配,这是抽样设计中的一个重要问题。
计算各层的样本量需要一些辅助信息,如各层中目标变量的方差。
在抽样调查的实践中,特别是一次性的抽样调查中,上述所需的辅助信息常常不具备,因此,我们面临着在信息量最小的条件下如何在各层中分配样本量的问题。
本文产生于作者在美国NORC(National Opinion Research Center)进行研究期间所做的调查设计中的一个实例,这里对其进行了归纳,,加工,提炼与析,希望能够就极小信息量条件下如何在分层抽样中进行样本量的分配这一问题提供一种思考的途径。
高中数学(人教B版)必修第二册:分层抽样【精品课件】
2.下列试验中最适合用分层抽样法抽样的是( ) A.从一箱 3 000 个零件中抽取 5 个入样 B.从一箱 3 000 个零件中抽取 600 个入样 C.从一箱 30 个零件中抽取 5 个入样 D.从甲厂生产的 100 个零件和乙厂生产的 200 个零件中抽取 6 个入样 D [D 选项中甲、乙生产的零件有差异,最适合分层抽样.]
160 [男生人数为 560×5602+80420=160.]14源自合 作探究
释 疑
难
15
分层抽样的概念 【例 1】 (1)下列各项中属于分层抽样的特点的是( ) A.从总体中逐个抽取 B.将总体分成几层,分层进行抽取 C.将总体分成几部分,按事先确定的规则在各部分中抽取 D.将总体随意分成几部分,然后进行随机抽取
(2)分成的各层互不交叉;
(3)各层抽取的比例都等于样本容量在总体中的比例,即Nn ,其中 n 为样本容量,N 为总体容量.
31
2.计算各层所抽取个体的个数时,若 Ni·Nn 的值不是整数怎么 办?
[提示] 为获取各层的入样数目,需先正确计算出抽样比Nn,若 Ni·Nn 的值不是整数,可四舍五入取整,也可先将该层等可能地剔除多 余的个体.
21
(1)④ (2)分层抽样 [(1)①中对四个饲养房抽取的白鼠平均分, 但由于各饲养房所养数量不一,反而造成了每个个体入选的可能性 不相等,是错误的方法.②中保证了每个个体入选的可能性相等, 但由于没有注意到处在四个不同环境会产生不同差异,不如采用分 层抽样可靠性高,且统一编号、统一选择加大了工作量.③中总体 采用了分层抽样,但在每个层次中抽取时有一定的主观性,貌似随 机,实则每个个体被抽到的可能性无法保证相等.
11
3.甲校有 3 600 名学生,乙校有 5 400 名学生,丙校有 1 800 名学生,为统计三校学生某方面的情况,计划采用分层抽样法抽取 一个容量为 90 的样本,应在这三校分别抽取学生( )
分层抽样和随机抽样详解
例1:某地农田分布在山地、丘陵、平原、洼地不同的地形上, 要对这个地区的农作物产量进行调查,应当采用什么抽样方法? 解:由于不同类型的农田之间的产量有较大差异,应当采用分 层抽样的方法,对不同类型的农田按其占总数的比例来抽取样 本.
例2:某公司有1000名员工,其中:高层管理人员为50名,属于高 收入者;中层管理人员为150名,属于中等收入者;一般员工为800 名,属于低收入者.要对这个公司员工的收入情况进行调查,欲抽
2.2 分层抽样与系统抽样
1. 正确理解分层抽样、系统抽样的概念,掌握 分层抽样、系统抽样的一般步骤. 2. 掌握分层抽样、系统抽样的特点,并能根据
实际问题确定选用哪种抽样方法.
自学导引
分层抽样的概念
属性特征 分成若干类型(有时称作层),然 将总体按其_________ 随机 抽取一定的样本,这种抽样方法 后在每个类型中_____ 称为分层抽样,有时也称为类型抽样.
调查方案.
解:我们可以采用系统抽样,按照下面的步骤设计方案. 第一步 按生产时间将一天分为50个时间段,也就是说,每个时间段
大约生产
10000 = 200 件产品.这时,抽样距就是200. 50
第二步 将一天中生产的机器零件按生产时间进行顺序编号.比如,第 一个生产出的零件就是0号,第二个生产出的零件就是1号等.
第一步 把这些图书分成40个组,由于 362 的商是9,余数是2,所以每个组 有9册书,还剩2册书.这时,抽样距就是9.
40
第二步 先用简单随机抽样的方法从这些书中抽取2册书,不进行检验. 第三步 将剩下的书进行编号,编号分别为0,1,...,359. 第四步 从第一组(编号分别为0,1,…,8)的书中按照简单随机抽样的方法, 抽取1册书,比如说,其编号为k. 第五步 顺序地抽取编号分别为下面数字的书:k+9,k+18,k+27,…,k+39×9,
2.1.3 分层抽样
(2)如果采用分层抽样,从个体数为N的总体 中抽取一个容量为n样本,那么每个个体被抽 到的可能性为( C )
1 A. N
1 B. n
n C. N
D. N
n
分析:根据每个个体都等可能入样,所 以其可能性等于样本容量与总体容量之比.
定层抽取容量
抽样 组样 结束
要点分析: (1) 当总体是由差异明显的几个部分组成时 ,往往选用分层抽样的方法.
(2)每个个体被抽中的可能性相同 (3)每一层抽取的数=
该层个体数 总体个体数 样本 × 容量
〖探究交流〗 (1)分层抽样又称类型抽样,即将相似的 个体归入一类(层),然后每层抽取若干个 体构成样本,所以分层抽样为保证每个个体 等可能入样,必须进行 (C) A、每层等可能抽样 B、每层不等可能抽样 C、所有层按同一抽样比等可能抽样 D、以上答案都不对
B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法 D.简单随机抽档法,分层抽样法
5、某单位有工程师6人,技术员12人,技工18 人,要从这些人中抽取一个容量为n的样本;如果采 用系统抽样和分层抽样方法抽取,不用剔除个体; 如果样本容量增加1个,则在采用系统抽样时,需要 在总体中先剔除1个个体,求得样本容量为___. 6
4、(2004年全国高考湖南卷)某公司在甲、 乙、丙、丁四个地区分别有150个、120个、180 个、150个销售点,公司为了调查产品销售的情 况,需从这600个销售点中抽取一个容量为100的 样本,记这项调查为①;在丙地区中有20个特大 型销售点,要从中抽取7个调查其销售收入和销 后服务等情况,记这项调查为②.则完成①、②这 两项调查采用的抽样方法依次是( B ) A.分层抽样法,系统抽样法
抽样技术第4章分层抽样
4.7 事后分层
在实际当中,有时进行事先分层会存在 一定的困难。 1.各层的抽样框无法得到。 2.几个变量都适合于分层,而要进行事先的 多重交叉分层存在一定困难。 3.总体规模太大,事先分层太费事等。 在这种情况下,就可以考虑采用事后分层 技术。
事后分层的具体实施办法是:先采用简
单随机抽样的方法从总体中抽取一个样本
第四章 分层抽样
4.1 什么是分层抽样
在例2.4中我们用简单随机抽样估计每 个郡的平均农场面积。我们提到,即使我 们认真细致地产生了一个随机样本,还是 有一些地区被过分代表,而另一些则根本 没有代表。例4.1用分层抽样保持分层变量 在样本中的均衡,从而使得总体得到全面 的估计。
使用分层抽样的理由: 1.我们要防止得到一个很差的样本。
分层抽样比例
如我们在2.3中所观察到的一样,比例是取
值为0到1之间的一个变量的均值,为了得
到比例的推断,我们用等式(4.1)—
(4.5),其中
,
,
则有
估计总体单元的总数有一个特别相似的性质:
因此,总体单元的总数估计量是每层总数估
计量之和 。类似有
。
例4.3 美国团体学习委员会(ACLS)用分层随 机抽样在七门学科中选取ACLS中的团体研究出版 物格局和属于这些团体的学者使用电脑和图书馆 的情况。数据见表4.2.
单元数。这样第h层中第j个单元入样的概率
为
。因此,抽样权重只是抽样概率
的倒数:
(4.8)
抽样权重之和等于总体容量N,每个抽样单 元代表一特定数量的总体单元。因此,整 个样本代表整个总体。这个定义可以用于 检验权重变量是否正确:如果样本权重之 和是其它的数,而不是N,那么肯定有某个 地方出错了。 总体总数的估计量可以写成以下形式:
9.1.2分层随机抽样
中年职工为: 400 5 200人 10
青年职工为:400 3 120人 10
老年职工为:400 2 80人 10
例 2 某市的 3 个区共有高中学生 20 000 人,且 3 个区的高 中学生人数之比为 2∶3∶5,现要从所有学生中抽取一个容量 为 200 的样本,调查该市高中学生的视力情况,试写出抽样 过程.
强调两点:
(1)分层抽样是等概率抽样,它也是公平的。用分 层抽样从个体为N的总体中抽取一个容量为n的样本 时,在整个抽样过程中每个个体被抽到的概率相等 为n/N。
(2)分层抽样是建立在简单随机抽样的基础上的, 由于它充分利用了已知信息,因此它获取的样本更 具代表性,在实用中更为广泛。
分层抽样的步骤:
解:(1)确定样本容量与总体的个体数之比100:500=1:5。
12( 依5次2)为利, 用抽2样8比0确定各,, 即年29龄5,5段5应6,抽1取9。的个体数, 5(3)利用简单5随机抽样或系5统抽样的方法,从各
年龄段分别抽取25,56,19人,然后合在一起,就 是所抽取的样本。
分层抽样
将总体按其属性特征分成若干类型(有时称作 层),然后在每个类型中按照所占比例随机抽取 一定的样本。这种抽样方法通常叫作分层抽样, 有时也称为类型抽样。
(2)能否在三个年级中平均抽取?
(3)三个年级中个体有较大差别,应如何提高样本 的代表性? 应考虑他们在样本中所占的比例。
创设情境
(4)如何确定各年级所要抽取的人数?
高一
高二
高三
总计
总体
1000
800
700
2500
分层抽样
分层抽样————————————————————————————————作者: ————————————————————————————————日期:ﻩ分层抽样抽样技术作为现代统计学科体系的重要组成部分,被广泛运用到社会实践当中。
自从1895年挪威首任中央统计局局长凯尔在伯尔尼第五届国际统计学会会议上提出所谓“代表性调查”的抽样方法以来,经过100多年的理论探讨和时间积累,抽样理论更加科学,抽样技术日臻完善。
抽样又称取样。
其原理是从研究的全部样品中抽取一部分样品单位。
从被抽取样品单位的分析、研究结果来估计和推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法。
基本的抽样技术包括简单随机抽样,系统抽样,分层抽样,多阶段抽样等。
在实际的抽样调查中我们常常会根据调查成本,调查规模等结合运用各种抽样方法进行实践。
分层抽样是通过对总体单位进行分类,即分成若干子总体,子总体之间比较相似,使每一个字总体的方差变小,这样只需要在子总体中抽取少量样本单位,就能很好地代表子总体的特征,从而提高对整个总体估计的精度。
分层抽样需要事先知道各层权重,但在现实情况下有些资料无法提前预知。
这时我们可以先从总体中抽取一个大的初始样本,从而获得有关的辅助信息,然后再从初始样本中抽取一个字样本,这种方法就是双重抽样。
其定义为,当简单性状与复杂性状存在关系时可用抽取简单性状来间接估计复杂性状的抽样方法。
结合分层抽样的双重抽样方法即为分层的双重抽样。
分层抽样,的主要特点就是可以提高估计精度,它不但能对总体进行估计。
同时可以对各层子总体进行估计。
如此便于实际中抽样的组织和实施。
下面我们就分层抽样方法展开讨论,运用实例分析进行比较。
一、分层抽样的原理简介在抽样之前,先将总体N 个单位划分成L个互不重复的子总体,每个子总体成为层,他们的大小分别为L N N N N ...,,,321,这L 层构成整个总体(1lh N Nh ==∑)。
2.1.3分层抽样
2.1.3分层抽样考点学习目标核心素养分层抽样的概念理解分层抽样的概念数学抽象分层抽样的使用条件和操作步骤掌握分层抽样的使用条件和操作步骤,会用分层抽样法进行抽样逻辑推理、数学运算问题导学(1)什么叫分层抽样?(2)分层抽样适用于什么情况?(3)分层抽样时,每个个体被抽到的机会是相等的吗?1.分层抽样的概念一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的特点(1)适用于总体由差异明显的几部分组成的情况.(2)更充分地反映了总体的情况,使样本具有较强的代表性.(3)等可能抽样,每个个体被抽到的可能性都是n N.3.分层抽样中分层原则(1)层内样本的差异要小,各层之间样本的差异要大.(2)分层后总体中的每个个体互不重叠,也不遗漏.4.抽样比(1)分层抽样也称“按比例抽样”,这里的“按比例”是指:①样本中第n层的个体数总体中第n层的个体数=样本容量总体容量;②总体中第m层的个体数总体中第n层的个体数=样本中第m层的个体数样本中第n层的个体数.(2)分层抽样中,每个个体被抽到的可能性是相等的,与层数、分层情况无关.■名师点拨如果总体的个数为N,样本容量为n,N i为第i层的个体数,则第i层抽取的个体数n i=n ·N i N ,每个个体被抽到的可能性是n i N i =1N i ·n ·N i N =n N.判断正误(对的打“√”,错的打“×”)(1)系统抽样时,将总体分成均等的几部分,每部分抽取一个,符合分层抽样,故系统抽样就是一种特殊的分层抽样.( )(2)在分层抽样时,每层可以不等可能抽样.( )(3)在分层抽样的过程中,每个个体被抽到的可能性是相同的,与层数及分层有关.( ) 解析:(1)因为分层抽样是从各层独立地抽取个体,而系统抽样各段上抽取时是按事先定好的规则进行的,各层编号有联系,不是独立的,故系统抽样不同于分层抽样.(2)分层抽样时,每层仍然要等可能抽样. (3)与层数及分层无关. 答案:(1)× (2)× (3)×(2020·江西省临川第一中学期末考试)为创建文明城市,共建美好家园,某市教育局拟从3 000名小学生,2 500名初中生和1 500名高中生中抽取700人参与“城市文明知识”问卷调查活动,应采用的最佳抽样方法是( )A .简单随机抽样法B .分层抽样法C .系统抽样法D .简单随机抽样法或系统抽样法解析:选B.根据题意,所有学生明显分成互不交叉的三层,即小学生,初中生,高中生,故采用分层抽样法.故选B.分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等可能抽样,必须进行( )A .每层等可能抽样B .每层可以不等可能抽样C .所有层按同一抽样比等可能抽样D .所有层抽取个体数量相同解析:选C.保证每个个体等可能的被抽取是三种基本抽样方式的共同特征,为了保证这一点,分层抽样时必须在所有层都按同一抽样比等可能抽样.一个班共有54人,其中男同学、女同学之比为5∶4,若抽取9人参加教改调查会,则每个男同学被抽取的可能性为________,每个女同学被抽取的可能性为________.解析:男、女每人被抽取的可能性是相同的,因为男同学共有54×59=30(人),女同学共有54×49=24(人),所以每个男同学被抽取的可能性为530=16,每个女同学被抽取的可能性为424=16.答案:16 16分层抽样的判断某社区有500户家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户.为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本,记作①;某学校高一年级有18名女排运动员,要从中选出4人调查学习负担情况,记作②.那么完成上述两项调查应采用的抽样方法是( )A .①用简单随机抽样法,②用系统抽样法B .①用分层抽样法,②用简单随机抽样法C .①用系统抽样法,②用分层抽样法D .①用分层抽样法,②用系统抽样法【解析】 ①因家庭收入不同其社会购买力也不同,宜用分层抽样的方法.②因总体个数较小,宜用简单随机抽样法.【答案】 B判断一个抽样方法是不是分层抽样的条件(1)看它是否具有分层抽样的特点,如总体中个体差异是否明显.(2)是否按照相同比例从各层中抽取.至于各层内用什么方法抽样是灵活的,可采用简单随机抽样,也可采用系统抽样.(3)在分层抽样中,无论哪一层的个体,被抽中的机会都是相等的,体现了抽样的公平性.(2018·高考全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异,为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.解析:因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.答案:分层抽样分层抽样中的有关计算(1)某单位共有老、中、青年职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为________.(2)某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:高一年级高二年级高三年级泥塑 a b c 剪纸xyz其中x ∶y ∶z =5∶3∶2,且“泥塑”社团的人数占两个社团总人数的35,为了了解学生对两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取________人.【解析】 (1)设该单位老年职工人数为x ,由题意得3x =430-160,解得x =90.则样本中的老年职工人数为90×32160=18.(2)法一:因为“泥塑”社团的人数占总人数的35,故“剪纸”社团的人数占总人数的25,所以“剪纸”社团的人数为800×25=320;因为“剪纸”社团中高二年级人数比例为y x +y +z =32+3+5=310,所以“剪纸”社团中高二年级人数为320×310=96.由题意知,抽样比为50800=116,所以从高二年级“剪纸”社团中抽取的人数为96×116=6.法二:因为“泥塑”社团的人数占总人数的35,故“剪纸”社团的人数占总人数的25,所以抽取的50人的样本中,“剪纸”社团中的人数为50×25=20.又“剪纸”社团中高二年级人数比例为y x +y +z =32+3+5=310,所以从高二年级“剪纸”社团中抽取的人数为20×310=6.【答案】 (1)18 (2)6分层抽样中有关计算的方法(1)抽样比=样本容量n 总体容量N =该层抽取的个体数该层的个体数.(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解.1.为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为8,16,24.若用分层抽样的方法抽取12个城市,则应抽取的中型城市数为( )A .3B .4C .5D .6解析:选 B.根据分层抽样的特点可知,抽样比例为1248=14,则应抽取的中型城市数为16×14=4.2.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,则应抽取超过45岁的职工为________人.解析:抽样比为25∶200=1∶8,而超过45岁的职工有80人,则从中应抽取的个体数为80×18=10.答案:10分层抽样的设计与应用一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?【解】 用分层抽样来抽取样本,步骤如下:(1)分层,按年龄将500名职工分成三层:不到35岁的职工;35至49岁的职工;50岁及50岁以上的职工.(2)确定每层抽取个体的个数.抽样比为100500=15,则在不到35岁的职工中抽取125×15=25(人);在35岁至49岁的职工中抽取280×15=56(人);在50岁及50岁以上的职工中抽出95×15=19(人).(3)在各层分别按系统抽样或随机数法抽取样本. (4)汇总每层抽样,组成样本.分层抽样的操作步骤第一步,计算样本容量与总体的个体数之比.第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数. 第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体. 第四步,将各层抽取的个体合在一起,就得到所取样本.在100个产品中,有一等品20个,二等品30个,三等品50个,现要抽取一个容量为30的样本,请说明抽样过程.解:先将产品按等级分成三层:第一层,一等品20个;第二层,二等品30个;第三层,三等品50个.然后确定每一层抽取的个体数,因为20∶30∶50=2∶3∶5,所以应在第一层中抽取产品6个,在第二层中抽取产品9个,在第三层中抽取产品15个.再分别给这些产品编号并贴上标签,用抽签法或随机数表法在各层中抽取,取到一等品6个,二等品9个,三等品15个,这样就通过分层抽样得到了一个容量为30的样本.三种抽样方法的选择及应用为了考察某学校的教学水平,将抽取这个学校高三年级的部分学生本学年的考试成绩进行统计分析,为了全面反映实际情况,采取以下三种方式进行抽查(已知该学校高三年级共有20个教学班,并且每个班内的学生按随机方式编好了学号,假定该校每班学生人数都相同):①从全年级20个班中任意抽取一个班,再从该班任意抽取20人,考察他们的学习成绩;②每个班都抽取1人,共计20人,考察这20个学生的成绩;③把学生按成绩分成优秀、良好、普通三个级别,从中共抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人).根据上面的叙述,回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中各自采用何种抽样方法?【解】(1)三种抽取方式中,其总体都是高三全体学生本学年的考试成绩,个体都是指高三年级每个学生本学年的考试成绩.第一种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第二种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第三种抽取方式中,样本为所抽取的100名学生本学年的考试成绩,样本容量为100.(2)三种抽取方式中,第一种方式采用的是简单随机抽样法;第二种方式采用的是系统抽样法和简单随机抽样法;第三种方式采用的是分层抽样法和简单随机抽样法.选择抽样方法的思路(1)判断总体是否由差异明显的几部分组成,若是,则选用分层抽样;否则,考虑用简单随机抽样或系统抽样.(2)判断总体容量和样本容量的大小.当总体容量较小时,采用抽签法;当总体容量较大、样本容量较小时,采用随机数表法;当总体容量较大、样本容量也较大时,采用系统抽样.某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各岗位中的人数情况如下表所示:管理技术开发营销生产合计老年40404080200 中年80120160240600 青年40160280720 1 200 合计160320480 1 040 2 000(2)若要开一个有25人参与的讨论单位发展与薪金调整方案的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对某运动会筹备情况的了解程度,则应怎样抽样?解:(1)用分层抽样法,并按老年职工4人,中年职工12人,青年职工24人抽取.(2)用分层抽样法,并按管理岗位2人,技术开发岗位4人,营销岗位6人,生产岗位13人抽取.(3)用系统抽样法,对全部2 000人随机编号,号码为0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,所得到的号码对应的20人即为要抽取的人.1.(2020·贵州省铜仁市第一中学期末考试)某高校有男学生3 000名,女学生7 000名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取男学生300名,女学生700名进行调查,则这种抽样方法是()A.抽签法B.随机数法C.系统抽样法D.分层抽样法解析:选D.总体由男生和女生组成,比例为3 000∶7 000=3∶7,所抽取的比例也是3∶7,这种抽样方法是分层抽样法.故选D.2.(2020·广西钦州市期末考试)某中学共有1 000名学生,其中高一年级350人,该校为了了解本校学生视力情况,用分层抽样的方法从该校学生中抽出一个容量为100的样本进行调查,则应从高一年级抽取的人数为()A.20 B.25C.30 D.35解析:选D.高一年级抽取的人数为3501 000×100=35.故选D.3.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人进行某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案.使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,3,…,270;使用系统抽样时,将学生统一随机编号为1,2,3,…,270,并将整个编号平均分为10段.如果抽得的号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④36,62,88,114,140,166,192,218,244,270. 关于上述样本的下列结论中,正确的是( ) A .②③都不能为系统抽样 B .②④都不能为分层抽样 C .①④都可能为系统抽样 D .①③都可能为分层抽样解析:选D.系统抽样又名“等距抽样”,做到等距的有①③④,但只做到等距还不一定是系统抽样,还应做到10段中每段要抽1个,检查这一点只需看第一个元素是否在1~27 范围内,结果发现④不符合,同时,若为系统抽样,则分段间隔k =27010=27,④也不符合这一要求,所以可能是系统抽样的为①③,因此排除A ,C ;若采用分层抽样,一、二、三年级的人数比例为4∶3∶3,由于共抽取10人,所以三个年级应分别抽取4人、3人、3人,即在1~108范围内要有4个编号,在109~189和190~270范围内要分别有3个编号,符合此要求的有①②③,即它们都可能为分层抽样(其中①③在每一层内采用了系统抽样,②在每一层内采用了简单随机抽样),所以排除B.4.某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.解析:设应抽取的男生人数为x ,则x 900-400=45900,解得x =25.答案:25[A 基础达标]1.为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样解析:选C.我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理,故选C.2.(2020·黑龙江省哈尔滨市第六中学期末考试)某校共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,用分层抽样抽取一个容量为20的样本,则应抽取的后勤人员人数是() A.3 B.2C.15 D.4解析:选A.因为160人抽取20人,所以抽取的比例为20160=18,因为后勤人数为24,所以应抽取24×18=3.故选A.3.(2020·河北省枣强中学期末考试)某中学高二年级共有学生2 400人,为了解他们的身体状况,用分层抽样的方法从中抽取一个容量为80的样本,若样本中共有男生42人,则该校高二年级共有女生()A.1 260 B.1 230C.1 200 D.1 140解析:选D.设女生总人数为x人,由分层抽样的方法,可得抽取女生人数为80-42=38(人),所以802 400=38x,解得x=1 140.故选D.4.(2020·河北省石家庄市期末考试)某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中取一个容量为36的样本,则老年人、中年人、青年人依次抽取的人数是()A.7,11,19 B.7,12,17C.6,13,17 D.6,12,18解析:选D.由题意,老年人27人,中年人54人,青年人81人的比例为1∶2∶3,所以抽取人数:老年人:16×36=6,中年人:26×36=12,青年人:36×36=18.故选D.5.某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为() A.100 B.150C.200 D.250解析:选A.抽样比为703 500=150,该校总人数为1 500+3 500=5 000,则n5 000=150,故n=100.6.(2020·四川省遂宁市期末考试)已知某地区中小学生人数如图所示,用分层抽样的方法抽取200名学生进行调查,则抽取的高中生人数为________.解析:某地区中小学生人数如图所示,用分层抽样的方法抽取200名学生进行调查,则抽取的高中生人数为200×2 0003 500+2 000+4 500=40.答案:407.某校对全校共1 800名学生进行健康调查,选用分层抽样法抽取一个容量为200的样本,已知女生比男生少抽了20人,则该校的女生人数应是________.解析:设抽取的女生人数为x,则x+(x+20)=200,解得x=90,则抽取的女生人数为90,抽取的男生人数为200-90=110,据此可知该校的女生人数应是1 800×90200=810.答案:8108.(2020·湖南省张家界市期末联考)我国古代数学算经十书之一的《九章算术》中有一“衰分”问题“今有北乡八千七百五十人,西乡七千二百五十人,南乡八千三百五十人,凡三乡,发役四百八十七人,则西乡遣____________人”.解析:今有北乡八千七百五十人,西乡七千二百五十人,南乡八千三百五十人,凡三乡,发役四百八十七人,则西乡遣487×7 2508 750+7 250+8 350=145(人).答案:1459.某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作为样本,用系统抽样法将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).(1)若第5组抽出的号码为22,则第8组抽出的号码应是多少? (2)若用分层抽样法,则应从40岁以下年龄段的职工中抽取多少名?解:(1)由分组可知,分段的间隔为5.又第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.(2)由题意知,40岁以下年龄段的职工人数为200×50%=100.若用分层抽样法,则应从40岁以下年龄段的职工中抽取40200×100=20(名).10.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例; (2)游泳组中,青年人、中年人、老年人分别应抽取的人数.解:(1)设登山组人数为x ,游泳组中,青年人、中年人、老年人所占比例分别为a 、b 、c ,则有x ×40%+3xb 4x =47.5%,x ×10%+3xc4x =10%,解得b =50%,c =10%,故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人所占比例分别为40%、50%、10%.(2)游泳组中,抽取的青年人人数为200×34×40%=60(人);抽取的中年人人数为200×34×50%=75(人);抽取的老年人人数为200×34×10%=15(人).即游泳组中,青年人、中年人、老年人分别应抽取的人数为60人,75人,15人.[B能力提升]11.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()A.4 B.5C.6 D.7解析:选C.四类食品的种数比为4∶1∶3∶2,则抽取的植物油类的种数为20×110=2,抽取的果蔬类的种数为20×210=4,二者之和为6种,故选C.12.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.解析:由分层抽样中各层的抽样比相同.样本中甲设备生产的有50件,则乙设备生产的有30件,所以在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品总数为4 800×35+3=1 800(件).答案:1 80013.某单位有工程师6人、技术员12人、技工18人.要从这些人中抽取一个容量为n 的样本,如果采用系统抽样和分层抽样的方法抽取,那么不用剔除个体;如果样本容量增加一个,那么在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n.解:依题意,知总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为36n ,分层抽样的抽样比是n36,抽取工程师的人数为n 36×6=n 6,技术员的人数为n 36×12=n 3,技工的人数为n 36×18=n2,所以n 应是36的约数且是6的倍数,即n =6,12,18. 当样本容量为n +1时,系统抽样的间隔为35n +1.因为35n +1必须为整数,所以n 只能取6,即样本容量n =6.14.(选做题)为了对某课题进行讨论研究,用分层抽样的方法从三所高校A ,B ,C 的相关人员中,抽取若干人组成研究小组,有关数据见下表(单位:人).(2)若从高校B 相关人员中选2人作专题发言,应采用什么抽样法,请写出合理的抽样过程.解:(1)分层抽样是按各层相关人数和抽取人数的比例进行的,所以有x 54=13⇒x =18,3654=y3⇒y =2.故x =18,y =2. (2)总体容量和样本容量较小,所以应采用抽签法,过程如下: 第一步,将36人随机编号,号码为1,2,3,…,36; 第二步,将号码分别写在相同的纸片上,揉成团,制成号签;第三步,将号签放入一个不透明的容器中,充分搅匀,依次不放回地抽取2个号码,并记录上面的编号;第四步,把与号码相对应的人抽出,即可得到所要的样本.。
分层抽样的计算公式
分层抽样的计算公式
p=Cm(t0-t)。
分层抽样样本量的计算公式:p=Cm(t0-t)。
分层抽样法也叫类型抽样法。
它是从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法。
1、首先,辩明突出的(重要的)人口统计特征和分类特征,这些特征与所研究的行为相关。
例如,研究某种产品的消费率时,按常理认为男性和女性有不同的平均消费比率。
2、为了把性别作为有意义的分层标志,调查者肯定能够拿出资料证明男性与女性的消费水平明显不同。
用这种方式可识别出各种不同的显著特征。
调查表明,一般来说,识别出6个重要的显著特征后,再增加显著特征的辨别对于提高样本代表性就没有多大帮助了。
3、确定在每个层次上总体的比例(如性别已被确定为一个显著的特征,那么总体中男性占多少比例,女性占多少比例呢?)。
利用这个比例,可计算出样本中每组(层)应调查的人数。
最后,调查者必须从每层中抽取独立简单随机样本。
9.1.2分层随机抽样课件(人教版)
学习目标
新课讲授
课堂总结
思考:对男生、女生分别进行简单随机抽样,样本量在男生、女生中应 如何分配?
男生人数 男生样本量=
×总样本量
全体学生人数
女生人数 女生样本量=
×总样本量
全体学生人数
无论是男生还是女生, 每个学生被抽到的可 能性相等.
n男=
326 50 23 712
n女=
386 50 27 712
i 1
Xi
Yi
i 1
MX
NY
M
X
N
Y
M N
MN MN MN
m
n
xi
i 1
i 1
yi
mx ny
m
x
n
y
mn
mn mn mn
学习目标
新课讲授
课堂总结
由于用第一层的样本平均数 x 可以估计第1层的总体平均数 X ,第二
层的样本平均数 y 可以估计第2层的总体平均数 Y ,
因此可以用 M
M N
问题2:如何计算总体平均数?
通过计算得出男生和女生身高的样本平均数分别为170.6,160.6.
总体平均数 170.6326 160.6386 165.2,
712
学习目标
新课讲授
课堂总结
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且 仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总 体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.
9.1.2 分层随机抽样
学习目标
新课讲授
课堂总结
1.了解分层随机抽样的特点、适用范围及必要性
2.掌握各层样本量比例分配的方法和分层随机抽样的样本 均值
分层抽样 2
2.1.3分层抽样学习目标(1)正确理解分层抽样的概念; (2)掌握分层抽样的一般步骤;(3)区分简单随机抽样、系统抽样和分层抽样,并选择适当的方法进行抽样。
知识清单:1、分层抽样的定义是:一般地,在抽样时,将总体分成 的层,然后按照 ,从各层 抽取一定数量的个体,将各层取出的个体 作为样本,这种抽样方法是分层抽样。
分层抽样时,每一个个体被抽到的概率都是 相等 的,分层抽样适用于 总体是由差异明显的几部分组成时的抽样 ;在每一层抽样时,采用的抽样方法可以是 随机抽样。
2、分层抽样的步骤:①分层:将总体按一定标准进行分层;② 计算抽样比:计算各层的个体数与总体的个体数的比;③样本容量的分配:按各层的个体数占总体的比确定各层应抽取的样本容量; ④层内抽样:在每一层进行抽样(可用简单随机抽样或系统抽样);⑤定样:最后将每一层抽取的样本汇总合成样本;3、在分层抽样中常用的关系式:该层的个体数各层抽取的个体数总体的个数样本容量 N n 总体中某两层的个体数之比=样本中这两层抽取的个体数之比4、选择抽样方法的规律:(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法;(2)当总体容量较大,样本容量也较小时,可采用随机数法;(3)当总体容量较大时,样本容量也较大时,可采用系统抽样法;(4)当总体是由差异明显的几部分组成时,可采用分层抽样;例题讲解例1 某学校在编教师160人,其中老教师16人,中年教师112人,青年教师32人,为了了解教师得健康状况,要从中抽取一个容量为20的样本,试确定用何种方法抽取?解:①计算抽样比n/N=20/160=1/8②样本容量的分配:样本中老教师人数为16*1/8=2;中年教师人数为112*1/8=14;青年教师人数为32*1/8=4③层内抽样:运用抽签法在16名老教师中抽取2人,运用系统抽样法在112名中年教师中抽取14人,运用抽签法在32名青年教师中抽取4人.④定样:把层内抽样得到的教师汇集一起,得到所求样本。
10.3.2系统抽样和分层抽样
练习2:
1、某工厂生产产品,用传送带将产品送放下一道工序, 质检人员每隔十分钟在传送带的某一个位置取一件检验, 则这种抽样方法是( C )。
A.抽签法
B.随机数表法
C.系统抽样
D.其他
2、采用系统抽样的方法,从个体数为1003的总体中抽
取一个容量50的样本,则在抽样过程中,被剔除的个
系统抽样的特点:(1)用系统抽样抽取样本时,每个
个体被抽到的可能性是相等的, (2)系统抽样适用于总体中个体数 较多,抽取样本容量也较大时; (3)系统抽样是不放回抽样。
巩固知识 典型例题
例4 某中职学校为了解2018级新生的身体发育情况,从 1000名新生中,利用系统抽样,抽取一个容量为50的样本.
个容量为n的样本,要平均分成n段,每段各有1个号码。
( 当N除以n的余数为r时,从总体中剔除r个个体, 将剩下的N-r个 个体重新编号。)
(3)定规:第一段中随机确定起始的个体编号m;然 后按照逐次加k的原则确定后续要抽的编号。
当N被n整除时,取 ;当N除以n的余数为r时,取
(4)抽样:按照一定规矩抽取样本,如抽每段的第m个顺序的
10.3.2 抽样方法----系统抽样、分层抽样
复习:
1、总体和样本 (样本容量) 2、抽样方法 ——1.简单随机抽样 3.简单随机抽样操作办法: ①抽签法(抓阄法)
②随机数法
①用抽签法抽取样本的步骤:
简记为:编号;制签;搅匀;抽签;取个体。
②用随机数表法抽取样本的步骤:
简记为:编号;选号;取个体。
第四步,从该号码起,接着依次取K1,K1+30,K1+2×30,
K1+3×30, … K1+(99)×30直到取够100个样本为止.
13级:2.1.2系统、分层抽样
系统抽样说明 (1)、适用于总体中个体数较大且个体差异不 明显的情况 (2)、剔除多余个体及第一段抽样都用简单随 机抽样,因而与简单随机抽样有密切联系 (3)、是等可能抽样,每个个体被抽到的可能 性相等 (4)系统抽样所得样本的代表性和具体的编号 有关;而简单随机抽样所得样本的代表性与个体 的编号无关,如果编号的个体特征随编号的变化 呈现一定的周期性,可能会使系统抽样的代表性 很差;
注意:
1 、分层抽样适用于总体由差异明显的几 部分组成的情况,每一部分称为层,在每一 层中实行简单随机抽样。
15
2 、分层抽样中分多少层,要视具体情况 而定。总的原则是:层内样本的差异要小, 而层与层之间的差异尽可能地大,否则将失 去分层的意义。 练习:选择合适的抽样方法进行抽样
(1)有30个篮球,其中甲厂生产的有21个,乙厂 生产的有9个,从中抽取10个 分层抽样
(1)将3万人分为5层,其中一个乡镇为一层.
14
(2)、按照样本容量的比例随机抽取各乡镇 应抽取的样本. 300×3/15=60(人),300×2/15=40(人), 300×5/15=100(人),300×2/15=40(人), 300×3/15=60(人),因此各乡镇抽取的人数 分别为60人、40人、100人、40人、60人. (3)、将300人组到一起,即得到一个样本.
(1)抽样 过程中每个 个体被抽到 的可能性相 等 (2)每次 抽出个体后 不再将它放 回,即不放 回抽样
将总体平均分成 在起始部分 总体中 几部分,按预先 时采用简单 个体较 制定的规则在各 随机抽样 多 部分抽取 总体由 各层抽样时 差异明 将总体分成几层, 采用简单随 显的几 机抽样或系 部分组 分层进行抽取 统抽样 成
5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验题目:
1、某居委会辖有三个居民新村,居委会欲对居民购买彩票的情况进行调查。
调查者考虑以新村分层,在每个新村中随机抽取了10个居民户并进行
了调查每户最近一个月购买彩票花费的金额(元),下表为每个新村及
调查的情况:
请估计该小区居民户购买彩票的平均支出,并给出估计的标准差。
给出95%的置信区间,并与简单随机抽样进行精度比较。
2、随着经济发展,某市居民正在悄悄改变过年的习惯,虽然大多数居民除
夕夜在家吃年夜饭、看电视节目,但是有些家庭到饭店吃年夜饭,或逛
夜市,或用过年的假期到外地旅游。
为研究这种现象,某研究机构以市
中心165万居民户作为研究对象,将居民户按6个行政区分层,每个行
政区随机抽取了30户居民户进行了调查(各层抽样比可以忽略),每个
行政区的情况以及在家吃年夜饭、看电视节目的居民户比例如下表:
试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。
9.03027301
1
===a p
933.030
283022===a p
9.030
27
303
3
===a p 867.03026304
4
===a p
933.030283055
===
a p 967.03029306
6
===a p
867.0*09.09.0*14.0933.0*21.09.0*18.0+++==∑p
w p h
H
h
st
923.0967.0*22.0933.0*16.0≈++
06.0*933.0*301
*1.0*9.0*301*)1(1)(ˆ21.018.02
2
2+=--
=∑p p n
f w p h
h
h
h
h
h
st
V
067.0*933.0*301*133.0*867.0*301*1.0*9.0*301*
16.009.014.02
22
+++
838.322.04
2
033.0*967.0*30
1*
-=+
P:[
)(ˆ96.1p p
st
st
V
±]=[0.923±1.96*838
.34
-]=[0.866,0.979]。