随机抽样知识讲解
高考数学概率统计知识点总结(文理通用)
概率与统计知识点及专练(一)统计基础知识:1. 随机抽样:(1).简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.(2).系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).(3).分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.2. 普通的众数、平均数、中位数及方差: (1).众数:一组数据中,出现次数最多的数(2).平均数:常规平均数:12nx x x x n ++⋅⋅⋅+=(3).中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数(4).方差:2222121[()()()]n s x x x x x x n =-+-+⋅⋅⋅+-(5).标准差:s3 .频率直方分布图中的频率:(1).频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数; 频数=总数*频率(2).频率之和等于1:121n f f f ++⋅⋅⋅+=;即面积之和为1: 121n S S S ++⋅⋅⋅+=4. 频率直方分布图下的众数、平均数、中位数及方差: (1).众数:最高小矩形底边的中点(2).平均数:112233n n x x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+(3).中位数:从左到右或者从右到左累加,面积等于0.5时x 的值(4).方差:22221122()()()nn s x x f x x f x x f =-+-+⋅⋅⋅+-5.线性回归直线方程:(1).公式:ˆˆˆy bx a=+其中:1122211()()ˆ()n ni i i ii in ni ii ix x y y x y nxybx x x nx====---∑∑==--∑∑(展开)ˆˆa y bx=-(2).线性回归直线方程必过样本中心(,) x y(3).ˆ0:b>正相关;ˆ0:b<负相关(4).线性回归直线方程:ˆˆˆy bx a=+的斜率ˆb中,两个公式中分子、分母对应也相等;中间可以推导得到6. 回归分析:(1).残差:ˆˆi i ie y y=-(残差=真实值—预报值)分析:ˆie越小越好(2).残差平方和:2 1ˆ() ni iiy y =-∑分析:①意义:越小越好;②计算:222211221ˆˆˆˆ()()()() ni i n niy y y y y y y y =-=-+-+⋅⋅⋅+-∑(3).拟合度(相关指数):2 2121ˆ()1()ni iiniiy y Ry y==-∑=--∑分析:①.(]20,1R∈的常数;②.越大拟合度越高(4).相关系数:()()n ni i i ix x y y x y nx y r---⋅∑∑==分析:①.[1,1]r∈-的常数;②.0:r>正相关;0:r<负相关③.[0,0.25]r∈;相关性很弱;(0.25,0.75)r∈;相关性一般;[0.75,1]r∈;相关性很强7. 独立性检验:(1).2×2列联表(卡方图): (2).独立性检验公式①.22()()()()()n ad bc k a b c d a c b d -=++++②.上界P 对照表:(3).独立性检验步骤:①.计算观察值k :2()()()()()n ad bc k a b c d a c b d -=++++ ②.查找临界值0k :由犯错误概率P ,根据上表查找临界值0k③.下结论:0k k ≥即认为有P 的没把握、有1-P 以上的有把握认为两个量相关;0k k <:即认为没有1-P 以上的把握认为两个量是相关关系。
简单随机抽样-高中数学知识点讲解
简单随机抽样1.简单随机抽样【知识点的认识】1.定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.特点:(1)有限性:总体个体数有限;(2)逐个性:每次只抽取一个个体;(3)不放回:抽取样本不放回,样本无重复个体;(4)等概率:每个个体被抽到的机会相等.(如果从个体数为N 的总体中抽取一个容量为n 的样本,则每个个体푛被抽取的概率等于푁)3.适用范围:总体中个数较少.4.注意:随机抽样不是随意或随便抽取,随意或随便抽取都会带有主观或客观的影响因素.【常用方法】1.抽签法(抓阄法)一般地,从个体总数为N 的总体中抽取一个容量为k 的样本,步骤为:(1)编号:将总体中所有个体编号(号码可以为 1﹣N);(2)制签:将编号写在形状、大小相同的号签上(可用小球、卡片、纸条等制作);(3)搅匀:将号签放在同一个箱子中进行均匀搅拌;(4)抽签:每次从箱中取出 1 个号签,连续抽取k 次;(5)取样:从总体中取出与抽到号签编号一致的个体.2.随机数表法.○随机数表:由 0﹣9 十个数字所组成,其中的每个数都是用随机方法产生的,这样的表称为随机数表.实现步骤:(1)编号:对总体中所有个体编号(每个号码位数一致);(2)选数:在随机数表中任选一个数作为开始;(3)取数:从选定的起始数沿任意方向取数(不在号码范围内的数、重复出现的数不取),直到取满为止;(4)取样:根据所得的号码从总体中抽取相应个体.【命题方向】以基本题(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考查学生学习基础知识、应用基础知识、解决实际问题的能力.(1)考查简单随机抽样的特点例:用简单随机抽样的方法从含有 100 个个体的总体中依次抽取一个容量为 5 的样本,则个体m 被抽到的概率为()1111A.100B.20C.99D.50分析:依据简单随机抽样方式,总体中的每个个体被抽到的概率都是一样的,再结合容量为 5,可以看成是抽 5 次,从而可求得概率.1解答:一个总体含有 100 个个体,某个个体被抽到的概率为,100∴以简单随机抽样方式从该总体中抽取一个容量为 5 的样本,1则指定的某个个体被抽到的概率为100× 5 =1.20故选:B.点评:不论用哪种抽样方法,不论是“逐个地抽取”,还是“一次性地抽取”,总体中的每个个体被抽到的概率都是一样的,体现了抽样方法具有客观公平性.(2)判断抽样方法是否为简单随机抽样常见与分层抽样、系统抽样对比,注意掌握各种抽样方法的区分.例:下面的抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每 100 万张为一个开奖组,通过随机抽取的方式确定号码的后四位为 2709 的2/ 4B.某车间包装一种产品,在自动包装的传送带上,每隔 30 分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取 2 人、14 人、4 人了解学校机构改革的意见D.用抽签法从 10 件产品中选取 3 件进行质量检验.分析:从所给的四个选项里观察因为抽取的个体间的间隔是固定的;得到A、B 不是简单随机抽样,因为总体的个体有明显的层次,C 不是简单随机抽样,D 是简单随机抽样.解答:A、B 不是简单随机抽样,因为抽取的个体间的间隔是固定的;C 不是简单随机抽样,因为总体的个体有明显的层次;D 是简单随机抽样.故选D.点评:本题考查简单随机抽样,考查分层抽样,考查系统抽样,是一个涉及到所学的所有抽样的问题,注意发现各种抽样的特点,分析清楚抽样的区别.(3)考查简单随机抽样的抽样方法操作例:利用随机数表法对一个容量为 500 编号为 000,001,002,…,499 的产品进行抽样检验,抽取一个容量为 10 的样本,若选定从第 12 行第 5 列的数开始向右读数,(下面摘取了随机数表中的第 11 行至第 15 行),根据下图,读出的第 3 个数是()A.841B.114C.014D.146分析:从随机数表 12 行第 5 列数开始向右读,最先读到的 1 个的编号是 389,再向右三位数一读,将符合条件的选出,不符合的舍去,继续向右读取即可.解答:最先读到的 1 个的编号是 389,向右读下一个数是 775,775 它大于 499,故舍去,再下一个数是 841,舍去,再下一个数是 607,舍去,再下一个数是 449,再下一个数是 983.舍去,再下一个数是 114.读出的第 3 个数是 114.故选B.点评:本题主要考查了抽样方法,随机数表的使用,在随机数表中每个数出现在每个位置的概率是一样的,所以每个数被抽到的概率是一样的,属于基础题.。
随机抽样知识点总结
随机抽样知识点总结随机抽样是统计学中的重要概念,它是指从总体中随机选择一部分个体进行观察与研究的一种方法。
在实际应用中,随机抽样常常被用来代表总体,以便进行统计推断和决策分析。
下面我们来总结一下关于随机抽样的一些重要知识点。
一、随机抽样的定义随机抽样是指从总体中以一定的概率分布随机选择一个或多个个体作为样本的过程。
在进行随机抽样时,要确保每个个体有相等的机会被选入样本,从而保证样本的代表性和可靠性。
二、随机抽样的方法1. 简单随机抽样:从总体中以相等的概率随机选择样本的方法,保证每个个体被选入样本的概率相等。
2. 分层随机抽样:将总体按照某种特定的特征分成若干个层次,然后在每个层次中进行简单随机抽样。
3. 系统抽样:按照一定的规律从总体中选择个体作为样本,例如每隔k个个体选择一个个体作为样本。
4. 整群抽样:将总体分成若干个互不相交的群体(或群组),然后从中随机选择若干个群作为样本。
5. 多阶段抽样:将总体层次化,先进行群组抽样,再在抽样所得的群组内进行简单随机抽样。
三、随机抽样的特点1. 代表性:通过随机抽样,样本能够尽可能代表总体的特征和变异性,从而使得对总体的推断更加准确。
2. 可靠性:在一定的置信水平下,通过对样本数据的分析和推断,可以得出关于总体的可靠性结论。
3. 实用性:随机抽样是一种简单、有效的统计抽样方法,能够在相对较小的成本和时间内获得对总体的有效信息。
四、随机抽样的应用1. 民意调查:随机抽样被广泛应用于民意调查中,通过对选民的随机抽样,可以得出对全国范围内的选民意见的推断。
2. 商品抽检:在商品生产过程中,可以通过随机抽样对产品进行抽检,保证产品质量的可靠性和稳定性。
3. 医学实验:在医学研究中,可以通过随机抽样的方式选择研究对象,以保证研究结论的有效性和可靠性。
4. 企业调查:在市场调研、消费者满意度调查等方面,也常常运用随机抽样的方法进行样本选择,以获得对总体的准确推断。
数理统计中的随机抽样和抽样分布——概率论知识要点
数理统计中的随机抽样和抽样分布——概率论知识要点概率论作为数理统计的基础,是研究随机现象及其规律的数学分支。
在数理统计中,随机抽样和抽样分布是非常重要的概念,本文将对这两个概念进行详细介绍和解释。
一、随机抽样随机抽样是指从总体中以随机的方式选择样本的过程。
在进行随机抽样时,每个个体被选中的概率应该是相等的,这样才能保证样本的代表性和可靠性。
随机抽样的方法有很多种,常用的包括简单随机抽样、分层抽样和系统抽样等。
1. 简单随机抽样简单随机抽样是最基本的抽样方法,它的特点是每个个体被选中的概率相等且相互独立。
简单随机抽样可以通过随机数表、随机数发生器等工具来实现。
在实际应用中,简单随机抽样常用于总体规模较小的情况。
2. 分层抽样分层抽样是将总体划分为若干个层次,然后从每个层次中随机选择样本。
这种抽样方法可以保证不同层次的个体在样本中的比例与总体中的比例相同,从而提高样本的代表性。
3. 系统抽样系统抽样是按照一定的规则从总体中选取样本的方法。
例如,可以按照一定的间隔从总体中选择样本,这个间隔称为抽样间隔。
系统抽样的优点是操作简便,但也存在可能引入系统误差的风险。
二、抽样分布抽样分布是指在随机抽样的基础上,通过大量重复抽样得到的统计量的分布情况。
在数理统计中,常用的抽样分布包括正态分布、t分布和F分布等。
1. 正态分布正态分布是一种重要的抽样分布,它具有对称、单峰和钟形曲线的特点。
在大样本情况下,根据中心极限定理,样本均值的分布接近于正态分布。
正态分布在数理统计中的应用非常广泛,例如用于估计总体均值和总体方差等。
2. t分布t分布是用于小样本情况下的抽样分布。
它相比于正态分布来说,具有更宽的尾部和更矮的峰值。
t分布的形状取决于自由度,自由度越大,t分布越接近于正态分布。
t分布在小样本情况下的参数估计和假设检验中经常被使用。
3. F分布F分布是用于比较两个样本方差是否显著不同的抽样分布。
F分布的形状取决于两个样本的自由度,它具有右偏和非对称的特点。
初中了解随机抽样的基本方法知识点
初中了解随机抽样的基本方法知识点随机抽样是统计学中常用的一种抽样方法,通过随机选择样本,可以有效地代表总体,并且减少因抽样误差而引起的统计结论偏差。
在初中阶段,学生需要了解随机抽样的基本方法,以便在未来的学习和实践中能够正确地进行抽样调查和数据分析。
本文将介绍初中学生应该了解的随机抽样的基本方法知识点。
一、简单随机抽样简单随机抽样是一种最基本的抽样方法,它的特点是每个样本有相等的机会被选中。
简单随机抽样的步骤如下:1.首先,确定总体。
总体是指我们要进行抽样调查的对象或群体。
2.然后,确定样本量。
样本量是指我们从总体中随机选择的样本个数。
3.接下来,给总体中的每个个体或元素赋予编号,编号应该是唯一且有序的。
4.使用随机数表或随机数发生器产生随机数,根据随机数选择对应的编号,选中对应的样本。
5.重复步骤4,直到选够所需的样本量。
6.最后,对选中的样本进行调查和分析。
二、系统抽样系统抽样是一种按照一定规则从总体中选择样本的方法,它比简单随机抽样更加高效。
系统抽样的步骤如下:1.确定总体和样本量。
2.给总体中的每个个体或元素赋予编号。
3.计算出总体容量与样本量的比值,得到抽样间距。
4.随机选择一个起始个体,然后按照抽样间距选取样本。
5.重复步骤4,直到达到所需的样本量。
6.最后,对选中的样本进行调查和分析。
三、分层抽样分层抽样是将总体划分为若干层,在每一层中进行抽样。
分层抽样的步骤如下:1.确定总体和样本量。
2.根据总体的特点和目的,将总体划分为若干个层。
3.确定每个层的样本量,并计算出各层的比例或者确定样本量的比例。
4.分别从每个层中进行简单随机抽样或者其他抽样方法抽取样本。
5.对选中的样本进行调查和分析。
四、整群抽样整群抽样是将总体划分为若干个互不重叠的群组,然后从群组中进行抽样。
整群抽样的步骤如下:1.确定总体和群组。
2.将总体划分为互不重叠的群组。
3.确定每个群组的样本量,并计算出各群组的比例或者确定样本量的比例。
人教版高中数学必修三 2.1《随机抽样》知识梳理+跟踪检测
人教版高中数学必修三 第二章 统计2.1《随机抽样》知识梳理知识点一:简单随机抽样1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎨⎧随机数法抽签法 3.简单随机抽样的优点及适用类型简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.知识点二:系统抽样1.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本.2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本,步骤为:(1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k ,对编号进行分段.当N n(n 是样本容量)是整数时,取k =N n; (3)在第1段用简单随机抽样确定第一个个体编号l(l ≤k);(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本.知识点三:简单随机抽样1.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.人教版高中数学必修三第二章统计2.1《随机抽样》跟踪检测一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是1 5B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .126.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,87.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A. 22,100x s +B. 22100,100x s ++C. 2,x sD. 2100,x s +9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A.①②③B.①②④C.①③④D.①②③④10.下列抽样实验中,最适宜用系统抽样的是()A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B.某厂生产的2 000个电子元件中随机抽取5个入样C.从某厂生产的2 000个电子元件中随机抽取200个入样D.从某厂生产的20个电子元件中随机抽取5个入样11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.16712.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为()A.2个B.3个C.5个D.13个13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,614.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,5315.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,916.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. 18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.人.三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:60人进行更为详细的调查,应当怎样进行抽样?23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?2.1《随机抽样》跟踪检测解答一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况[答案] D2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量[答案] C3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对[答案] C[解析]按照一定的规律进行抽取为系统抽样.4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是15B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此 C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同[答案] A[解析] 无论采用哪种抽样,每个个体被抽到的概率相等.5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .12[答案] A[解析] 运动员共计98人,抽取比例为2898=27,因此男运动员56人中抽取16人.6.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,8[答案] C[解析] 由题意得x =15,16.8=51(9+15+10+y +18+24) y =8,选C. 7.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A. 22,100x s + B. 22100,100x s ++ C. 2,x s D. 2100,x s +[答案] D[解析] 设增加工资后10位员工下月工资均值为'x ,方差为2's , 则平均数()()()12101'10010010010x x x x =++++⋅⋅⋅++⎡⎤⎣⎦ ()1210110010010x x x x =++++=+; ()()()222212101'100'100'100'10s x x x x x x ⎡⎤=+-++-+⋅⋅⋅++-⎣⎦ ()()()22221210110x x x x x x s ⎡⎤=-+-+⋅⋅⋅+-=⎣⎦.故选D . 9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A .①②③B .①②④C .①③④D .①②③④[答案] D10.下列抽样实验中,最适宜用系统抽样的是( )A .某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B .某厂生产的2 000个电子元件中随机抽取5个入样C .从某厂生产的2 000个电子元件中随机抽取200个入样D .从某厂生产的20个电子元件中随机抽取5个入样[答案] C[解析] A 中总体有明显层次,不适用系统抽样法;B 中样本容量很小,适宜用简单随机抽样法中的随机数法;D 中总体数很小,故适宜用抽签法,只有C 比较适用系统抽样法.11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A.93B.123C.137D.167[答案] C[解析] 由图可知该校女教师的人数为()11070%150160%7760137⨯+⨯-=+= 故选C12.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为( )A .2个B .3个C .5个D .13个[答案] A[考点]分层抽样方法[分析]由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x ,即可得出结论.解:由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x , ∴x=2,故选A .[点评]本题考查分层抽样,抽样过程中每个个体被抽到的可能性相同,这是解决抽样问题的依据,样本容量、总体个数、每个个体被抽到的概率,这三者可以做到知二求一.13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,6[答案] D[解析]由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×4 20=8,40×820=16,40×520=10,40×320=6.14.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,53[答案] A[解析]样本中共有30个数据,中位数为4547462+=;显然样本中数据出现次数最多的为45,故众数为45;极差为68-12=56,故选A.15.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,9[答案] B[解析]各年龄段所选分别为20100×45=9,20100×25=5,20100×30=6.16.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36[答案] B[解析]设该单位老年职工有x人,从中抽取y人.则160+3x=430⇒x=90,即老年职工有90人,则90160=y32⇒y=18.故选B.二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. [答案]30[解析]由题意,知22+3+5×n=6,∴n=30.18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.[答案]760[解析]设该校女生人数为x,则男生人数为(1 600-x).由已知,2001 600×(1 600-x)-2001 600·x=10,解得x=760.故该校的女生人数是760人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.[答案] 5.7%[解析]∵990∶99 000=1∶100,∴普通家庭中拥有3套或3套以上住房的大约为50×100=5 000(户).又∵100∶1 000=1∶10,∴高收入家庭中拥有3套或3套以上住房的大约为70×10=700(户).∴3套或3套以上住房的家庭约有5 000+700=5 700(户).故5 700100 000=5.7%.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.[答案]3720[解析]由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.40岁以下的年龄段的职工数为200×0.5=100,则应抽取的人数为40200×100=20(人).21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.生活能否自理人数性别男女能178 278不能23 21人.[答案]60[解析]由表知500人中生活不能自理的男性比女性多2人,所以该地区15 000位老人生活不能自理的男性比女性多2×15 000500=60(人).三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:很喜爱喜爱一般不喜爱2 435 4 5673 926 1 07260人进行更为详细的调查,应当怎样进行抽样?解:可用分层抽样方法,其总体容量为12 000.“很喜爱”占2 43512 000,应取60×2 43512 000≈12(人);“喜爱”占4 56712 000,应取60×4 56712 000≈23(人);“一般”占3 92612 000,应取60×3 92612 000≈20(人);“不喜爱”占1 07212 000,应取60×1 07212 000≈5(人).因此采用分层抽样在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?解:(1)将624名职工用随机方式编号由000至623.(2)利用随机数法从总体中剔除4人.(3)将剩下的620名职工重新编号由000至619.(4)分段,取间隔k=62062=10,将总体分成62组,每组含10人.(5)从第一段,即为000到009号随机抽取一个号l.(6)按编号将l,10+l,20+l,…,610+l,共62个号码选出,这62个号码所对应的职工组成样本.24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?解:学生A的方法得到的样本不能够反映不上网的居民情况,是一种方便样本,所得的结果代表性差,不能很准确地获得平均每户居民的月用水量;学生B 的方法实际上是普查,花费的人力物力要多一些,但是如果统计过程不出错,可以准确地得到平均每户居民的月用水量;在小区的每户居民都装有电话的情况下,学生C的方法是一种随机抽样方法,所得的样本具有代表性,可以比较准确地获得平均每户居民的月用水量.在小区的每户居民都装有电话的情况下,建议用随机抽样的方法获取数据,即用学生C的方法,以节省人力物力,并且可以得到比较精确的结果.5、已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为( )A. 0.4.3ˆ2yx =+ B. 2 2.4ˆy x =- C. 9ˆ2.5yx =-+ D. 0.3 4.4ˆy x =-+ [答案] A[解析] 变量x 与y 正相关,可以排除C,D;样本平均数代入可求这组样本数据的回归直线方程.∵变量x 与y 正相关,∴可以排除C,D;样本平均数3x =, 3.5y =,代入A 符合,B 不符合,故选A.。
第1节 随机抽样
第1节随机抽样知识梳理1.简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.2.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.诊断自测1.判断下列结论正误(在括号内打“√”或“×”)(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关.()(2)抽签法中,先抽的人抽中的可能性大.()(3)简单随机抽样是一种不放回抽样.()(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()答案 (1)× (2)× (3)√ (4)×2.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是( )A .总体B .个体C .样本的容量D .从总体中抽取的一个样本答案 A解析 由题目条件知,5000名居民的阅读时间的全体是总体;其中每1名居民的阅读时间是个体;从5000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.3.一个公司共有N 名员工,下设一些部门,要采用等比例分层抽样的方法从全体员工中抽取样本容量为n 的样本,已知某部门有m 名员工,那么从该部门抽取的员工人数是________.答案 nm N解析 每个个体被抽到的概率是n N ,设这个部门抽取了x 个员工,则x m =n N ,∴x=nm N .4.(2020·上饶一模)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为( ) 附:第6行至第9行的随机数表如下:26357900337091601620388277574950321149197306491676778733997467322748619871644148708628888519162074770111163024042979799196835125A .3B .16C .38D .20答案 D解析 按随机数表法,从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,超出00~49及重复的不选,则编号依次为33,16,20,38,49,32,…,则选出的第3个个体的编号为20,故选D.5.(2020·百校大联考)在新冠肺炎疫情期间,大多数学生都进行网上上课.我校高一、高二、高三共有学生1800名,为了了解同学们对“钉钉”授课软件的意见,计划采用分层抽样的方法从这1800名学生中抽取一个容量为72的样本.若从高一、高二、高三抽取的人数恰好是从小到大排列的连续偶数,则我校高三年级的人数为()A.800 B.750 C.700 D.650答案D解析设从高三年级抽取的学生人数为2x人,则从高二、高一年级抽取的人数分别为2x-2,2x-4.由题意可得2x+(2x-2)+(2x-4)=72,∴x=13.设我校高三年级的学生人数为N,且高三抽取26人,由分层抽样,得N1800=2672,∴N=650(人).6.(2018·全国Ⅲ卷改编)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样和分层抽样,则最合适的抽样方法是________.答案分层抽样解析因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.考点一简单随机抽样及其应用1.下面的抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D .用抽签方法从10件产品中选取3件进行质量检验答案 D解析 A ,B 不是简单随机抽样,因为抽取的个体间的间隔是固定的;C 不是简单随机抽样,因为总体中的个体有明显的层次;D 是简单随机抽样.故选D.2.用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )A.110,110B.310,15C.15,.310D.310,310答案 A解析 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110,故选A.3.(多选题)(2021·聊城模拟)要考察某种品牌的850颗种子的发芽率,利用随机数表法抽取50颗种子进行实验.先将850颗种子按001,002,…,850进行编号,如果从随机数表第2行第2列的数开始并向右读,下列选项中属于最先检验的4颗种子中一个的是________(下面抽取了随机数表第1行至第3行).( ) 03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95 97 74 94 67 74 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73 16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10A .774B .946C .428D .572答案 ACD解析 依据题意可知:向右读数依次为:774,946,774,428,114,572,042,533,…所以最先检验的4颗种子符合条件的为:774,428,114,572,结合选项知选ACD.感悟升华 1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.2.简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).考点二分层抽样及其应用角度1求某层入样的个体数【例1】某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20000人,其中各种态度对应的人数如下表所示:人进行详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为() A.25,25,25,25B.48,72,64,16C.20,40,30,10D.24,36,32,8答案D解析法一因为抽样比为10020000=1200,所以每类人中应抽取的人数分别为4800×1200=24,7200×1200=36,6400×1200=32,1600×1200=8.法二最喜爱、喜爱、一般、不喜欢的比例为4800∶7200∶6400∶1600=6∶9∶8∶2,所以每类人中应抽取的人数分别为66+9+8+2×100=24,96+9+8+2×100=36,86+9+8+2×100=32,26+9+8+2×100=8.角度2求总体或样本容量【例2】(1)(2020·东北三省四校联考)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n 的样本,其中高中生有24人,那么n等于()A.12B.18C.24D.36(2)(2021·重庆调研)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.答案(1)D(2)1800解析(1)根据分层抽样方法知n960+480=24960,解得n=36.(2)由题设,抽样比为80 4800=160.设甲设备生产的产品为x件,则x60=50,∴x=3000.故乙设备生产的产品总数为4800-3000=1800.感悟升华 1.求某层应抽个体数量:按该层所占总体的比例计算.2.已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.3.分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=样本容量总体容量=各层样本数量各层个体数量”.【训练】(1)(2020·郴州二模)已知我市某居民小区户主人数和户主对户型结构的满意率分别如图1和图2所示,为了解该小区户主对户型结构的满意程度,用分层抽样的方法抽取30%的户主进行调查,则样本容量和抽取的户主对四居室满意的人数分别为()A.240,18B.200,20C.240,20D.200,18(2)(2021·合肥模拟)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种,10种,30种,20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是________.答案(1)A(2)6解析(1)样本容量n=(250+150+400)×30%=240,抽取的户主对四居室满意的人数为150×30%×40%=18.(2)抽样比为2040+10+30+20=15,则抽取的植物油类种数是10×15=2,抽取的果蔬类食品种数是20×15=4,所以抽取的植物油类与果蔬类食品种数之和是2+4=6.A级基础巩固一、选择题1.(多选题)(2021·武汉调研)下列抽样方法不是简单随机抽样的是()A.从平面直角坐标系中抽取5个点作为样本B.某可乐公司从仓库中的1000箱可乐中一次性抽取20箱进行质量检查C.某连队从120名战士中,挑选出50名最优秀的战士去参加抢险救灾活动D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编号)答案AC解析对于A,平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故A中的抽样方法不是简单随机抽样;对于B,一次性抽取与逐个不放回地抽取是等价的,故B中的抽样方法是简单随机抽样;对于C,挑选的50名战士是最优秀的,不符合简单随机抽样的等可能性,故C中的抽样方法不是简单随机抽样;对于D,易知D中的抽样方法是简单随机抽样.2.(多选题)(2020·泰安质检)某公司生产三种型号的轿车,产量分别为1500辆,6000辆和2000辆.为检验该公司的产品质量,公司质监部门要抽取57辆进行检验,则下列说法正确的是()A.应采用分层随机抽样抽取B.应采用抽签法抽取C.三种型号的轿车依次应抽取9辆,36辆,12辆D.这三种型号的轿车,每一辆被抽到的概率都是相等的答案ACD解析因为是三种型号的轿车,个体差异明显,所以采用分层抽样,选项A正确;因为总体量较大,故不宜采用抽签法,选项B错误;抽样比为571500+6000+2000=3500,三种型号的轿车依次应抽取9辆,36辆,12辆,选项C正确.分层抽样中,每一个个体被抽到的可能性相同.故选项D正确.故答案为ACD.3.(2020·首都师范大学附属中学月考)从某班50名同学中选出5人参加户外活动,利用随机数表法抽取样本时,先将50名同学按01,02,…,50进行编号,然后从随机数表的第1行第5列和第6列数字开始从左往右依次选取两个数字,则选出的第5个个体的编号为()(注:表为随机数表的第1行与第2行)A.24答案A解析由题知,从随机数表的第1行第5列和第6列数字开始,由表可知依次选取43,36,47,46,24.4.(多选题)(2021·襄阳联考)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二.学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有()A.应该采用分层随机抽样法B.高一、高二年级应分别抽取100人和135人C.乙被抽到的可能性比甲大D.该问题中的总体是高一、高二年级的全体学生的视力答案ABD解析由于各年级的年龄段不一样,因此应采用分层抽样法.由于比例为23520×50+30×45=110,因此高一年级1000人中应抽取100人,高二年级1350人中应抽取135人,甲、乙被抽到的可能性都是110,因此只有C不正确,故应选ABD.5.如图是调查某学校高三年级男女学生是否喜欢数学的等高条形图,阴影部分的高表示喜欢数学的频率.已知该年级男、女生各500名(所有学生都参加了调查),现从所有喜欢数学的学生中按分层抽样的方式抽取32人,则抽取的男生人数为()A.16 B.32 C.24 D.8答案C解析由题中等高条形图可知喜欢数学的女生和男生的人数比为1∶3,,所以抽取的男生人数为24.故选C.6.某中学400名教师的年龄分布情况如图,现要从中抽取40名教师作样本,若用分层抽样方法,则40岁以下年龄段应抽取()A.40人B.200人C.20人D.10人答案C解析由题图知,40岁以下年龄段的人数为400×50%=200,若采用分层抽样应抽取200×40400=20(人).7.(多选题)(2021·淄博模拟)港珠澳大桥是中国境内一座连接中国香港、广东珠海和中国澳门的桥隧工程,因其超大的建筑规模、空前的施工难度以及顶尖的建造技术闻名世界,为内地前往香港的游客提供了便捷的交通途径,某旅行社分年龄统计了大桥落地以后,由香港大桥实现内地前往香港的老中青旅客的比例分别为5∶2∶3,现使用分层抽样的方法从这些旅客中随机抽取n名,若青年旅客抽到60人,则()A .老年旅客抽到100人B .中年旅客抽到20人C .n =200D .被抽到的老年旅客以及中年旅客人数之和超过200人答案 AC解析 由题意,香港大桥实现内地前往香港的老中青旅客的比例分别为5∶2∶3,若青年旅客抽到60人,现使用分层抽样的方法从这些旅客中随机抽取n 名,所以60n =35+2+3,解得n =200人,则老年旅客抽到60×53=100人,中年旅客抽到60×23=40人,则老年旅客和中年旅客人数之和为160.8.(2020·北京东城区模拟)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如表所示:“不喜欢”的男性青年观众中抽取了6人,则n =( )A .12B .16C .24D .32答案 C解析 由分层抽样的性质得:630=n 30+30+10+50,解得n =24.故选C.二、填空题9.假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,将800袋牛奶按000,001,…,799进行编号,若从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是________(下面摘取了随机数表第7行至第9行).解析由随机数表知,前4个样本的个体编号分别是331,572,455,068. 10.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=________.答案13解析依题意得360=n120+80+60,故n=13.11.(2020·海南质检)《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则乙应出(所得结果四舍五入,保留整数)钱数为________.答案32解析因为甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱.要按照各人带钱多少的比例进行关税.则乙应付:100560+350+180×350=3212109≈32钱.12.某企业三月中旬生产A,B,C三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表格.由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10件,根据以上信息,可得C产品的数量是________.答案800解析设A,C产品数量分别为x件、y件,则由题意可得⎩⎪⎨⎪⎧x +y +1300=3000,(x -y )×1301300=10,解得⎩⎨⎧x =900,y =800. B 级 能力提升13.我国古代数学算经十书之一的《九章算术》有一衰分问题:今有北乡八千一百人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,则北乡遣( )A .104人B .108人C .112人D .120人 答案 B解析 由题意知,抽样比为 3008100+7488+6912=175,所以北乡遣175×8100=108(人).14.下列抽取样本的方式属于简单随机抽样的个数为( ) ①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里. ③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛. A .0 B .1 C .2 D .3 答案 A解析 ①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样.因为它是有放回抽样;③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样.因为不是等可能抽样.故选A.15.甲、乙两所学校高三年级分别有1200人,1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下: 甲校:则A.12,7B.10,7C.10,8D.11,9答案B解析从甲校抽取110×12001200+1000=60(人),从乙校抽取110×12001200+1000=50(人),故x=10,y=7.16.某工厂的三个车间在12月份共生产了3600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从第一、二、三车间抽取的产品数分别为a,b,c,且a,b,c构成等差数列,则第二车间生产的产品数为________.答案1200解析因为a,b,c成等差数列,所以2b=a+c.所以a+b+c3=b.所以第二车间抽取的产品数占抽样产品总数的13.根据分层抽样的性质,可知第二车间生产的产品数占总数的13,即为13×3600=1200.。
《6.2.1简单随机抽样》知识清单
《简单随机抽样》知识清单知识点1简单随机抽样1.简单随机抽样的概念一般地,设一个总体含有N 个个体,从中①_________地抽取n (n ≤N )个个体为样本,如果总体内的每个个体都有相同的可能性被抽到,则把这样的抽样方法称为简单随机抽样.2.常用的简单随机抽样方法(1)抽签法:①假设一个总体有N 个个体,将它们逐一编号;②制作N 个号签(号签可以用小球、纸片等制作),将编号写在号签上;③将号签放在一个容器中,并充分搅拌均匀;④从容器中任意抽取n 个号签,记录其编号,就得到一个容量为n 的样本.(2)随机数法:先把总体中的N (N 为正整数)个个体依次编号,例如按1,2,…,N 编号,然后用随机数工具产生1~N 范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,如果生成的随机数有重复,即同一编号被多次抽到,需剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需的个体数.随机数生成的方法:①用随机试验生成随机数.②用信息技术生成随机数:用计算器生成随机数:用电子表格软件生成随机数;用R 统计软件生成随机数.知识点3总体均值与样本均值1.总体均值一般地,总体中有N 个个体,它们的变量值分别为12,,,N Y Y Y ,则称Y =②________为总体均值,又称总体平均数.2.总体均值加权平均数的形式如果总体的N 个变量值中,不同的值共有()k k N 个,不妨记为12,,,k Y Y Y ,其中i Y 出现的频数为(i f i =1,2,,)k ,则总体均值还可以写成加权平均数的形式Y11ki ii f Y N ==∑. 3.样本均值如果从总体中抽取一个容量为n 的样本,它们的变量值分别为12,,,n y y y ,则称y =③________为样本均值,又称样本平均数.4.总体比例与样本比例(1)总体比例:总体中具有某种特征的单位占所有单位的比例称为总体比例,记作P .一般地,总体中有n 个个体,记总体中第(1,2,,)i i n =个数据具有此种特征的变量值i Y 为1,不具有此种特征的变量值i Y 为0,则总体比例P 就是总体平均数12n Y Y Y Y P n +++==.(2)样本比例:样本中具有某种特征的单位占全部样本单位的比例称为样本比例,记作p .从总体中抽取一个容量为n 的样本,记样本中第(1,2,,)i i n =个数据具有此种特征的变量值i y 为1,不具有此种特征的变量值i y 为0,则样本比例p 就是样本平均数y p =12n y y y n +++=. 【答案】①不放回地全体②1211N N i i Y Y Y Y N N =+++=∑③1211n n i i y y y y n n =+++=∑ 【知识辨析】判断正误,正确的画“√”,错误的画“×”.1.科学的抽样所得到的样本能真实地反映总体.( )2.简单随机抽样中每个个体被抽到的机会都相等.( )3.在某校高一年级1000名学生中,选出个子最高的10名学生参加学校组织的篮球赛,是简单随机抽样.( )4.从高一(1)班抽取8人,若这8人的平均身高为170cm,则该班所有学生的平均身高一定为170cm.( )【答案】1.× 一般通过样本去估计总体,所以样本只能近似地反映总体.2.√ 无论是放回简单随机抽样还是不放回简单随机抽样,每个个体被抽到的机会相等.3.×选出个子最高的10名学生参加学校组织的篮球赛,每个个体被抽到的机会不相等,不是简单随机抽样.4.×样本平均数是总体平均数的估计值,因此该班所有学生的平均身高约为170cm.。
初中了解随机抽样的基本方法知识点
初中了解随机抽样的基本方法知识点随机抽样是统计学中常用的一种数据采集方法,通过从总体中选择一部分样本来进行研究和分析。
了解随机抽样的基本方法对于初中生来说是很重要的,因为它可以帮助他们更好地理解和应用统计学知识。
本文将介绍随机抽样的基本方法知识点,以便初中生能够掌握这一重要的统计学概念。
一、什么是随机抽样?随机抽样是指从总体中按照一定的概率方法选择样本的过程。
在随机抽样中,每个个体被选入样本的概率是相等的,这样可以保证样本的代表性,进而推断出总体的特征。
随机抽样是进行统计研究的基础,能够减小样本误差,提高统计结果的可靠性。
二、随机抽样的基本方法1. 简单随机抽样简单随机抽样是最基本、最常用的抽样方法。
它的特点是每个个体都有相等的机会被选为样本,且样本之间相互独立。
简单随机抽样的步骤如下:(1)确定总体:首先确定要进行抽样研究的总体,比如某个班级的学生。
(2)编制抽样框架:将总体按特定的顺序编号,形成一个抽样框架,比如按学号编号。
(3)确定样本容量:确定需要抽取的样本容量,比如抽取20名学生作为样本。
(4)使用随机数表或随机数发生器:根据抽样框架的编号,利用随机数表或随机数发生器来随机选择样本。
(5)抽取样本:按照随机选择的结果,从抽样框架中抽取样本。
2. 系统抽样系统抽样是在抽样框架上按照一定的规律选择样本的方法。
它的特点是通过均匀地按一定步长选取样本,保证了样本的代表性。
系统抽样的步骤如下:(1)确定总体:同样需要确定要进行抽样研究的总体。
(2)编制抽样框架:同样要将总体按特定的顺序编号,形成一个抽样框架。
(3)确定抽样间隔:确定需要的抽样间隔,即每隔多少个样品抽取一个样本。
(4)随机开始:使用随机数表或随机数发生器,在抽样框架的某个位置上随机选择一个起始点。
(5)抽取样本:从起始点开始,按照抽样间隔,依次选取样本。
3. 分层抽样分层抽样是根据总体的某种特征将总体划分为若干个层次,然后在每个层次中进行独立的随机抽样,最后将不同层次的样本合并在一起。
80随机抽样(基础)-知识讲解_随机抽样_基础
随机抽样编稿:丁会敏审稿:【学习目标】1、了解简单随机抽样的概念,掌握实施简单随机抽样的常用方法:抽签法和随机数表法;2、了解系统抽样的意义,并会用系统抽样的方法从总体中抽取样本;3、了解分层抽样的概念与特征,清楚简单随机抽样、系统抽样、分层抽样的区别和联系.【要点梳理】要点一、简单随机抽样简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回和不放回.我们在抽样调查中用的是不放回抽取.1、简单随机抽样的概念:一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本.2、简单随机抽样的特点:(1)被抽取样本的总体个数N是有限的;(2)简单随机样本数n小于等于样本总体的个数N;(3)从总体中逐个进行抽取,使抽样便于在实践中操作;(4)它是不放回抽取,这使其具有广泛应用性;(5)每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性.3、实施抽样的方法:(1)抽签法:抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力又不方便,若标号的纸片或小球搅拌得不均匀还可能导致抽样的不公平.抽签法的一般步骤:①将总体中的N个个体编号;②把这N个号码写在形状、大小相同的号签上;③将号签放在同一箱中,并搅拌均匀;④从箱中每次抽取一个号签,连续抽取n次;⑤将总体中与抽到的号签的编号一致的n个个体取出.(2)随机数表法:要理解好随机数表,即表中每个位置上等可能出现0,1,2,…,9这十个数字的数表.随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性.随机数表法的步骤:①将总体的个体编号(每个号码的位数一致);②在随机数表中任选一个数字作为开始;③从选定的数开始按一定的方向读下去,若得到的数码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止.注意:①选定开始数字,要保证所选数字的随机性;②确定读数方向获取样本号码时,读数方向可向左、向右、向上、向下,样本号码不能重复,否则舍去.要点诠释:1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型.3、简单随机抽样每个个体入样的可能性都相等,均为Nn ,但是这里一定要将每个个体入样的可能性、第n 次每个个体入样的可能性、特定的个体在第n 次被抽到的可能性这三种情况区分开来,避免在解题中出现错误.要点二、系统抽样1、系统抽样的概念:当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样.2、系统抽样的特征:(1)当总体容量N 较大时,采用系统抽样;(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样;(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.3、系统抽样的一般步骤:(1)采用随机的方法将总体中的N 个个体编号;(2)将编号按间隔k 分段,当N n 是整数时,取N k n =,当N n 不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数'N 能被n 整除,这时取'N k n =,并将剩下的总体重新编号;(3)在第一段用简单随机抽样确定起始个体的编号()l l N l k ∈≤,;(4)按照一定的规则抽取样本,通常是将编号为2(1)l l k l k l n k +++- ,,,,的个体取出.要点诠释:1、从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.2、系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样.要点三、分层抽样1、分层抽样的概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.2、分层抽样的特点:(1)适用于总体是由有明显差别的几部分组成时的情况;(2)分层抽样对各个个体来说被抽取的可能性相同.3、分层抽样的优点:(1)样本具有较强的代表性;(2)在各层抽样时,可灵活地选用不同的抽样方法.4、分层抽样的步骤:(1)将总体按一定的标准分层;(2)计算各层的个体数与总体的个体数的比;(3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量;(4)在每一层进行抽样(各层可以按简单随机抽样或系统抽样的方法抽取)要点诠释:1、应用分层抽样应遵循以下要求:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等.2、分层抽样是当总体有差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是,层内样本的差异要小,而层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样.(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.3、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法.要点四、三种抽样方法的比较类别简单随机抽样系统抽样分层抽样共同点(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样各自特点从总体中逐个抽取将总体均分成几部分按事先确定的规则在各部分抽取将总体分成n层,分层进行抽取相互联系在起始部分抽样时采用简单随机抽样各层抽样采用简单随机抽样或系统抽样适用范围总体中个体数较少总体中个体数较多总体由差异明显的几部分组成【典型例题】类型一:简单随机抽样例1.下面的抽样方法是简单随机抽样吗?为什么?(1)从无数个个体中抽取50个个体作为样本;(2)仓库中有l万支奥运火炬,从中一次性抽取100支火炬进行质量检查;(3)某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴四川参加抗震救灾工作;(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.【解析】(1)不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.(2)不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.(3)不是简单随机抽样.因为这50名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.(4)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.【总结升华】要判断所给的抽样方法是否是简单随机抽样.关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点:(1)总体的个数有限;(2)逐个抽取;(3)是不放回的抽取;(4)每个个体被抽到的可能性必须是相同的.举一反三:【变式1】下面的抽样方法是简单随机抽样吗?为什么?(1)某班45名同学,指定个子最高的5名同学参加学校组织的某项活动.(2)从20个零件中一次性抽出3个进行质量检验.(3)一小孩从玩具箱中的20件玩具中随意拿出一件来玩.玩后放回再拿下一件,连续玩了5件.【解析】(1)不是简单随机抽样.因为这不是等可能抽样.(2)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.(3)不是简单随机抽样.因为这是有放回抽样.例2.某大学为了支援西部教育事业,现从报名的18名志愿者中选取6人组成志愿小组.请用抽签法设计抽样方案.【解析】方案如下:第一步:将18名志愿者编号,号码是01,02, (18)第二步:将号码分别写在形状、大小相同的纸条上,揉成团,制成号签;第三步:将得到的号签放入一个不透明的袋子中,并充分搅匀;第四步:从袋子中依次抽取6个号签,并记录上面的编号:第五步:所得号码对应的志愿者就是志愿小组的成员.【总结升华】一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否容易被搅匀.一般地,当样本容量和总体容量较小时可用抽签法.举一反三:【变式1】一个学生在一次竞赛中要回答的8道题是这样产生的:从15道物理题中随机抽3道;从20道化学题中随机抽3道;从12道生物题中随机抽2道.使用合适的方法确定这个学生所要回答的三门学科问题的序号(物理题的编号为01~15,化学题的编号为16~35,生物题的编号为36~47).【解析】第一步:将试题的编号01~47分别写在形状、大小相同的纸条上,将纸条揉成团制成号签,并将物理、化学、生物题的号签分别放在三个不透明的袋子中,充分搅匀.第二步:从装有物理题的袋子中逐个抽取3个号签,从装有化学题的袋子中逐个抽取3个号签,从装有生物题的袋子中逐个抽取2个号签,并记录所得号签上的编号.这便是所要回答的三门学科问题的序号.例3.现有120台机器,请用随机数表法抽取10台机器,写出抽样过程.【思路点拨】已知N=120,n=10,用随机数表法抽样时编号000,001,…,119,抽取10个编号(都是三位数),对应的机器组成样本.【解析】使用随机数表法步骤如下:第一步,先将120台机器编号,可以编为000,001,002, (119)第二步,在随机数表中任选一个数作为开始,任选一个方向作为读数方向,例如选出第9行第7列的数3,向右读;第三步,从选定的数3开始向右读,每次读取三位,凡不在000~119中的数跳过去不读,前面已经读过的也跳过去不读.依次可得到074,100,094,052,080,003,105,107,083,092;第四步,以上这10个号码074,100,094,052,080,003,105,107,083,092所对应的10台机器就是要抽取的对象.【总结升华】用随机数表法抽取样本,编号时要注意使号码的位数相同.如本题将个体编号的位数统一为3位,即在位数较少的数前添加“0”,方便读表.举一反三:【变式1】某校有学生1200人,为了调查某种情况,打算抽取一个样本容量为50的样本,问此样本若采用简单随机抽样将如何进行?【解析】首先将该校学生都编上号码:0001,0002,0003,…,1200,如用随机数表法,则先在随机数表中选定一个数,如第5行第9列的数字6,从6开始向右连续读取数字,以4个数为一组,遇到右边线时向下错一行向左继续读取,所得数字如下:6438,5482,4622,3162,4309,9006,1844,3253,2383,0130,3046,1943,6248,3469,0253,7887,3239,737l,2845,3445,9493,4977,2261,8442,…,所抽取的数字如果小于或等于1200,则对应此号的学生就是被抽取的个体;如果所抽取的数字大于1200,而小于或等于2400,则减去1200,剩余数字即是被抽取的学生号码;如果所抽取的数字大于2400,而小于或等于3600,则减去2400;依此类推.如果遇到相同的号码,则只留取第一次读取的数字,其余的舍去,这样被抽取的学生所对应的号码依次是:0438,0682,1022,0762,0709,0606,0644,0853,1183,0130,0646,0743.0248,1069,0253,0687,0839,0171,0445,1045,1093,0177,1061,0042,…,一直取足50人为止.【变式2】要从10架钢琴中抽取4架进行质量检验,请你设计抽样方案.【解析】解法一:(随机数表法)第一步,将10架钢琴编号,号码是0,1, (9)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第3行第6列的数“2”,向右读.第三步,从数“2”开始,向右读,每次读取1位,重复数字只记录一次,依次可得到2,7,6,5.第四步,以上号码对应的4架钢琴就是要抽取的对象.解法二:(抽签法)第一步,将10架钢琴编号,号码是0,1, (9)第二步,将号码分别写在一张纸条上,揉成团,制成号签第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀.第四步,从袋子中逐个抽取4个号签,并记录上面的编号.第五步,所得号码对应的4架钢琴就是要抽取的对象.【总结升华】(1)将钢琴编号从0开始,10架钢琴用0—9就可表示,这样总体中的所有个体可用一位数表示,便于使用随机数表.(2)用抽签法抽样关键是将号签搅匀.类型二:系统抽样例4.下列抽样中不是系统抽样的是().A.从号码为1~15的15个球中任选3个作为样本,先在1~5号球中用抽签法抽出i0号,再将号码为i0+5,i0+10的球也抽出B.工厂生产的产品,用传送带将产品送入包装车间的过程中,检查人员从传送带上每5min抽取一件产品进行检验C.弄某项市场调查,规定在商店门口随机地抽一个人进行询问,直到调查到事先规定的调查人数为止D.某电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈【答案】C【解析】本题的判定依据是系统抽样方法的特征:系统抽样适用于个体数目较多但均衡的总体.判断一种抽样是不是系统抽样,首先看是否在抽样前知道总体是由什么构成的,抽样的方法能否保证每个个体按事先规定的条件等可能入样,再看抽样过程中是否将总体分成了几个均衡的部分,是否在每个部分中进行简单随机抽样.本题C显然不是系统抽样,因为事先不知道总体,抽样方法也不能保证每个个体等可能入样,总体也没有分成均衡的几部分,故C不是系统抽样.【总结升华】系统抽样的特点:①适用于总体容量较大的情况;②剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系;③是等可能抽样,每个个体被抽到的可能性都是n/N.举一反三:【变式1】下列抽样中,最适宜用系统抽样法的是()A.某市的4个区共有2000名学生,且4个区的学生人数之比为3∶8∶8∶2,从中抽取200名学生做样本B.从某厂生产的2000个电子元件中随机抽取5个做样本C.从某厂生产的2000个电子元件中随机抽取200个做样本D.从某厂生产的20个电子元件中随机抽取5个做样本【答案】C【解析】A中各区学生有区别,不好分成均衡的几部分,不适宜,B中抽取样本容量太小,不适宜.D 中总体个数较少,不适宜.故选C【总结升华】系统抽样适合总体容量较大且个体间差异较小的情况.例5.为了了解某大学一年级新生英语学习的情况,拟从503名大学一年级学生中抽取50名作为样本,如何采用系统抽样方法完成这一抽样?【思路点拨】由题设条件可知总体的个数为503,样本容量为50,不能整除,可采用随机抽样的方法从总体中剔除3个个体,使剩下的个体数500能被样本容量50整除,然后再采用系统抽样方法进行抽样.【解析】第一步,将503名学生用随机方式编号为1,2,3, (503)第二步,用抽签法或随机数表法剔除3个个体,这样剩下500名学生,对剩下的500名学生重新编号为1,2,3, (500)第三步,确定分段间隔k,将总体分为50个部分,每一部分包括10个个体,这时,第l部分的个体编号为1,2,...,10;第2部分的个体编号为11,12,...,20;依此类推,第50部分的个体编号为491,492, (500)第四步:在第1部分用简单随机抽样的方法确定起始的个体编号,例如5.第五步:依次在第2部分,第3部分,…,第50部分取出号码为15,25,…,495的个体,这样就得到一个容量为50的样本.【总结升华】总体中的每个个体都必须等可能的入样,为了实现“等距”入样且又等概率,应先剔除,再“分段”,后定起始位.采用系统抽样是为了减少工作量,提高其可操作性,减少人为误差.举一反三:【变式1】为了了解某年级学习情况,计划从该年级504名学生中抽取50名学生作为样本,问如何采用系统抽样的方法完成这一抽样?【解析】第一步:将504名学生随机编号为1,2,3,…,503,504;第二步:用抽签法或者随机数表法,剔除4个个体.这样剩下500名学生,对剩下的500名学生重新编号为1,2,3, (500)第三步:由于样本容量与总体容量的比为50:500=1:10,我们可将总体平均分成50部分,其中每一部分包含10个个体,这样第一部分的个体编号为1,2,3,…,10;第二部分的个体编号为11,12,13,…,20;依次类推,第50部分的个体编号为491,492,493, (500)第四步:从1到10号进行简单随机抽样,抽取一个号码,比如是5;第五步,依次在第2部分,第3部分,…,第50部分,取出号码分别为15,25,35,…,495.这样就得到了一个样本容量为50的样本.【变式2】某校高中三年级有学生322名,为了了解学生的某种情况,按1∶8的比例抽取一个样本,请用系统抽样的方法进行抽取,并写出抽样过程.【解析】因为322÷8=40余2,故先剔除2名学生,把剩下的320名学生编号为1,2,3,…,320.把总体分为40个部分,每一个部分都有8个个体,例如第一部分的个体编号为:1,2,3,…,8.然后在第一部分随机抽取一个号码,比如6号,那么从6号开始,每隔8个号码抽取1个,得到号码6,14,22,30,…,310,318,这样就得到一个容量为40的样本.类型三:分层抽样例6.在下列问题中,各采用什么抽样方法抽取样本?(1)从20台彩电中抽取4台进行质量检验;(2)科学会堂有32排座位,每排有40个座位(座号为1~40),一次报告会坐满了听众,会后为听取意见留下了座号为18的所有32名听众进行座谈;(3)光远中学有180名教职工,其中教师136名,管理人员20名,后勤服务人员24名,为征求某项意见,现从中抽取一个容量为15的样本.【答案】(1)简单随机抽样;(2)系统抽样;(3)分层抽样.【解析】(1)所述问题中总体中的个体数和样本容量均较少,故宜用简单随机抽样法;(2)所述问题具有总体中的个体数较多,且每个个体无明显差异的特点,所以适宜用系统抽样法;(3)所述问题的总体中的个体具有明显差异,即出现了3个层次,因此适宜用分层抽样法.【总结升华】总体容量较小宜用抽签法;总体容量较大,而样本容量较小宜用随机数表法;总体容量较大,样本容量也较大的宜用系统抽样法;总体是由差异明显的几个层次组成,宜用分层抽样法.举一反三:【变式1】一个单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,要从中抽取一个容量为20的样本,如何去抽取?方法一:将160人从1到160编上号,然后将用白纸做成的有1~160号的160个号签放入箱内搅匀,最后从中抽取20个签,与签号相同的20个人被选出.方法二:将160人从1至160编号,按编号顺序分成20组,每组8人,令1~8号为第一组,9~16号为第二组,……,153~160号为第20组.从第一组中用抽签方式抽到一个为k号(1≤k≤8),其余组是(k+8n)号(n=1,2,3,…,19),以此抽取20人.方法三:按20∶160=1∶8的比例,从业务员中抽取12人,从管理人员中抽取5人,从后勤服务人员中抽取3人,都用简单随机抽样法从各类人员中抽取所需人数,他们合在一起恰好抽到20人.以上的抽样方法,依次是简单随机抽样、分层抽样、系统抽样的顺序是().A.方法一、方法二、方法三B.方法二、方法一、方法三C.方法一、方法三、方法二D.方法三、方法一、方法二【答案】C例7.一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人,为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?【思路点拨】总体由不到35岁、35岁至49岁与50岁及50岁以上的个体构成,个体的差异较大,适合用分层抽样法.【解析】用分层抽样来抽取样本,步骤是:(1)分层.按年龄将职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.(2)确定每层抽取个体的个数.抽样比为10015005 ,则在不到35岁的职工中抽125×15=25(人);在35岁至49岁的职工中抽280×15=56(人);在50岁及50岁以上的职工中抽95×15=19(人).(3)在各层分别按抽签法或随机数表法抽取样本.(4)综合每层抽样,组成样本.【总结升华】本小题主要考查分层抽样的概念和运算以及抽样过程.求解总体由差异明显的个体构成的问题时,适合用分层抽样法.分层后,各层的个体数较多时,可采用系统抽样或随机数表法抽取出各层中的个体,一定要注意按比例抽取.举一反三:【高清课堂:随机抽样400439例1】【变式1】某学院的A,B,C三个专业共有1200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取____名学生.【答案】40【变式2】某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.【答案】3720【变式3】某地为了调查职业满意度,决定用分层抽样的方法从公务员、教师、自由职业者三个群体的相关人员中,抽取若干人组成调查小组,有关数据见下表,则调查小组的总人数为.相关人员数抽取人数公务员32x教师48y自由职业者644【解析】采用分层抽样,抽样比为2:3:4,由题可知x=2,y=3.则调查小组的总人数为2+3+4=9人,即为9人.。
抽样设计知识点总结
抽样设计知识点总结抽样设计是研究中常用的一种调查方法,在统计学和市场研究领域有着广泛的应用。
本文将总结抽样设计的基本概念、常见的抽样方法以及其优缺点,以帮助读者全面了解抽样设计的知识点。
以下是对抽样设计的详细总结:一、抽样设计的基本概念抽样设计是指在研究中通过对样本的选择和观察来对总体进行推断的过程。
其目的是通过从总体中抽取一部分个体进行观察和研究,从而推断出总体的特征和性质。
二、简单随机抽样简单随机抽样是指从总体中以等概率的方式随机选择样本的方法。
在简单随机抽样中,每个个体被选择为样本的概率是相等的,且相互之间是独立的。
简单随机抽样具有理论上的可行性和可重复性,但是在总体分布不均匀或者样本容量较大时,可能存在样本代表性不足的问题。
三、分层抽样分层抽样是将总体按照某些特征进行划分,然后在每个层次中进行独立的抽样。
分层抽样可以提高样本的代表性,并减小样本误差。
在分层抽样中,要根据总体的特征和目标确定划分的层次和样本容量,以确保每个层次都能充分代表总体。
四、整群抽样整群抽样是将总体按照某些特征划分为若干个互不重叠的群组,然后从选定的群组中进行全员抽样或随机抽样。
整群抽样能够简化抽样过程,减少抽样误差。
但是要注意群内的个体异质性,以保证样本的代表性。
五、多阶段抽样多阶段抽样又称为层级抽样,是将总体按照多个层次进行分层抽样的方法。
每个层次的样本数量和抽样方式可以根据实际情况进行调整,以提高样本的效率和代表性。
多阶段抽样常用于大规模调查和复杂样本选择的研究中。
六、配额抽样配额抽样是根据总体中各类别的比例,按照某些特征设定的配额进行抽样的方法。
配额抽样通常比较适用于面对有限数量的个体,且可以根据特定需求确定配额比例。
但是配额抽样不能保证每个个体被选择为样本的概率是相等的,可能导致样本的偏倚。
七、系统抽样系统抽样是按照某种规则从总体中依次选择样本的方法。
在系统抽样中,可以根据需要选择第一个样本的位置,然后按照固定的间隔选择后续的样本。
高中数学理科基础知识讲解《102随机抽样》教学课件
解析:由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为 =10,若在第1组中抽取的数字为006,则抽取的号码满足6+(n-1)×10=10n-4,其中n∈N*,其中当n=4时,抽取的号码为36;当n=18时,抽取的号码为176;当n=20时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B.
编号
分段间隔k
分段
简单随机抽样
(l+k)
(l+2k)
--
知识梳理
4.分层抽样(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照 ,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样. (2)应用范围:适用于总体由差异比较明显的几个部分组成.(3)注意事项:利用分层抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,则应当调整各层容量,即先剔除各层中“多余”的个体.
√
×
√
×
×
--
考点自诊
2.(2019河南平顶 模拟,4)为客观了解上海市民家庭存书量,上海市统计局社情民意调查中心通过电话调查系统开展专项调查,成功访问了2 007位市民,在这项调查中,总体、样本及样本的容量分别是( )a.总体是上海市民家庭总数量,样本是2 007位市民家庭的存书量,样本的容量是2 007b.总体是上海市民家庭的存书量,样本是2 007位市民家庭的存书量,样本的容量是2 007c.总体是上海市民家庭的存书量,样本是2 007位市民,样本的容量是2 007d.总体是上海市民家庭总数量,样本是2 007位市民,样本的容量是2 007
--
考点2
对点训练2(1)(2019四川雅安二模,7)某校高三年级共有学生900人,编号为1,2,3,…,900,现用系统抽样的方法抽取一个容量为45的样本,若在第一组抽取的编号是5,则抽取的45人中,编号落在区间[479,719]的人数为 ( )A.10 B.11 C.12 D.13(2)(2019四川攀枝花二模,7)某校校园艺术节活动中,有24名学生参加了学校组织的唱歌比赛,他们比赛成绩的茎叶图如图所示,将他们的比赛成绩从低到高编号为1~24号,再用系统抽样方法抽出6名同学周末到某音乐学院参观学习.则样本中比赛成绩不超过85分的学生人数为( )A.1 B.2 C.3 D.不确定
第1讲 随机抽样、用样本估计总体
第1讲随机抽样、用样本估计总体一、知识梳理1.随机抽样(1)简单随机抽样①定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),且每次抽取时总体内的各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.②常用方法:抽签法和随机数法.(2)分层抽样①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.②适用范围:适用于总体由差异比较明显的几个部分组成时.2.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数. (4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是s = 1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2], s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].常用结论1.不论哪种抽样方法,总体中的每一个个体入样的概率是相同的.2.会用三个关系频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.3.巧用四个有关的结论(1)若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x-+a ;(2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;(3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2;(4)s 2=1n ∑n i =1 (x i -x -)2=1n ∑n i =1x 2i-x -2,即各数平方的平均数减去平均数的平方. 二、教材衍化1.某校为了解学生学习的情况,采用分层抽样的方法从高一2 400人、高二2 000人、高三n 人中,抽取90人进行问卷调查.已知高一被抽取的人数为36,那么高三被抽取的人数为________.解析:由分层抽样可得 2 4002 400+2 000+n×90=36,则n =1 600,所以高三被抽取的人数为 1 6002 400+2 000+1 600×90=24. 答案:242.已知一组数据6,7,8,8,9,10,则该组数据的方差是________.答案:533.某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在第________组.解析:由题图可得,前四组的频率为(0.037 5+0.062 5+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,故中位数落在第4组.答案:4一、思考辨析判断正误(正确的打“√”,错误的打“×”)(1)简单随机抽样是一种不放回抽样.()(2)在抽签法中,先抽的人抽中的可能性大.()(3)一组数据的方差越大,说明这组数据的波动越大.()(4)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.()(5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.()(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.()答案:(1)√(2)×(3)√(4)√(5)√(6)√二、易错纠偏常见误区|(1)随机数表法的规则不熟出错;(2)频率分布直方图识图不清;1.假设要考察某公司生产的狂犬疫苗的剂量是否达标,现用随机数法从500支疫苗中抽取50支进行检验,利用随机数表抽取样本时,先将500支疫苗按000,001, (499)行编号,若从随机数表第7行第8列的数开始向右读,则抽取的第3支疫苗的编号为________.(下面摘取了随机数表的第7行至第9行)84 42 17 53 3157 24 55 06 8877 04 74 47 6721 76 33 50 2583 92 12 06 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 7933 21 12 34 2978 64 56 07 8252 42 07 44 3815 51 00 13 4299 66 02 79 54解析:由题意得,从随机数表第7行第8列的数开始向右读,符合条件的前三个编号依次是331,455,068,故抽取的第3支疫苗的编号是068.答案:0682.我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.解析:依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.答案:50考点一随机抽样(基础型)复习指导| 1.理解随机抽样的必要性和重要性.2.学会用简单随机抽样的方法从总体中抽取样本.3.通过对实例的分析,了解分层抽样的方法.核心素养:数据分析1.(2020·重庆中山外国语学校模拟)如饼图,某学校共有教师120人,从中选出一个30人的样本,其中被选出的青年女教师的人数为()A.12B.6C.4D.3解析:选D .青年教师的人数为120×30%=36,所以青年女教师为12人,故青年女教师被选出的人数为12×30120=3.故选D . 2.(2020·武汉市武昌区调研考试)已知某射击运动员每次射击击中目标的概率都为80%.现采用随机模拟的方法估计该运动员4次射击至少3次击中目标的概率:先由计算器产生0到9之间取整数值的随机数,指定0,1表示没有击中目标,2,3,4,5,6,7,8,9表示击中目标;再以每4个随机数为一组,代表4次射击的结果.经随机模拟产生了如下20组随机数:7527 0293 7140 9857 0347 4373 8636 6947 1417 4698 0371 6233 2616 8045 6011 3661 9597 7424 7610 4281据此估计,该射击运动员4次射击至少3次击中目标的概率为________.解析:4次射击中有1次或2次击中目标的有:0371,6011,7610,1417,7140,所以所求概率P =1-520=1520=0.75. 答案:0.753.一支田径队有男运动员56人,女运动员m 人,用分层抽样抽出一个容量为n 的样本,在这个样本中随机取一个当队长的概率为128,且样本中的男队员比女队员多4人,则m =________.解析:由题意知n =28,设其中有男队员x 人,女队员有y 人.则⎩⎪⎨⎪⎧x +y =28,x -y =4,56m =x y .解得x =16,y =12,m =42.答案:42(1)抽签法与随机数法的适用情况①抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.②一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)分层抽样问题类型及解题思路①求某层应抽个体数量,根据该层所占总体的比例计算.②已知某层个体数量,求总体容量,根据分层抽样即按比例抽样,列比例式进行计算.③确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.考点二样本的数字特征(应用型)复习指导| 1.通过实例理解样本数据的标准差的意义和作用,学会计算数据的标准差.2.能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.核心素养:数据分析、数学运算(1)在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93.去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为( )A .92,2.8B .92,2C .93,2D .93,2.8(2)(2020·盐城模拟)已知一组数据x 1,x 2,x 3,x 4,x 5的方差是2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的标准差为________.【解析】 (1)由题意得所剩数据:90,90,93,94,93.所以平均数x -=90+90+93+94+935=92. 方差s 2=15[(90-92)2+(90-92)2+(93-92)2+(93-92)2+(94-92)2]=2.8. (2)由s 2=1n i =1n (x i -x -)2=2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的方差是8,标准差为2 2. 【答案】 (1)A (2)2 2【迁移探究】 (变条件)本例(2)增加条件“x 1,x 2,x 3,x 4,x 5的平均数为2”,求数据2x 1+3,2x 2+3,2x 3+3,2x 4+3,2x 5+3的平均数和方差.解:数据2x 1+3,2x 2+3,2x 3+3,2x 4+3,2x 5+3的平均数为2×2+3=7,方差为22×2=8.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s2=1n[(x21+x22+…+x2n)-n x-2],或写成s2=1n(x21+x22+…+x2n)-x-2,即方差等于原数据平方的平均数减去平均数的平方.1.(2020·昆明市诊断测试)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作试验基地.这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,x n,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是()A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数解析:选B .平均数、中位数可以反映一组数据的集中程度;方差、标准差可以反映一组数据的波动大小,同时也反映这组数据的稳定程度.故选B .2.(2020·甘肃、青海、宁夏联考)从某小学随机抽取100名同学,将他们的身高(单位:厘米)分布情况汇总如下:A .119.3B .119.7C .123.3D .126.7解析:选C .由题意知身高在(100,110],(110,120],(120,130]内的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x ,则(x -120)×0.310=0.1,解得x ≈123.3.故选C .3.一组数据1,10,5,2,x ,2,且2<x <5,若该数据的众数是中位数的23倍,则该数据的方差为________.解析:根据题意知,该组数据的众数是2,则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x ,5,10,则2+x2=3,解得x =4,所以这组数据的平均数为 x -=16×(1+2+2+4+5+10)=4,方差为s 2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.答案:9考点三 频率分布直方图(应用型)复习指导| 1.通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图,体会它们各自的特点.2.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性.核心素养:直观想象、数据分析角度一求样本的频率、频数(2020·福建五校第二次联考)某服装店对过去100天其实体店和网店的销售量(单位:件)进行了统计,制成频率分布直方图如下:(1)若将上述频率视为概率,已知该服装店过去100天的销售中,实体店和网店销售量都不低于50的概率为0.24,求过去100天的销售中,实体店和网店至少有一边销售量不低于50的天数;(2)若将上述频率视为概率,已知该服装店实体店每天的人工成本为500元,门市成本为1 200元,每售出一件利润为50元,求该实体店一天获利不低于800元的概率.【解】(1)由题意知,网店销售量不低于50共有(0.068+0.046+0.010+0.008)×5×100=66(天),实体店销售量不低于50共有(0.032+0.020+0.012×2)×5×100=38(天),实体店和网店销售量都不低于50的天数为100×0.24=24,故实体店和网店至少有一边销售量不低于50的天数为66+38-24=80.(2)由题意,设该实体店一天售出x件,则获利为(50x-1 700)元,50x-1 700≥800⇒x ≥50.记该实体店一天获利不低于800元为事件A,则P(A)=P(x≥50)=(0.032+0.020+0.012+0.012)×5=0.38.故该实体店一天获利不低于800元的概率为0.38.角度二求样本的数字特征(2019·高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.(1)频率、频数、样本容量的计算方法①频率组距×组距=频率;②频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.(2)频率分布直方图中数字特征的计算①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.1.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为( )A .28B .40C .56D .60解析:选B .设中间一组的频数为x ,因为中间一个小长方形的面积等于其他8个长方形的面积和的25,所以其他8组的频数和为52x ,由x +52x =140,解得x =40.2.(2020·武昌区调研考试)对参加某次数学竞赛的1 000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.(1)根据直方图完成以下表格;(2)); (3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛选手的成绩? 解:(1)填表如下:(2)平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78, 方差s 2=(-23)2×0.05+(-13)2×0.15+(-3)2×0.35+72×0.35+172×0.1=101. (3)进入复赛选手的成绩为80+350-(380-100)350×10=82(分),所以初赛成绩为82分及其以上的选手均可进入复赛.(说明:回答82分以上,或82分及其以上均可)[基础题组练]1.某班有34位同学,座位号记为01,02,…,34,用下面的随机数表选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列数字开始,由左到右依次选取两个数字,则选出来的第4个志愿者的座号是( )49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 A .23B .09C .02D .16解析:选D .从随机数表第一行的第6列数字3开始,由左到右依次选取两个数字,不超过34的依次为21,32,09,16,17,故第4个志愿者的座号为16.2.(2020·陕西汉中重点中学联考)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如下表所示:若在“不喜欢的男性青年观众”中抽取了6人,则n =( )A .12B .16C .20D .24解析:选D .由题意得3030+10+30+50=30120=6n,解得n =24.故选D .3.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差解析:选A .记9个原始评分分别为a ,b ,c ,d ,e ,f ,g ,h ,i (按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A .4.(多选)某学生5次考试的成绩(单位:分)分别为85,67,m ,80,93,其中m >0.若该学生在这5次考试中成绩的中位数为80,则得分的平均数可能为( )A .70B .75C .80D .85解析:选ABC .已知的四次成绩按照由小到大的顺序排列为67,80,85,93,该学生这5次考试成绩的中位数为80,则m ≤80,所以平均数85+67+m +80+935≤81,可知平均数可能为70,75,80,不可能为85.故选ABC .5.(多选)从某地区年龄在25~55岁的人员中,随机抽取100人,了解他们对今年两会热点问题的看法,绘制出频率分布直方图,如图所示,则下列说法正确的是( )A .抽取的100人中,年龄在40~45岁的人数大约为20B .抽取的100人中,年龄在35~45岁的人数大约为40C .抽取的100人中,年龄在40~50岁的人数大约为50D .抽取的100人中,年龄在35~50岁的人数大约为60解析:选AD .根据频率分布直方图的性质得(0.01+0.05+0.06+a +0.02+0.02)×5=1,解得a =0.04,所以抽取的100人中,年龄在40~45岁的大约为0.04×5×100=20,所以A 正确;年龄在35~45岁的人数大约为(0.06+0.04)×5×100=50,所以B 不正确;年龄在40~50岁的人数大约为(0.04+0.02)×5×100=30,所以C 不正确;年龄在35~50岁的人数大约为(0.06+0.04+0.02)×5×100=60,所以D 正确.故选AD .6.(2020·开封市定位考试)某工厂生产A ,B ,C 三种不同型号的产品,产品数量之比为k ∶5∶3,现用分层抽样的方法抽出一个容量为120的样本,已知A 种型号产品共抽取了24件,则C 种型号产品抽取的件数为________.解析:依题意得24120=k k +5+3,解得k =2,所以C 种型号产品抽取的件数为32+5+3×120=36.答案:367.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是________.解析:由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好.答案:丙8.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.解析:设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.则志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.答案:(1)0.04(2)4409.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:(1)求a、b、c(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解:(1)由题意可得,b =1-(0.015+0.125+0.5+0.31)=0.05,a =200×0.05=10,c =200×0.5=100.(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.所以P =162200=0.81. (3)这次数学测验样本的平均分为x -=16×3+32.1×10+55×25+74×100+88×62200=73, 所以这次数学测验的年级平均分大约为73分.10.为了解甲、乙两个快递公司的工作状况,假设同一个公司快递员的工作状况基本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30天)的快递件数记录结果中随机抽取10天的数据,制图如下:每名快递员完成一件货物投递可获得的劳务费情况如下:甲公司规定每件4.5元;乙公司规定每天35件以内(含35件)的部分每件4元,超出35件的部分每件7元.(1)根据图中数据写出甲公司员工A 在这10天投递的快递件数的平均数和众数;(2)根据图中数据估算两公司的每位员工在该月所得的劳务费.解:(1)甲公司员工A 在这10天投递的快递件数的平均数为36,众数为33.(2)根据题图中数据,可估算甲公司的每位员工该月所得劳务费为 4.5×36×30=4 860(元),易知乙公司员工B 每天所得劳务费X 的可能取值为136,147,154,189,203,所以乙公司的每位员工该月所得劳务费约为110×(136×1+147×3+154×2+189×3+203×1)×30=165.5×30=4 965(元). [综合题组练]1.(2020·安徽五校联盟第二次质检)数据a 1,a 2,a 3,…,a n 的方差为σ2,则数据2a 1,2a 2,2a 3,…,2a n 的方差为( )A .σ22B .σ2C .2σ2D .4σ2解析:选D .设a 1,a 2,a 3,…,a n 的平均数为a ,则2a 1,2a 2,2a 3,…,2a n 的平均数为2a ,σ2=(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n. 则2a 1,2a 2,2a 3,…,2a n 的方差为(2a 1-2a )2+(2a 2-2a )2+(2a 3-2a )2+…+(2a n -2a )2n=4×(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n=4σ2.故选D . 2.(多选)新闻出版业不断推进供给侧结构性改革,深入推动优化升级和融合发展,持续提高优质出版产品供给,实现了行业的良性发展.下面是2015年至2019年我国新闻出版业和数字出版业营收情况,则下列说法正确的是( )A .2015年至2019年我国新闻出版业和数字出版业营收均逐年增加B .2019年我国数字出版业营收超过2015年我国数字出版业营收的2倍C .2019年我国新闻出版业营收超过2015年我国新闻出版业营收的1.5倍D .2019年我国数字出版业营收占新闻出版业营收的比例未超过三分之一解析:选ABD .根据图示数据可知A 正确;1 935.5×2=3 871<5 720.9,故B 正确;16 635.3×1.5=24 952.95>23 595.8,故C 不正确;23 595.8×13≈7 865>5 720.9,故D 正确.故选ABD .3.甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.解:(1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.x -甲=10+13+12+14+165=13; x -乙=13+14+12+12+145=13, s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4; s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙,可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.4.(2020·广州市调研测试)某蔬果经销商销售某种蔬果,售价为每千克25元,成本为每千克15元.销售宗旨是当天进货当天销售.如果当天卖不出去,未售出的全部降价以每千克10元处理完.根据以往的销售情况,按[0,100),[100,200),[200,300),[300,400),[400,500]进行分组,得到如图所示的频率分布直方图.(1)根据频率分布直方图计算该种蔬果日需求量的平均数x -(同一组中的数据用该组区间中点值代表);(2)该经销商某天购进了250千克该种蔬果,假设当天的需求量为x 千克(0≤x ≤500),利润为y 元.求y 关于x 的函数关系式,并结合频率分布直方图估计利润y 不小于1 750元的概率.解:(1)x -=50×0.001 0×100+150×0.002 0×100+250×0.003 0×100+350×0.0025×100+450×0.001 5×100=265.故该种蔬果日需求量的平均数为265千克.(2)当日需求量不低于250千克时,利润y =(25-15)×250=2 500(元),当日需求量低于250千克时,利润y =(25-15)x -(250-x )×5=15x -1 250(元),所以y =⎩⎨⎧15x -1 250,0≤x <2502 500,250≤x ≤500, 由y ≥1 750,得200≤x ≤500,所以P (y ≥1 750)=P (200≤x ≤500)=0.003 0×100+0.002 5×100+0.001 5×100=0.7. 故估计利润y 不小于1 750元的概率为0.7.。
随机抽样和非随机抽样专业知识讲座
一、抽样调查的一般理论 二、随机抽样 四种方法:简单随机抽样
类型抽样 机械抽样 整群抽样 三、非随机抽样法 三种方法: 任意抽样法
判断抽样法 配额抽样法 四、抽样误差和样本容量确定
本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不
第一节 抽当之样处,调请查联系的本一人或般网站原删理除。
确
选
概率抽样
定实 数
择
必施 据
抽
要调 处
样
非概率抽样
的
查
理
方
样
法
本Hale Waihona Puke 容量三、抽样调查的一般程序
本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不
随机抽样 当之处,请联系本人或网站删除。
一、随机抽样的概念及特点
(一)概念:随机抽样又称概率抽样 (二)特点
1.随机抽样是按随机原则进行抽样的; 2.随机抽样具有统计推算的原则。 二、随机抽样方法
非随机抽当之样处,和请随联系机本人抽或网样站的删除比。 较
抽样方 法
非随机抽 样
作用
研究总体的 局部现象
抽样原则 误差判断 应用
非随机抽 出样本, 主观性强
不能计算 和判断抽 样误差
可随时随 地采用
随机抽样 以部分推 随机抽出
断总体
第二章第一节简单随机抽样
第二章第一节简单随机抽样一、重点难点:1.正确理解随机抽样的概念,会描述抽签法、随机数表法的一般步骤.2.能够根据样本的具体情况选择适当的方法进行抽样.二、知识点讲解:一、简单随机抽样的概念:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
思考:简单随机抽样的每个个体入样的可能性为多少?(n/N)二、抽签法和随机数法:1、抽签法一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
抽签法的一般步骤:(1)将总体的个体编号;(2)连续抽签获取样本号码.思考:你认为抽签法有什么优点和缺点;当总体中的个体数很多时,用抽签法方便吗?解析:操作简便易行,当总体个数较多时工作量大,也很难做到“搅拌均匀”2、随机数法利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法.怎样利用随机数表产生样本呢?下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行。
第一步,先将800袋牛奶编号,可以编为000,001, (799)第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。
16 22 77 94 39 49 54 43 54 82 17 37 93 23 7884 42 17 53 31 57 24 55 06 88 77 04 74 47 6763 01 63 78 59 16 95 55 67 19 98 10 50 71 7533 21 12 34 29 78 64 56 07 82 52 42 07 44 3857 60 86 32 44 09 47 27 96 54 49 17 46 09 6287 35 20 96 43 84 26 34 91 6421 76 33 50 25 83 92 12 06 7612 86 73 58 07 44 39 52 38 7915 51 00 13 42 99 66 02 79 5490 52 84 77 27 08 02 73 43 28第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本。
新编简单随机抽样专业知识
在上表中,若选出第6行第5列旳数7,向右读
取,则第4个数是 443
。
例1、某车间工人加工一种轴100件,为了了解 这种轴旳直径,要从中抽取10件轴在同一条件 下测量,请利用抽签法和随机数表法旳措施抽 取样本?
简朴随机抽样一般采用两种措施: 抽签法和随机数表法。
抽签法:将100件轴编号为0,1,2,…,99, 并做好大小、形状相同旳号签,分别写上这 100个数,将这些号签放在一起,进行均匀搅 拌,接着连续抽取10个号签,然后测量这个10 个号签相应旳轴旳直径。
结束
抽签法
一般地,抽签法就是把总体中旳N个个体编号,把号
码写在号签上,将号签放在一种容器中,_均___匀__搅__拌___
后,每次从中抽取一种号签,连续抽取n次,就得到一 个容量为n旳样本。
抽签法旳优点是 总体个数不多时,简朴易操作
但是当总体旳容量非常大时,费时费力不以便,可能 造成抽样旳不公平。
16,19,10,12,07,39,38,33,21,34.
简单随机抽样
抽签法旳一般环节:
(总体个数N,样本容量n)
(1)将总体中旳N个个体编号;
(2)将这N个号码写在形状、 大小相 同旳号签上;
(3)将号签放在同一箱中,并 搅拌均匀;
(4)从箱中每次抽出1个号签, 连续抽出n次;
(5)将总体中与抽到旳号签编 号一致旳n个个体取出。
开始
54名同学编从号0到53编号
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62
第1部分 第一章 § 2 2.1 简单随机抽样
0,1,…,19.
第二步,将号码分别写在一张纸条上,揉成团,制成 号签. 返回
第三步,将得到的号签放入一个不透明的袋子中,并 充分搅匀. 第四步,从袋子中逐个抽取5个号签,并记录上面的 编号. 第五步,所得号码对应的5架钢琴就是要抽取的对象. [一点通] 利用抽签法抽取样本时应注意以下问题: (1)编号时,如果已有编号(如学号、标号等)可不必重新 编号.(例如该题中这20架钢琴事先有号可不编号)
(2)读数时,编号为两位,两位读取,编号为三位,
则三位读取,如果出现重号,则跳过,接着读取.
(3)当题目所给的编号位数不一致时,不便于直接从
随机数表中读取,这时需要对号码作适当的调整使新编
号位数相同.
返回
5.从10个篮球中任取一个,检查其质量,用随机数法抽取 样本,则应编号为 A.1,2,3,4,5,6,7,8,9,10 B.-5,-4,-3,-2,-1,0,1,2,3,4 C.10,20,30,40,50,60,70,80,90,100 ( )
返回
2.实施步)准备“ 抽签 ”的工具,实施“ 抽签 ”; (3)对样本中每一个个体进行测量或调查.
返回
为了检验某种产品的质量,决定从120件产品中抽取10
件进行检验.检查人员先将120件产品标号为 001,002,003,…,120.然后从随机数表中的某一行、某一列 按某一方向读取,凡不在001~120中的数跳过去不读,前面 已经读过的数也跳过去不读,按照此规则直到取足样本为
返回
某班班长为了从班内50人中选出一人参加春季游园活动, 他将全班同学进行编号,然后将编号置于某一纸箱,搅匀后, 请学习委员从中任意抽出一个,确定出参加游园的人选.
问题1:班长的做法公平吗?
第九章 统计(知识点梳理及例题解析)
第九章统计9.1 随机抽样1. 全面调查与抽样调查( 1 )对每一个调查对象都进行调查的方法,称为全面调查,又称普查W .( 2 )在一个调查中,我们把调查对象的全体称为总体,组成总体的每一个调查对象称为个体W .( 3 )根据一定的目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查W .( 4 )把从总体中抽取的那部分个体称为样本W .( 5 )样本中包含的个体数称为样本量W .( 6 )调查样本获得的变量值称为样本的观测数据,简称样本数据 .2. 简单随机抽样( 1 )有放回简单随机抽样一般地,设一个总体含有 N ( N 为正整数)个个体,从中逐个抽取 n (1 ≤ n < N )个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样 .( 2 )不放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样 .( 3 )简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样 .( 4 )简单随机样本通过简单随机抽样获得的样本称为简单随机样本 .( 5 )简单随机抽样的常用方法实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法 .■名师点拨( 1 )从总体中,逐个不放回地随机抽取 n 个个体作为样本,一次性批量随机抽取 n 个个体作为样本,两种方法是等价的 .( 2 )简单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样的公平性 .3. 总体平均数与样本平均数( 1 )总体平均数① 一般地,总体中有 N 个个体,它们的变量值分别为 Y 1 , Y 2 ,… , Y N ,则称== Y i 为总体均值,又称总体平均数 .② 如果总体的 N 个变量值中,不同的值共有 k (k ≤ N )个,不妨记为 Y 1 , Y2 ,… , Y k ,其中 Y i 出现的频数 f i ( i = 1 , 2 ,… , k ),则总体均值还可以写成加权平均数的形式= f i Y i W .( 2 )样本平均数如果从总体中抽取一个容量为 n 的样本,它们的变量值分别为 y 1 , y 2 ,… , yn ,则称== y i 为样本均值,又称样本平均数 . 在简单随机抽样中,我们常用样本平均数去估计总体平均数 .4. 分层随机抽样( 1 )分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层W .( 2 )比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配 .5. 分层随机抽样中的总体平均数与样本平均数( 1 )在分层随机抽样中,如果层数分为 2 层,第 1 层和第 2 层包含的个体数分别为 M 和 N ,抽取的样本量分别为 m 和 n . 我们用 X 1 , X 2 ,… , X M 表示第 1 层各个个体的变量值,用 x 1 , x 2 ,… , x m 表示第 1 层样本的各个个体的变量值;用 Y 1 , Y 2 ,… , Y N 表示第 2 层各个个体的变量值,用 y 1 , y 2 ,… ,y n 表示第 2 层样本的各个个体的变量值,则:① 第 1 层的总体平均数和样本平均数分别为== X i ,== x i .② 第 2 层的总体平均数和样本平均数分别为==Y i ,== y i .③ 总体平均数和样本平均数分别为=,=W .( 2 )由于用第 1 层的样本平均数可以估计第 1 层的总体平均数,用第 2 层的样本平均数可以估计第 2 层的总体平均数 . 因此我们可以用=+估计总体平均数 .( 3 )在比例分配的分层随机抽样中,==,可得+=+= . 因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数 .6. 获取数据的途径获取数据的基本途径有:( 1 )通过调查获取数据;( 2 )通过试验获取数据;( 3 )通过观察获取数据;( 4 )通过查询获取数据典型应用 1总体、样本等概念辨析题为了调查参加运动会的 1 000 名运动员的平均年龄,从中抽取了 100 名运动员进行调查,下面说法正确的是()A.1 000 名运动员是总体B. 每个运动员是个体C. 抽取的 100 名运动员是样本D. 样本量是 100【解析】根据调查的目的可知,总体是这 1 000 名运动员的年龄,个体是每个运动员的年龄,样本是抽取的 100 名运动员的年龄,样本量为 100. 故答案为D.【答案】 D此类题目要正确理解总体与个体的概念,要弄明白概念的实质,并注意样本与样本容量的不同,其中样本量为数目,无单位 .典型应用 2简单随机抽样的概念下面的抽样方法是简单随机抽样吗?为什么?( 1 )从无数个个体中抽取 50 个个体作为样本;( 2 )仓库中有 1 万支奥运火炬,从中一次抽取 100 支火炬进行质量检查;( 3 )某连队从 200 名党员官兵中,挑选出 50 名最优秀的官兵赶赴灾区开展救灾工作 .【解】( 1 )不是简单随机抽样 . 因为简单随机抽样要求被抽取的样本总体的个数是有限的 . ( 2 )不是简单随机抽样 . 虽然“ 一次性抽取” 和“ 逐个抽取” 不影响个体被抽到的可能性,但简单随机抽样要求的是“ 逐个抽取” . ( 3 )不是简单随机抽样 . 因为这 50 名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“ 等可能抽样” 的要求 .要判断所给的抽样方法是否为简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点 .典型应用 3抽签法及随机数法的应用某班有 50 名学生,要从中随机地抽出 6 人参加一项活动,请分别写出利用抽签法和随机数法抽取该样本的过程 .【解】( 1 )利用抽签法步骤如下:第一步:将这 50 名学生编号,编号为 01 , 02 , 03 ,… , 50.第二步:将 50 个号码分别写在纸条上,并揉成团,制成号签 .第三步:将得到的号签放在一个不透明的容器中,搅拌均匀 .第四步:从容器中逐一抽取 6 个号签,并记录上面的号码 .对应上面 6 个号码的学生就是参加该项活动的学生 .( 2 )利用随机数法步骤如下:第一步:将这 50 名学生编号,编号为 1 , 2 , 3 ,… , 50.第二步:用随机数工具产生 1 ~ 50 范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的学生进入样本 .第三步:重复第二步的过程,直到抽足样本所需人数 .对应上面 6 个号码的学生就是参加该项活动的学生 .( 1 )利用抽签法抽取样本时应注意以下问题:① 编号时,如果已有编号(如学号、标号等)可不必重新编号 . (例如该题中 50 名同学,可以直接利用学号)② 号签要求大小、形状完全相同 .③ 号签要搅拌均匀 .④ 抽取号签时要逐一、不放回抽取 .( 2 )利用随机数法抽取样本时应注意的问题:如果生成的随机数有重复,即同一编号被多次抽到,应剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需的人数 .典型应用 4分层随机抽样中的有关计算( 1 )某单位共有老、中、青年职工 430 人,其中有青年职工 160 人,中年职工人数是老年职工人数的 2 倍,为了解职工身体状况,现采用分层随机抽样方法进行调查,在抽取的样本中有青年职工 32 人,则该样本中的老年职工的人数为W .( 2 )某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“ 泥塑” 与“ 剪纸” 两个社团,已知报名参加这两个社团的学生共有800 人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:高一年级高二年级高三年级泥塑 a b c剪纸x y z其中 x ∶ y ∶ z = 5 ∶ 3 ∶ 2 ,且“ 泥塑” 社团的人数占两个社团总人数的,为了了解学生对两个社团活动的满意程度,从中抽取一个 50 人的样本进行调查,则从高二年级“ 剪纸” 社团的学生中应抽取人 .【解析】( 1 )设该单位老年职工人数为 x ,由题意得 3 x = 430 - 160 ,解得 x = 90. 则样本中的老年职工人数为 90 × = 18.( 2 )法一:因为“ 泥塑” 社团的人数占总人数的,故“ 剪纸” 社团的人数占总人数的,所以“ 剪纸” 社团的人数为 800 × = 320 ;因为“ 剪纸” 社团中高二年级人数比例为==,所以“ 剪纸” 社团中高二年级人数为 320 × = 96.由题意知,抽样比为=,所以从高二年级“ 剪纸” 社团中抽取的人数为 96 × = 6.法二:因为“ 泥塑” 社团的人数占总人数的,故“ 剪纸” 社团的人数占总人数的,所以抽取的 50 人的样本中,“ 剪纸” 社团中的人数为 50 × = 20.又“ 剪纸” 社团中高二年级人数比例为==,所以从高二年级“ 剪纸” 社团中抽取的人数为 20 × = 6.【答案】( 1 ) 18 ( 2 ) 6分层随机抽样中有关计算的方法( 1 )抽样比== .( 2 )总体中某两层的个体数之比=样本中这两层抽取的个体数之比 .对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解 .典型应用 5样本平均数的求法( 1 )甲在本次飞镖游戏中的成绩为 8 , 6 , 7 , 7 , 8 , 10 , 9 , 8 ,7 , 8. 求甲在本次游戏中的平均成绩 .( 2 )在了解全校学生每年平均阅读多少本文学经典名著时,甲同学抽取了一个容量为 10 的样本,并算得样本的平均数为 5 ;乙同学抽取了一个容量为 8 的样本,并算得样本的平均数为 6. 已知甲、乙两同学抽取的样本合在一起组成一个容量为 18 的样本,求合在一起后的样本均值 .【解】( 1 )甲在本次游戏中的平均成绩为= 7.8. ( 2 )合在一起后的样本均值为== .在分层随机抽样中,如果第一层的样本量为 m ,平均值为 x ;第二层的样本量为n ,平均值为 y ,则样本的平均值为 .9 . 2 用样本估计总体1 .频率分布表、频率分布直方图的制作步骤及意义2 .百分位数(1) 定义:一般地,一组数据的第 p 百分位数是这样一个值,它使得这组数据中至少有 p % 的数据小于或等于这个值,且至少有 ( 100 - p ) % 的数据大于或等于这个值.(2) 计算步骤:计算一组 n 个数据的第 p 百分位数的步骤:第 1 步,按从小到大排列原始数据.第 2 步,计算 i = n × p % .第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j ,则第 p 百分位数为第 j 项数据;若 i 是整数,则第 p 百分位数为第 i 项与第 ( i + 1) 项数据的平均数.典型应用 1频率分布表、频率分布直方图、频率分布折线图的绘制角度一频率分布表、频率分布直方图的绘制为考查某校高二男生的体重,随机抽取 44 名高二男生,实测体重数据( 单位: kg ) 如下:57 , 61 , 57 , 57 , 58 , 57 , 61 , 54 , 68 , 51 , 49 , 64 , 50 , 48 ,65 , 52 , 56 , 46 , 54 , 49 , 51 , 47 , 55 , 55 , 54 , 42 , 51 , 56 ,55 , 51 , 54 , 51 , 60 , 62 , 43 , 55 , 56 , 61 , 52 , 69 , 64 , 46 ,54 , 48将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.【解】以 4 为组距,列表如下:分组频率累计频数频率[41.5 , 45.5 ) 2 0.045 5[45.5 , 49.5 ) 7 0.159 1[49.5 , 53.5 ) 8 0.18 1 8[53.5 , 57.5 ) 16 0.363 6[57.5 , 61.5 ) 5 0.113 6[61.5 , 65.5 ) 4 0.090 9[65.5 , 69.5 ) 2 0.045 5频率分布直方图和频率分布折线图如图所示.(1) 在列频率分布表时,极差、组距、组数有如下关系:① 若为整数,则=组数;② 若不为整数,则的整数部分+ 1 =组数.(2) 组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过 100 ,按照数据的多少常分为 5 ~ 12 组,一般样本量越大,所分组数越多.角度二频率分布直方图的应用为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图 ( 如图所示 ) ,图中从左到右各小长方形面积之比为 2 ∶ 4 ∶ 17 ∶ 15 ∶ 9 ∶ 3 ,第二小组的频数为 12.(1) 第二小组的频率是多少?样本量是多少?(2) 若次数在 110 以上 ( 含 110 次 ) 为达标,则该校全体高一年级学生的达标率是多少?(3) 样本中不达标的学生人数是多少?(4) 第三组的频数是多少?【解】 (1) 频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为= 0.08.又因为第二小组的频率=,所以样本容量=== 150.(2) 由直方图可估计该校高一年级学生的达标率为 × 100% = 88 %.(3) 由 (1)(2) 知达标率为 88 % ,样本量为 150 ,不达标的学生频率为 1 - 0.88= 0.12.所以样本中不达标的学生人数为 150 × 0.12 = 18( 人 ) .(4) 第三小组的频率为= 0.34.又因为样本量为 150 ,所以第三组的频数为 150 × 0.34 = 51.频率分布直方图的应用中的计算问题(1) 小长方形的面积=组距 × =频率;(2) 各小长方形的面积之和等于 1 ;(3) =频率,此关系式的变形为=样本量,样本量 × 频率=频数.典型应用 2条形统计图为了丰富校园文化生活,某校计划在午间校园广播台播放“ 百家讲坛” 的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查 ( 每人只选一项内容 ) ,整理调查结果,绘制统计图如图所示.请根据统计图提供的信息回答以下问题:(1) 求抽取的学生数;(2) 若该校有 3 000 名学生,估计喜欢收听易中天《品三国》的学生人数;(3) 估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的百分比.【解】 (1) 从统计图上可以看出,喜欢收听于丹析《庄子》的男生有 20 人,女生有 10 人;喜欢收听《故宫博物院》的男生有 30 人,女生有 15 人;喜欢收听于丹析《论语》的男生有 30 人,女生有 38 人;喜欢收听易中天《品三国》的男生有 64 人,女生有 42 人;喜欢收听刘心武评《红楼梦》的男生有 6 人,女生有 45 人.所以抽取的学生数为 20 + 10 + 30 + 15 + 30 + 38 + 64 + 42 + 6 + 45 =300( 人 ) .(2) 喜欢收听易中天《品三国》的男生有 64 人,女生有 42 人,共有 106 人,占所抽取总人数的比例为,由于该校有 3 000 名学生,因此可以估计喜欢收听易中天《品三国》的学生有× 3 000 = 1 060( 人 ) .(3) 该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的比例为× 100% = 15 %.(1) 绘制条形统计图时,第一步确定坐标系中横轴和纵轴上坐标的意义,第二步确定横轴上各部分的间距及位置,第三步根据统计结果绘制条形图.实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.(2) 在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.典型应用 3折线统计图小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.根据图中的信息,回答以下问题:(1) 护士每隔几小时给小明测量一次体温?( 2) 近三天来,小明的最高体温、最低体温分别是多少?(3) 从体温看,小明的病情是在恶化还是在好转?(4) 如果连续 36 小时体温不超过 37.2 摄氏度的话,可认为基本康复,那么小明最快什么出院?【解】 (1) 根据横轴表示的意义,可知护士每隔 6 小时给小明测量一次体温.(2) 从折线统计图中的最高点和最低点对应的纵轴意义,可知最高体温是 39.5 摄氏度,最低体温是 36.8 摄氏度.(3) 从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.(4)9 月 8 日 18 时小明的体温是 37 摄氏度.其后的体温未超过 37.2 摄氏度,自 9 月 8 日 18 时起计算,连续 36 小时后对应的时间为 9 月 10 日凌晨 6 时.因此小明最快可以在 9 月 10 凌晨 6 时出院.(1) 绘制折线统计图时,第一步,确定直角坐标系中横、纵坐标表示的意义;第二步,确定一个单位长度表示一定的数量,根据数量的多少描出各点;第三步,用直线段顺次连接即可.(2) 在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.典型应用 4扇形统计图下图是 A , B 两所学校艺术节期间收到的各类艺术作品的情况的统计图:(1) 从图中能否看出哪所学校收到的水粉画作品数量多?为什么?(2) 已知 A 学校收到的剪纸作品比 B 学校的多 20 件,收到的书法作品比 B 学校的少 100 件,请问这两所学校收到艺术作品的总数分别是多少件?【解】 (1) 不能.因为两所学校收到艺术作品的总数不知道.(2) 设 A 学校收到艺术作品的总数为 x 件, B 学校收到艺术作品的总数为 y 件,则解得即 A 学校收到艺术作品的总数为 500 件,B 学校收到艺术作品的总数为 600 件.(1) 绘制扇形统计图时,第一步计算各部分所占百分比以及对应圆心角的度数;第二步在圆中按照上述圆心角画出各个扇形并恰当标注.(2) 扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.典型应用 5百分位数的计算现有甲、乙两组数据如下表所示.序号1 2 3 4 5 6 7 8 9 11112131415161718192甲组1 2 2 2 2 3 3 3 5 5 6 6 8 8 9 11121313乙组0 0 0 0 1 1 2 3 4 5 6 6 7 7 11414141415试求甲、乙两组数的 25 % 分位数与 75 % 分位数.【解】因为数据个数为 20 ,而且 20 × 25 % = 5 , 20 × 75% = 15.因此,甲组数的 25 % 分位数为== 2.5 ;甲组数的 75 % 分位数为== 9.5.乙组数的 25 % 分位数为== 1 ,乙组的 75 % 分位数为== 12.求百分位数时,一定要将数据按照从小到大的顺序排列.9 . 3 统计案例公司员工的肥胖情况调查分析1 .平均数和中位数的特点(1) 样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变.(2) 中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.(3) 与中位数相比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.2 .中位数、平均数与频率分布直方图的关系一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的 ( 图(1)) ,那么平均数和中位数应该大体上差不多;如果直方图在右边“ 拖尾” ( 图(2)) ,那么平均数大于中位数;如果直方图在左边“ 拖尾” ( 图 (3)) ,那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“ 长尾巴” 那边.3 .众数的特点众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.■名师点拨一般地,对数值型数据 ( 如用水量、身高、收入、产量等 ) 集中趋势的描述,可以用平均数、中位数;而对分类型数据 ( 如校服规格、性别、产品质量等级等 ) 集中趋势的描述,可以用众数.4 .总体方差与总体标准差如果总体中所有个体的变量值分别为 Y 1 , Y 2 ,… , Y N ,总体平均数为,则称 S 2 = __ ( Y i - ) 2 为总体方差, S =为总体标准差.与总体均值类似,总体方差也可以写成加权的形式.如果总体的 N 个变量值中,不同的值共有k ( k ≤ N ) 个,不妨记为 Y 1 , Y 2 ,… , Y k ,其中 Y i 出现的频数为 f i ( i = 1 , 2 ,… , k ) ,则总体方差为 S 2 = f i ( Y i - ) 2 .5 .样本方差与样本标准差如果一个样本中个体的变量值分别为 y 1 , y 2 ,… y n ,样本平均数为,则称 s 2 = ( y i - ) 2 为样本方差, s =为样本标准差.■名师点拨(1) 若 x 1 , x 2 , x 3 ,… , x n 的平均数为,方差为 s 2 那么 ax 1 + b ,ax 2 + b , ax 3 + b ,… , ax n + b 的平均数为′ = a + b ;方差s ′ 2 =a 2 s 2 .(2) 标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.显然,在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.典型应用 1众数、中位数、平均数的计算及应用某工厂人员及月工资构成如下:人员经理管理人员高级技工工人学徒合计月工资 ( 元 )22 000 2 500 2 200 2 000 1 000 29 700人数 1 6 5 10 1 23合计22 000 15 000 11 000 20 000 1 000 69 000(1) 指出这个表格中的众数、中位数、平均数;(2) 这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?【解】 (1) 由表格可知,众数为 2 000 元.把 23 个数据按从小到大 ( 或从大到小 ) 的顺序排列,排在中间的数应是第 12 个数,其值为 2 200 ,故中位数为 2 200 元.平均数为 (22 000 + 15 000 + 11 000 + 20 000 + 1 000)÷23 = 69 000÷23 = 3 000( 元 ) .(2) 虽然平均数为 3 000 元 / 月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.(1) 如果样本平均数大于样本中位数,说明数据中存在较大的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.(2) 众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.典型应用 2利用频率分布直方图求众数、中位数、平均数从高三抽出 50 名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:(1) 这 50 名学生成绩的众数与中位数;(2) 这 50 名学生的平均成绩.【解】 (1) 由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为 75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.因为 0.004 × 10 + 0.006 × 10 + 0.02 × 10= 0.04 + 0.06 + 0.2 = 0.3 ,所以前三个小矩形面积的和为 0.3. 而第四个小矩形面积为 0.03 × 10 = 0.3 , 0.3 +0.3 > 0.5 ,所以中位数应位于第四个小矩形内.设其底边为 x ,高为 0.03 ,所以令 0.03 x = 0.2 ,得x ≈ 6.7 ,故中位数应约为 70 + 6.7 = 76.7.(2) 样本平均值应是频率分布直方图的“ 重心” ,即所有数据的平均值,即每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.所以平均成绩为 45 × (0.004 × 10) + 55 × (0.006 × 10) + 65 × (0.02 × 10) + 75 × (0.03 × 10) + 85 × (0.024 × 10) + 95 × (0.016 × 10) = 76.2.频率分布直方图的数字特征(1) 众数:众数一般用频率分布表中频率最高的一组的组中值来显示,即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标;(2) 中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;(3) 平均数:平均数在频率分布表中等于组中值与对应频率之积的和.典型应用 3标准差、方差的计算及应用甲、乙两机床同时加工直径为 100 cm 的零件,为检验质量,从中抽取 6件测量数据为:甲: 99 100 98 100 100 103乙: 99 100 102 99 100 100(1) 分别计算两组数据的平均数及方差;(2) 根据计算说明哪台机床加工零件的质量更稳定.【解】 (1) 甲= × (99 + 100 + 98 + 100 + 100 + 103) = 100 ,乙= × (99 + 100 + 102 + 99 + 100 + 100) = 100 ,s = × [(99 - 100) 2 + (100 - 100) 2 + (98 - 100) 2 + (100 - 100) 2 +(100 - 100) 2 + (103 - 100) 2 ] =,s = × [(99 - 100) 2 + (100 - 100) 2 + (102 - 100) 2 + (99 - 100) 2 +(100 - 100) 2 + (100 - 100) 2 ] = 1.(2) 由 (1) 知甲=乙,比较它们的方差,因为 s > s ,故乙机床加工零件的质量更稳定.用样本的标准差、方差估计总体的方法(1) 用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差 ( 方差 ) 分析稳定情况.(2) 标准差、方差的取值范围是 [0 ,+∞ ) .(3) 因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机抽样【学习目标】1、了解简单随机抽样的概念,掌握实施简单随机抽样的常用方法:抽签法和随机数表法;2、了解系统抽样的意义,并会用系统抽样的方法从总体中抽取样本;3、了解分层抽样的概念与特征,清楚简单随机抽样、系统抽样、分层抽样的区别和联系.【要点梳理】要点一、简单随机抽样简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回和不放回.我们在抽样调查中用的是不放回抽取.1、简单随机抽样的概念:一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本.2、简单随机抽样的特点:(1)被抽取样本的总体个数N是有限的;(2)简单随机样本数n小于等于样本总体的个数N;(3)从总体中逐个进行抽取,使抽样便于在实践中操作;(4)它是不放回抽取,这使其具有广泛应用性;(5)每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性.3、实施抽样的方法:(1)抽签法:抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力又不方便,若标号的纸片或小球搅拌得不均匀还可能导致抽样的不公平.抽签法的一般步骤:①将总体中的N个个体编号;②把这N个号码写在形状、大小相同的号签上;③将号签放在同一箱中,并搅拌均匀;④从箱中每次抽取一个号签,连续抽取n次;⑤将总体中与抽到的号签的编号一致的n个个体取出.(2)随机数表法:要理解好随机数表,即表中每个位置上等可能出现0,1,2,…,9这十个数字的数表.随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性.随机数表法的步骤:①将总体的个体编号(每个号码的位数一致);②在随机数表中任选一个数字作为开始;③从选定的数开始按一定的方向读下去,若得到的数码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止.注意:①选定开始数字,要保证所选数字的随机性;②确定读数方向获取样本号码时,读数方向可向左、向右、向上、向下,样本号码不能重复,否则舍去.要点诠释:1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型.3、简单随机抽样每个个体入样的可能性都相等,均为Nn ,但是这里一定要将每个个体入样的可能性、第n 次每个个体入样的可能性、特定的个体在第n 次被抽到的可能性这三种情况区分开来,避免在解题中出现错误.要点二、系统抽样1、系统抽样的概念:当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样.2、系统抽样的特征:(1)当总体容量N 较大时,采用系统抽样;(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样;(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.3、系统抽样的一般步骤:(1)采用随机的方法将总体中的N 个个体编号;(2)将编号按间隔k 分段,当N n 是整数时,取N k n =,当N n不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数'N 能被n 整除,这时取'N k n =,并将剩下的总体重新编号; (3)在第一段用简单随机抽样确定起始个体的编号()l l N l k ∈≤,;(4)按照一定的规则抽取样本,通常是将编号为2(1)l l k l k l n k +++-L L ,,,,的个体取出. 要点诠释:1、从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.2、系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样.要点三、分层抽样1、分层抽样的概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.2、分层抽样的特点:(1)适用于总体是由有明显差别的几部分组成时的情况;(2)分层抽样对各个个体来说被抽取的可能性相同.3、分层抽样的优点:(1)样本具有较强的代表性;(2)在各层抽样时,可灵活地选用不同的抽样方法.4、分层抽样的步骤:(1)将总体按一定的标准分层;(2)计算各层的个体数与总体的个体数的比;(3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量;(4)在每一层进行抽样(各层可以按简单随机抽样或系统抽样的方法抽取)要点诠释:1、应用分层抽样应遵循以下要求:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等.2、分层抽样是当总体有差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是,层内样本的差异要小,而层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样.(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.3、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法.要点四、三种抽样方法的比较类型一:简单随机抽样例1.下列抽取样本的方式是否属于简单随机抽样?说明理由.(1)从无限多个个体中抽取100个个体作样本;(2)盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意抽出1个零件进行质量检验后再把它放回盒子里.【解析】(1)不是简单随机抽样,因为总体的个数是无限的.(2)不是简单随机抽样,因为它是放回抽样.【总结升华】简单随机抽样的四个特点:(1)总体的个数有限;(2)逐个抽取;(3)是不放回的抽取;(4)每个个体被抽到的可能性必须是相同的.举一反三:【变式1】下面的抽样方法是简单随机抽样吗?为什么?(1)某班45名同学,指定个子最高的5名同学参加学校组织的某项活动.(2)从20个零件中一次性抽出3个进行质量检验.(3)一小孩从玩具箱中的20件玩具中随意拿出一件来玩.玩后放回再拿下一件,连续玩了5件.【解析】(1)不是简单随机抽样.因为这不是等可能抽样.(2)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.(3)不是简单随机抽样.因为这是有放回抽样.例2.某工厂有112件产品,产品的编号为1,2,…,112.用随机数表法抽取一个容量为10的样本,写出抽样过程.【解析】解法一:第一步,将这112件产品原有的编号调整为001,002,003, (112)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向,例如,选第9行第7列的数“3”,向右读;第三步,从“3”开始,向右读,每次读出三位,凡不在001~112中的数跳过去不读,前面已经读过的数也跳过去不读,依次可得到074,100,094,052,080,003,105,107,083,092;第四步,产品原来的编号为74,100,94,52,80,3,105,107,83,92的那10件就是被抽取出来的产品.解法二:第一步,将这112件产品原来的编号调整为101,102,103, (212)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向,例如,选第9行第7列的数“3”,向右读;第三步,从“3”开始,向右读,每次读出三位,凡不在101~212中的数跳过去不读,前面已经读过的数也跳过去不读,依次可得到155,134,174,180,165,196,206,105,160,201;第四步,对应原来编号为55,34,74,80,65,96,106,5,60,101的产品就是要抽取的对象.【总结升华】本例中,112件产品原有的编号1,2,…,112的位数不统一,有1位数,有2位数,还有3位数.为了解决这一矛盾,解法一采用了“在位数少的数前面加0”的处理方法,例如,1变为001,11变为011;解法二采用了“把原来的数加上10的倍数”的处理方法.例如,2变为102,12变为112.解法一、解法二所采用的处理方法都达到了凑齐位数的效果.举一反三:【变式1】某校有学生1200人,为调查某种情况,打算抽取一个样本容量为50的样本,则此样本采用简单随机抽样将如何获得?【解析】解法一:(抽签法)①把该校学生编号,号码为0001,0002,0003,…,1200;②做大小、形状相同的号签;③将这些号签放在同一个箱子里,进行均匀搅拌;④抽签时,每次从中抽出1个号签,连续抽出50个号签,就得到了一个容量为50的样本.解法二:(随机数表法)①把该校学生编号,号码为0001,0002,0003,…,1200;②在随机数表中选定一个起始位置,假如起始位置是表中第5行第9列的数字6;③从6开始向右连续取数字,以4个数为一组,取到一行末尾时转到下一行从左到右继续读取,所得数字如下:6438,5482,4622,3162,4309,9006,1844,3253,2383,0130,3016……所取得的4位数字如果小于或等于1200,则对应此号的学生就是被抽取的个体.如果所取得的4位数字大于1200而小于2400则减去1200,剩余数字即是被抽取的号码.如果遇到相同号码,则只留第一次取得的数字,其余的舍去,经此处理,被抽取的学生号码如下:0438,0682,1022,0762,0709,0606,0644,0853,1183,0130,0616……一直取够50人止.【变式2】要从10架钢琴中抽取4架进行质量检验,请你设计抽样方案.【解析】解法一:(随机数表法)第一步,将10架钢琴编号,号码是0,1, (9)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第3行第6列的数“2”,向右读.第三步,从数“2”开始,向右读,每次读取1位,重复数字只记录一次,依次可得到2,7,6,5.第四步,以上号码对应的4架钢琴就是要抽取的对象.解法二:(抽签法)第一步,将10架钢琴编号,号码是0,1, (9)第二步,将号码分别写在一张纸条上,揉成团,制成号签第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀.第四步,从袋子中逐个抽取4个号签,并记录上面的编号.第五步,所得号码对应的4架钢琴就是要抽取的对象.【总结升华】(1)将钢琴编号从0开始,10架钢琴用0—9就可表示,这样总体中的所有个体可用一位数表示,便于使用随机数表.(2)用抽签法抽样关键是将号签搅匀.类型二:系统抽样例3.下列抽样中,最适宜用系统抽样法的是()A.某市的4个区共有2000名学生,且4个区的学生人数之比为3∶8∶8∶2,从中抽取200名学生做样本B.从某厂生产的2000个电子元件中随机抽取5个做样本C.从某厂生产的2000个电子元件中随机抽取200个做样本D.从某厂生产的20个电子元件中随机抽取5个做样本【答案】 C【解析】A中各区学生有区别,不好分成均衡的几部分,不适宜,B中抽取样本容量太小,不适宜.D 中总体个数较少,不适宜.故选C【总结升华】系统抽样适合总体容量较大且个体间差异较小的情况.举一反三:【变式1】下列抽样中不是系统抽样的是().A.从号码为1~15的15个球中任选3个作为样本,先在1~5号球中用抽签法抽出i0号,再将号码为i0+5,i0+10的球也抽出B.工厂生产的产品,用传送带将产品送入包装车间的过程中,检查人员从传送带上每5 min抽取一件产品进行检验C.弄某项市场调查,规定在商店门口随机地抽一个人进行询问,直到调查到事先规定的调查人数为止D.某电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈【答案】C【解析】本题的判定依据是系统抽样方法的特征:系统抽样适用于个体数目较多但均衡的总体.判断一种抽样是不是系统抽样,首先看是否在抽样前知道总体是由什么构成的,抽样的方法能否保证每个个体按事先规定的条件等可能入样,再看抽样过程中是否将总体分成了几个均衡的部分,是否在每个部分中进行简单随机抽样.本题C显然不是系统抽样,因为事先不知道总体,抽样方法也不能保证每个个体等可能入样,总体也没有分成均衡的几部分,故C不是系统抽样.【总结升华】系统抽样的特点:①适用于总体容量较大的情况;②剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系;③是等可能抽样,每个个体被抽到的可能性都是n/N.例4.为了了解参加某种知识竞赛的1 003名学生的成绩,抽取一个容量为50的样本,选用什么抽样方法比较恰当?简述抽样过程.【思路点拨】因为总体容量较大,且个体差异不大,适宜选用系统抽样.【解析】抽样过程如下:(1)随机地将这l 003个个体编号为1,2,3, (1003)(2)利用简单随机抽样,先从总体中随机剔除3个个体,剩下的个体数1000能被样本容量50整除,然后将1000个个体重新编号为1,2,3, (1000)(3)将总体按编号顺序均分成50部分,每部分包括20个个体.(4)在编号为1,2,3,…,20的第一部分个体中,利用简单随机抽样抽取一个号码,比如是18.(5)以18为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:18,38,58,…,978,998.【总结升华】(1)总体中的每个个体被剔除的概率相等都是31003,也就是每个个体不被剔除的概率相等都是10001003.采用系统抽样时每个个体被抽取的概率都是501000,所以在整个抽样过程中每个个体被抽取的可能性仍然相等,都是10005050100310001003⨯=.(2)系统抽样是建立在简单随机抽样的基础之上的,在总体中剔除若干个个体时,采用的是简单随机抽样;当将总体均分后对第一部分进行抽样时,采用的也是简单随机抽样.举一反三:【变式1】从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.【解析】因为802不能整除80,为了保证“等距”分段,应先剔除2个个体.由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:第一步,先从802辆轿车中剔除2辆轿车(剔除方法可用随机数表法);第二步,将余下的800辆轿车编号为1,2,…,800,并均匀分成80段,每段含8001080k==个个体;第三步,从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个号(如5)作为起始号;第四步,从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量为80的样本.【总结升华】用系统抽样法抽取样本,当Nn 不为整数时,取Nkn⎡⎤=⎢⎥⎣⎦,即先从总体中用简单随机抽样的方法剔除N-nk个个体,且剔除多余的个体不影响抽样的公平性.【变式2】某服装厂平均每小时大约生产服装362件,要求质检员每小时抽取40件服装检验其质量状况,请你设计一个调查方案.【解析】因为总体中的个体数较多,并且总体是由没有明显差异的个体组成,所以本题宜采用系统抽样法.第一步:把这些服装分成40组,由于36240的商是9,余数是2,所以每个组有9件服装还剩2件服装,这时分段间隔就是9.第二步:先用简单随机抽样的方法从这些服装中抽取2件服装不进行检验.第三步:将剩下的服装进行编号,编号分别为0,1,2, (359)第四步:从第一组(编号分别为0,1,…,8)的服装中按照简单随机抽样的方法抽取1件服装,比如,编号为k.第五步:依次抽取编号分别为下面数字的服装k,k+9,k+18,k+27,…,k+39×9,这样就抽取了一个容量为40的样本.类型三:分层抽样例5.在下列问题中,各采用什么抽样方法抽取样本?(1)从20台彩电中抽取4台进行质量检验;(2)科学会堂有32排座位,每排有40个座位(座号为1~40),一次报告会坐满了听众,会后为听取意见留下了座号为18的所有32名听众进行座谈;(3)光远中学有180名教职工,其中教师136名,管理人员20名,后勤服务人员24名,为征求某项意见,现从中抽取一个容量为15的样本.【答案】(1)简单随机抽样;(2)系统抽样;(3)分层抽样.【解析】(1)所述问题中总体中的个体数和样本容量均较少,故宜用简单随机抽样法;(2)所述问题具有总体中的个体数较多,且每个个体无明显差异的特点,所以适宜用系统抽样法;(3)所述问题的总体中的个体具有明显差异,即出现了3个层次,因此适宜用分层抽样法.【总结升华】总体容量较小宜用抽签法;总体容量较大,而样本容量较小宜用随机数表法;总体容量较大,样本容量也较大的宜用系统抽样法;总体是由差异明显的几个层次组成,宜用分层抽样法.举一反三:【变式1】一个单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,要从中抽取一个容量为20的样本,如何去抽取?方法一:将160人从1到160编上号,然后将用白纸做成的有1~160号的160个号签放入箱内搅匀,最后从中抽取20个签,与签号相同的20个人被选出.方法二:将160人从1至160编号,按编号顺序分成20组,每组8人,令1~8号为第一组,9~16号为第二组,……,153~160号为第20组.从第一组中用抽签方式抽到一个为k号(1≤k≤8),其余组是(k+8n)号(n=1,2,3,…,19),以此抽取20人.方法三:按20∶160=1∶8的比例,从业务员中抽取12人,从管理人员中抽取5人,从后勤服务人员中抽取3人,都用简单随机抽样法从各类人员中抽取所需人数,他们合在一起恰好抽到20人.以上的抽样方法,依次是简单随机抽样、分层抽样、系统抽样的顺序是().A.方法一、方法二、方法三B.方法二、方法一、方法三C.方法一、方法三、方法二D.方法三、方法一、方法二【答案】C【变式2】某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270;关于上述样本的下列结论中,正确的是A.②、③都不能为系统抽样B.②、④都不能为分层抽样C.①、④都可能为系统抽样D.①、③都可能为分层抽样【答案】D例6.某地区中小学人数的分布情况如下表所示(单位:人):请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.【思路点拨】先采用分层抽样法确定出此地区城市、县镇、农村应被抽取的个体数,再用分层抽样法将城市应抽取的个体数分配到小学、初中、高中.同理可以完成县镇、农村的分配.【解析】第一步,确定城市、县镇、农村应抽取的个体数.城市、县镇、农村的学生数分别为:357000+226200+11000=695200(人),221600+134200+43300=399100(人),258100+11290+6300=275690(人).因为样本容量与总体容量的比为1∶1000,所以样本中包含的各部分个体数分别为: 16952006951000⨯≈(人),13991003991000⨯≈(人),12756902761000⨯≈(人). 第二步,将城市应抽取的个体数分配到小学、初中、高中.因为城市小学、初中、高中的人数比为:357000∶226200∶112000=3570∶2262∶1120=1785∶1131∶560,1785+1131+560=3476,所以城市小学、初中、高中应抽取的人数分别为:69517853572476⨯≈(人),69511312263476⨯≈(人),6955601123476⨯≈(人). 第三步,将县镇应抽取的个体数分配到小学、初中、高中.因为县镇小学、初中、高中的人数比为:221600∶134200∶43300∶2216∶1342∶433,2216+1342+433=3991,所以县镇小学、初中、高中应抽取的人数分别为:39922162223991⨯≈(人),39913421343991⨯≈(人),399433433991⨯≈(人). 第四步,使用同样的方法将农村应抽取的个体数分配到小学、初中、高中.可得农村小学、初中、高中应抽取的人数分别为:258(人),11(人),6(人).第五步,再用合适的方法在对应的各个部分中抽取个体.在各层中所抽取的个体数如下表所示(单位:人):按照上表数目在各层中用合适的方法抽取个体,合在一起形成所需样本.【总结升华】 本题交错使用了分层抽样的方法,像这样比较复杂的问题,在解答的时候可以先将问题分成几个部分,再对各个部分具体解决. 举一反三:【变式1】一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人,为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取? 【解析】 用分层抽样来抽取样本,步骤是:(1)分层.按年龄将职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.(2)确定每层抽取个体的个数.抽样比为10015005=,则在不到35岁的职工中抽125×15=25(人); 在35岁至49岁的职工中抽280×15=56(人); 在50岁及50岁以上的职工中抽95×15=19(人).(3)在各层分别按抽签法或随机数表法抽取样本.(4)综合每层抽样,组成样本.【总结升华】分层后,各层的个体数较多时,可采用系统抽样或随机数表法抽取出各层中的个体,一定要注意按比例抽取.例7.为了考察某校的教学水平,现抽查这个学校高一年级部分学生的本学年考试成绩进行分析.为了全面地反映实际情况,采取以下三种方式进行抽查(已知该校高一年级共有20个班,并且所有学生都已经按随机方式编好了学号,假定该校每班人数都相同):①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察这20个学生的考试成绩;②每个班都抽取1人,共计20人,考察这20个学生的考试成绩;③把该校高一年级的学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生进行考察(已知按成绩分,该校高一学生中成绩优秀的学生有150名,良好的学生有600名,普通的学生有250名).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?(2)上面三种抽取方式中,各自采用何种抽样方法?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.【思路点拨】依据总体和个体的特点,选择抽取样本的方法.【答案】(1)高一年级全体学生的本学年考试成绩,高一年级每个学生本学年的考试成绩,抽取的20名学生本学年的考试成绩.(2)简单随机抽样法,系统抽样法和简单随机抽样法,分层抽样法和简单随机抽样法.(3)略【解析】(1)这三种抽取方式中,其总体都是指该校高一年级全体学生的本学年考试成绩,个体都是指高一年级每个学生本学年的考试成绩.其中第①种抽取方式中样本为所抽取的20名学生本学年的考试成。