11.3 随机抽样、用样本估计总体
随机抽样和样本估计总体
的样本,这种抽样方式叫做系统抽样.
(2)步骤: ①编号.采用随机的方式将总体中的个体编号,编号的方式 可酌情处理;
②_分__段__.先确定分段的间隔 k.当Nn(N 为总体中的个体数,n 为样本容量)是整数时,k=Nn ;当Nn 不是整数时,通过从总体中随 机剔除一些个体使剩下的总体中个体总数 N′能被 n 整除,这时 k =Nn′;
位数分别为( C )
A.85,85
图 15-1-1 B.84,86 C.84,85
D.85,86
4.(2011 年上海)课题组进行城市空气质量调查,按地域把 24 个城市分成甲、乙、丙三组,对应城市数分别为 4,12,8.若用分层 抽样抽取 6 个城市,则丙组中应抽取的城市数为___2_.
5.某个容量为 100 的样本的频率分布直方图如图 15-1-2, 则在区间[4,5)上的数据的频数为__3_0__.
A.①简单随机抽样,②系统抽样,③分层抽样 B.①简单随机抽样,②分层抽样,③系统抽样 C.①系统抽样,②简单随机抽样,③分层抽样 D.①分层抽样,②系统抽样,③简单随机抽样 解析:此题主要考察的是三种抽样方法的适用情况.对①总 体个数较少,采用简单随机抽样,对②个体数相对较多,采用系 统抽样,对③个体相互差异明显,采用分层抽样,故选A. 答案:A
平均环数-x
甲 乙丙丁 8.6 8.9 8.9 8.2
方差 s2 3.5 3.5 2.1 5.6
从这四个人中选择一人参加奥运会射击项目比赛,最佳人选Biblioteka 是( C )A.甲
B.乙
C.丙
D.丁
3.(2011 年广东广雅中学测试)在广雅中学“十佳学生”评选 的演讲比赛中,如图 15-1-1 是七位评委为某学生打出的分数的 茎叶图,去掉一个最高分和一个最低分后,所剩数据的众数和中
概率与统计
平均数、众数和中位数都是描述一组数据的集中趋势的量,但它们描述的角 度和适用的范围又不尽相同。
三.变量间的相关关系及回归分析
1.相关关系:
当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的 关系叫做相关关系。与函数关系不同,相关关系是一种不确定关系。
2.散点图
3.回归分析:
对具有相关关系的两个变量进行统计分析的方法叫做回归分析。
ˆx a <1>回归直线方程: y ˆ b
一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为 样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这 种抽样方法叫做简单随机抽样。(抽签法,随机数表法)
3.系统抽样
当总体中的个体比较多时,首先把总体分成均衡的若干部分,然后按照 事先确定的规则,从每一部分中抽取一个个体,得到所需要的样本,这种抽 样方法叫做系统抽样。
(2)特点:
①无限性:试验中所有可能出现的结果(基本事件)有无限多个; ②等可能性:试验结果在每一个区域内均匀分布。
构成事件A的区域长度(面积或体 积) (3)计算公式: P( A) 试验的全部结果所构成 的区域长度(面积或体 积)
7.条件概率 (1)定义:
对于任何两个事件A和B,在已知事件A发生的条件下,事件B发生的概率 叫做条件概率,用符号P(B|A)来表示。
《用样本估计总体》 讲义
《用样本估计总体》讲义在我们的日常生活和各种研究领域中,经常会遇到需要了解某个总体的情况,但由于总体规模过大或者其他限制,我们无法对总体中的每一个个体进行调查和分析。
这时候,用样本估计总体就成为了一种非常实用且有效的方法。
那么,什么是样本,什么又是总体呢?总体就是我们所关心的研究对象的整个集合,比如全国所有高中生的身高情况,这就是一个总体。
而样本呢,则是从总体中抽取的一部分个体,比如从某几个学校中抽取的部分高中生的身高数据。
为什么要用样本估计总体呢?首先,直接研究总体往往是不现实的,成本太高、时间太长,甚至根本无法做到。
其次,通过合理抽取的样本,我们能够以相对较小的代价和时间获取到关于总体的一些有用信息。
接下来,让我们看看如何抽取样本。
抽取样本可不是随便抓几个就行,得有一定的方法和原则,这样才能保证样本具有代表性,能够较好地反映总体的特征。
简单随机抽样是一种常见的抽样方法。
想象一下,我们把总体中的每个个体都编上号,然后通过随机数表或者其他随机的方式抽取一定数量的个体,这就是简单随机抽样。
比如要从一个班级的 50 名学生中抽取 5 名进行调查,我们可以给每个学生一个编号,然后随机抽取 5 个编号对应的学生。
分层抽样也是常用的方法之一。
如果总体中存在明显的不同层次或者类别,我们就可以按照这些层次进行分层,然后从每一层中分别抽取样本。
比如要调查一个城市居民的收入情况,我们可以按照不同的区域、职业等进行分层,然后从每个层次中抽取一定数量的居民。
系统抽样则是先将总体中的个体编号,然后按照一定的间隔抽取样本。
比如从 1000 个个体中抽取 50 个,我们可以先计算出间隔为 20,然后从第 1 个个体开始,每隔 20 个抽取一个。
抽取了合适的样本之后,我们就要通过样本的数据来估计总体的特征了。
首先是估计总体的均值。
样本均值就是样本中所有个体的平均值,我们可以用样本均值来估计总体的均值。
假设我们抽取的样本数据为 x1, x2, x3,, xn,那么样本均值x=(x1 + x2 + x3 ++ xn) / n 。
中等职业教育规划教材数学1-3册目录(人民教育出版社)
目录第一章集合(第一册)1.1集合及其表示1.1.1集合1.1.2集合的表示方法1.2集合之间的关系1.3集合的基本运算1.3.1交集1.3.2并集1.3.3补集1.4充要条件第二章方程与不等式2.1一元一次方程2.2不等式2.2.1不等式的基本性质2.2.2不等式的解集与区间2.2.3含有绝对值的不等式2.2.4一元二次不等式第三章函数3.1函数的概念3.2函数的表示方法3.3函数的单调性3.4函数的奇偶性3.5二次函数的图像和性质3.6函数的应用第四章指数函数与对数函数4.1实数指数4.2指数函数4.3对数及其运算4.3.1对数4.3.2对数的运算4.4对数函数4.5幂函数4.6指数函数与对数函数的应用第五章数列5.1数列5.2等差数列5.2.1等差数列的概念5.2.2等差数列的前n项和5.3等比数列5.3.1等比数列的概念5.3.2等比数列的前n项和5.4等差数列与等比数列的应用第六章空间几何体6.1认识空间几何体6.1.1认识多面体与旋转体6.1.2棱柱、棱锥6.1.3圆柱、圆锥、球6.2空间几何体的表面积与体积6.2.1空间几何体的表面积6.2.2空间几何体的体积第七章三角函数(第二册)7.1任意角的概念与弧度制7.1.1任意角的概念7.1.2弧度制7.2任意角的三角函数7.2.1任意角的三角函数的定义7.2.2单位圆与正弦、余弦线7.2.3利用计算器求三角函数值7.2.4三角函数值在各象限的符号7.3同角三角函数的基本关系式7.4三角函数的诱导公式7.5正弦、余弦函数的图像和性质7.5.1正弦函数的图像和性质7.5.2余弦函数的图像和性质7.6已知三角函数值求角第八章平面向量8.1向量的概念8.2向量的线性运算8.2.1向量的加法8.2.2向量的减法8.2.3数乘向量8.3平面向量的的直角坐标系8.3.1平面向量的直角坐标及其运算8.3.2平面向量平行的坐标表示8.3.3向量的长度公式和中点公式8.4向量的内积8.4.1向量的内积8.4.2向量内积的直角坐标运算第九章 直线与圆的方程9.1直线的方程9.1.1直线的方向向量与点向式方程9.1.2直线的斜率与点斜式方程9.1.3直线的法向量与点法式方程9.1.4直线的一般式方程9.2两条直线的位置关系9.2.1两条直线的平行9.2.2两条直线的交点与垂直9.3点到直线的距离9.4圆的方程9.4.1圆的标准方程9.4.2圆的一般方程第十章 立体几何初步10.1平面的基本性质10.2空间两条直线的位置关系10.3直线与平面的位置关系10.4平面与平面的位置的关系第十一章 概率与统计初步11.1计数的基本原理11.2概率初步11.2.1随机事件与样本空间11.2.2古典概率11.3随机抽样11.3.1简单随机抽样11.3.2系统抽样11.3.3分层抽样11.4用样本估计总体11.4.1用样本的频率分布估计总体的分布11.4.2用样本的数字特征估计总体的数字特征 11.5一元线性回归分析第十二章 三角计算及其应用 (第三册) 12.1和角公式12.1.1两角和与差的余弦12.1.2两角和与差的正弦12.1.3两角和与差的正切12.2倍角公式12.3正弦函数)sin(ϕω+=x A y 的图像和性质 12.4解三角形12.4.1余弦定理12.4.2三角形的面积12.4.3正弦定理12.5三角计算及应用举例第十三章圆锥曲线与方程13.1椭圆13.1.1椭圆的标准方程13.1.2椭圆的几何性质13.2双曲线13.2.1双曲线的标准方程13.2.2双曲线的几何性质13.3抛物线13.3.1抛物线的标准方程13.3.2抛物线的几何性质第十四章坐标变换与参数方程14.1坐标变换14.1.1坐标轴的平移14.1.2利用坐标轴的平移化简二元二次方程14.1.3坐标轴的旋转14.1.4利用坐标轴的旋转化简二元二次方程14.2一般二元二次方程的讨论14.2.1化一般二元二次方程为标准式14.2.2一般二元二次方程的讨论14.3参数方程14.3.1曲线的参数方程14.3.2圆的参数方程14.3.3直线的参数方程14.3.4圆锥曲线的参数方程14.4参数方程的应用举例第十五章逻辑代数基础15.1常用逻辑用语15.1.1命题15.1.2量词15.1.3逻辑联结词15.2数制15.2.1十进制与二进制15.2.2十进制与二进制之间的转换15.3逻辑代词15.3.1基本概念与基本逻辑运算15.3.2逻辑代数的运算律和基本定理15.3.3逻辑函数15.3.4逻辑函数的表示方法15.3.5逻辑函数的化简15.3.6逻辑图第十六章算法与程序框图16.1算法的概念16.2程序框图与算法的基本逻辑结构16.2.1程序框图的基本图例16.2.2顺序结构及其框图16.2.3条件分支结构及其框图16.2.4循环结构及其框图16.3条件判断16.4算法案例第十七章数据表格信息处理17.1数组、数据表格的概念17.2数组的代数运算17.3用软件处理数据表格17.4数据表格的图示第十八章编制计划的原理与方法18.1编制计划的有关概念18.2关键路径法18.3统筹图18.3.1网络图18.3.2横道图18.4进度计划的编制18.4.1网络图的时间参数18.4.2时间优化的方法第十九章线性规划初步19.1线性规划问题19.2二元一次不等式表示的区域19.3线性规划问题的图解法19.4线性规划问题的应用举例19.5用Excel解线性规划问题第二十章复数20.1复数的概念20.1.1复数的有关概念20.1.2复数的几何意义20.2复数的运算20.2.1复数的加法和减法20.2.2复数的乘法和除法20.3实系数一元二次方程的解法20.4复数的三角形式20.4.1复数的三角形式20.4.2复数三角形式的乘法与乘方运算20.4.3复数三角形式的除法运算20.4.4复数的开方运算20.5复数的指数形式20.6复数的应用第二十一章概率分布初步21.1排列与组合21.1.1排列与排列数公式21.1.2组合与组合数公式21.2二项式定理21.2.1二项式定理21.2.2二项式系数的性质21.3离散型随机变量及其分布21.3.1离散型随机变量21.3.2二项分布21.4正态分布。
样本估计总体 系统抽样 统计与统计案例
高考总复习:统计与统计案例【考纲要求】1.随机抽样(1)理解随机抽样的必要性和重要性;(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. 2.用样本估计总体(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题. 3.变量的相关性(1)会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆). 【知识网络】【考点梳理】考点一、随机抽样从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项统计图表用样本估计总体统计简单随机抽样数据的整 理分析数据的数字特征 分层抽样系统抽样变量的相关性指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.1.简单的随机抽样 简单随机抽样的概念:设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.① 用简单随机抽样从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时,任一个体被抽到的概率为1N;在整个抽样过程中各个个体被抽到的概率为n N;②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等; ③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础. 简单抽样常用方法:①抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号等等.②为将整个的编号分段 (即分成几个部分),要确定分段的间隔k .当Nn是整数时(N 为总体中的个体的个数,n 为样本容量),N k n =;当Nn 不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数'N 能被n 整除,这时'N k n=.③在第一段用简单随机抽样确定起始的个体编号l .④按照事先确定的规则抽取样本(通常是将l 加上间隔k ,得到第2个编号l k +,第3个编号2l k +,这样继续下去,直到获取整个样本).要点诠释:①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.4.常用的三种抽样方法的比较:要点诠释:(1)各种抽样的个体被抽到的概率相等;(2)抽样过程中个体被抽到的概率相等.5.不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样随机抽样、系统抽样、分层抽样都是不放回抽样考点二、用样本估计总体1. 统计图表包括条形图、折线图、饼图、茎叶图.2.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差)(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布表3.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离,s = (2)方差: 2222121[()()...()]n s x x x x x x n=-+-++- (n x 是样本数据,n 是样本容量,x 是样本平均数)要点诠释:现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?(通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差,这与有样本的频率分布近似代替总体分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.)5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标 6. 频率分布直方图反映样本的频率分布 (1)频率分布直方图中横坐标表示组距,纵坐标表示组距频率,频率=组距×组距频率(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. (4)众数为最高矩形中点的横坐标.(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标. 考点三、变量的相关性 1. 散点图将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之间的散点图.散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律.如果变量之间存在某种关系,这些点会有一个集中趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这样近似的过程称为曲线拟合.2.两个变量的线性相关(1)相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.(2)正相关在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.(3)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (4)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.3.回归方程 (1)最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程方程$y bx a =+是两个具有线性相关关系的变量的一组数据1122(,),(,),(,),n n x y x y x y L 的回归方程,期中,a b 是待定参数.$1122211()()()n ni i i ii i n ni ii i x x y y x ynxy b x x xnx a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑$要点诠释:相关关系与函数关系的异同点: 相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系; ②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 考点四、统计案例 1.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法;(2)随机误差:线性回归模型用y bx a e =++表示,其中a,b 为模型的未知数,e 称为随机误差. (3)样本点的中心在具有线性相关关系的数据1122(,),(,),(,),n n x y x y x y L 中回归方程的截距和斜率的最小二乘估计公式分别为:$$121()(),=-()nii i nii xx y y ba y bxxx ==--=-∑∑$$ 其中111,=,(,,)nni i i i x x y x x y n ===∑∑称为样本点的中心.(4)相关系数①()()nii xx y y r --=∑②当>0r 时,表明两个变量正相关; 当<0r 时,表明两个变量负相关.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常r 大于0.75时,认为两个变量有很强的线性相关性.2.残差分析 (1)总偏差平方和把每个效应(观测值减去总的平均值)的平方加起来即:21()nii yy =-∑(2)残差数据点和它回归直线上相应位置的差异µ2()i i y y -是随机误差的效应,称µµ=i ii e y y -为残差. (3)残差平方和µ21()nii i yy =-∑.(4)相关指数µ22121()()nii i n ii yy R yy ==-=-∑∑2R 的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中, 2R 表示解释变量对预报变量变化的贡献率, 2R 越接近于1,表示回归的效果越好.3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y,它们的可能取值分别为1122{,}{,}x y x y 和,其样本频数列联表(称为2×2列联表)为2×2列联表1y 2y总计1x a b a b + 2xcd c d + 总计a c +b d +a b c d +++构造一个随机变量22()()()()()n ad bc K a b c d a c b d -=++++,其中a b c d +++为样本容量.(3)独立性检验利用随机变量2K 来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.注: 在独立性检验中经常由2K 得到观测值k ,则k =2K 是否成立?(2K 与k 的关系并不是k =2K ,k 是2K 的观测值,或者说2K 是一个随机变量,它在a ,b ,c ,d )取不同值时,2K 可能不同,而k 是取定一组数a ,b ,c ,d 后的一个确定的值. 【典型例题】类型一、简单随机抽样【例1】某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?【思路点拨】简单随机抽样一般采用两种方法:抽签法和随机数表法.【解析】解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径.解法2:(随机数表法)将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本.【总结升华】从以上两种方法可以看出,当总体个数较少时用两种方法都可以,当样本总数较多时,方法2优于方法1.举一反三:【变式】某大学为了支持奥运会,从报名的24名大三的学生中选6人组成志愿小组,请用抽签法和随机数表法设计抽样方案.【思路点拨】(1)总体的个体数较少,利用抽签法或随机数表法可容易获取样本;(2)抽签法的操作要点:编号、制签、搅匀、抽取;(3)随机数表法的操作要点:编号、选起始数、读数、获取样本.【解析】抽签法第一步:将24名志愿者编号,编号为1,2,3, (24)第二步:将24个号码分别写在24张外形完全相同的纸条上,并揉成团,制成号签;第三步:将24个号签放入一个不透明的盒子中,充分搅匀;[来源:]第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数表法第一步:将24名学生编号,编号为01,02,03,……24;第二步:在随机数表中任选一数开始,按某一确定方向读数;第三步:凡不在01~24中的数或已读过的数,都跳过去不作记录,依次记录下得数;第四步:找出号码与记录的数相同的学生组成志愿小组.类型二、系统抽样【例2】某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.【思路点拨】按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号.【解析】按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293.【总结升华】系统抽样可按事先规定的规则抽取样本. 本题采用的规则是第一组随机抽取的学生编号为k,那么第m组抽取的学生编号为k+5(m-1).举一反三:【变式】一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为l ,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第最小组中抽取的号码个位数字与m+k 的个位数字相同.若m=6,则在第7组中抽取的号码是 .【答案】∵6m =,7k =,∴13m k += ∴在第7小组中抽取的号码是63. 类型三、分层抽样【例3】某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )A .分层抽样法,系统抽样法B .分层抽样法,简单随机抽样法C .系统抽样法,分层抽样法D .简单随机抽样法,分层抽样法【思路点拨】此题为抽样方法的选取问题.当总体中个体较多而且差异又不大时宜采用系统抽样,采用系统抽样在每小组内抽取时应按规则进行;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.【解析】依据题意,第①项调查应采用分层抽样l 法、第②项调查应采用简单随机抽样法.故选B . 【总结升华】采用什么样的抽样方法要依据研究的总体中的个体情况来定. 举一反三:【变式】甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生( )A.30人,30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人【答案】B ;根据样本容量和总体容量确定抽样比,最终得到每层中学生人数.【例4】一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.【思路点拨】采用分层抽样的方法.【解析】因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层.(2)按照样本容量的比例随机抽取各乡镇应抽取的样本.300×3/15=60(人),300×2/15=40(人),300×5/15=100(人),300×2/15=40(人),300×3/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人.(3)将300人组到一起,即得到一个样本.【总结升华】分层抽样在日常生活中应用广泛,其抽取样本的步骤尤为重要,应牢记按照相应的比例去抽取.举一反三:【变式】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的41,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定(Ⅰ)游泳组中,青年人、中年人、老年人分别所占的比例; (Ⅱ)游泳组中,青年人、中年人、老年人分别应抽取的人数. 【答案】(Ⅰ)设登山组人数为x ,游泳组中,青年人、中年人、老年人各占比例分别为a 、b 、c ,则有40%347.5%410%310%4x xbxx xc x ⋅+⎧=⎪⎪⎨⋅+⎪=⎪⎩,解得50%10%b c =⎧⎨=⎩故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%. (Ⅱ)游泳组中,抽取的青年人数为320040%604⨯⨯=(人);抽取的中年人数为32004⨯⨯50%=75(人); 抽取的老年人数为32004⨯⨯10%=15(人).类型四、用样本估计总体【例4】甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分) 甲组 76 90 84 86 81 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些?【思路点拨】学会用茎叶图表示数据的方法;并会进行统计推断.【解析】用茎叶图表示两小组的成绩如图:甲茎乙6 7 4 9 97 6 6 5 4 3 2 1 8 0 2 4 5 9 90 9 1由图可知甲组成绩较集中,即甲组成绩更整齐一些.【总结升华】对各数据是二、三位数,且数据量不是很大时,用用茎叶图表示较为方便,也便于进行统计推断,否则,应改用其他方法.举一反三:【变式1】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如图所示,则他们在这次测验中成绩较好的是组.【答案】甲小组【变式2】甲、乙两名运动员的5次测试成绩如下图所示,设12,s s分别表示甲、乙两名运动员测试成绩的标准差,12,x x分别表示甲、乙两名运动员测试成绩的平均数,则有()A.12x x=,12s s<B.12x x=,12s s>C.12x x>,12s s> D.12x x=,12s s=【答案】B【例5】以下茎叶图记录了甲、乙两组各四名同学在某次数学测验中的成绩,甲组记录中有一个数据模糊,无法确认,在图中以X表示.甲组乙组6 X8 74 1 9 0 0 3甲茎乙5 7 16 88 8 2 2 3 6 7(Ⅰ)如果甲组同学与乙组同学的平均成绩一样,求X 及甲组同学数学成绩的方差;(Ⅱ)如果X=7,分别从甲、乙两组同学中各随机选取一名,求这两名同学的数学成绩之和大于180的概率.(注:方差2222121=[()()...()],n s x x x x x x n-+-++-其中12,,...,.n x x x x 为的平均数)【思路点拨】(Ⅰ)利用平均数的基本概念加以求解。
随机抽样、用样本估计总体习题及答案解析
随机抽样、用样本估计总体1.某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标).所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有 根棉花纤维的长度小于20 mm.惠生活 观影指南爱尚嘟嘟园迅播影院请支持我们,有更多资源和动力【答案】 30【解析】 因为频率分布直方图的矩形的高为,频率概率故矩形的高⨯组距即为频率.从图中可知长 度小于20 mm 的频率为(0.01+0.01+0.04)50⨯=.3,又总体为100根,故纤维长度小于20 mm 的根 数为1000⨯.3=30根. 惠生活 观影指南 爱尚 嘟嘟园 迅播影院 请支持我们,有更多资源和动力 课后作业夯基基础巩固2.从2 008名学生中选取50名学生参加全国数学联赛,若采用下面的方法选取:先用简单随机抽 样从2 008人中剔除8人,剩下的2 000人再按系统抽样的方法抽取,则这2 008名学生中每人入选的概率( )A.不全相等B.均不相等C.都相等,且为502008D.都相等,且为140【答案】 C 【解析】 随机抽样过程中,保证每个个体被抽取的可能性是相等的,所以每人入选的概率都相等,且为502008. 3.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年 级的学生中应抽取的人数为… ( )A.6B.8C.10D.12【答案】 B【解析】 分层抽样的原理是按照各部分所占的比例抽取样本,设从高二年级抽取的学生数为n ,则30640n=,得n =8. 4.某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的 频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A.90B.75C.60D.45【答案】A【解析】样本中产品净重小于100克的频率为(0.050+0.100)⨯2=0.3,频数为36.样本总数为36120 03= ..∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)20⨯=.75, ∴样本中净重大于或等于98克并且小于104克的产品的个数为1200⨯.75=90.5.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A.91.5和91.5B.91.5和92C.91和91.5D.92和92【答案】A【解析】按照从小到大的顺序排列为87,89,90,91,92,93,94,96.∵有8个数据,∴中位数是中间两个数的平均数:91922+=91.5,平均数为8789909192939496918+++++++=.5,故选A.6.一组数据的平均数是4.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( )A.55.2,3.6B.55.2,56.4C.64.8,63.6D.64.8,3.6【答案】D【解析】每一个数据都加上60时,平均数也应加上60,而方差不变.7.为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为.【答案】40【解析】在系统抽样中,确定分段间隔k,对编号进行分段,(N k N n=为总体的容量,n 为样本的容量), ∴12004030N k n ===. 8.高三(1)班共有56人,学号依次为1,2,3,…,56,现用系统抽样的办法抽取一个容量为4的样本,已知 学号为6,34,48的同学在样本中,那么还有一个同学的学号应为 .【答案】 20【解析】 根据题意,56人应分为4组,每组14人,第一组为6号,第二组为6+14=20号,第三组为20+14=34号,第四组为34+14=48号,故还有一个同学的学号为20.9.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如图,则由此估计该厂工人一天生产该产品数量在[55,70)的人数约占该厂工人总数的百分率是 .【答案】 52.5%【解析】 结合频率分布直方图可以看出:生产数量在[55,65)的人数频率为0.04100⨯=.4,生产数量在[65,75)的人数频率为0.025⨯10=0.25,而生产数量在[65,70)的人数频率约为0.25⨯102=.125,那么生产数量在[55,70)的人数频率约为0.4+0.125=0.525,即52.5%. 10.(2011江苏高考,6)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差2s = .【答案】 165【解析】 ∵10685675x ++++==, ∴2s = 22222(107)(67)(87)(57)(67)1655-+-+-+-+-=. 11.为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎叶图表示如图,则该组数据的方差为.【答案】 5 【解析】 该运动员6场的总得分为14+17+18+18+20+21=108,平均得分为10818(6=分),方差为 2222221[(1418)(1718)(1818)(1818)(2018)(2118)]56-+-+-+-+-+-=,故填5. 12.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如 下表:惠生活 观影指南 爱尚 嘟嘟园 迅播影院 请支持我们,有更多资源和动力(1)画出茎叶图,由茎叶图你能获得哪些信息?(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并判断选谁参加比赛更合适【解】 (1)画茎叶图,如图所示,中间数为数据的十位数.从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是33.5,甲的中位数是33.因此乙总体得分情况比甲好(2)根据公式得3333x x =,=甲乙;s =甲 3.96s ,=乙 3.35;甲的中位数是33,乙的中位数是综合比较选乙参加比赛较为合适.。
高三数学人教版A版数学(理)高考一轮复习教案:用样本估计总体 Word版含答案
第三节用样本估计总体总体分布的估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一频率分布直方图1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.易误提醒 (1)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.(2)易忽视频率分布直方图中纵轴表示的应为频率组距.必记结论 由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. [自测练习]1.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:由题意知,a =1-(0.02+0.03+0.04)×102×10=0.005.答案:B2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:设中间一组的频数为x ,依题意有x 80=14⎝⎛⎭⎫1-x 80,解得x =16,应选D. 答案:D知识点二 茎叶图 茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.易误提醒 在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[自测练习]3.(2015·惠州模拟)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )A .19、13B .13、19C .20、18D .18、20解析:由茎叶图可知,甲的中位数为19,乙的中位数为13.故选A. 答案:A知识点三 样本的数字特征 1.众数、中位数、平均数 数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的平均数x =x 1+x 2+…+x nn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)方差:标准差的平方s 2s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x 是样本平均数.易误提醒 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.(3)实际问题中求得的平均数、众数和中位数应带上单位.必备方法 利用频率分布直方图求众数、中位数与平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[自测练习]4.对于一组数据x i (i =1,2,3,…,n ),如果将它们改变为x i +C (i =1,2,3,…,n ),其中C ≠0,则下列结论正确的是( )A .平均数与方差均不变B .平均数变,方差保持不变C .平均数不变,方差变D .平均数与方差均发生变化解析:依题意,记原数据的平均数为x ,方差为s 2,则新数据的平均数为(x 1+C )+(x 2+C )+…+(x n +C )n =x +C ,即新数据的平均数改变;新数据的方差为1n {[(x 1+C )-(x +C )]2+[(x 2+C )-(x +C )]2+…+[(x n +C )-(x +C )]2}=s 2,即新数据的方差不变,故选B.答案:B5.(2015·高考陕西卷)中位数为1 010的一组数构成等差数列,其末项为2 015,则该数列的首项为________.解析:设等差数列的首项为a 1,根据等差数列的性质可得,a 1+2 015=2×1 010,解得a 1=5.答案:5考点一频率分布直方图及应用|1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.12B.0.012C.0.18 D.0.018解析:依题意,0.054×10+10x+0.01×10+0.006×10×3=1,解得x=0.018,故选D.答案:D2.某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.解:(1)(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是频率组距,而不是频率.考点二 茎叶图|1.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x ,y 的值分别为( )A .2,4B .4,4C .5,6D .6,4解析:x 甲=75+82+84+(80+x )+90+936=85,解得x =6,由图可知y =4,故选D.答案:D2.(2016·长沙一模)右面的茎叶图是某班学生在一次数学测验时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C.女生成绩和男生成绩的中位数分别为82,80D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析:对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;对于D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;对于C,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误,故选C.答案:C使用茎叶图时,需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.考点三样本的数字特征|(2015·高考广东卷)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解] (1)依题意,20×(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)=1, 解得x =0.007 5.∴直方图中x 的值为0.007 5.(2)由图可知,最高矩形的数据组为[220,240), ∴众数为220+2402=230.∵[160,220)的频率之和为(0.002+0.009 5+0.011)×20=0.45,∴依题意,设中位数为y , ∴0.45+(y -220)×0.012 5=0.5. 解得y =224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.012 50.012 5+0.007 5+0.005+0.002 5=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5(户).(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)利用方差优化比较时方差越小,效果越好.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定.答案:甲11.概率与统计的综合问题的答题模板【典例】(12分)(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[思路点拨](1)因为在频率分布直方图上,纵坐标表示的是频率与组距的比值,根据频数求出频率,进而求出频率与组距的比值,根据频率分布直方图可看出满意度评分的平均值的大小和分散程度,中间的矩形面积越高越集中,越不分散;(2)B地区可直接借助低于70分的频数10求出不满意的概率,A地区利用频率分布直方图中小矩形的面积即为频率,可求出不满意的概率,进而比较大小.[规范解答](1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(6分)(2)A地区用户的满意度等级为不满意的概率大.(7分)记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,(8分)P(C B)的估计值为(0.005+0.02)×10=0.25.(10分)所以A地区用户的满意度等级为不满意的概率大.(12分)[模板形成]分析图表、审核数据↓作出频率分布直方图↓由直方图数据分析相应问题↓利用直方图求概率,作出判断↓反思解题过程注意规范化A组考点能力演练1.(2016·邢台摸底)样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其样本方差为( )A.105B.305C. 2 D .2解析:依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2,选D.答案:D2.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a <15,b =15,c =17,c >b >a ,选D.答案:D3.(2015·高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:根据柱形图易得选项A ,B ,C 正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D 错误.故选D.答案:D4.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:由题中茎叶图,知x 甲=26+28+29+31+315=29,s 甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2] =3105; x 乙=28+29+30+31+325=30,s 乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2] = 2.所以x 甲<x 乙,s 甲>s 乙,故选B. 答案:B5.(2016·内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[11,20),[20,30),[30,40]时,所作的频率分布直方图是( )解析:本题考查统计.利用排除法求解.由直方图的纵坐标是频率/组距,排除C 和D ;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A ,故选B.答案:B6.(2015·郑州二检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m 、n 的比值mn =________.解析:由茎叶图可知甲的数据为27、30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:387.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25.答案:258.(2015·高考湖北卷)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 解析:(1)0.1×1.5+0.1×2.5+0.1×a +0.1×2+0.1×0.8+0.1×0.2=1,解得a =3; (2)区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人数为10 000×0.6=6 000.答案:(1)3 (2)6 0009.甲、乙两人参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图.(1)指出学生乙成绩的中位数;(2)现要从中选派一人参加数学竞赛,你认为应该派哪位学生参加? 解:(1)依题意知,学生乙成绩的中位数为83+852=84.(2)派甲参加比较合适,理由如下:x 甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x 乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s 2甲=35.5,s 2乙=41,∵x 甲=x 乙,且s 2甲<s 2乙,∴甲的成绩比较稳定.10.(2016·唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m 名学生进行体育测试.根据体育测试得到了这m 名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m 的值及中位数n ;(2)若该校学生测试平均成绩小于n ,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06, 则m ×(0.02+0.02+0.06)=20,解得m =200.由直方图可知,中位数n 位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n -70)=0.5,解得n =74.5.(2)设第i (i =1,2,3,4,5,6,7)组的频率和频数分别为p i 和x i ,由图知,p 1=0.02,p 2=0.02,p 3=0.06,p 4=0.22,p 5=0.40,p 6=0.18,p 7=0.10,则由x i =200×p i ,可得x 1=4,x 2=4,x 3=12,x 4=44,x 5=80,x 6=36,x 7=20, 故该校学生测试平均成绩是x=35x1+45x2+55x3+65x4+75x5+85x6+95x7200=74<74.5,所以学校应该适当增加体育活动时间.B组高考题型专练1.(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123C.137 D.167解析:由扇形统计图可得,该校女教师人数为110×70%+150×(1-60%)=137.故选C.答案:C2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,故运动员人数为4.答案:43.(2015·高考江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:由平均数公式可得这组数据的平均数为4+6+5+8+7+66=6.答案:64.(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解:(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。
用样本估计总体
用样本估计总体要用样本估计总体的平均数和方差,首先需要了解一些基本概念和方法。
这篇文章将从样本、总体、样本估计等方面进行讨论,并介绍一些常见的样本估计方法。
1.样本与总体:样本是指从总体中选取的一部分观察值,总体是指研究对象的全部观察值的集合。
通常情况下,我们无法直接获得总体的所有观察值,但可以通过选取一部分样本来对总体进行估计。
2.样本估计:样本估计是通过对样本数据进行分析,得出对总体的一些参数的估计值。
常见的参数包括总体的平均数、方差、比例等。
3.样本的选择:为了保证样本的代表性,需要采用一定的抽样方法。
简单随机抽样是常用的抽样方法之一,它的特点是每个样本被选中的概率相等。
其他常用的抽样方法包括等距抽样、分层抽样等。
4.样本均值的估计:样本均值是用来估计总体均值的一个重要指标。
样本均值的估计值可以通过计算样本观察值的平均数得到。
假设样本的观察值为x1, x2, ..., xn,样本均值的估计公式为:样本均值的估计值 = (x1 + x2 + ... + xn) / n。
其中,n表示样本容量。
5.样本方差的估计:样本方差是用来估计总体方差的一个重要指标。
样本方差的估计值可以通过计算样本观察值与样本均值之差的平方的平均数得到。
假设样本的观察值为x1, x2, ..., xn,样本方差的估计公式为:样本方差的估计值= ((x1 - 样本均值的估计值)^2 + (x2 - 样本均值的估计值)^2 + ... + (xn - 样本均值的估计值)^2) / (n - 1)。
其中,n表示样本容量。
6.置信区间:在样本估计中,通常需要给出一个区间估计来反映估计值的准确程度。
置信区间是一个包含总体参数真值的区间,置信度表示该区间包含总体参数真值的概率。
置信区间的计算需要考虑样本容量、样本分布以及所选的置信水平等因素。
综上所述,通过样本对总体的平均数和方差进行估计是统计学中常见的问题。
根据样本均值的估计和样本方差的估计公式,可以计算出相应的估计值。
随机抽样-用样本估计总体
2.[2017全国卷Ⅰ]为评估一种农作物的种 植效果,选了n块地作试验田.这n块地的 亩产量(单位:kg)分别为x1,x2,…,xn,下 面给出的指标中可以用来评估这种农作物 亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差 C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
2.用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数。 (2)中位数:将数据按大小顺序排列,若有奇数个数,则最中间的数是中 位数;若有偶数个数,则中间两数的平均数是中位数。
(3)平均数:-x =_x_1+__x_2_+_n_…__+__x_n___ ______,反映了一组数据的平均水平。
B.某车间包装一种产品,在自动传送带上,每隔 5分钟抽一包产品,称其质量是否合格
C.某校分别从行政、教师、后勤人员中抽取2人、 14人、4人了解学校机构改革的意见
D.用抽签法从10件产品中选取3件进行质量检验
[答案] D
[解析] A,B不是简单随机抽样,因为抽 取的个体间的间隔是固定的;C也不是,因 为总体的个体有明显的层次;D是简单随机 抽样中的抽签法.故选D.
A.480 B.481
C.482 D.483
[答案] C
[解析] 根据系统抽样的定义可知,样本的 编号成等差数列,令a1=7,a2=32,d=25, 所以7+25(n-1)≤500,所以n≤20,最大编 号为7+25×19=482.
4.[2019山东临沂模拟]某班共有52人,现根
据学生的学号,用系统抽样的方法,抽取 一个容量为4的样本,已知3号、29号、42
号同学在样本中,那么样本中还有一个同 学的学号是( )
A.10
抽样方法与总体分布的估计
抽样比= 样个本体=容总量量.
各层样本容量 各层个体数量
例
(1)(2017河北石家庄二中三模,3)某校为了解1 000名高一新生的身体状
况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~
1 000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽
样抽取的号码为 ( C )
y
∴z y=21y2, ,z=18,
2 6(z 6),
若用分层抽样的方法抽取12个观测点的数据,则容城应抽取的数据个数
为12× =142,故选C.
6 12 18
方法 2 频率分布直方图的应用
用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识 图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点: (1)纵轴表示频率/组距;(2)频率分布直方图中各小长方形高的比就是相 应各组的频率之比;(3)直方图中各小长方形的面积是相应各组的频率, 所有的小长方形的面积之和等于1,即频率之和为1.
A.16 B.17 C.18 D.19
(2)(2017山东淄博二模,6)为了调研雄安新区的空气质量状况,某课题组 对雄县、容城、安新3县的空气质量进行了调查,按地域特点在三县内 设置空气质量观测点,已知三县内观测点的个数分别为6,y,z,依次构成 等差数列,且6,y,z+6成等比数列,若用分层抽样的方法抽取12个观测点 的数据,则容城应抽取的数据个数为 ( C ) A.8 B.6 C.4 D.2
6.样本的数字特征
(1)众数、中位数、平均数
数字特征 样本数据
频率分布直方图
众数
出现⑤ 次数最多 的数据
取最高的小矩形底边中点的横坐标
中位数
第五章《用样本推断总体》复习讲义(解析版)
第五章 用样本推断总体(考点讲义)1.样本容量:样本中个体的数目叫做样本容量。
2.在用样本特性估计总体特性时,要注意一是样本要有代表性,二是样本容量要足够大。
3.求平均数的公式:123nx x x x x n++++=L【类型一】利用样本平均数估算总体数量【例1】为了创设全新的校园文化氛围,进一步组织学生开展课外阅读,让学生在丰富多彩的书海中,扩大知识源,亲近母语,提高文学素养.某校准备开展“与经典为友、与名著为伴”的阅读活动,活动前对本校学生进行了“你最喜欢的图书类型(只写一项)”的随机抽样调查,相关数据统计如下:请根据以上信息解答下列问题:(1)该校对_____名学生进行了抽样调查,m = _____n =_____(2)请将图1和图2补充完整,并求出扇形统计图中小说所对应的圆心角度数;(3)已知该校共有学生800人,利用样本数据估计全校学生中最喜欢科幻人数约为多少人?【解析】(1)用其它初一它的百分比即可;(2)用360∘乘以所占得百分比;(3)用样本估计总体.解:(1)20÷10%=200(名).由图1,得n=40,m=100-20-10-40=30答:该校对200名学生进行了抽样调查;m=30,n=40(2)如图:小说对应的圆心角度数为360∘×20%=72∘;(3)800×30%=240.答:全校学生中最喜欢小说的人数约为240名.【对应训练1】为了估计湖里有多少条鱼,小刚先从湖里捞出了100条鱼做上标记,然后放回湖里去.经过一段时间,带有标记的鱼完全混合于鱼群后,小刚又从湖里捞出200条鱼,如果其中15条有标记,那么估计湖里有鱼()A.1333条B.3000条C.300条D.1500条【答案】A【解析】在样本中“捕捞200条鱼,发现其中15条有标记”,即可求得有标记的所占比例,而这一比例也适用于整体,据此即可解答.【对应训练2】我国古代数学名著《九章算术》有“米谷粒分”.粮仓开仓收粮,有人送来谷米1608石,验得其中夹有谷粒.现从中抽取谷米一把,共数得256粒,其中夹有谷粒32粒,则这批谷米内夹有谷粒约是________石.【答案】201【解析】根据256粒内夹谷32粒,可得比例,再乘以1608石,即可得出答案.【解答】解:根据题意,得1608×32=201(石),256∴这批谷米内夹有谷粒约201石.【对应训练3】某山区中学280名学生参加植树节活动,要求每人植3至6棵,活动结束后随机抽查了若干名学生每人的植树量,并分为四种类型,A:3棵;B:4棵;C:5棵;D:6棵,将各类的人数绘制成扇形图(如图1)和条形图(如图2).回答下列问题:(1)这次调查一共抽查了________名学生的植树量;请将条形图补充完整;(2)被调查学生每人植树量的众数是________棵、中位数是________棵;(3)求被调查学生每人植树量的平均数,并估计这280名学生共植树多少棵?【解析】(1)由B类型的人数及其所占百分比可得总人数,总人数乘以D类型的对应的百分比即可求出其人数,据此可补全图形;(2)根据众数和中位数的概念可得答案;(3)先求出样本的平均数,再乘以总人数即可.【解答】(1)这次调查一共抽查植树的学生人数为8÷40%=20(人),D类人数=20×10%=2(人);条形图补充如图:(2)植树4棵的人数最多,则众数是4,共有20人植树,其中位数是第10、11人植树数量的平均数,则中位数是4,(3)x=4×48×562×7=5.3(棵),205.3×280=148(棵).答:估计这3280名学生共植树1484棵.【类型二】用样本估计总体【例2】为了提高学生的综合素养,某校开设了五门第二课堂活动课,按照类别分为:A“剪纸”、B“绘画”、C“雕刻”、D“泥塑”、E“插花”.为了了解学生对每种活动课的喜爱情况,随机抽取了部分同学进行调查,将调查结果绘制成如下两幅不完整的统计图.根据信息,回答下列问题:(1)本次调查的样本容量为________,统计图中的a=________,b=________;(2)通过计算补全条形统计图;(3)该校共有3000名学生,请你估计全校喜爱“雕刻”的学生人数.解:(1)样本容量为1815%=120,a=120×10%=12,b=120×30%=36.故答案为:120;12;36.(2)组频数:120―18―12―30―36=24(人),补全条形统计图如图所示:(3)3000×30120=750(人),答:该校喜爱“雕刻”约有750人.【跟踪训练1】在一个不透明的盒子中装有20个黄、白两种颜色的乒乓球,除颜色外其它都相同,小明进行了多次摸球试验,发现摸到白色乒乓球的频率稳定在0.2左右,由此可知盒子中黄色乒乓球约有…()A.2个B.4个C.18个D.16个【答案】D【跟踪训练2】质检部门从1000件电子元件中随机抽取100件进行检测,其中有2件是次品.试据此估计这批电子元件中大约有________件次品.【答案】20【解析】根据随机抽取100件进行检测,其中有2件是次品,可以计算出这批电子元件中大约有多少件次品.【跟踪训练3】书籍是人类进步的阶梯.为了解学生的课外阅读情况,某校随机抽查了部分学生本学期阅读课外书的册数,并绘制出如下统计图.(1)共抽查了多少名学生?(2)请补全条形统计图,并写出被抽查学生本学期阅读课外书册数的众数、中位数;(3)根据抽查结果,请估计该校1200名学生中本学期课外阅读5册书的学生人数.解:(1)12÷30%=40(名).(2)如图所示,由图知,众数为5,中位数为5.(3)∵抽查的样本中,课外阅读5册书的学生人数占14×100%=35%,40∴估计该校学生课外阅读5册书的学生人数约占35%,∴该校1200名学生中课外阅读5册书的学生人数约为1200×35%=420(人).【类型三】用样本频率估计总体频率【例3】中长跑(男生1000m,女生800m)是河南省某市中招体育考试的必考项目.甲、乙两校为了解本校九年级学生的训练情况,各随机抽取了20名九年级学生的中长跑模拟测试成绩(满分:30分),将成绩进行统计、整理与分析,过程如下:【收集数据】【整理数据】整理以上数据,得到模拟测试成绩x(分)的频数分布表.【分析数据】根据以上数据,得到以下统计量.根据以上信息,回答下列问题:(1)填空:a= ________,b=_________, m=________, n=________;(2)综合上表中的统计量,推断________校学生中长跑成绩更好,理由为________(写出一条即可)(3)若甲、乙两校各有800名学生,请估计两校中长跑模拟测试成绩不低于25分的学生一共有多少名?解:(1)由数据可得,a=7,b=8,m=24.75,n=23.4. 故答案为:7;8;24.75;23.4.(2)甲校学生成绩的平均数比乙校学生成绩的平均数高,且甲校学生成绩的方差比乙校学生成绩的方差小,成绩较稳定.(答案不唯一,合理即可)故答案为:甲.=720(名),(3)(800+800)×1082020答:估计两校中长跑模拟测试成绩不低于25分的学生一共有720名.【跟踪训练】今年是建党100周年,为了让全校学生牢固树立爱国爱党的崇高信念,某校开展了形式多样的党史学习教育活动,八、九年级(各有500名学生)举行了一次党史知识竞答(满分为100分),然后随机各抽取20名同学的成绩进行了收集、统计与分析,过程如下:【收集数据】两个年级抽取的20名同学的成绩如下表:八年级:7968878985598997898998938586899077898379九年级:8688979194625194877194789255979294948598【整理数据】将两个年级的抽样成绩进行分组整理:成绩x(分)50≤x<6060≤x<7070≤x<8080≤x<9090≤x<100八年级113114九年级2a b411【分析数据】抽样的平均数、众数、中位数、方差和优秀率(90分及以上为优秀)如下表:年级统计量平均数众数中位数方差优秀率八年级8589c80.420%九年级859491.5192d请根据以下信息,回答下列问题:(1)填空:a=________,b= ________,c=________,d=________;(2)请估计此次知识竞答中,八年级成绩优秀的学生人数;(3)小李同学认为九年级的整体成绩更好,请从至少两个方面分析其合理性.解:(1)由表中数据可知,九年级落在60≤x<70内的只有62,故a=1;九年级落在70≤x<80内的有71,78,故b=2;八年级成绩按照从小到大的顺序排列后,落在第10,11的数为87,89,∴中位数为88,故c=88;九年级90分及以上的学生有11人,∴九年级的优秀率为1120×100%=55%.故答案为:1;2;88;55%.(2)∵500×20%=100,∴估计此次知识竞答中,八年级成绩优秀的学生人数为100人.(3)九年级抽样成绩的众数,中位数和优秀率均高于八年级,说明九年级平均成绩更高,高分更多,因此九年级整体成绩更好.【类型四】用样本推断总体的实际应用【例4】某运动鞋经销商随机调查某校40名女生的运动鞋号码,结果如下表:鞋的号码35.53636.53737.5人数4616122现在该经销商要进200双上述五种运动鞋,你认为应该怎样进货比较合理?解析:先求出各鞋码所占比例,再乘200,即可得到所需进货数.解:由表中数据可知各鞋码的女生的比例,根据比例进货.需要进35.5码运动鞋:200×440=20(双),需要进36码运动鞋:200×640=30(双)需要进36.5码运动鞋:200×1640=80(双),需要进37码运动鞋:200×1240=60(双)需要进37.5码运动鞋:200×240=10(双)。
《统计》知识点总结+典型例题+练习(含答案)
统计考纲要求1.理解总体、个体、样本等概念.2.会指出具体问题中的总体、个体、样本、样本容量.3.了解简单随机抽样、系统抽样、分层抽样等三种抽样方法.4.会根据特征选用合适的抽样方法抽取样本.5.理解用样本的频率分布估计总体.6.理解用样本均值、方差和标准差估计总体的均值、方差和标准差.知识点一:总体与样本1.定义:在统计中,所研究对象的全体叫做总体,组成总体的每个对象叫做个体.2.定义:被抽取出来的个体的集合叫做总体的样本,样本所含个体的数目叫做样本容量. 知识点二:抽样1.简单随机抽样定义:我们采用抽签的方法,将总体按照某种顺序编号,写在小纸片上.将小纸片揉成小团,放到一个不透明的袋子中,充分搅拌后,再从中逐个抽出10个小纸团.最后根据编号找到个体.这种抽样叫做简单随机抽样.注意:简单随机抽样必须保证总体的每个个体被抽到的机会是相同的.也就是说,简单随机抽样是等概率抽样.2.系统抽样定义:当总体所含的个体较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分中抽取一定数目的个体.这种抽样叫做系统抽样(或机械抽样).主要步骤:从容量为N的总体中,用系统抽样抽取容量为n的样本,按照下面的步骤进行:(1)编号:将总体的N个个体编号;(2)确定间隔:可以考虑用Nn(取整数)作间隔分段,将总体分成n段;(3)抽样:按照一定的规则抽取样本.如抽每段的第k个顺序号的个体(k为小于Nn的整数),得到容量为n的样本.3.分层抽样当总体是由有明显差异的几个部分组成时,可将总体按差异情况分成互不重叠的几个部分——层,然后按各层个体总数所占的比例来进行抽样,这种抽样叫做分层抽样. 对分层抽样的每一层进行抽样时,可采用简单随机抽样或系统抽样. 知识点三:用样本估计总体 1.用样本的频率分布估计总体频率频率的定义:各组内数据的个数,叫做该组的频数.每组的频数与全体数据的个数之比叫做该组的频率.频率分布直方图:根据频数分布表中各组的频率,得到频率分布表,由频率分布表画出频率分布直方图.用样本的频率分布估计总体的步骤为: (1)选择恰当的抽样方法得到样本数据;(2)计算数据最大值和最小值、确定组距和组数,确定分点并列出频率分布表; (3)绘制频率分布直方图;(4) 观察频率分布表与频率分布直方图,根据样本的频率分布,估计总体中某事件发生的概率.2.用样本均值、标准差估计总体 (1)平均数或均值定义:如果有n 个数1x ,2x ,…,n x ,那么121()n x x x x n=+++叫做这n 个数的平均数或均值,x 读作“x 拔”. 均值反映出这组数据的平均水平. (2)样本方差定义:如果样本由n 个数1x ,2x ,…,n x 组成,那么样本的方差为 2222121()()()1n s x x x x x x n ⎡⎤=-+-++-⎣⎦-. (3)样本标准差由于样本方差的单位是数据的单位的平方,使用起来不方便.因此,人们常使用它的算术平方根来表示个体与样本均值之间偏离程度,叫做样本标准差.即(+-n s x .题型一 总体、个体、样本、样本容量例1 某地区为了掌握7岁儿童身高状况,随机抽取200名儿童测试身高,请指出其中的总体、个体、样本与样本容量.解答:该地区所有7岁儿童的身高是总体,每一个7岁儿童的身高是个体,被抽取的200名7岁儿童的身高是样本,样本容量是200.题型二抽样例2某中职学校为了解2009级新生的身体发育情况,从1000名新生中,利用系统抽样,抽取一个容量为50的样本.请你来完成这个抽样.解答:将这1000名学生编号(也可以利用新生录取号),由于100020 50,所以取每段间隔为20,将编号分成50段,规定各段抽取第16个顺序号的学生,得到容量为50的样本.其学生号码依次为16,36,56,76, (996)题型三用样本均值、标准差估计总体例3 科研人员在研究地里的麦苗长势时,随机抽取20株,测得各株高为(单位:mm): 61675867656459625866645960635860 62606363求样本均值、样本方差、样本标准差.分析:应用公式解答:样本均值61.95,样本方差约为8.68,样本标准差约为2.95.一、选择题1.要能清楚的表示各部分在总体中所占的百分比,应选择().A 扇形统计图B 折线统计图C条形统计图 D 表框统计2.某社区有400个家庭,其中高等收入家庭120户,中等收入家庭180户,低收入家庭100户,为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本记作①;某校高一年级有12名女排球运动员,要从中选出3人调查学习情况记作②.那么,完成上述2项调查应采用的抽样方法是( ).A. ①用随机抽样法,②用系统抽样法B.①用分层抽样法,②用随机抽样法C.①用系统抽样法,②用分层抽样法D.①用分层抽样法,②用系统抽样法3. 以下物征数中能反映一组数据波动大小的是().A极差B平均数C方差D以上都不是4.某同学参加跳远比赛前,若教练想对他10次的训练成绩进行了分析以判断他的成绩是否稳定,则教练需要知道该同学这10次成绩的( ).A平均数 B.方差 C.频数 D.频率5.数据5,7,7,8,10,11的平均值是( ).A.2B. 4C.8D. 16.一组数据:5,7,7,a,10,11,它们的平均值是8,则a的值是( ).A2 B.4 C.8 D.17.扇形统计图中,占圆面积40%的扇形的圆心角的度数是(B )A 162°B 144°C 150°D 120°8.用随机数表法从100名学生(男生25人)中抽选20人进行问卷调查,某男生被抽到的概率是( C ).A.1100B.125C.15D.149. 为了了解1200名学生对课改试验的意见,计划从中抽取一个容量为30的样本,若采用系统抽样的方法,则分段间隔为( ).A.40B.30C.20D.1210. 数据-1,-2,0,1,2的标准差是()A 1B 2 C、0 D二、判断题1.数据1,2,3,2 的众数是2, ( )2.为了了解某校学生早餐就餐情况,四位同学做了不同的调查:小华向初一年级的三个班级的全体同学做了调查;小明向初二年级的三个班级的全体同学做了调查;小华向初三年级的全体同学做了调查;小珍分别向初一(1)班、初二(1)、初三(1)班的全体同学做了调查,则小华同学的抽样调查较科学.()3.要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是抽取的60只灯泡.()4.为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中总体是被抽查的200名考生.()5.某校一个年级有12个班,每个班有50名学生,每班的学号都是1~50,为了了解学生的课外兴趣爱好,要求对每班学号为20的学生进行问卷调查,那么这里采用的抽样方法是抽签法.()6.某职业学校高一年级有机电、财经、医护这三个专业,其学生人数之比是5∶3∶2,若用分层抽样的方法抽取容量为100的样本,则应从医护专业中抽取20个个体.()7. 为了知道一锅汤的味道,妈妈从锅里舀了一勺汤尝尝,这种调查方式是抽样调查.()8.若数据1,2,5,3,4的平均数为3.()9.青年歌手大奖赛共有10名选手参赛,并请了7名评委,下表是7名评委给参加最后决赛的两位选手甲评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为84.()10. 有四位同学从编号为1-50的总体中抽取8个个体组成一个样本,他们选取的样本中个体编别为:①05,10,15,20,25,30,35,40;②43,44,45,46,47,48,49,50;③1,3,5,7,9,11,13,15,17;④43,25,2,17,35,9,24,19.认为样本④较具有随机性.()三、填空题1.从某工厂生产的某一批零件中,随机抽取10件,测得长度为(单位:cm):79、81、80、78、79、81、79、82、79、78,则总体是_______,个体是_______,样本是_______,样本容量是_______.2.0,-1,1,-2,1 的中位数是为________.3.数据2,4,6,8 的平均数是是________.4.小新家今年6月份头6天用米量如下表:请你运用统计知识,估计小新家6月份(30天)用米量为________千克。
初中数学用样本估计总体优秀教案
初中数学用样本估计总体优秀教案(经典版)编制人:__________________审核人:__________________审批人:__________________编制单位:__________________编制时间:____年____月____日序言下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。
文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!并且,本店铺为大家提供各种类型的经典范文,如工作计划、工作总结、发言致辞、自我鉴定、合同协议、条据文书、规章制度、心得体会、教学资料、其他范文等等,想了解不同范文格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!Moreover, our store provides various types of classic sample texts for everyone, such as work plans, work summaries, speeches, self-evaluation, contract agreements, documents, rules and regulations, experiences, teaching materials, other sample texts, etc. If you want to learn about different sample formats and writing methods, please pay attention!初中数学用样本估计总体优秀教案初中数学用样本估计总体优秀教案(通用5篇)在教学工作者开展教学活动前,常常要写一份优秀的教案,教案有助于学生理解并掌握系统的知识。
高考数学真题 抽样方法与总体分布的估计
11.4抽样方法与总体分布的估计考点一随机抽样1.(2015湖南文,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3B.4C.5D.6答案B从35人中用系统抽样方法抽取7人,则可将这35人分成7组,每组5人,从每一组中抽取1人,而成绩在[139,151]上的有4组,所以抽取4人,故选B.2.(2015北京文,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师 1 800青年教师 1 600合计 4 300A.90B.100C.180D.300答案C本题考查分层抽样,根据样本中的青年教师有320人,且青年教师与老年教师人数的比为1600∶900=16∶9,可以得到样本中的老年教师的人数为916×320=180,故选C.3.(2014重庆文,3,5分)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250答案A由分层抽样的特点可知703 500=n3 500+1 500,解之得n=100.4.(2014湖南文,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案D在简单随机抽样、系统抽样和分层抽样中,每个个体被抽中的概率均为nN,所以p1=p2=p3,故选D. 评析随机抽样的要求是每个个体被抽中的概率相等,与具体的方法无关.5.(2014广东文,6,5分)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20答案C由系统抽样的定义知,分段间隔为1 00040=25.故答案为C.6.(2013课标Ⅰ理,3,5分)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样答案C因为男女生视力情况差异不大,而各学段学生的视力情况有较大差异,所以应按学段分层抽样,故选C.评析本题考查了分层抽样,准确理解分层抽样的意义是解题关键.7.(2013江西理,4,5分)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01答案D由题意知依次选取的编号为08,02,14,07,01,…(第2个02需剔除),所以选出来的第5个个体的编号为01,选D.8.(2013陕西理,4,5分)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11B.12C.13D.14答案B因为840∶42=20∶1,故编号在[481,720]内的人数为240÷20=12.9.(2018课标Ⅲ文,14,5分)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是 . 答案 分层抽样解析 本题考查抽样方法.因为不同年龄段客户对其服务的评价有较大差异,所以根据三种抽样方法的特点可知最合适的抽样方法是分层抽样.10.(2015福建文,13,4分)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为 . 答案 25解析 男生人数为900-400=500.设应抽取男生x 人,则由45900=x500得x=25.即应抽取男生25人. 11.(2014天津理,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取 名学生. 答案 60 解析420×300=60(名). 12.(2012天津理,9,5分)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取 所学校,中学中抽取 所学校. 答案 18;9解析 应从小学中抽取150150+75+25×30=18(所).应从中学中抽取75150+75+25×30=9(所).评析 本题考查分层抽样及数据处理能力.13.(2012福建文,14,4分)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是 . 答案 12解析 男女运动员人数比例为5698-56=43, 分层抽样中男女人数比例不变,则女运动员人数为 28×37=12.故应抽取女运动员人数是12.评析本题考查分层抽样方法.考查学生运算求解能力.考点二用样本估计总体1.(2017课标Ⅲ理,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.()根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A本题考查统计,数据分析.观察2014年的折线图,发现从8月至9月,以及10月开始的三个月接待游客量都是减少的,故A选项是错误的.2.(2017山东文,8,5分)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7答案A由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y=5.由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均值也为66,从而有56+62+65+74+70+x5=66,解得x=3.故选A.3.(2016山东理,3文3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案D由频率分布直方图知这200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.4.(2016课标Ⅲ理,4,5分)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案D由雷达图易知A、C正确;七月的平均最高气温超过20 ℃,平均最低气温约为12 ℃,一月的平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月的平均温差大,故B正确;由雷达图知平均最高气温超过20 ℃的月份有3个月.故选D.5.(2015课标Ⅱ理,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案 D 由柱形图可知:A 、B 、C 均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,∴D 不正确.6.(2020课标Ⅲ文,3,5分)设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( )A.0.01B.0.1C.1D.10答案 C 由已知条件可知样本数据x 1,x 2,…,x n 的平均数x =x 1+x 2+…+x nn,方差s 12=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=0.01,则数据10x 1,10x 2,…,10x n 的平均数为10x 1+10x 2+…+10x nn=10x .所以这组数据的方差s 22=1n [(10x 1-10x )2+(10x 2-10x )2+…+(10x n -10x )2]=100n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=100s 12=100×0.01=1,故选C.7.(2015安徽理,6,5分)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A.8B.15C.16D.32答案 C 设样本数据x 1,x 2,…,x 10的标准差为s,则s=8,可知数据2x 1-1,2x 2-1,…,2x 10-1的标准差为2s=16. 8.(2014陕西文,9,5分)某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A.x ,s 2+1002B.x +100,s 2+1002C.x ,s 2D.x +100,s 2答案 D 设增加工资后10位员工下月工资均值为x ',方差为s'2,则x '=110[(x 1+100)+(x 2+100)+…+(x 10+100)]=110(x 1+x 2+…+x 10)+100=x +100;方差s'2=110[(x 1+100-x ')2+(x 2+100-x ')2+…+(x 10+100-x ')2]=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=s 2.故选D. 9.(2011江苏,6,5分)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2= . 答案165解析 记星期一到星期五收到的信件数分别为x 1,x 2,x 3,x 4,x 5,则x =x 1+x 2+x 3+x 4+x 55=10+6+8+5+65=7.∴s 2=15[(x 1-x )2+(x 2-x )2+(x 3-x )2+(x 4-x )2+(x 5-x )2]=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=165. 评析 本题主要考查方差的公式,考查学生的运算求解能力.公式记忆准确,运算无误是解答本题的关键,属中等难度题.10.(2018江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .8 9 9 90 1 1答案 90解析 本题考查茎叶图、平均数.5位裁判打出的分数分别为89,89,90,91,91,则这5位裁判打出的分数的平均数为15×(89+89+90+91+91)=90.方法总结 要明确“茎”处数字是十位数字,“叶”处数字是个位数字,正确写出所有数据,再根据平均数的概念进行计算.11.(2015湖北文,14,5分)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a= ;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 .答案(1)3(2)6 000解析(1)由频率分布直方图可知:0.1×(0.2+0.8+1.5+2.0+2.5+a)=1,解得a=3.(2)消费金额在区间[0.5,0.9]内的购物者的频率为0.1×(3.0+2.0+0.8+0.2)=0.6,所以所求购物者的人数为0.6×10 000=6 000.12.(2014江苏,文6,5分)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100 cm.答案24解析60×(0.015+0.025)×10=24(株).13.(2019课标Ⅱ文,19,12分)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:√74≈8.602.解析本题考查了统计的基础知识、基本思想和方法,考查学生对频数分布表的理解与应用,考查样本的平均数,标准差等数字特征的计算方法,以及对现实社会中实际数据的分析处理能力.(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21. 产值负增长的企业频率为2100=0.02. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%. (2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100∑i=15n i (y i-y )2=1100[2×(-0.40)2+24×(-0.20)2+53×02+14×0.202+7×0.402]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.方法总结 利用频数分布表求平均数估计值的方法:各组区间中点值乘该组频数,并求和,再除以样本容量.利用频数分布表求标准差估计值的方法:用各组区间中点值代表该组,代入标准差公式即可.14.(2018课标Ⅰ文,19,12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) [0.6,0.7) 频数13249265使用了节水龙头50天的日用水量频数分布表日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) 频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水.(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解析(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).易错警示利用频率分布直方图求众数、中位数与平均数时,应注意区分这三者,在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.15.(2016北京文,17,13分)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解析(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.(3分)所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.(5分)依题意,w至少定为3.(6分)(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:组号12345678分组[2,4](4,6](6,8](8,10](10,12](12,17](17,22](22,27]频率0.10.150.20.250.150.050.050.05(10分) 根据题意,该市居民该月的人均水费估计为:4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).(13分)思路分析第(1)问,需要计算该市居民月用水量在各区间上的频率,根据样本的频率分布直方图即可获解.第(2)问,由月用水量的频率分布直方图和w=3可计算居民该月用水费用的数据的分组与频率分布表,由此可估计该市居民该月的人均水费.评析本题考查了频率分布直方图及用样本估计总体,属中档题.16.(2015课标Ⅱ理,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B地区456789(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解析(1)两地区用户满意度评分的茎叶图如下:A地区B地区4 683 5 136 46 4 26 2 4 5 5 6 8 8 6 4 37 3 3 4 6 9 9 28 6 5 18 3 2 1 7 5 5 29 1 3通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.(2)记C A1表示事件:“A 地区用户的满意度等级为满意或非常满意”; C A2表示事件:“A 地区用户的满意度等级为非常满意”; C B1表示事件:“B 地区用户的满意度等级为不满意”; C B2表示事件:“B 地区用户的满意度等级为满意”, 则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2) =P(C B1C A1)+P(C B2C A2) =P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48. 17.(2015课标Ⅱ文,18,12分)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.B 地区用户满意度评分的频数分布表满意度评分分组[50,60) [60,70) [70,80) [80,90) [90,100]频 数2814106(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大,说明理由.解析(1)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”. 由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.18.(2015广东文,17,12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解析(1)由已知得,20×(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)=1,解得x=0.007 5.(2)由题图可知,面积最大的矩形对应的月平均用电量区间为[220,240),所以月平均用电量的众数的估计值为230;因为20×(0.002+0.009 5+0.011)=0.45<0.5,20×(0.002+0.009 5+0.011+0.012 5)=0.7>0.5,所以中位数在区间[220,240)内.设中位数为m,则20×(0.002+0.009 5+0.011)+0.012 5×(m-220)=0.5,解得m=224.所以月平均用电量的中位数为224.(3)由题图知,月平均用电量为[220,240)的用户数为(240-220)×0.0125×100=25,同理可得,月平均用电量为[240,260),[260,280),[280,300]的用户数分别为15,10,5.故用分层抽样的方式抽取11户居民,月平均用电量在[220,240)的用户中应抽取11×2525+15+10+5=5(户).19.(2014课标Ⅰ文,18,12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解析(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.评析本题考查绘制频率分布直方图,计算样本的数字特征,及用样本估计总体等知识,同时考查统计的思想方法.20.(2014课标Ⅱ文,19,12分)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:甲部门乙部门49797665332110 98877766555554443332100665520063222034567891059044812245667778901123468800113449123345011456000(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解析(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.评析本题考查利用茎叶图进行中位数,概率的相关计算,考查用样本的数字特征估计总体的数字特征,运用统计与概率的知识与方法解决实际问题的能力,考查数据处理能力及应用意识.21.(2014北京文,18,13分)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号 分组 频数 1 [0,2) 6 2 [2,4) 8 3 [4,6) 17 4 [6,8) 22 5 [8,10) 25 6 [10,12) 12 7 [12,14) 6 8 [14,16) 2 9[16,18)2 合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)解析 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9. 故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以a=频率组距=0.172=0.085. 课外阅读时间落在组[8,10)内的有25人,频率为0.25,所以b=频率组距=0.252=0.125. (3)样本中的100名学生该周课外阅读时间的平均数在第4组.22.(2013课标Ⅰ文,18,12分)为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解析 (1)设A 药观测数据的平均数为x ,B 药观测数据的平均数为y ,由观测结果可得x =120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3, y =120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6. 由以上计算结果可得x >y ,因此可看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2,3上,而B 药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A 药的疗效更好.评析 本题考查数据的平均数和茎叶图,考查数据的分析处理能力和应用意识.23.(2013安徽文,17,12分)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x1、x2,估计x1-x2的值.解析(1)设甲校高三年级学生总人数为n.由题意知,30n=0.05,即n=600.样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级此次联考数学成绩及格率为1-530=5 6.(2)设甲、乙两校样本平均数分别为x'1、x'2,根据样本茎叶图可知,30(x'1-x'2)=30x'1-30x'2=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15. 因此x'1-x'2=0.5.故x1-x2的估计值为0.5分.评析本题考查随机抽样与茎叶图等统计学的基本知识,考查学生用样本估计总体的思想以及数据分析处理能力.24.(2020课标Ⅰ文,17,12分)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级 A B C D频数40 20 20 20乙分厂产品等级的频数分布表等级 A B C D频数28 17 34 21(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?解析(1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A级品的概率的估计值为40100=0.4;。
用样本推断总体 知识讲解
用样本推断总体——知识讲解【学习目标】1.学会用样本平均数、样本方差去估计总体平均数、总体方差.2.了解用样本估计总体的过程.3.能用样本的某种“率”估计总体相应的“率”,用样本的频数、频率分布估计总体的频数、频率分布.4.能通过样本来预测总体在未来一段时间内的发展水平或发展趋势.【要点梳理】要点一、总体平均数与方差的估计从总体中抽取样本,然后通过对样本的分析,去推断总体的情况,这是统计的基本思想.用样本平均数、样本方差分别去估计总体平均数、总体方差就是这一思想的一个体现.实践和理论都证明:对于简单随机样本,在大多数情况下,当样本容量足够大时,这种思想是合理的.由于简单随机样本客观地反映了实际情况,能够代表总体,因此我们可以用简单随机样本的平均数与方差去估计总体的平均数与方差.要点二、统计的简单应用在实践中,我们常常通过简单随机抽样,用样本的“率”去估计总体相应的“率”,例如:收视率、合格率、达标率等等.通过科学调查,在取得真是可靠的数据后,我们可以运用正确的统计方法来推断总体,除此之外,还可以利用已有的统计数据对事物在未来一段时间内的发展趋势做出判断和预测,为正确的决策提供服务.要点诠释:样本是总体的一部分,一个总体中可以有许多样本,为了使样本能较好地反映总体情况,在选取样本时要注意使其具有一定的代表性和广泛性.要点三、利用样本推断总体利用样本推断总体的过程如下:【典型例题】类型一、总体平均数与方差的估计1.水资源越来越缺乏,全球提倡节约用水,水厂为了了解某小区居民的用水情况,随机抽查了该小区10户家庭的月用水量,有关数据如下表:月用水量(m3)10 13 14 17 18户数 2 2 3 2 1如果该小区有500户家庭,根据上面的统计结果,估计该小区居民每月需要用水多少立方米?(写出解答过程).【思路点拨】先根据样本求出10户家庭的平均用水量,再乘以该小区的总户数即可. 【答案与解析】 解:根据题意得:110(10×2+13×2+14×3+17×2+18×1)=14(立方米), 14×500=7000(立方米),答:该小区居民每月需要用水7000立方米.【总结升华】此题考查了用样本平均数估计总体平均数,进而估计总体. 举一反三: 【变式】“立定跳远”是我市初中毕业生体育测试项目之一.测试时,记录下学生立定跳远的成绩,然后按照评分标准转化为相应的分数,满分10分.其中男生立定跳远的评分标准如下:注:成绩栏里的每个范围,含最低值,不含最高值.成绩(米) … 1.80—1.86 1.86—1.94 1.94—2.02 2.02—2.18 2.18—2.34 2.34— 得分(分) …5678910某校九年级有480名男生参加立定跳远测试,现从中随机抽取10名男生测试成绩(单位:分)如下:1.962.38 2.56 2.04 2.34 2.17 2.60 2.26 1.87 2.32 请完成下列问题:(1)求这10名男生立定跳远成绩的平均数; (2)如果将9分以上定为“优秀”,请你估计这480名男生中得优秀的人数. 【答案】 解:(1)根据题意得:x =110(1.96+2.38+2.56+2.04+2.34+2.17+2.60+2.26+1.87+2.32)=2.25(米); (2)因为抽查的10名男生中得分(9分)(含9分)以上有6人,所以有480×610=288(人); 答:该校480名男生中得到优秀的人数是288人.2.从甲、乙两种玉米苗中随机各抽出10株,分别测得它们的株高如下:(单位:cm )甲 21 42 39 14 19 22 37 41 40 25 乙27164041164440402744(1)根据以上数据分别求出甲、乙两种玉米株高的平均数和方差. (2)估计哪种玉米的苗长得高些; (3)哪种玉米的苗长得齐?【思路点拨】本题考察平均数、方差的定义.利用平均数及方差的计算公式可以求得. 【答案与解析】 解:(1)甲的平均值:)()(甲cm x 3025404137221914394221101=+++++++++=乙的平均值:甲的方差:)(2.10410)3025()3042()3021(22222cm S =-++-+-=甲, 乙的方差:)(8.12810)3144()3116()3127(22222cm S =-++-+-=乙(2)从随机抽取的样本来看,甲种玉米的平均高度小于乙种玉米的平均高度,所以可以推断乙种玉米的苗长的高.(3)从随机抽取的样本来看,由于22S S 甲乙<,所以可以推断甲种玉米的苗长得整齐. 【总结升华】本题既是一道与平均数、方差计算有关的问题,又是利用样本平均数、样本方差估计总体平均数、总体方差的一道题目,关键是理解和掌握平均数、方差的求解公式. 举一反三:【变式】某公司对两名业务主管上半年六个月的工作业绩考核得分如下(每个月满分为10分):甲 5 6 8 7 9 7 乙3679107(1)分别求出甲、乙两人的平均得分.(2)根据所学方差知识,请你比较谁的工作业绩较稳定. 【答案】 解:(1)根据平均数的公式知:1(568797)76X =+++++=甲,1(3679107)76X =+++++=乙.(2)222222215[(57)(67)(87)(77)(97)(77)]63S =-+-+-+-+-+-=甲,22222221[(37)(67)(77)(97)(107)(77)]56S =-+-+-+-+-+-=乙.∵22SS <甲乙,∴甲的工作业绩较稳定.类型二、统计的简单应用3.为了解某校七,八年级学生的睡眠情况,随机抽取了该校七,八年级部分学生进行调查,已知抽取七年级与八年级的学生人数相同,利用抽样所得的数据绘制如下统计图表.睡眠情况分组表(单位:时)根据图表提供的信息,回答下列问题:(1)求统计图中的a;(2)抽取的样本中,八年级学生睡眠时间在C组的有多少人?(3)如果睡眠时间x(时)满足:7.5≤x≤9.5,称睡眠时间合格,请你估计该校七、八年级学生睡眠时间的合格率分别是多少?【思路点拨】(1)根据扇形统计图,确定出a的值即可;(2)根据图1求出抽取的人数,乘以C占的百分比即可得到结果;(3)七年级的合格率要用抽取的合格人数除以总人数,八年级的合格率只需要将B、C两组的百分率加起来即可.【答案与解析】解:(1)根据题意得:a=1-(35%+25%+25%+10%)=5%;(2)根据题意得:(6+19+17+10+8)×35%=21(人),则抽取的样本中,八年级学生睡眠时间在C组的有21人;(3)七年级的合格率:191761917108+++++×100%=60%,八年级的合格率:25%+35%=60%,答:该校七、八年级学生中睡眠时间合格率分别是60%、60%.【总结升华】此题考查了条形统计图,用样本估计总体,频数(率)分布表,以及扇形统计图,弄清题中的数据是解本题的关键.举一反三:【变式】为了了解我市某学校“书香校园”的建设情况,检查组在该校随机抽取40名学生,调查了解他们一周阅读课外书籍的时间,并将调查结果绘制成如图所示的频数分布直方图(每小组的时间包含最小值,不包含最大值),若规定学生一周课外阅读时间不少于4小时为达标,估计该校学生阅读时间的达标率为()A.50% B.55% C.60% D.65%【答案】C.4.某羽毛球商场经理对新进某一品牌几种号码的男式羽毛球鞋的销售情况进行了一周的统计,得到一组数据后,绘制了频数、频率统计表与频数分布直方图如图所示:一周销售数量统计表频数(双)根据图表中提供的信息回答下列问题:(1)本次共统计羽毛球鞋多少双?(2)求出销售42号鞋的双数,并补全统计图;(3)根据市场调查,该商场计划再进1000双这种品牌的男式羽毛球鞋,请你帮经理估计一下,需要进多少双41号的羽毛球鞋?【思路点拨】(1)用39码的频数除以其频率即可确定羽毛球鞋数量;(2)用总数减去其他尺码的鞋子的频数即可求得42码的鞋子的数量,从而补全频数直方图;(3)需要进41号旅游鞋的双数=1000×41号鞋的频率.【答案与解析】解:(1)10÷0.1=100(双)∴本次共统计羽毛球鞋100双.(2)100-10-15-30-15-5=25双补全统计图如下:(3)1000×30%=300双.答:根据市场调查,估计需要进300双41号的羽毛球鞋.【总结升华】本题考查了频数分布直方图和利用统计图获取信息的能力;利用统计图获取信息时,必须认真观察、分析、研究统计图,才能做出正确的判断和解决问题.。
随机抽样与用样本估计总体
方图、 频 率折线 罔 、 茎 叶图 , 会 计 算
方 差 和 标 准差 ,并 能 计 算 样 本 平 均
步体会用 样本估计 总体 的思想 , 布 ,会 用 样 本 的 基 本数 字特 征 估 计 总体 的基 本 数 字 特 征 :初 步体 会 样 本频 率 分 布 和数 字特 征 的 随机 性. 在 历 年 高 考 中 ,该 部 分 知 识 在
分 布 直方 图 、频 率 折 线 图 、茎 叶 图.
.
( 4 1 ) 理解 估计 总体 的有关 概述 并
通 过 频 率 分 布 表 和频 率 分 布直 方 图 可 以对 准确 性 . 在计 数 和 计 算 时
一
熟 记 有关 公 式 .若取 值 。 , …, 9 f n 的 频 率 分 别 为p 。 , P , …, P , 则 其 平 均 值 为 1 P 1 + 2 P +… + P . 若 取 值 l ,
C ;
重 点 突 破
随机 抽样 是研 究如 何合理 收 集数据 , 而用 样本 估 计 总体 则是研 究如何 整理 与分 析 数 据, 从 样 本 的 数据 特 征 来 了解 整体 的情 况 , 由于 样本 的 随机 性 , 所 以可 以透 过 部 分 看 整
体 .在 学 习这 一部分 知识 时 , 要 通过 实 际问题 情境 , 学 习随机 抽样 、 样 本 估计 总体 的基本 方法 , 体会用 样本 估计 总体及 其 特征 的思 想 ; 通 过解 决 实 际问题 , 较 为 系统地 经历 数据 收 集与处 理 的全过 程 。 体 会 统计 思维 与确定 性 思维 的差异 . 由于抽样 方 法 与用 样本 估 计 总
体 所体 现 的统 计思想 是 一种重 要 的思想 方法 , 所 以这 部分 成 为高考 每年 必考 的 内容 .
随机抽样、用样本估计总体
=小矩形的面积;
样本容量
每组的频数=这一小组的频率×样本容量.
【变式探究】
2.(2016·山东卷)某高校调查了200名学生每周的自习时 间(单位:小时),制成了如图所示的频率分布直方图,其中自 习时间的范围是[17.5,30],样本数据分组为 [17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方 图,这200名学生中每周的自习时间不少于22.5小时的人数是 ()
若将运动员按成绩由好到差编为 1~35 号,再用系统抽
样方法从中抽取 7 人,则其中成绩在区间[139,151]上的运动
员人数是( )
A.3
B.4
C.5
D.6
解:(1)对数据进行分组,在区间[139,151]上,有几 组就有几个运动员.
因为 35÷7=5,因此可将编号为 1~35 的 35 个数据分 成 7 组,每组有 5 个数据,在区间[139,151]上共有 20 个 数据,分在 4 个小组中,每组取一人,共取 4 人.
解:因为可以用极差、方差或标准差来描述数据的离 散程度,所以要评估亩产量稳定程度,应该用样本数据的 极差、方差或标准差.
答案:B
抽样方法 频率分布直方图 茎叶图的应用
考点一·抽样方法
【例 1】 (1)用系统抽样法要从 160 名学生中抽取容量 为 20 的样本,将 160 名学生从 1~160 编号.按编号平均分 成 20 组(1~8 号,9~16 号,…,153~160 号),若第 16 组 应抽出的号码为 126,则第 1 组中用抽签法确定的号码是 ____________.
③甲地该月 14 时的气温的标准差小于乙地该月 14 时的 气温的标准差;
用样本估计总体
思考1:上述100个数据中的最大值和最 小值分别是什么?由此说明样本数据的 变化范围是什么?
0.2~4.3
思考2:样本数据中的最大值和最小值 的差称为极差.如果将上述100个数据 按组距为0.5进行分组,那么这些数据 共分为多少组?
(4.3-0.2)÷0.5=8.2
思考3:以组距为0.5进行分组,上述100 个数据共分为9组,各组数据的取值范围 可以如何设定?
(2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
思考4:样本数据的频率分布直方图是 根据频率分布表画出来的,一般地,频 率分布直方图的作图步骤如何?
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点, 在纵轴上标出 [153.5,156.5) [156.5,159.5) [159.5,162.5) [162.5,165.5) [165.5,168.5) [168.5,171.5) [171.5,174.5) [174.5,177.5) [177.5,180.5]
合计
频数 1 1 4 5 8 11 6 2 1 1 40
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
频率 组距 0.5 0.4 0.3 0.2 0.1
宽度:组距
高度:
频率 组距
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
上图称为频率分布直方图,其中横轴 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高 度在数量上有何特点?
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2