10.2统计图表、数据的数字特征、用样本估计总体
第2讲 统计图表、数据的数字特征、用样本估计总体
(2)质量指标值的样本平均数为
x = 80 × 0.06 + 90 × 0.26 + 100 × 0.38+110×0.22+120×0.08=100. 质量指标值的样本方差为 s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102 ×0.22+202×0.08=104. 所以这种产品质量指标值的平均数的估计值为 100, 方差的估计值为 104.
第10页考点二 茎叶图
训练 2 (2015· 海口调研)某样本数据的茎叶图如图所示,若该组数 据的中位数为 85,则该组数据的平均数为________.
解析 依题意得,
将样本数据由小到大排列, 中间的两 个数之和等于 85× 2=170,
因此 x=6,样本数据的平均数等于 1 (70× 2+80× 6+90× 2+53)=85.3. 10
第9页
返回目录
结束放映
考点突破
考点二 茎叶图
规律方法
(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而 “茎”的位置的数字位数一般不需要统一; ②重复出现的数据要重 复记录,不能遗漏,特别是“叶”的位置上的数据. (2)茎叶图通常用来记录两位数的数据,可以用来分析单组 数据,也可以用来比较两组数据. 通过茎叶图可以确定数据的中 位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分 布是否均匀等.
解析
依题意,低于 60 的人数的频率为
1-(0.020+0.015)× 20=0.3,
因此该班学生人数是 15÷ 0.3=50.
答案 50
第7页
返回目录
结束放映
考点突破
考点二 茎叶图 工人数(人) 1 3 3 5 4 3 1 20
年龄(岁) 【例题 2】(2014· 广东卷)某车间 20 19 名工人年龄数据如下表: 28 (1)求这 20 名工人年龄的众数与极差; 29 (2)以十位数为茎,个位数为叶, 30 作出这 20 名工人年龄的茎叶图; 31 32 (3)求这 20 名工人年龄的方差. 40 合计
高三第一学期数学教学计划5篇
高三第一学期数学教学计划5篇一、指导思想高三数学教学要以《全日制普通高级中学教科书》、20xx年普通高等学校招生全国统一考试《北京卷考试说明》为依据,以学生的发展为本,全面复习并落实基础知识、基本技能、基本数学思想和方法,为学生进一步学习打下坚实的基础。
要坚持以人为本, 强化质量的意识,务实规范求创新,科学合作求发展。
二、教学建议1、认真学习《考试说明》,研究高考试题,把握高考新动向,有的放矢,提高复习课的效率。
考试说明》是命题的依据,备考的依据。
高考试题是《考试说明》的具体体现。
因此要认真研究近年来的考试试题,从而加深对《考试说明》的理解,及时把握高考新动向,理解高考对教学的导向,以利于我们准确地把握教学的重、难点,有针对性地选配例题,优化教学设计,提高我们的复习质量。
注意08年高考的导向:注重能力考查,反对题海战术。
《考试说明》中对分析问题和解决问题的能力要求是:能阅读、理解对问题进行陈述的材料;能综合应用所学数学知识、思想和方法解决问题,包括解决在相关学科、生产、生活中的数学问题,并能用数学语言正确地加以表述;能选择有效的方法和手段对新颖的信息、情境和设问进行独立的思考与探究,使问题得到解决。
08年的高考试题无论是小题还是大题,都从不同的角度,不同的层次体现出这种能力的要求和对教学的导向。
这就要求我们在日常教学的每一个环节都要有目的地关注学生能力培养,真正提高学生的数学素养。
2、充分调动学生学习积极性,增强学生学习的自信心。
尊重学生的身心发展规律,做好高三复习的动员工作,调动学生学习积极性,因材施教,帮助学生树立学习的自信性。
3、注重学法指导,提高学生学习效率。
教师要针对学生的具体情况,进行复习的学法指导,使学生养成良好的学习习惯,提高复习的效率。
如:要求学生建立错题本,让学生养成反思的习惯;养成学生善于结合图形直观思维的习惯;养成学生表述规范,按照解答题的必要步骤和书写格式答题的习惯等。
高考数学10.2用样本估计总体与变量间的相关关系
2013版高考数学一轮复习精品学案:第十章统计、统计案例10.2用样本估计总体与变量间的相关关系【高考新动向】一、用样本估计总体(一) 考纲点击1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释;4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.(二)热点提示1.频率分布直方图、茎叶图、平均数、方差、标准差是考查的重点,同时考查对样本估计总体的思想的理解;2. 频率分布直方等内容经常与概率等知识相结合出题;3.题型以选择题和填空题为主,属于中低档题。
二、变量间的相关关系(一)考纲点击1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.(二)热点提示1.以考查线性回归系数为主,同时可考查利用散点图判断两个变量间的相关关系;2.以实际生活为背景,重在考查回归方程的求法;3.在高考题中本部分的命题主要是以选择、填空题为主,属于中档题目。
【考纲全景透析】一、用样本估计总体1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布表.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图;(2)总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.3.标准差和方差(1)标准差是样本数据到平均数的一种平均距离;(2)x是样本数(3)方差: (n据,n是样本容量,x是样本平均数)注:现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?(通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差,这与有样本的频率分布近似代替总体分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.)4.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值;(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标.二、变量间的相关关系1.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程 (1)最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程方程ˆybx a =+是两个具有线性相关关系的变量的一组数据1122(,),(,),(,)n n x y x y x y L 的回归方程,期中,a b 是待定参数.1122211()()()nni i i ii i n ni i i i x x y y x y nx yb x x x nx a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑ 注:相关关系与函数关系的异同点(相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系;②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系)【热点难点全析】一、用样本估计总体(一)频率分布直方图在总体估计中的应用 ※相关链接※频率分布直方图反映样本的频率分布(1)频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距. (2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.(4)众数为最高矩形中点的横坐标.(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.※例题解析※〖例〗为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学生全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.思路解析:利用面积求得每组的频率→求样本容量→求频率和→求达标率→分析中位数.解答:(1)由已知可设每组的频率为2x,4x,17x,15x,9x,3x.则2x+4x+17x+15x+9x+3x=1,解得x=0.02.则第二小组的频率为0.02×4=0.08,样本容量为12÷0.08=150.(2)次数在110次以上(含110次)的频率和为17×0.02+15×0.02+9×0.02+3×0.02=0.88,则高一学生的达标率为0.88×100%=88%.(3)在这次测试中,学生跳绳次数的中位数落在第四组.因为中位数为平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标.注:利用样本的频率分布可近似地估计总体的分布,要比较准确地反映出总体分布的情况,必须准确地作出频率分布表和频率分布直方图,充分利用所给的数据正确地作出估计.(二)用样本的分布估计总体※相关链接※茎叶图刻画数据的优点(1)所有的数据信息都可以从茎叶图中得到.(2)茎叶图便于记录和表示,且能够展示数据的分布情况.注:当数据是两位有效数字时,用茎叶图显得容易、方便.而当样本数据较大和较多时,用茎叶图表示,就显得不太方便.※例题解析※〖例〗在某电脑杂志的一篇目文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子中所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?思路解析:(1)将十位数字作为茎,个位数字作为叶,逐一统计;(2)根据茎叶图分析两组数据,得到结论.解答:(1)如图:(2)电脑杂志上每个句子的字数集中在10~30之间,中位数为22.5;而报纸上每个句子的字数集中在10~40之间,中位数为27.5.可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为读物须通俗易懂、简明.(三)用样本的数字特征估计总体的数字特征〖例〗甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.思路解析:(1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.解答:(1)由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.2222222222221013121416==1351314121214==1351=[(1013)(1313)(1213)(1413)(1613)]451[(1313)(1413)(1213)(1213)(1413)]0.85x x s s ++++++++-+-+-+-+-==-+-+-+-+-=甲乙甲乙,(2)由2s 甲>2s 乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.注:(1)运用方差解决问题时,注意到方差越大,波动越大,越不稳定;方差越小,波动越小,越稳定.(2)平均数与方差都是重要的数字特征,是对总体的一种简单的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(3)平均数、方差的公式推广①若数据123,,,,n x x x x L 的平均数为x ,那么12,,,n mx a mx a mx a +++L 的平均数是mx a +.②数据123,,,,n x x x x L 的方差为2s . a.22222111[()];n s x x x nx n=+++-L b.数据12,,,n x a x a x a +++L 的方差也为2s ; c.数据12,,,n ax ax ax L 的方差为22a s . 二、变量间的相关关系(一)利用散点图判断两个变量的相关关系 ※相关链接※ 1.散点图在散点图中,如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.注:函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况. 2.正相关、负相关从散点图可知,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.如年龄的值由小变大时,体内脂肪含量也在由小变大.反之,如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关. ※例题解析※〖例〗在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系。
统计图表、数据的数字特征、用样本估计总体
(3)茎叶图
①茎叶图表示数据的优点 没有信息 的损失,所有的_________ 原始数据 都可以从这 (ⅰ)茎叶图上_________ 个茎叶图中得到. 表示与比较 (ⅱ)茎叶图可以随时记录,方便___________. ②茎叶图表示数据的缺点
当数据量很大或有多组数据时,茎叶图就不那么直观清晰了.
1.一个容量为32的样本,已知某组样本的频率为0.375,则该 组样本的频数为( (A )4 ) (C)12 (D)16
(B )8
【解析】选C.频数=32〓0.375=12.
2.甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参 加了全部的7场比赛,平均得分均为16分,标准差分别为5.09 和3.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳 定的是( (A)甲 (C)甲、乙相同 ) (B)乙 (D)不能确定
【解析】(1)正确.平均数表示一组数据的平均水平,众数表示 一组数据中出现次数最多的数,中位数等分样本数据所占频率 . (2)错误.平均数一定不大于这组数据中的最大值. (3)正确.由标准差的意义知结论正确. (4)错误.中位数在一组数据中一定存在且唯一 .
(5)正确.由频率分布直方图的意义知结论正确 . (6)错误.茎叶图要求不能丢失数据. (7)错误.茎叶图也能够记录有三个或三个以上的有效数字的数 据,只不过此时茎叶的选择要灵活. 答案:(1)√ (5)√ (6)〓 (2)〓 (7)〓 (3)√ (4)〓
2.样本的数字特征
(1)众数、中位数、平均数
数字 特征 定义与求法 优点与缺点 众数通常用于描述变量的值
众
数
出现次数最 一组数中___________ 多 的数据 ___
出现次数最多的数.但显然它
对其他数据信息的忽视使得 无法客观地反映总体特征
第十章 第二节 统计图表数据的数字特征:用样本估计总体
类别
特点
折线统计图
能很好的反映 数据的变化趋势 .
扇形统计图 能很好的反映 数据之间的比例关系
3.样本的数字特征
3.用样本估计总体
类别
定义
由一些小矩形来表示,每个小矩形的宽度为 频率分布 Δxi (分组的宽度),高为 ,小矩形的面积
直方图 恰为相应的 频率fi .称这样的图形为频率分
布直方图.图中所有小矩形面积之和为 1 .
(1)分别求出两人得分的平均数与方差; (2)根据图和上面算得的结果,对两人的训练成绩作出评价. [思路点拨]
[课堂笔记] (1)甲、乙两人五次测试的成绩分别为:
甲 10分 13分 12分 14分 16分
乙 13分 14分 12分 12分 14分
甲的平均得分为:
=13,
乙的平均得分为:
=13.
= [(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16 -13)2]=4,
(1)完成数据的茎叶图; (2)用茎叶图处理现有的数据,有什么优点? (3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行 比较,写出统计结论.
ቤተ መጻሕፍቲ ባይዱ
[思路点拨]
[课堂笔记] (1)
(2)由于每个品种的数据都只有25个,样本不大,画茎叶图 很方便;此时茎叶图不仅清晰明了地展示了数据的分布情 况,便于比较,没有任何信息损失,而且还可以随时记录 新的数据. (3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均 值)比品种B高;②品种A的亩产标准差(或方差)比品种B大, 故品种A的亩产稳定性较差.
4.会用随机抽样的基本方法和样本估计总体 的思想解决一些简单的实际问题.
1.统计图表
类别
用样本的数字特征估计总体的数字特征(IV)
VS
详细描述
样本中位数是总体中位数的无偏估计,但 当样本量较小时,由于受到异常值的影响 ,估计的精度较低。因此,在估计总体中 位数时,需要保证样本量足够大。
实例三:基于方差的总体数字特征估计
总结词
样本方差是总体方差的无偏估计,但当样本 量较小时,估计的精度较低。
详细描述
样本方差是总体方差的无偏估计,但在实际 应用中,由于受到抽样误差的影响,样本方 差可能会被低估或高估。因此,在估计总体 方差时,需要使用修正的样本方差公式,以 提高估计的精度。
例子
样本均值$overline{x}$ 是总体均值$μ$的无偏 估计。
有效估计
定义
如果一个估计量是某个无偏估计量的函数,则称 这个估计量为有效估计量。
意义
有效估计量在无偏估计的基础上,进一步减小了 估计误差,提高了估计的精度。
例子
样本方差$s^{2}$是总体方差$σ^{2}总体的数字特 征(iv)
目录
• 引言 • 样本数字特征的选取 • 总体数字特征的估计 • 样本数字特征的性质 • 实例分析 • 结论与展望
01
CATALOGUE
引言
研究背景
随着大数据时代的来临,大量数据被收集和存储,如 何从这些数据中提取有用的信息成为了一个重要的研
究课题。
3
此外,随着数据量的不断增加,快速、准确地估 计总体数字特征的需求也日益迫切,因此该研究 具有重要的现实意义。
02
CATALOGUE
样本数字特征的选取
均值
总结词
均值是所有数值相加后除以数值的数量所得的结果,它反映了数据的平均水平 。
详细描述
在统计学中,均值是一种常用的数字特征,它能够概括一组数据的中心趋势。 通过计算样本的均值,可以估计总体均值的近似值,从而了解总体数据的平均 水平。
10_2统计图表_数据的数字特征和用样本估计总体(PPT84页)
北
497 503 506 508 507 492 496 500 501 499
师
根据用频率分布估计总体分布的原理,该自动包装机
大 版
包 装 的 袋 装 食 盐 质 量 在 497.5g ~ 501.5g 之 间 的 概 率 约 为
________.
[答案] 0.25
第10章 第二节
高考数学总复习
师 大
__区__间__数___增多,每个区间的长度则会相应随之减小,相应的
版
频率折线图就会越来越接近于一条光滑曲线,即总体密度曲线.
第10章 第二节
高考数学总复习
北
基础自测
师
大
版
第10章 第二节
高考数学总复习
1.(2011·四川理,1)有一个容量为66的样本,数据的分 组及各组的频数如下:
[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18
+0.01+0.04)×5=0.3,故抽测的100根中,棉花纤维的长 版 度小于20mm的有0.3×100=30(根).
第10章 第二节
高考数学总复习
6.从某自动包装机包装的食盐中,随机抽取20袋,测
得各袋的质量分别为(单位:g):
492 496 494 495 498 497 501 502 504 496
=15(4+4)=1.6,∴选 C.
第10章 第二节
高考数学总复习
4 . 一 个 社 会 调 查 机 构 就 某 地 居 民 的 月 收 入 调 查 了 10 000 人 , 并 根 据 所 得 数 据 画 了 样 本 的 频 率 分 布 直 方 图 ( 如 图).为了分析居民的收入与年龄、学历、职业等方面的关
用样本估算总体
用样本估算总体
◎ 用样本估算总体的定义
用样本估计总体的两个手段:
(1)用样本的频率分布估计总体的分布;
(2)用样本的数字特征估计总体的数字特征,需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本的容量越大,估计的结果也就越精确。
◎ 用样本估算总体的知识扩展
用样本估计总体的两个手段:
(1)用样本的频率分布估计总体的分布;
(2)用样本的数字特征估计总体的数字特征,需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本的容量越大,估计的结果也就越精确。
◎ 用样本估算总体的教学目标
1、通过实例,体会用样本估计总体的思想。
2、能够根据统计结果作出合理的判断和推测,能与同学进行交流,用清晰的语言表达自己的观点。
3、根据有关问题查找资料或调查,用随机抽样的方法选取样本,能用样本的平均数和方差,从而对总体有个体有个合理的估计和推测。
◎ 用样本估算总体的考试要求
能力要求:了解
课时要求:40
考试频率:选考
分值比重:2。
统计图表数据的数字特征和用样本估计总体[1]
统计图表数据的数字特征和用样本估 计总体[1]
统计图表数据的数字特征和用样本估 计总体[1]
统计图表数据的数字特征和用样本估 计总体[1]
统计图表数据的数字特征和用样本估 计总体[1]
(3)直方图中每一个矩形的面积是样本数据落在这个区 间上的频率,所有的小矩形的面积之和等于1,即频率之和 为1,由此可以估计样本数据落在某个区间的频率或概率或 者总体的数字特征.
统计图表数据的数字特征和用样本估 计总体[1]
统计图表数据的数字特征和用样本估 计总体[1]
统计图表数据的数字特征和用样本估 计总体[1]
统计图表数据的数字特征和用样本估 计总体[1]
统计图表数据的数字特征和用样本估 计总体[1]
•用样本分布估计总体的分布
统计图表数据的数字特征和用样本估 计总体[1]
(1)第二小组的频率是多少?样本容量是多少? (2)若次数在120以上(含120次)为优秀,试估计该学校 全体高一学生的优秀率是多少?
统计图表数据的数字特征和用样本估 计总体[1]
统计图表数据的数字特征和用样本估 计总体[1]
统计图表数据的数字特征和用样本估 计总体[1]
统计图表数据的数字特征和用样本估 计总体[1]
[答案] 30
统计图表数据的数字特征和用样本估 计总体[1]
[解析] 本题主要考查频率分布直方图的应用,从而考 查考生的识图与用图能力,同时也考查了考生的数据处理 能力和分析解决问题的能力.
由题意知,棉花纤维的长度小于20mm的频率为(0.01+ 0.01+0.04)×5=0.3,故抽测的100根中,棉花纤维的长度 小于20mm的有0.3×100=30(根).
统计图表数据的数字特征和用样本估 计总体[1]
第十章 统计与概率10-2用样本估计总体
注意以下结论: (1)如果x1、x2、„、xn的平均数为 - ,则ax1+b,ax2 x +b,„,axn+b的平均数为a -+b. x
(2)数据x1、x2、„、xn与数据x1+m、x2+ m、„、xn+m的方差相等. (3)若x1、x2、„、xn的方差为s2,则kx1, kx2,„,kxn的方差为k2s2. 计算方差时,要依据所给数据的特点恰当选 取公式以简化计算.
3.茎叶图 统计中还有一种被用来表示数据的图叫做茎 叶图. 茎是指中间的一列数,叶是从茎的旁边生长 出来的数. 在样本数据较少、较为集中,且位数不多时, 用茎叶图表示数据的效果较好,它当 样本数据较多时,茎叶图就不太方便.
4.平均数、中位数和众数
把样本方差的算术平方根叫做这组数据的样 本标准差.
(3)数据的离散程度可以通过极差、方差或
误区警示 1.对频率分布直方图和茎叶图识图不准是常见的错 误.在频率分布直方图中,小矩形的高= 频率 组距 =
频数 频率 .频率= ×组距=小矩形的面积. 组距×样本容量 组距
2.中位数可能不在样本数据中. 3.计算公式用错或计算错误.计算平均数、 方差、标准差等时计算量大,要注意计算结 果的准确性.
③将数据分组:通常对组内数值所在区间取 左闭右开区间,最后一组取闭区间,也可以 将样本数据多取一位小数分组;
④列频率分布表:登记频数,计算频率,列 出频率分布表. 将样本数据分成若干小组,每个小组内的样 本个数称作频数,频数与样本容量的比值叫 做这一小组的频率.频率反映数据在每组 所占比例 的大小.
方差:s12= 100)2]≈3.43. 乙车间:
用样本估计总体教案(绝对经典)
§11.2 统计图表、数据的数字特征、用样本估计总体会这样考 1.考查样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、标准差)的计算.主要以选择题、填空题为主;2.考查以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数).1.统计数据(1)众数、中位数、平均数、极差、众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.(可以没有或者多个). 中位数:将一组数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数).平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ).(2)方差、标准差 方差()()()[]2222121x x x x x x nS n -++-+-=标准差S =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差. 2.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图、频率分布直方图等.(1)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便. (2)在频率分布直方图中:①纵轴表示频率组距,②每小长方形的面积表示该组数据的频率或比例, ③各小长方形的面积之和等于1.3.用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.(2)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.4.利用频率分布直方图估计样本的数字特征(1)众数:最高那组的组中值.(2)平均数:每个小长方形的面积与每个组中值的乘积之和. (3)中位数:等分面积那条线的横坐标. [难点正本 疑点清源] 1.作频率分布直方图的步骤(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图. 频率分布直方图能很容易地表示大量数据,非常直观地表明分布的形状.1.一个容量为20的样本,数据的分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),x ;[40,50),5;[50,60),4;[60,70),2;则x =________;根据样本的频率分布估计,数据落在[10,50)的概率约为________. 答案 4 0.72.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是____.答案 6003.如上图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)答案 6.84.某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从上图中可以看出被处罚的汽车大约有的辆数为________. 答案 40题型一 频率分布直方图的绘制与应用例1 (1)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图; (2)据此估计本次考试中的平均分和中位数(保留整数).思维启迪:利用各小长方形的面积和等于1求分数在[70,80)内的频率,再补齐频率分布直方图. 解 (1)设分数在[70,80)内的频率为x ,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x =1,可得x =0.3,所以频率分布直方图如图所示.(2)平均分为x =45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).中位数为73 探究提高 频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.(2)从某小学随机抽取l00名同学,将他们的身高(单位:厘米)数据绘制成频率分布图(如上图).若要从身高在[120,130),[130,140),[l40,150]三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[120,130)的学生中选取的人数应为 .答案:15题型二 茎叶图的应用例2 (1)甲、乙两名同学在5次数学考试中,成绩统计用茎叶图表示如图所示,若甲、乙两人的平均成绩分别用x 甲、x 乙表示,则下列结论正确的是( )A 、x x <甲乙;乙比甲成绩稳定B 、x x >甲乙;乙比甲成绩稳定C 、x x <甲乙;甲比乙成绩稳定D 、x x >甲乙;甲比乙成绩稳定答案及解析:D(2)某学校从高二甲、乙两个班中各选6名同掌参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如上图,其中甲班学生成绩的中位数数是81,乙班学生成绩的平均分为81,则成绩更稳定的班级为______.答案及解析:乙。
统计图表数据的数字特征用样本估计总体 课件
解 (1)根据频率分布直方图得第一组的频率为 0.01×5=0.05,∴6x=0.05,∴x=120. (2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,
∴a=935≈32,则中位数为 32. (3)(ⅰ)5 个年龄组成绩的平均数为-x1=15×(93+96+97+94+90)=94, 方差为 s21=15×[(-1)2+22+32+02+(-4)2]=6. 5 个职业组成绩的平均数为-x2=15×(93+98+94+95+90)=94, 方差为 s22=15×[(-1)2+42+02+12+(-4)2]=6.8. (ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想
则下面结论中不正确的是( ) A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解析 法一 设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由 饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村 建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业 收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的. 法二 因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A 是错误的. 答案 A
将一组数据按大小依次排列,把处在_最__中__间__位置的一个数据(或 中位数
最中间两个数据的_平__均__数___)叫作这组数据的中位数
平均数 方差
样本数据的算术平均数,即-x=__x_1_+__x_2+_n_…__+__x_n_ s2=_1n_[_(_x_1-__-x_)_2_+__(x_2_-__-x_)2_+__…__+__(_x_n-__-x_)_2_] ,其中 s 为标准差
版高考数学一轮复习 核心素养测评六十二 11.2 统计图表、数据的数字特征 文(含解析)北师大版-北
核心素养测评六十二统计图表、数据的数字特征、用样本估计总体(30分钟60分)一、选择题(每小题5分,共25分)1.某学生在一门功课的22次考试中,所得分数的茎叶图如图所示,则此学生该门功课考试成绩的极差与中位数之和为( )A.117B.118【解析】选B.22次考试成绩最高为98分,最低为56分,所以极差为98-56=42,从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试成绩的极差与中位数之和为42+76=118.2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的X围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是 ( )A.56B.60C.120D.140【解析】选D.由频率分布直方图可知,每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.3.(2020·某某模拟)由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于-1,那么对于样本1,x1,-x2,x3,-x4,x5的中位数可以表示为( )A. B.C. D.【解析】选C.因为x1<x2<x3<x4<x5<-1,所以x1<x3<x5<1<-x4<-x2,则该组样本的中位数为中间两数的平均数,即.4.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差【解析】选A.9个数据去掉最高分与最低分2个,最中间的数据没变,所以不变的数字特征是中位数.5.某户居民根据以往的月用电量情况,绘制了月用电量的频率分布直方图(月用电量都在25度到325度之间)如图所示.估计该用户的月用电量的平均数、中位数、众数分别为世纪金榜导学号( )A.161,158,150B.150,150,150C.175,125,150D.161,175,150【解析】选A.估计该用户的月用电量的平均数:=50×0.12+100×0.18+150×0.3+200×0.22+250×0.12+300×0.06=161.估计该用户的月用电量的中位数约为:158.估计该用户的月用电量的众数约为:150.二、填空题(每小题5分,共15分)6.(2019·某某高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是.【解析】由题意,该组数据的平均数为=8,所以该组数据的方差是[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=.答案:7.(2020·某某模拟)如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是.①众数是9;②平均数是10;③中位数是9;④标准差是3.4.【解析】由题意可知,该组数据分别为:7,8,9,9,9,10,11,12,12,13,该组数据的众数为9,平均数为=10,中位数为=9.5,标准差为=,因此,①②正确.答案:①②8.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)频率分布直方图中x的值为.(2)在这些用户中,用电量落在区间[100,250)内的户数为.【解析】(1)由频率分布直方图中各小矩形的总面积为1,得(0.0012+0.0024×2+0.0036+x+0.0060)×50=1,解得x=0.0044.(2)用电量在[100,250)内的频率为(0.0036+0.0044+0.0060)×50=0.7,故用电量落在区间[100,250)内的户数为100×0.7=70.答案:(1)0.0044 (2)70三、解答题(每小题10分,共20分)9.为庆祝国庆节,某中学团委组织了“歌颂祖国,爱我中华”知识竞赛,从参加考试的学生中抽出60名,将其成绩(成绩均为整数)分成[40,50),[50,60),…,[90,100]六组,并画出如图所示的部分频率分布直方图,观察图形,回答下列问题:(1)求第四组的频率,并补全这个频率分布直方图.(2)估计这次考试的及格率(60分及以上为及格)和平均分.【解析】(1)因为各组的频率和等于1,所以第四组的频率为1-(0.025+0.015×2+0.010+0.005)×10=0.3.补全的频率分布直方图如图所示.(2)依题意可得第三、四、五、六组的频率之和为(0.015+0.030+0.025+0.005)×10=0.75,则可估计这次考试的及格率是75%.因为抽取学生的平均分约为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分),所以可估计这次考试的平均分为71分.10.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机选取18位患者服用A药,18位患者服用B药,这36位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的18位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.22.5 2.6 1.2 2.7 1.5 2.93.0 3.1 2.3服用B药的18位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.31.6 0.5 1.8 0.62.1 1.1 2.5 1.2 2.7(1)分别计算两组数据的平均数(小数点后保留两位小数),从计算结果看哪种药疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?并说明理由. 世纪金榜导学号【解析】(1)服用A药的18位患者日平均增加的睡眠时间的平均数为=(0.6+1.2+2.7+…+3.0+3.1+2.3)≈2.23(h)服用B药的18位患者日平均增加的睡眠时间的平均数为=(3.2+1.7+1.9+…+2.5+1.2+2.7)≈1.67(h),因为2.23>1.67,所以A种药的疗效更好.(2)由观测结果可绘制如图茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.(15分钟35分)1.(5分)(2020·某某模拟)某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数与平均数分别为( )A.20,22.5B.22.5,25C.22.5,22.75D.22.75,22.75【解析】选C.根据频率分布直方图,得平均数为5×(12.5×0.02+17.5×0.04+22.5×0.08+27.5×0.03+32.5×0.03)=22.75,因为0.02×5+0.04×5=0.3<0.5,0.3+0.08×5=0.7>0.5,所以中位数应在20~25内,设中位数为x,则0.3+(x-20)×0.08=0.5,解得x=22.5,所以这批产品的中位数是22.5.【变式备选】某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45]岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是( )岁岁岁岁【解析】选C.在频率分布直方图中,所有矩形面积之和为1,所以,数据位于的频率为1-×5=0.2,前两个矩形的面积之和为0.01×5+0.2=0.25,前三个矩形的面积之和为0.25+0.07×5=0.6,所以,中位数位于区间,设中位数为a,则有0.25+×0.07=0.5,解得a≈33.6(岁).2.(5分)(2020·某某模拟)气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)①甲地5个数据的中位数为24,众数为22;②乙地5个数据的中位数为27,总体均值为24;③丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8.则肯定进入夏季的地区有.(填序号) 世纪金榜导学号【解析】①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22,22,24,25,26,其连续5天的日平均气温均不低于22;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19,20,27,27,27时,可知其连续5天的日平均温度有低于22℃的,故不确定;③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22.则肯定进入夏季的地区有甲、丙两地.答案:①③【变式备选】已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为,方差为s2,则( )A.=70,s2<75B.=70,s2>75C.>70,s2<75D.<70,s2>75【解析】选A.由题意,可得==70,设收集的48个准确数据分别记为x1,x2,…,x48,则75=[++…++(60-70)2+(90-70)2]=[++…++500],s2=[++…++(80-70)2+(70-70)2]=[++…++100]<75,所以s2<75.3.(5分)(2020·某某模拟)某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则4x+2y的值是( )A.12B.14C.16D.18【解析】选A.因为中位数为12,所以x+y=4,数据的平均数为×(2+2+3+4+x+y+20+19+19+20+21)=11.4,要使该总体的标准差最小,即方差最小,所以(10+x-11.4)2+(10+y-11.4)2=(x-1.4)2+(y-1.4)2≥2=0.72,当且仅当x-1.4=y-1.4,即x=y=2时取等号,此时总体标准差最小,4x+2y=12.【变式备选】(2020·某某模拟)已知样本9,10,11,x,y的平均数是10,方差是2,则xy的值为( ) A.88 B.96 C.108 D.110【解析】选B.由于样本的平均数为10,则有=10,得x+y=20,由于样本的方差为2,则有=2,得+=8,即x2+y2-20+200=8,所以x2+y2=208,因此xy==96.4.(10分)(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0) [0,0.20) [0.20,0.40) [0.40,0.60) [0.60,0.80)企业数 2 24 53 14 7(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例.(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 世纪金榜导学号附:≈8.602.【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.产值负增长的企业频率为=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)=(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=n i=[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.0296,所以s==0.02×≈0.17,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.5.(10分)(2020·某某模拟)栀子原产于中国,喜温暖湿润、阳光充足的环境,较耐寒.叶,四季常绿;花,芳香素雅.绿叶白花,格外清丽.某地区引种了一批栀子作为绿化景观植物,一段时间后,从该批栀子中随机抽取100棵测量植株高度,并以此测量数据作为样本,得到该样本的频率分布直方图,其中不高于1.50m的植株高度茎叶图如图所示. 世纪金榜导学号(1)求植株高度频率分布直方图中a,b,c的值.(2)在植株高度频率分布直方图中,同一组中的数据用该区间的中点值代表,植株高度落入该区间的频率作为植株高度取该区间中点值的频率,估计这批栀子植株高度的平均值.【解析】(1)由茎叶图知,a==0.5,b==1.由频率分布直方图知(0.5+1+c+3+4)×0.1=1,所以c=1.5.(2)这批栀子植株高度的平均值的估计值为×0.1=1.60(m).(2020·某某模拟)某高中非毕业班学生人数分布情况如表,为了了解这2000个学生的体重情况,从中随机抽取160个学生并测量其体重数据,根据测量数据制作了如图所示的频率分布直方图.性别年级男生女生合计高一年级550 650 1200高二年级425 375 800合计975 1025 2000(1)为了使抽取的160个样品更具代表性,宜采取分层抽样,请你给出一个你认为合适的分层抽样方案,并确定每层应抽取的样品个数.(2)根据频率分布直方图,求x的值,并估计全体非毕业班学生中体重在[45,75)内的人数.(3)已知高一全体学生的平均体重为58.50kg,高二全体学生的平均体重为61.25kg,试估计全体非毕业班学生的平均体重. 世纪金榜导学号【解析】(1)方案一:考虑到体重应与年级及性别均有关,最合理的分层应分为以下四层:高一男生、高一女生、高二男生、高二女生高一男生:×160=44(人),高一女生:×160=52(人),高二男生:×160=34(人),高二女生:×160=30(人),方案二:按性别分为两层,男生与女生:男生人数:×160=78(人),女生人数:×160=82(人).方案三:按年级分为两层,高一学生与高二学生:高一人数:×160=96(人),高二人数:×160=64(人).(2)体重在[70,80)内的学生人数的频率:1-(0.075+0.2+0.275+0.225+0.05+0.025)=0.15,x==0.015,体重在[45,75)内人数的频率为:0.1+0.275+0.225+0.075=0.675,所以估计全体非毕业班学生体重在[45,75)内的人数为:2000×0.675=1350(人).(3)设高一全体学生的平均体重为=58.5kg,频率为P1=×100%=60%.高二全体学生的平均体重为=61.25kg,频率为P2=×100%=40%,则估计全体非毕业班学生的平均体重为·P1+·P2=58.50×60%+61.25×40%=59.6(kg).答:估计全校非毕业班学生的平均体重为59.6kg.。
配套课件102统计图表数据的数字特征用样本估
【反思·感悟】1.画频率分布直方图时要注意纵、横坐标轴的
意义,频率分布直方图中小矩形的面积是该组数据的频率.
2.频率分布直方图反映了样本的频率分布.
(1)在频率分布直方图中纵坐标表示 fi ,
频率(fi)=组距(Δxi)×
fi . xi
xi
(2)频率分布表中频率的和为1,故频率分布直方图中各长方形
写,相同的数据可以只记一次.
()
④用茎叶图表示数据有两个优点:一是统计图上没有原始数据信
息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中
的数据可以随时记录,随时添加,方便记录与表示. ( )
⑤茎叶图只能表示两位有效数字的数据.
()
【解析】根据频率分布直方图的含义可知①②都正确;茎叶图 要求不能丢失数据,所以③不正确;④正确;⑤不正确,茎叶 图能够记录三个或三个以上的有效数字的数据,只不过此时茎 和叶的选择要灵活. 答案:①√ ②√ ③× ④√ ⑤×
的面积和为1.
(3)用样本的频率分布可以估计相应总体的概率分布.
数字特征的应用 【方法点睛】 1.众数、中位数与平均数的作用 众数、中位数与平均数都是描述一组数据集中趋势的量,其中 平均数与每一个样本数据都有关,任何一个数据的改变都会引 起平均数的变化.
2.标准差与方差 标准差与方差描述了一组数据与平均数的离散程度,反映了一 组数据相对于平均数的波动情况,标准差与方差越大,说明这 组数据的波动性越大. 【提醒】用样本的数字特征估计总体的数字特征时,样本容量 越大,估计就越精确.
x 2 3+3 4+10 5+6 6+3 7+28+2 9+210 30
≈5.97.于是得mo<mex< .故选D.
超实用高考数学专题复习教学课件:10.3 统计图表 数据的数字特征 用样本估计总体
提高答题的正确率,希望对你有所帮助,有志者事竟成!
养成良好的答题习惯,是决定高考数学成败的决定性因素之一。做题前,要认真阅读题目要求、题干和
选项,并对答案内容作出合理预测;答题时,切忌跟着感觉走,最好按照题目序号来做,不会的或存在疑问
的,要做好标记,要善于发现,找到题目的题眼所在,规范答题,书写工整;答题完毕时,要认真检查,查
一个班参加市电视台组织的“环保知识竞赛”.该校对甲、乙两班的参赛选
手(每班7人)进行了一次环保知识测试,他们取得的成绩的茎叶图如图所示,
其中甲班学生的平均分是85分,乙班学生成绩的中位数是85分.
①求x,y的值;
②根据茎叶图,求甲、乙两班同学成绩的方差的
大小,并从统计学角度分析,该校应选择甲班还是
乙班参赛.
人,A正确;得分在[60,80)的频率为0.5,可得这100名参赛者中随机选取一人,
得分在[60,80)的概率为0.5,B正确;根据频率分布直方图知,最高的小矩形对
50+60
应的底边中点为 2 =55,即估计众数为
55,C 正确,根据分布直方图知,中位
0.1
数为 60+10×0.03×10≈63.33,D 错误,故选 D.
=85,
7
解得 x=9.因为乙班学生成绩的中位数是 85 分,所以 y=5.
2
②由①可知,甲 =85,所以甲
由茎叶图可得,乙 =
2
所以乙
=
=
1
360
2
2
2
×[(75-85) +(78-85) +…+(96-85) ]= 7 .
(2)试估计样本数据的中位数与平均数.
解 (1)由题知,月收入在[1 000,1 500)的频率为0.000 8×500=0.4,
用样本的数字特征估计总体的数字特征
(B)4
(C)2
(D)1
1.有甲、乙两种水稻,测得每种水稻各10株 的分蘖数后,计算出样本方差分别为S甲2=11 ,S乙2=3.4,由此可以估计( B ) (A)甲种水稻比乙种水稻分蘖整齐 (B)乙种水稻比甲种水稻分蘖整齐 (C)甲、乙种水稻分蘖整齐程度相同 (D)甲、乙两种水稻分蘖整齐程度不能比 较
频率分布直方图损失了一些样本数据,得到的是 一个估计值,且所得的估计值与数据分组有关.
注: 在只有样本频率分布直方图的情况下, 我们可以按上述方法估计众数、中位数和平 均数,并由此估计总体特征.
频率 组距
0.5 0.44 0.3 0.28
众数: 最高矩形的中点 中位数:左右两边直方图的面积相等.
平均数:频率分布直方图中每 个小矩形的面积乘以 小矩形底边中点的横 坐标之和.
x乙
=
1(13+14+12+12+14)=13 5
s2甲
=
1 5
[(10
13)2
+(13
13)2
+(12
13)2
+(14
13)2
+(16
13)2
]=4
s2乙
=
1 5
[(13
13)2
+(14
13)2
+(12
13)2
+(12
13)
2
+(14
13)2
]=0.8
(2)由 s2甲>s2乙可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,
算一算:在城市居民月均用水量样本数据的频率分布
直方图中,从左至右各个小矩形的面积分别是0.04, 0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此 估计总体的平均数是什么?
考点3 统计图表及数据的数字特征,用样本估计总体
温馨提示:高考题库为Word 版,请按住Ctrl ,滑动鼠标滚轴,调节合适的观看比例,点击右上角的关闭按钮可返回目录。
考点3 统计图表及数据的数字特征,用样本估计总体2010年考题1.(2010·陕西高考文科·T4)如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为A B x x 和,样本标准差分别为s A 和s B ,则( )(A) A x >B x ,s A >s B (B) A x <B x ,s A >s B (C) A x >B x ,s A <s B (D) A x <B x ,s A <s B【解析】选B 由图易得A x <B x ,又A 波动性大,B 波动性小,所以s A >s B2.(2010·山东高考理科·T6)样本中共有五个个体,其值分别为a,0,1,2,3,,若该样本的平均值为1,则样本方差为( )65【解析】选D,由题意知1a+0+1+2+3)=15(,解得a=-1,所以样本方差为2222221S =[(-1-1)+(0-1)+(1-1)+(2-1)+(3-1)]5=2,故选D.3. (2010·山东高考文科·T6)在某项体育比赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )(A )92 , 2 (B) 92 , 2.8 (C) 93 , 2 (D) 93 , 2.8 【解析】选了B ,去掉一个最高分95一个最低分89,剩下5个数的平均值为1(9090939493)925++++=,方差为222221[(9092)(9092)(9392)(9492)(9392)] 2.85-+-+-+-+-= 4. (2010·福建高考文科·T9)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A.91.5和91.5B.91.5和92C.91和91.5D.92和92【解析】选A ,数据从小到大排列后可得其中位数为919291.52+=,平均数为878990919293949691.58+++++++=。
用样本的数字特征估计总体的数字特征
用样本的数字特征估计总体的数字特征【知识点的知识】1.样本的数字特征:众数、中位数、平均数众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;(3)平均数:一组数据的算术平均数,即.2、三种数字特征的优缺点::(1)样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表示样本数据中的很少一部分信息.(2)中位数不受少数几个极端值的影响,容易计算,它仅利用了数据排在中间的数据的信息.(3)样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.(4)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.(5)使用者根据自己的利益去选择使用中位数或平均数来描述数据的中心,从而产生一些误导作用.3、如何从频率分布直方图中估计众数、中位数、平均数?利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.4、样本平均数、标准差对总体平均数、标准差的估计现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道(或不可求)的.如何求得总体的平均数与标准差呢?通常的做法是用样本的平均数与标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.如要考查一批灯泡的质量,我们可从中随机抽取一部分作为样本,要分析一批钢筋的强度,可以随机抽取一定数目的钢筋作为样本,只要样本的代表性强就可以用来对总体作出客观的判断.但需要注意的是,同一个总体,抽取的样本可以是不同的.如一个总体包含6个个体,现在要从中抽取3个作为样本,所有可能的样本会有20种不同的结果,若总体与样本容量较大,可能性就更多,而只要其中的个体是不完全相同的,这些相应的样本频率分布与平均数、标准差都会有差异.这就会影响到我们对总体情况的估计.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
●三个特征 利用频率分布直方图估计样本的数字特征: (1)中位数:在频率分布直方图中,中位数左边和右边的直方 图的面积相等,由此可以估计中位数值.
(2)平均数: 平均数的估计值等于每个小矩形的面积乘以矩形 底边中点横坐标之和.
(3)众数:最高的矩形的中点的横坐标.
题型一 频率分布直方图的绘制与应用 【例 1】 某校从参加高一年级期中考试的学生中随机抽出 60 名 学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…, [90,100]后得到如图所示的频率分布直方图,观察图形的信息,回 答下列问题:
题型二 【例2】
茎叶图的应用
从甲、乙两个城市分别随机抽取16台自动售货
机,对其销售额进行统计,统计数据用茎叶图表示(如图所示), 设甲、乙两组数据的平均数分别为 x 甲, x 乙,中位数分别为m甲, m乙,则( )
观察估算 是奇数个还是偶数个数据
A. x 甲< x 乙,m 甲>m 乙 C. x 甲> x 乙,m 甲>m 乙
第二节 ►►统计图表、数据的数字特征、用样本估计总体
星子中学数学组 郭清山
2015年2月25日星期三
【考点分析】 (1)考查样本的频率分布(分布表、直方图、茎叶图)中的有关 计算,样本特征数(众数、中位数、平均数、标准差)的计算.主要 以选择题、填空题为主; (2)考查以样本的分布估计总体的分布(以样本的频率估计总 体的频率、以样本的特征数估计总体的特征数).
利用各小长方形的面积和等于1
(1)求分数在[70,80)内的频率,并补全这个频率分布直方图; (2)统计方法中, 同一组数据常用该组区间的中点值作为代表, 据此估计本次考试中的平均分.
解析:(1)设分数在[70,80)内的频率为 x,
根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,
可得 x=0.3,所以频率分布直方图如图所示.
(2) 平均分为: x = 45×0.1 + 55×0.15 + 65×0.15 + 75×0.3 + 85×0.25+95×0.05=71(分).
点评:频率分布直方图直观形象地表示了样本的频率分布, 从这个直方图上可以求出样本数据在各个组的频率分布.根据频 率分布直方图估计样本(或者总体)的平均值时, 一般是采取组中值 乘以各组的频率(长方形面积)的方法.
最多 的数据. 8 ______ (1)众数:在一组数据中,出现次数□
最中间 9 ________ (2)中位数:将一组数据按大小依次排列,处在 □
位置的一个数据(或最中间两个数据的平均数).
1 10 ______________. n(x1+x2+…+xn) (3)平均数: x =□
1 2 2 2 [( x - x ) + ( x - x ) +…+ ( x - x ) ] 2 n 11 ________________________. n 1 (4)方差:s2=□
B. x 甲< x 乙,m 甲<m 乙 D. x 甲> x 乙,m 甲<m 乙
解析:甲数据集中于前半段,而乙数据集中于后半段,所以 x 甲< x 乙;
18+22 27+31 m 甲= 2 =20,m 乙= 2 =29,所以 m 甲<m 乙
所以选 B.
点评:由于茎叶图完全反映了所有的原始数据,解决由茎叶 图给出的统计图表试题时,就要充分使用这个图表提供的数据进 行相关的计算或者是对某些问题作出判断,这类试题往往伴随着 对数据组的平均值或者是方差的计算等.
【复习指导】 (1)理解统计中的常用术语:总体、个体、样 本、平均数、方差、中位数、众数;(2)会利用频率分布直方图、 茎叶图对总体进行估计,尤其是频率分布直方图的应用更是高考 考查的热点.
知 识 梳 理 1.统计图表
Hale Waihona Puke 信息原始数据数据分布 具体数目
具体数目
数据的变化趋势
数据之间的比例关系
2.数据的数字特征
(3)由 x 甲= x 乙,说明甲、乙两战士的平均水平相当;
2 又∵s2 甲>s乙,说明甲战士射击情况波动大,因此乙战士比甲战士射
击情况稳定.
点评:平均数与方差都是重要的数字特征,是对总体的一种 简明的描述,它们所反映的情况有着重要的实际意义,平均数、 中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
1 2 2 2 [ x - x + x - x +…+ x - x ] 2 n 12 __________________________. n 1 (5)标准差:s=□
3.用样本估计总体 类别 定义 13 由一些小矩形来表示,每个小矩形的宽度为□ 频率 分布 直方 图 16 ______. 方图.图中所有小矩形面积之和为□ 1
至右边所加区间的中点,就可以得到一条折线称之为 频率折线图.
●一种思想:用样本估计总体是统计的基本思想.
●两点注意 (1)频率分布直方图与统计条形图不同.
(2)①众数、中位数及平均数都是描述一组数据集中趋势的量,平 均数是最重要的量,与每个样本数据有关,这是中位数、众数所 不具有的性质.
②标准差、 方差描述了一组数据围绕平均数波动的大小. 标准 差、方差越大,数据的离散程度就越大.
fi Δxi 分组的宽度),高为 14 ______ Δxi ,小矩形的面 ______(
□
15 ______. 频率 fi 称这样的图形为频率分布直 积恰为相应的□
类别
定义 在频率分布直方图中,按照分组原则,再在左边和右 边各加上一个区间,从所加的左边区间的中点开始,
频率折 线图
各个矩形的顶端中点 17 __________________________ 用线段依次连接□ ,直
错因分析:错解中把矩形的高看作了频率,且矩形个数多数了一 个.
正确解答: 由题图可知, 员工中年薪在 2.4 万元~2.6 万元之间的 频率为 1-(0.02+0.08+0.08+0.10+0.10)×2=0.24, 所以年薪在 2.4 万元~2.6 万元之间的共有 300×0.24=72(人).
误区警示:(1)解答统计图表问题时,要认真审题、仔细观 察,从中提取有用的信息或数据.(2)频率分布直方图的纵坐标为 频率/组距,每一个小矩形的面积表示样本个体落在该区间内的频 率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见 的错误.
题型三
用样本的数字特征估计总体的数字特征
【例3】 甲、乙两名战士在相同条件下各射靶10次,每次 命中的环数分别是 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5. (1)分别计算两组数据的平均数; (2)分别计算两组数据的方差; (3)根据计算结果,估计一下两名战士的射击水平谁更好一 些.
1 解析:(1) x 甲=8+10(0-2-1+0-2-3+1+2-4-1)=7(环), 1 x 乙=8+10(-2-1-1+0-2-1+0-1+1-3)=7(环).
1 解析:(2)由方差公式 s =n[(x1- x )2+(x2- x )2+…+(xn- x )2]
2 2 2 2 可求得 s2 甲=3.0(环 ),s乙=1.2(环 ).
word部分:
请做: 考题调研 成功体验
点此进入该word板块
易错警示系列(40) 统计图表识图不准致误 【示例】 某公司共有员工 300 人,2012 年员工年薪情况的 频率分布直方图如图所示,求员工中年薪在 2.4 万元~2.6 万元之 间的人数.
错解:员工中年薪在 2.4 万元~ 2.6 万元之间的频率为 1-(0.02+0.08 +0.10)×2=0.60, 从而得到员工中年 薪在 2.4 万元~2.6 万元之间的共有 300×[1-(0.02+0.08+0.10)×2]= 180(人).