茎叶图与频率分布直方图_-2018届高三文科数学精品复习讲义与跟踪训练含解析
2018版高中数学专题02频率分布直方图及其应用分项汇编(含解析).pdf
专题02 频率分布直方图及其应用一、选择题1.【2017-2018年北京市首都师大附中高二期末】对高速公路某段上汽车行驶速度进行抽样调查,画出如下频率分布直方图.根据直方图估计在此路段上汽车行驶速度的众数和行驶速度超过80km/h的概率A. 75,0.25B. 80,0.35C. 77.5,0.25D. 77.5,0.35【答案】D故选D.2.【人教B版高中数学必修三同步测试】根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如图),从图中可以看出,该水文观测点平均至少100年才遇到一次的洪水的最低水位是()A. 48 mB. 49 mC. 50 mD. 51 m【答案】C【解析】由频率分布直方图知水位为50 m的频率组距为0.00520.01,即水文观测点平均至少一百年才遇到一次的洪水的最低水位是50 m. 本题选择C选项.3.【福建省三明市A片区高中联盟校2017-2018学年高二上学期阶段性考试】为了解某地区名高三男生的身体发育情况,抽查了该地区名年龄为~岁的高三男生体重(),得到频率分布直方图如图.根据图示,估计该地区高三男生中体重在kg的学生人数是( )A. B. C. D.【答案】C点睛:此题主要考查了频率分布直方图在实际问题中的应用,属于中低档题型,也是常考考点.在解决此类问题中,充分利用频率分布直方图的纵坐标的实际意义,其纵坐标值为:频率/组距,由此各组数据的频率=其纵坐标组距,各组频数=频率×总体,从而可估计出所求数据段的频数(即人数).4.【广东省中山一中、仲元中学等七校2017-2018学年高二3月联考】某商场在国庆黄金周的促销活动中,对10月1日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为3万元,则9时至14时的销售总额为A. 10万元B. 12万元C. 15万元D. 30万元【答案】D【解析】9时至10时的销售额频率为0.1,因此所有销售总额为万元,故选D.5.【四川省成都外国语学校2017-2018学年高二上学期期末考试】容量为100的样本,其数据分布在2,18,将样本数据分为4组:2,6,6,10,10,14,14,18,得到频率分布直方图如图所示.则下列说法不正确的是A. 样本数据分布在6,10的频率为0.32B. 样本数据分布在10,14的频数为40C. 样本数据分布在2,10的频数为40D. 估计总体数据大约有10%分布在10,14【答案】DD不正确.故选D.6.【四川省雅安市2017-2018学年高二上学期期末考试】某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试,现随机调查了24名笔试者的成绩,如下表所示:据此估计允许参加面试的分数线大约是()A. 75B. 80C. 85D. 90【答案】B故选B7.【四川省成都市2017-2018学年高二上学期期末调研考试】容量为100的样本,其数据分布在2,18,将样本数据分为4组:2,6,6,10,10,14,14,18,得到频率分布直方图如图所示,则下列说法不正确的是()A. 样本数据分布在6,10的频率为0.32B. 样本数据分布在10,14的频数为40C. 样本数据分布在2,10的频数为40D. 估计总体数据大约有10%分布在10,14【答案】D【解析】总体数据分布在10,14的概率为0.140% 0.020.080.10.05故选D8.【广西南宁市第二中学(曲靖一中、柳州高中)2017-2018学年高二上学期末期考试】2014年5月,国家统计局公布了《2013年农民工监测调查报告》,报告显示:我国农民工收入持续快速增长.某地区农民工人均月收入增长率如图1,并将人均月收入绘制成如图2的不完整的条形统计图.根据以上统计图来判断以下说法错误的是()A. 2013年农民工人均月收入的增长率是.B. 2011年农民工人均月收入是元.C. 小明看了统计图后说:“农民工2012年的人均月收入比2011年的少了”.D. 2009年到2013年这五年中2013年农民工人均月收入最高.【答案】C9.【四川省遂宁市2017-2018学年高二上学期期末考试】供电部门对某社区位居民2017年12月份人均用电情况进行统计后,按人均用电量分为,,,,五组,整理得到如下的频率分布直方图,则下列说法错误的是A. 月份人均用电量人数最多的一组有人B. 月份人均用电量不低于度的有人C. 月份人均用电量为度D. 在这位居民中任选位协助收费,选到的居民用电量在一组的概率为【答案】C。
苏教版数学高一作业 频率分布直方图与折线图(二)- 茎叶图
2.2.2频率分布直方图与折线图(二)2.2.3茎叶图一、填空题1.某调查机构调查了某地100个新生婴儿的体重,并根据所得数据画出了样本的频率分布直方图(如图所示),则新生婴儿的体重(单位:kg)在[3.2,4.0)的人数是______.2.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.根据茎叶图判断________班的平均身高较高.3.为了调查某厂工人生产某种产品的能力,现随机抽查了200名工人某天生产该产品的数量.产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如图所示,则这200名工人中一天生产该产品数量在[55,75)的人数是________.4.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.5.一次选拔运动员,测得7名选手的身高(单位:cm)分布茎叶图为⎪⎪⎪ 1817⎪⎪⎪0 10 3 x 8 9记录的平均身高为177 cm ,有一名候选人的身高记录不清楚,其末位数记为x ,那么x 的值为________________________________________________________________________. 6.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的14,且样本容量为160,则中间一组的频数为______.7.参加CBA 2013~2014赛季的甲、乙两支球队,统计两队队员的身高(单位:cm)茎叶图如下(以十位百位为茎,个位为叶):则由图知________队队员的身高更整齐些.8.某中学高一(2)班甲、乙两名同学自高中以来每次考试成绩的茎叶图如图,则________同学发挥较稳定,平均成绩________同学较高.(填“甲”或“乙”)9.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是________.(填序号)10.某个容量为100的样本的频率分布直方图如下图所示,则在区间[4,5)上的数据的频数..为______.二、解答题11.有一个容量为50的样本,数据分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5],4.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)画出频率折线图.12.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?13.某市2014年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.答案精析1.40解析 频率分布直方图反映样本的频率分布,每个小矩形的面积等于样本数据落在相应区间上的频率,故新生婴儿的体重在[3.2,4.0)的人数为100×(0.4×0.625+0.4×0.375)=40. 2.乙解析 由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间.因此乙班平均身高高于甲班. 3.130解析 由频率分布直方图可得,一天生产该产品数量在[55,75)的频率是(0.040+0.025)×10=0.65,所以人数为0.65×200=130. 4.24 23 解析 x 甲=110(10×2+20×5+30×3+17+6+7)=24, x乙=110(10×3+20×4+30×3+17+11+2)=23. 5.8解析 由茎叶图可知10+11+3+x +8+97=7,解得x =8. 6.32解析 设中间一个小长方形的面积为x , 由题意知,x +4x =1,所以x =15.则中间一组的频数为15×160=32.7.甲解析 由茎叶图知甲队身高大部分是2米零几,而乙队身高拉得较开. 8.乙 乙解析 从茎叶图可知乙同学的成绩在80~90分分数段的有9次,而甲同学的成绩在80~90分分数段的只有7次;再从题图上还可以看出,乙同学的成绩集中在90~100分分数段的最多,而甲同学的成绩集中在80~90分分数段的最多.故乙同学发挥较稳定且平均成绩也比甲同学高.9.①解析由于频率分布直方图的组距为5,去掉③④,又[0,5),[5,10)两组各一人,应选图①.10.30解析样本数据在(1,4)和(5,6)上的频率为(0.05+0.10+0.40+0.15)×1=0.7,故样本数据在(4,5)上的频率为1-0.7=0.3,其频数为100×0.3=30.11.解(1)频率分布表如下:累计频数频率分组频数[12.5,15.5)330.06[15.5,18.5)1180.16[18.5,21.5)2090.18[21.5,24.5)31110.22[24.5,27.5)41100.20[27.5,30.5)4650.10[30.5,33.5]5040.08合计50 1.00(2)频率分布直方图如下:(3)频率折线图为12.解(1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.13.解(1)频率分布表如下:分组累计频数频数频率[41,51)222 30[51,61)311 30[61,71)744 30[71,81)1366 30[81,91)231010 30[91,101)2855 30[101,111]3022 30合计301 (2)频率分布直方图如图所示:(3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.。
高考频率分布直方图知识点
高考频率分布直方图知识点高考题频率分布直方图知识点在学生的学习生涯中,高考是一个极为重要的里程碑。
为了能在高考中取得好成绩,学生们不仅要掌握各学科的基础知识,还需要熟悉高考题型和考点。
而对于数学科目来说,直方图是高考频率分布的一个重要知识点。
下面将以直方图为主题,讨论其相关知识点。
直方图是一种用来表示数据分布情况的图形。
它由一系列高度不等的矩形组成,每个矩形代表一个数据区间,高度表示该区间内数据的频数或频率。
首先,我们先来了解一下直方图的构成。
直方图的横轴通常表示数据的取值范围,纵轴表示频数或频率。
每个矩形的宽度可以根据数据的分布情况来确定,它们可以等宽也可以不等宽。
矩形的高度则代表了数据的频数或频率。
直方图的制作需要经过以下几个步骤。
首先,根据给定的数据集,将数据按照一定的区间进行分组。
一般来说,划分区间时需要保证每个区间的宽度相等,并且包含足够多的数据点。
然后,统计每个区间内的数据个数或频率,并将其绘制成对应高度的矩形。
最后,根据实际需要,可以给直方图添加标题和坐标轴标签等。
直方图不仅能够展示数据的分布情况,还可以帮助我们观察和分析数据的特征和规律。
通过观察直方图,我们可以了解到数据的集中趋势、离散程度以及异常值等重要信息。
比如,直方图的峰度可以反映数据的分布形态是平坦还是陡峭,而直方图的偏度可以反映数据的偏斜程度。
在考试中,直方图也被广泛应用于频率分布题目中。
考生需要根据给定的数据分布情况,回答一些与直方图相关的问题。
例如,考生可以根据直方图估计数据的平均值、中位数和众数等统计指标。
同时,直方图还可以帮助考生判断数据是否满足正态分布或其他特定分布形态。
此外,在解答与直方图相关的题目时,考生还需要熟悉直方图的性质和特点。
例如,直方图的面积表示数据的频数或频率总和。
而不同的数据分布形态会对直方图的形状产生影响。
当数据分布近似正态分布时,直方图呈现出钟形曲线,对称分布的数据则呈现出对称形状的直方图。
2018版高中数学 第二章 统计 2.2.3 茎叶图学案 苏教版必修3
2.2.3 茎叶图掌握茎叶图的意义及画法,并能在实际问题中用茎叶图进行数据统计.(重点、难点)[基础·初探]教材整理茎叶图阅读教材P60~P61“练习”上面的部分,并完成下列问题.1.茎叶图的定义将样本数据有条理的列出来,从中观察样本分布情况的图称为茎叶图.2.茎叶图的适用范围当样本数据较少时,用茎叶图表示数据的效果较好.3.茎叶图的制作方法(1)画“茎”:“茎”表示两位数的十位数字,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,再画上竖线作为分界线.(2)添“叶”:“叶”画在分界线的另一侧表示两位数的个位数字,共茎的叶一般按从小到大(或从大到小)的顺序同行列出.4.茎叶图刻画数据的优缺点(1)茎叶图刻画数据的优点:①所有的信息都可以从茎叶图中得到.②茎叶图便于记录和表示.(2)茎叶图刻画数据的缺点:当样本数据很多时,茎叶图的效果就不是很好了.填空:(1)用茎叶图表示一组两位数据时,数据的个数________茎叶图中叶的个数.(填“>”“=”“<”)【解析】因为每个数的个位数都要写在表示叶的那一栏中,故数据的个数与茎叶图中叶的个数相等.【答案】=(2)如图2214表示8位销售员一个月销售商品数量的茎叶图,则销售数量分别为________(单位:百件).图2214【解析】由茎叶图知“茎”表示十位“叶”表示个位.【答案】45,45,52,56,57,58,60,63[小组合作型]甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.【导学号:11032041】【精彩点拨】确定茎和叶→画出茎叶图→对两人成绩作出判断比较【自主解答】甲、乙两人数学成绩的茎叶图,如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,大多集中在80~100之间,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,多集中在70~90之间,中位数是88分,但分数分布相对于乙来说,趋于分散.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.1.画茎叶图关键是分清茎和叶,一般来说数据是两位数的,十位上数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要合理的选择茎和叶.2.在画茎叶图时,对于重复出现的数据要重复记录,不要遗漏.[再练一题]1.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)画出两组数据的茎叶图;(2)比较分析两组数据,能得出什么结论?【解】(1)依题意画出茎叶图,如图所示:(2)电脑杂志文章中每个句子的字数集中在10~20之间,而报纸文章中每个句子的字数集中在20~30之间,还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物要简明,通俗易懂.8∶00~12∶00间各自的车流量(单位:百辆),得到如图2215所示的茎叶图,根据茎叶图回答下列问题:图2215(1)甲交通站的车流量在[10,40]间的频率是多少?(2)甲、乙两个交通站哪个更繁忙?并说明理由.【精彩点拨】根据茎叶图中的数据进行分析并作出说明.【自主解答】 (1)甲交通站的车流量在[10,40]间的频率为414=27. (2)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方,从数据的分布情况来看,甲交通站更繁忙.1.利用茎叶图进行分析时要首先分清楚茎与叶所表示的意义及叶的排列规律,茎叶图直观地表示了数据的集中、离散的程度以及中位数、众数等特征.2.茎叶图既可以用于分析单组数据,也可以用于对两组数据进行比较分析.[再练一题]2.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图2216可知,下列说法不正确的是________.(填序号)图2216①甲运动员的成绩好于乙运动员;②乙运动员的成绩好于甲运动员;③甲、乙两名运动员的成绩没有明显的差异;④甲运动员的最低得分为0分.【解析】 由图可知,甲运动员的成绩比较集中,且平均得分大约在30多分,乙运动员得分也大致对称,平均得分在20多分,甲运动员最低分10分,乙运动员最低分8分,故①正确.【答案】 ②③④[探究共研型]探究1 的,他们各有什么优缺点? 【导学号:11032042】【提示】【提示】 (1)当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.(2)正确利用三种分布的描述方法,都能得到一些有关分布的主要特点(如分布是否具有对称性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响比较小,更接近于总体分布的特点.某统计机构从甲、乙两个城市所有的自动售货机中分别随机抽取了16台,记录一上午各自的销售情况:(元)甲:18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41.乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.试选用适当的方法表示上面的数据并简要说明选取该种方法的理由.【精彩点拨】 由于是两组数据,且数据个数不多,可选用茎叶图表示数据.【自主解答】 从题目中的数据不易直接看出各自的分布情况,为此,我们将以上数据用茎叶图表示,茎叶图如图所示,两竖线中间的数字表示甲、乙销售额的十位数字,两边的数字表示甲、乙销售额的个位数字.理由如下:茎叶图既可以用于分析单组数据,也可以用于对两组数据进行比较分析.用茎叶图刻画数据有两个优点:一是所有的信息都可以从这张茎叶图中得到,二是茎叶图便于记录和表示.茎叶图保留了数据信息,对数据的记录和表示很方便.但当样本数据很多时,茎叶图的效果就不是很好了,解题时应根据解决问题的特点和关注的主要方面有选择的应用.[再练一题]3.某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量并分别记录如下:甲:52,51,49,48,53,48,49;乙:60,65,40,35,25,65,60.(1)这种抽样方法是哪一种抽样方法?(2)画出茎叶图,并说明哪个车间的产品比较稳定.【解】(1)该抽样方法为系统抽样法.(2)茎叶图如图所示.由图可以看出甲车间包装的产品质量较集中,而乙车间包装的产品质量较分散,说明甲车间产品质量较稳定.1.如图2217是甲参加物理考试的成绩.图2217从图中可知甲参加的次数为________.【解析】由于茎叶图中重复的数字要一一列举出来,可知甲参加8次考试.【答案】82.在茎叶图2218中比40大的数据有________个.图2218【解析】由茎叶图知比40大的有47,48,49,共3个.【答案】 33.甲、乙两个班级各随机选出15名同学进行测试,成绩(单位:分)的茎叶图如图2219所示.图2219则甲、乙两班的最高成绩各是________分,从图中看,________班的平均成绩较高.【解析】由茎叶图可知甲班最高成绩为96,乙班最高成绩为92.由于乙班的成绩集中在60~80之间,故乙班的平均成绩高.【答案】96,92 乙4.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图2220.图2220据此可估计该校上学期400名教师中,使用多媒体进行教学次数在[16,30)内的人数为________.【解析】由茎叶图数据可知,在20名教师中,使用多媒体在[16,30)内的人数为8人,则在400名教师中共有400×820=160人.【答案】1605.心理教育专家对某班50人进行智力测验,其得分如下:48,65,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,4 7,66,55,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,58.(1)这次测验成绩中的最大值和最小值是多少?(2)画出并分析这50人成绩的茎叶图,你能得出什么结论?【解】(1)这次测验成绩中的最大值为97,最小值为32.(2)画出茎叶图如下图所示.从茎叶图上可以明显看出学生的成绩大都在50到70之间,且分布较对称,集中程度较高,符合学生正常的智力水平.。
专题14频率分布直方图与数字特征-2018年高考数学三轮复习大题疯狂练(通用解析版)
专题14频率分布直方图与数字特征-2018年高考数学三轮复习大题疯狂练(通用解析版)1.为选拔选手参加“中国诗词大会”,某中学举行一次“诗词大赛”活动.为了了解本次竞赛学生的成绩情况,从中抽取了部分学生的分数(得分取正整数,满分为100分)作为样本(样本容量为n )进行统计.按照50,60),60,70),70,80),80,90),90,100的分组作出频率分布直方图,并作出样本分数的茎叶图(图中仅列出了得分在50,60),90,100的数据).[[[[[][[](1)求样本容量n 和频率分布直方图中x 、y 的值;(2)在选取的样本中,从竞赛成绩在80分以上(含80分)的学生中随机抽取2名学生参加“中国谜语大会”,设随机变量X 表示所抽取的2名学生中得分在80,90)内的学生人数,求随机变量X 的分布列及数学期望.[【答案】(1)见解析;(2)见解析.【解析】试题分析:(1)由频率分布直方图及题意可得样本容量n 与x 、y 的值;(2)抽取的2名学生中得分在80,90)的人数X 可能取值0,1,2,求出相应的概率值,即可得到随机变量X 的分布列及数学期望.[抽取的2名学生中得分在80,90)的人数X 可能取值0,1,2,2112C 10C 10C 30C 303529则P (X =0)=2=,P (X =1)=,,=P X =2==()22C 4052C 4013C 4052[则X 的分布列为所以EX =0⨯35293+1⨯+2⨯=.52135222.某网站从春节期间参与收发网络红包的手机用户中随机抽取10000名进行调查,将受访用户按年龄分成5组:[10,20),[20,30),…,[50,60],并整理得到如下频率分布直方图:(Ⅰ)求a 的值;(Ⅱ)从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的概率;(Ⅲ)估计春节期间参与收发网络红包的手机用户的平均年龄.【答案】(Ⅰ)a =0.035;(Ⅱ)0.75;(Ⅲ)32.5.试题解析:(Ⅰ)根据频率分布直方图可知,10⨯(a+0.005+0.01+0.02+0.03)=1,解得a=0.035.(Ⅱ)根据题意,样本中年龄低于40的频率为10⨯(0.01+0.035+0.03)=0.75,所以从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的概率为0.75.(Ⅲ)根据题意,春节期间参与收发网络红包的手机用户的平均年龄估计为15⨯0.1+25⨯0.35+35⨯0.3+45⨯0.2+55⨯0.05=32.5(岁).3.为了弘扬民族文化,某中学举行了“我爱国学,传诵经典”考试,并从中随机抽取了60名学生的成绩(满分100分)作为样本,其中成绩不低于80分的学生被评为优秀生,得到成绩分布的频率分布直方图如图所示.(1)若该所中学共有2000名学生,试利用样本估计全校这次考试中优秀生人数;(2)(i)试估计这次参加考试的学生的平均成绩(同一组数据用该组区间的中点值作代表);(ii)若在样本中,利用分层抽样的方法从成绩不低于70分的学生中随机抽取6人,再从中抽取3人赠送一套国学经典学籍,试求恰好抽中2名优秀生的概率.【答案】(1)600;(2)(i)72.5;(ii).试题解析;(1)由直方图可知,样本中数据落在则估计全校这次考试中优秀生人数为(2)(i )设样本数据的平均数为,则则估计所有参加考试的学生的平均成绩为72.5..的频率为,,所以恰好抽中2名优秀生的概率为【点睛】统计中的四个数据特征.(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即= (x 1+x 2+…+x n ).(其中频率分布直方图中,用每组数据中点数表示)(4)方差与标准差.s 2= [(x 1-)2+(x 2-)2+…+(x n -)2],4.2018年中央电视台春节联欢晚会分会场之一落户黔东南州黎平县肇兴侗寨,黔东南州某中学高二社会实践小组就社区群众春晚节目的关注度进行了调查,随机抽取80名群众进行调查,将他们的年龄分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80],得到如图所示的频率分布直方图.(Ⅰ)求这80名群众年龄的中位数;(Ⅱ)将频率视为概率,现用随机抽样方法从该社区群众中每次抽取1人,共抽取3次,记被抽取的3人中年龄在30,40)的人数为ξ,若每次抽取的结果是相互独立的,求ξ的分布列,及数学期望E (ξ).[【答案】(Ⅰ)55;(Ⅱ)答案见解析.【解析】试题分析:(1)设80名群众年龄的中位数为x ,根据频率分布直方图数据即可求出x 的值,即80名群众年龄的中位数(2)求出年龄在[30,40)的概率,由题意可知ξ~B 3,⎪,ξ的所有可能取值为⎛1⎫⎝10⎭01,,2,3,求出相对应的概率,即可求得ξ的分布列,及数学期望E (ξ)(Ⅱ)由频率分布直方图可知,任意抽取1名群众,年龄恰在[30,40)的概率为1,10由题意可知ξ~B 3,⎪,ξ的所有可能取值为0,1,2,3,⎛1⎫⎝10⎭0937290⎛1⎫1⎛1⎫P (ξ=0)=C 3()=P ξ=1=C ()3 ⎪⎪1000⎝10⎭10⎝10⎭21243⎛9⎫,= ⎪101000⎝⎭3227⎛1⎫93⎛1⎫P (ξ=3)=C 3P (ξ=2)=C 32 ⎪()1=⎪1000⎝10⎭10⎝10⎭1⎛9⎫=⎪⎝10⎭10000X 的分布列为ξ0123P7291000243100027100011000所以E (ξ)=0⨯729243271300313+1⨯+2⨯+3⨯==.或者E (ξ)=3⨯=100010001000100010001010105.树立和践行“绿水青山就是金山银山,坚持人与自然和谐共生”的理念越来越深入人心,已形成了全民自觉参与,造福百姓的良性循环.据此,某网站退出了关于生态文明建设进展情况的调查,调查数据表明,环境治理和保护问题仍是百姓最为关心的热点,参与调查者中关注此问题的约占明建设的人群中随机选出200人,并将这200人按年龄分组:第1组第4组,第5组,得到的频率分布直方图如图所示.,第2组.现从参与关注生态文,第3组,(1)求出的值;(2)求这200人年龄的样本平均数(同一组数据用该区间的中点值作代表)和中位数(精确到小数点后一位);(3)现在要从年龄较小的第1,2组中用分层抽样的方法抽取5人,再从这5人中随机抽取3人进行问卷调查,求这2组恰好抽到2人的概率.【答案】(1)(2)平均数为41.5,中位数为(3)5人中随机抽取3人,共10个基本事件,从而得到第2组中抽到2人的概率.试题解析:(1)由(2)平均数为;设中位数为,则,得.岁;岁.(3)第1,2,3组的人数分别为20人,30人,从第1,2组中用分层抽样的方法抽取5人,则第1,2组抽取的人数分别为2人,3人,分别记为设从5人中随机抽取3人,为.,共10个基本事件,从而第2组中抽到2人的概率.6.某地区工会利用“健步行APP”开展健步走积分奖励活动.会员每天走5千步可获积分30分(不足5千步不积分),每多走2千步再积20分(不足2千步不积分).为了解会员的健步走情况,工会在某天从系统中随机抽取了1000名会员,统计了当天他们的步数,并将样本数据分为3,5),5,7),7,9),9,11),[[[[[11,13),[13,15),[15,17),[17,19),[19,21]九组,整理得到如下频率分布直方图:(Ⅰ)求当天这1000名会员中步数少于11千步的人数;(Ⅱ)从当天步数在11,13),13,15),15,17)的会员中按分层抽样的方式抽取6人,再从这6人中随机抽取2人,求这2人积分之和不少于200分的概率;(Ⅲ)写出该组数据的中位数(只写结果).【答案】(1) 300人;(2)[[[437;(3).53【解析】试题分析:(1)根据条形分布直方图中的数据得到健步走的步数在5,7)内的人数为60,在7,9)内的人数为100,在91,1[[[共得到300人;(2)根据分层抽样的概念得到在[11,13))内的人数为100,内应抽取3人,每人的积分是90分,在13,15)内应抽取2人,每人的积分是110分,在15,17)内应抽取[[1人,每人的积分是130分,再根据古典概型的公式得到概率值;(3)由中位数的概念,根据直方图可求出结果.解析:(Ⅰ)这1000名会员中健步走的步数在3,5)内的人数为0.02⨯2⨯1000=40;健步走的步数在5,7)内的人数为0.03⨯2⨯1000=60;健步走的步数在7,9)内的人数为0.05⨯2⨯1000=100;健步走的步数在9,11)内的人数为0.05⨯2⨯1000=100;[[[[40+60+100+100=300.所以这1000名会员中健步走的步数少于11千步的人数为300人.从6人中随机抽取2人,有a 1a 2,a 1a 3,a 1b 1,a 1b 2,a 1c ,a 2a 3,a 2b 1,a 2b 2,a 2c ,a 3b 1,a 3b 2,a 3c ,b 1b 2,b 1c ,b 2c 共15种方法.所以从6人中随机抽取2人,这2人的积分之和不少于200分的有a 1b 1,a 1b 2,a 1c ,a 2b 1,a 2b 2,a 2c ,a 3b 1,a 3b 2,a 3c ,b 1b 2,b 1c ,b 2c 共12种方法.设从6人中随机抽取2人,这2人的积分之和不少于200分为事件A ,则P (A )=124=.155所以从6人中随机抽取2人,这2人的积分之和不少于200分的概率为(Ⅲ)中位数为4.537.3。
2018版高考一轮总复习数学(理)习题第9章 统计、统计案例及算法初步9-2含答案
(时间:40分钟)1.PM2.5是指大气中直径小于或等于2。
5微米的颗粒物,一般情况下PM2.5浓度越大,大气环境质量越差.如图所示的茎叶图表示的是某市甲、乙两个监测站连续10日内每天的PM2。
5浓度读数(单位:μg/m3),则下列说法正确的是( )A.甲、乙监测站读数的极差相等B.乙监测站读数的中位数较大C.乙监测站读数的众数与中位数相等D.甲、乙监测站读数的平均数相等答案C解析因为甲、乙监测站读数的极差分别为55,57,所以A错误;甲、乙监测站读数的中位数分别为74,68,所以B错误;乙监测站读数的众数与中位数都是68,所以C正确,因此选C.2.某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,得到频率分布直方图如图所示,其中样本数据分组区间为,则频率分布直方图中a的值为( )A.0.005 B.0。
006C.0。
05 D.0.06答案B解析因为(0。
004+a+0.018+0.022×2+0。
028)×10=1,所以a=0.006.选B.3.如图是某电视台综艺节目举办的挑战主持人大赛上七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A.84,4.8 B.84,1。
6C.85,4 D.85,1.6答案D解析去掉最高分和最低分后,所剩数据的平均数为错误!=80+错误!(4×3+6+7)=85,方差为s2=错误!=1。
6。
4.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差答案C解析甲的平均数是错误!=6,中位数是6,极差是4,方差是错误!=2;乙的平均数是错误!=6,中位数是5,极差是4,方差是错误!=错误!,故选C.5.设样本数据x1,x2,…,x10的均值和方差分别为1和4,若y i=x i+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为( )A.1+a,4 B.1+a,4+aC.1,4 D.1,4+a答案A解析由均值和方差的定义及性质可知:错误!=错误!+a=1+a,s2y=s错误!=4,故选A。
(完整版)频率分布直方图和茎叶图练习
频率分别直方图与茎叶图练习题1第三组的频数和频率分别是 ( ) A .14和0.14 B .0.14和14 C .141和0.14 D . 31和1412.为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了(1)求出表中,,,m n M N 所表示的数分别是多少? (2)画出频率分布直方图.(3)全体女生中身高在哪组范围内的人数最多?3.200辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,则时速在[60,70)的汽车大约有( ) (A) 30辆 (B) 40辆(C) 60辆(D) 80辆)4年降水量/mm [ 100, 150 ) [ 150, 200 ) [ 200, 250 ) [ 250, 300 ] 概率0.21 0.16 0.13 0.125.如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.5---89.5这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格)6. 某班有50名学生,在学校组织的一次数学质量抽测中,如果按照抽测成绩的分数段[60,65),[65,70),…[95,100)进行分组,得到的分布情况如图所示.求:(Ⅰ)该班抽测成绩在[70,85)之间的人数;(Ⅱ)该班抽测成绩不低于85分的人数占全班总人数的百分比.5101520成绩人数60 65 70 75 80 85 90 95 1007 观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在(]2700,3000的频率为8 从两个班中各随机的抽取10名学生,他们的数学成绩如下:画出茎叶图9.某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:cm)(1)列出频率分布表;(2)画出频率分布直方图;(3)估计数据落在[150,170]范围内的概率。
频率分布直方图-2018届高三理科数学精品复习讲义与跟踪训练含解析
频率分布直方图-2018届高三理科数学精品复习讲义与跟踪训练教师版I .题源探究·黄金母题【例1】若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是 ( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92 【答案】A【例2】如图是某城市100位居民去年的月均用水量(单位:t )的频率分布直方图,月均用水量在区间[)1.5,2.5的居民大约有 ( )A .37位B .40位C .47位D .52位 【答案】C【解析】由频率分布直方图月均用水量在区间[)1.5,2的频率为0.450.50.225⨯=,月均用水量在区间[)2,2.5的居民的频率 为精彩解读【试题来源】例1:人教A 版必修3P 70改编;例2:人教A 版必修3P 65例题改编.【母题评析】这类题主要考查平均数、方差的计算以及茎叶图与频率分布直方图的简单应用. 【思路方法】用样本估计总体是统计的基本方法:(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.0.50050.25⨯=..月均用水量在区间[)1.5,2.5的居民的频数大约为()0.2250.2510047+⨯=,故选C.II.考场精彩·真题回放【例1】【2017高考新课标3理3】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳【答案】A客量波动性大,D选项正确.故选A.【例2】【2017高考新课标1文2】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差【命题意图】这类重点题考查分层抽样和系统抽样的计算.考查考生基本计算能力.【考试方向】这类试题在考查题型上,主要以选择题或填空题为主,属于中低档题.【难点中心】1.将频率分布直方图中相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图,频率分布折线图的的首、尾两端取值区间两端点须分别向外延伸半个组距,即折线图是频率分布直方图的近似,他们比频率分布表更直观、形象地反映了样本的分布规律.2.分清几个样本特征数:众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;平均数:反应一组数据的平均水平;方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数【答案】B【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B.【例3】【2017高考山东文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A.3,5 B.5,5 C.3,7 D.5,7【答案】A得3x .故选A.【例4】【2017高考北京文17】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.3.用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直观.4.频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率; (Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数学不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例. 【答案】(Ⅰ)0.4;(Ⅱ)20;(Ⅲ):32.(Ⅱ)根据题意,样本中分数不小于50的频率为(0.010.020.040.02)100.9+++⨯=,分数在区间[40,50)内的人数为1001000.955-⨯-=.所以总体中分数在区间[40,50)内的人数估计为540020100⨯=. (Ⅲ)由题意可知,样本中分数不小于70的学生人数为(0.020.04)1010060+⨯⨯=,所以样本中分数不小于70的男生人数为160302⨯=. 所以样本中的男生人数为30260⨯=,女生人数为1006040-=,男生和女生人数的比例为60:403:2=.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3:2.III .理论基础·解题原理⑴一表二图:①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1. ⑵茎叶图:①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等. ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写.3.总体特征数的估计: ⑴平均数:nx x x x x n++++=321;取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211;注意:频率分布表计算平均数要取组中值.⑵方差与标准差:一组样本数据n x x x ,,,21 方差:212)(1∑=-=ni ix xns ;标准差:21)(1∑=-=ni ix xns注:方差与标准差越小,说明样本数据越稳定.平均数反映数据总体水平;方差与标准差反映数据的稳定水平.IV .题型攻略·深度挖掘【考试方向】这类试题在考查题型上,通常以选择题或填空题的形式出现,难度中等. 【技能方法】1.解题模板:第一步,根据频率分布直方图计算出相应的频率;第二步,运用样本的频率估计总体的频率;第三步,得出结论.2.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.3.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大. 4.茎叶图、频率分布表和频率分布直方图都可直观描述样本数据的分布规律. 【易错指导】1.在使用茎叶图时,一定要注意看清楚所有的样本数据,弄清楚这个图中的数字特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.3.直方图与条形图不要搞混频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.V .举一反三·触类旁通考向1 茎叶图及其应用【例1】【2018黑龙江齐齐哈尔高三第一次模】某校连续12天对同学们的着装进行检查,着装不合格的人数用茎叶图表示,如图,则该组数据的中位数是A .24B .26C .27D .32 【答案】CC . 【例2】【2018江西上饶高三下学期二模】如图1是某学习小组学生在某次数学考试中成绩的茎叶图,1号到20号同学的成绩依次为1220,,,a a a ,图2是统计茎叶图中成绩在一定范围内的学生人数的程序框图,那么该框图的输出结果是( )A .8B .9C .11D .12 【答案】A【例3】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.【答案】(1)75,75;(2)0.1,0.16;(3)该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.规律方法(1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.(2)①作样本的茎叶图时先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.②根据茎叶图中数据数字特征进行分析判断考查识图能力,判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.【跟踪练习】1.【2018河南安阳高三二模】在某校连续5次考试成绩中,统计甲,乙两名同学的数学成绩得到如图所示的茎叶图.已知甲同学5次成绩的平均数为81,乙同学5次成绩的中位数为73,则x y+的值为()A.3B.4C.5D.6【答案】A【解析】77 81+=因为乙同学5次成绩的中位数为73,所以33,y x y =∴+=选A .2.【2018山西平遥中学高三3月高考适应性调研】某学校A 、B 两个班的数学兴趣小组在一次数学对抗赛中的成绩绘制茎叶图如下,通过茎叶图比较两班数学兴趣小组成绩的平均值及方差①A 班数学兴趣小组的平均成绩高于B 班的平均成绩 ②B 班数学兴趣小组的平均成绩高于A 班的平均成绩 ③A 班数学兴趣小组成绩的标准差大于B 班成绩的标准差 ④B 班数学兴趣小组成绩的标准差大于A 班成绩的标准差 其中正确结论的编号为( )A .①③B .①④C .②③D .②④ 【答案】B【解析】A 班:53,63,64,76,74,78,78,76,81,85,86,88,82,92,95;B 班:45,48,51,3.【2018湖北武汉武昌区高三1月调研】将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为91,现场作的7个分数的茎叶图有一个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为________.【答案】6 【解析】依题意8793909190915x +++++=,解得4x =.则方差为1641965+++=.【名师点睛】本题主要考查茎叶图的分辨,考查平均数的计算,考查方差的计算.从茎叶图可以看出最低分是87,最高分是99,去掉这两个分数后,可利用平均数的公式列方程来求出x 的值.根据前面求出的值再利用方差的计算公式()211n i i x x n =-∑来计算方差.考向2 频率分布直方图【例4】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A .56B .60C .120D .140【答案】D【解析】由频率分布直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140,故选D .【例5】某校从高一年级学生中随机抽取100名学生,将他们期中考试的数学成绩(均为整数)分成六段:[40,50),[50,60),…,[90,100]后得到频率分布直方图(如下图所示),则分数在[70,80)内的人数是 .【答案】30【解析】由频率分布直方图知小长方形面积为对应区间概率,所有小长方形面积和为1,因此分数在[70,80)内的概率为3.010)005.0010.02015.0025.0(1=⨯++⨯+-,人数为301003.0=⨯ 【例6】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.【答案】(1)0.30;(2)36 000;(3)2.04.(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.【名师点睛】(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率和条形图混淆.(2)“命题角度二”的例题中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.而利用频率分布直方图可以估计总体分布.【跟踪练习】1.【2018江西高三毕业班新课程教学质量监测】如图是60名学生参加数学竞赛的成绩(均为整数)的频率分布直方图,估计这次数学竞赛的及格率(60分及以上为及格)是()A .0.9B .0.75C .0.8D .0.7 【答案】B同样可得,60分及以上的频率=(0.015+0.03+0.025+0.005)×10=0.75 估计这次数学竞赛竞赛的及格率(大于或等于60分为及格)为75%, 故选:B .【名师点睛】利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.【2018贵州黔东南州联考】近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图,其中年龄在[)30,40岁的有2500人,年龄在[)20,30岁的有1200人,则m 的值为( )A .0.013B .0.13C .0.012D .0.12 【答案】C3.【2018河南六市高三第一次联考(一模)】为了解学生在课外活动方面的支出情况,抽取了n 个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[]10,50,其中支出金额在[]30,50的学生有117人,频率分布直方图如图所示,则n =( )A .180B .160C .150D .200 【答案】A【解析】[]30,50对应的概率为()10.010.025100.65-+⨯=,所以117=1800.65n =,选A . 4.一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[)2500,3500(元)月收入段应抽出 人.【答案】40【解析】由图(2500,3500元/月)收入段的频率是0.0005×500+0.0003×500=0.4,故用分层抽样方法抽出100人作进一步调查,则在(2500,3500元/月)收入段应抽出人数为0.4×100=40. 考向3 样本的数字特征【例7】【2018内蒙古呼和浩特高三第一次质量调研】如图为某班35名学生的投篮成绩(每人投一次)的条形统计图,其中上面部分数据破损导致数据不完全.已知该班学生投篮成绩的中位数是5,则根据统计图,无法确定下列哪一选项中的数值( )A .3球以下(含3球)的人数B .4球以下(含4球)的人数C .5球以下(含5球)的人数D .6球以下(含6球)的人数 【答案】C【解析】因为共有35人,而中位数应该是第18个数,所以第18个数是5,从图中看出第四个柱状图故选C .【例8】【2018湖南衡阳高三第二次联考(二模)】已知样本12,,,n x x x 的平均数为x ;样本12,,,m y y y 的平均数为()y x y ≠,若样本12,,,n x x x ,12,,,m y y y 的平均数()z ax 1a y =+-;其中,则()*,,n m n m N ∈的大小关系为( ) A .n m = B .n m ≥ C .n m < D .n m > 【答案】C102a <<C . 这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b )(a ,b ),(a ,b ),(a ,b ),(a ,b ).其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.(2)记E ={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),共7个.因此事件E 发生的频率为715.用频率估计概率,即得所求概率为P (E )=715.【名师点睛】(1)平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行平均数与方差的计算,关键是正确运用公式;(2)平均数与方差所反映的情况有着重要的实际意义,一般可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种可以做出评价或选择. 【跟踪练习】1.【2018贵州黔东南州高三下学期二模】甲乙两名同学6次考试的成绩统计如下图,甲乙两组数据的平均数,标准差分别为σσ甲乙,,则ABCD 【答案】C中数据显示甲同学的成绩比乙同学稳定,故σσ<甲乙.故选C .2.【2018云南昆明高三教学质量检查(二统)】“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.“搜索指数”越大,表示网民对该关键词的搜索次数越多,对该关键词相关的信息关注度也越高.下图是2017年9月到2018年2月这半年中,某个关键词的搜索指数变化的走势图.根据该走势图,下列结论正确的是( )A .这半年中,网民对该关键词相关的信息关注度呈周期性变化B .这半年中,网民对该关键词相关的信息关注度不断减弱C .从网民对该关键词的搜索指数来看,去年10月份的方差小于11月份的方差D .从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值 【答案】D【解析】根据走势图可知:这半年中,网民对该关键词相关的信息关注度不呈周期性变化,A 错;这半年中,网民对该关键词相关的信息关注度增减不确定,B 错;从网民对该关键词的搜索指数来看,去年10月份的搜索指数的稳定性小于11 月份的搜索指数的稳定性,所以去年10月份的方差大于11 月份的方差,C 错;从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值,D正确,故选D.3.【2018陕西榆林高三二模】为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2016年1月至2017年7月的调查数据得出的中国仓储指数,绘制出如下的折线图.根据该折线图,下列结论正确的是()A.2016年各月的合储指数最大值是在3月份B.2017年1月至7月的仓储指数的中位数为55C.2017年1月与4月的仓储指数的平均数为52D.2016年1月至4月的合储指数相对于2017年1月至4月,波动性更大D【答案】则这5 天中,每天最高气温较为稳定(方差较小)的城市为_______.(填甲或乙). 【答案】甲【解析】甲、乙两个城市的最高气温平均值都是30,甲的方差为(方差较小)的城市为甲,故答案为甲.5.【2018山东枣庄高三二模】随着高校自主招生活动的持续开展,我市高中生掀起了参与数学兴趣小组的热潮.为调查我市高中生对数学学习的喜好程度,从甲、乙两所高中各随机抽取了40名学生,记录他们在一周内平均每天学习数学的时间,并将其分成了6个区间:(]0,10、(]10,20、(]20,30、(]30,40、(]40,50、(]50,60,整理得到如下频率分布直方图:根据一周内平均每天学习数学的时间t ,将学生对于数学的喜好程度分为三个等级:(Ⅰ)试估计甲高中学生一周内平均每天学习数学的时间的中位数m 甲(精确到0.01);(Ⅱ)判断从甲、乙两所高中各自随机抽取的40名学生一周内平均每天学习数学的时间的平均值及方差2S 甲与2S 乙的大小关系(只需写出结论)、2S 甲(同一组中的数据用该组区间的中点值作代表);(Ⅲ)从甲高中与乙高中随机抽取的80名同学中数学喜好程度为“痴迷”的学生中随机抽取2人,求选出的2人中甲高中与乙高中各有1人的概率.【答案】(Ⅰ) 26.67m ≈甲;(Ⅱ)答案见解析;(Ⅲ)【解析】试题分析:()11026.67⨯≈;()2根据所给数据求出,2S 甲,2S 乙,然后对比即可得到答案;()3求出甲高中随机选取的40名学生中“痴迷”的学生的个数,记为1A ,2A ;乙高中随机选取的40名的概率解析:(Ⅰ)由样本估计总体的思想,甲高中学生一周内平均每天学习数学的时间的中位数1026.67⨯≈;;22S S >甲乙;350.2450.15550.0527.5+⨯+⨯+⨯=;()()21527.5400.2+-⨯⨯ ()()22527.5400.3+-⨯⨯ ()()23527.5400.2+-⨯⨯ ()()24527.5400.15+-⨯⨯ ()()25527.5400.05]+-⨯⨯178.75=.(Ⅲ)甲高中随机选取的40名学生中“痴迷”的学生有()400.005102⨯⨯=人,记为1A ,2A ;乙高中随机选取的40名学生中“痴迷”的学生有()400.015106⨯⨯=人,记为1B ,2B ,3B ,4B ,5B ,6B .随机选出2人有以下28种可能:()12,A A ,()11,A B ,()12,A B ,()13,A B ,()14,A B ,()15,A B ,()16,A B , ()21,A B ,()22,A B ,()23,A B ,()24,A B ,()25,A B ,()26,A B ,()12,B B , ()13,B B ,()14,B B ,()15,B B ,()16,B B ,()23,B B ,()24,B B ,()25,B B , ()26,B B ,()34,B B ,()35,B B ,()36,B B ,()45,B B ,()46,B B ,()56,B B ,所以,从甲、乙两所高中数学喜好程度为“痴迷”的同学中随机选出2人,选出的2人中甲、乙两所高中各有16.【2018海南高三第二次联合考试】从某小区抽取50户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如下.(1)求频率分布直方图中x 的值并估计这50户用户的平均用电量;(2)若将用电量在区间[)50,150内的用户记为A 类用户,标记为低用电家庭,用电量在区间[)250,350内的用户记为B 类用户,标记为高用电家庭,现对这两类用户进行问卷调查,让其对供电服务进行打分,打分情况见茎叶图:①从B 类用户中任意抽取1户,求其打分超过85分的概率;②若打分超过85分视为满意,没超过85分视为不满意,请填写下面列联表,并根据列联表判断是否有95%的把握认为“满意度与用电量高低有关”?附表及公式:,n a b c d =+++.【答案】(1)0.0044x =,186(2【解析】试题分析:(1)由矩形面积和为1,求得x ,再由每一个矩形的中点横坐标乘以矩形面积求和可得平均值;试题解析: 解:(120.0012)0.0044⨯+=, 按用电量从低到高的六组用户数分别为6,9,15,11,6,3, 186=度.(2)①B 类用户共9人,打分超过85分的有6人,所以从B 类用户中任意抽取3户,恰好有2户打分超过85 ②因为2K 的观测值 1.6 3.841=<,所以没有95%的把握认为“满意与否与用电量高低有关”. 【名师点睛】利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.。
【高中数学】10.3考点2 茎叶图及其运用
第十章 算法初步、统计与统计案例第三节 用样本估计总体考点2 茎叶图及其运用(2018·全国卷Ⅲ(理))某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表;(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),.【解析】(1)第二种生产方式的效率更高.理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80 min ;用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79 min.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min ;用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知,用第一种生产方式的工人完成生产任务平均所需时间高于80 min ;用第二种生产方式的工人完成生产任务平均所需时间低于80 min.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.(2)由茎叶图知m =79+812=80.列联表如下:(3)因为K 2=40(15×15−5×5)520×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.【答案】见解析(2018·江苏卷)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.【解析】这5位裁判打出的分数分别是89,89,90,91,91,因此这5位裁判打出的分数的平均数为89+89+90+91+915=90. 【答案】90。
2018-2019数学新学案同步必修三苏教版讲义:第2章 统计2.2.3 Word版含答案
2.2.3茎叶图学习目标 1.了解茎叶图的概念,会画茎叶图.2.了解频率分布直方图、频率折线图、茎叶图的各自特征,学会选择不同的方法分析样本的分布,从而作出总体估计.知识点茎叶图思考茎叶图是表示样本数据分布情况的一种方法,那么“茎”、“叶”分别指的是哪些数?答案茎是指中间的一列数,叶就是从茎的旁边生长出来的数.梳理茎叶图的定义:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.优点:它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.缺点:当样本数据较多时,枝叶就会很长,茎叶图就显得不太方便.1.对于两位数的茎叶图,中间的数字表示十位数,旁边的数字表示个位数.(√) 2.对于三位数的茎叶图,中间的数字表示百位数.旁边的数字表示十位和个位数.(×) 3.茎叶图的茎相当于频率分布表中的分组,茎上叶的数目相当于频率分布表中指定区间组的频数.(√)类型一茎叶图及其绘制例1有关部门从甲、乙两城市所有自动售货机中分别随机抽取了16台,记录了上午8∶00~11∶00间各自销售情况(单位:元):甲:18,8,10,43,30,10,22,6,27,25,58,5,14,18,30,41;乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23.试列出两个城市销售情况的茎叶图.解画出两个城市销售情况的茎叶图,把茎放在中间共用,叶分列左、右两侧.反思与感悟茎叶图的制作步骤:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.跟踪训练1某赛季甲、乙两名篮球运动员每场得分情况如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50.乙的得分:8,13,14,16,23,26,28,33,38,39,51,9,17.用茎叶图表示上面的数据.解如图所示的茎叶图中,中间的数字表示两位运动员得分的十位数,两边的数字分别表示两个人各场比赛得分的个位数.类型二茎叶图的画法及应用例2某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产量数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,44 5,451,454.品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,41 6,422,430.(1)画出茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,得出统计结论.解(1)茎叶图如图.(2)样本容量不大,画茎叶图很方便,此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息丢失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A亩产量的平均数比品种B亩产量的平均数大;②品种A的亩产量波动比品种B的亩产量波动大,故品种A的亩产量稳定性较差.反思与感悟利用茎叶图进行样本分析的角度及图形特点(1)角度:要从数据分布的对称性、中位数、稳定性、平均数等几个方面来比较.(2)图形特点:平均水平:大茎上的叶多,则平均值大;大茎上的叶少,则平均值小.分散程度:看叶集中在几个茎上,还是分散在多个茎上.跟踪训练2某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579根据两组数据作出两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).解两地区用户满意度评分的茎叶图如图:通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.类型三茎叶图与频率分布直方图的综合应用例3在某市的青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分布直方图都受到不同程度的破坏,可见部分如图所示,据此回答以下问题:求参赛总人数和频率分布直方图中[80,90)矩形的高,并补全频率分布直方图.解由茎叶图知,分数在[50,60)的频数为2.由频率分布直方图知,分数在[50,60)的频率为0.008×10=0.08,=25.所以参赛总人数为20.08所以分数在[80,90)的人数为25-2-7-10-2=4,=0.16,所以分数在[80,90)的频率为425故频率分布直方图中[80,90)矩形的高为0.16=0.016.10补全频率分布直方图,如图所示.反思与感悟茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录,但样本容量较大,或者需要比较三组以上的数据时,使用茎叶图就不合适;而频率分布表和频率分布直方图可以处理样本容量很大的数据,但损失了样本的原始数据,而且必须在完成抽样后才能制作.跟踪训练3某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是下列所给直方图中的________.(填序号)答案①解析方法一由题意知样本容量为20,组距为5.列表如下:观察各选项的频率分布直方图知应为①.方法二由茎叶图知落在区间[0,5)与区间[5,10)上的频数相等,故频率、频率组距也分别相等,比较四个直方图知①正确.1.数据123,127,131,151,157,135,129,138,147,152,134,121,142,143的茎叶图中,茎应取__________.答案12,13,14,15解析在茎叶图中叶应是数据中的最后一位,从而茎就确定了.2.在茎叶图中比40大的数据有________个.答案3解析由茎叶图中知比40大的有47,48,49,共3个.3.已知某工厂工人在6月份每天加工的零件个数的茎叶图如图所示(以零件个数的百位、十位数字为茎,个位数字为叶),那么该工厂工人在该月内加工的零件个数超过130的天数所占的百分比为________.答案10%4.某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是________.答案2解析去掉最低分87,去掉最高分94(假设x≤4),则7×91=80×2+9+8+90×5+2+3+2+1+x,所以x=2,符合题意.同理可验证x>4不合题意.5.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.答案4解析由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.1.估计总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录;而频率分布表和频率分布直方图则损失了样本的原始信息,必须在完成抽样后才能制作.3.正确利用三种分布的描述方法,都能得到一些有关分布的主要特点(如分布是否具有单峰性、是否具有对称性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响比较小,更接近于总体分布相应的特点.一、填空题1.下面的茎叶图,表示的数据为________________.答案8,11,11,12,21,24,29,50,52解析由茎叶图的制作方法知,数据为8,11,11,12,21,24,29,50,52.2.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.根据茎叶图判断________班的平均身高较高.答案乙解析由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间.因此乙班平均身高高于甲班.3.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________,________.答案4546解析 甲组数据为28,31,39,42,45,55,57,58,66,中位数为45. 乙组数据为29,34,35,42,46,48,53,55,67,中位数为46.4.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天中甲、乙两人日加工零件的平均数分别为________和________.答案 24 23 解析 x 甲=110(10×2+20×5+30×3+17+6+7)=24, x乙=110(10×3+20×4+30×3+17+11+2)=23. 5.一次选拔运动员,测得7名选手的身高(单位:cm)分布茎叶图为1718⎪⎪⎪0 3 x 8 90 1记录的平均身高为177 cm ,有一名候选人的身高记录不清楚,其末位数记为x ,那么x 的值为________. 答案 8解析 由茎叶图可知10+11+3+x +8+97=7,解得x =8.6.甲、乙两个小组各8名同学的英语口语测试成绩的茎叶图如图所示.甲、乙两组的平均数与中位数之差较大的组是________.答案 乙解析 由茎叶图可知,甲的平均数和中位数分别是83.625和83.5,乙的平均数和中位数分别是82.25和81,故乙的平均数和中位数的差较大.7.参加CBA 2016~2017赛季的甲、乙两支球队,统计两队队员的身高(单位:cm)茎叶图如下(以十位百位为茎,个位为叶):则由图知________队队员的身高更整齐些.答案甲解析由茎叶图知甲队身高大部分是2米零几,而乙队身高比较分散.8.某中学高一(2)班甲、乙两名同学自高中以来每次考试成绩的茎叶图如图,则________同学发挥较稳定,平均成绩________同学较高.(填“甲”“乙”)答案乙乙解析从茎叶图可知乙同学的成绩在80~90分分数段的有9次,而甲同学的成绩在80~90分分数段的只有7次;再从题图上还可以看出,乙同学的成绩集中在90~100分分数段的最多,而甲同学的成绩集中在80~90分分数段的最多.故乙同学发挥较稳定且平均成绩也比甲同学高.9.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数分别是________.答案46,45解析由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45.10.空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数约为________.(该年为365天)答案 146解析 该样本中AQI 大于100的频数是4,频率为25,由此估计该地全年AQI 大于100的频率为25,估计此地该年AQI 大于100的天数约为365×25=146.11.某篮球队的甲、乙两人练习罚球,每人练习10组,每组罚球40个,命中个数的茎叶图如图所示,则罚球命中率较高的是________(填“甲”“乙”).答案 甲解析 由茎叶图知甲每组进球数集中在20多个,乙每组进球数集中在10多个,故罚球命中率较高的是甲. 二、解答题12.参加某赛季的甲、乙两支球队,统计两队队员的身高(单位:cm)如下: 甲队队员:194,187,199,207,203,205,209,199,183,215,219,206,201,208; 乙队队员:179,192,218,223,187,194,205,207,185,197,199,209,214,189. (1)用茎叶图表示两队队员的身高;(2)根据茎叶图判断哪个队队员的身高整齐一些. 解 (1)茎叶图如下(以十位和百位为茎,个位为叶):(2)甲队队员的身高整齐一些.13.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?解(1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.三、探究与拓展14.某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.解甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的;甲同学的得分情况除一个特殊得分外,也大致对称,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.15.甲、乙两个网站为了了解各自受欢迎的程度,分别随机选取了14天记录上午8:00~10:00间各自的点击量:甲:73,24,58,72,64,38,66,70,20,41,55,67,8,25;乙:12,37,21,5,54,52,61,45,19,6,19,36,42,14.你能用哪些方法表示上面的数据?你认为甲、乙两个网站哪个更受欢迎?解方法一列频数分布表如下:由频数分布可以看出,甲网站的点击量多集中在[50,80]上,而乙网站的点击量多集中在[0,60)上,从数据的分布情况来看,甲网站更受欢迎.方法二画出茎叶图如图所示.由茎叶图可以看出,甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方.从数据的分布情况来看,甲网站更受欢迎.。
6章2节
基础知识梳理
由于上式含绝对值, 运算不太方便, 因此, 通常改为如下公式来计算标准差: s = 1 2 2 2 [( x 1- x ) +(x2- x ) +„+(xn- x ) ] n . (5)方差:从数学的角度考虑,有时 用标准差的平方 s2(方差)来代替标准差, 作为衡量样本数据离散程度的工具, s2 1 = n [(x1 - x )2 + (x2 - x )2 + „ + (xn - x )2].
课堂互动讲练
【点评】 一般用频率分布直方图反映样 本的频率分布,从而对总体的频率分布作出估 计.其具体步骤如下: ①将数据分组,确定合适的组距,列出频 率分布表,本题中已经给出频率分布表;②明 确纵、横轴的意义,纵轴表示 ,频率= ,横 轴表示样本数据,画出直方图;③直方图中每 一个小长方形的面积是样本数据落在这个区间 上的频率,所有的小长方形的面积之和等于1, 即频率之和为1,由此可以估计样本数据落在 某个区间的频率或概率或者总体的数字特征.
三基能力强化
1.200辆汽车经过某一雷达地区, 时速频率分布直方图如图所示,则时速 不低于60 km/h的汽车为________辆.
三基能力强化
解析:由频率分布直方图得时速不 低于60 km/h的车辆数为(0.028×10+0.01 0×10)×200=76. 答案:76
三基能力强化
2.某射手在一次训练中五次射击的 成绩分别为9.4,9.4,9.4,9.6,9.7,则该射 手成绩的方差是________.
2018高考数学真题 文科 10.3考点3 频率分布直方图及其运用
第十章算法初步、统计与统计案例第三节用样本估计总体考点3 频率分布直方图及其运用(2018·全国Ⅰ卷(文))某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)【解析】(1)如图所示.(2)根据以上数据,该家庭使用节水龙头后50天中日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=1×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.50该家庭使用了节水龙头50天日用水量的平均数为x2=1×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.50估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).【答案】见解析。
高二数学必修3第二章茎叶图与频率分布
统计跨越导练1. 为了了解某校高三学生视力情况,随机抽查了该校100名高三学生的视力情况,得到频但知道前4组的频数,每一个与前一个的比为 常数,后5组的频率,每一个与前一个的差为 常数,设最大的频率为a ,视力在4.6到5.0之间的学生数为b ,则a,b 的值分别为( ).A.0.27,78B. 0.27,83C. 27,78D. 2.7,832.在样本频率分布直方图中,共有11个小矩形,若中间一个的面积等于其余面积和的14,且样本容量为160,则中间一组的频数为 .3.为了了解高中学生的体能情况,抽了100名学生进行引体向上次数测试,将所得数据整理后,画出频率分布直方图如下图所示,图中从左到右依次为第1,2,3,4,5组.(1)第1组的频率为_____,频数为______.(2)若次数在5次(含5次)以上为达标,则达标率约为____.4.有一个容量为60的样本,(60名学生的数学考试成绩),分组情况如表3,将表格补全.5.图1为甲、乙两名同学某次考试中各科成绩(共9科,每科满分皆为100分)的茎叶图:组距由图回答:(1)甲、乙同学的各科成绩的中位数分别为____、____; (2)若60分以下为不及格,大于等于80分为优秀,则乙同学共有_____门课程不及格,_____门课程优秀;(3)甲、乙两个同学相比较,_______偏科现象更明显,________成绩相对好一些.6.如图4,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.589.5 这一组的频数与频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格)7.有一个容量为50 的样本,其数据的茎叶图如图2:图2 (1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图.8. 从两个班中各随机的抽取10名学生,他们的数学成绩如下: 甲班: 76 74 82 96 66 76 78 72 52 68 乙班:86 84 62 76 78 92 82 74 88 85画出茎叶图并分析两个班学生的数学学习情况.甲 乙 4 5 6 7 8 9 105 9 59 8 6 07 42 3 8 5 3 8 9 3 89.为了了解一大片经济林生长情况,随机测量其中100株的底部周长,得到如下数据:(单位:cm )131 103[来100(1)编制频率分布表;(2)绘制频率分布直方图; (3)估计该片经济林中底部周长小于100 cm 的树木约占多少?周长不小于120cm 的树木约占多少?10.从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm ),结果如下:由以上数据设计了茎叶图如图6:7 5 5 0 28 4 5 4 2 29 2 5 8 7 3 3 1 30 4 6 79 4 0 31 2 3 5 5 6 8 8 8 5 5 3 32 0 2 2 4 7 9 7 4 133 1 3 6 7 34 3 2 35 6根据以上茎叶图,对甲、乙两个品种棉花的纤维长度作比较。
2018版高中数学必修三课件:第二章 2-2-3 茎叶图 精品
答案
课堂小结 1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,
因此我们往往用样本的频率分布去估计总体的分布.
2.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估
计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,
用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布
解析答案
1
2
3
4
5
2. 数 据 123,127,131,151,157,135,129,138,147,152,134,121,142,143 的 茎 叶 12、13、14、15 图中,茎应取______________________.
解析 在茎叶图中叶应是数据中的最后一位,从而茎就确定了.
解析答案
两位运动员得分的十位数,两边的数字分别
表示两个人各场比赛得分的个位数.
解析答案
题型二
茎叶图及其应用
例2 某中学甲、乙两名同学最近几次的数学考试成绩情况如下: 甲的得分:95,81,75,89,71,65,76,88,94,110,107; 乙的得分:83,86,93,99,88,103,98,114,98,79,101. 画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
第2章
§ 2.2 总体分布的估计
2.2.3 茎叶图
学习 目标
1.在表示样本数据的过程中,学会画茎叶图.
2.通过实例体会茎叶图的特征,从而恰当地选择茎叶图分析样 本的分布,准确地做出总体估计.
栏目 索引
知识梳理
题型探究 当堂检测
自主学习重点突破 自查自纠源自识梳理自主学习知识点一
茎叶图
1.定义:茎是指中间 的一列数,叶就是从茎的旁边 生长出来的数 . 中
2018版高考数学(人教A版理)一轮复习教师用书 第9章 第3节 用样本估计总体 Word版含解析
第三节用样本估计总体[考纲传真] 1.了解分布的意义与作用,能根据概率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图9-3-1).图9-3-1横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本落在该组内的频率.2.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.样本的数字特征数字特征定义众数在一组数据中,出现次数最多的数据叫做这组数据的众数中位数将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积相等平均数样本数据的算术平均数,即x=x1+x2+…+x nn方差s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2],其中s为标准差1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(2)一组数据的方差越大,说明这组数据越集中. ()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.()[解析](1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.(2)错误.方差越大,这组数据越离散.(3)正确.小矩形的面积=组距×频率组距=频率.(4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故(4)错误.[答案] (1)√ (2)× (3)√ (4)×2.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图9-3-2所示,则这组数据的中位数和平均数分别是( )图9-3-2A .91.5和91.5B.91.5和92 C .91和91.5 D.92和92A [这组数据由小到大排列为87,89,90,91,92,93,94,96. ∴中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.] 3.(2017·南昌二模)如图9-3-3所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20)内的频数是( )图9-3-3A .50B.40 C .30 D.14C [因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在[15,20]的频数为0.3×100=30,故选C.]4.(2016·江苏高考)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.0.1 [5个数的平均数x =4.7+4.8+5.1+5.4+5.55=5.1, 所以它们的方差s 2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.]5.(2017·山东淄博模拟)某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图9-3-4,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.图9-3-42 [170+17×(1+2+x +4+5+10+11)=175, 则17×(33+x )=5,即33+x =35,解得x =2.]样本的数字特征(1)(2015·广东高考)已知样本数据x 1,x 2,…,x n 的均值x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.(2)某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ).其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.①若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差.并比较甲、乙两组的研发水平;②若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.(1)11 [由条件知x =x 1+x 2+…+x n n=5,则所求均值x 0=2x 1+1+2x 2+1+…+2x n +1n =2(x 1+x 2+…+x n )+n n=2x +1=2×5+1=11.] (2)①甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数为x 甲=1015=23.3分方差s 2甲=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-232×10+⎝ ⎛⎭⎪⎫0-232×5=29. 乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数为x 乙=915=35.方差s 2乙=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-352×9+⎝ ⎛⎭⎪⎫0-352×6=625. 因为x 甲>x 乙,s 2甲<s 2乙,所以甲组的研发水平优于乙组.6分②记E ={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),共7个.因此事件E 发生的概率为715.用频率估计概率,即得所求概率为P (E )=715.12分[规律方法] 1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行均值与方差的计算,关键是正确运用公式.2.可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种做出评价或选择.[变式训练1](2017·郑州模拟)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图9-3-5所示的茎叶图.考虑以下结论:图9-3-5①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的序号为()A.①③ B.①④C.②③D.②④B[甲地5天的气温为:26,28,29,31,31,其平均数为x甲=26+28+29+31+315=29;方差为s2甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;标准差为s甲= 3.6.乙地5天的气温为:28,29,30,31,32,其平均数为x乙=28+29+30+31+325=30;方差为s2乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;标准差为s乙= 2.∴x甲<x乙,s甲>s乙.]茎叶图及其应用了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.[解] (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.3分50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.5分(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.8分(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.12分[规律方法] 1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.2.(1)作样本的茎叶图时,先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.(2)根据茎叶图中数据的数字特征进行分析判断,考查识图能力、判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.[变式训练2] (2017·雅礼中学质检)已知甲、乙两组数据如茎叶图9-3-6所示,若两组数据的中位数相同,平均数也相同,那么m +n =________.【导学号:01772364】图9-3-611 [∵两组数据的中位数相同,∴m =2+42=3.又∵两组数据的平均数也相同,∴27+33+393=20+n +32+34+384,∴n =8, 因此m +n =11.]频率分布直方图☞角度1利用分布直方图求频率、频数(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图9-3-7所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()图9-3-7A.56 B.60C.120 D.140D[由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.]☞角度2用频率分布直方图估计总体(2016·四川高考)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图9-3-8所示的频率分布直方图.图9-3-8(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.[解](1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.3分由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.5分(2)由(1),知100位居民每人的月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.8分(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.30×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.12分[规律方法] 1.准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,易误认为纵轴上的数据是各组的频率.2.(1)例3-2中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.(2)利用样本的频率分布估计总体分布.[思想与方法]1.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.(3)茎叶图、频率分布表和频率分布直方图都是用图表直观描述样本数据的分布规律的.[易错与防范]1.使用茎叶图时,要弄清茎叶图的数字特点,切莫混淆茎与叶的含义.2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.3.直方图与条形图不要搞混.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.。
2018届高考数学(理)大一轮复习教师用书第十章第一节统计Word版含解析
第一节统计本节主要包括2个知识点:1.随机抽样;2.用样本估计总体.突破点(一)随机抽样1.简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.2.系统抽样在抽样时,将总体分成均衡的几个部分,然后按照事先确定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样).3.分层抽样在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.4.三种抽样方法的比较1.抽签法的步骤第一步,将总体中的N个个体编号;第二步,将这N个号码写在形状、大小相同的号签上;第三步,将号签放在同一不透明的箱中,并搅拌均匀;第四步,从箱中每次抽取1个号签,连续抽取k次;第五步,将总体中与抽取的号签的编号一致的k个个体取出.2.随机数法的步骤第一步,将个体编号;第二步,在随机数表中任选一个数开始;第三步,从选定的数开始,按照一定抽样规则在随机数表中选取数字,取足满足要求的数字就得到样本的号码.[例1](1)以下抽样方法是简单随机抽样的是()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()C.02 D.01[解析](1)选项A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C 不是简单随机抽样,因为总体的个体有明显的层次;选项D是简单随机抽样.(2)由题意知前5个个体的编号为08,02,14,07,01.[答案](1)D(2)D系统抽样的步骤(1)先将总体的N 个个体编号;(2)确定分段间隔k (k ∈N *),对编号进行分段.当N n (n 是样本容量)是整数时,取k =Nn ; (3)在第1段用简单随机抽样确定第1个个体编号l (l ≤k );(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本.[例2] (1)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11B .12C .13D .14(2)中央电视台为了解观众对《中国好歌曲》的意见,准备从502名现场观众中抽取10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除________个个体,抽样间隔为________.[解析] (1)由系统抽样定义可知,所分组距为84042=20,每组抽取一人,因为包含整数个组,所以抽取个体在区间[481,720]的数目为(720-480)÷20=12.(2)把502名观众平均分成50组,由于502除以50的商是10,余数是2,所以每组有10名观众,还剩2名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从502名观众中抽取2名观众,这2名观众不参加座谈;再将剩下的500名观众编号为1,2,3,…,500,并均匀分成50段,每段含50050=10个个体.所以需剔除2个个体,抽样间隔为10.[答案] (1)B (2)2 10 [易错提醒]用系统抽样法抽取样本,当Nn 不为整数时,取k =⎣⎡⎦⎤N n ,即先从总体中用简单随机抽样的方法剔除(N -nk )个个体,且剔除多余的个体不影响抽样的公平性.分层抽样进行分层抽样的相关计算时,常利用以下关系式巧解:(1)样本容量n 总体的个数N =该层抽取的个体数该层的个体数; (2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.[例3](1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师 1 800青年教师 1 600合计 4 300A.90 B.100C.180 D.300(2)(2016·东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=() A.54 B.90C.45 D.126(3)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).篮球组书画组乐器组高一4530a高二151020个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.[解析](1)设该样本中的老年教师人数为x,由题意及分层抽样的特点得x900=3201 600,故x=180.(2)依题意得33+5+7×n=18,解得n=90,即样本容量为90.(3)由题意知1245+15=3045+15+30+10+a+20,解得a=30.[答案](1)C(2)B(3)30[方法技巧]分层抽样的解题策略(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样. (4)抽样比=样本容量总体容量=各层样本数量各层个体数量.能力练通 抓应用体验的“得”与“失”1.[考点一]某工厂的质检人员对生产的100件产品,采用随机数法抽取10件检查,对100件产品采用下面的编号方法①1,2,3,…,100; ②001,002,…,100; ③00,01,02,…,99; ④01,02,03,…,100. 其中正确的序号是( ) A .②③④ B .③④ C .②③D .①②解析:选C 根据随机数法编号可知,①④编号位数不统一.2.[考点三]为了调查老师对微课堂的了解程度,某市拟采用分层抽样的方法从A ,B ,C 三所中学抽取60名教师进行调查,已知A ,B ,C 三所学校中分别有180,270,90名教师,则从C 学校中应抽取的人数为( )A .10B .12C .18D .24解析:选A 根据分层抽样的特征,从C 学校中应抽取的人数为90180+270+90×60=10.3.[考点二]某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号学生在样本中,那么样本中还有一个学生的学号是( )A .10B .11C .12D .16解析:选D 从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D.4.[考点三]某市有A 、B 、C 三所学校,共有高三文科学生1 500人,且A 、B 、C 三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B校学生中抽取________人.解析:设A、B、C三所学校高三文科学生人数分别为x,y,z,由题知x,y,z成等差数列,所以x+z=2y,又x+y+z=1 500,所以y=500,用分层抽样方法抽取B校学生人数为1201 500×500=40.答案:405.[考点二]为了了解本班学生对网络游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编号为:01,02,03,…,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编号为________.解析:由最小的两个编号为03,09可知,抽取时的分段间隔是6.即抽取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3+9×6=57.答案:57突破点(二)用样本估计总体1.频率分布直方图和茎叶图(1)作频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.2.样本的数字特征(1)众数、中位数、平均数①标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. ②方差:标准差的平方s 2=1n [(x 1-x )2+(x 2-x )2+…+(xn -x )2],其中x i (i =1,2,3,…,n )是样本数据,n是样本容量,x 是样本平均数.③方差与标准差相比,都是衡量样本数据离散程度的统计量,但方差因为对标准差进行了平方运算,夸大了样本的偏差程度.(3)平均数、方差公式的推广若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则数据mx 1+a ,mx 2+a ,…,mx n+a 的平均数为m x +a ,方差为m 2s 2.[例1] (1)(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140(2)某地政府调查了工薪阶层1 000人的月工资收入,并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资收入的满意程度,要用分层抽样的方法从调查的1 000人中抽出100人做电话询访,则(30,35](百元)月工资收入段应抽出________人.[解析] (1)由频率分布直方图知200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.(2)月工资收入落在(30,35](百元)内的频率为1-(0.02+0.04+0.05+0.05+0.01)×5=1-0.85=0.15,所以(30,35](百元)月工资收入段应抽出100×0.15=15(人).[答案] (1)D (2)15 [方法技巧]1.绘制频率分布直方图时需注意的两点(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确; (2)频率分布直方图的纵坐标是频率组距,而不是频率.2.与频率分布直方图计算有关的两个关系式 (1)频率组距×组距=频率; (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数.茎叶图1(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.2.茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.[例2]某良种培育基地正在培育一小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下.品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,4 45,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,4 15,416,422,430(1)作出数据的茎叶图;(2)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.[解](1)画出茎叶图如图所示:(2)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A 的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.[方法技巧]茎叶图问题的求解策略(1)由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表提供的样本数据进行相关的计算或者是对某些问题作出判断.(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图数据求出样本数据的数字特征,进一步估计总体情况.1际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差),分析稳定情况.2.若给出图形,一方面可以由图形得到相应的样本数据,计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性比较方差(标准差)的大小.考法(一)与频率分布直方图交汇命题[例3](2016·北京高考)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图.(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.[解](1)由用水量的频率分布直方图,知该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表如下:根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).[方法技巧]频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考法(二) 与茎叶图交汇命题[例4] (1)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,乙组数据的平均数为17.4,则x ,y 的值分别为( )甲组 乙组 9 0 9 9 y 6 1 6 6 x629 A.7,8 B .5,7 (2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:8 7 7 941x91则7个剩余分数的方差为________.[解析] (1)甲组数据的中位数为17, 故y =7,乙组数据的平均数为3×10+20+(9+6+6+x +9)5=17.4,解得x =7.(2)由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4.s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.[答案] (1)D (2)367[易错提醒]在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.考法(三) 与优化决策问题交汇[例5] 甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲 乙 丙 丁 平均环数x 8.3 8.8 8.8 8.7 方差s 23.53.62.25.4( ) A .甲 B .乙 C .丙D .丁[解析] 由题目表格中数据可知,丙平均环数最高,且方差最小,说明成绩好,且技术稳定,选C.[答案] C [方法技巧]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.能力练通 抓应用体验的“得”与“失”1.[考点一]在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:选D 设中间一组的频数为x ,依题意有x 80=14⎝⎛⎭⎫1-x 80,解得x =16. 2.[考点二]在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.131415⎪⎪⎪⎪0 0 3 4 5 6 6 8 8 8 91 1 12 2 23 34 45 5 56 67 80 1 2 2 3 3 3若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )A .3B .4C .5D .6解析:选B 35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在20÷5=4个小组中,每组取1人,共取4人.3.[考点一]某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x 的值等于( )A .0.12B .0.012C .0.18D .0.018解析:选D 依题意,0.054×10+10×x +0.01×10+0.006×10×3=1,解得 x =0.018. 4.[考点三·考法(二)]如图是某学校举行的运动会上七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )7 9 8 4 4 6 4 793A .84,4.84B .84,1.6C .85,1.6D .85,4 解析:选C 依题意,所剩数据的平均数是80+15×(4×3+6+7)=85,所剩数据的方差是15×[3×(84-85)2+(86-85)2+(87-85)2]=1.6.5.[考点三·考法(三)]甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x -甲=x -乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25, s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定. 答案:甲6.[考点三·考法(一)](2016·四川高考)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由.解:(1)由频率分布直方图可知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a +0.20+0.26+0.5×a +0.06+0.04+0.02=1,解得a =0.30. (2)由(1)知100位居民每人的月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x <3.由0.30×(x -2.5)=0.85-0.73,解得x =2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.7.[考点三·考法(二)]某车间20名工人年龄数据如下表:(1)求这20(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3)求这20名工人年龄的方差.解:(1)由题可知,这20名工人年龄的众数是30,极差是40-19=21.(2)这20名工人年龄的茎叶图如图所示:(3)这20名工人年龄的平均数为x =120(19+3×28+3×29+5×30+4×31+3×32+40)=30,∴这20名工人年龄的方差为s 2=120∑20i =1 (x i -x )2=112+6×22+7×12+5×02+10220=25220=12.6.[全国卷5年真题集中演练——明规律] 1.(2016·全国丙卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个解析:选D由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确;故D错误.2.(2013·新课标全国卷Ⅰ)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样解析:选C由于该地区的中小学生人数比较多,不能采用简单随机抽样,排除选项A;由于小学、初中、高中三个学段的学生视力差异性比较大,可采取按照学段进行分层抽样,而男女生视力情况差异性不大,不能按照性别进行分层抽样,排除B和D.故选C.3.(2014·新课标全国卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解:(1)如图所示:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.4.(2014·新课标全国卷Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.5.(2013·新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?A 药解:(1)设A 药观测数据的平均数为x -,B 药观测数据的平均数为y -.由观测结果可得 x -=120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y -=120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x ->y -,因此可看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎2,3上,而B药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A药的疗效更好.[课时达标检测] 重点保分课时——一练小题夯双基,二练题点过高考[练基础小题——强化运算能力]1.某学校为了了解某年高考数学的考试成绩,在高考后对该校1 200名考生进行抽样调查,其中有400名文科考生,600名理科考生,200名艺术和体育类考生,从中抽取120名考生作为样本,记这项调查为①;从10名家长中随机抽取3名参加座谈会,记这项调查为②,则完成①,②这两项调查宜采用的抽样方法依次是()A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法解析:选B在①中,文科考生、理科考生、艺术和体育类考生会存在差异,采用分层抽样法较好;在②中,抽取的样本个数较少,宜采用简单随机抽样法.2.某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n=()A.660 B.720 C.780 D.800解析:选B由已知条件,抽样比为13780=160,从而35600+780+n =160,解得n=720.3.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123 C.137 D.167解析:选C初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1。
2018届高考(新课标)数学(文)大一轮复习(课件+检测)(基础梳理+热点题型+演练提升)-第十章 统计与
§10.2 用样本估计总体 [考纲要求] 1.了解分布的意义和作用,会列频率分布表,会 画频率分布直方图、频率折线图、茎叶图,理解它们各自的特 点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3. 能从样本数据中提取基本的数字特征(平均数、标准差),并给出 合理解释.4.会用样本的频率分布估计总体的分布,会用样本的 基本数字特征估计总体的基本数字特征,理解用样本估计总体 的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决 一些简单的实际问题.
高考总复习·数学文科(RJ)
h
28
第十章 统计与统计案例
【方法规律】 (1)明确频率分布直方图的意义,即图中 的每一个小矩形的面积是数据落在该区间上的频率,所有 小矩形的面积和为1.
(2)对于统计图表类题目,最重要的是认真观察图表,从 中提炼有用的信息和数据.
高考总复习·数学文科(RJ)
h
29
第十章 统计与统计案例
h
10
6
23
第十章 统计与统计案例
(1)在图②中作出B地区用户满意度评分的频率分布直方 图,并通过直方图比较两地区满意度评分的平均值及分散 程度(不要求计算出具体值,给出结论即可).
B地区用户满意度评分的频率分布直方图
高考总复习·数学文科(RJ)
h
24
第十章 统计与统计案例 (2)根据用户满意度评分,将用户的满意度分为三个等级
是频率比.
(3)频率分布表和频率分布直方图是一组数据频率分布的两
种形式,前者准确,后者直观.
高考总复习·数学文科(RJ)
h
8
第十章 统计与统计案例
6.平均数、方差的公式推广 (1)若数据x1,x2,…,xn的平均数为x,那么mx1+a, mx2+a,mx3+a,…,mxn+a的平均数是mx+a. (2)数据x1,x2,…,xn的方差为s2. ①数据x1+a,x2+a,…,xn+a的方差也为s2; ②数据ax1,ax2,…,axn的方差为a2s2.
高二 茎叶图、直方图统计图的应用(胡达文)(1)
茎叶图、直方图统计图的应用知识梳理教学重、难点作业完成情况典题探究例1 某教师为了了解一次“普法”知识竞赛成绩情况,从800名学生中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表解答下列问题:(1)将频率分布表补全,并作出对应的频率分布直方图; (2)估计成绩在70.5~90.5分的学生的比例; (3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人?分组频数频率 60.5~70.5 0.16 70.5~80.5 10 80.5~90.5 18 0.3690.5~100.5 合计 50例2如图2是总体的一样本频率分布直方图,若[15,18)对应的频数为8,且[12,15)对应的小矩形面积为0.06.(1)求样本容量;(2)求样本在[12,15)内的频数;(3)求样本数据在[18,33)内的频率,并估计总体数据在[18,33)内的频率.例3某赛季甲、乙两名篮球运动员每场比赛的得分记录如下(甲运动员因伤缺席两场):甲运动员得分:13,51,23,8,26,38,16,33,14,28,39; 乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39. 用茎叶图表示两人的成绩,并由图指出哪位运动员的发挥更稳定?例4 为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8点到10点间各自的点击量如图.(1)甲、乙两个网站点击量的极差分别是多少?(2)甲网站点击量[]10,40间的频率是多少?(精确到0.00001) (3)甲、乙两个网站哪个更受欢迎?并说明理由?8 5 4 0 8 1 8 5 7 6 4 3 2 0 5 6 2 4 9 1 6 7 2 2 5 4 1 1 甲 0 1 2 3 4 5 6 7 乙演练方阵A 档(巩固专练)1.用样本频率分布估计总体分布的过程中,下列说法正确的是 ( ). A .总体容量越大,估计越精确 B .总体容量越小,估计越精确C .样本容量越大,估计越精确D .样本容量越小,估计越精确 2.下面对于茎叶图的说法正确的是( ).A .茎叶图不能保留原始数据B .茎叶图不能反映数据的分布情况C .当样本数据比较多时,用茎叶图很方便D .茎叶图可以随时添加数据3.一个容量为20的样本,组距与频数如下:( 10 , 20 ] , 2 ; ( 20 , 30 ] , 3 ; ( 30 , 40 ] , 4 ; ( 40 , 50 ] , 5 ; ( 50 , 60 ] , 4 ; ( 60 , 70 ] , 2 ; 则样本在( 10 , 50 ]上的频率为 ( ). A.120B. 14C. 12D. 7104.下面茎叶图中数据的平均值为14.3,则x y +的值为( ). A .25 B .6 C .33 D .55.图3为一组数据的茎叶图,共14个数据,但有一个数据已模糊不清了,已知这14个数据的中位数为65,则模糊不清的数字为______.6.从一堆苹果中任取了20个,并得到它们的质量(单位:g )数据分布表如表:分组 [)90100, [)100110, [)110120, [)120130, [)130140, [)140150, 频数123101则这堆苹果中,质量小于120克的苹果数约占苹果总数的 %.7.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17岁~18岁的男生体重(kg) ,得到频率分布直方图如图1. 那么,这100名学生中体重在[56.5,64.5]学茎 叶 2x 8 1 35 7 3y 9 0 1 2 茎 叶 0 1 5 7 9 0 __ 7 9 1 3 5 8 0 5 6 7 8生有______人.图18.抽查某班的15名学生在40 min 的课堂上的平均听课时间(单位:min )得到的数据的茎叶图如图5所示,现又抽查了另外5位同学的平均听课时间,其数据为32,15,21,33,30,请将这5个数据追加在茎叶图中.9.为了解某地初三年级男生的身高情况,从其中的一个学校选取容量为60的样本(60名男生的身高),分组情况如表2 ,求出表中a ,m 的值.表210. 12个人戒烟前和戒烟五个星期后的体重如下(单位:kg ) 人员 abcdefghijkl戒烟前 67 80 69 52 52 60 55 54 64 60 48 49 戒烟后708168555762545267585251画出茎叶图并回答下列问题:(1)这12个人戒烟前的体重的中位数和这12个人戒烟五个星期后的体重的众数各是多少?分组 147.5~155.5 155.5~163.5 163.5~171.5 171.5~179.5频数 62lm频率a0.1茎 叶 3 3 4 6 6 7 9 0 1 2 2 3 4 55 123(2)分别计算这12个人戒烟前和戒烟五个星期后的平均体重.B 档(提升精练)1.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图1可知 ( ).A .甲运动员的成绩好于乙运动员B .乙运动员的成绩好于甲运动员C .甲、乙两名运动员的成绩没有明显的差异D .甲运动员的最低得分为0分2.已知样本:10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,10,9,10,11,12,那么频率为0.2的范围是( ).A. 5.5~7.5B. 7.5~9.5C. 9.5~11.5D.11.5~13.53.将一个容量为m 的样本分成3组,已知第一组的频数为10,第二、三组的频率分别为0.35和0.45,则m = .4.从某校的高一学生中采用系统抽样法选出30人测量其身高,数据的茎叶图如图4(单位:cm ):若高一年级共有600人,据上图估算身高在1.70 m 以上的大约有_____人.5. 为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5~18岁男生体重(单位:kg ),得到如图3所示的频率分布直方图:甲 0 1 2 3 4 5 乙 8 247 199 36 25032 875421 944 1 茎 叶 2 5 2 3 3 6 8 3 3 4 5 5 7 7 8 1 2 2 3 3 4 4 4 5 57 88 0 114 15 16 17 18图3根据图3可得这100名学生中体重在[56.5,64.5)内的学生人数是______ _人.6.200辆汽车通过某一段公路的时速的频率分布直方图如图2,则时速在[50,60]的汽车大约有 辆.` 图2 图37.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果可用图3的条形图表示. 根据此图可得这50名学生这一天平均每人的课外阅读时间为____ h.8.如图是某班50名学生身高的频率分布直方图(精确到1cm),从左边起第一、二、三、四个小长方形的高的比为1:3:5:1,那么身高150cm 以下(不含150cm)的学生有多少人?身高为160cm 及160cm 以上的学生占全班学生总数的百分比约为多少?0.5 人数/个 时间/h20 10 50 1.0 1.5 2.0159. 目前,中国的青少年视力水平下降已引起全社会的关注,为了调查了解某中学高三年级1 500名学生的视力情况,从中抽测了一部分学生的视力, 整理数据后,分析数据如下:(1)在这个问题中,总体是 ; (2)填写频率分布表中未完成的部分;(3)若视力为4.9,5.0,5.1均属正常,不需矫正, 试估计该校毕业年级学生视力正常的人数约为多少?10.在同等条件下,对30辆同一型号的汽车进行耗油1L 所行路程的试验,得到如下数据(单位:km ),以前两位数为茎,画出上面数据的茎叶图.(提示:茎叶图中只单侧有数据) 14.1 12.3 13.7 14.0 12.8 12.9 13.1 13.6 14.4 13.8 12.6 13.8 12.6 13.2 13.3 14.2 13.9 12.7 13.0 13.2 13.5 13.6 13.4 13.6 12.1 12.5 13.1 13.5 13.2 13.4C 档(跨越导练)1. 为了了解某校高三学生视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道前4组的频数,每一个与前一个的比为 常数,后5组的频率,每一个与前一个的差为 常数,设最大的频率为a ,视力在4.6到5.0之间的学生数为b ,则a,b 的值分别为( ).A.0.27,78B. 0.27,83C. 27,78D. 2.7,832.在样本频率分布直方图中,共有11个小矩形,若中间一个的面积等于其余面积和的14,且样本容量为160,则中间一组的频数为 .3.为了了解高中学生的体能情况,抽了100名学生进行引体向上次数测试,将所得数据整理后,画出频率分布直方图如下图所示,图中从左到右依次为第1,2,3,4,5组.分 组 频 数 频 率 3.95~4.252 0.04 6 0.12 4.55~4.85 23 4.85~5.15 5.15~5.451 0.02 合计1.00频率分步表4.3 4.4 4.5 4.6 4.7 4.8 4.9 视力频率组距 5.0 5.1 5.2 0.30.1(1)第1组的频率为_____,频数为______.(2)若次数在5次(含5次)以上为达标,则达标率约为____.4.有一个容量为60的样本,(60名学生的数学考试成绩),分组情况如表3,将表格补全. 表3分组 0.5~ 20.5 20.5~ 40.5 40.5~ 60.5 60.5~ 80.5 80.5~ 100.5 频数 3 6 12频率0.35.图1为甲、乙两名同学某次考试中各科成绩(共9科,每科满分皆为100分)的茎叶图:由图回答:(1)甲、乙同学的各科成绩的中位数分别为____、____; (2)若60分以下为不及格,大于等于80分为优秀,则乙同学共有_____门课程不及格,_____门课程优秀;(3)甲、乙两个同学相比较,_______偏科现象更明显,________成绩相对好一些.6.如图4,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.589.5 这一组的频数与频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格)7.有一个容量为50 的样本,其数据的茎叶图如图2:甲 乙 4 5 6 7 8 9 105 9 5 9 86 07 42 3 8 5 3 8 9 3 81 3 4 5 6 6 6 7 8 8 8 8 9 9 92 0 0 0 01 1 2 2 2 2 23 3 34 4 45 5 56 6 6 67 7 78 8 8 93 0 1 1 2 3图2(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图.8. 从两个班中各随机的抽取10名学生,他们的数学成绩如下:甲班: 76 74 82 96 66 76 78 72 52 68乙班: 86 84 62 76 78 92 82 74 88 85画出茎叶图并分析两个班学生的数学学习情况.9.为了了解一大片经济林生长情况,随机测量其中100株的底部周长,得到如下数据:(单位:cm)135 98 102 110 99125 97 117 113 110109 124 87 131 97105 123 111 103 105129 126 97 100 115111 89 110 121 80129 99 90 99 12199 101 116 97 102102 108 117 99 118123 119 98 121 101121 110 96 100 10392 102 109 104 112102 123 104 104 12892 114 108 104 102111 106 117 104 109120 121 104 108 118123 107 111 91 100108 101 95 107 101106 119 97 126 108113 102 103 104 108(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100 cm的树木约占多少?周长不小于120cm的树木约占多少?10.从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:由以上数据设计了茎叶图如图6:甲 乙 3 1 27 7 5 5 0 28 4 5 4 2 29 2 5 8 7 3 3 1 30 4 6 79 4 0 31 2 3 5 5 6 8 8 8 5 5 3 32 0 2 2 4 7 9 7 4 133 1 3 6 7 34 3 2356根据以上茎叶图,对甲、乙两个品种棉花的纤维长度作比较。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
茎叶图与频率分布直方图2018届高三文科数学精品复习讲义与跟踪训练含解析I.题源探究·黄金母题【例1】若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5 B.91.5和92 C.91和91.5 D.92和92【答案】A【例2】如图是某城市100位居民去年的月均用水量(单位:t)的频率分布直方图,月均用水量在区间[)1.5,2.5的居民大约有()A.37位B.40位C.47位D.52位【答案】C【解析】由频率分布直方图月均用水量在区间[)1.5,2的频率为0.450.50.225⨯=,月均用水量在区间[)2,2.5的居民的频率为0.50050.25⨯=..月均用水量在区间[)1.5,2.5的居民的频数大约为()0.2250.2510047+⨯=,故选C.精彩解读【试题来源】例1:人教A版必修3P70改编;例2:人教A版必修3P65例题改编.【母题评析】这类题主要考查平均数、方差的计算以及茎叶图与频率分布直方图的简单应用.【思路方法】用样本估计总体是统计的基本方法:(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.II.考场精彩·真题回放【例1】【2017高考新课标1文2】为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数【答案】B【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B.【例2】【2017高考山东文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A.3,5 B.5,5 C.3,7 D.5,7【答案】A得3x .故选A.【例3】【2017高考北京文17】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:【命题意图】这类重点题考查分层抽样和系统抽样的计算.考查考生基本计算能力.【考试方向】这类试题在考查题型上,主要以选择题或填空题为主,属于中低档题.【难点中心】1.将频率分布直方图中相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图,频率分布折线图的的首、尾两端取值区间两端点须分别向外延伸半个组距,即折线图是频率分布直方图的近似,他们比频率分布表更直观、形象地反映了样本的分布规律.2.分清几个样本特征数:众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;平均数:反应一组数据的平均水平;方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率; (Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数学不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例. 【答案】(Ⅰ)0.4;(Ⅱ)20;(Ⅲ):32.(Ⅱ)根据题意,样本中分数不小于50的频率为(0.010.020.040.02)100.9+++⨯=,分数在区间[40,50)内的人数为1001000.955-⨯-=.所以总体中分数在区间[40,50)内的人数估计为540020100⨯=. (Ⅲ)由题意可知,样本中分数不小于70的学生人数为(0.020.04)1010060+⨯⨯=,所以样本中分数不小于70的男生人数为160302⨯=. 所以样本中的男生人数为30260⨯=,女生人数为1006040-=,男生和女生人数的比例为60:403:2=.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3:2.方差越大,说明数据的波动越大,越不稳定.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.3.用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直观. 4.频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.III .理论基础·解题原理⑴一表二图:①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1. ⑵茎叶图:①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等. ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写. 3.总体特征数的估计: ⑴平均数:nx x x x x n++++=Λ321;取值为n x x x ,,,21Λ的频率分别为n p p p ,,,21Λ,则其平均数为n n p x p x p x +++Λ2211;注意:频率分布表计算平均数要取组中值.⑵方差与标准差:一组样本数据n x x x ,,,21Λ方差:212)(1∑=-=ni ix xns ;标准差:21)(1∑=-=ni ix xns注:方差与标准差越小,说明样本数据越稳定.平均数反映数据总体水平;方差与标准差反映数据的稳定水平.IV .题型攻略·深度挖掘【考试方向】这类试题在考查题型上,通常以选择题或填空题的形式出现,难度中等. 【技能方法】1.解题模板:第一步,根据频率分布直方图计算出相应的频率;第二步,运用样本的频率估计总体的频率;第三步,得出结论.2.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.3.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大. 4.茎叶图、频率分布表和频率分布直方图都可直观描述样本数据的分布规律. 【易错指导】1.在使用茎叶图时,一定要注意看清楚所有的样本数据,弄清楚这个图中的数字特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.3.直方图与条形图不要搞混频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.V .举一反三·触类旁通考向1 茎叶图及其应用【例1】【2018黑龙江齐齐哈尔高三第一次模】某校连续12天对同学们的着装进行检查,着装不合格的人数用茎叶图表示,如图,则该组数据的中位数是A .24B .26C .27D .32 【答案】C 【解析】中位数是24+30272,选C . 【例2】【2018江西上饶高三下学期二模】如图1是某学习小组学生在某次数学考试中成绩的茎叶图,1号到20号同学的成绩依次为1220,,,a a a L ,图2是统计茎叶图中成绩在一定范围内的学生人数的程序框图,那么该框图的输出结果是( )A .8B .9C .11D .12 【答案】A【解析】由算法流程图可知,其统计的是数学成绩不小于100的人数,所以由茎叶图知,数学成绩不小于100的人数为8,因此输出结果为8,故选A .【例3】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对甲、乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲、乙两部门的评价.【答案】(1)75,75;(2)0.1,0.16;(3)该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.【解析】(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.规律方法 (1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况. (2)①作样本的茎叶图时先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.②根据茎叶图中数据数字特征进行分析判断考查识图能力,判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息. 【跟踪练习】1.【2018河南安阳高三二模】在某校连续5次考试成绩中,统计甲,乙两名同学的数学成绩得到如图所示的茎叶图.已知甲同学5次成绩的平均数为81,乙同学5次成绩的中位数为73,则x y 的值为( )A .3B .4C .5D .6 【答案】A 【解析】77728680908105x x +++++=∴=Q因为乙同学5次成绩的中位数为73,所以33,y x y =∴+=选A .2.【2018山西平遥中学高三3月高考适应性调研】某学校A 、B 两个班的数学兴趣小组在一次数学对抗赛中的成绩绘制茎叶图如下,通过茎叶图比较两班数学兴趣小组成绩的平均值及方差①A 班数学兴趣小组的平均成绩高于B 班的平均成绩 ②B 班数学兴趣小组的平均成绩高于A 班的平均成绩 ③A 班数学兴趣小组成绩的标准差大于B 班成绩的标准差 ④B 班数学兴趣小组成绩的标准差大于A 班成绩的标准差 其中正确结论的编号为( )A .①③B .①④C .②③D .②④ 【答案】B【解析】A 班:53,63,64,76,74,78,78,76,81,85,86,88,82,92,95;B 班:45,48,51,3.【2018湖北武汉武昌区高三1月调研】将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为91,现场作的7个分数的茎叶图有一个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为________.【答案】6 【解析】依题意8793909190915x +++++=,解得4x =.则方差为1641965+++=.【名师点睛】本题主要考查茎叶图的分辨,考查平均数的计算,考查方差的计算.从茎叶图可以看出最低分是87,最高分是99,去掉这两个分数后,可利用平均数的公式列方程来求出x 的值.根据前面求出的值再利用方差的计算公式()211n i i x x n =-∑来计算方差.考向2 频率分布直方图【例4】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140【答案】D【例5】某校从高一年级学生中随机抽取100名学生,将他们期中考试的数学成绩(均为整数)分成六段:[40,50),[50,60),…,[90,100]后得到频率分布直方图(如下图所示),则分数在[70,80)内的人数是 .【答案】30【解析】由频率分布直方图知小长方形面积为对应区间概率,所有小长方形面积和为1,因此分数在[70,80)内的概率为3.010)005.0010.02015.0025.0(1=⨯++⨯+-,人数为301003.0=⨯【例6】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; (3)估计居民月均用水量的中位数.【答案】(1)0.30;(2)36 000;(3)2.04.【解析】(1)由频率分布直方图可知:月均用水量在[0,0.5)内的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a ,解得a =0.30.(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x 吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5. 又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x <2.5. 由0.50×(x -2)=0.5-0.48,解得x =2.04.故可估计居民月均用水量的中位数为2.04吨.【名师点睛】(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率和条形图混淆.(2)“命题角度二”的例题中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.而利用频率分布直方图可以估计总体分布.【跟踪练习】1.【2018江西高三毕业班新课程教学质量监测】如图是60名学生参加数学竞赛的成绩(均为整数)的频率分布直方图,估计这次数学竞赛的及格率(60分及以上为及格)是()A.0.9 B.0.75 C.0.8 D.0.7【答案】B【解析】大于或等于60分的共四组,它们是:故选:B.【名师点睛】利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.【2018贵州黔东南州联考】近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图,其中年龄在[)30,40岁的有2500人,年龄在[)20,30岁的有1200人,则m 的值为( )A .0.013B .0.13C .0.012D .0.12 【答案】C3.【2018河南六市高三第一次联考(一模)】为了解学生在课外活动方面的支出情况,抽取了n 个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[]10,50,其中支出金额在[]30,50的学生有117人,频率分布直方图如图所示,则n =( )A .180B .160C .150D .200 【答案】A【解析】[]30,50对应的概率为()10.010.025100.65-+⨯=,所以117=1800.65n =,选A .4.一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[)2500,3500(元)月收入段应抽出 人.【答案】40【解析】由图(2500,3500元/月)收入段的频率是0.0005×500+0.0003×500=0.4,故用分层抽样方法抽出100人作进一步调查,则在(2500,3500元/月)收入段应抽出人数为0.4×100=40. 考向3 样本的数字特征【例7】【2018内蒙古呼和浩特高三第一次质量调研】如图为某班35名学生的投篮成绩(每人投一次)的条形统计图,其中上面部分数据破损导致数据不完全.已知该班学生投篮成绩的中位数是5,则根据统计图,无法确定下列哪一选项中的数值( )A .3球以下(含3球)的人数B .4球以下(含4球)的人数C .5球以下(含5球)的人数D .6球以下(含6球)的人数 【答案】C【解析】因为共有35人,而中位数应该是第18个数,所以第18个数是5,从图中看出第四个柱状图故选C .【例8】【2018湖南衡阳高三第二次联考(二模)】已知样本12,,,n x x x L 的平均数为x ;样本12,,,m y y y L 的平均数为()y x y ≠,若样本12,,,n x x x L ,12,,,m y y y L 的平均数()z ax 1a y =+-;其中10a 2<<,则()*,,n m n m N ∈的大小关系为( ) A .n m = B .n m ≥ C .n m < D .n m > 【答案】C 【解析】由题得()11,,n n n z nx my x y a n m n m n m n m ⎛⎫=+=+-∴= ⎪++++⎝⎭110,0,.22n a n m n m <<∴<<∴<+Q 故选C .这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b )(a ,b ),(a ,b ),(a ,b ),(a ,b ).其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. 【解析】(1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,0,1,1,1,0,1,因为x 甲>x 乙,s 2甲<s 2乙,所以甲组的研发水平优于乙组.(2)记E ={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),共7个.因此事件E 发生的频率为715.用频率估计概率,即得所求概率为P (E )=715.【名师点睛】(1)平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行平均数与方差的计算,关键是正确运用公式;(2)平均数与方差所反映的情况有着重要的实际意义,一般可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种可以做出评价或选择. 【跟踪练习】1.【2018贵州黔东南州高三下学期二模】甲乙两名同学6次考试的成绩统计如下图,甲乙两组数据的平均数分别为x 甲、x 乙,标准差分别为σσ甲乙,,则A .x x σσ<<甲乙甲乙,B .x x σσ甲乙甲乙,C .x x σσ><甲乙甲乙,D .x x σσ>>甲乙甲乙,【答案】C【解析】由图可知,甲同学除第二次考试成绩略低与乙同学,其他次考试都远高于乙同学,可知x x >甲乙,图中数据显示甲同学的成绩比乙同学稳定,故σσ<甲乙.故选C .2.【2018云南昆明高三教学质量检查(二统)】“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.“搜索指数”越大,表示网民对该关键词的搜索次数越多,对该关键词相关的信息关注度也越高.下图是2017年9月到2018年2月这半年中,某个关键词的搜索指数变化的走势图.根据该走势图,下列结论正确的是( )A .这半年中,网民对该关键词相关的信息关注度呈周期性变化B .这半年中,网民对该关键词相关的信息关注度不断减弱C .从网民对该关键词的搜索指数来看,去年10月份的方差小于11月份的方差D .从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值 【答案】D【解析】根据走势图可知:这半年中,网民对该关键词相关的信息关注度不呈周期性变化,A 错;这半年中,网民对该关键词相关的信息关注度增减不确定,B 错;从网民对该关键词的搜索指数来看,去年10月份的搜索指数的稳定性小于11 月份的搜索指数的稳定性,所以去年10月份的方差大于11 月份的方差,C 错;从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值,D正确,故选D.3.【2018陕西榆林高三二模】为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2016年1月至2017年7月的调查数据得出的中国仓储指数,绘制出如下的折线图.根据该折线图,下列结论正确的是()A.2016年各月的合储指数最大值是在3月份B.2017年1月至7月的仓储指数的中位数为55C.2017年1月与4月的仓储指数的平均数为52D.2016年1月至4月的合储指数相对于2017年1月至4月,波动性更大【答案】D【解析】2016年各月的仓储指数最大值是在11月份,所以A是错误的;由图可知,2017年1月至74.【2018江苏如皋高三年级第一学期教学质量调研(三)】甲、乙两个城市2017年夏季连续5天中,每天的最高气温(C )数据如下:城市每天的最高气温第1天第2天第3天第4天第5天甲28 31 27 33 31乙 25 26 29 34 36则这5 天中,每天最高气温较为稳定(方差较小)的城市为_______.(填甲或乙). 【答案】甲【解析】甲、乙两个城市的最高气温平均值都是30o ,甲的方差为419914.85++++=,乙的方差为2516116369318.6,55++++==∴每天最高气温较为稳定(方差较小)的城市为甲,故答案为甲.5.【2018山东枣庄高三二模】随着高校自主招生活动的持续开展,我市高中生掀起了参与数学兴趣小组的热潮.为调查我市高中生对数学学习的喜好程度,从甲、乙两所高中各随机抽取了40名学生,记录他们在一周内平均每天学习数学的时间,并将其分成了6个区间:(]0,10、(]10,20、(]20,30、(]30,40、(]40,50、(]50,60,整理得到如下频率分布直方图:根据一周内平均每天学习数学的时间t ,将学生对于数学的喜好程度分为三个等级: 学习时间(分钟/天) 20t ≤2050t <≤50t >喜好等级一般爱好痴迷(Ⅰ)试估计甲高中学生一周内平均每天学习数学的时间的中位数m 甲(精确到0.01);(Ⅱ)判断从甲、乙两所高中各自随机抽取的40名学生一周内平均每天学习数学的时间的平均值X 甲与X 乙及方差2S 甲与2S 乙的大小关系(只需写出结论),并计算其中的X 甲、2S 甲(同一组中的数据用该组区间的中点值作代表);(Ⅲ)从甲高中与乙高中随机抽取的80名同学中数学喜好程度为“痴迷”的学生中随机抽取2人,求选出的2人中甲高中与乙高中各有1人的概率.【答案】(Ⅰ) 26.67m ≈甲;(Ⅱ)答案见解析;(Ⅲ)37. 【解析】试题分析:()1根据频率分布直方图,由样本估计总体的思想可求得()0.50.10.2200.3m -+=+甲1026.67⨯≈;()2根据所给数据求出X 甲,X 乙,2S 甲,2S 乙,然后对比即可得到答案;()3求出甲高中随机选取的40名学生中“痴迷”的学生的个数,记为1A ,2A ;乙高中随机选取的40名解析:(Ⅰ)由样本估计总体的思想,甲高中学生一周内平均每天学习数学的时间的中位数()0.50.10.2200.3m -+=+甲 1026.67⨯≈;(Ⅱ)X X <甲乙;22S S >甲乙;50.1150.2250.3X =⨯+⨯+⨯甲 350.2450.15550.0527.5+⨯+⨯+⨯=;()()221[527.5400.140S =⨯-⨯⨯甲 ()()21527.5400.2+-⨯⨯ ()()22527.5400.3+-⨯⨯ ()()23527.5400.2+-⨯⨯ ()()24527.5400.15+-⨯⨯ ()()25527.5400.05]+-⨯⨯178.75=.(Ⅲ)甲高中随机选取的40名学生中“痴迷”的学生有()400.005102⨯⨯=人,记为1A ,2A ;乙高中随机选取的40名学生中“痴迷”的学生有()400.015106⨯⨯=人,记为1B ,2B ,3B ,4B ,5B ,6B .随机选出2人有以下28种可能:()12,A A ,()11,A B ,()12,A B ,()13,A B ,()14,A B ,()15,A B ,()16,A B , ()21,A B ,()22,A B ,()23,A B ,()24,A B ,()25,A B ,()26,A B ,()12,B B , ()13,B B ,()14,B B ,()15,B B ,()16,B B ,()23,B B ,()24,B B ,()25,B B , ()26,B B ,()34,B B ,()35,B B ,()36,B B ,()45,B B ,()46,B B ,()56,B B ,甲、乙两所高中各有1人,有以下12种可能:()11,A B ,()12,A B ,()13,A B ,()14,A B ,()15,A B ,()16,A B , ()21,A B ,()22,A B ,()23,A B ,()24,A B ,()25,A B ,()26,A B .所以,从甲、乙两所高中数学喜好程度为“痴迷”的同学中随机选出2人,选出的2人中甲、乙两所高中各有1人的概率为123287=. 6.【2018海南高三第二次联合考试】从某小区抽取50户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如下.(1)求频率分布直方图中x 的值并估计这50户用户的平均用电量;(2)若将用电量在区间[)50,150内的用户记为A 类用户,标记为低用电家庭,用电量在区间[)250,350内的用户记为B 类用户,标记为高用电家庭,现对这两类用户进行问卷调查,让其对供电服务进行打分,打分情况见茎叶图:①从B 类用户中任意抽取1户,求其打分超过85分的概率;②若打分超过85分视为满意,没超过85分视为不满意,请填写下面列联表,并根据列联表判断是否有95%的把握认为“满意度与用电量高低有关”?满意不满意 合计 A 类用户 B 类用户合计附表及公式:()2P K k≥0.050 0.010 0.001 0k3.841 6.635 10.828()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.【答案】(1)0.0044x=,186(2)23,没有【解析】试题分析:(1)由矩形面积和为1,求得x,再由每一个矩形的中点横坐标乘以矩形面积求和可得平均值;试题解析:解:(1)1(0.0060.00360.002450x=-++20.0012)0.0044⨯+=,按用电量从低到高的六组用户数分别为6,9,15,11,6,3,所以估计平均用电量为675912515175112256275332550⨯+⨯+⨯+⨯+⨯+⨯186=度.(2)①B类用户共9人,打分超过85分的有6人,所以从B类用户中任意抽取3户,恰好有2户打分超过85分的概率为2163391528C CC=.②满意不满意合计A类用户 6 9 15B类用户 6 3 9因为2K 的观测值 1.6 3.841=<,所以没有95%的把握认为“满意与否与用电量高低有关”.【名师点睛】利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.。