(高三理科数学第一轮复习)第十章 第2节 用样本估计总体
高考数学一轮复习第2讲 用样本估计总体
第2讲用样本估计总体1.用样本的频率分布估计总体分布(1)作频率分布直方图的步骤①求极差(01最大值与02最小值的差).03组距与04组数.05分组.06频率分布表.07频率分布直方图.(2)频率分布折线图和总体密度曲线08中点,就得到频率分布折线图.09样本容量的增加,作图时10所分的组数增加,11组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图12中间的一列数,叶是从茎的13旁边生长出来的数.2.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x -=14x1+x2+…+xn n ,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s = 15 错误!.(5)方差:s 2=161n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x -是样本平均数).1.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.标准差与方差的特点反映了各个样本数据聚集于样本平均数周围的程度.标准差(方差)越小,表明各个样本数据在样本平均数周围越集中;标准差(方差)越大,表明各个样本数据在样本平均数的两边越分散.3.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a .(2)若数据x 1,x 2,…,x n 的方差为s 2,则: ①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.2.(2020·云川贵百校联考)某课外小组的同学们从社会实践活动中调查了20户家庭某月的用电量,如下表所示:用电量/度120140160180200户数2358 2 则这20户家庭该月用电量的众数和中位数分别是()A.180,170 B.160,180C.160,170 D.180,160答案 A解析用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B,C;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.3.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为()A.28 B.40 C.56 D.60 答案 B解析设中间一个小长方形的面积为x,其他8个长方形的面积和为52x,因此x+52x=1,所以x=27.所以中间一组的频数为140×27=40.故选B.4.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案 A解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.5.(2020·全国卷Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01 B.0.1C.1 D.10答案 C解析因为数据ax i+b(i=1,2,…,n)的方差是数据x i(i=1,2,…,n)的方差的a2倍,所以所求数据的方差为102×0.01=1.故选C.6.对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为 .答案50解析根据题中的频率分布直方图可知,三等品的频率为1-(0.0500+0.0625+0.0375)×5=0.25,因此该样本中三等品的件数为200×0.25=50.多角度探究突破考向一统计图表及应用角度1扇形图例1(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案 A解析设新农村建设前的收入为M,则新农村建设后的收入为2M,新农村建设前种植收入为0.6M,新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A 不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,所以C正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选A.角度2折线图例2(多选)(2020·海南高考调研)如图所示的折线图是2020年1月25日至2020年2月12日陕西省及西安市新冠肺炎累计确诊病例的折线图,则下列判断正确的是()A.1月31日陕西省新冠肺炎累计确诊病例中西安市占比超过了1 3B.1月25日至2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势C.2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了97例D.2月8日到2月10日西安市新冠肺炎累计确诊病例的增长率大于2月6日到2月8日的增长率答案ABC解析1月31日陕西省新冠肺炎累计确诊病例共有87例,其中西安32例,所以西安市所占比例为3287>13,故A 正确;由折线图可知,1月25日到2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势,故B 正确;2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了213-116=97例,故C 正确;2月8日到2月10日西安市新冠肺炎累计确诊病例增加了98-8888=544,2月6日到2月8日西安市新冠肺炎累计确诊病例增加了88-7474=737,显然737>544,故D 错误.角度3 频率分布直方图例3 (1)(2020·天津高考)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A .10B .18C .20D .36答案 B解析 根据频率分布直方图可知,直径落在区间[5.43,5.47)之间的频率为(6.25+5.00)×0.02=0.225,则直径落在区间[5.43,5.47)内零件的个数为80×0.225=18.故选B.(2)(多选)(2020·临沂模拟)在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中正确的有( )A.成绩在[70,80]分的考生人数最多B.不及格的考生人数为1000人C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分答案ABC解析根据频率分布直方图得,成绩出现在[70,80]的频率最大,故A正确;不及格考生数为10×(0.010+0.015)×4000=1000,故B正确;根据频率分布直方图估计考试的平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C 正确;0.1+0.15+0.2=0.45<0.5,0.1+0.15+0.2+0.3=0.75>0.5,所以考生竞赛成绩的中位数为70+0.5-0.450.3×10≈71.67,故D错误.故选ABC. 常见统计图的特点(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)准确理解频率分布直方图的数据特点①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆;②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.1.(2020·葫芦岛模拟)书籍是人类的智慧结晶和进步阶梯,阅读是一个国家的文化根基和创造源泉.2014年以来,“全民阅读”连续6年被写入政府工作报告.某高中为了解学生假期自主阅读书籍类型,在全校范围内随机抽取了部分学生进行调查.学生选择的书籍大致分为以下四类:A历史类、B文学类、C科学类、D哲学类.根据调查的结果,将数据整理成如下的两幅不完整的统计图,其中a-b=10.根据上述信息,可知本次随机抽查的学生中选择A历史类的人数为()A.45 B.30C.25 D.22答案 B解析由题可知,样本容量为30-180.1=120,所以选择A历史类的人数为120-42-30-18=30.故选B.2.(2020·汕头二模)新型冠状病毒疫情发生后,口罩的需求量大增,某口罩工厂为提高生产效率,开展技术创新活动,提出两种新的生产方式,为比较两种生产方式的效率,选取80名工人,将他们随机分成两组,每组40人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.第一种生产方式40名工人完成同一生产任务所用时间(单位:min)如表:68728577838290838984 88877691799087918692 88878176959463878571 96637485929987827569 第二种生产方式40名工人完成同一生产任务所用时间(单位:min)如扇形图所示:(1)请填写第一种生产方式完成任务所用时间的频数分布表并作出频率分布直方图:生产时间[60,70)[70,80)[80,90)[90,100]频数(2)试从扇形图中估计第二种生产方式的平均数;(3)根据频率分布图和扇形图判断哪种生产方式的效率更高?并说明理由.解(1)第一种生产方式完成任务所用时间的频数分布表如下:生产时间[60,70)[70,80)[80,90)[90,100]频数481810频率分布直方图如下:(2)从扇形图中估计第二种生产方式的平均数为65×0.25+75×0.5+85×0.2+95×0.05=75.5 min.(3)从频率分布直方图中估计第一种生产方式的平均数为65×0.1+75×0.2+85×0.45+95×0.25=83.5 min,从平均数的角度发现:用第一种生产方式的工人完成生产任务所需要的时间高于80分钟;用第二种生产方式的工人完成生产任务所需要的时间低于80分钟,因此第二种生产方式的效率更高.考向二用样本估计总体例4(1)(多选)为了了解某校高一年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论正确的是()A.该校高一年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校高一年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校高一年级学生1分钟仰卧起坐的次数超过30次的约有320人D.该校高一年级学生1分钟仰卧起坐的次数少于20次的约有32人答案ABC解析由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校高一年级学生1分钟仰卧起坐的次数超过30次的约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校高一年级学生1分钟仰卧起坐的次数少于20次的约有160人.故A,B,C正确,D错误,故选ABC.(2)(2020·香坊区校级二模)2020年初新冠病毒疫情爆发,全国范围开展了“停课不停学”的线上教学活动.哈六中数学组积极研讨网上教学策略:先采取甲、乙两套方案教学,并对分别采取两套方案教学的班级的7次线上测试成绩进行统计如图所示:①请填写如表(要求写出计算过程)平均数方差甲乙②从下列三个不同的角度对这次方案选择的结果进行分析:a.从平均数和方差相结合看(分析哪种方案的成绩更好);b.从折线图上两种方案的走势看(分析哪种方案更有潜力).解①由图象可得,x-甲=17×(109+111+113+115+117+119+121)=115,x-乙=17×(121+115+109+115+113+117+115)=115,则s2甲=17×(62+42+22+02+22+42+62)=16,s2乙=17×(62+02+62+02+22+22+02)=807≈11.43,故表格第一行:115,16;第二行:115,约为11.43.②a.因为x-甲=x-乙,s2甲>s2乙,故乙方案更好.b.由折线图可知甲走势稳定上升,故甲方案更好.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.(2)方差的简化计算公式:s2=1n[(x21+x2+…+x2n)-n x-2],或写成s2=1n(x21+x2+…+x2n)-x-2,即方差等于原始数据平方的平均数减去平均数的平方.3.某学校共有学生2000人,其中高一800人,高二、高三各600人,学校对学生在暑假期间每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为x-=3小时,方差为s2=1.966,其中三个年级学生每天读书时间的平均数分别为x-1=2.7,x-2=3.1,x-3=3.3,又已知高一学生、高二学生每天读书时间的方差分别为s21=1,s2=2,则高三学生每天读书时间的方差s23= .答案 3解析由题意可得,1.966=8002000×[1+(2.7-3)2]+6002000×[2+(3.1-3)2]+6002000×[s23+(3.3-3)2],解得s23=3.4.(2020·南宁模拟)为了检测某种零件的一条生产线的生产过程,从生产线上随机抽取一批零件,根据其尺寸的数据得到如图所示的频率分布直方图.若尺寸落在区间(x--2s,x-+2s)之外,则认为该零件属于“不合格”的零件,其中x-,s分别为样本平均数和样本标准差,计算可得s≈15(同一组中的数据用该组区间的中点值作代表).(1)求样本平均数的大小;(2)若一个零件的尺寸是100 cm ,试判断该零件是否属于“不合格”的零件.解 (1)x -=35×10×0.005+45×10×0.010+55×10×0.015+65×10×0.030+75×10×0.020+85×10×0.015+95×10×0.005=66.5.(2)x -+2s =66.5+30=96.5,x --2s =66.5-30=36.5,100>96.5,∴该零件属于“不合格”的零件.一、单项选择题1.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( )A.x -A >x -B ,s A >s BB .x -A <x -B ,s A >s B C.x -A >x -B ,s A <s BD .x -A <x -B ,s A <s B答案 B解析 由图可得样本A 的数据都在10及以下,样本B 的数据都在10及以上,所以x -A <x -B ,样本B 的数据比样本A 的数据波动幅度小,所以s A >s B ,故选B.2.在高一期中考试中,甲、乙两个班的数学成绩统计如下表: 班级 人数 平均数 方差甲20x-甲2乙30x-乙3其中x-甲=x-乙,则两个班数学成绩的方差为()A.3 B.2C.2.6 D.2.5答案 C解析由题意可知两个班的数学成绩的平均数为x-=x-甲=x-乙,则两个班数学成绩的方差为s2=2020+30[2+(x-甲-x-)2]+3020+30[3+(x-乙-x-)2]=2020+30×2+3020+30×3=2.6.3.(2020·河南省名校联考)如图给出的是某小区居民一段时间内访问网站的比例图,则下列选项中不超过21%的为()A.腾讯与百度的访问量所占比例之和B.网易与搜狗的访问量所占比例之和C.淘宝与论坛的访问量所占比例之和D.新浪与小说的访问量所占比例之和答案 B解析由于网易与搜狗的访问量所占比例之和为18%,不超过21%,故选B.4.(2020·安庆模拟)某单位统计了本单位的职工一天行走步数(单位:百步)得到如图所示的频率分布直方图,估计该单位职工一天行走步数的平均值为(同一组中的数据用该组区间的中点值为代表)()A.125 B.125.6C.124 D.126答案 B解析由频率分布直方图,估计该单位职工一天行走步数的平均值为x-=60×0.002×20+80×0.006×20+100×0.008×20+120×0.012×20+140×0.010×20+160×0.008×20+180×0.002×20+200×0.002×20=125.6.故选B.5.(2020·威海一模)恩格尔系数是食品支出总额占个人消费支出总额的比重,其数值越小说明生活富裕程度越高.统计改革开放40年来我国历年城镇和农村居民家庭恩格尔系数,绘制了如图的折线图.根据该折线图,下列结论错误的是()A.城镇居民家庭生活富裕程度不低于农村居民家庭B.随着改革开放的不断深入,城镇和农村居民家庭生活富裕程度越来越高C.1996年开始城镇和农村居民家庭恩格尔系数都低于50%D.随着城乡一体化进程的推进,城镇和农村居民家庭生活富裕程度差别越来越小答案 C解析由折线图可知,对于A,因为城镇的恩格尔系数较小,故城镇居民家庭生活富裕程度不低于农村居民,A正确;对于B,城镇和农村的恩格尔系数整体上都在下降,说明城镇和农村居民家庭生活富裕程度越来越高,B正确;对于C,1996~2000年我国农村居民家庭恩格尔系数高于50%,C错误;对于D,结合图形得到城镇和农村家庭恩格尔系数之间的差距越来越小,说明城镇和农村家庭生活富裕程度差别越来越小,D正确.故选C.6.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案 D解析由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确;平均最高气温高于20 ℃的月份为六月、七月、八月,只有3个,D错误.7.某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布扇形图和90后从事互联网行业者岗位分布条形图,则下列结论中不一定正确的是()注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比80后多答案 D解析由题图易知互联网行业从业人员90后占56%,A正确;仅90后从事技术岗位的人数占总人数的0.22176,超过20%,B正确;90后从事运营岗位的人数占总人数的0.56×0.17=0.0952>0.03,C正确;90后从事技术岗位的人数占总人数的0.22176<0.41,而题中未给出80后从事互联网行业岗位分布情况,故D不一定正确.二、多项选择题8.(2020·青岛模拟)近几年,在国家大力支持和引导下,中国遥感卫星在社会生产和生活各领域的应用范围不断扩大,中国人民用遥感卫星系统研制工作取得了显著成绩,逐步形成了气象、海洋、陆地资源和科学试验等遥感卫星系统.如图是2007~2018年中国卫星导航与位置服务产业总体产值规模(万亿)及增速(%)的统计图,则下列结论中正确的是()A.2017年中国卫星导航与位置服务产业总体产值规模达到2550亿元,较2016年增长20.40%B.若2019年中国卫星导航与位置服务产业总体产值规模保持2018年的增速,总体产值规模将达3672亿元C.2007~2018年中国卫星导航与位置服务产业总体产值规模逐年增加,但不与时间成正相关D.2007~2018年中国卫星导航与位置服务产业总体产值规模的增速中有些与时间成负相关答案ABD解析对于A,根据图中数据可知2017年中国卫星导航与位置服务产业总体产值规模达到2550亿元,较2016年增长20.40%,故A正确;对于B,2019年中国卫星导航与位置服务产业总体产值规模保持2018年的增速,即为20%,故2019年总体产值规模为3060×(1+20%)=3672(亿元),故B正确;对于C,根据正相关的定义,散点位于从左下角到右上角区域,则两个变量具有正相关关系,故C错误;对于D,根据负相关的定义,散点位于从左上角到右下角区域,则两个变量具有负相关关系,故D 正确.故选ABD.9.为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论正确的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人答案ABC解析由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有160人.故A,B,C正确,D错误.故选ABC.10.在发生某公共卫生事件期间,我国有关机构规定:“该事件在一段时间没有发生规模群体感染的标志为连续10天,每天新增加疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,不一定符合该标志的是() A.甲地总体均值为3,中位数为4B.乙地总体均值为2,总体方差大于0C.丙地中位数为3,众数为3D.丁地总体均值为2,总体方差为3答案ABC解析由于平均数和中位数不能确定某一天的病例不超过7人,A不一定符合该标志;当总体方差大于0,不知道总体方差的具体数值,因此不能确定数据的波动大小,B不一定符合该标志;中位数和众数也不能确定某一天的病例不超过7人,C不一定符合该标志;当总体平均数是2,若有一个数据超过7,则方差就超过3,D一定符合该标志.故选ABC.三、填空题11.(2021·湖北宜昌高三月考)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):人入选,则入选的最佳人选应是 . 答案 甲解析 因为x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定.12.已知30个数据的60%分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 .答案 8.6解析 由30×60%=18,设第19个数据为x ,则7.8+x 2=8.2,解得x =8.6,即第19个数据是8.6.四、解答题13.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.14.我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市为了节约生活用水,计划在本市试行居民生活用水定额管理(即确定一个居民月均用水量标准,用水量不超过a的部分按照平价收费,超过a的部分按照议价收费).为了较为合理地确定出这个标准,通过抽样获得了100位居民某年的月均用水量(单位:t),制作了频率分布直方图.(1)由于某种原因频率分布直方图部分数据丢失,请在图中将其补充完整; (2)用样本估计总体,如果希望80%的居民每月的用水量不超过标准,则月均用水量的最低标准定为多少吨?并说明理由;(3)从频率分布直方图中估计该100位居民月均用水量的平均数.(同一组中的数据用该区间的中点值代表)解 (1)(2)月均用水量的最低标准应定为2.5 t .样本中月均用水量不低于2.5 t 的居民占样本总体的20%,由样本估计总体,要保证80%的居民每月的用水量不超出标准,月均用水量的最低标准应定为2.5 t.(3)这100位居民的月均用水量的平均数为0.5×⎝ ⎛⎭⎪⎪⎫14×0.10+34×0.20+54×0.30+74×0.40+94×0.60+114×0.30+134×0.10=1.875(t).。
2022版高考数学一轮复习第10章统计第2讲用样本估计总体课件
某商家因店面需重新装修,现需租赁一家新店面进行周转,合约期 一年.新店面只需安装该品牌节能灯5支(同种型号)即可正常营业.经了 解,A型20瓦和B型55瓦的两种节能灯照明效果相当,都适合安装.已 知A型和B型节能灯每支的价格分别为120元、25元,当地商业电价为 0.75元/千瓦时.假定该店面一年周转期的照明时间为3 600小时,若正常 营业期间灯坏了立即购买同型灯管更换(用频率估计概率).
直径落在区间[5.43,5.47)内的个数为 ( )
A.10
B.18
C.20
D.36
第二十三页,编辑于星期六:四点 五分。
(2)(2019年新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度, 进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中给A 组小鼠服甲离子溶液,给B组小鼠服乙离子溶液,给每只小鼠服的溶液 体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留 在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
若 选 择 B 型 节 能 灯 , 一 年 共 需 花 费 (5 + 4)×25 + 3 600×5×55×0.75×10-3=967.5(元).
因为967.5>870,所以该商家应选择A型节能灯.
第三十二页,编辑于星期六:四点 五分。
扇形图、折线图的应用 (1)某地区经过一年的新农村建设,经济收入增加了一倍, 实现翻番.为更好地了解该地区的经济收入变化情况,现统计了该地区 新农村建设前后的经济收入构成比例,得到如下扇形图:
第十一页,编辑于星期六:四点 五分。
1.(2019年长春期末)10名学生在一次数学考试中的成绩分别为x1,
x2,…,x10,要研究这10名学生成绩的平均波动情况,则最能说明问题
高考数学一轮复习 第十章 第2讲 用样本估计总体课件 文
ppt精选
3
2.样本的数字特征 (1)众数:一组数据中___出__现__次__数__最__多_____的那个数据,叫 做这组数据的众数. (2)中位数:把 n 个数据按大小顺序排列,处于_最__中___间____ 位置的一个数据叫做这组数据的中位数.
a1+a2+…+an (3)平均数:把________n___________称为 a1,a2,…,an 这 n 个数的平均数.
15
(2)(2014·高考北京卷)从某校随机抽取 100 名学生,获得了
他们一周课外阅读时间(单位:小时)的数据,整理得到数据
分组及频数分布表和频率分布直方图:
组号 1 2 3 4 5 6 7 8 9
合计
分组
[0,2) [2,4) [4,6) [6,8) [8,10) [10,12) [12,14) [14,16) [16,18)
ppt精选
4
(4)标准差与方差:设一组数据 x1,x2,x3,…,xn 的平均
数为-x ,则这组数据的标准差和方差分别是
s=
n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
s2=n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
ppt精选
5
[做一做]
1.(2014·高考四川卷)在“世界读书日”前夕,为了了解某
第十章 统计、统计案例及算法初步
第2讲 用样本估计总体
ppt精选
1
1.统计图表的含义
(1)频率分布表
①含义:把反映总体频率分布的表格称为频率分布表.
②频率分布表的画法步骤:
第一步:求___极__差_____,决定组数和组距,组距=极组差数;
第二步:__分__组______,通常对组内数值所在区间取左闭右开
人教版高中数学高考一轮复习--用样本估计总体(课件)
样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2
2025届高考数学一轮总复习第10章统计与成对数据的统计分析第2节用样本估计总体新人教A版
B.170
C.171
解析 根据题意,10×60%=6,所以第 60
以 x=171.
D.172
169+
169+
百分位数为 2 ,由已知 2 =170,所
考点二 用样本的数字特征估计总体的数字特征(多考向探究预测)
考向1总体集中趋势的估计(中位数、众数、平均数)
例2(1)(2024·山东济南模拟)某射击运动员连续射击5次,命中的环数(环数
3.一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )
4.对一组数据来说,平均数和中位数总是非常接近.( × )
题组二回源教材
5.(人教A版必修第二册9.2.2节例2改编)某机构调查了解10种食品的卡路里
含量,结果如下:107,135,138,140,146,175,179,182,191,195.则这组数据的第
1 m
2
∑
x
i,s1
m i=1
=
则①w =
m+
;
m+
②s
1 m
2
∑
(x
i-) ,
m i=1
1
=
{m[s12 +(
m+
2
=
1
2
∑
y
i,s2
i=1
=
1
2
∑
(y
i-) .
i=1
− w)2]+n[s22 +( − w)2]}.
常用结论
1.在频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即是众数;
均值和样本方差的计算.
目录索引
1 强基础 固本增分
2015届高考数学一轮总复习 10-2用样本估计总体
2015届高考数学一轮总复习 10-2用样本估计总体基础巩固强化一、选择题1.(2013·重庆理,4)以下茎叶图记录了甲、乙两组各5名学生在一次英语听力测试中的成绩(单位:min).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( ) A .2,5 B .5,5 C .5,8 D .8,8[答案] C[解析] 由甲组数据中位数为15,可得x =5;而乙组数据的平均数16.8=9+15+(10+y )+18+245,可解得y =8,故选C.2.(2013·西宁模拟)已知一组数据:a 1,a 2,a 3,a 4,a 5,a 6,a 7构成公差为d 的等差数列,且这组数据的方差等于1,则公差d 等于( )A .±14B .±12C .±128D .无法求解[答案] B[解析] 这组数据的平均数为a 1+a 2+a 3+a 4+a 5+a 6+a 77=7a 47=a 4,又因为这组数据的方差等于1,所以17[(a 1-a 4)2+(a 2-a 4)2+(a 3-a 4)2+(a 4-a 4)2+(a 5-a 4)2+(a 6-a 4)2+(a 7-a 4)2]=(3d )2+(2d )2+d 2+0+d 2+(2d )2+(3d )27=4d 2=1,解得d =±12.3.已知一组正数x 1,x 2,x 3,x 4的方差为s 2=14(x 21+x 22+x 23+x 24-16),则数据x 1+2,x 2+2,x 3+2,x 4+2的平均数为( )A .2B .3[解析] 设x 1,x 2,x 3,x 4的平均值为x -,则 s 2=14[(x 1-x -)2+(x 2-x -)2+(x 3-x -)2+(x 4-x -)2]=14(x 21+x 22+x 23+x 24-4x -2), ∴4x -2=16,∴x -=2,x -=-2(舍),∴x 1+2,x 2+2,x 3+2,x 4+2的平均数为4,故选C.4.(文)(2013·辽宁理,5)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60 [答案] B[解析] 由频率分布直方图知,低于60分的同学所占频率为(0.005+0.01)×20=0.3,故该班的学生人数为150.3=50.故选B.(理)(2013·福建理,4)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480[解析]由频率分布直方图知40~60分的频率为(0.005+0.015)×10=0.2,故估计不少于60分的学生人数为600×(1-0.2)=480.5.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图.由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()A.64 B.54C.48 D.27[答案] B[解析]前两组中的频数为100×(0.05+0.11)=16.∵后五组频数和为62,∴前三组为38.∴第三组为22.又最大频率为0.32,故最大频数为0.32×100=32.∴a=22+32=54,故选B.6.(文)(2013·六安一模)如图是2012年某校举办“激扬青春,勇担责任”演讲比赛上七位评委为某位选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的中位数和平均数分别为()A.8587 B.8486C.8485 D.8586[答案] C[解析]由茎叶图知,评委为某选手打出的分数分别不79,84,84,84,86,87,93,去掉一个最高分和一个最低分后分数分别是84,84,84,86,87,所以中位数为84,平均数为15×(84+84+84+86+87)=85.(理)(2013·山东滨州一模)如图是2013年在某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶图,则去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A.84,4.84 B .84,1.6 C .85,1.6 D .85,4[答案] C[解析] 去掉一个最高分93和一个最低分79,所剩数据的平均数x -=84+84+86+84+875=85,方差s 2=15[(84-85)2×3+(86-85)2+(87-85)2]=1.6,故选C.二、填空题7.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试.对200名学生测试所得数据作出频率分布直方图如图所示,若次数在110以上(含110次)为达标,则从图中可以看出高一学生的达标率是________.[答案] 80%[解析] 次数在110以上(含110次)的频率之和为(0.04+0.03+0.01)×10=0.8,则高一学生的达标率为0.8×100%=80%.8.(文)将容量为n 的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n 等于________.[答案] 60[解析] 由条件知,2+3+42+3+4+6+4+1×n =27,解得n =60.(理)容量为100的样本分为10组,若前7组频率之和为0.79,而剩下三组的频数成等比数列,且其公比不为1,则剩下的三组频数最大的一组的频率是________.[答案] 0.16或0.12[解析]后三组频数和为100(1-0.79)=21,设这三组频数依次为a、ap、ap2(a、p∈N*且p>1),由题意设得,a+ap+ap2=21,∵p>1,∴1+p+p2是21的大于3的约数,∴1+p+p2=21或1+p+p2=7,得p=4或p=2.当p=4时,频数最大值为16,频率为0.16;当p=2时,频数最大值为12,频率为0.12.9.(文)(2013·湖北理,11)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示(1)直方图中x的值为________.(2)在这些用户中,用电量落在区间[100,250)内的户数为________.[答案](1)0.0044(2)70[解析]∵50×(0.0024+0.0036+0.006+x+0.0024+0.0012)=1,∴x=0.0044.用电量在区间[100,250)内的频率为50×(0.0036+0.006+0.0044)=0.7,∴户数为100×0.7=70(户).(理)(2013·北京西城一模)某年级120名学生在一次百米测试中,成绩全部介于13s与18s之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为,那么成绩在[16,18]的学生人数是________.[答案] 54[解析] 成绩在[16,18]的学生的人数所占比例为6+31+3+7+6+3=920,所以成绩在[16,18]的学生人数为120×920=54.三、解答题10.(2012·石家庄市二模)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市为了节约生活用水,计划在本市试行居民生活用水定额管理(即确定一个居民月均用水量标准,用水量不超过a 的部分按照平价收费,超过a 的部分按照议价收费).为了较为合理地确定出这个标准,通过抽样获得了100位居民某年的月均用水量(单位:t),制作了频率分布直方图.(1)由于某种原因频率分布直方图部分数据丢失,请在图中将其补充完整;(2)用样本估计总体,如果希望80%的居民每月的用水量不超过标准,则月均用水量的最低标准定为多少吨?并说明理由;(3)从频率分布直方图中估计该100位居民月均用水量的平均数.(同一组中的数据用该区间的中点值代表)[解析] (1)(2)月均用水量的最低标准应定为2.5t.样本中月均用水量不低于2.5t 的居民有20位,占样本总体的20%,由样本估计总体,要保证80%的居民每月的用水量不超出标准,月均用水量的最低标准应定为2.5t.(3)这100位居民的月均用水量的平均数为0.5×(14×0.10+34×0.20+54×0.30+74×0.40+94×0.60+114×0.30+134×0.10)=1.875(t).能力拓展提升一、选择题11.(文)某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品个数是( )A .90B .75C .60D .45 [答案] A[解析] 产品净重小于100克的频率为(0.050+0.100)×2=0.300,设样本容量为n ,则36n =0.300,所以n =120,净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.(理)某校对高三年级的学生进行体检,现将高三男生的体重(单位:kg)数据进行整理后分成六组,并绘制频率分布直方图(如图所示).已知图中从左到右第一、第六小组的频率分别为0.16、0.07,第一、第二、第三小组的频率成等比数列,第三、第四、第五、第六小组的频率成等差数列,且第三小组的频数为100,则该校高三年级的男生总数为( )A .480B .440C .420D .400[答案] D[解析] 设第一、第二、第三小组的频率构成的等比数列公比为q ,第三、第四、第五、第六小组的频率构成的等差数列公差为d ,则由题意知即⎩⎪⎨⎪⎧0.16+0.16q +0.64q 2+6d =1,0.16q 2+3d =0.07. 消去d 得,16q 2+8q -35=0.∵q >0,∴q =54.∴第三组的频率P =0.16q 2=0.25.设男生总数为x ,则x ×25%=100,∴x =400.12.(2013·山东济南一模)某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x -甲,x -乙和中位数y 甲,y 乙进行比较,下面结论正确的是( )A.x -甲>x -乙,y 甲>y 乙B.x -甲<x -乙,y 甲<y 乙 C.x -甲<x -乙,y 甲>y 乙 D.x -甲>x -乙,y 甲<y 乙 [答案] B[解析] 由茎叶图得x -甲=19+20+21+23+25+29+32+33+37+4110=28,x -乙=10+26+30+30+34+37+44+46+46+4710=35,y 甲=25+292=27,y 乙=34+372=35.5,∴x -甲<x -乙,y 甲<y 乙,故选B. 二、填空题13.(2013·福建莆田模拟)一组数据如茎叶图所示,若从中剔除2个数据,使得新数据组的平均数不变且方差最小,则剔除的2个数据的积等于________.[答案] 63[解析] 这组数据的平均数x -=3+8+12+11+13+16+217=12,由题意,剔除2个数据,平均数不变,且方差最小,则这两个数的和等于24且(x i -x -)2的和最大,所以这两个数为3与21,故剔除的2个数据的积等于3×21=63.14.(文)(2013·徐州模拟)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人.则n 的值为________.[答案] 100[解析] 由条件知,1-(0.01+0.024+0.036)×10=30n,∴n =100.(理)某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测这3000名学生在该次数学考试中成绩小于60分的学生数是________.[答案] 600[解析] 成绩小于60分的学生频率为:(0.002+0.006+0.012)×10=0.2 故3000名学生中成绩小于60分的学生数为:3000×0.2=600. 三、解答题15.(2013·东北三校联考)PM2.5是指悬浮在空气中的空气动力学当量直径小于或等于2.5μm 的颗粒物,也称为可入肺颗粒物,根据现行国家标准GB3095—2012,PM2.5日均值在35微克/m 3以下空气质量为一级;在35微克/m 3~75微克/m 3之间空气质量为二级;在75微克/m 3以上空气质量为超标.从某自然保护区2012年全年每天的PM2.5监测值数据中随机地抽取12天的数据作为样本,监测值如茎叶图所示(十位为茎,个位为叶):(1)求空气质量为超标的数据的平均数与方差;(2)从空气质量为二级的数据中任取2个,求这2个数据的和小于100的概率;(3)以这12天的PM2.5日均值来估计2012年的空气质量情况,估计2012年(按366天计算)中大约有多少天的空气质量达到一级或二级.[解析] (1)空气质量为超标的数据有四个:77,79,84,88, 平均数为x -=77+79+84+884=82.方差为s 2=14×[(77-82)2+(79-82)2+(84-82)2+(88-82)2]=18.5.(2)空气质量为二级的数据有五个:47,50,53,57,68,任取两个有十种可能结果:{47,50},{47,53},{47,57},{47,68},{50,53},{50,57},{50,68},{53,57},{53,68},{57,68},两个数据和小于100的结果有一种:{47,50}, 记“两个数据和小于100”为事件A ,则P (A )=110,即从空气质量为二级的数据中任取2个,这2个数据和小于100的概率为110.(3)空气质量为一级或二级的数据共8个,所以空气质量为一级或二级的频率为812=23, 366×23=244,所以,2012年的366天中空气质量达到一级或二级的天数估计为244天.16.(文)某学校为了了解学生的日平均睡眠时间(单位:h),随机选择了n 名同学进行调查.下表是这n 名同学的日睡眠时间的频率分布表.(1)求(2)统计方法中,同一组数据常用该组区间的中点值(例如区间[4,5)的中点值是4.5)作为代表.若据此计算的上述数据的平均值为6.52,求a 、b 的值,并由此估计该学校学生的日平均睡眠时间在7小时以上的概率.[解析] (1)由频率分布表可得n =60.12=50.补全数据如下表频率分布直方图如下:(2)由题意知,⎩⎪⎨⎪⎧150(6×4.5+10×5.5+a ×6.5+b ×7.5+4×8.5)=6.52,6+10+a +b +4=50. 解得a =15,b =15.设“该学校学生的日平均睡眠时间在7小时以上”为事件A , 则P (A )≈15+450=0.38答:该学校学生的日平均睡眠时间在7小时以上的概率约为0.38.(理)某校高三(1)班共有40名学生,他们每天自主学习的时间全部在180min 到330min 之间,按他们学习时间的长短分5个组统计得到如下频率分布表:(1)求分布表中s 、t (2)某兴趣小组为研究每天自主学习的时间与学习成绩的相关性,需要在这40名学生中按时间用分层抽样的方法抽取20名学生进行研究,问应抽取多少名第一组的学生?(3)已知第一组的学生中男、女生均为2人,在(2)的条件下抽取第一组的学生,求既有男生又有女生被抽中的概率.[解析] (1)s =840=0.2,t =1-0.1-s -0.3-0.25=0.15.(2)设应抽取x 名第一组的学生,则x 4=2040,得x =2.故应抽取2名第一组的学生.(3)在(2)的条件下应抽取2名第一组的学生. 记第一组中2名男生为a 1,a 2,2名女生为b 1,b 2,按时间用分层抽样的方法抽取2名第一组的学生共有6种等可能的结果,列举如下: a 1a 2,a 1b 1,a 1b 2,a 2b 1,a 2b 2,b 1b 2.其中既有男生又有女生被抽中的有a 1b 1,a 1b 2,a 2b 1,a 2b 2,共4种结果, 所以既有男生又有女生被抽中的概率为P =46=23.考纲要求1.了解频率分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. 补充说明1.编制频率分布直方图的步骤如下:①求极差:极差是一组数据的最大值与最小值的差.②决定组距和组数:当样本容量不超过100时,常分成5~12组.组距=极差组数.③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可以将样本数据多取一位小数分组;④列频率分布表:登记频数,计算频率,列出频率分布表.将样本数据分成若干小组,每个小组内的样本个数称为频数,频数与样本容量的比值叫做这一小组的频率.频率反映数据在每组所占比例的大小.⑤绘制频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.2.频率分布折线图(1)把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图. (2)总体密度曲线如果样本容量不断增大,分组的组距不断缩小,则频率分布折线图实际上越来越接近于一条光滑曲线,这条光滑的曲线就叫总体密度曲线.3.茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.4.方差是刻画一组数据离散程度的量,它反映一组数据围绕平均数波动的大小.方差越大,这组数据波动越大,越分散.讨论产品质量、售价高低、技术高低、产量高低、成绩高低、寿命长短等等问题,一般都是通过方差来体现.计算方差时,要依据所给数据的特点恰当选取公式以简化计算.备选习题1.从某女子跳远运动员的多次测试中,随机抽取20次成绩作为样本,按各次的成绩(单位:cm)分成五组,第一组[490,495),第二组[495,500),第三组[500,505),第四组[505,510),第五组[510,515],相应的样本频率分布直方图如图所示.(1)样本落入第三组[500,505)的频数是多少?(2)现从第二组和第五组的所有数据中任意抽取两个,分别记为m、n,求事件“|m-n|≤5”的概率.[解析](1)由频率分布直方图可知,样本落入[500,505)的频率是1-(0.01+0.02+0.04+0.03)×5=0.5,所以,样本落入[500,505)的频数是0.5×20=10.(2)第二组中有0.02×5×20=2个数据,记为a、b;第五组中有0.03×5×20=3个数据,记为A、B、C.则{m,n}的所有可能结果为{a,b},{a,A},{a,B},{a,C},{b,A},{b,B},{b,C},{A,B},{A,C},{B,C},共10种.其中使|m-n|≤5成立的有{a,b},{A,B},{A,C},{B,C},共4种.所以事件“|m-n|≤5”的概率为P=410=25.2.(2013·烟台四校联考)据悉2012年山东省高考要将体育成绩作为参考,为此,济南市为了了解今年高中毕业生的体能状况,从本市某校高中毕业班中抽取一个班进行铅球测试,成绩在8.0m(精确到0.1m)以上的为合格.把所得数据进行整理后,分成6组,并画出频率分布直方图的一部分如图所示.已知从左到右前5个小组的对应矩形的高分别为0.04,0.10,0.14,0.28,0.30,且第6小组的频数是7.(1)求这次铅球测试成绩合格的人数;(2)若由直方图来估计这组数据的中位数,指出该中位数在第几组内,并说明理由. [解析] (1)由题易知,第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)×1=0.14, ∴此次测试的总人数为70.14=50.∴这次铅球测试成绩合格的人数为(0.28×1+0.30×1+0.14×1)×50=36.(2)直方图中位数两侧的矩形面积和相等,即频率和相等,前三组的频率和为0.28,前四组的频率和为0.56,∴中位数位于第4组内.。
高考数学第一轮知识点总复习 第二节 用样本估计总体
平.因为公司中少数人的月工资额与大多数人的月工资额差别较大,
这样导致了平均数与中位数的偏差较大,所以平均数不能客观真实
地反映这个公司员工的工资水平.
题型四 综合问题
【例4】(12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能每 瓶装的容量都不是标准的容量.我们随机抽出了20瓶,测得它们的容量 (单位:百毫升)如下: 12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1 12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1 11.4 11.6 11.2 12.2
1
(2)频率分布直方图如图:
(3)电子元件寿命在100 h~400 h以内的频数为130,则频率 为 13=00.65. 200
(4)寿命在400 h以上的电子元件的频数为70,则频率 为 =700.35. 200
学后反思利用样本的频率分布可近似地估计总体的分布.从本例可 以看出,要比较准确地反映出总体70 分布的情况,必须准确地作出
[140,15 0)
人数
4
8
x
5
3
生产能 力分组 人数
表2:
[110, 120)
6
[120,130) [130,14 0)
y
36
[140,15 0)
18
(1)先确定x、y,再完成下列频率分布直方图,就生产能力而言, A类工人中个体间的差异程度与B类工人中个体间的差异程度哪 个更小?(不用计算,可通过观察直方图直接回答结论)
比;所有组距的频率之和为1;每一组距的频率是频率分布直方图中该
组距所对应的矩形的面积.
解
(1)M=0.102
=50,m=50-(1+4+20+15+8)=2n,N =m1,
高三数学总复习课件第10篇第2节用样本估计总体
1.一个容量为 20 的样本.已知某组的频率为 0.25,则该组的频数为( B ) (A)2 (B)5 (C)15 (D)80 解析:设该组的频数为 a,由2a0=0.25,得 a=5.故选 B. 2.(教材改编题)某赛季,甲、乙两名篮球运动员都参加了 11 场比赛,他们每场比赛得 分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为( A )
第2节 用样本估计总体
考纲展示
考纲解读
1.了解分布的意义和作用,会列频率分布表,能 根据频率分布表画频率分布直方图、频率折线图 、茎叶图,体会它们各自的特点.
2.理解样本数据标准差的意义和作用,会计算 数据标准差(不要求记忆公式). 3.能从样本数据中提取基本的数字特征(如平均 数、标准差),并作出合理的解释. 4.会用样本的频率分布估计总体分布,会用样 本的基本数字特征估计总体的基本数字特征,理 解用样本估计总体的思想.
6
6
=1223,
∴ x 甲= x 乙,s 甲 2>s 乙 2,
由此可以说明,甲、乙二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优 秀.
当两对象平均数值相同时,用方差来区分其稳定性.
【例 1】 (2009 年高考上海卷)在发生某公共卫生事件期间,有专业机构认为该事件在一 段时间内没有发生大规模群体感染的标志为“连续 10 天,每天新增疑似病例不超过 7 人”.根 据过去 10 天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
(3)小矩形高的画法:据频数比来画,假设频数为1的小 矩形的高为h,则频数为k的小矩形的高为kh.
茎叶图的应用
【例 2】 (2009 年高考安徽卷)某良种培育基地正在培育一种小麦新品种 A,将其与原有
高三数学一轮课件:第10章 第2节 用样本估计总体
第十章 统计与概率
第十二页,编辑于星期日:二十二点 四十分。
走向高考 ·高考总复习 ·人教A版 ·数学
1.(文)(2014·唐山一模)下图的茎叶图表示柜台记录的一天
销售额情况(单位:元),则销售额的中位数是( )
[解析] (1)依题意得,10×(2a+0.02+0.03+0.04)=1,解 得a=0.005.
(2)这100名学生语文成绩的平均分为:55×0.05+65×0.4 +75×0.3+85×0.2+95×0.05=73(分).
第十章 统计与概率
第二十九页,编辑于星期日:二十二点 四十分。
走向高考 ·高考总复习 ·人教A版 ·数学
第十章 统计与概率
第二十七页,编辑于星期日:二十二点 四十分。
走向高考 ·高考总复习 ·人教A版 ·数学
(1)求图中a的值; (2)根据频率分布直方图,估计这100名学生语文成绩的平 均分; (3)若这100名学生语文成绩某些分数段的人数(x)与数学成 绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90) 之外的人数.
4.众数:在一组数据中,出现次数__最__多____的数(若有两 个或几个数据出现得最多,且出现的次数一样,这些数据都是 这组数据的众数;若一组数据中,每个数据出现的次数一样 多,则认为这组数据没有众数).在频率分布直方图中,众数是 __最__高____小矩形中点的横坐标.
第十章 统计与概率
第十页,编辑于星期日:二十二点 四十分。
走向高考 ·高考总复习 ·人教A版 ·数学
(理)(2013·哈尔滨四校统考)甲、乙、丙、丁四人参加某运动
高考数学一轮复习第10章第2节用样本估计总体课件理
A.2012 年至 2013 年研发投入占营收比增量相比 2017 年至 2018 年增量大 B.2013 年至 2014 年研发投入增量相比 2015 年至 2016 年增量小 C.该企业连续 12 年研发投入逐年增加 D.该企业连续 12 年来研发投入占营收比逐年增加
解析:选 D 对于 A,2012 年至 2013 年研发投入占营收比增量为 13.5%-11.5%= 2%,2017 年至 2018 年研发投入占营收比增量为 14.9%-14.6%=0.3%,A 正确;对于 B, 2013 年至 2014 年研发投入增量为 32-30=2(十亿元),2015 年至 2016 年研发投入增量 为 60-41=19(十亿元),B 正确;对于 C,由题图易知该企业连续 12 年研发投入逐年增 加,C 正确;对于 D,由题图知 2008 年至 2009 年研发投入占营收比是减少的,D 错误.故 选 D.
►常用结论 平均数、方差的公式推广 (1)若数据 x1,x2,…,xn 的平均数为-x ,那么 mx1+a,mx2+a,mx3+a,…,mxn +a 的平均数是 m-x +a. (2)数据 x1,x2,…,xn 的方差为 s2. ①数据 x1+a,x2+a,…,xn+a 的方差也为 s2; ②数据 ax1,ax2,…,axn 的方差为 a2s2.
[考情分析]
[核心素养]
频率分布直方图、茎叶图及其应用,将是 2021 年 1.数据分析
高考考查的热点,题型将是选择题或填空题,分值为 5 2.数学运算
分,也可能与概率结合一起在解答题中出现.
1
课 前 ·基 础 巩 固
‖知识梳理‖ 1.作频率分布直方图的步骤 (1)求极差(即一组数据中 1 _最__大__值____与 2 __最__小__值___的差); (2)决定 3 __组__距_____与 4 __组__数_____; (3)将数据 5 ___分__组__________; (4)列 6 ____频__率__分__布__表_________; (5)画 7 ___频__率__分__布__直__方__图______.
高考一轮复习第10章统计统计案例第2讲用样本估计总体
第二讲 用样本估计总体知识梳理·双基自测 知识梳理知识点一 用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤为:①_求极差__;②_决定组距与组数__;③_将数据分组__;④_列频率分布表__;⑤_画频率分布直方图__.(2)频率分布折线图顺次连接频率分布直方图中_各小长方形上端的中点__,就得到频率分布折线图. (3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息. 知识点二 茎叶图(1)茎叶图中茎是指_中间__的一列数,叶是从茎的_旁边__生长出来的数.(2)茎叶图的优点是可以_保留__原始数据,而且可以_随时__记录,这对数据的记录和表示都能带来方便.知识点三 样本的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =_x 1+x 2+…+x nn__,反映了一组数据的平均水平.(4)标准差: s =_1n[x 1-x2+x 2-x2+…+x n -x2]__,反映了样本数据的离散程度.(5)方差:s 2=_1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度.重要结论(1)若一组数据x i (i =1,2,…,n)的平均数为x -,方差为s 2,则数据组ax i +b(i =1,2,…,n ,a ,b 为常数)的平均数为a x -+b ,方差为a 2·s 2.(2)频率分布直方图与众数、中位数与平均数的关系 ①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的,均为12.③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 走进教材2.(P 81A 组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )A .95,94B .92,86C .99,86D .95,91[解析]由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .3.(P 7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有_25__人.[解析]100×(0.5×0.5)=25(人).题组三走向高考4.(2020·新课标Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为( C )A.0.01 B.0.1C.1 D.10[解析]∵样本数据x1,x2,…,x n的方差为0.01,∴根据任何一组数据同时扩大几倍方差将变为平方倍增长,∴数据10x1,10x2,…,10x n的方差为:100×0.01=1,故选C.5.(2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( B )A.10 B.18C.20 D.36[解析]直径落在区间[5.43,5.47)的频率为(6.25+5)×0.02= 0.225,则被抽取的零件中,直径落在区间[5.43,5.47)内的个数为0.225×80 =18个,故选B.考点突破·互动探究考点一频率分布直方图——自主练透例1 (1)(2021·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:组号分组频数频率第1组[160,165) 0.100笫2组[165,170) ①第3组[170,175) 20 ②第4组[175,180) 20 0.200第5组[180,185) 10 0.100合计100 1.00(ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.(2)(2021·福建漳州质检)2018年9月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达52亿元.某青年志愿者组织调查了某地区的50个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:[0,2 000],(2 000,4 000],(4 000,6 000],(6 000,8 000],(8 000,10 000](单位:元),得到如图所示的频率分布直方图.(ⅰ)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表);(ⅱ)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这50户损失超过4 000元的农户中随机抽取2户进行重点帮扶,设抽出损失超过8 000元的农户数为X,求X的分布列和数学期望.[解析](1)(ⅰ)第1组的频数为100×0.100=10,所以①处应填的数为100-(10+20+20+10)=40, 从而第2组的频率为40100=0.400.②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200. 频率分布直方图如图所示.(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:第3组:2050×5=2,第4组:2050×5=2,第5组:1050×5=1,所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试. (ⅲ)记“第4组至少有一名选手被考官A 面试”为事件A , 则P(A)=C 12C 13+C 22C 25=710. ⎝ ⎛⎭⎪⎫或P A =1-P A -=1-C 23C 25=710 (2)(ⅰ)记每个农户的平均损失为x -元,则x -=1 000×0.3+3 000×0.4+5 000×0.18+7 000×0.06+9 000×0.06=33 601;(ⅱ)由频率分布直方图,可得损失超过 4 000元的农户共有(0.000 09+0.000 03+0.000 03)×2 000×50=15(户),损失超过8 000元的农户共有0.000 03×2 000×50=3(户),随机抽取2户,则X 的可能取值为0,1,2; 计算P(X =0)=C 212C 215=2235,P(X =1)=C 112C 13C 215=1235,P(X =2)=C 23C 215=135.所以X 的分布列为:X0 1 2P2235 1235 135数学期望为E(X)=0×2235+1×1235+2×135=25.名师点拨应用频率分布直方图时的注意事项用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.〔变式训练1〕(1)(2021·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为_220__.(2)(2021·山西适应性考试)某病毒引起的肺炎的潜伏期平均为7天左右,短的约2~3天,长的约10~14天,甚至有20余天.某医疗机构对400名确诊患者的潜伏期进行统计,整理得到以下频率分布直方图.根据该直方图估计:要使90%的患者显现出明显病状,需隔离观察的天数至少是( C )A .12B .13C .14D .15[解析] (1)根据频率分布直方图知: (2a +0.04+0.03+0.02)×10=1⇒a =0.005; 计算出数学成绩不低于100分的频率为: (0.03+0.02+0.005)×10=0.55;所以这次测试数学成绩不低于100分的人数为0.55×400=220人.(2)由题可知,第一,二,三,四,五组的频率分别为0.16,0.4,0.32,0.08,0.04. 因为前三组的频率和为0.88, 故要使90%的患者显现出明显病状,则需隔离观察的天数至少是:13+0.9-0.880.02=14,故选C .考点二 茎叶图——师生共研例2 (多选题)(2021·四川省乐山市调研改编)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A ,现从a ,b 两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法正确的是( ABD )A .x a <x bB .a 的方差大于b 的方差C .b 品种的众数为3.31D .a 品种的中位数为3.27 [解析] 由茎叶图得:b 品种所含β-胡萝卜素普遍高于a 品种, ∴x a <x b ,故A 正确;a 品种的数据波动比b 品种的数据波动大, ∴a 的方差大于b 的方差,故B 正确; b 品种的众数为3.31与3.41,故C 错误; a 品种的数据的中位数为:3.23+3.312=3.27,故D 正确.名师点拨茎叶图的绘制及应用(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.〔变式训练2〕(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 与y 的值分别为( A )A .3,5B .5,5C .3,7D .5,7[解析] 甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x =3.故选A . 考点三 样本数字特征——多维探究 角度1 样本数字特征与频率分布直方图例3 (1)如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( B )A .12.5,12.5B .12.5,13C .13,12.5D .13,13[解析] 由频率分布直方图可知,众数为10+152=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x ,则(x -10)×0.1=0.5-0.2,解得x =13.角度2 样本数字特征与茎叶图(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:⎪⎪⎪897 74 0 1 0 x 9 1则7个剩余分数的方差为_367__.[解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4,∴s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.角度3 样本数字特征的计算(3)(2021·湖北武汉、襄阳、荆门、宜昌四地六校考试联盟联考)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差s 2为( C )A .52B .3C .72D .4[解析] 设某7个数据分别为a 1,a 2,…,a 7, 则由题意得a 1+a 2+…+a 7=5×7=35, (a 1-5)2+(a 2-5)2+…+(a 7-5)2=4×7=28, 加入新数据5后的平均数x -=35+58=5,方差s 2=a 1-52+a 2-52+…+a 7-52+5-528=288=72.故选C .名师点拨平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.〔变式训练3〕(1)(角度1)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为_155__,平均数为_156.8__.(2)(角度2)(2021·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )A .89 54.5B .89 53.5C .87 53.5D .89 54(3)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2:其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s′2,则x -′,s′2分别为( C )A .3x -+2,3s 2+2 B .3x -,3s 2C .3x -+2,9s 2D .3x -+2,9s 2+2[解析] (1)中位数为:150+(170-150)×0.10.02×20=155.该组数据的平均数为x =0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.(2)由题可知,中位数为:87+912=89,先求平均数:x -=78+79+84+86+87+87+91+94+98+98+99+9912=90,S 2=112[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,故中位数为:89,方差为53.5,故选:B .(3)显然x -′=3x -+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a ,则方差变为原方差的a 2倍,故选C .考点四 折线图——师生共研例4 (多选题)(2021·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论不正确的是( BCD )A .连续三天日平均温度的方差最大的是7日,8日,9日三天B .这15天日平均温度的极差为15 ℃C .由折线图能预测16日温度要低于19 ℃D .由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数[解析] A 选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B 选项,这15天日平均温度的极差为18 ℃,B 错;C 选项,由折线图无法预测16日温度是否低于19 ℃,故C 错误;D 选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D 错误.故选B 、C 、D .名师点拨折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.〔变式训练4〕(多选题)甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为x -甲、x -乙,则( BC )A .每次考试甲的成绩都比乙的成绩高B .甲的成绩比乙稳定C .x -甲一定大于x -乙D .甲的成绩的极差大于乙的成绩的极差[解析] 第二次考试甲的成绩比乙低,A 错;由图可知甲的成绩比乙的成绩波动小,B 正确,D 错;甲的平均成绩显然比乙的平均成绩高,C 正确;故选B 、C .名师讲坛·素养提升 高考与频率分布直方图例5 (2021·安徽省池州市期末)高三年级某班50名学生期中考试数学成绩的频率分布直方图如图所示,成绩分组区间为:[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150].其中a ,b ,c 成等差数列且c =2a ,物理成绩统计如表.(说明:数学满分150分,物理满分100分)分组 [50,60) [60,70) [70,80) [80,90) [90,100]频数6920105(1)根据频率分布直方图,请估计数学成绩的平均分; (2)根据物理成绩统计表,请估计物理成绩的中位数;(3)若数学成绩不低于140分的为“优”,物理成绩不低于90分的为“优”,已知本班中至少有一个“优”同学总数为6人,从此6人中随机抽取3人.记X 为抽到两个“优”的学生人数,求X 的分布列和期望值.[解析] (1)根据频率分布直方图得, (a +b +2c +0.024+0.020+0.004)×10 =1, 又因a +c =2b ,c =2a ,解得a =0.008,b =0.012,c =0.016, 故数学成绩的平均分x -=85×0.04+95×0.12+105×0.16+115×0.2+125×0.24 +135×0.16+145×0.08=117.8(分),(2)总人数50分,由物理成绩统计表知,中位数在成绩区间[70,80), 所以物理成绩的中位数为75分.(3)数学成绩为“优”的同学有4人,物理成绩为“优”有5人,因为至少有一个“优”的同学总数为6名同学,故两科均为“优”的人数为3人,故X 的取值为0、1、2、3.P(X =0)=C 33C 36=120,P(X =1)=C 13C 23C 36=920,P(X =2)=C 23C 13C 36=920,P(X =3)=C 33C 36=120,所以分布列为:X 0 1 2 3 P120920920120∴期望值为E(X)=0×120+1×920+2×920+3×120=32.名师点拨(1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系. (2)准确理解频率分布直方图的数据特点是解题关键. 〔变式训练5〕(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).[解析](1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。
(新课改地区)2021版高考数学一轮复习第十章用样本估计总体ppt课件新人教B版
典题索引 考点一、T1,4 考点二、例
3 样本值与估计值之间的关系、频率分布直方图的性质 考点三、角度1
4 各样本数字特征的意义考点 Nhomakorabea、角度3
【教材·基础自测】 1.(必修3P62例改编)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所 示,则这组数据的中位数和平均数分别是 ( ) A.91.5和91.5 B.91.5和92 C.91和91.5 D.92和92
(2)标准差、方差
①标准差:样本数据到平均数的一种平均距离,一般用s表示,
s= n1[(x1-x)2+(x2-x)2+…+(xn-x)2] . ②方差:标准差的平方s2:
s2=
1 n
[(x1-
x
)2+(x2- x
)2+…+(xn- x
)2].
其中xi(i=1,2,3,…,n)是样本数据,n是样本容量, x 是样本平均数.
【知识点辨析】 (正确的打“√”,错误的打“×”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. ( ) (2)一组数据的方差越大,说明这组数据越集中. ( ) (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大. () (4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相 同的数据可以只记一次. ( )
【解析】选A.这组数据由小到大排列为87,89,90,91,92,93,94,96,所以中位数
是 91+92 =91.5,
2
平均数 x = 87+89+90+91+92+93+94+96
8
=91.5.
2.(必修3P65例1改编)为评估一种农作物的种植效果,选了n块地作试验田.这n块
高考数学一轮复习 用样本估计总体课件
C. 3
D. 4
解析:四种说法都正确,甲队的平均进球数多于乙队,故
第一句正确;乙队标准差较小,说明技术水平稳定;甲队
平均进球数是3.2,但其标准差却是3,离散程度较大,由
此可判断甲队表现不稳定;平均进球数是1.8,标准差只有
0.3,每场的进球数相差不多,可见乙队的确很少不进球. 答案:D
4.如图是某兴趣小组学生在一次数学测验中 的得分茎叶图,则该组男生的平均得分与
图的一部分(如下图),已知从左到右前5个小组的频率分别 为0.04,0.10,0.14,0.28,0.30.第6小组的频数是7.
(1)请将频率分布直方图补充完整;
(2)该校参加这次铅球测试的男生有多少人?
(3)若成绩在8.0米以上(含8.0米)的为合格,试求这次铅球 测试的成绩的合格率; (4)在这次测试中,你能确定该校参加测试的男生铅球成 绩的众数和中位数各落在哪个小组内吗?
(3)频率分布表和频率分布直方图是一组数据频率分布的两 种形式,前者准确,后者直观. (4)众数为最高矩形中点的横坐标. (5)中位数为平分频率分布直方图面积且垂直于横轴的直线 与横轴交点的横坐标.
为了了解某校初中毕业男生的体能状况,从该校 初中毕业班学生中抽取若干名男生进行铅球测试,把所得
数据(精确到0.1米)进行整理后,分成6组画出频率分布直方
[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=
∴乙稳定.
答案:乙
频率分布直方图反映样本的频率分布:
(1)频率分布直方图中横坐标表示组距,纵坐标表示
频率=组距×
,
(2)频率分布直方图中各小长方形的面积之和为1,因此在 频率分布直方图中组距是一个固定值,所以各小长方形高 的比也就是频率比.
高三数学一轮复习讲义(用样本估计总体)学生
课题:用样本估计总体知识点一、频率分布直方图1.频率分布直方图(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的特征数估计总体的特征数.(2)在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.2.频率分布折线图和总体密度曲线 (1)频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图. (2)总体密度曲线随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.统计中称之为总体分布的密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.3.作频率分布直方图的步骤:(1)作出频率分布表:①求极差(即一组数据中最大值与最小值得差)②决定组距和组数:绘制频数分布表和频数分布直方图时要将一批数据分组,•组距和组数的确定没有固定的标准,通常数据越多,所分的组数也越多,当数据在100个以内时,•根据数据的多少常分成5─12组.一般地,所分的小组里含最小值,不含最大值,•即数据x 满足a ≤x<b(2)建立直角坐标系:X 轴为组距;Y 轴为频率/组距4.在频率直方图中,众数是最高的小长方形的底边的中点横坐标的值;中位数是所有小长方形的面积相等的分界线;平均数是各小长方形底边中点的横坐标与对应频率的积的和.【典型例题】【例1】(2023·全国·高三专题练习)某校1000名学生参加数学竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( ) A .频率分布直方图中aB .估计这20名学生数学考试成绩的第60百分位数为80C .估计这20名学生数学考试成绩的众数为80D .估计总体中成绩落在[50,60)内的学生人数为110【例2】(2022·天津滨海新·模拟预测)某品牌家电公司从其全部200名销售员工中随机抽出50名调查销售情况,销售额都在区间[5,25](单位:百万元)内,将其分成5组:[5,9),[9,13,[13,17),[17,21),[21,25],并整理得到如下的频率分布直方图,下列说法正确的是( ) A .频率分布直方图中aB .估计全部销售员工销售额的中位数为15C .估计全部销售员工中销售额在区间[9,13内有64人D .估计全部销售员工销售额的第75百分位数为17【例3】(2022·全国·模拟预测)(多选)某城市地铁交通建设项目已经基本完成,为了解市民对该项目的满意度,分别从不同地铁站点随机抽取1000名市民对该项目进行评分,统计发现评分均在[]40,100内,把评分分成[)40,50,[)50,60,[)60,70,[)70,80,[)80,90,[]90,100六组,并绘制成频率分布直方图(如图所示).则下列判断正确的是( ) A .图中aB .该次满意度评分的平均分为85C .该次满意度评分的众数为85D .大约有34%的市民满意度评分在[)60,80内【例4】从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a ,b 的值;【举一反三】1.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a =_________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为_________.2.(2022·全国·高三专题练习)某区政府组织了以“不忘初心,牢记使命”为主题的教育活动,为统计全区党员干部一周参与主题教育活动的时间,从全区的党员干部中随机抽取n 名,获得了他们一周参与主题教育活动时间(单位:h )的频率分布直方图如图所示,已知参与主题教育活动时间在(]12,16内的人数为92. (1)求n 的值;(2)以每组数据所在区间的中点值作为本组的代表,估算这些党员干部参与主题教育活动时间的中位数(中位数精确到0.01).(3)如果计划对参与主题教育活动时间在(]16,24内的党员干部给予奖励,且在(]16,20,(]20,24内的分别评为二等奖和一等奖,那么按照分层抽样的方法从获得一、二等奖的党员干部中选取5人参加社区义务宣讲活动,再从这5人中随机抽取2人作为主宣讲人,求这2人均是二等奖的概率.知识点二、茎叶图茎叶图:定义是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数画法对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎优缺点用茎叶图表示数据的优点是:(1)所有的信息都可以从茎叶图中得到;(2)便于记录和读取,能够展示数据的分布情况.缺点是:当样本数据较多或数据位数较多时,茎叶图就显得不太方便【典型例题】【例1】为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h ),试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间: 服用B 药的20位患者日平均增加的睡眠时间: (1)作出茎叶图;(2)从茎叶图看,哪种药的疗效更好?A 药B 药 0. 1. 2.3.【例2】某中学高三年级从甲、乙两个班级各选出8名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生成绩的平均分是86,乙班学生成绩的中位数是83,则x y +的值为( ) A .9 B .10 C .11 D .13【举一反三】1.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)如图I 所示;若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为( )A 、3B 、4C 、5D 、6 2.某车间20名工人年龄数据如下表:年龄(岁) 工人数(人)19 1 28 3 29 3 30 5 31 4 32 3 40 1 合计20知识三、用样本的数字特征估计总体的数字特征1.用样本的特征数估计总体的特征数 (1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数:样本数据的算术平均数,即12n 1(x +x +...+x )x n=. 在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差 样本方差2222121[()()...()]n s x x x x x x n=-+-++- 标准差222121[()()...()]n s x x x x x x n=-+-++-其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.2.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.3.在频率直方图中,众数是最高的小长方形的底边的中点横坐标的值;中位数是所有小长方形的面积相等的分界线;平均数是各小长方形底边中点的横坐标与对应频率的积的和.4.平均数与方差都是重要的特征数,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,掌握公式不难求出,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.【典型例题】【例1】对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( ) A .46,45,56 B .46,45,53 C .47,45,56 D .45,47,53【例2】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[)[)00.50.5,1⋅⋅⋅,,,[]4,4.5分成9组,制成了如图所示的频率分布直方图.(1)求直方图中的a 值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.请说明理由;(3)估计居民月均用水量的中位数.【举一反三】1.某市高三学生数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,若130~140分数段的人数为90人,则90~100分数段的人数为_____.2.(2022·新疆克拉玛依·三模(文))第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中a 的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.【课堂巩固】1.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( ) A .众数 B .平均数 C .中位数 D .标准差2.某班学生一次数学考试成绩频率分布直方图如图所示,数据分组依次为]150,130[),130,110[),110,90[),90,70[,若成绩大于等于90分的人数为36,则成绩在)130,110[的人数为()A.12B.9C.15D.183.为了研究某药物的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,右图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.184.以下茎叶图记录了甲.乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为.【课后练习】正确率:__________1.某学校高一、高二、高三年级的学生人数之比为4:3:3,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则从高二年级抽取的学生人数为()A.15 B.20 C.25 D.302.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析。
第10章 第2节 用样本估计总体-2023届高三一轮复习数学精品备课(新高考人教A版2019)
基础知识·自主回顾
知识梳理
1.作频率分布直方图的步骤
(1)求极差(即一组数据中_最_大__值__与_最_小__值__的差); (2)决定_组_距__与组__数__; (3)将数据_分_组__; (4)列_频__率__分_布__表__; (5)画_频__率_分__布__直__方__图__.
记 C 为事件:“乙离子残留在体内的百分比不低于 5.5”,
根据直方图得到 P(C)的估计值为 0.70. (1)求乙离子残留百分比直方图中 a,b 的值; (2)分别估计甲、乙离子残留百分比的平均值(同一组中 的数据用该组区间的中点值为代表).
[自主解答] (1)由已知得 0.70=a+0.20+0.15, 故 a=0.35.b=1-0.05-0.15-0.70=0.10. (2)甲离子残留百分比的平均值的估计值为 2 × 0.15 + 3×0.20 + 4×0.30 + 5×0.20 + 6×0.10 + 7×0.05=4.05. 乙离子残留百分比的平均值的估计值为 3 × 0.05 + 4×0.10 + 5×0.15 + 6×0.35 + 7×0.20 + 8×0.15=6.00.
A.3,5 C.3,7
B.5,5 D.5,7
[自主解答] (1)根据两组数据的中位数相等可得 65=60+y,解得 y=5,又它们的平均值相等, 所以56+62+65+574+(70+x) =59+61+67+5(60+y)+78, 解得 x=3.故选 A.
(2)某调查机构对全国互联网行业进行调查统计 ,得到 整个互联网行业从业者年龄分布饼状图,90 后从事互联网 行业者岗位分布条形图,则下列结论中不一定正确的是 ()
D.极差
解析 设 9 位评委评分按从小到大排列为 x1<x2<x3<x4…<x8<x9.则原始中位数为 x5,去掉最低分 x1,最 高分 x9,后剩余 x2<x3<x4…<x8,中位数仍为 x5,故选 A.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
知识衍化体验
考点聚集突破
(2)频率分布直方图:反映样本频率分布的直方图(如图)
@《创新设计》
频率 横轴表示样本数据,纵轴表示__组__距___,每个小矩形的面积表示样本落在该组内的
__频__率__.
3
知识衍化体验
考点聚集突破
@《创新设计》
2.茎叶图 统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁 边生长出来的数.
面积为13P,P+13P=1,P=34,则中间一个小矩形的面积等于13P=14,200×14=50,
即该组的频数为 50. 答案 50
17
知识衍化体验
考点聚集突破
@《创新设计》
考点一 茎叶图及其应用 【例1】 (1)(2018·济南模拟)中国诗词大会的播出引发了全民的读书热,某小学语文老
师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规 定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生 得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的 成就按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人” 称号的人数为( )
14
知识衍化体验
考点聚集突破
@《创新设计》
5.(2019·新余二模)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中 随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40 人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所 示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是( )
22
知识衍化体验
考点聚集突破
【训练1】 空气质量指数 (Air Quality Index,简称AQI)是定量描述 空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优; 51~100为良;101~150为轻度污染;151~200为中度污染;201~ 300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI 记录数据中,随机抽取10个,用茎叶图记录如下.根据该统计数据, 估计此地该年AQI大于100的天数约为________(该年为365天). 解析 该样本中 AQI 大于 100 的频数是 4,频率为25, 由此估计该地全年 AQI 大于 100 的频率为25, 估计此地该年 AQI 大于 100 的天数约为 365×25=146. 答案 146
A.2
20
B. 2
C.10
D. 10
知识衍化体验
考点聚集突破
@《创新设计》
解析 (1)由茎叶图可得,获“诗词达人”称号的有 8 人,据该次比赛的成就按照称 号的不同进行分层抽样抽选 10 名学生,则抽选的学生中获得“诗词达人”称号的 人数为 8×1400=2(人). (2)甲地该月5天11时的气温数据(单位:℃)为28,29,30,30+m,32; 乙地该月5天11时的气温数据(单位:℃)为26,28,29,31,31, 则乙地该月11时的平均气温为(26+28+29+31+31)÷5=29(℃), 所以甲地该月11时的平均气温为30 ℃, 故(28+29+30+30+m+32)÷5=30,解得m=1. 则甲地该月11时的平均气温的标准差为
15×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]= 2. 答案 (1)A (2)B
21
知识衍化体验
考点聚集突破
@《创新设计》
规律方法 1.茎叶图的三个关注点 (1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏. (3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重 心”下移者平均数较大,数据集中者方差较小. 2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息.
15
知识衍化体验
考点聚集突破
@《创新设计》
A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关 C.倾向选择生育二胎的人员中,男性人数与女性人数相同 D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数 解析 由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不生 育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中, 男性人数为60×60%=36,女性人数为40×60%=24,不相同.故选C. 答案 C
8
知识衍化体验
考点聚集突破
@《创新设计》
解析 (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势. (2)错误.方差越大,这组数据越离散.
频率 (3)正确.小矩形的面积=组距×组距=频率. (4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录, 故(4)错误. 答案 (1)√ (2)× (3)√ (4)×
[微点提醒] 1.频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面 积乘以小长方形底边中点的横坐标之和.
6
知识衍化体验
考点聚集突破
18
知识衍化体验
考点聚集突破
@《创新设计》
9810
2 0
5 1
6 2
8 4
5
7
8
70 2 2 3 3 3 4 5 5 6 9
6506
2 6
2 8
3 9
4
4
4
5
7
7
8
9
A.2
B.4
C.5
D.6
19
知识衍化体验
考点聚集突破
@《创新设计》
(2)(2019·长沙质检)为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的 气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地 该月11时的平均气温高1 ℃,则甲地该月11时的平均气温的标准差为( )
@《创新设计》
@《创新设计》
4.(2018·全国Ⅰ卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现 翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后 农村的经济收入构成比例,得到如图所示的饼图:
12
知识衍化体验
考点聚集突破
@《创新设计》
则下面结论中不正确的是( ) A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
@《创新设计》
2.平均数、方差的公式推广 (1)若数据 x1,x2,…,xn 的平均数为-x,那么 mx1+a,mx2+a,mx3+a,…,mxn+a 的平均数是 m-x+a. (2)数据 x1,x2,…,xn 的方差为 s2. ①数据 x1+a,x2+a,…,xn+a 的方差也为 s2; ②数据 ax1,ax2,…,axn 的方差为 a2s2.
1
知识衍化体验
考点聚集突破
@《创新设计》
知识梳理 1.频率分布直方图
(1)频率分布表的画法: 极差
第一步:求_极__差___,决定组数和组距,组距=__组__数____; 第二步:__分__组__,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表.
13
知识衍化体验
考点聚集突破
@《创新设计》
解析 法一 设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由 饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村 建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业 收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的. 法二 因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A 是错误的. 答案 A
7
知识衍化体验
考点聚集突破
基础自测
@《创新设计》
1.判断下列结论正误(在括号内打“√”或“×”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (2)一组数据的方差越大,说明这组数据越集中.( ) (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越 大.( ) (4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相 同的数据可以只记一次.( )
24
知识衍化体验
考点聚集突破
@《创新设计》
(1)求x; (2)求抽取的x人的年龄的中位数(结果保留整数);
25
知识衍化体验
考点聚集突破
@《创新设计》
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依 次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和 5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组 中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98, 94,95,90. (ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差; (ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度, 并谈谈你的感想.
(4)标准差与方差:设一组数据 x1,x2,x3,…,xn 的平均数为-x,则这组数据 的标准差和方差分别是
s= 1n[(x1--x)2(x2--x)2+…+(xn--x)2], s2=1n[(x1--x)2+(x2--x)2+…+(xn--x)2].
@《创新设计》