2015届高考数学一轮总复习 10-2用样本估计总体

合集下载

高考数学一轮复习第2讲 用样本估计总体

高考数学一轮复习第2讲 用样本估计总体

第2讲用样本估计总体1.用样本的频率分布估计总体分布(1)作频率分布直方图的步骤①求极差(01最大值与02最小值的差).03组距与04组数.05分组.06频率分布表.07频率分布直方图.(2)频率分布折线图和总体密度曲线08中点,就得到频率分布折线图.09样本容量的增加,作图时10所分的组数增加,11组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图12中间的一列数,叶是从茎的13旁边生长出来的数.2.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x -=14x1+x2+…+xn n ,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s = 15 错误!.(5)方差:s 2=161n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x -是样本平均数).1.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.标准差与方差的特点反映了各个样本数据聚集于样本平均数周围的程度.标准差(方差)越小,表明各个样本数据在样本平均数周围越集中;标准差(方差)越大,表明各个样本数据在样本平均数的两边越分散.3.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a .(2)若数据x 1,x 2,…,x n 的方差为s 2,则: ①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.2.(2020·云川贵百校联考)某课外小组的同学们从社会实践活动中调查了20户家庭某月的用电量,如下表所示:用电量/度120140160180200户数2358 2 则这20户家庭该月用电量的众数和中位数分别是()A.180,170 B.160,180C.160,170 D.180,160答案 A解析用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B,C;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.3.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为()A.28 B.40 C.56 D.60 答案 B解析设中间一个小长方形的面积为x,其他8个长方形的面积和为52x,因此x+52x=1,所以x=27.所以中间一组的频数为140×27=40.故选B.4.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案 A解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.5.(2020·全国卷Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01 B.0.1C.1 D.10答案 C解析因为数据ax i+b(i=1,2,…,n)的方差是数据x i(i=1,2,…,n)的方差的a2倍,所以所求数据的方差为102×0.01=1.故选C.6.对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为 .答案50解析根据题中的频率分布直方图可知,三等品的频率为1-(0.0500+0.0625+0.0375)×5=0.25,因此该样本中三等品的件数为200×0.25=50.多角度探究突破考向一统计图表及应用角度1扇形图例1(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案 A解析设新农村建设前的收入为M,则新农村建设后的收入为2M,新农村建设前种植收入为0.6M,新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A 不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,所以C正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选A.角度2折线图例2(多选)(2020·海南高考调研)如图所示的折线图是2020年1月25日至2020年2月12日陕西省及西安市新冠肺炎累计确诊病例的折线图,则下列判断正确的是()A.1月31日陕西省新冠肺炎累计确诊病例中西安市占比超过了1 3B.1月25日至2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势C.2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了97例D.2月8日到2月10日西安市新冠肺炎累计确诊病例的增长率大于2月6日到2月8日的增长率答案ABC解析1月31日陕西省新冠肺炎累计确诊病例共有87例,其中西安32例,所以西安市所占比例为3287>13,故A 正确;由折线图可知,1月25日到2月12日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势,故B 正确;2月2日后到2月10日陕西省新冠肺炎累计确诊病例增加了213-116=97例,故C 正确;2月8日到2月10日西安市新冠肺炎累计确诊病例增加了98-8888=544,2月6日到2月8日西安市新冠肺炎累计确诊病例增加了88-7474=737,显然737>544,故D 错误.角度3 频率分布直方图例3 (1)(2020·天津高考)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A .10B .18C .20D .36答案 B解析 根据频率分布直方图可知,直径落在区间[5.43,5.47)之间的频率为(6.25+5.00)×0.02=0.225,则直径落在区间[5.43,5.47)内零件的个数为80×0.225=18.故选B.(2)(多选)(2020·临沂模拟)在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中正确的有( )A.成绩在[70,80]分的考生人数最多B.不及格的考生人数为1000人C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分答案ABC解析根据频率分布直方图得,成绩出现在[70,80]的频率最大,故A正确;不及格考生数为10×(0.010+0.015)×4000=1000,故B正确;根据频率分布直方图估计考试的平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C 正确;0.1+0.15+0.2=0.45<0.5,0.1+0.15+0.2+0.3=0.75>0.5,所以考生竞赛成绩的中位数为70+0.5-0.450.3×10≈71.67,故D错误.故选ABC. 常见统计图的特点(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)准确理解频率分布直方图的数据特点①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆;②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.1.(2020·葫芦岛模拟)书籍是人类的智慧结晶和进步阶梯,阅读是一个国家的文化根基和创造源泉.2014年以来,“全民阅读”连续6年被写入政府工作报告.某高中为了解学生假期自主阅读书籍类型,在全校范围内随机抽取了部分学生进行调查.学生选择的书籍大致分为以下四类:A历史类、B文学类、C科学类、D哲学类.根据调查的结果,将数据整理成如下的两幅不完整的统计图,其中a-b=10.根据上述信息,可知本次随机抽查的学生中选择A历史类的人数为()A.45 B.30C.25 D.22答案 B解析由题可知,样本容量为30-180.1=120,所以选择A历史类的人数为120-42-30-18=30.故选B.2.(2020·汕头二模)新型冠状病毒疫情发生后,口罩的需求量大增,某口罩工厂为提高生产效率,开展技术创新活动,提出两种新的生产方式,为比较两种生产方式的效率,选取80名工人,将他们随机分成两组,每组40人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.第一种生产方式40名工人完成同一生产任务所用时间(单位:min)如表:68728577838290838984 88877691799087918692 88878176959463878571 96637485929987827569 第二种生产方式40名工人完成同一生产任务所用时间(单位:min)如扇形图所示:(1)请填写第一种生产方式完成任务所用时间的频数分布表并作出频率分布直方图:生产时间[60,70)[70,80)[80,90)[90,100]频数(2)试从扇形图中估计第二种生产方式的平均数;(3)根据频率分布图和扇形图判断哪种生产方式的效率更高?并说明理由.解(1)第一种生产方式完成任务所用时间的频数分布表如下:生产时间[60,70)[70,80)[80,90)[90,100]频数481810频率分布直方图如下:(2)从扇形图中估计第二种生产方式的平均数为65×0.25+75×0.5+85×0.2+95×0.05=75.5 min.(3)从频率分布直方图中估计第一种生产方式的平均数为65×0.1+75×0.2+85×0.45+95×0.25=83.5 min,从平均数的角度发现:用第一种生产方式的工人完成生产任务所需要的时间高于80分钟;用第二种生产方式的工人完成生产任务所需要的时间低于80分钟,因此第二种生产方式的效率更高.考向二用样本估计总体例4(1)(多选)为了了解某校高一年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论正确的是()A.该校高一年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校高一年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校高一年级学生1分钟仰卧起坐的次数超过30次的约有320人D.该校高一年级学生1分钟仰卧起坐的次数少于20次的约有32人答案ABC解析由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校高一年级学生1分钟仰卧起坐的次数超过30次的约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校高一年级学生1分钟仰卧起坐的次数少于20次的约有160人.故A,B,C正确,D错误,故选ABC.(2)(2020·香坊区校级二模)2020年初新冠病毒疫情爆发,全国范围开展了“停课不停学”的线上教学活动.哈六中数学组积极研讨网上教学策略:先采取甲、乙两套方案教学,并对分别采取两套方案教学的班级的7次线上测试成绩进行统计如图所示:①请填写如表(要求写出计算过程)平均数方差甲乙②从下列三个不同的角度对这次方案选择的结果进行分析:a.从平均数和方差相结合看(分析哪种方案的成绩更好);b.从折线图上两种方案的走势看(分析哪种方案更有潜力).解①由图象可得,x-甲=17×(109+111+113+115+117+119+121)=115,x-乙=17×(121+115+109+115+113+117+115)=115,则s2甲=17×(62+42+22+02+22+42+62)=16,s2乙=17×(62+02+62+02+22+22+02)=807≈11.43,故表格第一行:115,16;第二行:115,约为11.43.②a.因为x-甲=x-乙,s2甲>s2乙,故乙方案更好.b.由折线图可知甲走势稳定上升,故甲方案更好.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.(2)方差的简化计算公式:s2=1n[(x21+x2+…+x2n)-n x-2],或写成s2=1n(x21+x2+…+x2n)-x-2,即方差等于原始数据平方的平均数减去平均数的平方.3.某学校共有学生2000人,其中高一800人,高二、高三各600人,学校对学生在暑假期间每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为x-=3小时,方差为s2=1.966,其中三个年级学生每天读书时间的平均数分别为x-1=2.7,x-2=3.1,x-3=3.3,又已知高一学生、高二学生每天读书时间的方差分别为s21=1,s2=2,则高三学生每天读书时间的方差s23= .答案 3解析由题意可得,1.966=8002000×[1+(2.7-3)2]+6002000×[2+(3.1-3)2]+6002000×[s23+(3.3-3)2],解得s23=3.4.(2020·南宁模拟)为了检测某种零件的一条生产线的生产过程,从生产线上随机抽取一批零件,根据其尺寸的数据得到如图所示的频率分布直方图.若尺寸落在区间(x--2s,x-+2s)之外,则认为该零件属于“不合格”的零件,其中x-,s分别为样本平均数和样本标准差,计算可得s≈15(同一组中的数据用该组区间的中点值作代表).(1)求样本平均数的大小;(2)若一个零件的尺寸是100 cm ,试判断该零件是否属于“不合格”的零件.解 (1)x -=35×10×0.005+45×10×0.010+55×10×0.015+65×10×0.030+75×10×0.020+85×10×0.015+95×10×0.005=66.5.(2)x -+2s =66.5+30=96.5,x --2s =66.5-30=36.5,100>96.5,∴该零件属于“不合格”的零件.一、单项选择题1.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x -A 和x -B ,样本标准差分别为s A 和s B ,则( )A.x -A >x -B ,s A >s BB .x -A <x -B ,s A >s B C.x -A >x -B ,s A <s BD .x -A <x -B ,s A <s B答案 B解析 由图可得样本A 的数据都在10及以下,样本B 的数据都在10及以上,所以x -A <x -B ,样本B 的数据比样本A 的数据波动幅度小,所以s A >s B ,故选B.2.在高一期中考试中,甲、乙两个班的数学成绩统计如下表: 班级 人数 平均数 方差甲20x-甲2乙30x-乙3其中x-甲=x-乙,则两个班数学成绩的方差为()A.3 B.2C.2.6 D.2.5答案 C解析由题意可知两个班的数学成绩的平均数为x-=x-甲=x-乙,则两个班数学成绩的方差为s2=2020+30[2+(x-甲-x-)2]+3020+30[3+(x-乙-x-)2]=2020+30×2+3020+30×3=2.6.3.(2020·河南省名校联考)如图给出的是某小区居民一段时间内访问网站的比例图,则下列选项中不超过21%的为()A.腾讯与百度的访问量所占比例之和B.网易与搜狗的访问量所占比例之和C.淘宝与论坛的访问量所占比例之和D.新浪与小说的访问量所占比例之和答案 B解析由于网易与搜狗的访问量所占比例之和为18%,不超过21%,故选B.4.(2020·安庆模拟)某单位统计了本单位的职工一天行走步数(单位:百步)得到如图所示的频率分布直方图,估计该单位职工一天行走步数的平均值为(同一组中的数据用该组区间的中点值为代表)()A.125 B.125.6C.124 D.126答案 B解析由频率分布直方图,估计该单位职工一天行走步数的平均值为x-=60×0.002×20+80×0.006×20+100×0.008×20+120×0.012×20+140×0.010×20+160×0.008×20+180×0.002×20+200×0.002×20=125.6.故选B.5.(2020·威海一模)恩格尔系数是食品支出总额占个人消费支出总额的比重,其数值越小说明生活富裕程度越高.统计改革开放40年来我国历年城镇和农村居民家庭恩格尔系数,绘制了如图的折线图.根据该折线图,下列结论错误的是()A.城镇居民家庭生活富裕程度不低于农村居民家庭B.随着改革开放的不断深入,城镇和农村居民家庭生活富裕程度越来越高C.1996年开始城镇和农村居民家庭恩格尔系数都低于50%D.随着城乡一体化进程的推进,城镇和农村居民家庭生活富裕程度差别越来越小答案 C解析由折线图可知,对于A,因为城镇的恩格尔系数较小,故城镇居民家庭生活富裕程度不低于农村居民,A正确;对于B,城镇和农村的恩格尔系数整体上都在下降,说明城镇和农村居民家庭生活富裕程度越来越高,B正确;对于C,1996~2000年我国农村居民家庭恩格尔系数高于50%,C错误;对于D,结合图形得到城镇和农村家庭恩格尔系数之间的差距越来越小,说明城镇和农村家庭生活富裕程度差别越来越小,D正确.故选C.6.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案 D解析由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确;平均最高气温高于20 ℃的月份为六月、七月、八月,只有3个,D错误.7.某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布扇形图和90后从事互联网行业者岗位分布条形图,则下列结论中不一定正确的是()注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比80后多答案 D解析由题图易知互联网行业从业人员90后占56%,A正确;仅90后从事技术岗位的人数占总人数的0.22176,超过20%,B正确;90后从事运营岗位的人数占总人数的0.56×0.17=0.0952>0.03,C正确;90后从事技术岗位的人数占总人数的0.22176<0.41,而题中未给出80后从事互联网行业岗位分布情况,故D不一定正确.二、多项选择题8.(2020·青岛模拟)近几年,在国家大力支持和引导下,中国遥感卫星在社会生产和生活各领域的应用范围不断扩大,中国人民用遥感卫星系统研制工作取得了显著成绩,逐步形成了气象、海洋、陆地资源和科学试验等遥感卫星系统.如图是2007~2018年中国卫星导航与位置服务产业总体产值规模(万亿)及增速(%)的统计图,则下列结论中正确的是()A.2017年中国卫星导航与位置服务产业总体产值规模达到2550亿元,较2016年增长20.40%B.若2019年中国卫星导航与位置服务产业总体产值规模保持2018年的增速,总体产值规模将达3672亿元C.2007~2018年中国卫星导航与位置服务产业总体产值规模逐年增加,但不与时间成正相关D.2007~2018年中国卫星导航与位置服务产业总体产值规模的增速中有些与时间成负相关答案ABD解析对于A,根据图中数据可知2017年中国卫星导航与位置服务产业总体产值规模达到2550亿元,较2016年增长20.40%,故A正确;对于B,2019年中国卫星导航与位置服务产业总体产值规模保持2018年的增速,即为20%,故2019年总体产值规模为3060×(1+20%)=3672(亿元),故B正确;对于C,根据正相关的定义,散点位于从左下角到右上角区域,则两个变量具有正相关关系,故C错误;对于D,根据负相关的定义,散点位于从左上角到右下角区域,则两个变量具有负相关关系,故D 正确.故选ABD.9.为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论正确的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人答案ABC解析由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有160人.故A,B,C正确,D错误.故选ABC.10.在发生某公共卫生事件期间,我国有关机构规定:“该事件在一段时间没有发生规模群体感染的标志为连续10天,每天新增加疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,不一定符合该标志的是() A.甲地总体均值为3,中位数为4B.乙地总体均值为2,总体方差大于0C.丙地中位数为3,众数为3D.丁地总体均值为2,总体方差为3答案ABC解析由于平均数和中位数不能确定某一天的病例不超过7人,A不一定符合该标志;当总体方差大于0,不知道总体方差的具体数值,因此不能确定数据的波动大小,B不一定符合该标志;中位数和众数也不能确定某一天的病例不超过7人,C不一定符合该标志;当总体平均数是2,若有一个数据超过7,则方差就超过3,D一定符合该标志.故选ABC.三、填空题11.(2021·湖北宜昌高三月考)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):人入选,则入选的最佳人选应是 . 答案 甲解析 因为x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定.12.已知30个数据的60%分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 .答案 8.6解析 由30×60%=18,设第19个数据为x ,则7.8+x 2=8.2,解得x =8.6,即第19个数据是8.6.四、解答题13.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.14.我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市为了节约生活用水,计划在本市试行居民生活用水定额管理(即确定一个居民月均用水量标准,用水量不超过a的部分按照平价收费,超过a的部分按照议价收费).为了较为合理地确定出这个标准,通过抽样获得了100位居民某年的月均用水量(单位:t),制作了频率分布直方图.(1)由于某种原因频率分布直方图部分数据丢失,请在图中将其补充完整; (2)用样本估计总体,如果希望80%的居民每月的用水量不超过标准,则月均用水量的最低标准定为多少吨?并说明理由;(3)从频率分布直方图中估计该100位居民月均用水量的平均数.(同一组中的数据用该区间的中点值代表)解 (1)(2)月均用水量的最低标准应定为2.5 t .样本中月均用水量不低于2.5 t 的居民占样本总体的20%,由样本估计总体,要保证80%的居民每月的用水量不超出标准,月均用水量的最低标准应定为2.5 t.(3)这100位居民的月均用水量的平均数为0.5×⎝ ⎛⎭⎪⎪⎫14×0.10+34×0.20+54×0.30+74×0.40+94×0.60+114×0.30+134×0.10=1.875(t).。

高考数学一轮复习 第十章 第2讲 用样本估计总体课件 文

高考数学一轮复习 第十章 第2讲 用样本估计总体课件 文

ppt精选
3
2.样本的数字特征 (1)众数:一组数据中___出__现__次__数__最__多_____的那个数据,叫 做这组数据的众数. (2)中位数:把 n 个数据按大小顺序排列,处于_最__中___间____ 位置的一个数据叫做这组数据的中位数.
a1+a2+…+an (3)平均数:把________n___________称为 a1,a2,…,an 这 n 个数的平均数.
15
(2)(2014·高考北京卷)从某校随机抽取 100 名学生,获得了
他们一周课外阅读时间(单位:小时)的数据,整理得到数据
分组及频数分布表和频率分布直方图:
组号 1 2 3 4 5 6 7 8 9
合计
分组
[0,2) [2,4) [4,6) [6,8) [8,10) [10,12) [12,14) [14,16) [16,18)
ppt精选
4
(4)标准差与方差:设一组数据 x1,x2,x3,…,xn 的平均
数为-x ,则这组数据的标准差和方差分别是
s=
n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
s2=n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
ppt精选
5
[做一做]
1.(2014·高考四川卷)在“世界读书日”前夕,为了了解某
第十章 统计、统计案例及算法初步
第2讲 用样本估计总体
ppt精选
1
1.统计图表的含义
(1)频率分布表
①含义:把反映总体频率分布的表格称为频率分布表.
②频率分布表的画法步骤:
第一步:求___极__差_____,决定组数和组距,组距=极组差数;
第二步:__分__组______,通常对组内数值所在区间取左闭右开

2015届高三数学湘教版一轮复习配套课件:第10章 第3节 用样本估计总体

2015届高三数学湘教版一轮复习配套课件:第10章 第3节 用样本估计总体

+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.由于 2<4,
所以乙的平均成绩较为稳定. [答案] 2
计算一定
要准啊!
数学
首页
上一页
下一页
末页
第二十五页,编辑于星期五:八点 四十七分。
第三节 用样本估计总体 结束
[类题通法] 1.用样本估计总体时,样本的平均数、标准差只是总体 的平均数、标准差的近似.实际应用中,需先计算数据的平均 数,分析平均水平,再计算方差(标准差)分析稳定情况. 2.若给出图形,一方面可以由图形得到相应的样本数据, 再计算平均数、方差(标准差);另一方面,可以从图形直观分 析样本数据的分布情况,大致判断平均数的范围,并利用数据 的波动性大小比较方差(标准差)的大小.
第 2 小组的频率为 0.75×26=0.25,又其频数为 12,故样本容
量为01.225=48.
答案:48
数学
首页
上一页
下一页
末页
第十一页,编辑于星期五:八点 四十七分。
第三节 用样本估计总体 结束
1.(2014·滨州模拟)在样本的频率分布直方图中,共有 11 个小
长方形,若中间一个小长方形的面积等于其他 10 个小长方形
上一页
下一页
末页
第二十四页,编辑于星期五:八点 四十七分。
第三节 用样本估计总体 结束
[解析] 对于甲,平均成绩为-x =90,所以方差为 s2=15
×[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]
=4;对于乙,平均成绩为-x =90,方差为 s2=15×[(89-90)2
C.55
D.60

人教版高中数学高考一轮复习--用样本估计总体(课件)

人教版高中数学高考一轮复习--用样本估计总体(课件)
2.在实际问题中,总体平均数、总体方差和总体标准差都是未知的,一般用
样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2

2015高考数学一轮课件:第9篇 第2节 用样本估计总体

2015高考数学一轮课件:第9篇 第2节 用样本估计总体

数学(第十人页,教编A辑版于星期·五理:科十三点 五(A十H五分) 。
基础梳理
课 时 训考练点 突 破
1.(2014潍坊一模)某校从参加高二年级学业水平测试的 学生中抽出100名学生,其数学成绩的频率分布直方图如图 所 示 . 其 中 成 绩 分 组 区 间 是 [40,50) , [50,60) , [60,70) , [70,80) , [80,90) , [90,100] . 则 成 绩 在 [80,100] 上 的 人 数 为 ()
数学(第二人十二教页A,版编辑于·星理期科五:十三(点AH五十) 五分。
基础梳理
(2)频率分布直方图:
课 时 训考练点 突 破
数学(第二人十三教页A,版编辑于·星理期科五:十三(点AH五十) 五分。
基础梳理
课 时 训考练点 突 破
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占
数学(第十人五页教,A编版辑于星·期理五科:十三点(A五H十五) 分。
基础梳理
课 时 训考练点 突 破
解析:总体密度曲线是频率分布折线图在样本容量无限 大,组距无限小时一个理想曲线,是有关系的,故选项A错 误;由选项A解释知道,频率分布折线图只能无限趋近于总 体密度曲线,但不能说就是总体密度曲线,所以选项B错 误;同理选项C也错误;如果样本容量无限增大,分组的组 距无限缩小,那么频率分布折线图就会无限接近于一条光滑 的曲线,这条光滑的曲线就是总体密度曲线,故选D.
用茎叶图表示数据的优点是:(1)所有的信息都可以 从茎叶图中得到;(2)便于记录和读取,能够展示数 据的分布情况.缺点是:当样本数据较多或数据位 数较多时,茎叶图就显得不太方便
数学(第六人页,教编A辑版于星期·五理:科十三点 五(A十H五分) 。

2015高考数学一轮总复习课件:9.2 用样本估计总体

2015高考数学一轮总复习课件:9.2 用样本估计总体

2. 理解样本数据标准差的意义和作用,会计算数据标准差.
3. 能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解
释.
4. 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总
体的基本数字特征,理解用样本估计总体的思想.
5. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际
4 000 又月收入在[1 000,1 500)的有 4 000 人,故样本容量 n= 0.4 =10
000. 月收入在[1 500,2 000)的频率为 0.000 4×500=0.2, 月收入在[2 000,2 500)的频率为 0.000 3×500=0.15, 月收入在[3 500,4 000]的频率为 0.000 1×500=0.05,
第四页,编辑于星期五:十二点 四十七分。
2. 频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的 中点 ,就得频率 分布折线图. (2)总体密度曲线:随着 样本容量 的增加,作图时所分的组数增加, 组距 减 小,相应的频率分布折线图会越来越接近于一条光滑曲线,即总体密度曲线.
B. 平均数
C. 中位数
D. 标准差
第二十八页,编辑于星期五:十二点 四十七分。
x1+x2+…+xn
y1+y2+…+ym
(1)x=
n
,y=
m

x1+x2+…+xn+y1+y2+…+ym
z=
m+n

nx+my n
m
则 z= m+n =m+nx+m+ny.
n1 由题意知 0<m+n<2,∴n<m.
(2)对样本中每个数据都加上一个非零常数时不改变样本的方差和标准 差,众数、中位数、平均数都发生改变.

2015高考数学一轮课件:10-2用样本估计总体

2015高考数学一轮课件:10-2用样本估计总体

诊突培断破养基高解础频题
第四页,编辑于星期五:十三点 七分。
2.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 ①众数:在一组数据中,出现次数最多的数据叫做这组数据 的众数. ②中位数:将一组数据按大小依次排列,把处在最中间位置 的一个数据(或最中间两个数据的平均数)叫做这组数据的中位 数. ③平均数:样本数据的算术平均数,即 x =1n(x1+x2+…+ xn).在频率分布直方图中,中位数左边和右边的直方图的面 积 相等 .
诊突培断破养基高解础频题
第三页,编辑于星期五:十三点 七分。
(4)将频率分布直方图中各个相邻的矩形的上底边的 中点顺次 连结起来,就得到频率分布折线图.随着 样本容的量增加, 作图时所分的 增组加数,组距减小,相应的频率分布折线图就 会越来越接近于一条光滑的曲线,统计中称之为总体分布的密 度曲线,它能够更加精细的反映出总体在各个范围内取值的百 分比. (5)茎叶图不仅能够保留原始数据,而且能够展示数据的分布情 况.茎是指中间一列数,叶就是从茎的旁边生长出来的数,在 样本数据较少时,用茎叶图表示数据的效果较好.
的频率用各小长方形的面积 表示,各小长方形的面积总和等
于1 .
诊突培断破养基高解础频题
第二页,编辑于星期五:十三点 七分。
(3)频率分布直方图的作法步骤: ①求全距,决定组数和组距,组距=全 组距 数; ②分组,通常对组内数值所在区间取左闭右开区间,最后一组取 闭区间; ③统计频数,计算频率,列出频率分布表.画出频率分布直方 图.
诊突培断破养基高解础频题
第二十五页,编辑于星期五:十三点 七分。
s2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]= 4, s2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]= 0.8. (2)由s2甲>s乙2 可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动, 可知甲的成绩在不断提高,而乙的成绩则无明显提高.

高考数学一轮复习 第十章 统计 10.2 用样本估计总体 文

高考数学一轮复习 第十章 统计 10.2 用样本估计总体 文

【步步高】(江苏专用)2017版高考数学一轮复习 第十章 统计 10.2用样本估计总体 文1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图.2.频率分布折线图和总体分布的密度曲线(1)频率分布折线图:将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.(2)总体分布的密度曲线:将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线. 3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. 4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差:s =1n[x 1-x2+x 2-x2+…+x n -x2].(3)方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x是样本平均数). 【知识拓展】1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m x+a.(2)数据x1,x2,…,x n的方差为s2.①数据x1+a,x2+a,…,x n+a的方差也为s2;②数据ax1,ax2,…,ax n的方差为a2s2.【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √)(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( ×)(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √)(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( ×)(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √)(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( ×)1.(2015·陕西改编)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为________.答案137解析由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.2.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是__________.答案91.5和91.5解析∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数为12×(91+92)=91.5.平均数为18×(87+89+90+91+92+93+94+96)=91.5.3.在“世界读书日”前夕,为了了解某地 5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是________. 答案 总体解析 调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体.4.(教材改编)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为________.答案 19,135.(教材改编)甲、乙两人在相同条件下各射靶10次,每次命中环数如下: 甲 4 7 10 9 5 6 8 6 8 8 乙 7 8 6 8 6 7 8 7 5 9 试问10次射靶的情况较稳定的是________. 答案 乙解析 x 甲=4+7+10+9+5+6+8+6+8+810=7.1,x 乙=7+8+6+8+6+7+8+7+5+910=7.1.s 2甲=110[(4-7.1)2+(7-7.1)2+…+(8-7.1)2]=3.09, s 2乙=110[(7-7.1)2+(8-7.1)2+…+(9-7.1)2]=1.29. s 2甲>s 2乙,∴乙较稳定.题型一频率分布直方图的绘制与应用例1 (2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数281410 6(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意解(1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.思维升华(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.(1)(2014·山东改编)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.答案12解析志愿者的总人数为200.16+0.24×1=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.(2)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:①求分数在[70,80)内的频率,并补全这个频率分布直方图;②统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分. 解 ①设分数在[70,80)内的频率为x ,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x =1,可得x =0.3,所以频率分布直方图如图所示.②平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分). 题型二 茎叶图的应用例2 (1)(2015·山东)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为________.(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为__________. 答案 (1)①④ (2)5,8解析 (1)甲地5天的气温为:26,28,29,31,31, 其平均数为x 甲=26+28+29+31+315=29;方差为s 2甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;标准差为s 甲= 3.6.乙地5天的气温为:28,29,30,31,32, 其平均数为x 乙=28+29+30+31+325=30;方差为s 2乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;标准差为s 乙= 2. ∴x 甲<x 乙,s 甲>s 乙.(2)由茎叶图及已知得x =5,又乙组数据的平均数为16.8,即9+15+10+y +18+245=16.8,解得y =8. 引申探究1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好. 解 由原题可知x =5,则甲组平均分为9+12+15+24+275=17.4.而乙组平均分为16.8,所以甲组成绩较好.2.在本例(2)条件下:①求乙组数据的中位数、众数;②求乙组数据的方差. 解 ①由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24. 故中位数为18,众数为18.②s 2=15[(9-16.8)2+(15-16.8)2+(18-16.8)2×2+(24-16.8)2]=23.76.思维升华 茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.(2014·课标全国Ⅱ)某市为了考核甲,乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲,乙两部门评分的中位数; (2)分别估计该市的市民对甲,乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲,乙两部门的评价.解 (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75. 50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲,乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲,乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分.) 题型三 用样本的数字特征估计总体的数字特征例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 解 (1)由题图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13;x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4;s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(2015·广东)某工厂36名工人的年龄数据如下表. 工人编号 年龄 工人编号 年龄 工人编号 年龄 工人编号 年龄 1 40 10 36 19 27 28 34 2 44 11 31 20 43 29 39 3 40 12 38 21 41 30 43 4 41 13 39 22 37 31 38 5 33 14 43 23 34 32 42 6 40 15 45 24 42 33 53 7 4516 3925 3734 378 42 17 38 26 44 35 49 9 4318 3627 4236 39(1)年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的均值x 和方差s 2;(3)36名工人中年龄在x -s 与x +s 之间的有多少人?所占的百分比是多少(精确到0.01%)?解 (1)44,40,36,43,36,37,44,43,37.(2)x =44+40+36+43+36+37+44+43+379=40.s 2=19[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=1009.(3)40-103=1103,40+103=1303在⎝ ⎛⎭⎪⎫1103,1303的有23个,占63.89%.9.高考中频率分布直方图的应用典例 (14分)(2015·广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 规范解答解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1得:x =0.007 5, 所以直方图中x 的值是0.007 5.[3分](2)月平均用电量的众数是220+2402=230.[4分]因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5得:a =224,所以月平均用电量的中位数是224.[8分](3)月平均用电量为[220,240)的用户有0.012 5×20×100=25(户),月平均用电量为[240,260)的用户有0.007 5×20×100=15(户),月平均用电量为[260,280)的用户有0.005×20×100=10(户),月平均用电量为[280,300]的用户有0.002 5×20×100=5(户),抽取比例=1125+15+10+5=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).[14分]温馨提醒 本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意.[方法与技巧]1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.若取值x 1,x 2,…,x n 的频率分别为p 1,p 2,…,p n ,则其平均值为x 1p 1+x 2p 2+…+x n p n ;若x 1,x 2,…,x n 的平均数为x ,方差为s 2,则ax 1+b ,ax 2+b ,…,ax n +b 的平均数为a x +b ,方差为a 2s 2. [失误与防范]频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.A组专项基础训练(时间:40分钟)1.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为____________.答案0.4解析10个数据落在区间[22,30)内的数据有22,22,27,29,共4个,因此,所求的频率为410=0.4.2.(2014·陕西改编)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为____________.答案x+100,s2解析x1+x2+…+x1010=x,y i=x i+100,所以y1,y2,…,y10的均值为x+100,方差不变.3.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________.答案50解析由频率分布直方图,知低于60分的频率为(0.01+0.005)×20=0.3.∴该班学生人数n =150.3=50.4.在某次测量中得到的A 样本数据如下:42,43,46,52,42,50,若B 样本数据恰好是A 样本数据每个都减5后所得数据,则A ,B 两样本的数字特征对应相同的是__________. 答案 标准差解析 利用平均数、标准差、众数、中位数等统计特征数的概念求解.由B 样本数据恰好是A 样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A 样本不相同,标准差不变.5.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a 1、a 2,则一定有________.①a 1>a 2 ②a 2>a 1 ③a 1=a 2④a 1,a 2的大小与m 的值有关 答案 ②解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a 2>a 1.6.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为________________. 答案 2解析 由题意可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.7.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为________.答案367解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2] =17(16+9+1+0+1+9+0)=367. 8.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.答案 0.030 3解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a =1-0.70010=0.030.由题意知,身高在[120,130),[130,140),[140,150]内的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为1860=310,∴在[140,150]中选取的学生应为3人.9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60]的频率及全班人数;(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高. 解 (1)分数在[50,60]的频率为0.008×10=0.08. 由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为20.08=25.(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为425÷10=0.016.10.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36.(1)求样本容量及样本中净重大于或等于98克并且小于104克的产品的个数;(2)已知这批产品中每个产品的利润y (单位:元)与产品净重x (单位:克)的关系式为y =⎩⎪⎨⎪⎧3,96≤x <98,5,98≤x <104,4,104≤x ≤106,求这批产品平均每个的利润.解 (1)产品净重小于100克的频率为(0.050+0.100)×2=0.300.设样本容量为n . ∵样本中产品净重小于100克的个数是36, ∴36n=0.300,∴n =120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.750,∴样本中净重大于或等于98克并且小于104克的产品的个数是120×0.750=90.(2)产品净重在[96,98),[98,104),[104,106]内的频率分别为0.050×2=0.100,(0.100+0.150+0.125)×2=0.750,0.075×2=0.150,∴其相应的频数分别为120×0.100=12,120×0.750=90,120×0.150=18, ∴这批产品平均每个的利润为1120×(3×12+5×90+4×18)=4.65(元). B 组 专项能力提升 (时间:30分钟)11.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是________.答案①解析由于频率分布直方图的组距为5,排除③、④,又[0,5),[5,10)两组各一人,排除②,①符合条件,故①正确.12.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.答案24解析底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24. 13.(2015·湖北)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案(1)3 (2)6 000解析由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.于是消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6×10 000=6 000,故应填3,6 000.14.若某产品的直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:分组频数频率[-3,-2)0.10[-2,-1)8(1,2]0.50(2,3]10(3,4]合计50 1.00(1)(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.解(1)如下表所示频率分布表.分组频数频率[-3,-2)50.10[-2,-1)80.16(1,2]250.50(2,3]100.20(3,4]20.04合计50 1.00(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为 0.50+0.20=0.70.(3)设这批产品中的合格品数为x 件, 依题意505 000=20x +20,解得x =5 000×2050-20=1 980.所以该批产品的合格品件数是1 980.15.(2014·广东)某车间20名工人年龄数据如下表:年龄(岁) 19 28 29 30 31 32 40 工人数(人)1335431(1)求这20(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (3)求这20名工人年龄的方差.解 (1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:40-19=21. (2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为:120(30-19)2+320(30-28)2+320(30-29)2+520(30-30)2+420(30-31)2+320(30-32)2+120(30-40)2=12.6.。

2015届高三数学(理,山东版)一轮课件:第9章 第2节 用样本估计总体

2015届高三数学(理,山东版)一轮课件:第9章 第2节 用样本估计总体

服/务/教/师 免/费/馈/赠
返回菜单
数学·新课标(理科)山东专用
1.若某校高一年级 8 个班参加合唱比赛的得分如茎叶图 9- 2-1 所示,则这组数据的中位数
和平均数分别是( A.91.5 和 91.5 C.91 和 91.5
服/务/教/师 免/费/馈/赠
图 9-2-1 )
B.91.5 和 92 D.92 和 92
四、标准差和方差
1.标准差是样本数据到平均数的一种_平__均__距__离______.
2.标准差:
s=_____n1_[__x_1-___x__2_+__x__2-___x__2+__…___+__x_n_-___x__2]__. 3.方差:s2=_n1_[_(x_1_-__x__)_2+__(_x_2_-__x__)2_+__…__+__(_x_n_-__x__)2_](xn 是样
2.有一个容量为 66 的样本,数据的分组及各组的频数如下:
[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9
[23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3 根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是
返回菜单
数学·新课标(理科)山东专用
【解析】 由题图可知,车速大于或等于70 km/h的汽车 的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2= 40(辆).
【答案】 B
服/务/教/师 免/费/馈/赠
返回菜单
数学·新课标(理科)山东专用
4.某老师从星期一到星期五收到的信件数分别为
10,6,8,5,6,则该组数据的方差s2=________. 【解析】 平均数 x =10+6+58+5+6=7.

高考数学一轮复习 10.2用样本估计总体课件 文 湘教版

高考数学一轮复习 10.2用样本估计总体课件 文 湘教版

ppt精选
12
11/18/2020
【解析】(1)由频率分布直方图得前五组频率为 (0.008+0.016+0.04+0.04+0.06)×5=0.82,后三组频率 为1-0.82=0.18,人数为0.18×50=9(人),这所学校高三 年级全体男生身高在180 cm以上(含180 cm)的人数为 800×0.18=144(人). (2)由频率分布直方图得第八组频率为0.008×5=0.04,人 数为0.04×50=2(人),设第六组人数为m,则第七组人数 为9-2-m=7-m.又m+2=2×(7-m),∴m=4,所以第 六组人数为4人,第七组人数为3人,频率分别为0.08,0.06.频 率/组距分别为0.016,0.012(画图如图).
入一个新数据 5,此时样本容量为 9,平均数为,方差为 s2 ,则()
A. x =5, s2 <2
B. x =5, s2 >2
C. x >5, s2 <2
D. x >5, s2 >2
【解析】∵ 1 8
(x1x2源自+…+x8)=5,∴
1 9
( x1 x2 +…+ x8 +5)=5,
∴=5,由方差定义及意义可知加入新数据 5 后,样本数据取值的稳
5.(2014·武汉武昌区联考)已知某单位有40名职工,现要从中抽取
5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成
5组.按系统抽样方法在各组内抽取一个号码.
(1)若第1组抽出的号码为2,则所有被抽出职工的号码为 ;
(2)分别统计这5名职工的体重(单位:公斤),获得体重数据的茎
叶图如图所示,则该样本的方差为
定性比原来强,∴ s2 <2,故选 A.

2015年高考数学(理)总复习精品课件:第16章第2讲用样本估计总体

2015年高考数学(理)总复习精品课件:第16章第2讲用样本估计总体

第2讲用样本估计总体[匚口亘』由室厶过去.1 •用样本估计总体通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的分布,另_种是用样本的数字特征估计总体的数字特征2.统计图(1)频率分布直方图:①求极差:极差是一组数据的最大值与最小值的差.②决定组距和组数:当样本容量不超过100时,常分成5〜极差12组.组距=组数.③将数据分组:通常对组内数值所在区间取左闭右开区间.最后一组取闭区间•也可以将样本数据多取一位小数分组;④列频率分布表:登记频数,计算频率,列出频率分布表.将样本数据分成若干个小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的频率.频率反映上个数据在每组所占比例的大小.⑤绘制频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一小长方形,它的高等于该组的频率组距,这样得到一系列的长方形,每个长方形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图,各个长方形的面积总和等于1 .(2)频率分布折线图和总体密度曲线:①频率分布折线图:连接频率分布直方图中各长方形上端的中点,就得频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线.⑶茎叶图:当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有佶息,而址可以随时记录,给数据的记录和表示都带来方便.3.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数:①众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.③平均数:样本数据的算术平均数,即T- -(^i+^+-+xj④在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(2)样本方差、标准差:①标准差(其中/是样本数据的第〃项,n是样木容量,匚是平均数).②标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.嶷础自测1.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图16-2-1),设甲、乙两组数据的平均数分别为匚甲,匚乙,中位数分别为加甲,m乙则()A.兀甲v x乙,m甲>加乙B.X甲vx乙,m甲V加乙C.兀甲>兀乙,m甲>加乙D.兀甲>兀乙,m甲V加乙屮乙8650 88400102 875 2202 3 3 78 0 03 1 2 4 4 83 1423 8图16-2-1根据平均数的概念易计算出兀甲< 兀乙,又加甲 甘=29.故选B.解析: =20 9 m (18 + 22 2答案:B2•某一网络公司为了调查一住宅区连接互联网情况,从该住宅区28 000住户中随机抽取了 210户进行调查,调查数据如 图16-2-2,则估计该住宅区已接入互联网的住户数是(C )户数f已接■未接[]图 16-2-25500 6554A.90B.1200C. 12 000D. 14 000新住户住户类型3.(2013年湖北)从某小区抽取100户居民进行月用电量调发现其用电量都在50到350度之间,频率分布直方图如图16-2-3 所示.(1)直方图中兀的值为0.0044 ;(2)在这些用户中,用电量落在区间[100,250)内的户数为704•甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是(C )A.甲B.乙C.丙D.T解析:由表可知,乙、丙的平均成绩最好,平均环数为8.9 ;但乙的方差大,说明乙的波动性大,所以丙为最佳人选,故选C.5.(2012年湖南)如图1624是某学校一名篮球运 动员在五场比赛中所得分数的茎叶图,则该运动员在 这五场比赛中得分的方羞为6.8 .注:方差¥ =厂工)2 + (兀2_工)2+•••+(%厂工几其中工为兀1,X2,…,%”的平均数) 解析:工=*(8+9+10+13+15)= 11,s2 = £[(8 —11)2 + (9—11)2 + (10—11)2 + (13—11)2 + (15 — 11)2] = 6.8.0 8 910 3 5图 1624考点1频率分布直方图的绘制及其应用例1:某中学高一女生共有450人,为了了解高一女生的身高情况,随机抽取部分高一女生测量身高,所得数据整理后列出频率分布表如下:(1)求出表中字母加,巧M, N所对应的数值;(2)在给出的直角坐标系中画出频率分布直方图(图16・2・5);⑶估计该校高一女生身高在149.5〜165.5 cm范围内有多少人?频率*0.070.050.040.030.020.01——1----- 1 ------ 1 ----- 1 ----- 1 ----- 1 --------- ►145.5149.5 153.5 157.5 161.5 165.5 1695 身高/cm图16-2-5Q解:(1)由题意M=Q-J^=50,落在区间165.5〜169.5内数据频数m = 50 - (8 + 6+ 14 + 10 + 8) = 4 ,频率为〃 =0.08,总频率N 二1.00.(2)频率分布直方图如图D57 :⑶该所学校高一女生身高在149.5〜165.5 cm 之间的比例 为0.12 +0.28 + 0.20 + 0.16 = 0.76 ,则该校高一女生在此范围内 的人数为450x0.76 = 342(人).【方法与技巧】用频率分布直方图解决相关问题时,应正 确理解图表中各个量的意义,识图掌握信息是解决该类问题的率分布直方图中各长方形高的比也就是其频率之比;③直方图 中每一个矩形的面积是样本数据落在这个区间上的频率,所有 的小矩形的面积之和等于1,即频率之和为].关键.频率分布直方图有以下几个要点:①纵轴表示频率解析:根据题意,频率分布表可得:答案为A. 答案:A考点2茎叶图的应用例2: (2012年陕西)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图16-2-7),则该样本的中位数、 解析:根据茎叶图可知样本中共有30个数据,中位数为46 ,出现次数最多的是45 ,最大数与最小数的差为68 - 12 = 56. 故选A.答案:A众数、极差分别是(A. 46,45,56B. 46,45,53C. 47,45,56D ・45,47,53 1 25 2 02 3 3 3 124489 4 55 5778 89 5 0011479 6 178 图 16-2-7【方法与技巧】(1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况.【互动探究】2•图16・2・8是某学生的数学考试成绩茎叶图,第1次到14 次的考试成绩依次记为41,A2,…,Ay•图16-2-9是统计茎叶图中成绩在一定范围内考试次数的一个算法流程图•那么算法流程图输出的结果是____________11 4图16-2-8解析:算法流程图输出的数表示考试成绩中大于或等于90 分的次数.答案:10解:⑴记甲被抽到的成绩为X ,乙被抽到成绩为y ,用数对(兀/ y)表示基本事件.从甲、乙两人的成绩中各随机抽取一个,则共有(5,6) , (5,7),(5,8) , (5,9) , (6,6) , (6,7) , (6,8) , (6,9) , (9,6) , (9,7) , (9,8) , (9,9), (10,6) ,(10,7) , (10,8) , (10,9) , 16 种结果.记甲的成绩比乙咼为事件4,则4 包含(9,6) , (9,7) , (9,8) , (10,6) , (10,7) , (10,8) , (10,9)7有7种结果…;P(4)=话⑵甲的成绩平均数x 1 = ~上字一 =7.5,乙 的成绩平均数 厂=6+7 丁 8+9 = 75甲的成绩方差:° (5-7.5)2+(6-7.5)2 + (9-7.5)2 + (10-7.5)2‘ . s ] == 4.25, 乙的成绩方差: ](6-7.5)2+(7—7.5)2 + (8—7.5)2+(9—7.5)2】•••选派乙运动员参加决赛比较合适. 2 2S> 2 1 S 9【方法与技巧】(1)众数体现了样本数据的最大集中点,但无法客观的反映总体特征.(2)中位数是样本数据所占频率的等分线.(3)标准差、方差描述了一组数据围绕平均数波动的大小. 标准差、方差越大,数据越分散;标准差、方差越小,数据越集中.【互动探究】3.(2013年辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为10 .难点突破O统计图与离散型随机变量的分布列的结合在高考中常以频率分布直方图或茎叶图的形式出现考查离散型随机变量的分布列及方差问题,这也是近几年高考出题的热点问题.例题:(2012年广东广州高中毕业班综合测试)如图16210 所示的茎叶图记录了甲、乙两个小组(每小组4人)在期末考试中的数学成绩•乙组记录中有一个数据模糊,无法确认,在图中以G表示•已知甲、乙两个小组的数学成绩的平均分相同.⑴求G的值;(2)求乙组四名同学数学成绩的方差;(3)分别从甲、乙两组同学中各随机选取一名甲组9 7乙组879a 3X,求随机变量X的分布列和均值(数学期望). 图16210同学,记这两名同学数学成绩之差的绝对值为 6 6解:⑴依题意,得|x(87 + 89 + 96+96)=|x (87+90+^+93+95),解得0 = 3.(2)根据已知条件,可以求得两组同学数学成绩的平均分都为7=92.所以乙组四名同学数学成绩的方差为『=*87 —92)2+(93 - 92)2+ (93 - 92)2+(95 一92)2]=9.(3)分别从甲、乙两组同学中各随机选取一名同学,共有4X4 =16(种)可能的结果.这两名同学成绩之差的绝对值X的所有情况如下表:所以X的所有可能取值为0,123,4,6,&9.1 2 1由表,可得P(X=O)=J^, P(X=1)=J^, P(X=2)=话,P(X4 2 3 1= 3)=吋P(X=4)=厉,P(X=6)=吋P(X=8)=厉,P(X=9) 2所以随机变量X的分布列为:随机变量X的数学期望为E(X) = OX 寻+1X 磊+ 2X 害+3X 磊+ 4X 磊+ 6><乖+1 2 68_178X T6+9X16=l6_ 4 ・。

【志鸿优化设计】2015届高考数学(人教版,理科)一轮总复习精品课件:11.8 用样本估计总体

【志鸿优化设计】2015届高考数学(人教版,理科)一轮总复习精品课件:11.8 用样本估计总体
48 组的频数为 12,故样本容量为
12 6 0.25 2
=48.
解析 答案
考点一
考点二考点三Fra bibliotek 第十一章11.8 用样本估计总体 -15-
考点二 茎叶图的应用
【例 2】 若某校高一年级 8 个班参加合唱比赛的得分如茎叶图所示, 则这组数据的中位数和平均数分别是( )
A.91.5 和 91.5 B.91.5 和 92 C.91 和 91.5 D.92 和 92
关闭
解析
考点一 考点二 考点三
答案
第十一章
11.8 用样本估计总体 -211 2 3
1.如图所示是某公司(共有员工 300 人)某年员工年薪情况的频率分布直方 图,由此可知,员工中年薪在 1.4 万元~1.6 万元之间的共有 人.
关闭
由所给图形可知,员工中年薪在 1.4 万元~1.6 万元之间的频率为 1-(0.02+0.08+0.08+0.10+0.10)×2=0.24,所以员工中年薪在 1.4 万元~1.6 万元 关闭 72 之间的共有 300×0.24=72(人).
0+0.002 4+0.001 2)×50=0.22,于是 x=
50
(1)由频率分布直方图知[200,250)小组的频率为 1-(0.002 4+0.003 6+0.006 =0.004 4.
;
关闭
.
(2)∵数据落在[100,250)内的频率为(0.003 6+0.006 0+0.004 4)×50=0.7, (1)0.004 4 (2)70 ∴所求户数为 0.7×100=70.
关闭
A
因为样本数据个数为偶数,中位数为

2015高考数学一轮课件:第11章 11.2 用样本估计总体

2015高考数学一轮课件:第11章  11.2 用样本估计总体

通常用样本方差估计总体方差,当 样本容量接近总体容量
时,样本方差很接近总体方差.
基础知识
题型分类
思想方法
练出高分 第五页,编辑于星期五:十三点 三十六分。
基础知识·自主学习
夯基释疑
夯实基础 突破疑难
题号
1 2 3 4 5
答案
(1) √ (2) ×(3) √(4) × 3.2
4 0.7 6.8 600
(90-91)2+(94-91)2+(91-91)2] =17(16+9+1+0+1+9+0)=376.
基础知识
题型分类
思想方法
练出高分 第十七页,编辑于星期五:十三点 三十六分。
题型分类·深度剖析
题型三
用样本的数字特征估计总体的数字特征
【例 3】 甲、乙二人参加某体育 思维启迪
解析
项目训练,近期的五次测试成绩
基础知识
题型分类
思想方法
练出高分 第十页,编辑于星期五:十三点 三十六分。
题型分类·深度剖析
跟踪训练 1 (2013·陕西改编)对一批产品的长度(单位:mm)进行 抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长 度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为 二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率, 现从该批产品中随机抽取一件,则其为二等品的概率为__0_._4_5___.
2.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数 最多 的数据叫做这组数据的 众数. 中位数:将一组数据按大小依次排列,把处在 最中间 位置的一 个数据(或最中间两个数据的平均数)叫做这组数据的中位数.

高考一轮复习第10章统计统计案例第2讲用样本估计总体

高考一轮复习第10章统计统计案例第2讲用样本估计总体

第二讲 用样本估计总体知识梳理·双基自测 知识梳理知识点一 用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤为:①_求极差__;②_决定组距与组数__;③_将数据分组__;④_列频率分布表__;⑤_画频率分布直方图__.(2)频率分布折线图顺次连接频率分布直方图中_各小长方形上端的中点__,就得到频率分布折线图. (3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息. 知识点二 茎叶图(1)茎叶图中茎是指_中间__的一列数,叶是从茎的_旁边__生长出来的数.(2)茎叶图的优点是可以_保留__原始数据,而且可以_随时__记录,这对数据的记录和表示都能带来方便.知识点三 样本的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =_x 1+x 2+…+x nn__,反映了一组数据的平均水平.(4)标准差: s =_1n[x 1-x2+x 2-x2+…+x n -x2]__,反映了样本数据的离散程度.(5)方差:s 2=_1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度.重要结论(1)若一组数据x i (i =1,2,…,n)的平均数为x -,方差为s 2,则数据组ax i +b(i =1,2,…,n ,a ,b 为常数)的平均数为a x -+b ,方差为a 2·s 2.(2)频率分布直方图与众数、中位数与平均数的关系 ①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的,均为12.③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 走进教材2.(P 81A 组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )A .95,94B .92,86C .99,86D .95,91[解析]由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .3.(P 7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有_25__人.[解析]100×(0.5×0.5)=25(人).题组三走向高考4.(2020·新课标Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为( C )A.0.01 B.0.1C.1 D.10[解析]∵样本数据x1,x2,…,x n的方差为0.01,∴根据任何一组数据同时扩大几倍方差将变为平方倍增长,∴数据10x1,10x2,…,10x n的方差为:100×0.01=1,故选C.5.(2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( B )A.10 B.18C.20 D.36[解析]直径落在区间[5.43,5.47)的频率为(6.25+5)×0.02= 0.225,则被抽取的零件中,直径落在区间[5.43,5.47)内的个数为0.225×80 =18个,故选B.考点突破·互动探究考点一频率分布直方图——自主练透例1 (1)(2021·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:组号分组频数频率第1组[160,165) 0.100笫2组[165,170) ①第3组[170,175) 20 ②第4组[175,180) 20 0.200第5组[180,185) 10 0.100合计100 1.00(ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.(2)(2021·福建漳州质检)2018年9月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达52亿元.某青年志愿者组织调查了某地区的50个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:[0,2 000],(2 000,4 000],(4 000,6 000],(6 000,8 000],(8 000,10 000](单位:元),得到如图所示的频率分布直方图.(ⅰ)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表);(ⅱ)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这50户损失超过4 000元的农户中随机抽取2户进行重点帮扶,设抽出损失超过8 000元的农户数为X,求X的分布列和数学期望.[解析](1)(ⅰ)第1组的频数为100×0.100=10,所以①处应填的数为100-(10+20+20+10)=40, 从而第2组的频率为40100=0.400.②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200. 频率分布直方图如图所示.(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:第3组:2050×5=2,第4组:2050×5=2,第5组:1050×5=1,所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试. (ⅲ)记“第4组至少有一名选手被考官A 面试”为事件A , 则P(A)=C 12C 13+C 22C 25=710. ⎝ ⎛⎭⎪⎫或P A =1-P A -=1-C 23C 25=710 (2)(ⅰ)记每个农户的平均损失为x -元,则x -=1 000×0.3+3 000×0.4+5 000×0.18+7 000×0.06+9 000×0.06=33 601;(ⅱ)由频率分布直方图,可得损失超过 4 000元的农户共有(0.000 09+0.000 03+0.000 03)×2 000×50=15(户),损失超过8 000元的农户共有0.000 03×2 000×50=3(户),随机抽取2户,则X 的可能取值为0,1,2; 计算P(X =0)=C 212C 215=2235,P(X =1)=C 112C 13C 215=1235,P(X =2)=C 23C 215=135.所以X 的分布列为:X0 1 2P2235 1235 135数学期望为E(X)=0×2235+1×1235+2×135=25.名师点拨应用频率分布直方图时的注意事项用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.〔变式训练1〕(1)(2021·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为_220__.(2)(2021·山西适应性考试)某病毒引起的肺炎的潜伏期平均为7天左右,短的约2~3天,长的约10~14天,甚至有20余天.某医疗机构对400名确诊患者的潜伏期进行统计,整理得到以下频率分布直方图.根据该直方图估计:要使90%的患者显现出明显病状,需隔离观察的天数至少是( C )A .12B .13C .14D .15[解析] (1)根据频率分布直方图知: (2a +0.04+0.03+0.02)×10=1⇒a =0.005; 计算出数学成绩不低于100分的频率为: (0.03+0.02+0.005)×10=0.55;所以这次测试数学成绩不低于100分的人数为0.55×400=220人.(2)由题可知,第一,二,三,四,五组的频率分别为0.16,0.4,0.32,0.08,0.04. 因为前三组的频率和为0.88, 故要使90%的患者显现出明显病状,则需隔离观察的天数至少是:13+0.9-0.880.02=14,故选C .考点二 茎叶图——师生共研例2 (多选题)(2021·四川省乐山市调研改编)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A ,现从a ,b 两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法正确的是( ABD )A .x a <x bB .a 的方差大于b 的方差C .b 品种的众数为3.31D .a 品种的中位数为3.27 [解析] 由茎叶图得:b 品种所含β-胡萝卜素普遍高于a 品种, ∴x a <x b ,故A 正确;a 品种的数据波动比b 品种的数据波动大, ∴a 的方差大于b 的方差,故B 正确; b 品种的众数为3.31与3.41,故C 错误; a 品种的数据的中位数为:3.23+3.312=3.27,故D 正确.名师点拨茎叶图的绘制及应用(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.〔变式训练2〕(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 与y 的值分别为( A )A .3,5B .5,5C .3,7D .5,7[解析] 甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x =3.故选A . 考点三 样本数字特征——多维探究 角度1 样本数字特征与频率分布直方图例3 (1)如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( B )A .12.5,12.5B .12.5,13C .13,12.5D .13,13[解析] 由频率分布直方图可知,众数为10+152=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x ,则(x -10)×0.1=0.5-0.2,解得x =13.角度2 样本数字特征与茎叶图(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:⎪⎪⎪897 74 0 1 0 x 9 1则7个剩余分数的方差为_367__.[解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4,∴s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.角度3 样本数字特征的计算(3)(2021·湖北武汉、襄阳、荆门、宜昌四地六校考试联盟联考)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差s 2为( C )A .52B .3C .72D .4[解析] 设某7个数据分别为a 1,a 2,…,a 7, 则由题意得a 1+a 2+…+a 7=5×7=35, (a 1-5)2+(a 2-5)2+…+(a 7-5)2=4×7=28, 加入新数据5后的平均数x -=35+58=5,方差s 2=a 1-52+a 2-52+…+a 7-52+5-528=288=72.故选C .名师点拨平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.〔变式训练3〕(1)(角度1)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为_155__,平均数为_156.8__.(2)(角度2)(2021·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )A .89 54.5B .89 53.5C .87 53.5D .89 54(3)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2:其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s′2,则x -′,s′2分别为( C )A .3x -+2,3s 2+2 B .3x -,3s 2C .3x -+2,9s 2D .3x -+2,9s 2+2[解析] (1)中位数为:150+(170-150)×0.10.02×20=155.该组数据的平均数为x =0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.(2)由题可知,中位数为:87+912=89,先求平均数:x -=78+79+84+86+87+87+91+94+98+98+99+9912=90,S 2=112[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,故中位数为:89,方差为53.5,故选:B .(3)显然x -′=3x -+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a ,则方差变为原方差的a 2倍,故选C .考点四 折线图——师生共研例4 (多选题)(2021·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论不正确的是( BCD )A .连续三天日平均温度的方差最大的是7日,8日,9日三天B .这15天日平均温度的极差为15 ℃C .由折线图能预测16日温度要低于19 ℃D .由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数[解析] A 选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B 选项,这15天日平均温度的极差为18 ℃,B 错;C 选项,由折线图无法预测16日温度是否低于19 ℃,故C 错误;D 选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D 错误.故选B 、C 、D .名师点拨折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.〔变式训练4〕(多选题)甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为x -甲、x -乙,则( BC )A .每次考试甲的成绩都比乙的成绩高B .甲的成绩比乙稳定C .x -甲一定大于x -乙D .甲的成绩的极差大于乙的成绩的极差[解析] 第二次考试甲的成绩比乙低,A 错;由图可知甲的成绩比乙的成绩波动小,B 正确,D 错;甲的平均成绩显然比乙的平均成绩高,C 正确;故选B 、C .名师讲坛·素养提升 高考与频率分布直方图例5 (2021·安徽省池州市期末)高三年级某班50名学生期中考试数学成绩的频率分布直方图如图所示,成绩分组区间为:[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150].其中a ,b ,c 成等差数列且c =2a ,物理成绩统计如表.(说明:数学满分150分,物理满分100分)分组 [50,60) [60,70) [70,80) [80,90) [90,100]频数6920105(1)根据频率分布直方图,请估计数学成绩的平均分; (2)根据物理成绩统计表,请估计物理成绩的中位数;(3)若数学成绩不低于140分的为“优”,物理成绩不低于90分的为“优”,已知本班中至少有一个“优”同学总数为6人,从此6人中随机抽取3人.记X 为抽到两个“优”的学生人数,求X 的分布列和期望值.[解析] (1)根据频率分布直方图得, (a +b +2c +0.024+0.020+0.004)×10 =1, 又因a +c =2b ,c =2a ,解得a =0.008,b =0.012,c =0.016, 故数学成绩的平均分x -=85×0.04+95×0.12+105×0.16+115×0.2+125×0.24 +135×0.16+145×0.08=117.8(分),(2)总人数50分,由物理成绩统计表知,中位数在成绩区间[70,80), 所以物理成绩的中位数为75分.(3)数学成绩为“优”的同学有4人,物理成绩为“优”有5人,因为至少有一个“优”的同学总数为6名同学,故两科均为“优”的人数为3人,故X 的取值为0、1、2、3.P(X =0)=C 33C 36=120,P(X =1)=C 13C 23C 36=920,P(X =2)=C 23C 13C 36=920,P(X =3)=C 33C 36=120,所以分布列为:X 0 1 2 3 P120920920120∴期望值为E(X)=0×120+1×920+2×920+3×120=32.名师点拨(1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系. (2)准确理解频率分布直方图的数据特点是解题关键. 〔变式训练5〕(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).[解析](1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。

【创新方案】2015高考数学一轮复习(知识回扣+热点突破+能力提升)用样本估计总体 理 北师大版

【创新方案】2015高考数学一轮复习(知识回扣+热点突破+能力提升)用样本估计总体 理 北师大版

第二节 用样本估计总体1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(平均数、标准差),并给出合理解释.4.会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.1.频率分布直方图(1)频率分布直方图由一些小矩形来表示,每个小矩形的宽度为Δx i (分组的宽度),高为f iΔx i,小矩形的面积恰为相应的频率f i ,图中所有小矩形的面积之和为1. (2)作频率分布直方图的步骤:①求极差(即一组数据中最大值与最小值的差). ②决定组距与组数. ③将数据分组. ④列频率分布表. ⑤画频率分布直方图. 2.频率折线图(1)定义:在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.(2)作用:可以用它来估计总体的分布情况. 3.茎叶图(1)茎叶图表示数据的优点:①茎叶图上没有信息的损失,所有的原始数据都可以从这个茎叶图中得到. ②茎叶图可以随时记录,方便表示与比较. (2)茎叶图表示数据的缺点:当数据量很大或有多组数据时,茎叶图就不那么直观清晰了. 4.数据的数字特征(1)中位数:一组从小到大(或从大到小)排列的数,若个数是奇数,最中间位置的数为中位数,若个数是偶数,中位数为最中间两个数的平均数.(2)众数:一组数中出现次数最多的数据. (3)标准差和方差①标准差是样本数据到平均数的一种平均距离.②标准差:s =1n[x 1-x 2+x 2-x 2+…+x n -x 2].③方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](其中x n (n ∈N +)是样本数据,n 是样本容量,x 是样本平均数).1.在频率分布直方图中如何确定中位数?提示:在频率分布直方图中,中位数左边和右边的直方图的面积是相等的. 2.利用茎叶图求数据的中位数的步骤是什么?提示:(1)将茎叶图中数据按大小顺序排列;(2)找中间位置的数.1.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差解析:选D 只有标准差不变,其中众数、平均数和中位数都加2. 2.某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有( )A .30辆B .40辆C .60辆D .80辆 解析:选B 从频率分布直方图可知:速度大于或等于70 km/h 的频率为0.02×10=0.2,而汽车总量为200辆,所以被处罚的汽车约有200×0.2=40辆.3.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图所示.据此可估计上学期该校400名教师中,使用多媒体进行教学次数在[16,30)内的人数为( )A .100B .160C .200D .280 解析:选B 由茎叶图,可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×820=160.4.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2=________.解析:由题意得:x -=10+6+8+5+65=7,∴s 2=15×[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.答案:3.25.从一堆苹果中任取10只,称得它们的质量如下(单位:克):125,120,122,105,130,114,116,95,120,134,则样本数据落在[114.5,124.5)内的频率为________.解析:数据落在[114.5,124.5)内的有:120,122,116,120共4个,故所求频率为410=0.4.答案:0.4考点一数字特征的应用[例1] (1)(2013·某某高考)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:8 7 7 9 4 0 1 0 x 9 1则7个剩余分数的方差为( )A.1169B.367 C .36 D.6 77(2)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差[自主解答] (1)由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,x =4.s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.(2)由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.[答案] (1)B (2)C【方法规律】样本数字特征及公式推广(1)平均数和方差都是重要的数字特征,是对总体的一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.(2)平均数、方差公式的推广若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则数据mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x +a ,方差为m 2s 2.甲、乙两人参加某体育项目训练,近期的五次测试成绩如图.(1)分别求出两人得分的平均数与方差;(2)根据图和(1)中算得的结果,对两人的训练成绩作出评价. 解:(1)由图像可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x -甲=10+13+12+14+165=13,x -乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本上呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.考点二 茎叶图的应用[例2] (1)(2013·某某高考)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,8(2)某校高三年级进行了一次数学测验,随机从甲、乙两班各抽取6名同学,所得分数的茎叶图如图所示.甲班 乙班 2 9 1 7 0 8 0 3 6 6 2 7 2 5 8 6①根据茎叶图判断哪个班的平均分数较高,并说明理由;②现从甲班这6名同学中随机抽取两名同学,求他们的分数之和大于165分的概率. [自主解答] (1)由茎叶图及已知得x =5,又乙组数据的平均数为16.8,即9+15+10+y +18+245=16.8,解得y =8.(2)①因为乙班的成绩集中在80分,且没有低分,所以乙班的平均分比较高.②设“从甲班中任取两名同学,两名同学分数之和超过165分”为事件A .从甲班6名同学中任取两名同学,则基本事件空间中包含了15个基本事件,又事件A 中包含4个基本事件,所以P (A )=415.即从甲班中任取两名同学,两名同学分数之和大于165分的概率为415.[答案] (1)C 【互动探究】本例(1)中条件不变,试比较甲、乙两组哪组成绩较好. 解:由原题可知x =5,则甲组平均分为9+12+15+24+275=17.4.而乙组平均分为16.8,所以甲组成绩较好.【方法规律】茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐.甲、乙两个小组各10名学生的英语口语测试成绩如下(单位:分): 甲组:76 90 84 86 81 87 86 82 85 83 乙组:82 84 85 89 79 80 91 89 79 74用茎叶图表示这两个小组的成绩,并判断哪个小组的成绩更整齐一些. 解:茎叶图如图所示(中间的茎为十位上的数字).由茎叶图容易看出甲组的成绩是对称的,有810的叶集中分布在茎8上,乙组的成绩也大致对称,有610的叶集中分布在茎8上,从叶在茎上的分布情况看,甲组的成绩更整齐一些.高频考点 考点三频率分布直方图的应用1.频率分布直方图是用样本估计总体的一种重要的方法,是高考命题的一个热点,多以选择题或填空题的形式呈现,试题难度不大,多为容易题或中档题.2.高考对频率分布直方图的考查主要有以下两个命题角度: (1)已知频率分布直方图中的部分数据,求其他数据; (2)已知频率分布直方图,求某些X 围内的数值.[例3] (1)(2013·某某高考)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60(2)(2013·某某高考)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120[自主解答] (1)成绩在[20,40)和[40,60)的频率分别是0.1,0.2,则低于60分的频率是0.3,设该班学生总人数为m ,则15m=0.3,m =50.(2)由频率分布直方图可得,该模块测试成绩不少于60分的学生人数为600-(0.005+0.015)×10×600=480.[答案] (1)B (2)B与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种X围内的数据.可利用图形及某X围结合求解.(2014·某某模拟)如图是某市3月1日至14日的空气质量指数趋势图.空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染.某人随机选择3月1日至3月13日中的某一天到达该市,并停留2天.(1)求此人到达当日空气质量优良的概率;(2)求此人在该市停留期间只有1天空气重度污染的概率;(3)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)解:(1)在3月1日至3月13日这13天中,1日、2日、3日、7日、12日、13日共6天的空气质量优良,所以此人到达当日空气质量优良的概率是6 13 .(2)根据题意,事件“此人在该市停留期间只有1天空气重度污染”等价于“此人到达该市的日期是4日,或5日,或7日,或8日”,所以此人在该市停留期间只有1天空气重度污染的概率为413.(3)从3月5日开始连续三天的空气质量指数方差最大.——————————[课堂归纳——通法领悟]———————————2个异同——众数、中位数和平均数的异同,标准差和方差的异同(1)众数、中位数和平均数的异同众数中位数平均数相同点都是描述一组数据集中趋势的量不同点与这组数据中的部分数据有关,出现在这些数据中不一定在这些数据中出现.奇数个时,在这组数值中出现;偶数时,为中间两数平均值不一定在这些数值中出现(2)标准差和方差的异同相同点:标准差和方差描述了一组数据围绕平均数波动的大小.不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然.2个区别——直方图与条形图的区别不要把直方图错以为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为f iΔx i,这是密度,连续随机变量在某一点上是没有频率的.易误警示(十八)频率分布直方图中的易错点[典例] 如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的X围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.[解题指导] 平均气温低于22.5 ℃是图中最左边两个矩形面积,而平均气温不低于25.5 ℃是最右边矩形的面积.[解析] 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右边矩形面积为0.18×1=0.18,则样本中平均气温不低于25.5 ℃的城市个数为50×0.18=9.[答案] 9[名师点评] 1.忽视频率分布直方图中纵轴的含义为f iΔx i,误认为是每组相应的频率值,导致失误;2.不清楚直方图中各组的面积之和为1,导致某组的频率不会求; 3.不理解由直方图求样本平均值的方法,误用每组的频率乘以每组的端点值而导致失误; 4.由直方图确定众数时应为最高矩形中点对应的横坐标值.对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如图所示,由图可知,这一批电子元件中使用寿命在100~300 h 的电子元件的数量与使用寿命在300~600 h 的电子元件的数量的比是________.解析:寿命在100~300 h 的电子元件的频率为⎝ ⎛⎭⎪⎫12 000+32 000×100=420=15;寿命在300~600 h 的电子元件的频率为⎝ ⎛⎭⎪⎫1400+1250+32 000×100=45. 则它们的电子元件数量之比为15∶45=1∶4.答案:1∶4[全盘巩固]1.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92解析:选A 将这组数据从小到大排列,得87,89,90,91,92,93,94,96.故中位数为91+922=91.5.平均数为x -=87+89+90+91+92+93+94+968=91.5.2.容量为20的样本数据,分组后的频数如下表: 分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70] 频数 2 3 4 5 4 2则样本数据落在区间[10,40)的频率为( ) A .0.35 B .0.45 C .0.55 D .0.65解析:选B 求得该频数为2+3+4=9,样本容量是20,所以频率为920=0.45.3.(2014·某某模拟)某班的全体学生参加数学测试,成绩的频率分布直方图如图所示,数据的分组依次为:[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60 解析:选B 由频率分布直方图可知;低于60分学生的频率为:(0.01+0.005)×20=0.3,又因为低于60分的人数为15,所以学生人数为150.3=50.4.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析:选A 从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56.5.(2013·某某高考)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )解析:选A 由已知得,共分为8组,选项C 、D 不符合题意,应排除;由茎叶图知[0,5)的频数为1,f i Δx i =120×5=0.01,[5,10)的频数为1,f i Δx i =120×5=0.01,[10,15)的频数为4,f i Δx i =420×5=0.04,……由以上计算可知,选项B 不符合题意.6.某地区为了解中学生的日平均睡眠时间(单位:h),随机选择了n 位中学生进行调查,根据所得数据画出样本的频率分布直方图,如图所示,且从左到右的第1个、第4个、第2个、第3个小长方形的面积依次构成公差为0.1的等差数列,又第一小组的频数是10,则n 等于( )A .80B .90C .100D .110解析:选C 设第1个小长方形的面积为S ,则4个小长方形的面积之和为⎝ ⎛⎭⎪⎫4S +4×32×0.1, 由题意知,4S +4×32×0.1=1,故S =0.1,又因为10n=0.1,所以n =100.7.(2013·某某高考)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员 第1次 第2次 第3次 第4次 第5次 甲 87 91 90 89 93 乙 89 90 91 88 92则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.解析:设甲、乙两位射击运动员的平均成绩分别为x -甲,x -乙,方差分别为s 2甲,s 2乙.由题意得,x -甲=87+91+90+89+935=90, s 2甲=15×[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2] =15×[(-3)2+12+02+(-1)2+32] =4;x -乙=89+90+91+88+925=90, s 2乙=15×[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2] =15×[(-1)2+02+12+(-2)2+22] =2.则s 2甲>s 2乙,乙的成绩较为稳定,方差为2.答案:28.(2013·某某高考)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x 的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.解析:(1)由频率分布直方图总面积为1,得(0.001 2+0.002 4×2+0.003 6+x +0.006 0)×50=1,解得x =0.004 4;(2)用电量在[100,250)内的频率为(0.003 6+0.004 4+0.006 0)×50=0.7,故户数为100×0.7=70.答案:(1)0.004 4 (2)709.(2014·万州模拟)为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a ,最大频率为0.32,则a 的值为________.解析:由直方图可知:前2组的频率之和为0.5×0.1+1.1×0.1=0.16,它们的频数和为100×0.16=16.因此,第三组的频数为100-(62+16)=22,第四组的频数为0.32×100=32.故a=22+32=54.答案:5410.从某校高三年级800名男生中随机抽取50名测量其身高,据测量,被测学生的身高全部在155 cm至195 cm之间.将测量结果按如下方式分成8组:第一组[155,160),第二组[160,165),…,第八组[190,195],如图是按上述分组得到的频率分布直方图的一部分.已知第一组与第八组的人数相同,第七组与第六组的人数差恰好为第八组与第七组的人数差.求下列频率分布表中字母的值,并补充完成频率分布直方图.频率分布表:分组频数频率频率/组距…………[180,185)x y z[185,190)m n p…………解:由频率分布直方图可知前五组的频率是(0.008+0.016+0.04+0.04+0.06)×5=0.82,第八组的频率是0.008×5=0.04,所以第六、七组的频率和是1-0.82-0.04=0.14,所以第八组的人数为50×0.04=2,第六、七组的总人数为50×0.14=7.由已知得x+m=7,m-x=2-m,解得x=4,m=3,所以y=0.08,n=0.06,z=0.016,p=0.012.补充完成的频率分布直方图如图所示.11.(2013·新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.41.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?A 药B 药0.1.2.3.解:(1)设A 药观测数据的平均数为x -,B 药观测数据的平均数为y -,由观测结果可得x -=120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y -=120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得x ->y -,因此可看出A 药的疗效更好.(2)由观测结果可绘制如下茎叶图:A 药B 药6 0. 5 5 6 8 98 5 5 2 2 1. 1 2 2 3 4 6 7 8 99 8 7 7 6 5 4 3 3 2 2. 1 4 5 6 75 2 1 0 3. 2从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2,3上,而B 药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A 药的疗效更好. 12.(2013·某某高考)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x -1、x -2,估计x -1-x -2的值.解:(1)设甲校高三年级学生总人数为n .由题意知,30n=0.05,即n =600. 样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级此次联考数学成绩及格率为1-530=56.(2)设甲、乙两校样本平均数分别为x -1′,x -2′.根据样本茎叶图可知,30(x -1′-x -2′)=30x -1′-30x -2′=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15.因此x -1′-x -2′=0.5.故x -1-x -2的估计值为0.5分.[冲击名校]1.(2013·某某高考)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.解析:设5个班级的数据分别为0<a <b <c <d <e .由平均数及方差的公式得a +b +c +d +e 5=7,a -72+b -72+c -72+d -72+e -725=4.设a -7,b -7,c -7,d -7,e -7分别为p ,q ,r ,s ,t ,则p ,q ,r ,s ,t 均为整数,则⎩⎪⎨⎪⎧p +q +r +s +t =0,p 2+q 2+r 2+s 2+t 2=20.设f (x )=(x -p )2+(x -q )2+(x -r )2+(x -s )2=4x 2-2(p +q +r +s )x +(p 2+q 2+r 2+s 2)=4x 2+2tx +20-t 2,由(x -p )2,(x -q )2,(x -r )2,(x -s )2不能完全相同知f (x )>0,则判别式Δ<0,解得-4<t <4,所以-3≤t ≤3,所以e 的最大值为10.答案:102.(2013·某某高考)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4则:(1)平均命中环数为________;(2)命中环数的标准差为________.解析:(1)由公式知,平均数为110×(7+8+7+9+5+4+9+10+7+4)=7; (2)由公式知,s 2=110×(0+1+0+4+4+9+4+9+0+9)=4.∴标准差s =2. 答案:(1)7 (2)2[高频滚动]某市甲、乙、丙3个区共有高中学生20 000人,且甲、乙、丙3个区的高中学生人数之比为2∶3∶5.现要用分层抽样方法从该市甲、乙、丙3个区所有高中学生中抽取一个样本,已知从甲区中抽取了80人,则应从乙、丙2个区中共抽取 ( )A .120人B .200人C .320人D .400人解析:选C 由已知条件可得甲区高中学生人数为20 000×210=4 000人,则应当从乙、丙2个区中共抽取804 000×(20 000-4 000)=320人.。

高考数学一轮复习 用样本估计总体课件

高考数学一轮复习 用样本估计总体课件

C. 3
D. 4
解析:四种说法都正确,甲队的平均进球数多于乙队,故
第一句正确;乙队标准差较小,说明技术水平稳定;甲队
平均进球数是3.2,但其标准差却是3,离散程度较大,由
此可判断甲队表现不稳定;平均进球数是1.8,标准差只有
0.3,每场的进球数相差不多,可见乙队的确很少不进球. 答案:D
4.如图是某兴趣小组学生在一次数学测验中 的得分茎叶图,则该组男生的平均得分与
图的一部分(如下图),已知从左到右前5个小组的频率分别 为0.04,0.10,0.14,0.28,0.30.第6小组的频数是7.
(1)请将频率分布直方图补充完整;
(2)该校参加这次铅球测试的男生有多少人?
(3)若成绩在8.0米以上(含8.0米)的为合格,试求这次铅球 测试的成绩的合格率; (4)在这次测试中,你能确定该校参加测试的男生铅球成 绩的众数和中位数各落在哪个小组内吗?
(3)频率分布表和频率分布直方图是一组数据频率分布的两 种形式,前者准确,后者直观. (4)众数为最高矩形中点的横坐标. (5)中位数为平分频率分布直方图面积且垂直于横轴的直线 与横轴交点的横坐标.
为了了解某校初中毕业男生的体能状况,从该校 初中毕业班学生中抽取若干名男生进行铅球测试,把所得
数据(精确到0.1米)进行整理后,分成6组画出频率分布直方
[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=
∴乙稳定.
答案:乙
频率分布直方图反映样本的频率分布:
(1)频率分布直方图中横坐标表示组距,纵坐标表示
频率=组距×

(2)频率分布直方图中各小长方形的面积之和为1,因此在 频率分布直方图中组距是一个固定值,所以各小长方形高 的比也就是频率比.

2015高考数学一轮复习课件:10.2 用样本估计总体

2015高考数学一轮复习课件:10.2 用样本估计总体

变式探究 1 为了了解某校高三学生的视力情况,随机地抽 查了该校 100 名高三学生的视力情况,得到频率分布直方图如下 图,由于不慎将部分数据丢失,但知道后 5 组频数和为 62,设 视力在 4.6 到 4.8 之间的学生数为 a,最大频率为 0.32,则 a 的 值为( )
A.64 B.54 C.48 D.27
第十七页,编辑于星期五:十二点 十九分。
(1)请将频率分布直方图补充完整.
(2)该校参加这次铅球测试的男生有多少人? (3)若成绩在 8.0 m 以上(含 8.0 m)的为合格,试求这次铅球测 试的成绩的合格率.
第十八页,编辑于星期五:十二点 十九分。
解析: (1)由频率分布直方图的意义可知,各小组频率之和为 1,故 第 6 小组的频率为: 1-(0.04+0.10+0.14+0.28+0.30)=0.14,易知第 6 小组与 第 3 小组的频率相等,故两个小长方形等高,图略. (2)由(1)知,第 6 小组的频率是 0.14. 又因为第 6 小组的频数是 7,现设参加这次测试的男生有 x 人,根据频率定义,得7x=0.14,即 x=50. (3)由图可知,第 4、5、6 小组成绩在 8.0 m 以上(含 8.0 m), 其频率之和为:0.28+0.30+0.14=0.72,故合格率为 72%.
10.2 用样本估计总体
第一,编辑于星期五:十二点 十九分。
第二页,编辑于星期五:十二点 十九分。
考点梳理
一、频率分布直方图
1.通常我们对总体作出的估计一般分成两种.一种是用样
本 的 ___频__率__分__布___ 估 计 总 体 的 分 布 . 另 一 种 是 用 样 本 的
_数__字__特__征___估计总体的数字特征.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2015届高考数学一轮总复习 10-2用样本估计总体基础巩固强化一、选择题1.(2013·重庆理,4)以下茎叶图记录了甲、乙两组各5名学生在一次英语听力测试中的成绩(单位:min).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( ) A .2,5 B .5,5 C .5,8 D .8,8[答案] C[解析] 由甲组数据中位数为15,可得x =5;而乙组数据的平均数16.8=9+15+(10+y )+18+245,可解得y =8,故选C.2.(2013·西宁模拟)已知一组数据:a 1,a 2,a 3,a 4,a 5,a 6,a 7构成公差为d 的等差数列,且这组数据的方差等于1,则公差d 等于( )A .±14B .±12C .±128D .无法求解[答案] B[解析] 这组数据的平均数为a 1+a 2+a 3+a 4+a 5+a 6+a 77=7a 47=a 4,又因为这组数据的方差等于1,所以17[(a 1-a 4)2+(a 2-a 4)2+(a 3-a 4)2+(a 4-a 4)2+(a 5-a 4)2+(a 6-a 4)2+(a 7-a 4)2]=(3d )2+(2d )2+d 2+0+d 2+(2d )2+(3d )27=4d 2=1,解得d =±12.3.已知一组正数x 1,x 2,x 3,x 4的方差为s 2=14(x 21+x 22+x 23+x 24-16),则数据x 1+2,x 2+2,x 3+2,x 4+2的平均数为( )A .2B .3[解析] 设x 1,x 2,x 3,x 4的平均值为x -,则 s 2=14[(x 1-x -)2+(x 2-x -)2+(x 3-x -)2+(x 4-x -)2]=14(x 21+x 22+x 23+x 24-4x -2), ∴4x -2=16,∴x -=2,x -=-2(舍),∴x 1+2,x 2+2,x 3+2,x 4+2的平均数为4,故选C.4.(文)(2013·辽宁理,5)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60 [答案] B[解析] 由频率分布直方图知,低于60分的同学所占频率为(0.005+0.01)×20=0.3,故该班的学生人数为150.3=50.故选B.(理)(2013·福建理,4)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480[解析]由频率分布直方图知40~60分的频率为(0.005+0.015)×10=0.2,故估计不少于60分的学生人数为600×(1-0.2)=480.5.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图.由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()A.64 B.54C.48 D.27[答案] B[解析]前两组中的频数为100×(0.05+0.11)=16.∵后五组频数和为62,∴前三组为38.∴第三组为22.又最大频率为0.32,故最大频数为0.32×100=32.∴a=22+32=54,故选B.6.(文)(2013·六安一模)如图是2012年某校举办“激扬青春,勇担责任”演讲比赛上七位评委为某位选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的中位数和平均数分别为()A.8587 B.8486C.8485 D.8586[答案] C[解析]由茎叶图知,评委为某选手打出的分数分别不79,84,84,84,86,87,93,去掉一个最高分和一个最低分后分数分别是84,84,84,86,87,所以中位数为84,平均数为15×(84+84+84+86+87)=85.(理)(2013·山东滨州一模)如图是2013年在某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶图,则去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A.84,4.84 B .84,1.6 C .85,1.6 D .85,4[答案] C[解析] 去掉一个最高分93和一个最低分79,所剩数据的平均数x -=84+84+86+84+875=85,方差s 2=15[(84-85)2×3+(86-85)2+(87-85)2]=1.6,故选C.二、填空题7.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试.对200名学生测试所得数据作出频率分布直方图如图所示,若次数在110以上(含110次)为达标,则从图中可以看出高一学生的达标率是________.[答案] 80%[解析] 次数在110以上(含110次)的频率之和为(0.04+0.03+0.01)×10=0.8,则高一学生的达标率为0.8×100%=80%.8.(文)将容量为n 的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n 等于________.[答案] 60[解析] 由条件知,2+3+42+3+4+6+4+1×n =27,解得n =60.(理)容量为100的样本分为10组,若前7组频率之和为0.79,而剩下三组的频数成等比数列,且其公比不为1,则剩下的三组频数最大的一组的频率是________.[答案] 0.16或0.12[解析]后三组频数和为100(1-0.79)=21,设这三组频数依次为a、ap、ap2(a、p∈N*且p>1),由题意设得,a+ap+ap2=21,∵p>1,∴1+p+p2是21的大于3的约数,∴1+p+p2=21或1+p+p2=7,得p=4或p=2.当p=4时,频数最大值为16,频率为0.16;当p=2时,频数最大值为12,频率为0.12.9.(文)(2013·湖北理,11)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示(1)直方图中x的值为________.(2)在这些用户中,用电量落在区间[100,250)内的户数为________.[答案](1)0.0044(2)70[解析]∵50×(0.0024+0.0036+0.006+x+0.0024+0.0012)=1,∴x=0.0044.用电量在区间[100,250)内的频率为50×(0.0036+0.006+0.0044)=0.7,∴户数为100×0.7=70(户).(理)(2013·北京西城一模)某年级120名学生在一次百米测试中,成绩全部介于13s与18s之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为,那么成绩在[16,18]的学生人数是________.[答案] 54[解析] 成绩在[16,18]的学生的人数所占比例为6+31+3+7+6+3=920,所以成绩在[16,18]的学生人数为120×920=54.三、解答题10.(2012·石家庄市二模)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市为了节约生活用水,计划在本市试行居民生活用水定额管理(即确定一个居民月均用水量标准,用水量不超过a 的部分按照平价收费,超过a 的部分按照议价收费).为了较为合理地确定出这个标准,通过抽样获得了100位居民某年的月均用水量(单位:t),制作了频率分布直方图.(1)由于某种原因频率分布直方图部分数据丢失,请在图中将其补充完整;(2)用样本估计总体,如果希望80%的居民每月的用水量不超过标准,则月均用水量的最低标准定为多少吨?并说明理由;(3)从频率分布直方图中估计该100位居民月均用水量的平均数.(同一组中的数据用该区间的中点值代表)[解析] (1)(2)月均用水量的最低标准应定为2.5t.样本中月均用水量不低于2.5t 的居民有20位,占样本总体的20%,由样本估计总体,要保证80%的居民每月的用水量不超出标准,月均用水量的最低标准应定为2.5t.(3)这100位居民的月均用水量的平均数为0.5×(14×0.10+34×0.20+54×0.30+74×0.40+94×0.60+114×0.30+134×0.10)=1.875(t).能力拓展提升一、选择题11.(文)某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品个数是( )A .90B .75C .60D .45 [答案] A[解析] 产品净重小于100克的频率为(0.050+0.100)×2=0.300,设样本容量为n ,则36n =0.300,所以n =120,净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.(理)某校对高三年级的学生进行体检,现将高三男生的体重(单位:kg)数据进行整理后分成六组,并绘制频率分布直方图(如图所示).已知图中从左到右第一、第六小组的频率分别为0.16、0.07,第一、第二、第三小组的频率成等比数列,第三、第四、第五、第六小组的频率成等差数列,且第三小组的频数为100,则该校高三年级的男生总数为( )A .480B .440C .420D .400[答案] D[解析] 设第一、第二、第三小组的频率构成的等比数列公比为q ,第三、第四、第五、第六小组的频率构成的等差数列公差为d ,则由题意知即⎩⎪⎨⎪⎧0.16+0.16q +0.64q 2+6d =1,0.16q 2+3d =0.07. 消去d 得,16q 2+8q -35=0.∵q >0,∴q =54.∴第三组的频率P =0.16q 2=0.25.设男生总数为x ,则x ×25%=100,∴x =400.12.(2013·山东济南一模)某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x -甲,x -乙和中位数y 甲,y 乙进行比较,下面结论正确的是( )A.x -甲>x -乙,y 甲>y 乙B.x -甲<x -乙,y 甲<y 乙 C.x -甲<x -乙,y 甲>y 乙 D.x -甲>x -乙,y 甲<y 乙 [答案] B[解析] 由茎叶图得x -甲=19+20+21+23+25+29+32+33+37+4110=28,x -乙=10+26+30+30+34+37+44+46+46+4710=35,y 甲=25+292=27,y 乙=34+372=35.5,∴x -甲<x -乙,y 甲<y 乙,故选B. 二、填空题13.(2013·福建莆田模拟)一组数据如茎叶图所示,若从中剔除2个数据,使得新数据组的平均数不变且方差最小,则剔除的2个数据的积等于________.[答案] 63[解析] 这组数据的平均数x -=3+8+12+11+13+16+217=12,由题意,剔除2个数据,平均数不变,且方差最小,则这两个数的和等于24且(x i -x -)2的和最大,所以这两个数为3与21,故剔除的2个数据的积等于3×21=63.14.(文)(2013·徐州模拟)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人.则n 的值为________.[答案] 100[解析] 由条件知,1-(0.01+0.024+0.036)×10=30n,∴n =100.(理)某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测这3000名学生在该次数学考试中成绩小于60分的学生数是________.[答案] 600[解析] 成绩小于60分的学生频率为:(0.002+0.006+0.012)×10=0.2 故3000名学生中成绩小于60分的学生数为:3000×0.2=600. 三、解答题15.(2013·东北三校联考)PM2.5是指悬浮在空气中的空气动力学当量直径小于或等于2.5μm 的颗粒物,也称为可入肺颗粒物,根据现行国家标准GB3095—2012,PM2.5日均值在35微克/m 3以下空气质量为一级;在35微克/m 3~75微克/m 3之间空气质量为二级;在75微克/m 3以上空气质量为超标.从某自然保护区2012年全年每天的PM2.5监测值数据中随机地抽取12天的数据作为样本,监测值如茎叶图所示(十位为茎,个位为叶):(1)求空气质量为超标的数据的平均数与方差;(2)从空气质量为二级的数据中任取2个,求这2个数据的和小于100的概率;(3)以这12天的PM2.5日均值来估计2012年的空气质量情况,估计2012年(按366天计算)中大约有多少天的空气质量达到一级或二级.[解析] (1)空气质量为超标的数据有四个:77,79,84,88, 平均数为x -=77+79+84+884=82.方差为s 2=14×[(77-82)2+(79-82)2+(84-82)2+(88-82)2]=18.5.(2)空气质量为二级的数据有五个:47,50,53,57,68,任取两个有十种可能结果:{47,50},{47,53},{47,57},{47,68},{50,53},{50,57},{50,68},{53,57},{53,68},{57,68},两个数据和小于100的结果有一种:{47,50}, 记“两个数据和小于100”为事件A ,则P (A )=110,即从空气质量为二级的数据中任取2个,这2个数据和小于100的概率为110.(3)空气质量为一级或二级的数据共8个,所以空气质量为一级或二级的频率为812=23, 366×23=244,所以,2012年的366天中空气质量达到一级或二级的天数估计为244天.16.(文)某学校为了了解学生的日平均睡眠时间(单位:h),随机选择了n 名同学进行调查.下表是这n 名同学的日睡眠时间的频率分布表.(1)求(2)统计方法中,同一组数据常用该组区间的中点值(例如区间[4,5)的中点值是4.5)作为代表.若据此计算的上述数据的平均值为6.52,求a 、b 的值,并由此估计该学校学生的日平均睡眠时间在7小时以上的概率.[解析] (1)由频率分布表可得n =60.12=50.补全数据如下表频率分布直方图如下:(2)由题意知,⎩⎪⎨⎪⎧150(6×4.5+10×5.5+a ×6.5+b ×7.5+4×8.5)=6.52,6+10+a +b +4=50. 解得a =15,b =15.设“该学校学生的日平均睡眠时间在7小时以上”为事件A , 则P (A )≈15+450=0.38答:该学校学生的日平均睡眠时间在7小时以上的概率约为0.38.(理)某校高三(1)班共有40名学生,他们每天自主学习的时间全部在180min 到330min 之间,按他们学习时间的长短分5个组统计得到如下频率分布表:(1)求分布表中s 、t (2)某兴趣小组为研究每天自主学习的时间与学习成绩的相关性,需要在这40名学生中按时间用分层抽样的方法抽取20名学生进行研究,问应抽取多少名第一组的学生?(3)已知第一组的学生中男、女生均为2人,在(2)的条件下抽取第一组的学生,求既有男生又有女生被抽中的概率.[解析] (1)s =840=0.2,t =1-0.1-s -0.3-0.25=0.15.(2)设应抽取x 名第一组的学生,则x 4=2040,得x =2.故应抽取2名第一组的学生.(3)在(2)的条件下应抽取2名第一组的学生. 记第一组中2名男生为a 1,a 2,2名女生为b 1,b 2,按时间用分层抽样的方法抽取2名第一组的学生共有6种等可能的结果,列举如下: a 1a 2,a 1b 1,a 1b 2,a 2b 1,a 2b 2,b 1b 2.其中既有男生又有女生被抽中的有a 1b 1,a 1b 2,a 2b 1,a 2b 2,共4种结果, 所以既有男生又有女生被抽中的概率为P =46=23.考纲要求1.了解频率分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. 补充说明1.编制频率分布直方图的步骤如下:①求极差:极差是一组数据的最大值与最小值的差.②决定组距和组数:当样本容量不超过100时,常分成5~12组.组距=极差组数.③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可以将样本数据多取一位小数分组;④列频率分布表:登记频数,计算频率,列出频率分布表.将样本数据分成若干小组,每个小组内的样本个数称为频数,频数与样本容量的比值叫做这一小组的频率.频率反映数据在每组所占比例的大小.⑤绘制频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.2.频率分布折线图(1)把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图. (2)总体密度曲线如果样本容量不断增大,分组的组距不断缩小,则频率分布折线图实际上越来越接近于一条光滑曲线,这条光滑的曲线就叫总体密度曲线.3.茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.4.方差是刻画一组数据离散程度的量,它反映一组数据围绕平均数波动的大小.方差越大,这组数据波动越大,越分散.讨论产品质量、售价高低、技术高低、产量高低、成绩高低、寿命长短等等问题,一般都是通过方差来体现.计算方差时,要依据所给数据的特点恰当选取公式以简化计算.备选习题1.从某女子跳远运动员的多次测试中,随机抽取20次成绩作为样本,按各次的成绩(单位:cm)分成五组,第一组[490,495),第二组[495,500),第三组[500,505),第四组[505,510),第五组[510,515],相应的样本频率分布直方图如图所示.(1)样本落入第三组[500,505)的频数是多少?(2)现从第二组和第五组的所有数据中任意抽取两个,分别记为m、n,求事件“|m-n|≤5”的概率.[解析](1)由频率分布直方图可知,样本落入[500,505)的频率是1-(0.01+0.02+0.04+0.03)×5=0.5,所以,样本落入[500,505)的频数是0.5×20=10.(2)第二组中有0.02×5×20=2个数据,记为a、b;第五组中有0.03×5×20=3个数据,记为A、B、C.则{m,n}的所有可能结果为{a,b},{a,A},{a,B},{a,C},{b,A},{b,B},{b,C},{A,B},{A,C},{B,C},共10种.其中使|m-n|≤5成立的有{a,b},{A,B},{A,C},{B,C},共4种.所以事件“|m-n|≤5”的概率为P=410=25.2.(2013·烟台四校联考)据悉2012年山东省高考要将体育成绩作为参考,为此,济南市为了了解今年高中毕业生的体能状况,从本市某校高中毕业班中抽取一个班进行铅球测试,成绩在8.0m(精确到0.1m)以上的为合格.把所得数据进行整理后,分成6组,并画出频率分布直方图的一部分如图所示.已知从左到右前5个小组的对应矩形的高分别为0.04,0.10,0.14,0.28,0.30,且第6小组的频数是7.(1)求这次铅球测试成绩合格的人数;(2)若由直方图来估计这组数据的中位数,指出该中位数在第几组内,并说明理由. [解析] (1)由题易知,第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)×1=0.14, ∴此次测试的总人数为70.14=50.∴这次铅球测试成绩合格的人数为(0.28×1+0.30×1+0.14×1)×50=36.(2)直方图中位数两侧的矩形面积和相等,即频率和相等,前三组的频率和为0.28,前四组的频率和为0.56,∴中位数位于第4组内.。

相关文档
最新文档