三维设计高考数学理总复习用样本估计总体
2024年广东省高考数学一轮复习第9章第2讲:用样本估计总体(附答案解析)
![2024年广东省高考数学一轮复习第9章第2讲:用样本估计总体(附答案解析)](https://img.taocdn.com/s3/m/e06394f89fc3d5bbfd0a79563c1ec5da50e2d6f5.png)
2024年广东省高考数学一轮复习第9章第2讲:用样本估计总体考试要求 1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.能用数字特征估计总体集中趋势和总体离散程度.知识梳理1.百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.平均数、中位数和众数(1)平均数:x=1n(x1+x2+…+x n).(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).3.方差和标准差(1)方差:s2=1n错误!(x i -x)2或1n错误!2i-x2.(2)标准差:s=错误!.4.总体(样本)方差和总体(样本)标准差(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体平均数为Y,则总体方差S2=1N错误!(Y i-Y)2.(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体方差为S2=1N错误!i(Y i-Y)2.常用结论1.若x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,…,mx n+a的平均数为m x+a.2.数据x1,x2,…,x n与数据x1′=x1+a,x2′=x2+a,…,x n′=x n+a的方差相等,即数据经过平移后方差不变.3.若x1,x2,…,x n的方差为s2,那么ax1+b,ax2+b,…,ax n+b的方差为a2s2.思考辨析判断下列结论是否正确(请在括号中打“√”或“×”)(1)对一组数据来说,平均数和中位数总是非常接近.(×)(2)方差与标准差具有相同的单位.(×)(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(√)(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√)教材改编题1.若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为()A.2B.4C.6D.8答案D解析根据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据2x1,2x2,…,2x9的方差为22s2=8.2.某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为()A.88.5B.89C.91D.89.5答案B解析7次的训练成绩从小到大排列为85,86,87,88,88,89,90,7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数据,即89.3.某校体育节10名旗手的身高(单位:cm)分别为175,178,176,180,179,175,176,179,180,179,则中位数为________.答案178.5解析把10名旗手的身高从小到大排列为175,175,176,176,178,179,179,179,180,180,则178+1792=178.5,所以所求中位数为178.5.题型一样本的数字特征和百分位数的估计例1(1)从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位数分别为()A.92,85B.92,88C.95,88D.96,85答案B解析数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经按照由小到大的顺序排列,计算10×25%=2.5,取第三个数,所以第25百分位数是88.延伸探究本例中,第70百分位数是多少?解10×70%=7,第70百分位数是第7项与第8项的平均数,为92+962=94.(2)(多选)(2023·哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物(PM 2.5)的观测值:396275268225168166176173188168141157若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发生改变的是()A .极差B .中位数C .众数D .平均数答案ABD解析根据题意,若在此组数据中增加一个比现有的最大值大25的数据,即最大值变为396+25=421,极差为最大值与最小值的差,要发生改变;加入数据前,中位数为12×(173+176)=174.5,加入数据后,中位数为176,发生改变;众数为数据中出现次数最多的数,不会改变;若加入数据前,平均数为x ,加入数据后,平均数为12x +42113>x,发生改变.思维升华计算一组n 个数据第p 百分位数的步骤跟踪训练1(1)某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为85,90,93,99,101,103,116,130,则这8名学生数学成绩的第75百分位数为()A .102B .103C .109.5D .116答案C 解析这组数据已经按照由小到大的数据排列,8×75%=6,则这8名学生数学成绩的第75百分位数为第6个数与第7个数的平均数,即为103+1162=109.5.(2)(多选)冬季奥林匹克运动会,是世界规模最大的冬季综合性运动会.自1924年起,每四年举办一届.2022年2月在北京举办了第24届冬季奥林匹克运动会,为了宣传奥运精神,红星实验学校组织了甲、乙两个社团,利用一周的时间对外进行宣传,将每天宣传的次数绘制成如图所示的频数分布折线图,则()A .甲社团宣传次数的众数小于乙社团宣传次数的众数B .甲社团宣传次数的极差大于乙社团宣传次数的极差C .甲社团宣传次数的平均数大于乙社团宣传次数的平均数D .甲社团宣传次数的方差大于乙社团宣传次数的方差答案ABD解析观察每天宣传次数的频数分布折线图,甲社团宣传次数的众数、乙社团宣传次数的众数分别为2,3,A 正确;甲社团宣传次数的极差、乙社团宣传次数的极差分别为3,2,B 正确;甲社团宣传次数的平均数x 1=2+2+3+2+5+4+37=3,乙社团宣传次数的平均数x 2=2+2+3+4+3+3+47=3,C 不正确;甲社团宣传次数的方差s 21=17×[3×(2-3)2+2×(3-3)2+(5-3)2+(4-3)2]=87,乙社团宣传次数的方差s 22=17×[2×(2-3)2+3×(3-3)2+2×(4-3)2]=47,D 正确.题型二总体集中趋势的估计例2为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m 的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.解(1)由频率分布直方图知(0.01+m +0.04+0.02)×10=1,解得m =0.03;设此次竞赛活动学生成绩的中位数为x 0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x 0<90,由(x 0-80)×0.04=0.5-0.4,得x 0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由频率分布直方图及(1)知,x =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-8210×0.4=0.52,则获奖的学生有500×0.52=260(名),所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.思维升华频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.跟踪训练2(2022·哈尔滨模拟)治理沙漠化离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.(1)求直方图中a 的值及众数、中位数;(2)若树苗高度在185cm 及以上是可以移栽的合格树苗.从样本中用比例分配的分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格树苗分别应抽取多少株?解(1)∵(0.0015+0.0110+0.0225+0.0300+a +0.0080+0.0020)×10=1,∴a =0.0250,众数为185+1952=190,设中位数为x ,∵(0.0015+0.0110+0.0225)×10=0.35<0.5,(0.0015+0.0110+0.0225+0.0300)×10=0.65>0.5,则185<x<195,0.35+0.0300×(x-185)=0.5,∴x=190.故a=0.0250,众数为190,中位数为190.(2)由题意可知,合格树苗所占频率为(0.0300+0.0250+0.0080+0.0020)×10=0.65,不合格树苗所占频率为1-0.65=0.35,所以不合格树苗抽取20×0.35=7(株),合格树苗抽取20×0.65=13(株),故不合格树苗、合格树苗应分别抽取7株和13株.题型三总体离散程度的估计例3(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下.旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s21和s22.(1)求x,y,s21,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s21+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解(1)由表格中的数据易得x=110×(-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.3)+10.0=10.0,y=110×(0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.5)+10.0=10.3,s21=110×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,s22=110×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.(2)由(1)中数据可得y -x =10.3-10.0=0.3,而2s 21+s 2210=25(s 21+s 22)=0.0304,显然有y -x >2s 21+s 2210著提高.思维升华总体离散程度的估计标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.跟踪训练3(2022·济宁模拟)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.解(1)x 甲=18×(82+81+79+78+95+88+93+84)=85,x 乙=18×(92+95+80+75+83+80+90+85)=85,s 2甲=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,s 2乙=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41.(2)由(1)知x 甲=x 乙,s 2甲<s 2乙,甲的成绩较稳定,所以派甲参赛比较合适.课时精练1.为做好疫情防控工作,某校坚持落实“双测温两报告”制度,以下是某宿舍6名学生某日上午的体温记录:36.3,36.1,36.4,36.7,36.5,36.6(单位:℃),则该组数据的第80百分位数为()A .36.7B .36.6C .36.5D .36.4答案B解析将6名学生该日上午的体温记录从小到大排列为36.1,36.3,36.4,36.5,36.6,36.7,因为80%×6=4.8,所以该组数据的第80百分位数为36.6.2.(2022·南京模拟)已知一组数据x 1,x 2,x 3,x 4,x 5的平均数为2,方差为12,则另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数、方差分别为()A .2,12B .2,1C .4,32D .4,92答案D解析因为一组数据x 1,x 2,x 3,x 4,x 5的平均数为2,方差为12,所以另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数为3×2-2=4,方差为32×12=92.3.(多选)成立时间少于10年、估值超过10亿美元且未上市的企业称为独角兽企业.2022年中国新经济独角兽企业分布较广泛、覆盖居民生活的各个方面.如图为2022年中国新经济独角兽企业TOP100的行业分布图,在中国新经济独角兽企业TOP100榜单中,京、沪、粤三地的企业数量共同占比达到70%.下列说法正确的是()A .随着智能出行与共享经济观念的普及,汽车交通行业备受投资者关注B .在该TOP100榜单中独角兽企业数量的中位数是3C .在中国新经济独角兽企业TOP100榜单中,京、沪、粤三地的企业超过82家D .2022年中国新经济独角兽企业TOP100榜单中,企业服务、汽车交通、先进制造行业的企业数量共同占比超过30%答案AD解析A 选项,由图可知,汽车交通行业在独角兽企业TOP100榜单中数量较多,故A 选项正确;B 选项,数据为11,10,10,10,10,9,7,6,4,4,4,4,3,2,2,2,2,则中位数为4,故B 选项不正确;C 选项,100×70%=70<82,故C 选项不正确;D 选项,企业服务、汽车交通、先进制造行业的企业数量共同占比为11+10+10100×100%=31%>30%,故D 选项正确.4.(多选)习近平总书记强调,要坚持健康第一的教育理念,加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级学生每周在校体育锻炼时长(单位:小时)进行了统计,得到如下频率分布表:分组[2,3)[3,4)[4,5)[5,6]频率0.250.300.200.25则下列关于高一年级学生每周体育锻炼时长的说法中正确的是()A .众数约为2.5B .中位数约为3.83C .平均数为3.95D .第80百分位数约为5.2答案BCD解析对于A ,根据频率分布表可得,高一年级学生每周体育锻炼时长的众数为3+42=3.5,故A 错误;对于B ,设高一年级学生每周体育锻炼时长的中位数为x ,则0.25+x -34-3×0.30=0.5,解得x ≈3.83,故B 正确;对于C ,高一年级学生每周体育锻炼时长的平均数为0.25×2.5+0.30×3.5+0.20×4.5+0.25×5.5=3.95,故C 正确;对于D ,因为0.25+0.30+0.20+0.05=0.80,所以高一年级学生每周体育锻炼时长的第80百分位数约为5+0.050.25=5.2,故D 正确.5.(多选)第24届冬奥会于2022年2月4日在国家体育场鸟巢举行了盛大开幕式.在冬奥会的志愿者选拔工作中,某高校承办了面试工作,面试成绩满分100分,现随机抽取了80名候选者的面试成绩并分为五组,绘制成如图所示的频率分布直方图,则下列说法正确的是(每组数据以区间的中点值为代表)()A.b的值为0.25B.候选者面试成绩的中位数约为69.4C.在被抽取的候选者中,成绩在区间[65,75)之间的候选者有30人D.估计候选者的面试成绩的平均数约为69.5答案BD解析对于A,由(0.005+b+0.045+0.02+0.005)×10=1,解得b=0.025,故A错误;对于B,设候选者面试成绩的中位数为x,则(0.005+0.025)×10+(x-65)×0.045=0.5,解得x≈69.4,故B正确;对于C,成绩在区间[65,75)的频率为0.045×10=0.45,故人数为80×0.45=36,故C错误;对于D,50×0.005×10+60×0.025×10+70×0.045×10+80×0.02×10+90×0.005×10=69.5,故D正确.6.(2023·云南师大附中模拟)根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①,②,③,④,依次计算得到结果如下:①平均数x<4;②平均数x<4且极差小于或等于3;③平均数x<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A.1组B.2组C.3组D.4组答案B解析①举反例:0,0,0,4,11,其平均数x=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10-3=7,此时数据的平均数必然大于7,与x<4矛盾,故假设错误.则此组数据全部小于10.符合入冬指标;③举反例:1,1,1,1,11,平均数x=3<4,且标准差s=4.但不符合入冬指标;④在众数等于5且极差小于等于4时,最大数不超过9.符合入冬指标.7.(2022·福州模拟)电影《长津湖》点燃了人们心中对英雄的崇敬之情,也更加显示出如今和平生活的来之不易.某影院记录了观看此片的70位观众的年龄,其中年龄位于区间[10,20)内的有10位,位于区间[20,30)内的有20位,位于区间[30,40)内的有25位,位于区间[40,50]内的有15位,则这70位观众年龄的众数的估计值为________.答案35解析由于25>20>15>10,故众数位于区间[30,40)内,所以众数的估计值为30+402=35.8.(2023·沧州模拟)已知某样本数据分别为1,2,3,a ,6,若样本平均数x =3,则样本方差s 2=________.答案145解析由题设,得x =1+2+3+a +65=3,可得a =3,所以s 2=15错误!(x i -x )2=145.9.(2023·南通模拟)某学校对高一某班的同学进行了身高(单位:cm)调查,将得到的数据进行适当分组后(除最后一组为闭区间外其余每组为左闭右开区间),画出如图所示的频率分布直方图.(1)求m 的值;(2)估计全班同学身高的中位数;(3)估计全班同学身高的平均数及方差(同一组中的数据用该组区间的中点值作代表).解(1)由频率分布直方图可得(m +0.010+0.010+0.015+0.040)×10=1,解得m =0.025.(2)设全班同学身高的中位数为x ,由题可知x ∈[165,175),得0.10+0.15+(x -165)×0.040=0.5,解得x =171.25,故估计全班同学身高的中位数为171.25.(3)估计全班同学身高的平均数为150×0.10+160×0.15+170×0.40+180×0.25+190×0.10=171,估计全班同学身高的方差为(150-171)2×0.10+(160-171)2×0.15+(170-171)2×0.40+(180-171)2×0.25+(190-171)2×0.10=119.10.对参加某次数学竞赛的1000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.(1)根据直方图完成以下表格;成绩[50,60)[60,70)[70,80)[80,90)[90,100]频数(2)求参赛选手初赛成绩的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛的选手成绩?解(1)填表如下:成绩[50,60)[60,70)[70,80)[80,90)[90,100]频数50150350350100(2)平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78,方差为(55-78)2×0.05+(65-78)2×0.15+(75-78)2×0.35+(85-78)2×0.35+(95-78)2×0.1=101.(3)进入复赛的选手成绩为80+350-(380-100)350×10=82(分),所以初赛成绩为82分及以上的选手均可进入复赛.(说明:回答82分以上,或82分及以上均可).11.(2022·天津模拟)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5~40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28答案D解析垫球数在区间[5,25)内的人数占总数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%;所以第75百分位数位于区间[25,30)内,且25+5×0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.12.(2022·上海模拟)若等差数列{x n }的公差为3,则x 1,x 2,x 3,…,x 9的方差为________.答案60解析由等差数列{x n }的公差为3,可知x =x 1+x 2+…+x 99=x 1+x 92×99=x 1+x 92=x 5,所以方差s 2=19[(x 1-x 5)2+(x 2-x 5)2+…+(x 9-x 5)2]=19(16d 2+9d 2+4d 2+d 2)×2=203d 2=203×9=60.13.(多选)某学校规定,若五个工作日内学校某天有超过3个人的体温测量值高于37.5℃,则需全员进行核酸检测.该校统计了五个工作日内每天体温超过37.5℃的人数,则根据这组数据的下列信息,能断定该校不需全员进行核酸检测的是()A .中位数是1,平均数是1B .中位数是1,众数是0C .中位数是2,众数是2D .平均数是2,方差是0.8答案AD 解析对于A ,因为中位数是1,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为a ,b ,1,c ,d ,因为平均数是1,所以a +b +1+c +d =5,若d =4,则a =b =c =0,与中位数是1矛盾,故A 正确;对于B ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为0,0,1,2,4,满足中位数是1,众数是0,但有一天超过3人,故B 错误;对于C ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为0,2,2,3,4,满足中位数是2,众数是2,但有一天超过3人,故C 错误;对于D ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为a ,b ,c ,d ,e ,因为平均数是2,方差是0.8,则a +b +c +d +e =10,15[(a -2)2+(b -2)2+(c -2)2+(d -2)2+(e -2)2]=0.8,即(a -2)2+(b -2)2+(c -2)2+(d -2)2+(e -2)2=4,则e≤4,若e=4,从方差角度来说a=b=c=d=2,不满足a+b+c+d+e=10,所以e<4,同理a,b,c,d均小于4,故D正确.14.(多选)已知一组数据丢失了一个大于3的数据,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的2倍,则丢失的数据可能是()A.4B.12C.18D.20答案AC解析设丢失的数据为x,则这七个数据的平均数为31+x7,众数是3,若3<x<5,则中位数为x,此时31+x7+3=2x,解得x=4;若x≥5,则中位数为5,此时31+x7+3=2×5,解得x=18.综上所述,丢失的数据可能是4或18.。
人教版高中数学高考一轮复习--用样本估计总体(课件)
![人教版高中数学高考一轮复习--用样本估计总体(课件)](https://img.taocdn.com/s3/m/ebd84575f08583d049649b6648d7c1c709a10b05.png)
样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2
2024版高考数学总复习:用样本估计总体课件
![2024版高考数学总复习:用样本估计总体课件](https://img.taocdn.com/s3/m/d268f453001ca300a6c30c22590102020740f2c7.png)
4.样本的数字特征
1
(x
+x
+…+x
)
1
2
n
如果有n个数据x1,x2,…,xn,那么平均数为=________________,
ҧ
标准差为s=
1
1 − ҧ
2
+ 2 − ҧ
2
+ ⋯ + − ҧ
2
1
2+(x -)
2+…+(x -)
2]
[(x
-
)
ҧ
ҧ
ҧ
1
2
n
方差为s2=____________________________________.
2
3
4
5
D
解析:由频率分布直方图知,评分在区间[82,86)内的影视作品
的频率为(86-82)×0.05=0.2,故评分在区间[82,86)内的影视作品
数量是400×0.2=80.
1
2
3
4
5
5.已知样本量为200,在样本的频率分布直方图中,共有n个小长方
形.若中间一个小长方形的面积等于其余(n-1)个小长方形面积和
第二步:决定组数和组距,组距=______;
组数
分组
第三步:将数据_____,通常对组内数值所在区间取左闭右开区间,
最后一组取闭区间;
第四步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图(如图).
频率
组距
横轴表示样本数据,纵轴表示______,每个小长方形的面积表示样
,
(1)若数据x1 ,x2 ,…,xn 的平均数为 ,则mx
三维设计江苏专用高三数学一轮总复习第十章算法统计与概率第二节统计初步第二课时用样本估计总体课件理
![三维设计江苏专用高三数学一轮总复习第十章算法统计与概率第二节统计初步第二课时用样本估计总体课件理](https://img.taocdn.com/s3/m/79051f62ec3a87c24028c4f5.png)
(2)标准差、方差 ①标准差:样本数据到平均数的一种平均距离,一般用 s 表示,s= n1[x1- x 2+x2- x 2+…+xn- x 2] .
②方差:标准差的平方 s2 s2= n1[(x1- x )2+(x2--x )2+…+(xn- x )2],其中 xi(i=
1,2,3,…,n)是样本数据,n 是样本容量,-x 是样__本__平__均__数__.
[题组练透] 1.如图所示的茎叶图记录了甲、
乙两组各五名学生在一次英语 听力测试中的成绩(单位:分), 已知甲组数据的中位数为 17, 乙组数据的平均数为 17.4,则 x,y 的值分别为________.
解析:甲的中位数为 17, 故 y=7, 乙的平均数为3×10+20+95+6+6+x+9=17.4, 解得 x=7. 答案:7,7
角度二:样本的数字特征与茎叶图交汇 2.(2016·常州模拟)南京市各级各类中小学每年都要进行学生体
质健康测试,测试总成绩满分为 100 分,规定测试成绩在 [85,100] 之 间 为 体 质 优 秀 ; 在 [75,85) 之 间 为 体 质 良 好 ; 在 [60,75)之间为体质合格;在[0,60)之间为体质不合格.现从 某校高三年级的 300 名学生中随机抽取 30 名学生的体质健 康测试成绩,其茎叶图如图所示:
[即时应用] (2015·湖北高考)某电子商务公司对 10 000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区 间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的 a=________; (2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人 数为________.
答案:乙
1.易把直方图与条形图混淆 两者的区别在于条形图是离散随机变量,纵坐标刻度为频 数或频率,直方图是连续随机变量,连续随机变量在某一 点上是没有频率的. 频率
高考数学总复习 102 用样本估计总体课件 理 新人教A版
![高考数学总复习 102 用样本估计总体课件 理 新人教A版](https://img.taocdn.com/s3/m/bb8e5252d1f34693dbef3e5c.png)
则n,m的大小关系为
()
A.n<m
B.n>m
C.n=m
D.不能确定
第三十五页,共47页。
解析:由已知,得x1+x2+…+xn=n x ,y1+y2+…+ym
=m y ,
z
=
x1+x2+…+xn+y1+y2+…+ym m+n
从这个茎叶图中得到,其二是在比赛时随时记录,方便记录
与表示.
(3)在样本数据较少时,用茎叶图表示数据的效果较好,
但当样本数据较多时,茎叶图就显得不太方便了.
第七页,共47页。
4.样本的数字特征
数字特征
定义
众数
在一组数据中,出现次数 最多的数据叫做这组 数据的众数.
中位 数
平均 数
方差
将一组数据按大小依次排列,把处在 最中间位(置zhōngjiān) 的一个数据(或最中间两个数据的平均数)叫做这
如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81
,83,82,82,64,79,86,85,75,71,49,45. 分组 频数 频率
[41,51)
2
2 30
[51,61)
1
1 30
第十五页,共47页。
第十三页,共47页。
2.频率分布直方图中各小长方形的面积之和为1,因此 在频率分布直方图中组距是一个固定值,所以各小长方形高 的比也就是频率比.
3.频率分布表和频率分布直方图是一组数据频率分布的 两种形式,前者准确,后者直观.
第十四页,共47页。
某市2012年4月1日~4月30日对空气污染指数的监测数据
三维设计高考数学人教版理科一轮复习配套题库10.3用样本估计总体(含答案详析)
![三维设计高考数学人教版理科一轮复习配套题库10.3用样本估计总体(含答案详析)](https://img.taocdn.com/s3/m/1500fc7af5335a8102d22049.png)
高考真题备选题库第10章 算法初步、统计、统计案例第3节 用样本估计总体考点 用样本估计总体1.(2013安徽,5分)某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )A .这种抽样方法是一种分层抽样B .这种抽样方法是一种系统抽样C .这五名男生成绩的方差大于这五名女生成绩的方差D .该班男生成绩的平均数小于该班女生成绩的平均数解析:本题考查抽样方法的特点、数字特征数的求解等基础知识.解题时只要求出平均数、方差就可以找出答案.若抽样方法是分层抽样,男生、女生应分别抽取6人、4人,所以A 错;由题目看不出是系统抽样,所以B 错;这五名男生成绩的平均数x 1=86+94+88+92+905=90,这五名女生成绩的平均数x 2=88+93+93+88+935=91,故这五名男生成绩的方差为15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8,这五名女生成绩的方差为15[(88-91)2×2+(93-91)2×3]=6,所以这五名男生成绩的方差大于这五名女生成绩的方差,但该班男生成绩的平均数不一定小于女生成绩的平均数,所以D 错,故选C.答案:C2.(2013福建,5分)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120解析:本题考查频率分布直方图等基础知识,意在考查考生数形结合能力、运算求解能力.由频率分布直方图可得,该模块测试成绩不少于60分的学生人数为600-(0.005+0.015)×10×600=480.答案:B3.(2013重庆,5分)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A.2,5 B.5,5C.5,8 D.8,8解析:本题考查了统计知识中平均数和茎叶图的知识,意在考查考生对概念的掌握能力及运算求解能力.由于甲组的中位数是15,可得x=5,由于乙组数据的平均数为16.8,得y=8.答案:C4.(2013湖北,5分)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.解析:本题考查统计,意在考查考生对频率分布直方图知识的掌握情况.(1)根据频率和为1,得(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4;(2)(0.003 6+0.006 0+0.004 4)×50×100=70.答案:0.004 4705.(2013广东,12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率.解:本题考查茎叶图、样本均值、古典概型等基础知识,考查样本估计总体的思想方法,考查数据处理能力、运算求解能力.(1)样本均值为17+19+20+21+25+306=1326=22.(2)由(1)知样本中优秀工人占的比例为26=13,故推断该车间12名工人中有12×13=4名优秀工人.(3)设事件A :从该车间12名工人中,任取2人,恰有1名优秀工人,则P (A )=C 14C 18C 212=1633. 6.(2012安徽,5分)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解析:由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.答案:C7.(2012陕西,5分)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙解析:由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显x甲<x 乙,甲的中位数为20,乙的中位数为29,即m 甲<m 乙.答案:B8.(2012江西,5分)样本(x 1,x 2,…,x n )的平均数为x -,样本(y 1,y 2,…,y m )的平均数为y -(x -≠y -).若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z -=αx -+(1-α)y -,其中0<α<12,则n ,m 的大小关系为( )A .n <mB .n >mC .n =mD .不能确定解析:∵x 1+x 2+…+x n =n x -,y 1+y 2+…+y m =m y -,x 1+x 2+…+x n +y 1+y 2+…+y m =(m +n )z -=(m +n )αx -+(m +n )(1-α)y -, ∴n x -+m y -=(m +n )αx -+(m +n )(1-α)y -,∴⎩⎪⎨⎪⎧n =(m +n )α,m =(m +n )(1-α),于是有n -m =(m +n )[α-(1-α)]=(m +n )(2α-1), ∵0<α<12,∴2α-1<0,∴n -m <0,即m >n .答案:A9.(2011江西,5分)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m o ,平均值为x ,则( )A .m e =m o =xB .m e =m o <xC.m e<m o<x D.m o<m e<x解析:由图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即m e=5.5,5出现的次数最多,故m o=5,x=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m o<m e<x.答案:D10.(2010陕西,5分)如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B,则()A.x A>x B,s A>s BB.x A<x B,s A>s BC.x A>x B,s A<s BD.x A<x B,s A<s B解析:由图可知A组的6个数为2.5,10,5,7.5,2.5,10,B组的6个数为15,10,12.5,10,12.5,10,所以x A=2.5+10+5+7.5+2.5+106=37.56,x B=15+10+12.5+10+12.5+106=706.显然x A<x B,又由图形可知,B组的数据分布比A均匀,变化幅度不大,故B组数据比较稳定,方差较小,从而标准差较小,所以s A>s B.答案:B11.(2009·山东,5分)某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A .90B .75C .60D .45解析:由频率分布直方图可知,产品净重小于100克的概率是0.05×2+0.1×2=0.3,所以样本中产品的个数为360.3=120,产品净重大于或等于104克的概率为0.075×2=0.15, ∴产品净重大于或等于98克而小于104克的概率为1-0.15-0.1=0.75,则净重在此范围内的产品个数为120×0.75=90个.故选A.答案:A12.(2010江苏,5分)某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标).所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有________根棉花纤维的长度小于20 mm.解析:由题意知,棉花纤维的长度小于20 mm 的频率为(0.01+0.01+0.04)×5=0.3, 故抽测的100根中,棉花纤维的长度小于20 mm 的有0.3×100=30(根). 答案:3013.(2009·江苏,5分)某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:则以上两组数据的方差中较小的一个为s 2=________.解析:x 甲=7,s 2甲=15[12+02+02+12+02]=25,x乙=7,s 22=15[12+02+12+02+22]=65,∴s 2甲<s 2乙,∴方差中较小的一个为s 2甲,即s 2=25. 答案:2514.(2011天津,13分)编号分别为A 1,A 2,…,A 16的16名篮球运动员在某次训练比赛中的得分记录如下:(1)(2)(ⅰ)用运动员编号列出所有可能的抽取结果; (ⅱ)求这2人得分之和大于50的概率. 解:(1)4,6,6.(2)(ⅰ)得分在区间[20,30)内的运动员编号为A 3,A 4,A 5,A 10,A 11,A 13,从中随机抽取2人,所有可能的抽取结果有:{A 3,A 4},{A 3,A 5},{A 3,A 10},{A 3,A 11},{A 3,A 13},{A 4,A 5},{A 4,A 10},{A 4,A 11},{A 4,A 13},{A 5,A 10},{A 5,A 11},{A 5,A 13},{A 10,A 11},{A 10,A 13},{A 11,A 13},共15种.(ⅱ)“从得分在区间[20,30)内的运动员中随机抽取2人,这2人得分之和大于50”(记为事件B )的所有可能结果有:{A 4,A 5},{A 4,A 10},{A 4,A 11},{A 5,A 10},{A 10,A 11},共5种.所以P (B )=515=13.。
【三维设计】高考数学一轮复习 第2节 用样本估计总体课件
![【三维设计】高考数学一轮复习 第2节 用样本估计总体课件](https://img.taocdn.com/s3/m/9c6152be6f1aff00bed51edd.png)
[精析考题] [例3] (2011·广东高考)在某次测验中,有6位同学的平 均成绩为75分.用xn表示编号为n(n=1,2,…,6)的同学 所得成绩,且前5位同学的成绩如下:
编号n 1 2 3 4 5 成绩xn 70 76 72 70 72
(1)求第6位同学的成绩x6,及这6位同学成绩的标准差s; (2)从前5位同学中,随机地选2位同学,求恰有1位同学 成绩在区间(68,75)中的概率.
第2小组的频率为0.75×
2 6
=0.25,又其频数为12,故样本容
量为01.225=48.
答案:48
2.(2012·杭州模拟)某初一年级有500名同学,将他们 的身高(单位:cm)数据绘制成频率分布直方图(如 图),若要从身高在[120,130),[130,140),[140,150] 三组内的学生中,用分层抽样的方法选取30人参加 一项活动,则从身高在[130,140)内的学生中选取的 人数应为________.
2.(教材习题改编)某同学进入高三后, 4次月考的数学成绩的茎叶图如图, 则该同学数学成绩的平均分是( )
11 4 12 6 8 13 2
A.125
B.122.25
C.45
D.129.5
解析:由茎叶图知平均值为114+126+4 128+132=125,
答案:A
3.某部门计划对某路段进行限速,为调查限速60 km/h
解析:甲比赛得分的中位数为28,乙比赛得分的中位 数为36,所以甲、乙两人比赛得分的中位数之和为28 +36=64.
答案: 64
4.(2011·太原联考)甲、乙两个体能康复训练小组各有 10名组员,经过一段时间训练后,某项体能测试结 果的茎叶图如图所示,则这两个小组中体能测试平 均成绩较高的是________组.
2024届新高考一轮总复习人教版 第九章 第2节 用样本估计总体 课件(49张)
![2024届新高考一轮总复习人教版 第九章 第2节 用样本估计总体 课件(49张)](https://img.taocdn.com/s3/m/7c1b1bf14128915f804d2b160b4e767f5acf8004.png)
2.(必修第二册 P202 例 2 改编)某机构调查了解 10 种食品的卡路里含量,结果如下:
107,135,138,140,146,175,179,182,191,195.则这组数据的第 25 百分位数和
中位数分别是( )
A.138,160.5
B.138,146
C.138,175
D.135,160.5
[必记结论] 1.频率分布直方图与众数、中位数、平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面 积乘以小长方形底边中点的横坐标之和.
2.简单随机抽样样本平均数、方差的公式推广 (1)若数据 x1,x2,…,xn 的平均数为-x ,则 mx1+a,mx2+a,mx3+a,…,mxn+a 的平均数是 m-x +a. (2)数据 x1,x2,…,xn 与数据 x1′=x1+a,x2′=x2+a,…,xn′=xn+a 的方差相等, 即数据经过平移后方差不变; (3)若数据 x1,x2,…,xn 的方差为 s2,则数据 ax1+b,ax2+b,…,axn+b 的方差 为 a2s2.
【小题热身】 1.思考辨析(在括号内打“√”或“×”) (1)对一组数据来说,平均数和中位数总是非常接近.( ) (2)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( ) (3)方差与标准差具有相同的单位.( ) (4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不 变.( ) 答案:(1)× (2)√ (3)× (4)√
情况下是优点,但它对极端值的不敏 数据的平均数)
感有时也会成为缺点
数字特征
适用于新教材2024版高考数学一轮总复习:用样本估计总体课件北师大版
![适用于新教材2024版高考数学一轮总复习:用样本估计总体课件北师大版](https://img.taocdn.com/s3/m/5c35fbe1d05abe23482fb4daa58da0116c171fbf.png)
∑ xi,s12
=1
=
则① =
②s
+
=
1 m
∑ (xi-)2,
m i=1
+
+
1
= + {m[12 +(
2
=
1
∑ yiyi-)2.
=1
;
− )2]+n[22 +( − )2]}.
常用结论
1.在频率分布直方图中:
考向1中位数、众数、平均数
题组(1)(多选)(2022·重庆三模)已知一组样本数据:4,4,5,7,7,7,8,9,9,10.关于
这组样本数据,结论正确的是(
A.平均数为8
B.众数为7
C.极差为6
D.中位数为8
)
(2)(多选)(2022·广东茂名二模)小李上班可以选择公交车、自行车两种交
通工具,他分别记录了100次坐公交车和100次骑车所用时间(单位:分钟),得
3.一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )
4.在频率分布直方图中,最高的小长方形底边中点的横坐标可作为众数的
估计值.( √ )
题组二 双基自测
5. (2023·云南昆明高三检测)为了解某种作物的生长情况,抽取该作物植株
高度(单位:cm)的一个随机样本,整理得到样本频率分布直方图如图所示.
x 1 +x 2 +…+x n
n
3.总体离散程度的估计
(1)假设一组数据是x1,x2,…,xn,用表示这组数据的平均数,那么这n个数的
①标准差
s=
1
[(1 -)2
+ (2 -)2 + … + ( -)2 ].
高中数学 三维设计 统计 用样本估计总体
![高中数学 三维设计 统计 用样本估计总体](https://img.taocdn.com/s3/m/61cbfe6d26284b73f242336c1eb91a37f11132a3.png)
9.2 用样本估计总体 9.2.1 总体取值规律的估计 9.2.2 总体百分位数的估计新课程标准新学法解读1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.2.结合实例,掌握用样本估计总体的取值规律.3.理解百分位数的统计含义,能用样本百分位数估计总体百分位数.1.会根据频率分布表估计总体,会利用频率分布直方图估计总体.2.对于频率分布直方图的相关问题需要重点掌握,了解其综合应用问题是本部分内容的难点.3.学会计算样本百分位数,会对总体百分位数做出合理估计.[思考发现]1.某班学生在一次数学考试中各分数段以及人数的成绩分布为:[0,80),2人;[80,90),6人;[90,100),4人;[100,110),10人;[110,120),12人;[120,130),5人;[130,140),4人;[140,150],2人.那么分数在[100,130)中的频数以及频率分别为( )A .27,0.56B .20,0.56C .27,0.60D .13,0.29解析:选C 由[100,130)中的人数为10+12+5=27(人),得频数为27,频率为2745=0.60.2.一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为( )A .10组B .9组C .8组D .7组解析:选A 由题意知,152-6010=9.2,故应分成10组.3.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)内的汽车有( )A .30辆B .40辆C .60辆D .80辆解析:选C由直方图知,时速在[50,60)内的频率为0.03×10=0.3,故此段内汽车有200×0.3=60辆.4.一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为() A.2 B.4C.6 D.8解析:选B频率=频数样本量,则频数=频率×样本量=0.125×32=4.5.某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.则甲得分的第50百分位数为________;乙得分的第75百分位数为_______.解析:把甲的得分由小到大排列为65,71,75,76,81,88,89,94,95,107,110.把乙的得分由小到大排列为79,83,86,88,93,98,98,99,101,103,114.由11×50%=5.5,可知甲得分的第50百分位数为6项数据,据此可得甲得分的第50百分位数为88;由11×75%=8.25,可知乙得分的第75百分位数为第9项数据,据此可得乙得分的第75百分位数为101.答案:88101[系统归纳]1.绘制频率分布直方图的步骤(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.[说明]频数分布直方图的纵坐标是频数,每一组数对应的矩形的高度与频数成正比;频率分布直方图的纵坐标是频率组距,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,所有矩形的面积之和为1.2.条形图、折线图及扇形图(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.3.百分位数(1)一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算一组几个数据第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i 是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.(3)四分位数即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.绘制频率分布直方图[例1]一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.65.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.05.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.75.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm 之间的麦穗所占的百分比.[解] (1)计算极差:7.4-4.0=3.4.(2)决定组距与组数:若取组距为0.3,因为3.40.3≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频率分布表:分组 频数 频率 [3.95,4.25) 1 0.01 [4.25,4.55) 1 0.01 [4.55,4.85) 2 0.02 [4.85,5.15) 5 0.05 [5.15,5.45) 11 0.11 [5.45,5.75) 15 0.15 [5.75,6.05) 28 0.28 [6.05,6.35) 13 0.13 [6.35,6.65) 11 0.11 [6.65,6.95) 10 0.10 [6.95,7.25) 2 0.02 [7.25,7.55] 1 0.01 合计1001.00(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm 之间的麦穗约占41%.绘制频率分布直方图应注意的2个问题(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“频率/组距”所占的比例来定高.如我们预先设定以“”为一个单位长度,代表“0.1”,则若一个组的频率组距为0.2,则该小矩形的高就是“”(占两个单位长度),如此类推.(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.[变式训练]某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 根据上面的数据,回答下列问题:(1)这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图.解:(1)这次测验成绩的最低分是32分,最高分是97分. (2)根据题意,列出样本的频率分布表如下:分组 频数 频率 [30,40) 1 0.02 [40,50) 6 0.12 [50,60) 12 0.24 [60,70) 14 0.28 [70,80) 9 0.18 [80,90) 6 0.12 [90,100] 2 0.04 合计501.00频率分布直方图如图所示.频率分布直方图的应用[例2]从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18]2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.[解](1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9. (2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)同一组中的每个数据用该组区间的中点值代替,则数据的平均数为:1×0.06+3×0.08+5×0.17+7×0.22+9×0.25+11×0.12+13×0.06+15×0.02+17×0.02=7.68(小时)所以样本中的100名学生该周课外阅读时间的平均数在第4组.频率分布直方图的性质(1)每个小矩形的面积表示样本数据落在该组内的频率. (2)所有小矩形的面积和等于1.(3)利用一组的频数和频率,可以求样本量.[变式训练]某电子商务公司对10 000名网络购物者2019年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________人.解析:(1)由0.1×1.5+0.1×2.5+0.1a +0.1×2.0+0.1×0.8+0.1×0.2=1,解得a =3. (2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6. 因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000(人). 答案:(1)3 (2)6 000总体百分位数的估计[例3] (1)为了解毕业生工作情况,某高校对12名应届毕业生起始月薪作了统计如下: 毕业生 起始月薪 毕业生 起始月薪 1 2 32 850 2 9503 0507 8 92 8903 130 2 9404 5 62 8802 7552 7101011123 3252 9202 880则第85百分位数是________.(2)考察某校高二年级男生的身高,随机抽取40名高二男生,实测身高数据(单位:cm)如下:171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 160 168 174 165 168 174 159 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161请估计该校高二年级男生身高的第25,50,75百分位数.[解析](1)首先对数据排序:2 710 2 755 2 850 2 880 2 880 2 890 2 920 2 940 2 950 3 050 3 130 3 325所以i=12×85%=10.2.即第85百分位数是3 130.[答案] 3 130(2)把这40名男生的身高数据按从小到大排序,可得151 156 157 157 158 159 160 160 161 161 162 163 163 163 163 164 164 165 165 166 166 167 167 167 168 168 168 168 168 168 169 169 169 170 171 171 174 174 176 180由25%×40=10,50%×40=20,57%×40=30,可知样本数据的第25百分位数为161.5,第50百分位数为166,第75百分位数为168.5.据此可估计该校高二男生身高的第25,50,75百分位数分别约为161.5,166和168.5.总体百分位数估计需要注意的两个问题(1)总体百分位估计的基础是样本百分位数的计算,因此计算准确是关键;(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.[变式训练]某良种培育基地正在培育一种小麦新品种A,将其种植了25亩,所得亩产数据(单位:千克)如下:421, 399, 445,359, 415, 443,367,454,368,375, 392, 400, 423,405,412, 427,414, 423, 430, 388,430, 357,434, 445, 451试估计该品种小麦亩产的第80,95百分位数.解:将25个样本数据按从小到大排序,可得357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,4 45,445,451,454由80%×25=20,95%×25=23.75,可知样本数据的第80百分位数为438.5,第95百分位数为第24项数据,为451. 据此估计该品种小麦亩产的第80,95百分位数分别约为438.5和451.A级——学考合格性考试达标练1.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8,其累计频率为0.4,则这个样本的容量是()A.20B.40C.70 D.80解析:选A由已知不超过70分的人数为8,累计频率为0.4,则这个样本量n=80.4=20.故选A.2.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为()A.20 B.30C.40 D.50解析:选B样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.故选B.3.如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.120 B.0.180C.0.012 D.0.018解析:选D由图可知纵坐标表示频率/组距,故x=0.1-0.054-0.010-0.006×3=0.018.故选D.4.某地农村2004年到2019年间人均居住面积的统计图如图所示,则增长最多的5年为( )A .2004年~2009年B .2009年~2014年C .2014年~2019年D .无法从图中看出解析:选C 2004年~2009年的增长量为3.1,2009年~2014年的增长量为3.2,2014年~2019年的增长量为3.8.故选C.5.观察下图所示的统计图,下列结论正确的是( )A .甲校女生比乙校女生多B .乙校男生比甲校男生少C .乙校女生比甲校男生少D .甲、乙两校女生人数无法比较解析:选D 图中数据只是百分比,甲、乙两个学校的学生人数不知道,因此男生、女生的具体人数也无法得知.故选D.6.900,920,920,930,930的20%分位数是________.解析:因为5×20%=1,所以该组数据的20%分位数是900+9202=910.答案:9107.某校高三(1)班共有40名学生,他们每天自主学习的时间全部在180分钟到330分钟之间,按他们学习时间的长短分5个组统计,得到如下频率分布表:第一组 [180,210) 4 0.10 第二组 [210,240) 8 s 第三组 [240,270) 12 0.30 第四组 [270,300) 10 0.25 第五组[300,330]6t则分布表中s ,t 的值分别为________,________. 解析:s =840=0.2,t =1-0.1-s -0.3-0.25=0.15.答案:0.200.158.甲、乙两个城市2019年4月中旬,每天的最高气温统计图如图所示,这9天里,气温比较稳定的城市是________.解析:从折线统计图中可以很清楚的看到乙城市的气温变化较大,而甲城市气温相对来说较稳定,变化基本不大.答案:甲9.某班50名同学参加数学测验,成绩的分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图.解:(1)频率分布表如下:分组频数频率[40,50)20.04[50,60)30.06[60,70)100.20[70,80)150.30[80,90)120.24[90,100]80.16(2)频率分布直方图如下:10.调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171163163166166168168160168165171169167169151168170168160174165168174159167156157164169180176157162161158164163163167161试估计该校高三年级男生的身高数据的30%分位数. 解:按从小到大排列原始数据151 156 157 157 158 159 160 160 161 161 162 163 163 163 163 164 164 165 165 166 166 167 167 167 168 168 168 168 168 168 169 169 169 170 171 171 174 174 176 180 i =40×30%=12为整数.又因第12项与第13项数据都是163,所以他们的平均数也为163. 所以估计该校高三年级男生的身高数据的30%分位数约为163.B 级——面向全国卷高考高分练1.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:组号 1 2 3 4 5 6 7 8 频数101314141513129第3组的频率和累积频率为( ) A .0.14和0.37 B.114和127C .0.03和0.06D.314和637解析:选A 由表可知,第三小组的频率为14100=0.14,累积频率为10+13+14100=0.37.故选A.2.某工厂对一批元件进行抽样检测.经检测,抽出的元件的长度(单位:mm)全部介于93至105之间.将抽出的元件的长度以2为组距分成6组:[93,95),[95,97),[97,99),[99,101),[101,103),[103,105],得到如图所示的频率分布直方图.若长度在[97,103)内的元件为合格品,根据频率分布直方图,估计这批元件的合格率是( )A .80%B .90%C .20%D .85.5%解析:选A 由频率分布直方图可知元件长度在[97,103)内的频率为1-(0.027 5+0.027 5+0.045 0)×2=0.8,故这批元件的合格率为80%.故选A.3.在样本的频率分布直方图中,某个小长方形的面积是其他小长方形面积之和的14,已知样本量是80,则该组的频数为( )A .20B .16C .30D .35解析:选B 设该组的频数为x ,则其他组的频数之和为4x ,由样本量是80,得x +4x =80,解得x =16,即该组的频数为16.故选B.4.某厂对一批产品进行抽样检测,如图是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为[76,78),[78,80),…,[84,86].若这批产品有120个,估计其中净重大于或等于78克且小于84克的产品的个数是( )A .12B .18C .25D .90解析:选D 净重大于或等于78克且小于84克的频率为(0.100+0.150+0.125)×2=0.75,所以在该范围内的产品个数为120×0.75=90.故选D.5.如图是根据某中学为地震灾区捐款的情况而制作的统计图.已知该校在校学生3 000人,根据统计图计算该校共捐款________元.解析:根据统计图,得高一人数为3 000×32%=960(人), 捐款960×15=14 400(元);高二人数为3 000×33%=990(人),捐款990×13=12 870(元); 高三人数为3 000×35%=1 050(人),捐款1 050×10=10 500(元). 所以该校学生共捐款14 400+12 870+10 500=37 770(元). 答案:37 7706.5,6,7,8,9,10,11,12,13,14的25%分位数为________,75%分位数为________,90%分位数为________.解析:由于共有10个数字,则10×25%=2.5,10×75%=7.5,10×90%=9.故25%分位数为7,75%分位数为12,90%分位数为13+142=13.5.答案:7 12 13.57.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图(如图所示).分组频数频率一组0≤t<500二组5≤t<10100.10三组10≤t<1510②四组15≤t<20①0.50五组20≤t≤25300.30合计100 1.00解答下列问题:(1)这次抽样的样本量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图;(3)旅客购票用时的平均数可能落在哪一组?解:(1)样本量是100.(2)第四组的频数①=100-30-10-10=50,第三组的频率②=1.00-0.30-0.50-0.10=0.10.所补频率分布直方图如图中的阴影部分.(3)设旅客平均购票用时为t min,则有0×0+5×10+10×10+15×50+20×30100≤t<5×0+10×10+15×10+20×50+25×30100,即15≤t<20.所以旅客购票用时的平均数可能落在第四组.C级——拓展探索性题目应用练为了了解某片经济林的生长情况,随机测量其中的100棵树的底部周长,得到如下数据(单位:cm):(2)画出频率分布直方图及频率折线图;(3)估计该片经济林中底部周长小于100 cm的树占多少,底部周长不小于120 cm的树占多少.解:(1)这组数据的最大的数为135,最小的数为80,最大的数与最小的数的差为55,可将该组数据分为11组,组距为5.频率分布表如下:(2)频率分布直方图和频率折线图如下图所示.(3)从频率分布表得,样本中底部周长小于100 cm 的频率为0.01+0.02+0.04+0.14=0.21,样本中底部周长不小于120 cm 的频率为0.11+0.06+0.02=0.19.所以估计该片经济林中底部周长小于100 cm 的树占21%,底部周长不小于120 cm 的树占19%.9.2.3 总体集中趋势的估计新课程标准新学法解读结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.阅读教材并通过复习回顾初中学习的众数、中位数、平均数概念,明确它们的统计含义.[思考发现]1.一组数据:85,88,73,88,79,85,其众数是( )A .88B .73C .88,85D .85解析:选C 该组数据85,88,73,88,79,85有两个众数,它们是88,85.故选C. 2.已知数据-3,-2,0,6,6,13,20,35,则它的中位数和众数各是( ) A .6和6 B .3和6 C .6和3D .9.5和6解析:选A ∵从小到大排列的这8个数,排在中间的两个数都是6,∴中位数是6;∵6出现的次数最多,∴众数是6,故选A.3.已知一组数据从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么这组数据的众数为( )A .5B .6C .4D .5.5解析:选B 由题意得12(4+x )=5,得x =6.4.已知一组数据0,2,x,4,5的众数是4,那么这组数据的平均数是________. 解析:∵数据0,2,x,4,5的众数是4,∴x =4,∴这组数据的平均数是15×(0+2+4+4+5)=3.答案:35.一组数据1,10,5,2,x,2,且2<x <5,若该数据的众数是中位数的23倍,则该数据的平均数为________.解析:根据题意知,该组数据的众数是2,则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x,5,10,则2+x 2=3,解得x =4,所以这组数据的平均数为x =16×(1+2+2+4+5+10)=4.答案:4[系统归纳]1.众数、中位数、平均数的理解(1)一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.[说明] 如果有几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数.(2)如果一组数有奇数个数,且按照从小到大排列后为x 1,x 2,…,x 2n +1,则称x n +1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x 1,x 2,…,x 2n ,则称x n +x n +12为这组数的中位数. (3)如果给定的一组数是x 1,x 2,…,x n ,则这组数的平均数为x =1n (x 1+x 2+…+x n ).众数、中位数、平均数都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.2.众数、中位数、平均数的比较息平均数代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据全体的信息任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大众数、中位数、平均数的计算[例1]某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群:13,13,14,15,15,15,15,16,17,17;乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?[解](1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为54+3+4+4+5+6+6+6+6+5610=15(岁),中位数为6岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.[变式训练]如果5个数x1,x2,x3,x4,x5的平均数是7,那么x1+1,x2+1,x3+1,x4+1,x5+1这5个数的平均数是()A.5 B.6C.7 D.8解析:选D 法一(定义法):依题意x 1+x 2+…+x 5=35,所以(x 1+1)+(x 2+1)+…+(x 5+1)=40,故所求平均数为405=8. 法二(性质法):显然新数据(记为y i )与原有数据的关系为y i =x i +1(i =1,2,3,4,5),故新数据的平均数为x +1=8.总体集中趋势的估计[例2] 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数、中位数、平均分;(2)估计该校参加高二年级学业水平测试的学生的众数、中位数和平均数. [解] (1)①由题图知众数为70+802=75. ②由题图知,设中位数为x ,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x -70),所以x ≈73.3.③由题图知这次数学成绩的平均分为:40+502 ×0.005×10+50+602 ×0.015×10+60+702 ×0.02×10+70+802 ×0.03×10+80+902×0.025×10+90+1002×0.005×10=72.(2)由于数据是来自高二年级全部参加学业水平测试的学生的简单随机样本,所以可以估计高二年级参加学业水平测试的学生的众数是75,中位数是73.3,平均分是72.用频率分布直方图估计众数、中位数、平均数(1)众数:取最高小长方形底边中点的横坐标作为众数.(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x 轴交点的横坐标称为中位数.(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.[变式训练]为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则:(1)这20名工人中一天生产该产品的数量在[55,75)的人数是________; (2)这20名工人中一天生产该产品的数量的中位数为________; (3)这20名工人中一天生产该产品的数量的平均数为________. 解析:(1)(0.04×10+0.025×10)×20=13.(2)因为0.2+0.4>0.5,所以中位数一定在[55,65]之间,设中位数为x ,则0.2+(x -55)×0.04=0.5,x =62.5.(3)平均数为0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64. 答案:(1)13 (2)62.5 (3)64A 级——学考合格性考试达标练1.下列说法中,不正确的是( ) A .数据2,4,6,8的中位数是4,6 B .数据1,2,2,3,4,4的众数是2,4C .一组数据的平均数、众数、中位数有可能是同一个数据D .8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是8×5+7×311解析:选A 数据2,4,6,8的中位数为4+62=5,显然A 是错误的,B 、C 、D 都是正确的.故选A.2.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组成绩的平均数、众数、中位数分别是( )A .85分,85分,85分B .87分,85分,86分C .87分,85分,85分D .87分,85分,90分解析:选C 由题意知,该学习小组共有10人, 因此众数和中位数都是85(分),平均数为100+95+2×90+4×85+80+7510=87(分).故选C.3.某班50名学生的一次安全知识竞赛成绩分布如表所示:(满分10分)成绩(分) 0 1 2 3 4 5 6 7 8 9 10 人数(人) 0113561915这次安全知识竞赛成绩的众数是( ) A .5分 B .6分 C .9分D .10分解析:选C 根据众数是一组数据中出现次数最多的进行判断,由表中数据可知成绩9分出现了19次,最多,所以众数是9分. 故选C.4.统计学校排球队员的年龄,发现有12、13、14、15等四种年龄,统计结果如下表:年龄(岁) 12 13 14 15 人数(个)2468根据表中信息可以判断该排球队员年龄的平均数、众数、中位数分别为( ) A .13,15,14 B .14,15,14 C .13.5,15,14D .15,15,15 解析:选B 排球队员年龄的平均数 x =12×2+13×4+14×6+15×820=14,故平均数是14,15出现了8次,出现的次数最多,故众数是15.从小到大排列后,排在10、11两个位置的数是14,14,故中位数是14. 故选B.5.某市4月份日平均气温统计图情况如图所示,则在日平均气温这组数据中,众数和中位数分别是( )A .13,13B .13,13.5C .13,14D .16,13解析:选C ∵这组数据中,13出现了10次,出现次数最多,∴众数为13,∵第15个数和第16个数都是14,∴中位数是14.故选C.6.某医院急救中心随机抽取20位病人等待急诊的时间记录如下表: 等待时间[0,5)[5,10)[10,15)[15,20)[20,25](分钟)频数48521用上述分组资料计算出病人平均等待时间的估计值x=________.解析:x=120(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5.答案:9.57.若有一个企业,70%的员工年收入1万元,25%的员工年收入3万元,5%的员工年收入11万元,则该企业员工的年收入的平均数是________万元,中位数是________万元,众数是________万元.解析:年收入的平均数是1×70%+3×25%+11×5%=2(万元).因为70%的员工年收入1万元,其他的只占30%,所以年收入的中位数、众数都为1万元.答案:2118.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________件;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.解析:由分层抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为 1 020×50%+980×20%+1 030×30%=1 015(小时).答案:50 1 0159.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.。
高考数学总复习 102用样本估计总体课件 新人教A版
![高考数学总复习 102用样本估计总体课件 新人教A版](https://img.taocdn.com/s3/m/af96c8c803d8ce2f006623ec.png)
经测算发现,乙品牌车 CO2 排放量的平均值为-x 乙=120 g/km.
(1)从被检测的 5 辆甲类品牌中任取 2 辆,则至少有一辆 CO2 排放量超标的概率是多少?
(2)若 90<x<130,试比较甲、乙两类品牌车 CO2 排放量的 稳定性.
解析:(1)从被检测的 5 辆甲类品牌车中任取 2 辆,共有 10 种不同的 CO2 排放量结果:
注意以下结论: (1)如果 x1、x2、…、xn 的平均数为-x ,则 ax1+b,ax2+b,…, axn+b 的平均数为 a -x +b. (2)数据 x1、x2、…、xn 与数据 x1+m、x2+m、…、xn+m 的方差相等. (3)若 x1、x2、…、xn 的方差为 s2,则 kx1,kx2,…,kxn 的方差为 k2s2. 计算方差时,要依据所给数据的特点恰当选取公式以简 化计算.
[例 3] (2012·东北三校一模)汽车是碳排放量比较大的 行业之一,欧盟规定,从 2012 年开始,将对 CO2 排放量超 过 130 g/km 的 M1 型新车进行惩罚(视为排放量超标),某检测 单位对甲、乙两类 M1 型车抽取 5 辆进行 CO2 排放量检测, 记录如下(单位:g/km):
甲 80 110 120 140 150 乙 100 120 x y 160
5.方差、标准差 设样本数据为 x1,x2,…,xn 样本平均数为-x ,则 s2=1n·[(x1 --x )2+(x2--x )2+…+(xn--x )2]=1n[(x21+x22+…+xn2)-n x 2] 叫做这组数据的方差,用来衡量这组数据的波动大小,一组 数据方差越大,说明这组数据波动越大. 把样本方差的算术平方根叫做这组数据的样本标准差.
⑤绘制频率分布直方图:把横轴分成若干段,每一段对 应一个组距,然后以线段为底作一矩形,它的高等于该组的 频率 组距,这样得出一系列的矩形,每个矩形的面积恰好是该组 上的频率.这些矩形就构成了频率分布直方图.
用样本估计总体高三一轮复习课件
![用样本估计总体高三一轮复习课件](https://img.taocdn.com/s3/m/4998e1f3192e45361166f594.png)
用样本估计总体高三一轮复习课件
• 4.样本的数字特征
数字特征
定义
众数
在一组数据中,出现次数 最多 的数据叫做这组 数据的众数
用样本估计总体高三一轮复习课件
5.(2017·南通调研)为了研究某药品的疗效,选取若干名志愿者进行 临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为 [12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的 顺序分别编号为第一组,第二组,……,第五组.下图是根据试 验数据制成的频率分布直方图.已知第一组与第二组共有 20 人, 第三组中没有疗效的有 6 人,则第三组中有疗效的人数为 ________.
用样本估计总体高三一轮复习课件
解析 全体志愿者共有:0.24+200.16×1=50(人), 所以第三组有志愿者:0.36×1×50=18(人), ∵第三组中没有疗效的有 6 人, ∴有疗效的有 18-6=12(人). 答案 12
用样本估计总体高三一轮复习课件
• 考点一 茎叶图及其应用 • 【例1】 (2014·全国Ⅱ卷)某市为了考核甲、
用样本估计总体高三一轮复习课件
(2)由所给茎叶图知,50 位市民对甲、乙部门的评分高于 90 的比率 分别为550=0.1,580=0.16,故该市的市民对甲、乙部门的评分高于 90 的概率的估计值分别为 0.1,0.16. (3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的 评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准 差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价 较高、评价较为一致,对乙部门的评价较低、评价差异较大.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.(2012·山西大同)将容量为n的样本中的数据分为6组, 绘制频率分布直方图,若第一组至第六组的数据的频 率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之 和为27,则n=________.
解析:依题意得,前三组的频率总和为2+3+2+4+3+6+4 4+1= 290,因此有2n7=290,即 n=60.
第15页组 织了“迎新杯”知识竞赛, 从参加考试的学生中抽出 若干名学生,并将其成绩 绘制成频率分布直方图(如 图),其中成绩的范围是[50,100],样本数据分组为 [50,60),[60,70),[70,80),[80,90),[90,100],已知样本 中成绩小于70分的个数是36,则样本中成绩在[60,90)内 的学生人数为________.
(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80), [80,90)各分数段的人数依次为 0.005×10×100=5,0.04×10×100= 40,0.03×10×100=30,0.02×10×100=20.
由题中给出的比例关系知数学成绩在上述各分数段的人数依 次为 5,40×12=20,30×43=40,20×54=25.
答案:60
第9页/共37页
1.在频率分布直方图中,中位数左边和右边的直方图的 面积相等,由此可以估计中位数的值,而平均数的估计值等 于频率分布直方图中每个小矩形的面积乘以小矩形底边中点 的横坐标之和,众数是最高的矩形的中点的横坐标.
2.注意区分直方图与条形图,条形图中的纵坐标刻度 为频数或频率,直方图中的纵坐标刻度为频率/组距.
[70,80) 3∶4
[80,90) 4∶5
第12页/共37页
[自主解答] (1)由频率分布直方图知(2a+0.02+0.03+ 0.04)×10=1,解得a=0.005.
(2)由频率分布直方图知这100名学生语文成绩的平均分为 55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+ 95×0.005×10=73(分).
二、频率分布折线图和总体密度曲线 1.频率分布折线图:连接频率分布直方图中各小 长方形上端的 中点 ,就得频率分布折线图. 2.总体密度曲线:随着 样本容量 的增加,作图时 所分的组数 增加, 组距 减小,相应的频率折线图会 越来越接近于 一条光滑曲线 ,即总体密度曲线.
第1页/共37页
三、样本的数字特征
A.20 C.30
B.25 D.35
第6页/共37页
解析:由题意知a×10+0.35+0.2+0.1+0.05=1, 则a=0.03,故学生人数为0.3×100=30. 答案:C
第7页/共37页
4.(教材习题改编)甲、乙两人比赛射击,两人所得的平均 环数相同,其中甲所得环数的方差为5,乙所得环数如 下:5、6、9、10、5,那么这两人中成绩较稳定的是 ________. 解析: x =7,s2乙=4.4, 则 s甲2 >s2乙,故乙的成绩较稳定. 答案:乙
3.方差与原始数据的单位不同,且平方后可能夸大了 偏差的程度,虽然方差与标准差在刻画样本数据的分散程度 上是一样的,但在解决实际问题时,一般多采用标准差.
第10页/共37页
用样本的频率分布估计总体分布
[例1] (2012·广东高考) 某校100名学生期中考 试语文成绩的频率分布直方 图如图所示,其中成绩分组 区间是:[50,60),[60,70), [70,80),[80,90),[90,100].
() B.31与26 D.26与30
解析:观察茎叶图可知,这组数据的众数是31,中位 数是26. 答案:B
第4页/共37页
2.(教材习题改编)把样本容量为20的数据分组,分组区
间与频数如下:[10,20),2;[20,30),3;[30,40),4;
[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)
第11页/共37页
(1)求图中a的值; (2)根据频率分布直方图,估计这100名学生语文成绩 的平均分; (3)若这100名学生语文成绩某些分数段的人数(x)与数 学成绩相应分数段的人数(y)之比如下表所示,求数学成 绩在[50,90)之外的人数.
分数段 [50,60) x∶y 1∶1
[60,70) 2∶1
故数学成绩在[50,90)之外的人数为 100-(5+20+40+25)=10.
第13页/共37页
在本例条件下估计样本数据的众数. 解:众数应为最高矩形的中点对应的横坐标,故约 为65.
第14页/共37页
解决频率分布直方图问题时要抓住 (1)直方图中各小长方形的面积之和为1.
频率 (2)直方图中纵轴表示 组距 ,故每组样本的频率为组 频率 距×组距,即矩形的面积. (3)直方图中每组样本的频数为频率×总体数.
数字 特征
定义
众数
一组数据中,出现次数 最多 的数据叫做这组 数据的众数. 将一组数据按大小依次排列,把处在_最__中__间__
位置的一个数据(或最中间两个数据的平均数) 中位数
叫做这组数据的中位数.,在频率分布直方图中,
中位数左边和右边的直方图的面积相等 .
第2页/共37页
数字 特征
定义
平均数
样本数据的算术平均数.即 n1(x1+x2+…+xn) .
上的数据的频率是
()
A.0.05
B.0.25
C.0.5
D.0.7
解析:由题知,在区间[10,50)上的数据的频数是 2+3
+4+5=14,故其频率为1240=0.7. 答案:D
第5页/共37页
3.(2012·长春模拟)从某小学随机抽取100名同学,将他们 的身高(单位:厘米)数据绘制成频率分布直方图由图 中数据可知身高在[120,130]内的学生人数为 ( )
x
=
方差
S2= n1[(x1- x )2+(x2- x )2+…+(xn- x )2]. 其中s为标准差
四、茎叶图
茎叶图的优点是可以保留原始数据,而且可以随时记
录,方便记录与表示.
第3页/共37页
[小题能否全取] 1.(教材习题改编)在如图所示的茎叶图
表示的数据中,众数和中位数分别是
A.23与26 C.24与30