高三数学一轮复习 用样本估计总体巩固与练习
2024年广东省高考数学一轮复习第9章第2讲:用样本估计总体(附答案解析)
![2024年广东省高考数学一轮复习第9章第2讲:用样本估计总体(附答案解析)](https://img.taocdn.com/s3/m/e06394f89fc3d5bbfd0a79563c1ec5da50e2d6f5.png)
2024年广东省高考数学一轮复习第9章第2讲:用样本估计总体考试要求 1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.能用数字特征估计总体集中趋势和总体离散程度.知识梳理1.百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.平均数、中位数和众数(1)平均数:x=1n(x1+x2+…+x n).(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).3.方差和标准差(1)方差:s2=1n错误!(x i -x)2或1n错误!2i-x2.(2)标准差:s=错误!.4.总体(样本)方差和总体(样本)标准差(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体平均数为Y,则总体方差S2=1N错误!(Y i-Y)2.(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体方差为S2=1N错误!i(Y i-Y)2.常用结论1.若x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,…,mx n+a的平均数为m x+a.2.数据x1,x2,…,x n与数据x1′=x1+a,x2′=x2+a,…,x n′=x n+a的方差相等,即数据经过平移后方差不变.3.若x1,x2,…,x n的方差为s2,那么ax1+b,ax2+b,…,ax n+b的方差为a2s2.思考辨析判断下列结论是否正确(请在括号中打“√”或“×”)(1)对一组数据来说,平均数和中位数总是非常接近.(×)(2)方差与标准差具有相同的单位.(×)(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(√)(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√)教材改编题1.若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为()A.2B.4C.6D.8答案D解析根据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据2x1,2x2,…,2x9的方差为22s2=8.2.某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为()A.88.5B.89C.91D.89.5答案B解析7次的训练成绩从小到大排列为85,86,87,88,88,89,90,7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数据,即89.3.某校体育节10名旗手的身高(单位:cm)分别为175,178,176,180,179,175,176,179,180,179,则中位数为________.答案178.5解析把10名旗手的身高从小到大排列为175,175,176,176,178,179,179,179,180,180,则178+1792=178.5,所以所求中位数为178.5.题型一样本的数字特征和百分位数的估计例1(1)从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位数分别为()A.92,85B.92,88C.95,88D.96,85答案B解析数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经按照由小到大的顺序排列,计算10×25%=2.5,取第三个数,所以第25百分位数是88.延伸探究本例中,第70百分位数是多少?解10×70%=7,第70百分位数是第7项与第8项的平均数,为92+962=94.(2)(多选)(2023·哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物(PM 2.5)的观测值:396275268225168166176173188168141157若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发生改变的是()A .极差B .中位数C .众数D .平均数答案ABD解析根据题意,若在此组数据中增加一个比现有的最大值大25的数据,即最大值变为396+25=421,极差为最大值与最小值的差,要发生改变;加入数据前,中位数为12×(173+176)=174.5,加入数据后,中位数为176,发生改变;众数为数据中出现次数最多的数,不会改变;若加入数据前,平均数为x ,加入数据后,平均数为12x +42113>x,发生改变.思维升华计算一组n 个数据第p 百分位数的步骤跟踪训练1(1)某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为85,90,93,99,101,103,116,130,则这8名学生数学成绩的第75百分位数为()A .102B .103C .109.5D .116答案C 解析这组数据已经按照由小到大的数据排列,8×75%=6,则这8名学生数学成绩的第75百分位数为第6个数与第7个数的平均数,即为103+1162=109.5.(2)(多选)冬季奥林匹克运动会,是世界规模最大的冬季综合性运动会.自1924年起,每四年举办一届.2022年2月在北京举办了第24届冬季奥林匹克运动会,为了宣传奥运精神,红星实验学校组织了甲、乙两个社团,利用一周的时间对外进行宣传,将每天宣传的次数绘制成如图所示的频数分布折线图,则()A .甲社团宣传次数的众数小于乙社团宣传次数的众数B .甲社团宣传次数的极差大于乙社团宣传次数的极差C .甲社团宣传次数的平均数大于乙社团宣传次数的平均数D .甲社团宣传次数的方差大于乙社团宣传次数的方差答案ABD解析观察每天宣传次数的频数分布折线图,甲社团宣传次数的众数、乙社团宣传次数的众数分别为2,3,A 正确;甲社团宣传次数的极差、乙社团宣传次数的极差分别为3,2,B 正确;甲社团宣传次数的平均数x 1=2+2+3+2+5+4+37=3,乙社团宣传次数的平均数x 2=2+2+3+4+3+3+47=3,C 不正确;甲社团宣传次数的方差s 21=17×[3×(2-3)2+2×(3-3)2+(5-3)2+(4-3)2]=87,乙社团宣传次数的方差s 22=17×[2×(2-3)2+3×(3-3)2+2×(4-3)2]=47,D 正确.题型二总体集中趋势的估计例2为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m 的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.解(1)由频率分布直方图知(0.01+m +0.04+0.02)×10=1,解得m =0.03;设此次竞赛活动学生成绩的中位数为x 0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x 0<90,由(x 0-80)×0.04=0.5-0.4,得x 0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由频率分布直方图及(1)知,x =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-8210×0.4=0.52,则获奖的学生有500×0.52=260(名),所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.思维升华频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.跟踪训练2(2022·哈尔滨模拟)治理沙漠化离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.(1)求直方图中a 的值及众数、中位数;(2)若树苗高度在185cm 及以上是可以移栽的合格树苗.从样本中用比例分配的分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格树苗分别应抽取多少株?解(1)∵(0.0015+0.0110+0.0225+0.0300+a +0.0080+0.0020)×10=1,∴a =0.0250,众数为185+1952=190,设中位数为x ,∵(0.0015+0.0110+0.0225)×10=0.35<0.5,(0.0015+0.0110+0.0225+0.0300)×10=0.65>0.5,则185<x<195,0.35+0.0300×(x-185)=0.5,∴x=190.故a=0.0250,众数为190,中位数为190.(2)由题意可知,合格树苗所占频率为(0.0300+0.0250+0.0080+0.0020)×10=0.65,不合格树苗所占频率为1-0.65=0.35,所以不合格树苗抽取20×0.35=7(株),合格树苗抽取20×0.65=13(株),故不合格树苗、合格树苗应分别抽取7株和13株.题型三总体离散程度的估计例3(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下.旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s21和s22.(1)求x,y,s21,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s21+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解(1)由表格中的数据易得x=110×(-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.3)+10.0=10.0,y=110×(0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.5)+10.0=10.3,s21=110×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,s22=110×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.(2)由(1)中数据可得y -x =10.3-10.0=0.3,而2s 21+s 2210=25(s 21+s 22)=0.0304,显然有y -x >2s 21+s 2210著提高.思维升华总体离散程度的估计标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.跟踪训练3(2022·济宁模拟)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.解(1)x 甲=18×(82+81+79+78+95+88+93+84)=85,x 乙=18×(92+95+80+75+83+80+90+85)=85,s 2甲=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,s 2乙=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41.(2)由(1)知x 甲=x 乙,s 2甲<s 2乙,甲的成绩较稳定,所以派甲参赛比较合适.课时精练1.为做好疫情防控工作,某校坚持落实“双测温两报告”制度,以下是某宿舍6名学生某日上午的体温记录:36.3,36.1,36.4,36.7,36.5,36.6(单位:℃),则该组数据的第80百分位数为()A .36.7B .36.6C .36.5D .36.4答案B解析将6名学生该日上午的体温记录从小到大排列为36.1,36.3,36.4,36.5,36.6,36.7,因为80%×6=4.8,所以该组数据的第80百分位数为36.6.2.(2022·南京模拟)已知一组数据x 1,x 2,x 3,x 4,x 5的平均数为2,方差为12,则另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数、方差分别为()A .2,12B .2,1C .4,32D .4,92答案D解析因为一组数据x 1,x 2,x 3,x 4,x 5的平均数为2,方差为12,所以另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数为3×2-2=4,方差为32×12=92.3.(多选)成立时间少于10年、估值超过10亿美元且未上市的企业称为独角兽企业.2022年中国新经济独角兽企业分布较广泛、覆盖居民生活的各个方面.如图为2022年中国新经济独角兽企业TOP100的行业分布图,在中国新经济独角兽企业TOP100榜单中,京、沪、粤三地的企业数量共同占比达到70%.下列说法正确的是()A .随着智能出行与共享经济观念的普及,汽车交通行业备受投资者关注B .在该TOP100榜单中独角兽企业数量的中位数是3C .在中国新经济独角兽企业TOP100榜单中,京、沪、粤三地的企业超过82家D .2022年中国新经济独角兽企业TOP100榜单中,企业服务、汽车交通、先进制造行业的企业数量共同占比超过30%答案AD解析A 选项,由图可知,汽车交通行业在独角兽企业TOP100榜单中数量较多,故A 选项正确;B 选项,数据为11,10,10,10,10,9,7,6,4,4,4,4,3,2,2,2,2,则中位数为4,故B 选项不正确;C 选项,100×70%=70<82,故C 选项不正确;D 选项,企业服务、汽车交通、先进制造行业的企业数量共同占比为11+10+10100×100%=31%>30%,故D 选项正确.4.(多选)习近平总书记强调,要坚持健康第一的教育理念,加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级学生每周在校体育锻炼时长(单位:小时)进行了统计,得到如下频率分布表:分组[2,3)[3,4)[4,5)[5,6]频率0.250.300.200.25则下列关于高一年级学生每周体育锻炼时长的说法中正确的是()A .众数约为2.5B .中位数约为3.83C .平均数为3.95D .第80百分位数约为5.2答案BCD解析对于A ,根据频率分布表可得,高一年级学生每周体育锻炼时长的众数为3+42=3.5,故A 错误;对于B ,设高一年级学生每周体育锻炼时长的中位数为x ,则0.25+x -34-3×0.30=0.5,解得x ≈3.83,故B 正确;对于C ,高一年级学生每周体育锻炼时长的平均数为0.25×2.5+0.30×3.5+0.20×4.5+0.25×5.5=3.95,故C 正确;对于D ,因为0.25+0.30+0.20+0.05=0.80,所以高一年级学生每周体育锻炼时长的第80百分位数约为5+0.050.25=5.2,故D 正确.5.(多选)第24届冬奥会于2022年2月4日在国家体育场鸟巢举行了盛大开幕式.在冬奥会的志愿者选拔工作中,某高校承办了面试工作,面试成绩满分100分,现随机抽取了80名候选者的面试成绩并分为五组,绘制成如图所示的频率分布直方图,则下列说法正确的是(每组数据以区间的中点值为代表)()A.b的值为0.25B.候选者面试成绩的中位数约为69.4C.在被抽取的候选者中,成绩在区间[65,75)之间的候选者有30人D.估计候选者的面试成绩的平均数约为69.5答案BD解析对于A,由(0.005+b+0.045+0.02+0.005)×10=1,解得b=0.025,故A错误;对于B,设候选者面试成绩的中位数为x,则(0.005+0.025)×10+(x-65)×0.045=0.5,解得x≈69.4,故B正确;对于C,成绩在区间[65,75)的频率为0.045×10=0.45,故人数为80×0.45=36,故C错误;对于D,50×0.005×10+60×0.025×10+70×0.045×10+80×0.02×10+90×0.005×10=69.5,故D正确.6.(2023·云南师大附中模拟)根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①,②,③,④,依次计算得到结果如下:①平均数x<4;②平均数x<4且极差小于或等于3;③平均数x<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A.1组B.2组C.3组D.4组答案B解析①举反例:0,0,0,4,11,其平均数x=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10-3=7,此时数据的平均数必然大于7,与x<4矛盾,故假设错误.则此组数据全部小于10.符合入冬指标;③举反例:1,1,1,1,11,平均数x=3<4,且标准差s=4.但不符合入冬指标;④在众数等于5且极差小于等于4时,最大数不超过9.符合入冬指标.7.(2022·福州模拟)电影《长津湖》点燃了人们心中对英雄的崇敬之情,也更加显示出如今和平生活的来之不易.某影院记录了观看此片的70位观众的年龄,其中年龄位于区间[10,20)内的有10位,位于区间[20,30)内的有20位,位于区间[30,40)内的有25位,位于区间[40,50]内的有15位,则这70位观众年龄的众数的估计值为________.答案35解析由于25>20>15>10,故众数位于区间[30,40)内,所以众数的估计值为30+402=35.8.(2023·沧州模拟)已知某样本数据分别为1,2,3,a ,6,若样本平均数x =3,则样本方差s 2=________.答案145解析由题设,得x =1+2+3+a +65=3,可得a =3,所以s 2=15错误!(x i -x )2=145.9.(2023·南通模拟)某学校对高一某班的同学进行了身高(单位:cm)调查,将得到的数据进行适当分组后(除最后一组为闭区间外其余每组为左闭右开区间),画出如图所示的频率分布直方图.(1)求m 的值;(2)估计全班同学身高的中位数;(3)估计全班同学身高的平均数及方差(同一组中的数据用该组区间的中点值作代表).解(1)由频率分布直方图可得(m +0.010+0.010+0.015+0.040)×10=1,解得m =0.025.(2)设全班同学身高的中位数为x ,由题可知x ∈[165,175),得0.10+0.15+(x -165)×0.040=0.5,解得x =171.25,故估计全班同学身高的中位数为171.25.(3)估计全班同学身高的平均数为150×0.10+160×0.15+170×0.40+180×0.25+190×0.10=171,估计全班同学身高的方差为(150-171)2×0.10+(160-171)2×0.15+(170-171)2×0.40+(180-171)2×0.25+(190-171)2×0.10=119.10.对参加某次数学竞赛的1000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.(1)根据直方图完成以下表格;成绩[50,60)[60,70)[70,80)[80,90)[90,100]频数(2)求参赛选手初赛成绩的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛的选手成绩?解(1)填表如下:成绩[50,60)[60,70)[70,80)[80,90)[90,100]频数50150350350100(2)平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78,方差为(55-78)2×0.05+(65-78)2×0.15+(75-78)2×0.35+(85-78)2×0.35+(95-78)2×0.1=101.(3)进入复赛的选手成绩为80+350-(380-100)350×10=82(分),所以初赛成绩为82分及以上的选手均可进入复赛.(说明:回答82分以上,或82分及以上均可).11.(2022·天津模拟)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5~40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28答案D解析垫球数在区间[5,25)内的人数占总数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%;所以第75百分位数位于区间[25,30)内,且25+5×0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.12.(2022·上海模拟)若等差数列{x n }的公差为3,则x 1,x 2,x 3,…,x 9的方差为________.答案60解析由等差数列{x n }的公差为3,可知x =x 1+x 2+…+x 99=x 1+x 92×99=x 1+x 92=x 5,所以方差s 2=19[(x 1-x 5)2+(x 2-x 5)2+…+(x 9-x 5)2]=19(16d 2+9d 2+4d 2+d 2)×2=203d 2=203×9=60.13.(多选)某学校规定,若五个工作日内学校某天有超过3个人的体温测量值高于37.5℃,则需全员进行核酸检测.该校统计了五个工作日内每天体温超过37.5℃的人数,则根据这组数据的下列信息,能断定该校不需全员进行核酸检测的是()A .中位数是1,平均数是1B .中位数是1,众数是0C .中位数是2,众数是2D .平均数是2,方差是0.8答案AD 解析对于A ,因为中位数是1,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为a ,b ,1,c ,d ,因为平均数是1,所以a +b +1+c +d =5,若d =4,则a =b =c =0,与中位数是1矛盾,故A 正确;对于B ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为0,0,1,2,4,满足中位数是1,众数是0,但有一天超过3人,故B 错误;对于C ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为0,2,2,3,4,满足中位数是2,众数是2,但有一天超过3人,故C 错误;对于D ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为a ,b ,c ,d ,e ,因为平均数是2,方差是0.8,则a +b +c +d +e =10,15[(a -2)2+(b -2)2+(c -2)2+(d -2)2+(e -2)2]=0.8,即(a -2)2+(b -2)2+(c -2)2+(d -2)2+(e -2)2=4,则e≤4,若e=4,从方差角度来说a=b=c=d=2,不满足a+b+c+d+e=10,所以e<4,同理a,b,c,d均小于4,故D正确.14.(多选)已知一组数据丢失了一个大于3的数据,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的2倍,则丢失的数据可能是()A.4B.12C.18D.20答案AC解析设丢失的数据为x,则这七个数据的平均数为31+x7,众数是3,若3<x<5,则中位数为x,此时31+x7+3=2x,解得x=4;若x≥5,则中位数为5,此时31+x7+3=2×5,解得x=18.综上所述,丢失的数据可能是4或18.。
新高考数学一轮复习考点知识专题讲解与练习 57 用样本估计总体
![新高考数学一轮复习考点知识专题讲解与练习 57 用样本估计总体](https://img.taocdn.com/s3/m/65f15c4859fafab069dc5022aaea998fcd224047.png)
新高考数学一轮复习考点知识专题讲解与练习考点知识总结57 用样本估计总体高考概览高考在本考点的常考题型为选择题、填空题,分值为5分,中、低等难度考纲研读1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图,并体会它们各自的特点2.理解样本数据标准差的意义和作用,会计算数据的标准差3.能从样本数据中提取基本的数字特征(如平均数、标准差、百分位数),并做出合理的解释4.会计算分层随机抽样的样本均值与样本方差5.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想6.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题一、基础小题1.一组数据90,92,99,97,96,x的众数是92,则这组数据的中位数是() A.94 B.95 C.96 D.97答案A解析数据90,92,99,97,96,x的众数是92,则x=92,所以这组数据为90,92,92,96,97,99,则这组数据的中位数是12×(92+96)=94.故选A.2.如图所示是根据某市3月1日至10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是()A.-2 B.0C.1 D.2答案D解析由折线图可知,这10天的最低气温按照从小到大的顺序排列为-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的第80百分位数是2+22=2.3.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积和的14,且样本量为80,则中间一组的频数为() A.0.25 B.0.5 C.20 D.16答案D解析设中间一组的频数为x,依题意有x80=14⎝⎛⎭⎪⎫1-x80,解得x=16.4.研究人员随机调查统计了某地1000名“上班族”每天在工作之余使用手机上网的时间,并将其绘制为如图所示的频率分布直方图,若同一组数据用该区间的中点值作代表,则可估计该地“上班族”每天在工作之余使用手机上网的平均时间是()A.1.78小时B.2.24小时C.3.56小时D.4.32小时答案C解析该地“上班族”每天在工作之余使用手机上网的平均时间是(1×0.12+3×0.2+5×0.1+7×0.08)×2=3.56小时.5.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:班级人数平均分数方差甲20x-2甲乙30x-3乙其中x-甲=x-乙,则两个班数学成绩的方差为()A.3 B.2C.2.6 D.2.5答案C解析由题意可知两个班的数学成绩平均数为x-=x-甲=x-乙,则两个班数学成绩的方差为s2=2020+30×[2+(x-甲-x-)2]+3020+30×[3+(x-乙-x-)2]=2020+30×2+3020+30×3=2.6.6.2022年4月24日下午,随着最后1例新冠肺炎重症患者治愈,武汉重症病例实现了清零,抗疫工作取得了阶段性重大胜利.某方舱医院从出院的新冠肺炎患者中随机抽取100人,将这些患者的治疗时间(都在[5,30]天内)进行统计,制作出频率分布直方图如图所示,则估计该院新冠肺炎患者治疗时间的中位数是()A.16 B.17C.18 D.19答案B解析设这100名新冠肺炎患者治疗时间的中位数是x,∵(0.01+0.05)×5=0.3<0.5,(0.01+0.05+0.1)×5=0.8>0.5,∴x∈[15,20),0.3+(x-15)×0.1=0.5,解得x=17,则该院新冠肺炎患者治疗时间的中位数是17.故选B.7.(多选)乐乐家共有七人,已知今年这七人年龄的众数为35,平均数为44,中位数为55,标准差为19,则5年后,下列说法中正确的是()A.这七人岁数的众数变为40B.这七人岁数的平均数变为49C.这七人岁数的中位数变为60D.这七人岁数的标准差变为24答案ABC解析根据众数、平均数、中位数的概念得5年后,每人的年龄相应增加5,而标准差不变,所以这七人年龄的众数变为40;平均数变为49;中位数变为60;标准差不变,为19.故选ABC.8.(多选)为了解运动健身减肥的效果,某健身房调查了20名肥胖者,测量了他们的体重(单位:千克).健身之前他们的体重情况如三维饼图1所示,经过半年的健身后,他们的体重情况如三维饼图2所示.对比健身前后,关于这20名肥胖者,下列结论正确的是()A.他们健身后,体重在区间[90,100)内的人数不变B.他们健身后,体重在区间[100,110)内的人数减少了2个C.他们健身后,体重在区间[110,120)内的肥胖者体重都有减轻D.他们健身后,这20名肥胖者的体重的中位数位于区间[90,100)答案ACD解析题图1中体重在区间[90,100),[100,110),[110,120)内的人数分别为8,10,2;题图2中体重在区间[80,90),[90,100),[100,110)内的人数分别为6,8,6.故选ACD.二、高考小题9.(2022·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案C解析由频率分布直方图,知该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1×100%=6%,故A正确;由频率分布直方图,知该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;由频率分布直方图,知该地农户家庭年收入的平均值约为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C不正确;由频率分布直方图,知该地农户家庭年收入介于4.5万元至8.5万元之间的农户比率约为(0.10+0.14+0.20+0.20)×1×100%=64%>50%,故D正确.故选C.10.(多选)(2022·新高考Ⅱ卷)下列统计量中,能度量样本x1,x2,…,x n的离散程度的是()A.样本x1,x2,…,x n的标准差B.样本x1,x2,…,x n的中位数C.样本x1,x2,…,x n的极差D.样本x1,x2,…,x n的平均数答案AC解析由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势.故选AC.11.(多选)(2022·新高考Ⅰ卷)有一组样本数据x1,x2,…,x n,由这组数据得到新样本数据y1,y2,…,y n,其中y i=x i+c(i=1,2,…,n),c为非零常数,则() A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同答案CD解析由题可知x-=x1+x2+…+x nn ,y-=y1+y2+…+y nn=x1+x2+…+x nn+c=x-+c ,因为c ≠0,所以x -≠y -,A 错误;若样本数据x 1,x 2,…,x n 的中位数为x k ,因为y i =x i +c ,c ≠0,所以样本数据y 1,y 2,…,y n 的中位数为y k =x k +c ≠x k ,B 错误;设s x 表示样本数据x 1,x 2,…,x n 的标准差,s y 表示样本数据y 1,y 2,…,y n 的标准差,则样本数据y 1,y 2,…,y n 的标准差s y =1n (y 1-y -)2+(y 2-y -)2+…+(y n -y -)2=1n[(x 1+c )-(x -+c )]2+[(x 2+c )-(x -+c )]2+…+[(x n +c )-(x -+c )]2=1n (x 1-x -)2+(x 2-x -)2+…+(x n -x -)2=s x ,所以C 正确;设样本数据x 1,x 2,…,x n 中最大的为x n ,最小的为x 1,因为y i =x i +c ,所以样本数据y 1,y 2,…,y n 中最大的为y n ,最小的为y 1,极差为y n -y 1=(x n +c )-(x 1+c )=x n -x 1,所以D 正确.故选CD.12.(2022·天津高考)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是( )A .20B .40 C.64 D .80答案 D解析 由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.050×4=80.故选D.13.(2022·全国Ⅲ卷)在一组样本数据中,1,2,3,4出现的频率分别为p 1,p 2,p 3,p 4,且∑4i =1p i =1,则下面四种情形中,对应样本的标准差最大的一组是( ) A .p 1=p 4=0.1,p 2=p 3=0.4B .p 1=p 4=0.4,p 2=p 3=0.1C .p 1=p 4=0.2,p 2=p 3=0.3D .p 1=p 4=0.3,p 2=p 3=0.2答案 B解析 对于A ,该组数据的平均数为x -A =(1+4)×0.1+(2+3)×0.4=2.5,方差为s 2A =(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×0.1=0.65;对于B ,该组数据的平均数为x -B =(1+4)×0.4+(2+3)×0.1=2.5,方差为s 2B =(1-2.5)2×0.4+(2-2.5)2×0.1+(3-2.5)2×0.1+(4-2.5)2×0.4=1.85;对于C ,该组数据的平均数为x -C=(1+4)×0.2+(2+3)×0.3=2.5,方差为s 2C =(1-2.5)2×0.2+(2-2.5)2×0.3+(3-2.5)2×0.3+(4-2.5)2×0.2=1.05;对于D ,该组数据的平均数为x -D =(1+4)×0.3+(2+3)×0.2=2.5,方差为s 2D =(1-2.5)2×0.3+(2-2.5)2×0.2+(3-2.5)2×0.2+(4-2.5)2×0.3=1.45.因此,B 项这一组样本数据的标准差最大.故选B.14.(2022·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差答案 A解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.15.(2022·全国Ⅱ卷)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.答案 0.98解析 平均正点率x -=10×0.97+20×0.98+10×0.9910+20+10=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98.16.(2022·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________.答案 53解析 这组数据的平均数为8,故其方差为s 2=16×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=53.三、模拟小题17.(2022·河北张家口第三次模拟)某中学春季运动会上,12位参加跳高半决赛同学的成绩各不相同,按成绩从高到低取前6位进入决赛,如果小明知道了自己的成绩后,则他可根据其他11位同学成绩的哪个数据判断自己能否进入决赛( )A.中位数B.平均数C.极差D.方差答案A解析12位同学参赛,按成绩从高到低取前6位进入决赛,正好一半,因此可根据中位数判断小明是否能进入决赛.故选A.18.(多选)(2022·广东省花都区高三上学期调研)四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的有()A.中位数为3,众数为3B.平均数为3,众数为4C.平均数为3,中位数为3D.平均数为2,方差为2.4答案BD解析对于A,当掷骰子出现的结果为1,2,3,3,6时,满足中位数为3,众数为3,所以A不能判断;对于B,若平均数为3,且出现点数为6,则其余4个数的和为9,而众数为4,故其余4个数的和至少为10,所以B可以判断;对于C,当掷骰子出现的结果为1,1,3,4,6时,满足平均数为3,中位数为3,可以出现点6,所以C不能判断;对于D,若平均数为2,且出现点数6,则方差s2>12=3.2>2.4,所以当平均数5×(6-2)为2,方差为2.4时,一定不会出现点数6.故选BD.19.(多选)(2022·安徽蚌埠高三模拟)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列说法正确的是()A.甲的成绩的平均数等于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差大于乙的成绩的极差答案AC解析由题图可得,x-甲=4+5+6+7+85=6,x-乙=3×5+6+95=6,A正确;甲的成绩的中位数为6,乙的成绩的中位数为5,B错误;甲的成绩的第80百分位数为7+82=7.5,乙的成绩的第80百分位数为6+92=7.5,所以二者相等,C正确;甲的成绩的极差为4,乙的成绩的极差也为4,D错误.20.(多选)(2022·广东肇庆第二次统一检测)某大学生暑假到工厂参加生产劳动,生产了100件产品,质检人员测量其长度(单位:厘米),将所得数据分成6组:[90,91),[91,92),[92,93),[93,94),[94,95),[95,96],得到如图所示的频率分布直方图,则关于这100件产品,下列说法中正确的是()A.b=0.25B.长度落在区间[93,94)内的个数为35C.长度的众数一定落在区间[93,94)内D.长度的中位数一定落在区间[93,94)内答案ABD解析对于A,由频率和为1,得(0.35+b+0.15+0.1×2+0.05)×1=1,解得b=0.25,故A正确;对于B,长度落在区间[93,94)内的个数为100×0.35=35,故B正确;对于C,这100件产品长度的众数不一定落在区间[93,94)内,故C错误;对于D,由(0.1×2+0.25)×1=0.45<0.5,(0.1×2+0.25+0.35)×1=0.8>0.5,知这100件产品长度的中位数一定落在区间[93,94)内,故D正确.故选ABD.21.(多选)(2022·湖南师大附中高三第二次月考)甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层随机抽样方法从两所学校一共抽取了110名学生的数学成绩,考生成绩都分布在[70,150]内,并作出了如下频数分布统计表,规定考试成绩在[120,150]内为优秀,则下列说法正确的有()分组[70,80)[80,90)[90,100)[100,110)AB.估计甲校优秀率为25%,乙校优秀率为40% C.估计甲校和乙校众数均为120D.估计乙校的数学平均成绩比甲校高答案ABD解析对于A,甲校抽取110×12002200=60人,乙校抽取110×10002200=50人,故x=10,y=7,故A正确;对于B,估计甲校优秀率为1560=25%,乙校优秀率为2050=40%,故B正确;对于C,甲校众数的估计值为105,115,乙校众数的估计值为115,125,故C 错误;对于D,甲校平均成绩为109.5,乙校平均成绩为114.6,故D正确.22.(多选)(2022·湖南六校联考)下图是某市6月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择6月1日至13日中的某一天到达该市,并停留2天,下列说法正确的有()A.该市14天空气质量指数的平均值大于100B.此人到达当日空气质量优良的概率为8 13C.此人在该市停留期间只有1天空气重度污染的概率为2 13D.每连续3天计算一次空气质量指数的方差,其中第5天到第7天的方差最大答案AD解析114×(86+25+57+143+220+160+40+217+160+121+158+86+79+37)=113.5,故A正确;在6月1日至13日这13天中,1日,2日,3日,7日,12日,13日共6天的空气质量优良,所以此人到达当日空气质量优良的概率为613,故B不正确;6月1日至14日连续两天包含的样本点有13个,此人在该市停留期间只有1天空气重度污染的样本点是{4,5},{5,6},{7,8},{8,9},共4个,所以此人在该市停留期间只有1天空气重度污染的概率是413,故C不正确;由空气质量指数趋势图可以看出,从3月5日开始连续三天的空气质量指数方差最大,故D正确.故选AD.23.(2022·山东潍坊高三质检)为了调查公司员工的健康状况,用分层随机抽样的方法抽取样本,已知所抽取的所有员工的体重的方差为124,男员工的平均体重为70 kg ,标准差为4,女员工的平均体重为50 kg ,标准差为6.若样本中有20名男员工,则女员工的人数为________.答案 30解析 设男员工的权重为ω男,由题意可知样本的平均数x -=ω男x -男+(1-ω男)x -女=70ω-男+50(1-ω男)=20ω男+50,样本的方差s 2=ω男[s 2男+(x -男-x -)2]+(1-ω男)[s 2女+(x -女-x -)2],即ω男[42+(70-20ω男-50)2]+(1-ω男)[62+(50-20ω男-50)2]=124,解得ω男=0.4,因为样本中有20名男员工,所以样本中女员工的人数为200.4×(1-0.4)=30.一、高考大题1.(2022·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.9 新设备10.110.410.110.010.1旧设备 9.8 10.0 10.1 10.2 9.7 新设备10.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x -和y -,样本方差分别记为s 21和s 22.(1)求x -,y -,s 21,s 22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y --x-≥2s 21+s 2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解 (1)由表中的数据可得:x -=9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.710=10,y -=10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.510=10.3, s 21=110×[(9.8-10)2+(10.3-10)2+(10.0-10)2+(10.2-10)2+(9.9-10)2+(9.8-10)2+(10.0-10)2+(10.1-10)2+(10.2-10)2+(9.7-10)2]=0.036,s 22=110×[(10.1-10.3)2+(10.4-10.3)2+(10.1-10.3)2+(10.0-10.3)2+(10.1-10.3)2+(10.3-10.3)2+(10.6-10.3)2+(10.5-10.3)2+(10.4-10.3)2+(10.5-10.3)2]=0.04.(2)由(1)中的数据可得y --x -=10.3-10=0.3,2s 21+s 2210=20.036+0.0410=20.0076=0.0304,因为0.3=0.09>0.0304,所以y --x ->2s 21+s 2210.所以可以认为新设备生产产品的该项指标的均值较旧设备有显著提高.2.(2022·全国Ⅰ卷)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表(1)(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?解(1)由表中数据可知,甲厂加工出来的一件产品为A级品的概率的估计值为40100=0.4,乙厂加工出来的一件产品为A级品的概率的估计值为28=0.28.100(2)甲分厂加工100件产品的总利润为40×(90-25)+20×(50-25)+20×(20-25)-20×(50+25)=1500元,所以甲分厂加工100件产品的平均利润为15元/件.乙分厂加工100件产品的总利润为28×(90-20)+17×(50-20)+34×(20-20)-21×(50+20)=1000元,所以乙分厂加工100件产品的平均利润为10元/件.故厂家应选择甲分厂承接加工业务.3.(2022·全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.4.(2022·全国Ⅰ卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m 3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解 (1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m 3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m 3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x -1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x-2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计该家庭使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).二、模拟大题5.(2022·河南郑州一模)河阴石榴是河南省荥阳市的特产,距今已有2100多年的历史,河阴石榴籽粒大,色紫红,甜味浓,被誉为“中州名果”.河阴石榴按照果径大小可以分为四类:标准果、优质果、精品果、礼品果.某超市老板从采购的一批河阴石榴中随机抽取100 kg,根据石榴的等级分类标准得到的数据如下表所示:(1)求a(2)用样本估计总体,超市老板参考以下两种销售方案进行销售:方案1:不分类卖出,单价为20元/kg;方案2:分类卖出,分类后的水果售价如下表所示:=0.2.解(1)a=100-10-30-40=20,礼品果所占比例是20100(2)理由一:设方案2的石榴售价的平均数为x -,x -=16×110+18×310+22×410+24×210=20.6,因为x -=20.6>20,所以从超市老板的销售利润角度考虑,采用方案2比较好.理由二:设方案2的石榴售价的平均数为x -,x -=16×110+18×310+22×410+24×210=20.6,虽然x -=20.6>20,但20.6-20=0.6,差额不太大,从超市老板后期对石榴分类的人力资源和时间成本角度考虑,采用方案1比较好.6.(2022·湖南师大附中第一次大练习)某学校团委组织了“文明出行,爱我中华”的知识竞赛,从参加考试的学生中抽出60名学生,将其成绩(单位:分)整理后,得到如图所示的频率分布直方图(其中分组区间为[40,50),[50,60),…,[90,100]).(1)求成绩在[70,80)的频率,并补全此频率分布直方图;(2)求这次考试平均分的估计值(同一组中的数据以这组数据所在区间中点的值作代表);(3)若从成绩在[40,50)和[90,100]的学生中任选两人,求他们的成绩在同一分组区间的概率.解 (1)成绩在[70,80)的频率为1-(0.005+0.015+0.020+0.030+0.005)×10=0.25.补全频率分布直方图如下:(2)依题意可得,平均分x-=(45×0.005+55×0.015+65×0.020+75×0.025+85×0.030+95×0.005)×10=72.5.故这次考试平均分的估计值为72.5.(3)成绩在[40,50)和[90,100]的人数分别是3和3,所以从成绩在[40,50)和[90,100]内的学生中任选两人,将[40,50)分数段的3人编号为A1,A2,A3,将[90,100]分数段的3人编号为B1,B2,B3,从中任取两人,则样本空间Ω={(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A1,B3),(A2,A3),(A2,B1),(A2,B2),(A2,B3),(A3,B1),(A3,B2),(A3,B3),(B1,B2),(B1,B3),(B2,B3)},共有15个样本点,这15个样本点发生的可能性是相等的.其中,在同一分数段内的事件所含样本点有(A1,A2),(A1,A3),(A2,A3),(B1,B2),(B1,B3),(B2,B3),共6个,故所求概率P=615=25.7.(2022·河北省衡水市第一中学高三上学期第一次调研)“2022年全国城市节约用水宣传周”已于5月9日至15日举行.成都市围绕“贯彻新发展理念,建设节水型城市”这一主题,开展了形式多样、内容丰富的活动.进一步增强全民保护水资源,防治水污染,节约用水的意识.为了解活动开展成效,某街道办事处工作人员赴一小区调查住户的节约用水情况,随机抽取了300名业主进行节约用水调查评分,将得到的分数分成6组:[70,75),[75,80),[80,85),[85,90),[90,95), [95,100],得到如图所示的频率分布直方图.(1)求a的值,并估计这300名业主评分的中位数;(2)若先用比例分配的分层随机抽样的方法从评分在[90,95)和[95,100]的业主中抽取5人,然后再从抽出的这5名业主中任意选取2人做进一步访谈,求这2人中至少有1人的评分在[95,100]的频率.解(1)∵第三组的频率为1-(0.020+0.025+0.030+0.035+0.050)×5=0.200,=0.040.∴a=0.2005又第一组的频率为0.025×5=0.125,第二组的频率为0.035×5=0.175,第三组的频率为0.200,∴前三组的频率之和为0.125+0.175+0.200=0.500,∴这300名业主评分的中位数为85.(2)由频率分布直方图,知评分在[90,95)的人数与评分在[95,100]的人数的比值为3∶2,∴采用比例分配的分层随机抽样法抽取5人,评分在[90,95)的有3人,评分在[95,100]的有2人.不妨设评分在[90,95)的3人分别为A1,A2,A3,评分在[95,100]的2人分别为B1,B2,则从5人中任选2人的所有可能情况有{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},共10种.其中选取的2人中至少有1人的评分在[95,100]的情况有{A1,B1},{A1,B2},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},共7种.故这2人中至少有1人的评分在[95,100]的概率为P=710.。
高三数学一轮复习课时作业5:用样本估计总体
![高三数学一轮复习课时作业5:用样本估计总体](https://img.taocdn.com/s3/m/9f0326b36c175f0e7dd13735.png)
第2讲用样本估计总体基础巩固题组(建议用时:40分钟)一、选择题1.(2014·青岛检测)如图是一容量为100的样本的质量的频率分布直方图,样本质量均在『5,20』内,其分组为『5,10),『10,15),『15,20』,则样本质量落在『15,20』内的频数为()A.10 B.20C.30 D.40解析由题意得组距为5,故样本质量在『5,10),『10,15)内的频率分别为0.3和0.5,所以样本质量在『15,20』内的频率为1-0.3-0.5=0.2,频数为100×0.2=20,故选B.答案B2.(2015·西安检测)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法中一定正确的是() A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班级男生成绩的平均数小于该班女生成绩的平均数解析依题意,显然不能确定题中的抽样方法是属于哪种抽样,因此选项A,B均不正确;选项D,仅有5名男生,5名女生的数学成绩,而不能得出该班男生成绩的平均数小于该班女生成绩的平均数;对于C,注意到将这五个男生与女生的成绩均按由小到大排列,这五名男生的成绩相对较为分散,因此这五名男生成绩的方差大于这五名女生成绩的方差,故选C.答案C3.(2014·临沂一模)某中学高三从甲、乙两个班中各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生成绩的众数是85,乙班学生成绩的中位数是83,则x+y的值为()A.7 B.8C.9 D.10解析由茎叶图可知,甲班学生成绩的众数是85,所以x=5.乙班学生成绩的中位数是83,所以y=3,所以x+y=5+3=8.答案B4.(2015·东北三省三校联考)在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的下列数字特征对应相同的是() A.平均数B.标准差C.众数D.中位数解析利用平均数、标准差、众数、中位数等统计特征数的概念求解.由B 样本数据恰好是A样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A样本不相同,标准差不变,故选B.答案B5.(2015·沈阳监测)某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机调查了24名笔试者的成绩,如下表所示:分数段『60,65)『65,70)『70,75)『75,80)『80,85)『85,90』人数 2 3 49 5 1 A .75 B .80 C .85D .90解析 因为参加笔试的400人中择优选出100人,故每个人被择优选出的概率P =100400=14,因为随机调查24名笔试者,则估计能够参加面试的人数为24×14=6,观察表格可知,分数在『80,85)有5人,分数在『85,90)的有1人,故面试的分数线大约为80分,故选B. 答案 B 二、填空题6.(2014·甘肃诊断)如图是根据某赛季甲、乙两名篮球运动员参加11场比赛的得分情况画出的茎叶图.若甲运动员的中位数为a ,乙运动员的众数为b ,则a -b =________.解析 由茎叶图可知甲运动员的中位数为a =19,乙运动员的众数为b =11,所以a -b =8. 答案 87.样本中共有五个个体,其值分别为a ,0,1,2,3.若该样本的平均值为1,则样本方差为________.解析 由题可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15『(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2』=2. 答案 28.(2015·银川检测)某企业3个分厂同时生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为________h.解析依题意,抽取的100件产品来自于第一、二、三分厂分别有25,50,25件,因此抽取的100件产品的使用寿命的平均值为1100(980×25+1 032×25+1 020×50)=1 013(h).答案 1 013三、解答题9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在『50,60』的频率及全班人数;(2)求分数在『80,90』之间的频数,并计算频率分布直方图中『80,90』间的矩形的高.解(1)分数在『50,60』的频率为0.008×10=0.08.由茎叶图知,分数在『50,60』之间的频数为2,所以全班人数为20.08=25.(2)分数在『80,90』之间的频数为25-2-7-10-2=4,频率分布直方图中『80,90』间的矩形的高为425÷10=0.016.10.(2014·北京卷)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).解(1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组『4,6)内的有17人,频率为0.17,所以a=频率组距=0.172=0.085.课外阅读时间落在组『8,10)内的有25人,频率为0.25,所以b=频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.能力提升题组(建议用时:25分钟)11.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成『0,5),『5,10),…,『30,35),『35,40』时,所作的频率分布直方图是()解析由于频率分布直方图的组距为5,排除C、D,又『0,5),『5,10)两组各一人,排除B,应选A.答案A12.(2014·益阳模拟)为了了解某校九年级1 600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人解析由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有160人.故D是错误的,选D.答案D13.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{a n},已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为________.解析∵小长方形的面积由小到大构成等比数列{a n},且a2=2a1,∴样本的频率构成一个等比数列,且公比为2,,∴a1+2a1+4a1+8a1=15a1=1,∴a1=115∴小长方形面积最大的一组的频数为300×8a1=160.答案16014.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下: 服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解 (1)设A 药观测数据的平均数为x -A ,B 药观测数据的平均数为x -B ,则x -A =120(0.6+1.2+2.7+1.5+2.8+1.8+2.2+2.3+3.2+3.5+2.5+2.6+1.2+2.7+1.5+2.9+3.0+3.1+2.3+2.4)=2.3.x -B =120(3.2+1.7+1.9+0.8+0.9+2.4+1.2+2.6+1.3+1.4+1.6+0.5+1.8+0.6+2.1+1.1+2.5+1.2+2.7+0.5)=1.6.则x -A >x -B ,因此A 药的疗效更好. (2)由观测结果绘制如下茎叶图:从茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎“2.”,“3.”上;B 药疗效的试验结果有710的叶集中在茎“0.”,“1.”上.由上述可看出A药的疗效更好.。
2025年高考数学一轮复习课时作业-用样本估计总体【含解析】
![2025年高考数学一轮复习课时作业-用样本估计总体【含解析】](https://img.taocdn.com/s3/m/143078790166f5335a8102d276a20029bc64636f.png)
2025年高考数学一轮复习课时作业-用样本估计总体【原卷版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.642.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.183.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,924.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.56.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.7.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.8.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.2810.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.12.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.2025年高考数学一轮复习课时作业-用样本估计总体【解析版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.64【解析】选C.将6名学生该日在校体育锻炼时长记录从小到大排列为45,51,59,62,66,70,因为80%×6=4.8,所以该组数据的80%分位数为66.2.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.18【解析】选B.志愿者的总人数为20=50,所以第三组的人数为50×0.36=18,(0.24+0.16)×1有疗效的人数为18-6=12.3.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,92【解析】选D.因为一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,所以另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为3×2-2=4,方差为32×12=92.4.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等【解析】选D.将A,B两家企业10天内已处理的废水的某项指标值的检测结果从小到大排列:A企业:43,63,65,72,73,75,78,81,86,98.B企业:37,58,61,65,68,68,71,77,82,94.A企业该指标值的极差为98-43=55,B企业该指标值的极差为94-37=57,A错误;A企业该指标值的中位数为73+752=74,B企业该指标值的中位数为68+682=68,B错误;A企业该指标值的平均数为43+63+65+72+73+75+78+81+86+9810=73.4,B企业该指标值的平均数为37+58+61+65+68+68+71+77+82+9410=68.1,C错误;由上可知,B企业该指标值的众数与中位数都为68,D正确.5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.5【解析】选BCD.选项A,乙同学体温的极差为36.5-36.3=0.2,故A错误;选项B,从题中折线图上可以看出,乙同学的体温比甲同学的体温更稳定,故B正确;选项C,乙同学的体温从低到高依次为36.3℃,36.3℃,36.4℃,36.4℃,36.4℃, 36.5℃,36.5℃,故众数为36.4,而中位数和平均数都是36.4,故C正确;选项D,甲同学的体温从低到高依次为36.2℃,36.2℃,36.4℃,36.4℃,36.5℃, 36.5℃,36.6℃,由70%×7=4.9,可知数据的第70百分位数为第5项数据36.5,故D 正确.6.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.【解析】根据题意,设今年计划招聘的硕士生为x人,博士生为y人,又由现有研究员300人,其中本科生有300×20%=60(人),硕士生有300×40%=120(人),=0.15,=0.4,解得 =40, =60.答案:407.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.【解析】由题意得m-2=10,所以m=12,所以该组数据的平均数为 =2+4+8+124=132,由方差的计算公式可知:s2=14 2-+(4-132)2+(8-132)2+12- =594.答案:5948.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【解析】(1)甲=18×(82+81+79+78+95+88+93+84)=85,乙=18×(92+95+80+75+83+80+90+85)=85,甲2=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2] =35.5,乙2=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2] =41.(2)由(1)知甲=乙,甲2< 乙2,甲的成绩较稳定,所以派甲参赛比较合适.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28【解析】选D.垫球数在区间[5,25)内的人数占总人数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总人数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%,所以第75百分位数位于区间[25,30)内,且25+5×0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.10.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差【解析】选BD.对于A,如1,2,2,2,3,5的平均数为2.5,而2,2,2,3的平均数为2.25,不相等,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,其中位数为 3+ 42,x2,x3,x4,x5的中位数为 3+ 42,所以B正确;对于C,x1,x2,x3,x4,x5,x6的波动更大,所以C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x5-x2≤x6-x1,故D正确.11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.【解析】因为(0.01+0.01+m+0.02+0.02)×10=1,所以m=0.04,又0.1+0.1+0.4=0.6, 0.1+0.1+0.4+0.2=0.8,所以第65百分位数位于第4组中,设第65百分位数为a,则0.1+0.1+0.4+(a-80)×0.02=0.65,解得a=82.5.答案:82.512.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.【解析】(1)由题中频率分布直方图知(0.01+m+0.04+0.02)×10=1,解得m=0.03;设此次竞赛活动学生成绩的中位数为x0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x0<90,由(x0-80)×0.04=0.5-0.4,得x0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由题中频率分布直方图及(1)知, =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-8210×0.4=0.52,则获奖的学生有500×0.52=260(名),所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.。
2025高考数学一轮复习- 用样本的数字特征估计总体-专项训练【含解析】
![2025高考数学一轮复习- 用样本的数字特征估计总体-专项训练【含解析】](https://img.taocdn.com/s3/m/03e432777275a417866fb84ae45c3b3566ecdd7c.png)
课时过关检测(六十五)用样本的数字特征估计总体【原卷版】1.数据1,2,3,4,5,6的60%分位数为()A .3B .3.5C .3.6D .42.若数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为()A .x -和s 2B .2x -+3和4s 2C .2x -+3和s 2D .2x -+3和4s 2+12s +93.为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2019年1月至2020年7月的调查数据得出的中国仓储指数,绘制出如下折线图.根据该折线图,下列结论正确的是()A .2019年各月的仓储指数最大值是在3月份B .2020年1月至7月的仓储指数的中位数为55C .2020年1月与4月的仓储指数的平均数为52D .2019年1月至4月的仓储指数相对于2020年1月至4月,波动性更大4.已知样本甲:x 1,x 2,x 3,…,x n 与样本乙:y 1,y 2,y 3,…,y n ,满足y i =2x 3i +1(i =1,2,…,n ),则下列叙述中一定正确的是()A .样本乙的极差等于样本甲的极差B .样本乙的众数大于样本甲的众数C .若某个x i 为样本甲的中位数,则y i 是样本乙的中位数D .若某个x i 为样本甲的平均数,则y i 是样本乙的平均数5.已知样本x 1,x 2,…,x n 的平均数为x ,样本y 1,y 2,…,y m 的平均数为y (x ≠y ),若样本x 1,x 2,…,x n ,y 1,y 2,…,y m 的平均数z =ax +(1-a )y ,其中0<a <12,则n ,m (n ,m∈N*)的大小关系为()A.n=m B.n≥mC.n<m D.n>m6.(多选)甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表:班级参加人数中位数方差平均数甲55149191135乙55151110135下列结论中,正确的是()A.甲、乙两班学生成绩的平均水平相同B.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)C.甲班的成绩波动情况比乙班的成绩波动大D.甲班成绩的众数小于乙班成绩的众数7.(多选)某篮球爱好者在一次篮球训练中,需进行五轮投篮,每轮投篮5次.统计各轮投进球的个数,获知其前四轮投中的个数分别为2,3,4,4,则第五轮结束后,下列数字特征有可能发生的是()A.平均数为3,极差是3B.中位数是3,极差是3C.平均数为3,方差是0.8D.中位数是3,方差是0.568.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为________,方差为_________.9.某经销商从外地一水殖厂购进一批小龙虾,并随机抽取40只进行统计,按重量分类统计结果如图:(1)估计这批小龙虾重量的第10百分位数与第90百分位数;(2)该经销商将这批小龙虾分成三个等级,如表:等级三等品二等品一等品重量/克[5,25)[25,45)[45,55]试估计这批小龙虾划为几等品比较合理?10.(多选)2020年2月8日,在韩国首尔举行的四大洲花样滑冰锦标赛双人自由滑比赛中,中国组合隋文静/韩聪以总分217.51分拿下四大洲赛冠军,这也是他们第六次获得四大洲冠军.中国另一对组合彭程/金杨以213.29分摘得银牌.花样滑冰锦标赛有9位评委进行评分,首先这9位评委给出某对选手的原始分数,评定该队选手的成绩时从9个原始评分中去掉一个最高分、一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变化的数字特征是()A.中位数B.平均数C.方差D.极差11.(多选)随着人民生活水平的提高,对城市空气质量的关注度也逐步增大,如图是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格天气,下面四种说法正确的是()A.1月至8月空气质量合格天数超过20天的月份有5个B.第二季度与第一季度相比,空气质量合格天数的比重下降了C.8月是空气质量最好的一个月D.6月的空气质量最差12.某快递网点收取快递费用的标准是重量不超过1kg的包裹收费10元,重量超过1kg 的包裹,除收费10元之外,超过1kg的部分,每超出1kg(不足1kg,按1kg计算)需要再收费5元.该公司近60天每天揽件数量的频率分布直方图如图所示(同一组数据用该区间的中点值作代表).(1)求这60天每天包裹数量的平均数和中位数;(2)该快递网点负责人从收取的每件快递的费用中抽取5元作为工作人员的工资和网点的利润,剩余的作为其他费用.已知该网点有工作人员3人,每人每天工资100元,以样本估计总体,试估计该网点每天的利润有多少元?13.记样本x 1,x 2,…,x m 的平均数为x -,样本y 1,y 2,…,y n 的平均数为y -(x -≠y -).若样本x 1,x 2,…,x m ,y 1,y 2,…,y n 的平均数为z -=14x -+34y -,则mn的值为()A .3B .4C .14D .1314.某校有高中生2000人,其中男女生比例约为5∶4,为了获得该校全体高中生的身高信息,采取了以下两种方案:方案一:采用比例分配的分层随机抽样方法,抽收了样本量为n 的样本,得到如图所示的频数分布表和频率分布直方图.方案二:采用分层随机抽样方法,抽取了男、女生样本量均为25的样本,计算得到男生样本的均值为170,方差为16,女生样本的均值为160,方差为20.身高(单位:cm)[145,155)[155,165)[165,175)[175,185)[185,195]频数mpq64(1)根据图表信息,求n ,q 并补充完整频率分布直方图,估计该校高中生的身高均值;(同一组中的数据以这组数据所在区间中点的值为代表)(2)计算方案二中总样本的均值及方差;(3)计算两种方案总样本均值的差,并说明用方案二总样本的均值作为总体均值的估计合适吗?为什么?课时过关检测(六十五)用样本的数字特征估计总体【解析版】1.数据1,2,3,4,5,6的60%分位数为()A .3B .3.5C .3.6D .4解析:D由6×60%=3.6,所以数据1,2,3,4,5,6的60%分位数是第四个数,故选D .2.若数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为()A .x -和s 2B .2x -+3和4s 2C .2x -+3和s 2D .2x -+3和4s 2+12s +9解析:B原数据乘以2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数和方差分别是2x -+3和4s 2.3.为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2019年1月至2020年7月的调查数据得出的中国仓储指数,绘制出如下折线图.根据该折线图,下列结论正确的是()A .2019年各月的仓储指数最大值是在3月份B .2020年1月至7月的仓储指数的中位数为55C .2020年1月与4月的仓储指数的平均数为52D .2019年1月至4月的仓储指数相对于2020年1月至4月,波动性更大解析:D2019年各月的仓储指数最大值是在11月份,所以A 错误;由题图可知,2020年1月至7月的仓储指数的中位数约为53,所以B 错误;2020年1月与4月的仓储指数的平均数约为51+552=53,所以C 错误;由题图可知,2019年1月至4月的仓储指数比2020年1月至4月的仓储指数波动更大,故选D .4.已知样本甲:x 1,x 2,x 3,…,x n 与样本乙:y 1,y 2,y 3,…,y n ,满足y i =2x 3i +1(i =1,2,…,n ),则下列叙述中一定正确的是()A .样本乙的极差等于样本甲的极差B .样本乙的众数大于样本甲的众数C .若某个x i 为样本甲的中位数,则y i 是样本乙的中位数D .若某个x i 为样本甲的平均数,则y i 是样本乙的平均数解析:C ∵y i =2x 3i +1,∴y i 关于x i 单调递增,甲样本极差为x n -x 1,乙样本极差为y n-y 1=2(x 3n -x 31)=2(x n -x 1)(x 2n +x n x 1+x 21),两个数据大小关系不定,∴样本乙的极差不一定等于样本甲的极差,A 错误;样本乙的众数不一定大于样本甲的众数,B 错误;若x i 为样本甲的平均数,y i 不一定是样本乙的平均数,D 错误;若x i 为样本甲的中位数时,则y i 一定是样本乙的中位数,C 正确.5.已知样本x 1,x 2,…,x n 的平均数为x ,样本y 1,y 2,…,y m 的平均数为y (x ≠y ),若样本x 1,x 2,…,x n ,y 1,y 2,…,y m 的平均数z =ax +(1-a )y ,其中0<a <12,则n ,m (n ,m ∈N *)的大小关系为()A .n =mB .n ≥mC .n <mD .n >m解析:C 由题意得z =1n +m (nx +my )=n n +mx ,∴a =n n +m,∵0<a <12,∴0<n n +m <12,又n ,m ∈N *,∴2n <n +m ,∴n <m .故选C .6.(多选)甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表:班级参加人数中位数方差平均数甲55149191135乙55151110135下列结论中,正确的是()A .甲、乙两班学生成绩的平均水平相同B .乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)C .甲班的成绩波动情况比乙班的成绩波动大D .甲班成绩的众数小于乙班成绩的众数解析:ABC甲、乙两班成绩的平均数都是135,故两班成绩的平均水平相同,∴A 正确;s 2甲=191>110=s 2乙,∴甲班成绩不如乙班稳定,即甲班成绩波动较大,∴C 正确;甲、乙两班人数相同,但甲班成绩的中位数为149,乙班成绩的中位数为151,从而易知乙班每分钟输入汉字数≥150个的人数要多于甲班,∴B 正确;由题表看不出两班学生成绩的众数,∴D 错误.7.(多选)某篮球爱好者在一次篮球训练中,需进行五轮投篮,每轮投篮5次.统计各轮投进球的个数,获知其前四轮投中的个数分别为2,3,4,4,则第五轮结束后,下列数字特征有可能发生的是()A .平均数为3,极差是3B .中位数是3,极差是3C .平均数为3,方差是0.8D .中位数是3,方差是0.56解析:BCD2+3+4+4=13,①若平均数为3,则第五轮投中的个数为2,所以极差为4-2=2,方差为15×[(2-3)2×2+(3-3)2+(4-3)2×2]=0.8,即选项A 错误,C 正确;②若中位数为3,则第五轮投中的个数为0或1或2或3,当投中的个数为0时,极差为4,平均数为2.6,方差为15×[(0-2.6)2+(2-2.6)2+(3-2.6)2+(4-2.6)2×2]=2.24;当投中的个数为1时,极差为3,平均数为2.8,方差为15×[(1-2.8)2+(2-2.8)2+(3-2.8)2+(4-2.8)2×2]=1.36;当投中的个数为2时,极差为2,方差为0.8;当投中的个数为3时,极差为2,平均数为3.2,方差为15×[(2-3.2)2+(3-3.2)2×2+(4-3.2)2×2]=0.56,即选项B 和D 均正确.故选B 、C 、D .8.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为________,方差为_________.解析:∵-1,0,4,x,7,14的中位数为5,∴4+x2=5,∴x =6,∴这组数据的平均数是-1+0+4+6+7+146=5,这组数据的方差是16×(36+25+1+1+4+81)=743.答案:57439.某经销商从外地一水殖厂购进一批小龙虾,并随机抽取40只进行统计,按重量分类统计结果如图:(1)估计这批小龙虾重量的第10百分位数与第90百分位数;(2)该经销商将这批小龙虾分成三个等级,如表:等级三等品二等品一等品重量/克[5,25)[25,45)[45,55]试估计这批小龙虾划为几等品比较合理?解:(1)因为40×10%=4,所以第10百分位数为第4项与第5项的平均数,在[5,15)范围内约为5+152=10.因为40×90%=36,所以第90百分位数为第36项与第37项的平均数,在[35,55]范围内,约为35+552=45,所以估计这批小龙虾重量的第10百分位数为10,第90百分位数为45.(2)由(1)知,这批小龙虾重量集中在[10,45]范围内,所以划为二等品比较合理.10.(多选)2020年2月8日,在韩国首尔举行的四大洲花样滑冰锦标赛双人自由滑比赛中,中国组合隋文静/韩聪以总分217.51分拿下四大洲赛冠军,这也是他们第六次获得四大洲冠军.中国另一对组合彭程/金杨以213.29分摘得银牌.花样滑冰锦标赛有9位评委进行评分,首先这9位评委给出某对选手的原始分数,评定该队选手的成绩时从9个原始评分中去掉一个最高分、一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变化的数字特征是()A .中位数B .平均数C .方差D .极差解析:BCD因为7个有效评分是9个原始评分中去掉一个最高分、一个最低分,所以中位数不变,平均数、方差、极差可能发生变化,所以可能变化的数字特征是平均数、方差、极差,故选B 、C 、D .11.(多选)随着人民生活水平的提高,对城市空气质量的关注度也逐步增大,如图是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格天气,下面四种说法正确的是()A .1月至8月空气质量合格天数超过20天的月份有5个B .第二季度与第一季度相比,空气质量合格天数的比重下降了C .8月是空气质量最好的一个月D .6月的空气质量最差解析:ABC1月至8月空气质量合格天数超过20天的月份有:1月,2月,6月,7月,8月,共5个,所以A 是正确的;第一季度合格天数的比重为22+26+1931+29+31≈0.7363,第二季度合格天数的比重为19+13+2530+31+30≈0.6264,所以第二季度与第一季度相比,空气质量合格的天数的比重下降了,所以B 是正确的;8月空气质量合格天气达到30天,是空气质量最好的一个月,所以C 是正确的;5月空气质量合格天气只有13天,5月份的空气质量最差,所以D 是错误的,故选A 、B 、C .12.某快递网点收取快递费用的标准是重量不超过1kg 的包裹收费10元,重量超过1kg 的包裹,除收费10元之外,超过1kg 的部分,每超出1kg(不足1kg ,按1kg 计算)需要再收费5元.该公司近60天每天揽件数量的频率分布直方图如图所示(同一组数据用该区间的中点值作代表).(1)求这60天每天包裹数量的平均数和中位数;(2)该快递网点负责人从收取的每件快递的费用中抽取5元作为工作人员的工资和网点的利润,剩余的作为其他费用.已知该网点有工作人员3人,每人每天工资100元,以样本估计总体,试估计该网点每天的利润有多少元?解:(1)每天包裹数量的平均数为0.1×50+0.1×150+0.5×250+0.2×350+0.1×450=260(件),因为[0,200)的频率为0.2,[200,300)的频率为0.5,中位数为200+0.5-0.20.5×100=260(件),所以该网点每天包裹的平均数和中位数都为260件.(2)由(1)可知平均每天的揽件数为260件,利润为260×5-3×100=1000(元),所以该网点平均每天的利润有1000元.13.记样本x 1,x 2,…,x m 的平均数为x -,样本y 1,y 2,…,y n 的平均数为y -(x -≠y -).若样本x 1,x 2,…,x m ,y 1,y 2,…,y n 的平均数为z -=14x -+34y -,则mn的值为()A .3B .4C .14D .13解析:D由题意知x 1+x 2+…+x m =m x -,y 1+y 2+…+y n =n y -,z -=(x 1+x 2+…+x m )+(y 1+y 2+…+y n )m +n =m x -+n y -m +n =m x -m +n +n y -m +n =14x -+34y -,所以m m +n =14,n m +n =34,可得3m =n ,所以m n =13.14.某校有高中生2000人,其中男女生比例约为5∶4,为了获得该校全体高中生的身高信息,采取了以下两种方案:方案一:采用比例分配的分层随机抽样方法,抽收了样本量为n 的样本,得到如图所示的频数分布表和频率分布直方图.方案二:采用分层随机抽样方法,抽取了男、女生样本量均为25的样本,计算得到男生样本的均值为170,方差为16,女生样本的均值为160,方差为20.身高(单位:cm)[145,155)[155,165)[165,175)[175,185)[185,195]频数mpq64(1)根据图表信息,求n ,q 并补充完整频率分布直方图,估计该校高中生的身高均值;(同一组中的数据以这组数据所在区间中点的值为代表)(2)计算方案二中总样本的均值及方差;(3)计算两种方案总样本均值的差,并说明用方案二总样本的均值作为总体均值的估计合适吗?为什么?解:(1)因为身高在区间[185,195]的频率为0.008×10=0.08,频数为4,所以样本量n =40.08=50,m =0.008×10×50=4,p =0.04×10×50=20,q =50-4-20-6-4=16,所以身高在[165,175)的频率为1650=0.32,小矩形的高为0.032,所以身高在[175,185)的频率为650=0.12,小矩形的高为0.012,由此补全频率分布直方图:由频率分布直方图可知样本的身高均值为(150×0.008+160×0.04+170×0.032+180×0.012+190×0.008)×10=167.2,所以由样本估计总体可知,估计该校高中生的身高均值为167.2.(2)把男生样本记为x 1,x 2,x 3,…,x 25,其均值为x -,方差为s 2x ,把女生样本记为y 1,y 2,y 3,…,y 25,其均值为y -,方差为s 2y ,总体样本均值记为z -,方差记为s 2,所以z -=2525+25x -+2525+25y -=25×170+25×16050=165,s 2=150{25[s 2x +(x --z -)2]+25[s 2y +(y --z -)2]}=150{25[16+(170-165)2]+25[20+(160-165)2]}=43.(3)两种方案总样本均值的差为167.2-165=2.2,所以用方案二总体样本均值作为总体均值的估计不合适,原因是没有进行等比例的分层随机抽样,每个个体被抽到的可能性不同,因此代表性较差.。
2025年高考数学一轮复习-抽样方法、统计图表、用样本估计总体-专项训练【含答案】
![2025年高考数学一轮复习-抽样方法、统计图表、用样本估计总体-专项训练【含答案】](https://img.taocdn.com/s3/m/6a822b574b7302768e9951e79b89680203d86b9e.png)
2025年高考数学一轮复习-抽样方法、统计图表、用样本估计总体-专项训练基础巩固练1.(2023连云港期中)下列一组数据的第30百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6.A.3.0B.3.2C.3.3D.4.42.从某中学抽取10名同学,得到他们的数学成绩(单位:分)如下:88,85,82,92,90,92,96,92,96,98.这10名同学数学成绩的众数、中位数分别为()A.92,92B.92,96C.96,92D.92,903.(2023宿迁月考)统计某样本数据得到的频率分布直方图如图所示,已知该样本容量为300,则样本数据落在[6,14)内的频数为()A.68B.170C.204D.2404.如图,这是某市2023年国庆节假期的楼房认购量与成交量的折线图,小明同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,则下列判断正确的为()A.日成交量的中位数是16B.日成交量超过日平均成交量的有2天C.10月7日认购量的增幅大于10月7日成交量的增幅D.日认购量的方差大于日成交量的方差5.(多选题)在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.方法1:采用简单随机抽样的方法,将零件分别编号为00,01,02,…,99,用抽签法抽取20个.方法2:采用分层随机抽样的方法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.对于上述问题,下列说法正确的是()A.无论采用哪种抽样方法,这100个零件中每一个零件被抽到的可能性都是15B.采用不同的方法,这100个零件中每一个零件被抽到的可能性各不相同C.在上述两种抽样方法中,方法2抽到的样本比方法1抽到的样本更能反映总体的特征D.在上述两种抽样方法中,方法1抽到的样本比方法2抽到的样本更能反映总体的特征6.(多选题)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()甲乙A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差等于乙的成绩的极差7.在一次竞选中,规定一个人获胜的条件如下:(1)在竞选中得票最多;(2)得票数不低于总票数的一半.在计票时,周鹏得票的数据丢失.候选人赵明钱红孙华李丽周鹏得票数3001003060x如果周鹏获胜,那么周鹏的得票数x的最小值为.8.(2023盐城调研)已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为.9.某大学艺术专业400名学生参加某次测评,根据男、女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成[20,30),[30,40),…,[80,90]七组,并整理得到如图所示的频率分布直方图:(1)从样本中随机抽取一人,求其分数小于70的频率.(2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男、女生人数相等.试估计总体中男生和女生人数的比.综合提升练10.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,并得到频率分布直方图如图:则这20名工人一天生产该产品的数量的中位数为()A.65B.64C.62.5D.6011.一组数据的平均数为a,方差为b,将这组数据的每个数都乘m(m>0)后得到一组新数据,则下列说法正确的是()A.这组新数据的平均数为aB.这组新数据的平均数为a+mC.这组新数据的方差为mbD.这组新数据的方差为m2b12.(多选题)(2023徐州质检)在第一次全市高三年级统考后,数学老师为了解本班学生的本次数学考试情况,将全班50名学生的数学成绩绘制成了频率分布直方图.已知该班级学生的数学成绩(单位:分)全部介于65到145之间(满分150分),将数学成绩按如下方式分成八组:第一组[65,75),第二组[75,85),…,第八组[135,145].按上述分组方法得到的频率分布直方图的一部分如图所示,则下列结论正确的是()A.第七组的频率为0.008B.该班级数学成绩的中位数的估计值为101C.该班级数学成绩的平均分的估计值大于95D.该班级数学成绩的方差的估计值大于2613.已知甲、乙两组数据如下表所示,其中a,b∈N*,若甲、乙两组数据的平均数相等,要使甲组数据的方差小于乙组数据的方差,则(a,b)为.(只需填一组)甲12ab10乙12471114.某校从高一年级中随机抽取部分学生,将他们的期末数学测试成绩分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]6组加以统计,得到如图所示的频率分布直方图.据此统计,期末数学测试成绩不少于第60百分位数的分数至少为.15.6月17日是联合国确定的“世界防治荒漠化和干旱日”,为增强全社会对防治荒漠化的认识与关注,聚焦联合国2030年可持续发展目标——实现全球土地退化零增长.自2004年以来,我国荒漠化和沙化状况呈现整体遏制、持续缩减、功能增强、成效明显的良好态势.治理沙漠离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值及众数、中位数.(2)已知树高为185cm及以上的是可以移栽的合格树苗.①求合格树苗的平均高度(结果精确到个位);②从样本中按分层抽样的方法抽取20株树苗进一步研究,不合格树苗、合格树苗分别应抽取多少株?创新应用练16.某小区毗邻一条公路,为了解交通噪声,有关部门连续25天监测噪声值(单位:分贝),得到频率分布直方图(图1),发现噪声污染严重,采取了在公路旁加装隔声板等治理措施,而后,再连续25天监测噪声值,得到频率分布直方图(图2).图1图2同一组中的数据用该组区间的中点值作代表,请解答下列问题:(1)根据上面两个频率分布直方图,估计治理后比治理前的平均噪声值降低了分贝.(2)国家“城市区域环境噪声”规定:重度污染:>65分贝;中度污染:60~65分贝;轻度污染:55~60分贝;较好:50~55分贝;好:≤50分贝.把上述两个样本数据的频率视为概率,根据图1估算出该小区噪声治理前一年内(365天)噪声中度污染及以上的天数为277,根据图2估计一年内(365天)噪声中度污染及以上的天数比治理前减少了天.(精确到1天)参考答案1.C2.A3.C4.D5.AC6.BCD7.4908 839.解(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从样本中随机抽取一人,其分数小于70的频率为0.4.(2)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60 12=30,所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比为60∶40=3∶2.所以根据分层抽样原理,估计总体中男生和女生人数的比为3∶2.10.C11.D12.BCD13.(4,8)或(5,7)或(6,6)或(7,5)或(8,4)(填其中一个即可)14.7415.解(1)∵(0.0015+0.0110+0.0225+0.0300+a+0.0080+0.0020)×10=1,∴a=0.0250.众数为185+1952=190.设中位数为x,∵(0.0015+0.0110+0.0225)×10=0.35<0.5,(0.0015+0.0110+0.0225+0.030)×10=0.65>0.5,∴185<x<195,(0.0015+0.0110+0.0225)×10+0.030(x-185)=0.5,∴x=190.(2)∵树苗高度为185cm及以上的频率是(0.0300+0.0250+0.0080+0.0020)×10=0.65, =[190×(0.030×10)+200×(0.0250×10)+210×(0.0080×10)+220×(0.002 0×10)]÷0.65≈197(cm).(3)应抽取不合格的树苗20×0.35=7(株),合格的树苗20×0.65=13(株),故不合格树苗、合格树苗分别应抽取7株和13株.16.(1)2.56(2)138。
高三一轮复习第八章 第二节用样本估计总体
![高三一轮复习第八章 第二节用样本估计总体](https://img.taocdn.com/s3/m/fe82341c82c4bb4cf7ec4afe04a1b0717fd5b30d.png)
课时作业1.(2022·毛坦厂中学月考)一个容量为32的样本,已知某组样本的频率为0.375,则该组样本的频数为( )A.4 B.8C.12 D.16【答案】 C2.(2022·西藏拉萨中学月考)某次知识竞赛中,四个参赛小队的初始积分都是10分,在答题过程中,各小队每答对1题加0.5分,若答题过程中四个小队答对的题数分别是3道,7道,7道,3道,则四个小队积分的方差为( )A.0.5 B.0.75C.1 D.1.25【解析】 四个小队积分分别为11.5,13.5,13.5,11.5,平均数为11.5+13.5+13.5+11.54=12.5,故四个小队积分的方差为14[(11.5-12.5)2×2+(13.5-12.5)2×2]=1,故选C.【答案】 C3.(2022·龙岩质检)党的十八大以来,脱贫攻坚取得显著成绩.2013年至2016年4年间,累计脱贫5 564万人,2017年各地根据实际进行创新,精准、高效地完成了脱贫任务.某地区对当地3 000户家庭的2017年所的年收入情况调查统计,年收入的频率分布直方图如图所示,数据(单位:千元)的分组依次为[20,40),[40,60),[60,80),[800,100],则年收入不超过6万的家庭大约为( )A.900户B.600户C.300户D.150户【解析】 由频率分布直方图可得年收入不超过6万的家庭的概率为:(0.005+0.01)×20=0.3,所以年收入不超过6万的家庭大约为:3 000×0.3=900,故选A.【答案】 A4.(2022·江苏模拟)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.在这些用户中,用电量落在区间[150,250]内的户数为( )A.48 B.52C.60 D.70【解析】 由题意可知,这些用户中,用电量落在区间[150,250]内的频率为1-(0.002 4+0.003 6+0.002 4+0.001 2)×50=0.52,所以用电量落在区间[150,250]内的户数为100×0.52=52,故选D.【答案】 D5.(多选) (2022·江苏模拟)已知数据x1,x2,…,x n的平均数为,标准差为s,则( ) A.数据x21,x2,…,x2n的平均数为,标准差为s2B.数据2x1,2x2,…,2x n的平均数为,标准差为2sC.数据x1+2,x2+2,…,x n+2的平均数为x+2,方差为s2D.数据2x1-2,2x2-2,…,2x n-2的平均数为-2,方差为2s2【解析】 取x1=1,x2=3,则=2,x21=1,x2=9,=5,故,A错误;数据2x1,2x2,…,2x n的平均数为2x,标准差为2s,B正确;数据x1+2,x2+2,…,x n+2的平均数为x+2,方差为s2,C正确;数据2x1-2,2x2-2,…,2x n-2的平均数为2x-2,方差为4s2,D错误.故选BC.【答案】 BC6.(多选)(2022·石家庄五校联考)下图统计了截止到2019年年底中国电动汽车充电桩细分产品占比及保有量情况,关于这5次统计,下列说法错误的是( )A.私人类电动汽车充电桩保有量增长率最高的年份是2018年B.公共类电动汽车充电桩保有量的中位数是25.7万台C.公共类电动汽车充电桩保有量的平均数为23.12万台D.从2017年开始,我国私人类电动汽车充电桩占比均超过50%【解析】 私人类电动汽车充电桩保有量增长率最高的年份是2016年,A错误;这5次统计的公共类电动汽车充电桩保有量的中位数是21.4万台,B错误;因为4.9+14.1+21.4+30+44.7=23.02,故C项错误,D项显然正确.故选:ABC.5【答案】 ABC7.某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其平均数和方差分别为x 和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为( )【解析】 因为每个数据都加上100,所以平均数也增加100,而离散程度应保持不变,即方差不变.【答案】 D8.(2022·宁夏长庆中学)某校为了了解全校高中学生十一小长假参加实践活动的情况,抽查了100名学生,统计他们假期参加实践活动的时间,绘成的频率分布直方图如图所示,估计这100名学生参加实践活动时间的中位数是( )A.7.2 B.7.16C.8.2 D.7【解析】 因为在频率分布直方图中,中位数两侧的面积相等,所以0.04×2+0.12×2+(x-6)×0.15=0.5,可解出x=7.2,故选A.【答案】 A9.(2022·泉州质检)已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为,方差为s2,则( )【解析】 分别根据数据的平均数和方差的计算公式,求得x,s2的值,即可得到答案.由题意,可得=70×50+80-60+70-9050=70,设收集的48个准确数据分别记为x1,x2, (x48)则75=150[(x1-70)2+(x2-70)2+…+(x48-70)2+(60-70)2+(90-70)2]=150[(x1-70)2+(x2-70)2+…+(x48-70)2+500],s2=150[(x1-70)2+(x2-70)2+…+(x48-70)2+(80-70)2+(70-70)2]=150[(x1-70)2+(x2-70)2+…+(x48-70)2+100]<75,所以s2<75.故选A.【答案】 A10.(多选)(2022·重庆模拟)2020年12月31日,我国第一支新冠疫苗“国药集团中国生物新冠灭活疫苗”获得国家药监局批准附条件上市,保护率为79.34%,中和抗体阳转率为99.52%,该疫苗将面向全民免费.所谓疫苗的保护率,是通过把人群分成两部分,一部分称为对照组,即注射安慰剂;另一部分称为疫苗组,即注射疫苗来进行的.当从对照组和疫苗组分别获得发病率后,就可以计算出疫苗的保护率=(对照组发病率-疫苗组发病率)/对照组发病率×100%.关于注射疫苗,下列说法正确的是( )A.只要注射了新冠疫苗,就一定不会感染新冠肺炎B.新冠疫苗的高度阳转率,使得新冠肺炎重症感染的风险大大降低C.若对照组10 000人,发病100人;疫苗组2 000人,发病80人,则保护率为60% D.若某疫苗的保护率为80%,对照组发病率为50%,那么在1 000个人注射了该疫苗后,一定有1 000个人发病【解析】 显然选项A错误,对于选项B:新冠疫苗的阳转率高说明有高滴度的抗体,当感染新冠肺炎后,肺炎症状将会大大降低,进而减少重症率,所以选项B正确,对于选项C:由保护率的计算公式可得:对照组和疫苗组的发病率分别为1%,0.4%,代入可得保护率为60%,所以选项C正确,对于选项D:虽然根据公式算出样本中疫苗组的发病率为10%,但实际是否会发病是随机事件,所以选项D错误.【答案】 BC11.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为________.【解析】 由题意知15(a+0+1+2+3)=1,解得a=-1,所以样本方差为s2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.【答案】 212.(2022·西城一模)在一次体育水平测试中,甲、乙两校均有100名学生参加,其中:甲校男生成绩的优秀率为70%,女生成绩的优秀率为50%;乙校男生成绩的优秀率为60%,女生成绩的优秀率为40%.对于此次测试,给出下列三个结论:①甲校学生成绩的优秀率大于乙校学生成绩的优秀率;②甲、乙两校所有男生成绩的优秀率大于甲、乙两校所有女生成绩的优秀率;③甲校学生成绩的优秀率与甲、乙两校所有学生成绩的优秀率的大小关系不确定.其中,所有正确结论的序号是________.【解析】 不能确定甲乙两校的男女比例,故①不正确;因为甲乙两校的男生的优秀率均大于女生成绩的优秀率,故甲、乙两校所有男生成绩的优秀率大于甲、乙两校所有女生成绩的优秀率,故②正确;因为不能确定甲乙两校的男女比例,故不能确定甲校学生成绩的优秀率与甲、乙两校所有学生成绩的优秀率的大小关系,故③正确.【答案】 ②③13.(2022·顺德二模)为了解某市公益志愿者的年龄分布情况,有关部门通过随机抽样,得到如图的频率分布直方图.(1)求a的值,并估计该市公益志愿者年龄的平均数(同一组中的数据用该组区间的中点值作代表);(2)根据世界卫生组织确定新的年龄分段,青年是指年龄15~44岁的年轻人.据统计,该市人口约为300万人,其中公益志愿者约占总人口的40%.试根据直方图估计该市青年公益志愿者的人数.【解】 (1)∵(0.005+0.01+0.02+a+0.025+0.01)×10=1,∴a=0.03该市公益志愿者的平均年龄:=20×0.05+30×0.1+40×0.2+50×0.3+60×0.25+70×0.1=49(2)由频率分布直方图可得年龄15~44岁的频率为:(0.005+0.01+0.02×910)×10=0.33,∴估计该市青年公益志愿者的人数为:300×40%×0.33=39.6(万) 14.(2022·临沂三模)某地教育主管部门对所管辖的学校进行年终督导评估,为了解某学校师生对学校教学管理的满意度,分别从教师和不同年级的学生中随机抽取若干师生,进行评分(满分100分),绘制如下频率分布直方图,并将分数从低到高分为四个等级:满意度评分低于 60分 60分到 79分 80分到 89分 90分及 以上 满意度等级 不满意基本 满意满意 非常满意 已知满意度等级为基本满意的有136人.(1)求表中a 的值及不满意的人数;(2)从等级为不满意师生中按评分分层抽取6人了解不满意的原因,并从6人中选取2人担任整改监督员,求2人中恰有1人评分在[40,50)的概率;(3)若师生的满意指数不低于0.8,则该校可获评“教学管理先进单位”,根据你所学的统计知识,判断是否能获奖,并说明理由.(注:满意指数=满意程度的平均分100) 【解】 (1)由频率和为1,得(0.002+0.004+0.014+0.020+a +0.025)×10=1,解得a =0.035,设不满意的人数为x ,则(0.002+0.004)∶(0.014+0.020)=x ∶136, 解得x=24;(2)按评分分层抽取6人,应在评分在[40,50)的师生中抽取2人,分别记作A、B,在评分在[50,60)的师生中抽取4人,分别记为c、d、e、f,从这6人中选2人的所有基本事件为AB、Ac、Ad、Ae、Af、Bc、Bd、Be、Bf、cd、ce、cf、de、df、ef共15种,其中恰有1人评分在[40,50)包含的基本事件为Ac、Ad、Ae、Af、Bc、Bd、Be、Bf共8种,记“2人中恰有1人的评分在[40,50)”为事件A,则P(A)=8 15;(3)师生的满意指数为1100×(45×0.02+55×0.04+65×0.14+75×0.2+85×0.35+95×0.25)=0.807;师生的满意指数不低于0.8,可获评“教学管理先进单位”.。
【赢在微点】高三数学(文)一轮复习练习:10-3用样本估计总体(含答案解析)
![【赢在微点】高三数学(文)一轮复习练习:10-3用样本估计总体(含答案解析)](https://img.taocdn.com/s3/m/293f807b1fd9ad51f01dc281e53a580216fc5077.png)
【赢在微点】高三数学(文)一轮复习练习:10-3用样本估计总体(含答案解析)配餐作业(五十九) 用样本估计总体一、选择题1.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100]。
若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60解析:根据频率分布直方图,低于60分的同学所占频率为:(0.005+0.01)×20=0.3,故该班的学生人数为150.3=50,故选B 。
答案:B2.某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A.x ,s 2+1002B.x +100,s 2+1002C.x ,s 2D.x +100,s 2解析:方法一:对平均数和方差的意义深入理解可巧解。
因为每个数据都加上了100,故平均数也增加100,而离散程度应保持不变,故选D 。
方法二:由题意知x 1+x 2+…+x n =n x ,s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],则所求均值y =1n [(x 1+100)+(x 2+100)+…+(x n +100)]=1n(n x +n×100)=x +100,而所求方差s′2=1n [(x 1+100-y )2+(x 2+100-y )2+…+(x n +100-y )2]=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=s 2,故选D 。
答案:D3.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是据北京某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的中位数较低的是()A.甲、乙相等B.甲C.乙D.无法确定解析:由茎叶图可得甲地浓度的中位数为0.066,乙地浓度的中位数为0.062,因此乙地浓度的中位数较低。
新教材高考数学一轮复习54用样本估计总体训练含解析新人教B版
![新教材高考数学一轮复习54用样本估计总体训练含解析新人教B版](https://img.taocdn.com/s3/m/028bbe76daef5ef7bb0d3c5b.png)
新教材高考数学一轮复习:五十四 用样本估计总体(建议用时:45分钟)A 组 全考点巩固练1.某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图如图所示.由图可知,这10天最低气温的80%分位数是( )A .-2B .0C .1D .2D 解析:由折线图可知,这10天的最低气温按照从小到大排列为-3,-2,-1,-1,0,0,1,2,2,2.因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的80%分位数是2+22=2. 2.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60B 解析:由频率分布直方图知低于60分的频率为(0.010+0.005)×20=0.3.所以该班学生人数n =150.3=50. 3.(2020·河北衡水高三模拟)某学校对100间学生公寓的卫生情况进行综合评比,依考核分数分为A ,B ,C ,D 四个等级,其中分数在[60,70)为D 等级;分数在[70,80)为C 等级;分数在[80,90)为B 等级;分数在[90,100]为A 等级.考核评估后,得其频率分布折线图如图所示,估计这100间学生公寓评估得分的平均数是()A.80.25 B.80.45C.80.5 D.80.65C解析:由折线图可知,A等级分数在[90,100]频率为0.025×10=0.25;B等级分数在[80,90)频率为0.020×10=0.20;C等级分数在[70,80)频率为0.040×10=0.40;D等级分数在[60,70)频率为0.015×10=0.15.平均数为65×0.15+75×0.40+85×0.20+95×0.25=80.5.故选C.4.(2020·滨州模拟)随着我国经济实力的不断提升,居民收入也在不断增加.某家庭2018年全年的收入与2014年全年的收入相比增加了一倍,实现翻番.同时该家庭的消费结构随之也发生了变化,现统计了该家庭这两年不同品类的消费额占全年总收入的比例,得到了如下折线图,则()A.该家庭2018年食品的消费额是2014年食品的消费额的一半B.该家庭2018年教育医疗的消费额与2014年教育医疗的消费额相当C.该家庭2018年休闲旅游的消费额是2014年休闲旅游的消费额的五倍D.该家庭2018年生活用品的消费额是2014年生活用品的消费额的两倍C解析:选项A中,2018年食品消费占0.2,2014年食品消费占0.4,因2018年全年的收入与2014年全年的收入相比增加了一倍,所以两年的食品消费额相当,故A项错误.选项B中,2018年教育医疗消费占0.2,2014年教育医疗消费占0.2,因2018年全年的收入与2014年全年的收入相比增加了一倍,所以2018年教育医疗消费额是2014年的两倍,故B项错误.选项C 中,2018年休闲旅游消费占0.25,2014年休闲旅游消费占0.1,因2018年全年的收入与2014年全年的收入相比增加了一倍,所以2018年休闲旅游消费消费额是2014年的五倍,故C 项正确.选项D 中,2018年生活用品消费占0.3,2014年生活用品消费占0.15,因2018年全年的收入与2014年全年的收入相比增加了一倍,所以2018年生活用品消费额是2014年的四倍,故D 项错误.5.(多选题)疫苗的研制需要经过临床试验阶段,抗体产生的初次应答和再次应答两个阶段都需经过一定的潜伏期,潜伏期长短与抗原的性质有关.疫苗经5~7天,类毒素在2~3周后,血液中才出现抗体,初次应答所产生的抗体量一般不多,持续时间也较短,从抗体出现的种类来看,IgM(免疫球蛋白M)出现最早,但消失也快,在血液中只维持数周至数月.IgG(免疫球蛋白G)出现稍迟于IgM ,当IgM 接近消失时,IgG 达高峰,它在血液中维持时间可达数年之久.当第二次接受相同抗原时,机体可出现再次反应,开始时抗体有所下降,这是因为原有抗体被再次进入的抗原结合所致.如图是某种疫苗试验得到的有关测试数据绘制出的图形,则下列关于该图形说法正确的是( AC )A .初次抗原刺激阶段,在10天内试验个体对抗原刺激不够灵敏,产生IgG 的浓度比较低B .初次抗原刺激阶段,IgG 峰值出现早于IgM 峰值C .再次抗原刺激阶段,总抗体量大概8天左右达到峰值,且潜伏期比初次抗原刺激阶段要短D .在试验的两个阶段IgG 的峰值出现比IgM 出现最早,但IgG 消失也快6.某校女子篮球队7名运动员身高(单位:cm)的数据分别为171,172,17x,174,175,180,181.已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰.如果把其末位数字记为x ,那么x 的值为________.2 解析:170+17×(1+2+x +4+5+10+11)=175,17×(33+x )=5,即33+x =35,解得x =2.7.一组样本数据的频率分布直方图如图所示,估计此样本数据的50%分位数为________.1009解析:样本数据低于10的比例为(0.08+0.02)×4=0.40,样本数据低于14的比例为0.4+0.09×4=0.40+0.36=0.76,所以此样本数据的50%分位数在[10,14]内,估计此样本数据的50%分位数为10+0.10.36×4=1009. B 组 新高考培优练8.(2021·深圳月考)已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为s 2,则( )A.x =70,s 2<75B.x =70,s 2>75C.x >70,s 2<75D.x <70,s 2>75A 解析:由题意,根据平均数的计算公式,可得x =70×50+80-60+70-9050=70. 设收集的48个准确数据分别记为x 1,x 2,…,x 48,则75=150[(x 1-70)2+(x 2-70)2+…+(x 48-70)2+(60-70)2+(90-70)2] =150[(x 1-70)2+(x 2-70)2+…+(x 48-70)2+500], s 2=150[(x 1-70)2+(x 2-70)2+…+(x 48-70)2+(80-70)2+(70-70)2] =150[(x 1-70)2+(x 2-70)2+…+(x 48-70)2+100]<75,故s 2<75.故选A. 9.(多选题)(2020·泰安一模)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,则( )注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.A .互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B .互联网行业中从事技术岗位的人数超过总人数的20%C .互联网行业中从事运营岗位的人数90后比80前多D .互联网行业中从事技术岗位的人数90后比80后多ABC 解析:选项A ,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术和运营岗位的人数占比分别为39.6%和17%,则“90后”从事技术和运营岗位的人数占总人数的56%×(39.6%+17%)≈31.7%.“80前”和“80后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,故选项A 正确.选项B ,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术岗位的人数占比为39.6%,则“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%.“80前”和“80后”中必然也有从事技术岗位的人,则总的占比一定超过20%,故选项B 正确.选项C ,“90后”从事运营岗位的人数占总人数的比为56%×17%≈9.5%,大于“80前”的总人数所占比3%,故选项C 正确.选项D ,“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%,“80后”的总人数占比为41%,条件中未给出从事技术岗位的占比,故不能判断,所以选项D 错误.10.(2020·海淀模拟)已知样本x 1,x 2,…,x n 的平均数为x ,样本y 1,y 2,…,y m 的平均数为y (x ≠y ).若样本x 1,x 2,…,x n ,y 1,y 2,…,y m 的平均数z =ax +(1-a )y ,其中0<a <12,则n ,m (n ,m ∈N *)的大小关系为( )A .n =mB .n ≥mC .n <mD .n >mC 解析:由题意得z =1n +m (nx +my )=n n +m x +⎝ ⎛⎭⎪⎫1-n n +m y ,所以a =n n +m. 因为0<a <12,所以0<n n +m <12. 又n ,m ∈N *,所以2n <n +m ,所以n <m .11.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值.由测量结果得如下频数分布表:质量指标[75,85)[85,95)[95,105)[105,115)[115,125] 值分组频数62638228(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表).(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)样本数据的频率分布直方图如图所示.(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.。
2023届高考数学一轮复习作业用样本估计总体新人教B版
![2023届高考数学一轮复习作业用样本估计总体新人教B版](https://img.taocdn.com/s3/m/2805b2f9b8f3f90f76c66137ee06eff9aef84960.png)
用样本估计总体一、选择题1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A.45 B.50 C.55 D.60B [由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.∴该班学生人数n==50.]2.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数8.38.88.88.7方差s23.53.62.25.4从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( )A.甲 B.乙 C.丙 D.丁C [由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好.]3.王明同学随机抽查某市10个小区所得到的绿化率情况如下表所示:小区绿化率(%)225332小区个数2431则关于这10个小区绿化率情况,下列说法错误的是( )A.方差是13% B.众数是25%C.中位数是25% D.平均数是26.2%A [根据表格数据,众数为25%,选项B正确;中位数为25%,选项C正确;平均数为=26.2,选项D正确;方差为[2(20-26.2)2+4(25-26.2)2+3(30-26.2)2+(32-26.2)2]=15.96,选项A错误.]4.在“我爱你,中国”为主题的演讲比赛中,七位评委对甲参赛选手的评分如图茎叶图所示,去掉一个最高分和一个最低分,所剩数据的方差为( )A. B. C. D.C [由茎叶图可知评委打出的最低分78,最高分94.其余得分为85,85,85,87,88,故平均分为(85+85+85+87+88)÷5=86,方差为[3×(85-86)2+(87-86)2+(88-86)2]=.]5.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[0,5),[5,10),[10,15),[15,20),[20,25),[25,30),[30,35),[35,40]时,所作的频率分布直方图如图所示,则原始茎叶图可能是( )A BC DA [由频率分布直方图可知,[0,5)的频数为20×0.01×5=1,[5,10)的频数为20×0.01×5=1,[10,15)的频数为20×0.04×5=4,[15,20)的频数为20×0.02×5=2,[20,25)的频数为20×0.04×5=4,[25,30)的频数为20×0.03×5=3,[30,35)的频数为20×0.03×5=3,[35,40]的频数为20×0.02×5=2,则对应的茎叶图为A.]6.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下列结论不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半A [设新农村建设前经济收入的总量为x,则新农村建设后经济收入的总量为2x.建设前种植收入为0.6x,建设后种植收入为0.74x,故A不正确;建设前其他收入为0.04x,建设后其他收入为0.1x,故B正确;建设前养殖收入为0.3x,建设后养殖收入为0.6x,故C正确;建设后养殖收入与第三产业收入的总和占建设后经济收入总量的58%,故D正确.]二、填空题7.某水产养殖场利用100个网箱养殖水产品,收获时测量各箱水产品的产量(单位:kg),其频率分布直方图如图所示,则该养殖场有 个网箱产量不低于50 kg.82 [由频率分布直方图,可知不低于50 kg的频率为:(0.040+0.070+0.042+0.012)×5=0.82,所以网箱个数:0.82×100=82.]8.(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 .0.98 [经停该站高铁列车所有车次的平均正点率的估计值为=0.98.]9.甲、乙两组数据如下表所示,其中a,b∈N*,若甲、乙两组数据的平均数相等,要使甲组数据的方差小于乙组数据的方差,则(a,b)为 .(只需填一组)甲12a b 1 0乙12471 1(4,8)或(5,7)或(6,6)或(7,5)或(8,4)(填其中一个即可) [由题意1+2+a+b+10=1+2+4+7+11,所以a+b=12,平均数为5,甲组数据的方差小于乙组数据的方差,所以(1-5)2+(2-5)2+(a-5)2+(b-5)2+(10-5)2<(1-5)2+(2-5)2+(4-5)2+(7-5)2+(11-5)2,即(a-5)2+(b-5)2<16.所以(a,b)=(4,8)或(5,7)或(6,6)或(7,5)或(8,4).故答案为:(4,8)或(5,7)或(6,6)或(7,5)或(8,4)(填其中一个即可).]三、解答题10.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.93.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.41.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?[解](1)设A药观测数据的平均数为,B药观测数据的平均数为,由观测结果可得=×(0.6+1.2+2.7+1.5+2.8+1.8+2.2+2.3+3.2+3.5+2.5+2.6+1.2+2.7+1.5+2.9+3.0+3.1+2.3+2.4)=2.3,=×(3.2+1.7+1.9+0.8+0.9+2.4+1.2+2.6+1.3+1.4+1.6+0.5+1.8+0.6+2.1+1.1+2.5+1.2+2.7+0.5)=1.6.由以上计算结果可得>,因此可看出A药的疗效更好.(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎“2.”“3.”上,而B药疗效的试验结果有的叶集中在茎“0.”“1.”上,由此可看出A药的疗效更好.11.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.[解](1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.1.如图是追踪调查200个某种电子元件寿命(单位:h)所得到的频率分布直方图,其中300 h~400 h,400 h~500 h两组数据丢失,下面四个说法中有且只有一个与原数据相符,这个说法是( )①寿命在300 h~400 h的频数是90;②寿命在400 h~500 h所对应的矩形的面积是0.2;③用频率分布直方图估计该种电子元件的平均寿命为(150×0.1+250×0.15+350×0.45+450×0.15+550×0.15)h;④寿命超过400 h的频率为0.3.A.① B.② C.③ D.④B [若①正确,则300 h~400 h对应的频率为0.45,400 h~500 h对应的频率为0.15,则②错误,电子元件的平均寿命约为(150×0.1+250×0.15+350×0.45+450×0.15+550×0.15)h,则③正确,寿命超过400 h的频率为0.15+0.15=0.3,则④正确,故不符合题意;若②正确,则300 h~400 h对应的频率为0.4,则①错误,电子元件的平均寿命约为(150×0.1+250×0.15+350×0.4+450×0.2+550×0.15)h,则③错误,寿命超过400 h的频率为0.2+0.15=0.35,则④错误,故符合题意.故选B.]2.气象意义上从春季进入夏季的标志为“连续5天的日平均温度均不低于22 ℃”.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数,单位:℃):①甲地:5个数据的中位数为24,众数为22;②乙地:5个数据的中位数为27,总体均值为24;③丙地:5个数据中有1个数据是32,总体均值为26,总体方差为10.8.其中肯定进入夏季的地区有( )A.①②B.①③C.②③D.①②③B [甲地的5个数据的中位数为24,众数为22,则甲地连续5天的日平均温度的记录数据中必有22,22,24,其余2天的记录数据大于24,且不相等,故甲地符合进入夏季的标准.乙地的5个数据的中位数为27,总体均值为24,当5个数据为19,20,27,27,27时,其连续5天的日平均温度中有低于22 ℃的,此时乙地不符合进入夏季的标准.丙地的5个数据中有1个数据是32,总体均值为26,设其余4个数据分别为x1,x2,x3,x4,则总体方差s2=×[(32-26)2+(x1-26)2+(x2-26)2+(x3-26)2+(x4-26)2]=7.2+[(x1-26)2+(x2-26)2+(x3-26)2+(x4-26)2].若x1≤21,则s2≥7.2+5=12.2,即s2>10.8,不满足题意,所以x1,x2,x3,x4均大于或等于22,故丙地符合进入夏季的标准.综上所述,肯定进入夏季的地区有①③.故选B.]3.某小区为了让居民了解更多垃圾分类的知识,对500名小区居民进行了培训,并进行了培训结果测试,从中随机抽取50名居民的成绩(单位:分),按照[50,60),[60,70),…,[90,100]分成5组,并制成了如图所示的频率分布直方图,则下列结论正确的是 (填序号).①所抽取的50名居民成绩的平均数约为74②所抽取的50名居民成绩的中位数约为75③所抽取的50名居民成绩的众数约为65、75④参加培训的居民中约有100人的成绩不低于85分①④ [由频率分布直方图可得,成绩在[80,90)内的频率为1-(0.01+0.03+0.03+0.01)×10=0.2,则x=0.02.故可估计所抽取的50名居民成绩的平均数为(55×0.01+65×0.03+75×0.03+85×0.02+95×0.01)×10=74,所以①正确.由频率分布直方图可知,成绩在[50,60)内的频率为0.1,成绩在[60,70)内的频率为0.3,成绩在[70,80)内的频率为0.3,所以中位数在[70,80)内.设中位数约为70+y,则0.03y=0.5-0.1-0.3=0.1,解得y≈3.33,所以所求中位数约为73.33,所以②错误.最高矩形是第二个、第三个(从左往右数),这两个最高矩形数据的中间值为70,所以所求众数约为70,所以③错误.由频率分布直方图可得成绩在[80,90)内的频率为0.2,则成绩在[85,90)内的频率为0.1,又成绩在[90,100]内的频率为0.1,所以参加培训的居民中成绩不低于85分的约有500×0.1+500×0.1=100(人).故④正确.]4.某单位为了了解退休职工的生活情况,对50名退休职工做了一次问卷调查(满分100分),并从中随机抽取了10名退休职工的问卷,得分情况统计如下:分数77798184889293人数1113211试回答以下问题:(1)求抽取的10名退休职工问卷得分的均值和方差s2;(2)10名退休职工问卷得分在-s与+s之间有多少人?这些人占10名退休职工的百分比为多少?(3)若用样本估计总体,则50名退休职工中问卷得分在(80,90)之间的人数大约为多少?[解](1)==85,s2=[(77-85)2+(79-85)2+(81-85)2+3×(84-85)2+2×(88-85)2+(92-85)2+(93-85)2]=25.(2)由(1)知,s=5,从而-s=80,+s=90,于是10名职工问卷得分在-s与+s之间有6人,所占百分比为60%.(3)由(2)可知,50名退休职工中问卷调查得分在(80,90)之间的大约有50×0.6=30人.1.近年来,我国国内文化和旅游市场潜力不断释放,大众出游热情持续高涨,行业发展整体呈好的趋势,以下为2011-2019年我国国内旅游收入情况统计图.根据统计图,下列结论正确的是( )A.与2018年相比,2019年国内旅游收入增幅约为19.61%B.2011-2019年国内旅游收入的中位数为3.3万亿元C.2011-2019年国内旅游收入的平均数约为3.5万亿元D.若每年国内旅游收入y(万亿元)与年份x线性相关,且满足y=b(x-2 010)+1.205,则估计2020年的国内旅游收入为7.2万亿元A [选项A,由图可知,2019年国内旅游收入比2018年增长了1万亿元,增幅约为×100%≈0.196 1×100%=19.61%,故A选项正确.选项B,将2011-2019年这九年的国内旅游收入的金额按照由小到大的顺序排列,可得中位数是3.4万亿元,故B选项不正确.选项C,2011-2019年国内旅游收入的平均数约为≈3.69(万亿元),故C选项不正确.选项D,由题意可得==2 015,将(2 015,3.69)代入y=b(x-2 010)+1.205,得5b+1.205=3.69,可得b=0.497,所以y=0.497(x-2 010)+1.205,将x=2 020代入,可得y=6.175,D选项不正确.]2.随着“互联网+交通”模式的迅猛发展,“共享自行车”在很多城市相继出现.某“共享自行车”运营公司为了了解某地区用户对该公司所提供的服务的满意度,随机调查了40名用户,得到用户的满意度评分如下:用系统抽样法从40名用户中抽取容量为10的样本,且在第一分段里随机抽到的评分数据为92.(1)请你列出抽到的10个样本的评分数据;(2)计算所抽到的10个样本的均值和方差s2;(3)在(2)的条件下,若用户的满意度评分在(-s,+s)之间,则满意度等级为“A级”.试应用样本估计总体的思想,估计该地区满意度等级为“A级”的用户所占的百分比是多少?(精确到0.1%)参考数据:≈5.48,≈5.74,≈5.92.[解](1)由题意得,通过系统抽样分别抽取编号为4,8,12,16,20,24,28,32,36,40的评分数据为样本,则样本的评分数据分别为92,84,86,78,89,74,83,78,77,89.(2)由(1)中样本的评分数据可得=(92+84+86+78+89+74+83+78+77+89)=83,则有s2=[(92-83)2+(84-83)2+(86-83)2+(78-83)2+(89-83)2+(74-83)2+(83-83)2+(78-83)2+(77-83)2+(89-83)2]=33.(3)由题意知用户的满意度评分在(83-,83+)即(77.26,88.74)之间满意度等级为“A级”.由(1)中样本容量为10的样本评分在(77.26,88.74)之间的用户有5人,则该地区满意度等级为“A级”的用户所占的百分比约为×100%=50.0%.。
2023届高考数学一轮复习作业用样本估计总体北师大版
![2023届高考数学一轮复习作业用样本估计总体北师大版](https://img.taocdn.com/s3/m/f4f9426d2f3f5727a5e9856a561252d380eb20a1.png)
用样本估计总体一、选择题1.(2021·全国卷甲)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间C[对于A:根据频率分布直方图知该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1=0.06,正确;对于B:根据频率分布直方图知该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1=0.10,正确;对于C:根据频率分布直方图知该地农户家庭年收入的平均值估计为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),错误;对于D:根据频率分布直方图知该地农户家庭年收入介于4.5万元至8.5万元之间的农户比率估计为(0.10+0.14+0.20+0.20)×1=0.64,正确.]2.(2019·全国卷Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )A.0.5 B.0.6 C.0.7 D.0.8C[根据题意阅读过《红楼梦》《西游记》的人数用韦恩图表示如下:所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.]3.某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A -结伴步行,B -自行乘车,C -家人接送,D -其他方式.并将收集的数据整理绘制成如下两幅不完整的统计图.根据图中信息,本次抽查的学生中A 类人数是( )A .30B .40C .42D .48A [由条形统计图知,B -自行乘车上学的有42人,C -家人接送上学的有30人,D -其他方式上学的有18人,采用B ,C ,D 三种方式上学的共90人,设A -结伴步行上学的有x 人,由扇形统计图知,A -结伴步行上学与B -自行乘车上学的学生占60%,所以x +42x +90=60100,解得x =30,故选A .]4.如图是某样本数据的茎叶图,则该样本的中位数、众数、极差分别是( )A .32 34 32B .33 45 35C .34 45 32D .33 36 35B [由茎叶图知,该样本的众数为45,极差为47-12=35,样本数据共有16个,从小到大排列,第8个数据为32,第9个数据为34,因此样本的中位数为33.故选B .]5.某商场在国庆黄金周的促销活动中,对10月1日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为3万元,则9时至14时的销售总额为( )A.10万元B.12万元C.15万元D.30万元D[9时至10时的销售额频率为0.1,因此9时至14时的销售总额为30.1=30(万元),故选D.]二、填空题6.从某企业的某种产品中抽取1 000件,测量该种产品的一项质量指标值,由测量结果得到如图所示的频率分布直方图,假设这项指标在[185,215]内,则这项指标合格,估计该企业这种产品在这项指标上的合格率为________.79%[指标值在[185,215]内的频率为(0.022+0.024+0.033)×10=0.79,故合格率为79%.]7.从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下:甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数.甲:________;乙:________;丙:________.众数平均数中位数[甲厂数据的众数是8,乙厂数据的平均数是8,丙厂数据的中位数是8.]8.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为________.367[由茎叶图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4.故s 2=17×[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.]三、解答题9.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:成绩分组 频数 频率 平均分 [0,20) 30.01516 [20,40) ab32.1 [40,60) 250.125 55 [60,80) c0.5 74 [80,100]620.3188(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.[解] (1)由题意可得,b =1-(0.015+0.125+0.5+0.31)=0.05,a =200×0.05=10,c =200×0.5=100.(2)根据已知及(1)所求,在抽出的200人的数学成绩中,及格的有162人, 所以P =162200=0.81.(3)这次数学测验样本的平均分为x =16×3+32.1×10+55×25+74×100+88×62200=73,所以这次数学测验的年级平均分大约为73分.10.某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,[0.2,[0.3,[0.4,[0.5,[0.6,0.2) 0.3)0.4) 0.5)0.6) 0.7) 频数1324926 5使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数15131016 5(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)[解](1)如图所示.(2)根据题表中数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=150(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x2=150(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.(0.48-0.35)×365=47.45(m3).估计使用节水龙头后,一年可节省47.45 m3水.1.随着我国经济实力的不断提升,居民收入也在不断增加.某家庭2018年全年的收入与2014年全年的收入相比增加了一倍,实现翻番.同时该家庭的消费结构随之也发生了变化,现统计了该家庭这两年不同品类的消费额占全年总收入的比例,得到了如下折线图:则下列结论中正确的是( )A.该家庭2018年食品的消费额是2014年食品的消费额的一半B.该家庭2018年教育医疗的消费额与2014年教育医疗的消费额相当C.该家庭2018年休闲旅游的消费额是2014年休闲旅游的消费额的五倍D.该家庭2018年生活用品的消费额是2014年生活用品的消费额的两倍C[设该家庭2014年全年收入为a,则2018年全年收入为2a.对于A,2018年食品消费额为0.2×2a=0.4a,2014年食品消费额为0.4a,故两者相等,A不正确.对于B,2018年教育医疗消费额为0.2×2a=0.4a,2014年教育医疗消费额为0.2a,故B不正确.对于C,2018年休闲旅游消费额为0.25×2a=0.5a,2014年休闲旅游消费额为0.1a,故C正确.对于D,2018年生活用品的消费额为0.3×2a=0.6a,2014年生活用品的消费额为0.15a,故D不正确.]2.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x,方差为s2,则( )A.x=70,s2<75 B.x=70,s2>75C.x>70,s2<75 D.x<70,s2>75A[由题意,可得x=70×50+80-60+70-9050=70,设收集的48个准确数据分别记为x1,x2, (x48)则75=150[(x1-70)2+(x2-70)2+…+(x48-70)2+(60-70)2+(90-70)2]=150[(x1-70)2+(x2-70)2+…+(x48-70)2+500],s2=150[(x1-70)2+(x2-70)2+…+(x48-70)2+(80-70)2+(70-70)2]=150[(x1-70)2+(x2-70)2+…+(x48-70)2+100]<75,所以s2<75.故选A.]3.已知数据x1,x2,…,x n的平均数x=5,方差s2=4,则数据3x1+7,3x2+7,…,3x n+7的平均数为________,标准差为________.22 6[数据3x1+7,3x2+7,…,3x n+7的平均数为3×5+7=22,方差为32×4=36,则标准差为6.]4.某种产品的质量按照其质量指标值M进行等级划分,具体如下表:质量指标值M M<8080≤M<110M≥110 等级三等品二等品一等品现从某企业生产的这种产品中随机抽取了100件作为样本,对其质量指标值M进行统计分析,得到如图所示的频率分布直方图.(1)记A表示事件“一件这种产品为二等品或一等品”,试估计事件A的概率;(2)已知该企业的这种产品每件一等品、二等品、三等品的利润分别为10元、6元、2元,试估计该企业销售10 000件该产品的利润;(3)根据该产品质量指标值M的频率分布直方图,求质量指标值M的中位数的估计值.(精确到0.01)[解](1)记B表示事件“一件这种产品为二等品”,C表示事件“一件这种产品为一等品”,则事件B,C互斥,且由频率分布直方图估计P(B)=0.2+0.3+0.15=0.65,P(C)=0.1+0.09=0.19,又P(A)=P(B+C)=P(B)+P(C)=0.84,所以事件A的概率估计为0.84.(2)由(1)知,任取一件产品是一等品、二等品的概率估计值分别为0.19,0.65,故任取一件产品是三等品的概率估计值为0.16,从而10 000件产品估计有一等品、二等品、三等品分别为1 900,6 500,1 600件, 故利润估计为1 900×10+6 500×6+1 600×2=61 200元. (3)因为在产品质量指标值M 的频率分布直方图中, 质量指标值M <90的频率为0.06+0.1+0.2=0.36<0.5, 质量指标值M <100的频率为0.06+0.1+0.2+0.3=0.66>0.5, 故质量指标值M 的中位数估计值为90+0.5-0.360.03≈94.67.1.近年来,我国国内文化和旅游市场潜力不断释放,大众出游热情持续高涨,行业发展整体呈好的趋势,以下为2011-2019年我国国内旅游收入情况统计图.根据统计图,下列结论正确的是( )A .与2018年相比,2019年国内旅游收入增幅约为19.61%B .2011-2019年国内旅游收入的中位数为3.3万亿元C .2011-2019年国内旅游收入的平均数约为3.5万亿元D .若每年国内旅游收入y (万亿元)与年份x 线性相关,且满足y ^=b ^(x -2 010)+1.205,则估计2020年的国内旅游收入为7.2万亿元A [选项A ,由图可知,2019年国内旅游收入比2018年增长了1万亿元,增幅约为15.1×100%≈0.196 1×100%=19.61%,故A 选项正确.选项B ,将2011-2019年这九年的国内旅游收入的金额按照由小到大的顺序排列,可得中位数是3.4万亿元,故B 选项不正确.选项C ,2011-2019年国内旅游收入的平均数约为1.9+2.3+2.6+3.3+3.4+3.9+4.6+5.1+6.19≈3.69(万亿元),故C 选项不正确.选项D ,由题意可得x =2 011+2 012+2 013+2 014+2 015+2 016+2 017+2 018+2 0199=2 015,将(2 015,3.69)代入y ^=b ^(x -2 010)+1.205,得5b +1.205=3.69,可得b ^=0.497,所以y ^=0.497(x -2 010)+1.205,将x =2 020代入,可得y ^=6.175,D 选项不正确.]2.随着“互联网+交通”模式的迅猛发展,“共享自行车”在很多城市相继出现.某“共享自行车”运营公司为了了解某地区用户对该公司所提供的服务的满意度,随机调查了40名用户,得到用户的满意度评分如下:据为92.(1)请你列出抽到的10个样本的评分数据; (2)计算所抽到的10个样本的均值x 和方差s 2;(3)在(2)的条件下,若用户的满意度评分在(x -s ,x +s )之间,则满意度等级为“A 级”.试应用样本估计总体的思想,估计该地区满意度等级为“A 级”的用户所占的百分比是多少?(精确到0.1%)参考数据:30≈5.48,33≈5.74,35≈5.92.[解] (1)由题意得,通过系统抽样分别抽取编号为4,8,12,16,20,24,28,32,36,40的评分数据为样本,则样本的评分数据分别为92,84,86,78,89,74,83,78,77,89.(2)由(1)中样本的评分数据可得x =110(92+84+86+78+89+74+83+78+77+89)=83,则有s 2=110[(92-83)2+(84-83)2+(86-83)2+(78-83)2+(89-83)2+(74-83)2+(83-83)2+(78-83)2+(77-83)2+(89-83)2]=33.(3)由题意知用户的满意度评分在(83-33,83+33)即(77.26,88.74)之间满意度等级为“A级”.由(1)中样本容量为10的样本评分在(77.26,88.74)之间的用户有5人,则该地区满意度等级为“A级”的用户所占的百分比约为510×100%=50.0%.。
考点专练54:用样本估计总体—2023届高考数学一轮复习(新高考)
![考点专练54:用样本估计总体—2023届高考数学一轮复习(新高考)](https://img.taocdn.com/s3/m/c9bcbf9a8662caaedd3383c4bb4cf7ec4afeb600.png)
考点专练54:用样本估计总体一、选择题1.某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图如图所示.由图可知,这10天最低气温的第80百分位数是()A.-2B.0C.1D.22.PM2.5是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即PM2.5日均值在35 μg/m3以下空气质量为一级,在35~75 μg/m3空气质量为二级,超过75 μg/m3为超标.如图是某地12月1日至10日的PM2.5(单位:μg/m3)的日均值,则下列说法正确的是()A.这10天中有2天空气质量为一级B.从6日到9日PM2.5日均值逐渐降低C.这10天中PM2.5日均值的中位数是55D.这10天中PM2.5日均值的平均数是453.已知一组数据x1,x2,…,x n的平均数为a,标准差为s.若2x1-1,2x2-1,…,2x n-1的平均数与方差相等,则s2-a2的最大值为()A.-1B.-12C.-14 D.-3164.为了解学生的身体状况,某校随机抽取了一批学生测量体重.经统计,这批学生的体重数据(单位:千克)全部介于45至70之间.将数据分成5组,并得到如图所示的频率分布直方图.图中a的值为()A.0.04B.0.2C.0.03D.0.055.甲组数据为5,12,16,21,25,37,乙组数据为1,6,14,18,38,39,则甲、乙的平均数、极差及中位数相同的是()A.极差B.平均数C.中位数D.都不相同6.若样本数据x1,x2,…,x10标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为()A.8B.64C.32D.167.袁隆平是中国杂交水稻事业的开创者,是“当代神农”,致力于杂交水稻技术的研究、应用与推广,为人类运用科技手段战胜饥饿带来了绿色的希望和金色的收获.袁老的科研团队发现“野败”后,将其带回实验,在试验田中随机抽取了100株水稻统计每株水稻的稻穗数(单位:颗)得到如图所示的频率分布直方图(同一组中的数据用该组区间的中点值代表),则下列说法错误的是()A.a=0.01B.这100株水稻的稻穗数平均值在区间[280,300)中C.这100株水稻的稻穗数的众数是250D.这100株水稻的稻穗数的中位数在区间[240,260)中8.(2022·邵阳模拟)已知某旅游城市2020年前10个月的游客人数(万人)按从小到大的顺序排列如下:3,5,6,9,x,y,15,17,18,21.若该组数据的中位数为13,则该组数据的平均数为()A.12B.10.7C.13D.159.(多选)在某地区某传染病流行期间,为了建设指标显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各项中,一定符合上述指标的是()A.平均数x≤3B.标准差s≤2C.平均数x≤3且极差小于或等于2D.众数等于1且极差小于或等于4二、填空题10.某校女子篮球队7名运动员身高(单位:cm)的数据分别为171,172,17x,174,175,180,181.已知记录的平均身高为175 cm,但记录中有一名运动员身高的末位数字不清晰.如果把其末位数字记为x,那么x的值为________11.一组样本数据的频率分布直方图如图所示,估计此样本数据的第50百分位数为_______12.如图是某工厂对一批新产品长度(单位:mm)检测结果的频率分布直方图,估计这批产品的平均长度为________ mm.13.某校从参加高一物理期末考试的学生中随机抽出60名,将其物理成绩(均为整数)分成六组:[40,50),[50,60),…,[90,100],并绘制成如下的频率分布直方图.由此估计此次高一物理期末考试成绩的第75百分位数为________三、解答题14.某游乐园为了吸引游客,推出了A,B两款不同的年票,游乐园每次进园门票原价为100元.A年票前12次进园门票每次费用为原价,从第13次起,每次费用为原价的一半,A 年票不需交开卡工本费.B年票每次进园门票为原价的9.5折,B年票需交开卡工本费a元(a∈N).已知某市民每年至少去该游乐园11次,最多不超过14次.该市民多年来年进园记录如表:年进园次数11 12 13 14频率0.15 0.40 0.10 0.35(1)(2)若该市民使用A年票,求该市民在进园门票上年花费的平均数;(3)从该市民在进园门票上年花费的平均数来看,若选择A年票比选择B年票更优惠,求a 的最小值.15.(2021·运城期末)某种产品的质量以其质量指标值m衡量,并按照质量指标值m划分等级如表:质量指标值m m<85 85≤m<105 m≥105等级三等品二等品一等品现在从某企业生产的这种产品中随机抽取了200件作为样本,检验其质量指标值m,得到的频率分布直方图如图所示(每组只含最小值,不含最大值).(1)求第75百分位数(精确到0.1).(2)在样本中,按照产品等级用比例分配的分层随机抽样的方法抽取8件产品,则这8件产品中,一等品的件数是多少?(3)将频率视为概率,已知该企业的这种产品中每件一等品的利润是10元,每件二等品和三等品的利润都是6元,试估计该企业销售600件这种产品所获利润.16.用分层随机抽样的方法从某校高一年级学生的数学期末成绩(满分为100分,成绩都是整数)中抽取一个样本量为100的样本,其中男生成绩数据40个,女生成绩数据60个,再将40个男生成绩样本数据分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],绘制得到如图所示的频率分布直方图.(1)估计男生成绩样本数据的第80百分位数;(2)在区间[40,50)和[90,100]内的两组男生成绩样本数据中,随机抽取两个进行调查,求调查对象来自不同分组的概率;(3)已知男生成绩样本数据的平均数和方差分别为71和187.75,女生成绩样本数据的平均数和方差分别为73.5和119,求总样本的平均数和方差.参考答案:一、选择题1.D2.B3.C4.A5.B6.D7.B8.A9.CD二、填空题10.答案:211.答案:100912.答案:22.7513.答案:82三、解答题14.解:(1)由频率分布表知,该市民年进园次数的频率最大是0.40,对应的次数是12,所以估计该市民进园次数的众数为12.(2)该市民使用A年票时,在进园门票上年花费的平均数为x A=11×100×0.15+12×100×0.40+(12×100+50)×0.10+(12×100+100)×0.35=1 225.(3)该市民使用B年票时,在进园门票上年花费的平均数为x B=(11×0.15+12×0.40+13×0.10+14×0.35)×95+a=1 201.75+a,因为x A<x B,所以1 225<1 201.75+a,解得a>23.25.又a∈N,所以a的最小值为24.若选择A年票比选择B年票更优惠,则a的最小值是24.15.解:(1)由题意可得,(0.002 5+0.010 0+0.020 0+0.026 0+0.009 0+0.002 5+x)×10=1,解得x=0.030,所以产品质量在[65,105)的频率为0.625,产品质量在[65,115)的频率为0.885,则第75百分位数在[105,115)内,所以第75百分位数为105+10×0.75-0.6250.885-0.625≈109.8.(2)由频率分布直方图及等级划分规则知样本中一等品频率为:(0.026 0+0.009 0+0.002 5)×10=0.375,所以在样本中,一等品的件数为200×0.375=75,所以按照产品等级用比例分配分层随机抽样的方法抽取8件产品,应抽取一等品的件数为8×75200=3(件) (3)由(2)知,从该企业这种产品中任取一件是一等品的概率为0.375,则是二等品或三等品的概率为0.625,故该企业销售600件这种产品,所获利润约为600×(0.375×10+0.625×6)=4 500(元).16.解:(1)由频率分布直方图可知,在[40,80)内的成绩占比为70%,在[40,90)内的成绩占比为95%,因此第80百分位数一定位于[80,90)内.因为80+10×0.8-0.70.95-0.7=84,所以估计男生成绩样本数据的第80百分位数为84.(2)在区间[40,50)和[90,100]内的男生成绩样本数据分别有4个和2个,则在这6个数据中随机抽取两个的样本空间Ω包含的样本点个数为n(Ω)=15.记事件A=“调查对象来自不同分组”,则事件A包含的样本点个数为n(A)=4×2=8,所以P(A)=n(A)n(Ω)=8 15.(3)设男生成绩样本数据为x1,x2,…,x40,其平均数为x=71,方差为s2x=187.75,女生成绩样本数据为y1,y2,…,y60,其平均数为y=73.5,方差为s2y=119,总样本的平均数为z,方差为s2.由按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,得z=40100x+60100y=72.5,s2=1100{40[s2x+(x-z)2]+60[s2y+(y-z)2]}=1100{40[187.75+(71-72.5)2]+60[119+(73.5-72.5)2]}=148所以总样本的平均数和方差分别为72.5和148.。
(福建专用)高考数学一轮复习 课时规范练53 用样本估计总体 理 新人教A版-新人教A版高三全册数学
![(福建专用)高考数学一轮复习 课时规范练53 用样本估计总体 理 新人教A版-新人教A版高三全册数学](https://img.taocdn.com/s3/m/744da280d1d233d4b14e852458fb770bf78a3bb0.png)
课时规X练53 用样本估计总体一、基础巩固组1.一组数据分别为12,16,20,23,20,15,28,23,则这组数据的中位数是()A.19B.20C.21.5D.232.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数8.3 8.8 8.8 8.7方差s23.5 3.6 2.2 5.4从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是()A.甲B.乙C.丙D.丁3.(2017某某某某一模,理3)某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在()A.第3组B.第4组C.第5组D.第6组4.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为()A.2B.3C.4D.5 〚导学号21500581〛5.在某次测量中得到的甲样本数据如下:42,43,46,52,42,50,若乙样本数据恰好是甲样本每个数据都减5后所得数据,则甲、乙两个样本的下列数字特征对应相同的是()A.平均数B.标准差C.众数D.中位数6.若数据x1,x2,…,x n的平均数为,方差为s2,则2x1+3,2x2+3,…,2x n+3的平均数和方差分别为()A.和s2B.2+3和4s2C.2+3和s2D.2+3和4s2+12s+97.(2017某某某某一模)某班级有50名同学,一次数学测试平均成绩是92,如果学号为1号到30号的同学平均成绩为90,那么学号为31号到50号同学的平均成绩为.8.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]的学生人数是.9.某市运动会期间30名志愿者年龄数据如下表:年龄/岁人数/人19 721 228 330 431 532 340 6合计30(1)求这30名志愿者年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这30名志愿者年龄的茎叶图;(3)求这30名志愿者年龄的方差.〚导学号21500582〛二、综合提升组10.若一组数据2,4,6,8的中位数、方差分别为m,n,且ma+nb=1(a>0,b>0),则的最小值为()A.6+2B.4+3C.9+4D.2011.已知样本(x1,x2,…,x n)的平均数为,样本(y1,y2,…,y m)的平均数为),若样本(x1,x2,…,x n,y1,y2,…,y m)的平均数=α+(1-α),其中0<α<,则n,m的大小关系为()A.n<mB.n>mC.n=mD.不能确定12.(2017某某晋中一模,理13)设样本数据x1,x2,…,x2 017的方差是4,若y i=2x i-1(i=1,2,…,2 017),则y1,y2,…,y2 017的方差为.13.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60) [60,70) [70,80) [80,90)x∶y1∶1 2∶1 3∶4 4∶5〚导学号21500583〛三、创新应用组14.某学校随机抽取20个班,调查各班有网上购物经历的人数,所得数据的茎叶图如图所示,以5为组距将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()15.(2017某某某某一模)某校为指导学生合理选择文理科的学习,根据数理综合测评成绩,按6分为满分进行折算后,若学生成绩小于m分建议选择文科,不低于m分则建议选择理科(这部分学生称为候选理科生).现从该校高一随机抽取500名学生的数理综合成绩作为样本,整理得到分数的频率分布直方图(如图所示).(1)求直方图中t的值;(2)根据此次测评,为使80%以上的学生选择理科,整数m至多定为多少?(3)若m=4,试估计该校高一学生中候选理科学生的平均成绩.(精确到0.01)〚导学号21500584〛课时规X练53用样本估计总体1.B把该组数据按从小到大的顺序排列如下:12,15,16,20,20,23,23,28,排在中间的两个数是20,20,故这组数据的中位数为=20.故选B.2.C由题目表格中数据可知,丙的平均环数最高,且方差最小,说明丙的技术稳定,且成绩好,故选C.3.B由题图可得,前第四组的频率为(0.037 5+0.062 5+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,即中位数落在第4组,故选B.4.B依题意可得10×(0.005+0.01+0.02+a+0.035)=1,则a=0.03.所以身高在[120,130),[130,140),[140,150]三组内的学生人数比例为3∶2∶1.所以从身高在[140,150]内的学生中选取的人数应为18=3.5.B设样本甲中的数据为x i(i=1,2,…,6),则样本乙中的数据为y i=x i-5(i=1,2,…,6),则样本乙中的众数、平均数和中位数与甲中的众数、平均数和中位数都相差5,只有标准差没有发生变化,故选B.6.B原数据乘2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数、方差分别是2+3和4s2.7.95设学号为31号到50号同学的平均成绩为x,则92×50=90×30+20x,解得x=95,故答案为95.8.54成绩在[16,18]的学生人数所占比例为,所以成绩在[16,18]的学生人数为120=54.9.解 (1)众数为19,极差为21.(2)茎叶图如图.(3)年龄的平均数为=29,故这30名志愿者年龄的方差为[(19-29)2×7+2×(21-29)2+3×(28-29)2+4×(30-29)2+(31-29)2×5+(32-29)2×3+(40-29)2×6]=10.D∵数据2,4,6,8的中位数是5,方差是(9+1+1+9)=5,∴m=5,n=5.∴ma+nb=5a+5b=1(a>0,b>0).(5a+5b)=520(当且仅当a=b时等号成立),故选D.11.A由题意知样本(x1,…,x n,y1,…,y m)的平均数为又=+(1-α),即α=,1-α=因为0<α<,所以0<,即2n<m+n,所以n<m,故选A.12.16根据题意,设样本数据x1,x2,…,x2 017的平均数为,又由其方差为4,则[(x1-)2+(x2-)2+(x3-)2+…+(x2 017-)2]=4.对于数据y i=2x i-1(i=1,2,…,2 017),其平均数(y1+y2+…+y2 017)=[(2x1-1)+(2x2-1)+…+(2x2 017-1)]=2-1,其方差[(y1-)2+(y2-)2+(y3-)2+…+(y2 017-)2]=[(x1-)2+(x2-)2+(x3-)2+…+(x2 017-)2]=16,故答案为16.13.解 (1)依题意,得10(2a+0.02+0.03+0.04)=1,解得a=0.005.(2)这100名学生语文成绩的平均分为:55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73(分).(3)数学成绩在[50,60)的人数为:100×0.05=5,数学成绩在[60,70)的人数为:100×0.4=20,数学成绩在[70,80)的人数为:100×0.3=40,数学成绩在[80,90)的人数为:100×0.2=25,所以数学成绩在[50,90)之外的人数为:100-5-20-40-25=10.14.A由组距可知选项C,D不对;由茎叶图可知[0,5)有1人,[5,10)有1人,故第一、二小组频率相同,频率分布直方图中矩形的高应相等,可排除B.故选A.15.解 (1)根据频率分布直方图,得0.15×1+t×1+0.30×1+t×1+0.15×1=1,解得t=0.2.(2)为使80%以上的学生选择理科,则0.15+0.2+0.3<0.8<0.15+0.2+0.3+0.2,故满足条件的m值为2.(3)当m=4时,4.93,估计该校高一学生中候选理科学生的平均成绩为4.93分.。
高三数学一轮复习 用样本估计总体双基限时训练 理(含解析)
![高三数学一轮复习 用样本估计总体双基限时训练 理(含解析)](https://img.taocdn.com/s3/m/c0a6a7f91a37f111f0855b0e.png)
2014届高三数学一轮复习 用样本估计总体双基限时训练 理(含解析)巩固双基,提升能力一、选择题1.(2012·江西)样本(x 1,x 2,…,x n )的平均数为x ,样本(y 1,y 2,…,y m )的平均数为y (x ≠y ),若样本(x 1,x 2,…,x n ,y 1,y 2,…y m )的平均数z =αx +(1-α)y ,其中0<α<12,则n ,m 的大小关系为( )A .n <mB .n >mC .n =mD .不能确定解析:依题意得x 1+x 2+…+x n =n x ,y 1+y 2+…+y m =m y ,x 1+x 2+…+x n +y 1+y 2+…+y m =(m +n )z =(m +n )αx +(m +n )(1-α)y ,所以n x +m y =(m +n )αx +(m +n )(1-α)y ,所以⎩⎪⎨⎪⎧n =m +n α,m =m +n1-α,于是有n -m =(m +n )[α-(1-α)]=(m +n )(2α-1). 因为0<α<12,所以2α-1<0.所以n -m <0,即n <m . 答案:A2.(2012·安徽)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )甲乙A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解析:由条形图易知甲的平均数为x -甲=4+5+6+7+85=6,方差为s 2甲=-22+-12+02+12+225=2,中位数为6,极差为4;乙的平均数为x 乙=3×5+6+95=6,方差为s 2乙=3×-12+0+325=125,中位数为5,极差为4,故x 甲=x 乙,s 2乙>s 2甲,且甲的成绩的中位数大于乙的成绩的中位数,两人成绩的极差相等.答案:C3.(2013·威海质检)在一次数学测验中,统计7名学生的成绩分布茎叶图如下图所示,若这7名学生的平均成绩为77分,则x 的值为( )A.5 B .6 C .7 D .8解析:由题意知这7名同学的平均成绩为70+74+78+79+80+81+70+x 7=532+x 7=77,解得x =7.答案:C4.(2013·安徽联考)据第六次全国人口普查的数据,得到我国人口的年龄频率分布直方图如下图所示.那么在一个总人口数为300万的城市中,年龄在[20,60)之间的人口数大约有( )A.158万B.166万C.174万D.132万解析:年龄在[20,60)之间的人所占频率为:(0.018+0.011)×20=0.58,∴年龄在[20,60)之间的人大约有0.58×300=174(万),故选C.答案:C5.(2013·东北模拟)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是据北京某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的中位数较低的是( )A.甲、乙相等B.甲C.乙D.无法确定解析:由茎叶图可得甲地浓度的中位数为0.066,乙地浓度的中位数为0.062,因此乙地浓度的中位数较低.答案:C6.(2013·云南统测)某校对高三年级学生进行体验,并将高三男生的体重(kg)数据进行整理后分成五组,绘制成下图所示的频率分布直方图,如果规定,高三男生的体重结果只分偏胖、偏瘦和正常三个类型,超过65 kg 属于偏胖,低于55 kg 属于偏瘦,已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25、0.2、0.1、0.05,第二小组的频数为400.若该校高三男生的体重没有55 kg 和65 kg ,则该校高三年级的男生总数和体重正常的频率分别为( )A .1 000,0.5B .800,0.5C .800,0.6D .1 000,0.6解析:根据题意,第二小组的频率为0.4,故高三年级的男生总数为4000.4=1 000,体重位于55 kg 到65 kg 之间为正常,所求概率为0.4+0.2=0.6.答案:D 二、填空题7.(2013·安徽联考)已知x 是1,2,3,x,5,6,7这七个数据的中位数,且1,3,x ,-y 这四个数据的平均数为1,则1x+y 的最小值为__________.解析:由已知得3≤x ≤5,1+3+x -y4=1,∴y =x , ∴1x +y =1x +x ,又函数y =1x+x 在[3,5]上单调递增,∴当x =3时取最小值103.答案:1038.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95),由此得到频率分布直方图如图所示,则这20名工人中一天生产该产品数量在[55,75)的人数是__________.解析:设生产产品数量在[55,75)的人数为x,则x20=(0.040+0.025)×10,x=13.答案:139.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是__________.解析:根据样本的频率分布直方图,成绩小于60分的学生的频率为0.02+0.06+0.12=0.20,所以可推测3 000名学生中成绩小于60分的人数为600名.答案:600三、解答题10.(2013·衡阳调研)甲、乙两台机床同时生产一种零件,在10天中,两台机床每天出的次品数分别是:甲010220312 4乙 2 3 1 1 0 2 1 1 0 1分别计算两个样本的平均数与方差,从计算结果看,哪台机床10天生产中出次品的平均数较小?出次品的波动较小?解析:x 甲=110×(0×3+1×2+2×3+3×1+4×1)=1.5,x 乙=110×(0×2+1×5+2×2+3×1)=1.2,s 2甲=110×[(0-1.5)2+(1-1.5)2+(0-1.5)2+…+(2-1.5)2+(4-1.5)2]=1.65, s 22=110×[(2-1.2)2+(3-1.2)2+(1-1.2)2+…+(0-1.2)2+(1-1.2)2]=0.76. 从结果看乙台机床10天生产中出次品的平均数较小,出次品的波动也较小. 11.(2013·金华联考)下图是某市有关部门根据该市干部的月收入情况,作抽样调查后画出的样本频率分布直方图.已知图中第一组的频数为4 000,请根据该图提供的信息解答下列问题:(图中每组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500))(1)求样本中月收入在[2 500,3 500)的人数;(2)为了分析干部的收入与年龄、职业等方面的关系,必须从样本的各组中按月收入用分层抽样方法抽出100人作进一步分析,则月收入在[1 500,2 000)的这段应抽多少人?(3)试估计样本数据的中位数.解析:(1)∵月收入在[1 000,1 500)的概率为 0.000 8×500=0.4,且有4 000人, ∴样本的容量n =4 0000.4=10 000;月收入在[1 500,2 000)的频率为0.000 4×500=0.2;月收入在[2 000,2 500)的频率为0.000 3×500=0.15; 月收入在[3 500,4 000)的频率为0.000 1×500=0.05.∴月收入在[2 500,3 500)的频率为1-(0.4+0.2+0.15+0.05)=0.2. ∴样本中月收入在[2 500,3 500)的人数为0.2×10 000=2 000. (2)∵月收入在[1 500,2 000)的人数为0.2×10 000=2 000,∴再从10 000人中用分层抽样方法抽出100人,则月收入在[1 500,2 000)的这段应抽取100×2 00010 000=20(人).(3)由(1)知月收入在[1 000,2 000)的频率为0.4+0.2=0.6>0.5, ∴样本数据的中位数为1 500+0.5-0.40.000 4=1 500+250=1 750(元).12.(2013·陕西调研)某班同学利用寒假进行社会实践,对[25,55]岁的人群随机抽取n 人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:组数分组低碳族的人数占本组的频率第一组 [25,30) 120 0.6第二组 [30,35) 195 p第三组 [35,40) 100 0.5第四组 [40,45) a0.4第五组[45,50)300.3第六组 [50,55] 15 0.3(1)补全频率分布直方图并求n 、a 、p 的值;(2)从年龄段在[40,50)的“低碳族”中采用分层抽样法抽取6人参加户外低碳体验活动,其中选取2人作为领队,求选取的2名领队中恰有1人年龄在[40,45)岁的概率.解析:(1)第二组的频率为1-(0.04+0.04+0.03+0.02+0.01)×5=0.3,∴高为0.35=0.06.频率分布直方图如下:第一组的人数为1200.6=200,频率为0.04×5=0.2,∴n =2000.2=1 000.由题可知,第二组的频率为0.3,∴第二组的人数为1 000×0.3=300,∴p =195300=0.65.第四组的频率为0.03×5=0.15,∴第四组的人数为1 000×0.15=150,∴a =150×0.4=60.(2)∵[40,45)岁年龄段的“低碳族”与[45,50)岁年龄段的“低碳族”的比值为60∶30=2∶1,∴采用分层抽样法抽取6人,[40,45)岁的有4人,[45,50)岁的有2人.设[40,45)岁中的4人为a、b、c、d,[45,50)岁中的2人为m、n,则选取2人作为领队的方法有(a,b)、(a,c)、(a,d)、(a,m)、(a,n)、(b,c)、(b、d)、(b,m)、(b,n)、(c,d)、(c,m)、(c,n)、(d,m)、(d,n)、(m,n),共15种.其中恰有1人年龄在[40,45)岁的有(a,m)、(a,n)、(b,m)、(b,n)、(c,m)、(c,n)、(d,m)、(d,n),共8种.∴选取的2名领队中恰有1人年龄在[40,45)岁的概率为P=815.。
高三数学一轮巩固与练习 用样本估计总体
![高三数学一轮巩固与练习 用样本估计总体](https://img.taocdn.com/s3/m/908d1dea08a1284ac850438d.png)
巩固1.如图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,4D .85,1.6解析:选D.由茎叶图可知评委打出的最低分为79,最高分为93,其余得分为84,84,86,84,87,故平均分为84×3+86+875=85,方差为15[3×(84-85)2+(86-85)2+(87-85)2]=1.6.2.(2009年高考福建卷)一个容量为100的样本,其数据的分组A .0.13B .0.39C .0.52D .0.64解析:选C.由列表知样本数据落在(10,40]上的频数为52, 频率为0.52.3.为了了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出样本的频率分布直方图(如图),那么在这100株树木中,底部周长小于110 cm 的株数是( )A .30B .60C .70D .80解析:选C.底部周长小于110 cm 的频率:10×0.01+10×0.02+10×0.04=0.7.周长小于110 cm 的株数为:100×0.7=70.4.(原创题)在样本的频率分布直方图中,共有4个小长方形,这4个小方形的面积由小到大构成等差数列{a n },已知a 2=2a 1,且样本容量为400,则小长方形面积最大的一组的频数为________.答案:1605.(2009年高考重庆卷)从一堆苹果中任取5只,称得它们的质量为(单位:克):125 124 121 123 127则该样本标准差s =________(克)(用数字作答).解析:∵x =15(125+124+121+123+127)=124,∴s 2=15[(125-124)2+(124-124)2+(121-124)2+(123-124)2+(127-124)2]=4,∴s =2.答案:26.为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出了频率分(1)求出表中m ,n ,M ,N 所表示的数分别是多少?(2)画出频率分布直方图;(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5以上的概率.解:(1)M =10.02=50,m =50-(1+4+20+15+8)=2,N =1,n =m M =250=0.04.(2)作出直角坐标系,组距为4,纵轴表示频率/组距,横轴表示身高,画出直方图如下图.(3)在153.5~157.5范围内最多,估计身高在161.5以上的概率为P =1050=0.2.练习则该植物一年生长在[30,40)内的频率是()A.0.80B.0.65C.0.40 D.0.25解析:选C.由频率含义可计算其结果.由频率的定义得80÷(20+30+80+40+30)=0.40.2.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x等于()A.21 B.22C.23 D.24解析:选A.个数为偶数,因此中位数22=x+23 2,∴x=21.3.在2008年第29届北京奥运会上,我国代表团的金牌数雄踞榜首.如图是位居金牌榜前十二位的代表团获得的金牌数的茎叶图,则这十二个代表团获得的金牌数的平均数与中位数的差m的值为()A.3.5 B.4C.4.5 D.5解析:选B.由茎叶图中的数据可求得这十二个代表团获得的金牌数的平均数为17.5,中位数为13.5,故m=4.4.如图是甲、乙两名射击运动员各射击10次后所得到的成绩的茎叶图(茎表示成绩的整数环数,叶表示小数点后的数字),由图可知()A.甲、乙中位数的和为18.2,乙稳定性高B.甲、乙中位数的和为17.8,甲稳定性高C.甲、乙中位数的和为18.5,甲稳定性高D.甲、乙中位数的和为18.65,乙稳定性高解析:选A.求中位数时,必须先将这组数据从小到大或从大到小排列,数据的个数为奇数,则中位数是最中间的一个,若数据的个数为偶数,则中位数是最中间的两个数据的平均数,据此易知两人中位数和为18.2,又分析茎叶图可知乙数据分布比较集中,即乙的稳定性较高.5.一组数据中的每一个数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )A .81.2,4.4B .78.8,4.4C .81.2,84.4D .78.8,75.6解析:选A.设原来的平均数为x .则x -80=1.2,∴x =81.2,方差不变.6.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a ,b 的值分别为( )A .0.27,78B .0.27,83C .2.7,78D .2.7,83解析:选A.组距=0.1,4.3~4.4之间的频数为100×0.1×0.1=1.4.4~4.5之间的频数为100×0.1×0.3=3.根据前4组频数成等比数列,则4.6~4.7之间的频数为1·(31)3=27.∴最大频率a =27100=0.27.根据后6组频数成等差数列,且有100-13=87(人),设公差为d ,则6×27+6×52d =87,∴d =-5,所以b =4×27+4×32×(-5)=78.7.如图所示是一个容量为200的样本的频率分布直方图,请根据图形中的数据填空:(1)样本数据落在[5,9)内的频率是 ;(2)样本数据落在[9,13)内的频数是 .解析:该题考查频率分布直方图的意义及应用图形解题的能力.频率=频率组距×组距=0.08×4=0.32,频数=频率×样本容量=0.09×4×200=72.答案:0.32 728.(2009年高考辽宁卷)某企业3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1020 h,1032 h ,则抽取的100件产品的使用寿命的平均值为________h.解析:由于三个厂的产量比为1∶2∶1 ,所以从三个厂抽出产品比例也应为1∶2∶1.所以100件产品的使用寿命平均值为980×1+1020×2+1032×14=1013. 答案:10139.已知总体的各个体的值由小到大依次为2,3,3,7,a ,b,12,13.7,18.3,20,且总体的中位数为10.5,平均数为10.若要使该总体的方差最小,则a 、b 的取值分别是________.解析:这10个数的中位数为a +b 2=10.5.这10个数的平均数为10.要使总体方差最小,即(a-10)2+(b-10)2最小.又∵(a-10)2+(b-10)2=(21-b-10)2+(b-10)2=(11-b)2+(b-10)2=2b2-42b+221,∴当b=10.5时,(a-10)2+(b-10)2取得最小值.又∵a+b=21,∴a=10.5,b=10.5.答案:a=10.5,b=10.5(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?解:(1)众数200,中位数220,平均数x=1×2200+6×250+5×220+10×200+1×10023=300.(2)平均数受数据中的极端值的影响较大,这个平均数是从一名工资极高(是工人工资的11倍)的经理和其他四类员工的周工资计算出来的,它不能客观地反映该工厂的工资水平.11.(2009年高考安徽卷)某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,42 7,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,40 1,403,406,407,410,412,415,416,422,430(1)画出茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.解:(1)(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.12.(2009年高考宁夏、海南卷)某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类、B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数).(1)求甲、乙两工人都被抽到的概率,其中甲为A类工人,乙为B类工人;(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.生产能力分组[100,110)[110,120)[120,130)[130,140)[140,150)类工人中个体间的差异程度与B 类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)②分别估计A 类工人和B 类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).解:(1)甲、乙被抽到的概率均为110,且事件“甲工人被抽到”与事件“乙工人被抽到”相互独立,故甲、乙两工人都被抽到的概率为P =110×110=1100.(2)①由题意知A 类工人中应抽查25名,B 类工人中应抽查75名.故4+8+x +5+3=25,得x =5,6+y +36+18=75,得y =15.频率分布直方图如下:从直方图可以判断:B类工人中个体间的差异程度更小.②x A=425×105+825×115+525×125+525×135+325×145=123,x B=675×115+1575×125+3675×135+1875×145=133.8,x=25100×123+75100×133.8=131.1.A类工人生产能力的平均数、B类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.。
2021届高考数学一轮复习第九章第5讲用样本估计总体基础反馈训练(含解析)
![2021届高考数学一轮复习第九章第5讲用样本估计总体基础反馈训练(含解析)](https://img.taocdn.com/s3/m/5cadce8933d4b14e85246885.png)
基础知识反馈卡·9.5时间:20分钟分数:60分一、选择题(每小题5分,共30分)1.一组数据12,15,24,25,31,31,36,36,37,39,44,49,50的中位数是( )A.31 B.36 C.35 D.342.如果数据x1,x2,…,x n的平均数为x,方差为s2,则2x1+3,2x2+3,…,2x n+3的平均数和方差分别为( )A.x和s2 B.2x+3和4s2C.2x+3和s2 D.2x+3和4s2+12s+93.如图J951所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( )A.12.5,12.5 B.12.5,13 C.13,12.5 D.13,13图J951图J952图J953 4.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( )A.a>b>c B.b>c>a C.c>a>b D.c>b>a5.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图J952.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )A BC D6.某商场对一个月内每天的顾客人数进行统计得到如图J953所示的样本茎叶图,则该样本的中位数和众数分别是( )A.46,45 B.45,46 C.46,47 D.47,45二、填空题(每小题5分,共15分)7.如图J954是某工厂对一批新产品长度(单位:mm)检测结果的频率分布直方图,估计这批产品的平均长度为________mm.图J954图J9558.某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图J955).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是________.9.某样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为________.三、解答题(共15分)10.(2014年新课标Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?图J956基础知识反馈卡·9.51.B 2.B 3.B 4.D 5.A 6.A7.22.75 解析:根据频率分布直方图,估计这批产品的平均长度为(12.5×0.02+17.5×0.04+22.5×0.08+27.5×0.03+32.5×0.03)×5=22.75(mm).8.6009.2 解析:由a +0+1+2+35=1,得a =-1, ∴s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2. 10.解:(1)频率分布直方图如图DJ35:图DJ35(2)质量指标值的样本平均数为 x =80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s 2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104. 所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68,由于该估计值小于0.8.故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高三数学一轮复习 用样本估计总体巩固与练习1.如图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,4D .85,1.6 解析:选D.由茎叶图可知评委打出的最低分为79,最高分为93,其余得分为84,84,86,84,87,故平均分为84×3+86+875=85,方差为15[3×(84-85)2+(86-85)2+(87-85)2]=1.6. 2.(2009组别 频数(0,10] 12(10,20] 13(20,30] 24(30,40] 15(40,50] 16(50,60] 13(60,70] 7A .0.13B .0.39C .0.52D .0.64解析:选C.由列表知样本数据落在(10,40]上的频数为52,频率为0.52.3.为了了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出样本的频率分布直方图(如图),那么在这100株树木中,底部周长小于110 cm 的株数是( )A .30B .60C .70D .80解析:选C.底部周长小于110 cm 的频率:10×0.01+10×0.02+10×0.04=0.7.周长小于110 cm 的株数为:100×0.7=70.4.(原创题)在样本的频率分布直方图中,共有4个小长方形,这4个小方形的面积由小到大构成等差数列{a n },已知a 2=2a 1,且样本容量为400,则小长方形面积最大的一组的频数为________.答案:1605.(2009年高考重庆卷)从一堆苹果中任取5只,称得它们的质量为(单位:克):125 124 121 123 127则该样本标准差s=________(克)(用数字作答).解析:∵x=15(125+124+121+123+127)=124,∴s2=15[(125-124)2+(124-124)2+(121-124)2+(123-124)2+(127-124)2]=4,∴s=2.答案:26.为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行(1)求出表中m,n,M,N所表示的数分别是多少?(2)画出频率分布直方图;(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5以上的概率.解:(1)M=10.02=50,m=50-(1+4+20+15+8)=2,N=1,n=mM=250=0.04.(2)作出直角坐标系,组距为4,纵轴表示频率/组距,横轴表示身高,画出直方图如下图.(3)在153.5~157.5范围内最多,估计身高在161.5以上的概率为P =1050=0.2.练习高度(cm) [10,20) [20,30) [30,40) [40,50) [50,60)棵数 20 30 80 40 30A .0.80B .0.65C .0.40D .0.25解析:选C.由频率含义可计算其结果.由频率的定义得80÷(20+30+80+40+30)=0.40.2.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x 等于( )A .21B .22C .23D .24解析:选A.个数为偶数,因此中位数22=x +232, ∴x =21.3.在2008年第29届北京奥运会上,我国代表团的金牌数雄踞榜首.如图是位居金牌榜前十二位的代表团获得的金牌数的茎叶图,则这十二个代表团获得的金牌数的平均数与中位数的差m 的值为( )A .3.5B .4C .4.5D .5解析:选B.由茎叶图中的数据可求得这十二个代表团获得的金牌数的平均数为17.5,中位数为13.5,故m=4.4.如图是甲、乙两名射击运动员各射击10次后所得到的成绩的茎叶图(茎表示成绩的整数环数,叶表示小数点后的数字),由图可知( )A.甲、乙中位数的和为18.2,乙稳定性高B.甲、乙中位数的和为17.8,甲稳定性高C.甲、乙中位数的和为18.5,甲稳定性高D.甲、乙中位数的和为18.65,乙稳定性高解析:选 A.求中位数时,必须先将这组数据从小到大或从大到小排列,数据的个数为奇数,则中位数是最中间的一个,若数据的个数为偶数,则中位数是最中间的两个数据的平均数,据此易知两人中位数和为18.2,又分析茎叶图可知乙数据分布比较集中,即乙的稳定性较高.5.一组数据中的每一个数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( )A.81.2,4.4 B.78.8,4.4C.81.2,84.4 D.78.8,75.6解析:选A.设原来的平均数为x.则x-80=1.2,∴x=81.2,方差不变.6.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b 的值分别为( )A.0.27,78 B.0.27,83C .2.7,78D .2.7,83解析:选A.组距=0.1,4.3~4.4之间的频数为100×0.1×0.1=1.4.4~4.5之间的频数为100×0.1×0.3=3.根据前4组频数成等比数列,则4.6~4.7之间的频数为1·(31)3=27.∴最大频率a =27100=0.27.根据后6组频数成等差数列,且有100-13=87(人),设公差为d ,则6×27+6×52d =87,∴d =-5,所以b =4×27+4×32×(-5)=78. 7.如图所示是一个容量为200的样本的频率分布直方图,请根据图形中的数据填空:(1)样本数据落在[5,9)内的频率是 ;(2)样本数据落在[9,13)内的频数是 .解析:该题考查频率分布直方图的意义及应用图形解题的能力.频率=频率组距×组距=0.08×4=0.32,频数=频率×样本容量=0.09×4×200=72.答案:0.32 728.(2009年高考辽宁卷)某企业3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1020 h,1032 h ,则抽取的100件产品的使用寿命的平均值为________h.解析:由于三个厂的产量比为1∶2∶1 ,所以从三个厂抽出产品比例也应为1∶2∶1.所以100件产品的使用寿命平均值为980×1+1020×2+1032×14=1013. 答案:10139.已知总体的各个体的值由小到大依次为2,3,3,7,a ,b,12,13.7,18.3,20,且总体的中位数为10.5,平均数为10.若要使该总体的方差最小,则a 、b 的取值分别是________.解析:这10个数的中位数为a +b 2=10.5. 这10个数的平均数为10.要使总体方差最小,即(a -10)2+(b -10)2最小.又∵(a -10)2+(b -10)2=(21-b -10)2+(b -10)2=(11-b )2+(b -10)2=2b 2-42b +221,∴当b =10.5时,(a -10)2+(b -10)2取得最小值.又∵a +b =21,∴a=10.5,b=10.5.答案:a=10.5,b=10.5 10人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?解:(1)众数200,中位数220,平均数x=1×2200+6×250+5×220+10×200+1×10023=300.(2)平均数受数据中的极端值的影响较大,这个平均数是从一名工资极高(是工人工资的11倍)的经理和其他四类员工的周工资计算出来的,它不能客观地反映该工厂的工资水平.11.(2009年高考安徽卷)某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434 ,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,40 7,410,412,415,416,422,430(1)画出茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.解:(1)(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A 的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.12.(2009年高考宁夏、海南卷)某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类、B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数).(1)求甲、乙两工人都被抽到的概率,其中甲为A类工人,乙为B类工人;(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.生产能力分[100,110)[110,120)[120,130)[130,140)[140,150) 组人数48x 5 3生产能力分组[110,120)[120,130)[130,140)[140,150)人数6y 3618度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).解:(1)甲、乙被抽到的概率均为110,且事件“甲工人被抽到”与事件“乙工人被抽到”相互独立,故甲、乙两工人都被抽到的概率为P=110×110=1100.(2)①由题意知A类工人中应抽查25名,B类工人中应抽查75名.故4+8+x+5+3=25,得x=5,6+y+36+18=75,得y=15.频率分布直方图如下:从直方图可以判断:B类工人中个体间的差异程度更小.②x A=425×105+825×115+525×125+525×135+325×145=123,x B=675×115+1575×125+3675×135+1875×145=133.8,x=25100×123+75100×133.8=131.1.A类工人生产能力的平均数、B类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.。