2021年高考数学专题复习练习考点65 用样本估计总体解析版
高一数学用样本估计总体试题答案及解析
高一数学用样本估计总体试题答案及解析1.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取20人参加一项活动,则从身高在[120,130内的学生中选取的人数应为.【答案】10【解析】由频率分布直方图可得:;则[120,130),[130,140),[140,150]三组人数所占的比例为,则在[120,130内选取的人数应为.【考点】频率分布直方图.2.设的平均数是,标准差是,则另一组数的平均数和标准差分别是_________.【答案】,.【解析】另一组数的平均数为:,标准差为:,所以则另一组数的平均数和标准差分别是,.【考点】统计中的期望与方差.3.200辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,则时速在[60,70)的汽车大约( )A.30辆B.40辆C.60辆D.80辆【答案】D【解析】时速在[60,70)的频率为,故汽车大约有辆.【考点】频率分布直方图的应用.4.某校五四演讲比赛中,七位评委为一选手打出的分数如下:90 86 90 97 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.B.C.D.【答案】B【解析】由题意知,去掉一个最高分和一个最低分后,所剩数据的平均数为;方差为故选B.【考点】样本平均数和方差的计算.5.统计某校800名学生的数学期末成绩,得到频率分布直方图如图所示,若考试采用100分制,并规定不低于60分为及格,则及格率为.【答案】0.8【解析】由图形可知及格率为,答案为0.8.【考点】频率分布直方图6.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( ).A.甲B.乙C.丙D.丁【答案】C.【解析】分析表格可知,乙与丙的平均环数最多,又丙的方差比乙小说明丙成绩发挥的较为稳定,所以最佳人选为丙.【考点】数据的平均数与方差的意义.7.一次选拔运动中,测得7名选手的身高(单位:cm)分布茎叶图如图,记录的平均身高为177cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为( )A.5B.6C.7D.8【答案】D【解析】由图可知7名同学的身高分别为180、181、170、173、,178、179而7名同学的平均身高为177,所以有得=178,所以【考点】茎叶图8.由正整数组成的一组数据,其平均数和中位数都是,且标准差等于,则这组数据为 .(从小到大排列)【答案】【解析】由已知不妨假设,则,又因为标准差等于,所以,且都是正整数,观察分析可知这组数据只可为:1,1,3,3.【考点】1.平均数与中位数;2.标准差;3.方程组思想.9.某路段属于限速路段,规定通过该路段的汽车时速不得超过70km/h,否则视为违规扣分,某天有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图,如下图所示,则违规扣分的汽车大约为辆.【答案】120.【解析】易求得70-80这组的频率为1-0.05-0.18-0.38-0.27=0.12,则违规扣分的汽车大约为辆.【考点】频率分布直方图中每组对应的长方形面积为,总面积为1,频数=频率样本容量.10.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.【答案】0.04;440【解析】由频率分布直方图得:,解得;志愿者年龄在[25,35)的人数为.【考点】概率与统计.11.将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均分为91,现场做的7个得分的茎叶图(如图)后来有一个数据模糊,无法辨认,在图中用表示,则x的值为( )A.0B.4C.5D.7【答案】A【解析】如果是最高得分的话,,所以是最大值,那么,解得,故选A.【考点】茎叶图12.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差______.【答案】3.2【解析】由平均数及方差的定义可得;.【考点】样本数据的数字特征:平均值与方差.13.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图;(2)求这两个班参赛的学生人数是多少;(3)这两个班参赛学生的成绩的中位数应落在第几小组内.【答案】(1)第二小组的频率为,补全的频率分布直方图详见解析;(2)100人;(3)九年级两个班参赛学生的成绩的中位数应落在第二小组内.【解析】(1)先从所给的直方图中得出第一、三、四、五小组的频率,然后用1减去第一、三、四、五小组的频率和得到第二小组的频率,接着由确定第二小组的小长方形的高,从而可补全频率分布直方图;(2)用第二小组的频数除以该组的频率,即可计算出九年两个班参赛学生的总人数;(3)要确定中位数所在的小组,只需先确定各小组的频数,从第一小组开始累加,当和达到总人数的一半时的组就是中位数所在的小组.试题解析:(1)∵各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05∴第二小组的频率为:∴落在59.5~69.5的第二小组的小长方形的高,则补全的频率分布直方图如图所示(2)设九年级两个班参赛的学生人数为人∵第二小组的频数为40人,频率为0.40∴,解得所以这两个班参赛的学生人数为100人(3)因为0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5所以九年级两个班参赛学生的成绩的中位数应落在第二小组内【考点】1.频率分布直方图;2.转化与运算能力.14.在样本的频率分布直方图中, 共有9个小长方形, 若第一个长方形的面积为0.02, 前五个与后五个长方形的面积分别成等差数列且公差互为相反数,若样本容量为160, 则中间一组(即第五组)的频数为()A.12B.24C.36D.48【答案】C【解析】设公差为d,那么9个小长方形的面积分别为0.02,0.02+d,0.02+2d,0.02+3d,0.02+4d,0.02+3d,0.02+2d,0.02+d,0.02,而9个小长方形的面积和为 1,可得0.18+16d=1 可以求得d=∴中间一组的频数为:160×(0.02+4d)=36.故答案为:36.故选C。
人教版高中数学高考一轮复习--用样本估计总体(课件)
样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2
第2节 用样本估计总体--2025年高考数学复习讲义及练习解析
第二节用样本估计总体课标解读考向预测1.会用统计图表对总体进行估计,会求n 个数据的第p 百分位数.2.能用样本的数字特征估计总体集中趋势和总体离散程度.用样本估计总体在高考中出题频率较高,常结合频率分布直方图、样本的数字特征出题.预计2025年高考将会以与统计图表的识读、成对数据的统计分析相综合的形式呈现.必备知识——强基础1.总体百分位数的估计(1)第p 百分位数的定义一般地,一组数据的第p 百分位数是这样一个值,它使得这组数据中至少有01p %的数据小于或等于这个值,且至少有(100-p )%的数据大于或等于这个值.(2)四分位数常用的分位数有第25百分位数,第50百分位数(即中位数),第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第0225百分位数也称为第一四分位数或下四分位数,第0375百分位数也称为第三四分位数或上四分位数.2.样本的数字特征(1)众数:一组数据中04出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于05最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把06a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数.(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].3.总体平均数、方差、标准差与样本平均数、方差、标准差名称定义总体均值(总体平均数)、方差、标准差一般式:如果总体中有N个个体,它们的变量值分别为Y1,Y2,…,Y N,则称Y-=Y1+Y2+…+Y NN=1N∑Ni=1Y i为07总体均值,又称总体平均数,称S2=1N∑Ni=1(Y i-Y-)2为08总体方差,S=S2为09总体标准差加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体均值为Y-=101N∑ki=1f i Y i,总体方差为S2=111N∑ki=1f i(Y i-Y-)2样本均值(样本平均数)、方差、标准差如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,y n,则称y-=y1+y2+…+y nn=1n∑ni=1y i为12样本均值,又称样本平均数,称s2=1n∑ni=1(y i-y-)2为13样本方差,s=s2为14样本标准差说明:(1)在简单随机抽样中,我们常用样本平均数、方差、标准差去估计总体平均数、方差、标准差.(2)总体平均数、方差、标准差是一个确定的数,样本平均数、方差、标准差具有随机性(因为样本具有随机性).(3)一般情况下,样本量越大,估计越准确1.频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.平均数、方差的公式推广若数据x1,x2,…,x n的平均数为x-,方差为s2,那么mx1+a,mx2+a,mx3+a,…,mx n +a的平均数是m x-+a,方差为m2s2.1.概念辨析(正确的打“√”,错误的打“×”)(1)对一组数据来说,平均数和中位数总是非常接近.()(2)一组数据的方差越大,说明这组数据越集中.()(3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.()答案(1)×(2)×(3)√2.小题热身(1)(人教A 必修第二册习题9.2T1改编)下列一组数据的第25百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A .3.2B .3.0C .4.4D .2.5答案A解析把该组数据按照由小到大的顺序排列,可得2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i =10×25%=2.5,不是整数,得第3个数据3.2是第25百分位数.(2)(多选)(人教B 必修第二册习题5-1B T3改编)给出一组数据:1,3,3,5,5,5,下列说法正确的是()A .这组数据的极差为4B .这组数据的平均数为3C .这组数据的中位数为4D .这组数据的众数为3和5答案AC解析这组数据的极差为5-1=4,A 正确;这组数据的平均数为1+3×2+5×36=113,B 错误;这组数据的中位数为3+52=4,C 正确;这组数据的众数为5,D 错误.(3)(人教B 必修第二册练习B T4改编)某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用比例分配的分层随机抽样的方法从3个分厂生产的电子产品中共抽取100件进行使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的平均使用寿命分别为980h ,1020h ,1032h ,则抽取的100件产品的平均使用寿命为________h.答案1013解析由比例分配的分层随机抽样的知识可知,从第一、二、三分厂抽取的电子产品件数分别为25,50,25,则抽取的100件产品的平均使用寿命为1100×(980×25+1020×50+1032×25)=1013(h).(4)已知一组数据的频率分布直方图如图,则众数是________,平均数是________.答案6567解析因为最高小长方形底边中点的横坐标为65,所以众数为65;平均数x -=(55×0.030+65×0.040+75×0.015+85×0.010+95×0.005)×10=67.考点探究——提素养考点一百分位数的计算例1(1)(2023·江苏南通海安质量监测)“双减”政策实施后,学生的课外阅读增多.某班50名学生到图书馆借书数量统计如下:借书数量/本5678910频数/人58131194则这50名学生的借书数量的上四分位数是()A .8B .8.5C .9D .10答案C解析由50×75%=37.5,故第75百分位数为借书数量从小到大排序后的第38个,又5+8+13+11=37<38<5+8+13+11+9=46,故上四分位数(第75百分位数)是9.(2)某校为了了解高三年级学生的身体素质状况,在开学初举行了一场身体素质体能测试,以便对体能不达标的学生进行有针对性的训练,促进他们体能的提升,现从整个年级测试成绩中抽取100名学生的测试成绩,并把测试成绩分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组,绘制成频率分布直方图(如图所示).其中分数在[90,100]这一组内的纵坐标为a ,则该次体能测试成绩的80%分位数约为________分.答案92解析由频率分布直方图知,10×(0.002+0.004+0.014+0.020+a+0.035)=1,得a=0.025.因为0.02+0.04+0.14+0.20+0.35=0.75,所以该次体能测试成绩的80%分位数落在[90,100]内,设其为x,则由(x-90)×0.025=0.05,解得x=92.【通性通法】计算一组n个数据第p百分位数的步骤【巩固迁移】1.为了养成良好的运动习惯,某人记录了自己一周内每天的运动时长(单位:分钟),分别为53,57,45,61,79,49,x,若这组数据的第80百分位数与第60百分位数的差为3,则x =()A.58或64B.59或64C.58D.59答案A解析将已知的6个数从小到大排序为45,49,53,57,61,79.若x≤57,则这组数据的第80百分位数与第60百分位数分别为61和57,它们的差为4,不符合条件;若x≥79,则这组数据的第80百分位数与第60百分位数分别为79和61,它们的差为18,不符合条件;若57<x<79,则这组数据的第80百分位数与第60百分位数分别为x和61(或61和x),则|x-61|=3,解得x=58或x=64.故选A.2.(2024·安徽十校联考)学校组织班级知识竞赛,某班的8名学生的成绩(单位:分)分别是68,63,77,76,82,88,92,93,则这8名学生成绩的75%分位数是()A.88分B.89分C.90分D.92分答案C解析8名学生的成绩从小到大排列为63,68,76,77,82,88,92,93,因为8×75%=6,所以75%分位数为第6个数和第7个数的平均数,即12×(88+92)=90(分).考点二总体集中趋势的估计例2(1)(2024·山东临沂模拟)10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则()A.a>b>c B.c>b>aC.c>a>b D.b>c>a答案B解析将生产的件数由小到大排列为10,12,14,14,15,15,16,17,17,17,a=110×(15+17+14+10+15+17+17+16+14+12)=14.7,b=15,c=17.因此c>b>a.故选B.(2)(多选)(2023·湖北荆州中学模拟)某公司为提高职工政治素养,对全体职工进行了一次时事政治测试,随机抽取了100名职工的成绩,并将其制成如图所示的频率分布直方图,以样本估计总体,则下列结论中正确的是()A.该公司职工的测试成绩不低于60分的人数约占总人数的80%B.该公司职工测试成绩的中位数约为70分C.该公司职工测试成绩的平均值约为68分D.该公司职工测试成绩的众数约为60分答案BC解析对于A,该公司职工的测试成绩不低于60分的频率为(0.02+0.015)×20=0.70,∴该公司职工的测试成绩不低于60分的人数约占总人数的70%,故A错误;对于B,测试成绩在[20,60)的频率为(0.005+0.01)×20=0.3,测试成绩在[60,80)的频率为0.02×20=0.4,∴该公司职工测试成绩的中位数约为60+0.5-0.30.4×20=70分,故B 正确;对于C ,该公司职工测试成绩的平均值约为x -=30×0.005×20+50×0.01×20+70×0.02×20+90×0.015×20=68分,故C 正确;对于D ,该公司职工测试成绩的众数约为60+802=70分,故D 错误.故选BC.【通性通法】频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:各组区间的中点值与对应频率之积的和.【巩固迁移】3.某市市民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w =3时,估计该市居民该月的人均水费.解(1)如题图所示,用水量在[0.5,2)的频率为(0.2+0.3+0.4)×0.5=0.45,用水量在[0.5,3)的频率为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于2立方米的频率为0.45,用水量小于等于3立方米的频率为0.85,又w 为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w 至少定为3.(2)当w =3时,该市居民该月的人均水费估计为(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=10.5(元).即当w =3时,该市居民该月的人均水费估计为10.5元.考点三总体离散程度的估计例3甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.解(1)x -甲=18×(82+81+79+78+95+88+93+84)=85,x -乙=18×(92+95+80+75+83+80+90+85)=85,s 2甲=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,s 2乙=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41.(2)由(1)知x -甲=x -乙,s 2甲<s 2乙,甲的成绩较稳定,所以派甲参赛比较合适.【通性通法】标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.【巩固迁移】4.(2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为x i ,y i (i =1,2,…,10).试验结果如下:试验序号i 12345678910伸缩率x i545533551522575544541568596548伸缩率y i536527543530560533522550576536记z i =x i -y i (i =1,2,…,10),z 1,z 2,…,z 10的样本平均数为z -,样本方差为s 2.(1)求z -,s 2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果z -≥2s 210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).解(1)x -=110×(545+533+551+522+575+544+541+568+596+548)=552.3,y -=110×(536+527+543+530+560+533+522+550+576+536)=541.3,z -=x --y -=552.3-541.3=11,z i =x i -y i 的值分别为9,6,8,-8,15,11,19,18,20,12,故s 2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)由(1)知,z -=11,2s 210=2 6.1=24.4,故有z -≥2s 210,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.考点四分层随机抽样的均值与方差例4为调查某地区中学生每天的睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间的均值为9小时,方差为0.5,抽取高中生1200人,其每天睡眠时间的均值为8小时,方差为1,则估计该地区中学生每天睡眠时间的方差为________.答案 1.04解析该地区中学生每天睡眠时间的平均数为8001200+800×9+12001200+800×8=8.4(小时),该地区中学生每天睡眠时间的方差为8001200+800×[0.5+(9-8.4)2]+12001200+800×[1+(8-8.4)2]=1.04.【通性通法】在分层随机抽样中,如果第一层的样本量为m ,平均值为x -,方差为s 21;第二层的样本量为n ,平均值为y -,方差为s 22,则样本的平均值为w -=m x -+n y -m +n,样本的方差为s 2=1m +n {m [s 21+(x --w -)2]+n [s 22+(y --w -)2]}.特别地,在比例分配的分层随机抽样中,我们可以直接用样本平均数w -估计总体平均数W -,用样本方差s 2估计总体方差S 2.【巩固迁移】5.(2023·安徽宣城模拟)某学校有男生400人,女生600人,为调查该校全体学生每天运动时间的情况,按照男女比例通过分层随机抽样的方法取到一个样本,样本中男生每天运动时间的平均值为80分钟,方差为10,女生每天运动时间的平均值为60分钟,方差为20.结合数据,估计该校全体学生每天运动时间的方差为()A .15B .16C .96D .112答案D解析由题意,用比例分配的分层随机抽样的方式抽取样本,且该样本中男、女生的比为400600=23,不妨设抽取的男、女生人数分别为2n ,3n ,那么样本的总数为5n .则所有样本的平均值为15n ×(80×2n +60×3n )=68,方差为2n 5n ×[10+(80-68)2]+3n5n×[20+(60-68)2]=112.故选D.6.为了了解全区科级干部“党风廉政知识”的学习情况,采用比例分配的分层随机抽样方法,从全区320名正科级干部和1280名副科级干部中抽取40名科级干部预测全区科级干部“党风廉政知识”的学习情况.现将这40名科级干部分为正科级干部组和副科级干部组,利用同一份试卷分别进行测试.经过测试后,两组各自将测试成绩统计分析如下表:分组人数平均成绩正科级干部组a 80副科级干部组b70则40名科级干部测试成绩的平均分x -=________.答案72解析样本量与总体中的个体数的比为40320+1280=140,则抽取的正科级干部人数a =320×140=8,副科级干部人数b =1280×140=32.所以这40名科级干部测试成绩的平均分x -=80×8+70×3240=72.课时作业一、单项选择题1.(2023·天津河西区三模)学校组织班级知识竞赛,某班的12名学生的成绩(单位:分)分别是58,67,73,74,76,82,82,87,90,92,93,98,则这12名学生成绩的第三四分位数是()A .88分B .89分C .90分D .91分答案D解析12名学生的成绩(单位:分)由小到大排列为58,67,73,74,76,82,82,87,90,92,93,98,∵12×75%=9,∴这12名学生成绩的第三四分位数是90+922=91(分).2.(2024·重庆南开中学月考)为了解某高中学生的身高情况,按年级采用比例分配的分层随机抽样的方法抽取样本,抽到高一、高二、高三年级的学生人数分别为100,200,300,样本中高一、高二、高三这三个年级学生的平均身高分别为x -,y -,z -,则估计该高中学生的平均身高为()A .16x -+13y -+12z-B .x -+y -+z -2C .12x -+13y -+16z-D .x -+y -+z -3答案A解析样本量为100+200+300=600,样本平均数为100600x -+200600y -+300600z -=16x -+13y -+12z -,所以估计该高中学生的平均身高为16x -+13y -+12z -.3.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则()A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差答案B解析讲座前问卷答题的正确率的中位数为70%+75%2=72.5%>70%,故A 错误;讲座后问卷答题的正确率只有一个是80%,4个是85%,剩下的全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,故B 正确;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,故C 错误;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,故D 错误.故选B.4.给定一组数据5,5,4,3,3,3,2,2,2,1,则这组数据()A .众数为2B .平均数为2.5C .方差为1.6D .标准差为4答案C解析由题中数据可得,众数为2和3,故A 错误;平均数x -=5+5+…+2+110=3,故B错误;方差s 2=(5-3)2+(5-3)2+…+(2-3)2+(1-3)210=1.6,标准差为 1.6≠4,故C 正确,D 错误.5.(2023·河北唐山一中模拟)对某种电子元件使用寿命跟踪调查,所得样本的频率分布直方图如图.由图可知,这一批电子元件使用寿命的85%分位数为()A .500hB .450hC .350hD .550h答案A解析电子元件寿命小于500h 的百分比为+32000+1400+85%,则这批电子元件使用寿命的85%分位数为500h .故选A .6.某市教育部门组织高中教师在暑假期间进行培训,培训后统一举行测试.随机抽取100名教师的测试成绩(单位:分,满分100分)进行统计,得到如图所示的频率分布折线图,则下列说法正确的是()A .这100名教师的测试成绩的极差是20分B .这100名教师的测试成绩的众数是90分C .这100名教师的测试成绩的中位数是87.5分D .这100名教师中测试成绩不低于90分的人数占比超过50%答案C解析对于A ,由题意知,这100名教师的测试成绩的最高分与最低分无法确定,故极差无法确定,故A 错误;对于B ,由题图易知这100名教师的测试成绩的众数为87.5分,故B 错误;对于C ,设这100名教师的测试成绩的中位数为x 分,则(0.02+0.04)×5+(x -85)×0.08=0.5,解得x =87.5,故C 正确;对于D ,这100名教师中测试成绩不低于90分的人数占比为(0.03+0.03)×5×100%=30%,30%<50%,故D 错误.故选C.7.已知两组数据x 1,x 2,x 3,x 4,x 5和y 1,y 2,y 3,y 4,y 5的中位数、方差均相同,则两组数据合并为一组数据后,()A .中位数一定不变,方差可能变大B .中位数一定不变,方差可能变小C .中位数可能改变,方差可能变大D .中位数可能改变,方差可能变小答案A解析不妨设x 1≤x 2≤x 3≤x 4≤x 5,y 1≤y 2≤y 3≤y 4≤y 5,则两组数据x 1,x 2,x 3,x 4,x 5和y 1,y 2,y 3,y 4,y 5的中位数分别为x 3,y 3,则x 3=y 3,两组数据合并为一组数据后,中位数为x 3+y 32=x 3=y 3,故中位数一定不变,设x 1,x 2,x 3,x 4,x 5的平均数为x -,方差为s 21,y 1,y 2,y 3,y 4,y 5的平均数为y -,方差为s 21,则∑5i =1x i =5x -,∑5i =1x 2i =5(s 21+x -2),∑5i =1y i =5y -,∑5i =1y 2i =5(s 21+y -2),则两组数据合并为一组数据后的平均数z -=110(∑5i =1x i +∑5i =1y i )=110(5x -+5y -)=x -+y -2,方差s 2=110[∑5i =1(x i -z -)2+∑5i =1(y i -z -)2]=110(∑5i =1x 2i +∑5i =1y 2i -10z -2)=110[5(s 21+x -2)+5(s 21+y -2)-10z -2]=s 21+x -2+y -22-z -2=s 21+x -2+y -22-=s 21+(x --y -)24≥s 21,当且仅当x -=y -时,等号成立,故方差可能变大,一定不会变小.故选A.8.某高校分配给某中学一个保送名额,该中学进行校内举荐评选,评选条件除了要求该生获得该校“三好学生”称号,还要求学生在近期连续3次大型考试中,每次考试的名次都在全校前5名(每次考试无并列名次).现有甲、乙、丙、丁四位同学都获得了“三好学生”称号,四位同学在近期连续3次大型考试名次的数据分别为甲同学:平均数为3,众数为2;乙同学:中位数为3,众数为3;丙同学:众数为3,方差小于3;丁同学:平均数为3,方差小于3.则一定符合推荐要求的同学是()A .甲和乙B .乙和丁C .丙和丁D .甲和丁答案D解析对于甲同学,平均数为3,众数为2,则3次考试的成绩的名次为2,2,5,满足要求;对于乙同学,中位数为3,众数为3,可举反例:3,3,6,不满足要求;对于丙同学,众数为3,方差小于3,可举特例:3,3,6,则平均数为4,方差s 2=13×[2×(3-4)2+(6-4)2]=2<3,不满足要求;对于丁同学,平均数为3,方差小于3,设丁同学3次考试的名次分别为x 1,x 2,x 3,若x 1,x 2,x 3中至少有一个大于等于6,则方差s 2=13[(x 1-3)2+(x 2-3)2+(x 3-3)2]>3,与已知条件矛盾,所以x 1,x 2,x 3均不大于5,满足要求.二、多项选择题9.(2024·重庆模拟)一组数据按从小到大的顺序排列为2,3,3,x ,7,10,若这组数据的平均数是中位数的54倍,则下列说法正确的是()A .x =4B .众数为3C .中位数为4D .方差为233答案BCD解析一组数据按从小到大的顺序排列为2,3,3,x ,7,10,∵这组数据的平均数是中位数的54倍,∴16×(2+3+3+x +7+10)=54×3+x 2,解得x =5,故A 错误;众数为3,故B 正确;中位数为3+52=4,故C 正确;平均数为16×(2+3+3+5+7+10)=5,方差为16×[(2-5)2+(3-5)2+(3-5)2+(5-5)2+(7-5)2+(10-5)2]=233,故D 正确.故选BCD.10.(2023·湖北武汉二中模拟)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列说法正确的是()A .甲的成绩的平均数等于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的第80百分位数等于乙的成绩的第80百分位数D .甲的成绩的极差大于乙的成绩的极差答案AC解析由题图可得,甲的成绩的平均数为4+5+6+7+85=6,乙的成绩的平均数为3×5+6+95=6,A 正确;甲的成绩的中位数为6,乙的成绩的中位数为5,B 错误;甲的成绩的第80百分位数为7+82=7.5,乙的成绩的第80百分位数为6+92=7.5,所以二者相等,C 正确;甲的成绩的极差为8-4=4,乙的成绩的极差为9-5=4,D 错误.故选AC.三、填空题11.(2023·四川资阳中学第一次质量检测)某歌手电视大奖赛中,七位评委对某选手打出如下分数:7.9,8.1,8.4,8.5,8.5,8.7,9.9,则其第50百分位数为________.答案8.5解析由题意可知,共有7个数据并且已经按照从小到大的顺序排列,其第50百分位数即为这组数据的中位数,所以其第50百分位数是第4个数据,为8.5.12.(2024·江西八所重点中学联考)某工厂为了解产品的生产情况,随机抽取了50个样本,若样本数据x 1,x 2,…,x 50的方差为8,则数据3x 1-1,3x 2-1,…,3x 50-1的方差为________.答案72解析样本数据x 1,x 2,…,x 50的方差为8,所以数据3x 1-1,3x 2-1,…,3x 50-1的方差为32×8=72.13.若已知30个数x 1,x 2,…,x 30的平均数为6,方差为9;现从原30个数中剔除x 1,x 2,…,x 10这10个数,且剔除的这10个数的平均数为8,方差为5,则剩余的20个数x 11,x 12,…,x 30的方差为________.答案8解析由题意得x 1+x 2+…+x 30=6×30=180,x 21+x 22+…+x 230=9×30+30×62=1350,x 1+x 2+…+x 10=8×10=80,x 21+x 22+…+x 210=5×10+10×82=690,所以剩余的20个数的平均数为180-8020=5,x 211+x 212+…+x 230=1350-690=660,所以剩余的20个数的方差为660-20×2520=8.14.已知一个样本的样本量为10,平均数为15,方差为3,现从样本中去掉一个数据15,此时样本的平均数为x -,方差为s 2,则x -=________,s 2=________.答案15103解析设这10个数据为x 1,x 2,…,x 9,15,则x -=15×10-159=15.又s 2=(x 1-15)2+(x 2-15)2+…+(x 9-15)29,(x 1-15)2+(x 2-15)2+…+(x 9-15)2+(15-15)210=3,所以s 2=309=103.四、解答题15.(2023·哈尔滨九中三模)某经销商采购了一批水果,根据某些评价指标进行打分,现从中随机抽取20筐(每筐1kg),得分数据如下:17,23,29,31,34,40,46,50,51,51,58,62,62,68,71,78,79,80,85,95.根据以往的大数据认定:得分在区间(0,25],(25,50],(50,75],(75,100]内的分别对应四级、三级、二级、一级.(1)试求这20筐水果得分的平均数;(2)用样本估计总体,经销商参考以下两种销售方案进行销售:方案一:将得分的平均数换算为等级,按换算后的等级出售;方案二:分等级出售.不同等级水果的售价如下表所示:等级一级二级三级四级售价(万元/吨)21.81.41.2请从经销商的角度,根据售价分析采用哪种销售方案较好,并说明理由.解(1)这20筐水果得分的平均数为120×(17+23+29+31+34+40+46+50+51+51+58+62+62+68+71+78+79+80+85+95)=55.5.(2)方案一:由于得分的平均数55.5∈(50,75],所以可以估计这批水果的销售单价为1.8万元/吨.方案二:设这批水果售价的平均值为x -万元/吨,由已知数据得,得分在(0,25]内的有17,23,共2个,所以估计四级水果所占比例为110;得分在(25,50]内的有29,31,34,40,46,50,共6个,所以估计三级水果所占比例为310;得分在(50,75]内的有51,51,58,62,62,68,71,共7个,所以估计二级水果所占比例为720;得分在(75,100]内的有78,79,80,85,95,共5个,所以估计一级水果所占比例为14.则x -=2×14+1.8×720+1.4×310+1.2×110=1.67(万元/吨).所以从经销商的角度考虑,采用方案一的售价较高,所以采用方案一较好.16.电动摩托车的续航里程,是指电动摩托车在蓄电池满电量的情况下一次能行驶的最大距离,为了解A ,B 两个不同型号电动摩托车的续航里程,现从某卖场库存电动摩托车中随机抽取A ,B 两个型号的电动摩托车各5台,在相同条件下进行测试,统计结果如下:电动摩托车编号12345A 型续航里程(km)120125122124124B 型续航里程(km)118123127120a已知A ,B 两个型号被测试电动摩托车续航里程的平均值相等,(1)求a 的值;(2)小李需要购买一款电动摩托车,从中位数和方差相结合的角度,帮小李选择一款电动摩托车,并说明理由.解(1)因为A ,B 两个型号被测试电动摩托车续航里程的平均值相等,所以120+125+122+124+1245=118+123+127+120+a5,解得a =127.(2)A 型号被测试电动摩托车续航里程从小到大排列为120,122,124,124,125;B 型号被测试电动摩托车续航里程从小到大排列为118,120,123,127,127.所以A 型号被测试电动摩托车续航里程的中位数为124km ,B 型号被测试电动摩托车续航里程的中位数为123km ,即A 型号的中位数大于B 型号的中位数,A 型号被测试电动摩托车续航里程的平均数为x -A =120+125+122+124+1245=123,则A 型号被测试电动摩托车续航里程的方差为s 2A =(120-123)2+(125-123)2+(122-123)2+2×(124-123)25=165,B 型号被测试电动摩托车续航里程的方差为s 2B =(118-123)2+(123-123)2+(120-123)2+2×(127-123)25=665,所以B 型号的方差大于A 型号的方差,所以B 型号被测试电动摩托车续航里程数不稳定,波动比较大,而A 型号的中位数大于B 型号的中位数,所以小李应选择A 型号电动摩托车.17.(多选)(2024·重庆诊断)为了解市民对亚运会体育节目收视情况,随机抽取了200名观众进行调查,其中女性占40%.根据调查结果分别绘制出男、女观众收看亚运会系列节目时长的频率分布直方图,则下列说法正确的是()A .m =0.1B .男观众收看节目时长的众数为8小时C .女观众收看节目的平均时长小于男观众收看节目的平均时长D .收看节目达到9小时的观众中女性人数是男性人数的13答案ABC解析由男观众收看亚运会系列节目时长的频率分布直方图,得(0.050+0.075×2+0.200+m )×2=1,解得m =0.1,故A 正确;由男观众收看亚运会系列节目时长的频率分布直方图,得男观众收看节目时长的众数为7+92=8小时,故B 正确;女观众收看节目的平均时长为(4×0.1+6×0.2+8×0.15+10×0.05)×2=6.6(小时),男观众收看节目的平均时长为(4×0.05+6×0.075+8×0.2+10×0.1+12×0.075)×2=8.3(小时),女观众收看节目的平均时长小于男观众收看节目的平均时长,故C 正确;收看节目达到9小时的观众中,女性人数为200×40%×0.05×2=8,男性人数为200×60%×0.175×2=42,故D 错误.18.(多选)(2023·湖北武汉调研)某市今年夏天迎来罕见的高温炎热天气,当地气象部门统计。
《用样本估计总体》典型例题
《用样本估计总体》典型例题【考情分析】用样本的频率分布估计总体分布的有关问题在高考中的常考题型有两个:(1)根据频率分布表和频率分布直方图进行频数或频率的计算,这种考查形式出现的频率很高;(2)频率分布直方图的绘制,这种考查形式常出现在解答题中,用样本的数字特征估计总体的数字特征也是高考中的常考题型,从近几年高考命题的趋势可以看出,对本节概念的考查开始逐步朝着对数据分析能力考查的方向发展,题目往往需结合相关数字特征的统计意义进行求解.题型1统计图表的信息读取(逻辑推理)典例1、[推测解释能力](2018·全国卷I)某地区经过1年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下列结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半思路本题以实际生活为背景考查了统计图表信息提取的知识,图表命题涉及广泛,解决本题时要注意题目条件中的“农村的经济收入增加了一倍,实现翻番”,否则计算出错,导致判断失误.解析方法一(通解)设建设前经济收入为a,则建设后经济收入为2a,则由图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以只有A是错误的.方法二(优解)因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.答案A题型2与统计图表有关的计算(数据分析)典例2、[分析计算能力(2020-天津卷)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),⋯,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A.10B.18C.20D.36×组距,进行求解思路本题通过分析、读取频率分布直方图中数据的信息,利用公式频率=频率组距运算.解析根据题意,在被抽取的零件中,直径落在区间[5.43,5.47)内的频率为(6.25+5.00)×0.02= 0.225,则个数为80×0.225=18.答案 B题型3数字特征的含义与计算(数据分析)典例3-1[概括理解能力](全国II卷)为了评估一种农作物的种植效果,选了n块地作试验田.这n 块地的亩产量(单位:kg)分别为x1,x2,x3,⋯,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x1,x2,x3,⋯,x n的平均数B.x1,x2,x3,⋯,x n的标准差C.x1,x2,x3,⋯,x n的最大值D.x1,x2,x3,⋯,x n的中位数思路 本题依据数据的数字特征的意义,分析判断数据运用数字特征进行评价时,应从平均数、众数、中位数、方差、极差等多个角度对这组数据进行分析,全面考虑各数字特征的优缺点. 解析 平均数和中位数都能反映一组数据的集中趋势,而且平均数能反映一组数据的平均水平;标准差和方差都能反映一组数据的稳定程度.答案 B典例3-2、(2019-江苏卷)已知一组数据6,7,8,9,10,则该组数据的方差是_________.思路 本题考查了平均数和方差的计算公式,解决本题的关键是熟记平均数和方差的计算公式,本题考查了学生的分析计算能力和数学运算核心素养.解析 由平均数公式可得这组数据的平均数为8,则方差为(−2)2+(−1)2+0+0+12+226=53. 答案 53题型4用样本数字特征估计总体数字特征的简单计算典例4、[简单问题解决能力]某学校高一年级共有三个班,按优秀率进行评选.1班30人,优秀率30%,2班35人,优秀率60%,三班35人,优秀率40%,则全年级优秀率为_________.解析 本题通过优秀率、加权平均数来考查样本估计总体的数字特征,分析题意,根据班级优秀率求解全年级优秀率.由于某学校高一年级共有三个班,按优秀率进行评选:1班30人,优秀率30%,2班35人,优秀率60%,三班35人,优秀率40%,则全年级优秀率为:30×30%+35×60%+35×40%30+35+35=44%.答案 44%题型5用样本数字特征估计总体数字特征的综合计算(数学建模)典例5、[综合问题解决能力](2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲,乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).思路本题属于样本平均值估计总体的综合应用,根据频率分布直方图的特征,通过数据分析,在频率分布直方距计算a的值.解析(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1−0.05−0.15−0.70=0.10. (2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。
2025年高考数学一轮复习课时作业-用样本估计总体【含解析】
2025年高考数学一轮复习课时作业-用样本估计总体【原卷版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.642.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.183.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,924.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.56.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.7.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.8.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.2810.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.12.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.2025年高考数学一轮复习课时作业-用样本估计总体【解析版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.64【解析】选C.将6名学生该日在校体育锻炼时长记录从小到大排列为45,51,59,62,66,70,因为80%×6=4.8,所以该组数据的80%分位数为66.2.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.18【解析】选B.志愿者的总人数为20=50,所以第三组的人数为50×0.36=18,(0.24+0.16)×1有疗效的人数为18-6=12.3.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,92【解析】选D.因为一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,所以另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为3×2-2=4,方差为32×12=92.4.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等【解析】选D.将A,B两家企业10天内已处理的废水的某项指标值的检测结果从小到大排列:A企业:43,63,65,72,73,75,78,81,86,98.B企业:37,58,61,65,68,68,71,77,82,94.A企业该指标值的极差为98-43=55,B企业该指标值的极差为94-37=57,A错误;A企业该指标值的中位数为73+752=74,B企业该指标值的中位数为68+682=68,B错误;A企业该指标值的平均数为43+63+65+72+73+75+78+81+86+9810=73.4,B企业该指标值的平均数为37+58+61+65+68+68+71+77+82+9410=68.1,C错误;由上可知,B企业该指标值的众数与中位数都为68,D正确.5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.5【解析】选BCD.选项A,乙同学体温的极差为36.5-36.3=0.2,故A错误;选项B,从题中折线图上可以看出,乙同学的体温比甲同学的体温更稳定,故B正确;选项C,乙同学的体温从低到高依次为36.3℃,36.3℃,36.4℃,36.4℃,36.4℃, 36.5℃,36.5℃,故众数为36.4,而中位数和平均数都是36.4,故C正确;选项D,甲同学的体温从低到高依次为36.2℃,36.2℃,36.4℃,36.4℃,36.5℃, 36.5℃,36.6℃,由70%×7=4.9,可知数据的第70百分位数为第5项数据36.5,故D 正确.6.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.【解析】根据题意,设今年计划招聘的硕士生为x人,博士生为y人,又由现有研究员300人,其中本科生有300×20%=60(人),硕士生有300×40%=120(人),=0.15,=0.4,解得 =40, =60.答案:407.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.【解析】由题意得m-2=10,所以m=12,所以该组数据的平均数为 =2+4+8+124=132,由方差的计算公式可知:s2=14 2-+(4-132)2+(8-132)2+12- =594.答案:5948.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【解析】(1)甲=18×(82+81+79+78+95+88+93+84)=85,乙=18×(92+95+80+75+83+80+90+85)=85,甲2=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2] =35.5,乙2=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2] =41.(2)由(1)知甲=乙,甲2< 乙2,甲的成绩较稳定,所以派甲参赛比较合适.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28【解析】选D.垫球数在区间[5,25)内的人数占总人数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总人数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%,所以第75百分位数位于区间[25,30)内,且25+5×0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.10.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差【解析】选BD.对于A,如1,2,2,2,3,5的平均数为2.5,而2,2,2,3的平均数为2.25,不相等,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,其中位数为 3+ 42,x2,x3,x4,x5的中位数为 3+ 42,所以B正确;对于C,x1,x2,x3,x4,x5,x6的波动更大,所以C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x5-x2≤x6-x1,故D正确.11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.【解析】因为(0.01+0.01+m+0.02+0.02)×10=1,所以m=0.04,又0.1+0.1+0.4=0.6, 0.1+0.1+0.4+0.2=0.8,所以第65百分位数位于第4组中,设第65百分位数为a,则0.1+0.1+0.4+(a-80)×0.02=0.65,解得a=82.5.答案:82.512.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.【解析】(1)由题中频率分布直方图知(0.01+m+0.04+0.02)×10=1,解得m=0.03;设此次竞赛活动学生成绩的中位数为x0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x0<90,由(x0-80)×0.04=0.5-0.4,得x0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由题中频率分布直方图及(1)知, =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-8210×0.4=0.52,则获奖的学生有500×0.52=260(名),所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.。
第五章《用样本推断总体》复习讲义(解析版)
第五章 用样本推断总体(考点讲义)1.样本容量:样本中个体的数目叫做样本容量。
2.在用样本特性估计总体特性时,要注意一是样本要有代表性,二是样本容量要足够大。
3.求平均数的公式:123nx x x x x n++++=L【类型一】利用样本平均数估算总体数量【例1】为了创设全新的校园文化氛围,进一步组织学生开展课外阅读,让学生在丰富多彩的书海中,扩大知识源,亲近母语,提高文学素养.某校准备开展“与经典为友、与名著为伴”的阅读活动,活动前对本校学生进行了“你最喜欢的图书类型(只写一项)”的随机抽样调查,相关数据统计如下:请根据以上信息解答下列问题:(1)该校对_____名学生进行了抽样调查,m = _____n =_____(2)请将图1和图2补充完整,并求出扇形统计图中小说所对应的圆心角度数;(3)已知该校共有学生800人,利用样本数据估计全校学生中最喜欢科幻人数约为多少人?【解析】(1)用其它初一它的百分比即可;(2)用360∘乘以所占得百分比;(3)用样本估计总体.解:(1)20÷10%=200(名).由图1,得n=40,m=100-20-10-40=30答:该校对200名学生进行了抽样调查;m=30,n=40(2)如图:小说对应的圆心角度数为360∘×20%=72∘;(3)800×30%=240.答:全校学生中最喜欢小说的人数约为240名.【对应训练1】为了估计湖里有多少条鱼,小刚先从湖里捞出了100条鱼做上标记,然后放回湖里去.经过一段时间,带有标记的鱼完全混合于鱼群后,小刚又从湖里捞出200条鱼,如果其中15条有标记,那么估计湖里有鱼()A.1333条B.3000条C.300条D.1500条【答案】A【解析】在样本中“捕捞200条鱼,发现其中15条有标记”,即可求得有标记的所占比例,而这一比例也适用于整体,据此即可解答.【对应训练2】我国古代数学名著《九章算术》有“米谷粒分”.粮仓开仓收粮,有人送来谷米1608石,验得其中夹有谷粒.现从中抽取谷米一把,共数得256粒,其中夹有谷粒32粒,则这批谷米内夹有谷粒约是________石.【答案】201【解析】根据256粒内夹谷32粒,可得比例,再乘以1608石,即可得出答案.【解答】解:根据题意,得1608×32=201(石),256∴这批谷米内夹有谷粒约201石.【对应训练3】某山区中学280名学生参加植树节活动,要求每人植3至6棵,活动结束后随机抽查了若干名学生每人的植树量,并分为四种类型,A:3棵;B:4棵;C:5棵;D:6棵,将各类的人数绘制成扇形图(如图1)和条形图(如图2).回答下列问题:(1)这次调查一共抽查了________名学生的植树量;请将条形图补充完整;(2)被调查学生每人植树量的众数是________棵、中位数是________棵;(3)求被调查学生每人植树量的平均数,并估计这280名学生共植树多少棵?【解析】(1)由B类型的人数及其所占百分比可得总人数,总人数乘以D类型的对应的百分比即可求出其人数,据此可补全图形;(2)根据众数和中位数的概念可得答案;(3)先求出样本的平均数,再乘以总人数即可.【解答】(1)这次调查一共抽查植树的学生人数为8÷40%=20(人),D类人数=20×10%=2(人);条形图补充如图:(2)植树4棵的人数最多,则众数是4,共有20人植树,其中位数是第10、11人植树数量的平均数,则中位数是4,(3)x=4×48×562×7=5.3(棵),205.3×280=148(棵).答:估计这3280名学生共植树1484棵.【类型二】用样本估计总体【例2】为了提高学生的综合素养,某校开设了五门第二课堂活动课,按照类别分为:A“剪纸”、B“绘画”、C“雕刻”、D“泥塑”、E“插花”.为了了解学生对每种活动课的喜爱情况,随机抽取了部分同学进行调查,将调查结果绘制成如下两幅不完整的统计图.根据信息,回答下列问题:(1)本次调查的样本容量为________,统计图中的a=________,b=________;(2)通过计算补全条形统计图;(3)该校共有3000名学生,请你估计全校喜爱“雕刻”的学生人数.解:(1)样本容量为1815%=120,a=120×10%=12,b=120×30%=36.故答案为:120;12;36.(2)组频数:120―18―12―30―36=24(人),补全条形统计图如图所示:(3)3000×30120=750(人),答:该校喜爱“雕刻”约有750人.【跟踪训练1】在一个不透明的盒子中装有20个黄、白两种颜色的乒乓球,除颜色外其它都相同,小明进行了多次摸球试验,发现摸到白色乒乓球的频率稳定在0.2左右,由此可知盒子中黄色乒乓球约有…()A.2个B.4个C.18个D.16个【答案】D【跟踪训练2】质检部门从1000件电子元件中随机抽取100件进行检测,其中有2件是次品.试据此估计这批电子元件中大约有________件次品.【答案】20【解析】根据随机抽取100件进行检测,其中有2件是次品,可以计算出这批电子元件中大约有多少件次品.【跟踪训练3】书籍是人类进步的阶梯.为了解学生的课外阅读情况,某校随机抽查了部分学生本学期阅读课外书的册数,并绘制出如下统计图.(1)共抽查了多少名学生?(2)请补全条形统计图,并写出被抽查学生本学期阅读课外书册数的众数、中位数;(3)根据抽查结果,请估计该校1200名学生中本学期课外阅读5册书的学生人数.解:(1)12÷30%=40(名).(2)如图所示,由图知,众数为5,中位数为5.(3)∵抽查的样本中,课外阅读5册书的学生人数占14×100%=35%,40∴估计该校学生课外阅读5册书的学生人数约占35%,∴该校1200名学生中课外阅读5册书的学生人数约为1200×35%=420(人).【类型三】用样本频率估计总体频率【例3】中长跑(男生1000m,女生800m)是河南省某市中招体育考试的必考项目.甲、乙两校为了解本校九年级学生的训练情况,各随机抽取了20名九年级学生的中长跑模拟测试成绩(满分:30分),将成绩进行统计、整理与分析,过程如下:【收集数据】【整理数据】整理以上数据,得到模拟测试成绩x(分)的频数分布表.【分析数据】根据以上数据,得到以下统计量.根据以上信息,回答下列问题:(1)填空:a= ________,b=_________, m=________, n=________;(2)综合上表中的统计量,推断________校学生中长跑成绩更好,理由为________(写出一条即可)(3)若甲、乙两校各有800名学生,请估计两校中长跑模拟测试成绩不低于25分的学生一共有多少名?解:(1)由数据可得,a=7,b=8,m=24.75,n=23.4. 故答案为:7;8;24.75;23.4.(2)甲校学生成绩的平均数比乙校学生成绩的平均数高,且甲校学生成绩的方差比乙校学生成绩的方差小,成绩较稳定.(答案不唯一,合理即可)故答案为:甲.=720(名),(3)(800+800)×1082020答:估计两校中长跑模拟测试成绩不低于25分的学生一共有720名.【跟踪训练】今年是建党100周年,为了让全校学生牢固树立爱国爱党的崇高信念,某校开展了形式多样的党史学习教育活动,八、九年级(各有500名学生)举行了一次党史知识竞答(满分为100分),然后随机各抽取20名同学的成绩进行了收集、统计与分析,过程如下:【收集数据】两个年级抽取的20名同学的成绩如下表:八年级:7968878985598997898998938586899077898379九年级:8688979194625194877194789255979294948598【整理数据】将两个年级的抽样成绩进行分组整理:成绩x(分)50≤x<6060≤x<7070≤x<8080≤x<9090≤x<100八年级113114九年级2a b411【分析数据】抽样的平均数、众数、中位数、方差和优秀率(90分及以上为优秀)如下表:年级统计量平均数众数中位数方差优秀率八年级8589c80.420%九年级859491.5192d请根据以下信息,回答下列问题:(1)填空:a=________,b= ________,c=________,d=________;(2)请估计此次知识竞答中,八年级成绩优秀的学生人数;(3)小李同学认为九年级的整体成绩更好,请从至少两个方面分析其合理性.解:(1)由表中数据可知,九年级落在60≤x<70内的只有62,故a=1;九年级落在70≤x<80内的有71,78,故b=2;八年级成绩按照从小到大的顺序排列后,落在第10,11的数为87,89,∴中位数为88,故c=88;九年级90分及以上的学生有11人,∴九年级的优秀率为1120×100%=55%.故答案为:1;2;88;55%.(2)∵500×20%=100,∴估计此次知识竞答中,八年级成绩优秀的学生人数为100人.(3)九年级抽样成绩的众数,中位数和优秀率均高于八年级,说明九年级平均成绩更高,高分更多,因此九年级整体成绩更好.【类型四】用样本推断总体的实际应用【例4】某运动鞋经销商随机调查某校40名女生的运动鞋号码,结果如下表:鞋的号码35.53636.53737.5人数4616122现在该经销商要进200双上述五种运动鞋,你认为应该怎样进货比较合理?解析:先求出各鞋码所占比例,再乘200,即可得到所需进货数.解:由表中数据可知各鞋码的女生的比例,根据比例进货.需要进35.5码运动鞋:200×440=20(双),需要进36码运动鞋:200×640=30(双)需要进36.5码运动鞋:200×1640=80(双),需要进37码运动鞋:200×1240=60(双)需要进37.5码运动鞋:200×240=10(双)。
2021届高考数学总复习第66讲:用样本估计总体
2021届高考数学总复习第66讲:用样本估计总体[最新考纲] 1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.茎叶图茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.4.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数. (2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数. (4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x ,则这组数据的标准差和方差分别是s =1n [](x 1-x )2+(x 2-x )2+…+(x n -x )2 s 2=1n [](x 1-x )2+(x 2-x )2+…+(x n -x )2 =1n (x 21+x 22+…+x 2n )-x 2.[常用结论]1.频率分布直方图的三个结论(1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1.(3)小长方形的高=频率组距,所有小长方形高的和为1组距. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.一、思考辨析(正确的打“√”,错误的打“×”)(1)在频率分布直方图中,小矩形的高表示频率. ( )(2)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高. ( )(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(4)一组数据的方差越大,说明这组数据的波动越大.()[答案](1)×(2)√(3)√(4)√二、教材改编1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A.4B.8C.12D.16B[设频数为n,则n32=0.25,∴n=32×14=8.]2.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5 B.91.5和92C.91和91.5 D.92和92A[∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5,平均数x=87+89+90+91+92+93+94+968=91.5.]3.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有人.25[用水量为[2,2.5)的频率为0.5×0.5=0.25,则用水量为[2,2.5)的居民有100×0.25=25(人).]4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是.0.1 [5个数的平均数x =4.7+4.8+5.1+5.4+5.55=5.1,所以它们的方差s 2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.]考点1 扇形图和折线图(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.1.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A .新农村建设后,种植收入减少B .新农村建设后,其他收入增加了一倍以上C .新农村建设后,养殖收入增加了一倍D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半A [设新农村建设前经济收入的总量为x ,则新农村建设后经济收入的总量为2x .建设前种植收入为0.6x ,建设后种植收入为0.74x ,故A 不正确;。
10.3 用样本估计总体 2021年高考数学复习优化一轮用书文数
-16-
考点1
考点2
考点3
对点训练1(1)某地区交管部门为了对该地区驾驶员的某项考试 成绩进行分析,随机抽取了15分到45分之间的1 000名驾驶员的成 绩,并根据这1 000名驾驶员的成绩画出样本的频率分布直方图(如
图),则成绩在[30,35)内的驾驶员人数为( C )
A.60 B.180 C.300 D.360
一次.( × )
(5)频率分布表和频率分布直方图是一组数据频率分布的两种形
式,前者准确,后者直观.( √ )
-7-
知识梳理 双基自测
12345
2.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的 亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估
这种农作物亩产量稳定程度的是( )
-20-
考点1
考点2
考点3
(2)解:①根据使用节水龙头后的频数分布表,计算各组的频率,结 合每组的组距,计算频率与组距的比值作为频率分布直方图的纵坐 标画出频率分布直方图.如图所示.
考点1
考点2
考点3
-21-
②根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
考点1
考点2
考点3
-17-
解析:根据题意,可知成绩在[30,35)内的驾驶员人数的频率为1(0.01+0.01+0.04+0.05+0.03)×5=1-0.7=0.3,故成绩在[30,35)内的 驾驶员人数为1 000×0.3=300,故选C.
-18-
考点1
考点2
2025高考数学一轮复习- 用样本的数字特征估计总体-专项训练【含解析】
课时过关检测(六十五)用样本的数字特征估计总体【原卷版】1.数据1,2,3,4,5,6的60%分位数为()A .3B .3.5C .3.6D .42.若数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为()A .x -和s 2B .2x -+3和4s 2C .2x -+3和s 2D .2x -+3和4s 2+12s +93.为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2019年1月至2020年7月的调查数据得出的中国仓储指数,绘制出如下折线图.根据该折线图,下列结论正确的是()A .2019年各月的仓储指数最大值是在3月份B .2020年1月至7月的仓储指数的中位数为55C .2020年1月与4月的仓储指数的平均数为52D .2019年1月至4月的仓储指数相对于2020年1月至4月,波动性更大4.已知样本甲:x 1,x 2,x 3,…,x n 与样本乙:y 1,y 2,y 3,…,y n ,满足y i =2x 3i +1(i =1,2,…,n ),则下列叙述中一定正确的是()A .样本乙的极差等于样本甲的极差B .样本乙的众数大于样本甲的众数C .若某个x i 为样本甲的中位数,则y i 是样本乙的中位数D .若某个x i 为样本甲的平均数,则y i 是样本乙的平均数5.已知样本x 1,x 2,…,x n 的平均数为x ,样本y 1,y 2,…,y m 的平均数为y (x ≠y ),若样本x 1,x 2,…,x n ,y 1,y 2,…,y m 的平均数z =ax +(1-a )y ,其中0<a <12,则n ,m (n ,m∈N*)的大小关系为()A.n=m B.n≥mC.n<m D.n>m6.(多选)甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表:班级参加人数中位数方差平均数甲55149191135乙55151110135下列结论中,正确的是()A.甲、乙两班学生成绩的平均水平相同B.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)C.甲班的成绩波动情况比乙班的成绩波动大D.甲班成绩的众数小于乙班成绩的众数7.(多选)某篮球爱好者在一次篮球训练中,需进行五轮投篮,每轮投篮5次.统计各轮投进球的个数,获知其前四轮投中的个数分别为2,3,4,4,则第五轮结束后,下列数字特征有可能发生的是()A.平均数为3,极差是3B.中位数是3,极差是3C.平均数为3,方差是0.8D.中位数是3,方差是0.568.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为________,方差为_________.9.某经销商从外地一水殖厂购进一批小龙虾,并随机抽取40只进行统计,按重量分类统计结果如图:(1)估计这批小龙虾重量的第10百分位数与第90百分位数;(2)该经销商将这批小龙虾分成三个等级,如表:等级三等品二等品一等品重量/克[5,25)[25,45)[45,55]试估计这批小龙虾划为几等品比较合理?10.(多选)2020年2月8日,在韩国首尔举行的四大洲花样滑冰锦标赛双人自由滑比赛中,中国组合隋文静/韩聪以总分217.51分拿下四大洲赛冠军,这也是他们第六次获得四大洲冠军.中国另一对组合彭程/金杨以213.29分摘得银牌.花样滑冰锦标赛有9位评委进行评分,首先这9位评委给出某对选手的原始分数,评定该队选手的成绩时从9个原始评分中去掉一个最高分、一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变化的数字特征是()A.中位数B.平均数C.方差D.极差11.(多选)随着人民生活水平的提高,对城市空气质量的关注度也逐步增大,如图是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格天气,下面四种说法正确的是()A.1月至8月空气质量合格天数超过20天的月份有5个B.第二季度与第一季度相比,空气质量合格天数的比重下降了C.8月是空气质量最好的一个月D.6月的空气质量最差12.某快递网点收取快递费用的标准是重量不超过1kg的包裹收费10元,重量超过1kg 的包裹,除收费10元之外,超过1kg的部分,每超出1kg(不足1kg,按1kg计算)需要再收费5元.该公司近60天每天揽件数量的频率分布直方图如图所示(同一组数据用该区间的中点值作代表).(1)求这60天每天包裹数量的平均数和中位数;(2)该快递网点负责人从收取的每件快递的费用中抽取5元作为工作人员的工资和网点的利润,剩余的作为其他费用.已知该网点有工作人员3人,每人每天工资100元,以样本估计总体,试估计该网点每天的利润有多少元?13.记样本x 1,x 2,…,x m 的平均数为x -,样本y 1,y 2,…,y n 的平均数为y -(x -≠y -).若样本x 1,x 2,…,x m ,y 1,y 2,…,y n 的平均数为z -=14x -+34y -,则mn的值为()A .3B .4C .14D .1314.某校有高中生2000人,其中男女生比例约为5∶4,为了获得该校全体高中生的身高信息,采取了以下两种方案:方案一:采用比例分配的分层随机抽样方法,抽收了样本量为n 的样本,得到如图所示的频数分布表和频率分布直方图.方案二:采用分层随机抽样方法,抽取了男、女生样本量均为25的样本,计算得到男生样本的均值为170,方差为16,女生样本的均值为160,方差为20.身高(单位:cm)[145,155)[155,165)[165,175)[175,185)[185,195]频数mpq64(1)根据图表信息,求n ,q 并补充完整频率分布直方图,估计该校高中生的身高均值;(同一组中的数据以这组数据所在区间中点的值为代表)(2)计算方案二中总样本的均值及方差;(3)计算两种方案总样本均值的差,并说明用方案二总样本的均值作为总体均值的估计合适吗?为什么?课时过关检测(六十五)用样本的数字特征估计总体【解析版】1.数据1,2,3,4,5,6的60%分位数为()A .3B .3.5C .3.6D .4解析:D由6×60%=3.6,所以数据1,2,3,4,5,6的60%分位数是第四个数,故选D .2.若数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为()A .x -和s 2B .2x -+3和4s 2C .2x -+3和s 2D .2x -+3和4s 2+12s +9解析:B原数据乘以2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数和方差分别是2x -+3和4s 2.3.为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2019年1月至2020年7月的调查数据得出的中国仓储指数,绘制出如下折线图.根据该折线图,下列结论正确的是()A .2019年各月的仓储指数最大值是在3月份B .2020年1月至7月的仓储指数的中位数为55C .2020年1月与4月的仓储指数的平均数为52D .2019年1月至4月的仓储指数相对于2020年1月至4月,波动性更大解析:D2019年各月的仓储指数最大值是在11月份,所以A 错误;由题图可知,2020年1月至7月的仓储指数的中位数约为53,所以B 错误;2020年1月与4月的仓储指数的平均数约为51+552=53,所以C 错误;由题图可知,2019年1月至4月的仓储指数比2020年1月至4月的仓储指数波动更大,故选D .4.已知样本甲:x 1,x 2,x 3,…,x n 与样本乙:y 1,y 2,y 3,…,y n ,满足y i =2x 3i +1(i =1,2,…,n ),则下列叙述中一定正确的是()A .样本乙的极差等于样本甲的极差B .样本乙的众数大于样本甲的众数C .若某个x i 为样本甲的中位数,则y i 是样本乙的中位数D .若某个x i 为样本甲的平均数,则y i 是样本乙的平均数解析:C ∵y i =2x 3i +1,∴y i 关于x i 单调递增,甲样本极差为x n -x 1,乙样本极差为y n-y 1=2(x 3n -x 31)=2(x n -x 1)(x 2n +x n x 1+x 21),两个数据大小关系不定,∴样本乙的极差不一定等于样本甲的极差,A 错误;样本乙的众数不一定大于样本甲的众数,B 错误;若x i 为样本甲的平均数,y i 不一定是样本乙的平均数,D 错误;若x i 为样本甲的中位数时,则y i 一定是样本乙的中位数,C 正确.5.已知样本x 1,x 2,…,x n 的平均数为x ,样本y 1,y 2,…,y m 的平均数为y (x ≠y ),若样本x 1,x 2,…,x n ,y 1,y 2,…,y m 的平均数z =ax +(1-a )y ,其中0<a <12,则n ,m (n ,m ∈N *)的大小关系为()A .n =mB .n ≥mC .n <mD .n >m解析:C 由题意得z =1n +m (nx +my )=n n +mx ,∴a =n n +m,∵0<a <12,∴0<n n +m <12,又n ,m ∈N *,∴2n <n +m ,∴n <m .故选C .6.(多选)甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表:班级参加人数中位数方差平均数甲55149191135乙55151110135下列结论中,正确的是()A .甲、乙两班学生成绩的平均水平相同B .乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)C .甲班的成绩波动情况比乙班的成绩波动大D .甲班成绩的众数小于乙班成绩的众数解析:ABC甲、乙两班成绩的平均数都是135,故两班成绩的平均水平相同,∴A 正确;s 2甲=191>110=s 2乙,∴甲班成绩不如乙班稳定,即甲班成绩波动较大,∴C 正确;甲、乙两班人数相同,但甲班成绩的中位数为149,乙班成绩的中位数为151,从而易知乙班每分钟输入汉字数≥150个的人数要多于甲班,∴B 正确;由题表看不出两班学生成绩的众数,∴D 错误.7.(多选)某篮球爱好者在一次篮球训练中,需进行五轮投篮,每轮投篮5次.统计各轮投进球的个数,获知其前四轮投中的个数分别为2,3,4,4,则第五轮结束后,下列数字特征有可能发生的是()A .平均数为3,极差是3B .中位数是3,极差是3C .平均数为3,方差是0.8D .中位数是3,方差是0.56解析:BCD2+3+4+4=13,①若平均数为3,则第五轮投中的个数为2,所以极差为4-2=2,方差为15×[(2-3)2×2+(3-3)2+(4-3)2×2]=0.8,即选项A 错误,C 正确;②若中位数为3,则第五轮投中的个数为0或1或2或3,当投中的个数为0时,极差为4,平均数为2.6,方差为15×[(0-2.6)2+(2-2.6)2+(3-2.6)2+(4-2.6)2×2]=2.24;当投中的个数为1时,极差为3,平均数为2.8,方差为15×[(1-2.8)2+(2-2.8)2+(3-2.8)2+(4-2.8)2×2]=1.36;当投中的个数为2时,极差为2,方差为0.8;当投中的个数为3时,极差为2,平均数为3.2,方差为15×[(2-3.2)2+(3-3.2)2×2+(4-3.2)2×2]=0.56,即选项B 和D 均正确.故选B 、C 、D .8.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为________,方差为_________.解析:∵-1,0,4,x,7,14的中位数为5,∴4+x2=5,∴x =6,∴这组数据的平均数是-1+0+4+6+7+146=5,这组数据的方差是16×(36+25+1+1+4+81)=743.答案:57439.某经销商从外地一水殖厂购进一批小龙虾,并随机抽取40只进行统计,按重量分类统计结果如图:(1)估计这批小龙虾重量的第10百分位数与第90百分位数;(2)该经销商将这批小龙虾分成三个等级,如表:等级三等品二等品一等品重量/克[5,25)[25,45)[45,55]试估计这批小龙虾划为几等品比较合理?解:(1)因为40×10%=4,所以第10百分位数为第4项与第5项的平均数,在[5,15)范围内约为5+152=10.因为40×90%=36,所以第90百分位数为第36项与第37项的平均数,在[35,55]范围内,约为35+552=45,所以估计这批小龙虾重量的第10百分位数为10,第90百分位数为45.(2)由(1)知,这批小龙虾重量集中在[10,45]范围内,所以划为二等品比较合理.10.(多选)2020年2月8日,在韩国首尔举行的四大洲花样滑冰锦标赛双人自由滑比赛中,中国组合隋文静/韩聪以总分217.51分拿下四大洲赛冠军,这也是他们第六次获得四大洲冠军.中国另一对组合彭程/金杨以213.29分摘得银牌.花样滑冰锦标赛有9位评委进行评分,首先这9位评委给出某对选手的原始分数,评定该队选手的成绩时从9个原始评分中去掉一个最高分、一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变化的数字特征是()A .中位数B .平均数C .方差D .极差解析:BCD因为7个有效评分是9个原始评分中去掉一个最高分、一个最低分,所以中位数不变,平均数、方差、极差可能发生变化,所以可能变化的数字特征是平均数、方差、极差,故选B 、C 、D .11.(多选)随着人民生活水平的提高,对城市空气质量的关注度也逐步增大,如图是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格天气,下面四种说法正确的是()A .1月至8月空气质量合格天数超过20天的月份有5个B .第二季度与第一季度相比,空气质量合格天数的比重下降了C .8月是空气质量最好的一个月D .6月的空气质量最差解析:ABC1月至8月空气质量合格天数超过20天的月份有:1月,2月,6月,7月,8月,共5个,所以A 是正确的;第一季度合格天数的比重为22+26+1931+29+31≈0.7363,第二季度合格天数的比重为19+13+2530+31+30≈0.6264,所以第二季度与第一季度相比,空气质量合格的天数的比重下降了,所以B 是正确的;8月空气质量合格天气达到30天,是空气质量最好的一个月,所以C 是正确的;5月空气质量合格天气只有13天,5月份的空气质量最差,所以D 是错误的,故选A 、B 、C .12.某快递网点收取快递费用的标准是重量不超过1kg 的包裹收费10元,重量超过1kg 的包裹,除收费10元之外,超过1kg 的部分,每超出1kg(不足1kg ,按1kg 计算)需要再收费5元.该公司近60天每天揽件数量的频率分布直方图如图所示(同一组数据用该区间的中点值作代表).(1)求这60天每天包裹数量的平均数和中位数;(2)该快递网点负责人从收取的每件快递的费用中抽取5元作为工作人员的工资和网点的利润,剩余的作为其他费用.已知该网点有工作人员3人,每人每天工资100元,以样本估计总体,试估计该网点每天的利润有多少元?解:(1)每天包裹数量的平均数为0.1×50+0.1×150+0.5×250+0.2×350+0.1×450=260(件),因为[0,200)的频率为0.2,[200,300)的频率为0.5,中位数为200+0.5-0.20.5×100=260(件),所以该网点每天包裹的平均数和中位数都为260件.(2)由(1)可知平均每天的揽件数为260件,利润为260×5-3×100=1000(元),所以该网点平均每天的利润有1000元.13.记样本x 1,x 2,…,x m 的平均数为x -,样本y 1,y 2,…,y n 的平均数为y -(x -≠y -).若样本x 1,x 2,…,x m ,y 1,y 2,…,y n 的平均数为z -=14x -+34y -,则mn的值为()A .3B .4C .14D .13解析:D由题意知x 1+x 2+…+x m =m x -,y 1+y 2+…+y n =n y -,z -=(x 1+x 2+…+x m )+(y 1+y 2+…+y n )m +n =m x -+n y -m +n =m x -m +n +n y -m +n =14x -+34y -,所以m m +n =14,n m +n =34,可得3m =n ,所以m n =13.14.某校有高中生2000人,其中男女生比例约为5∶4,为了获得该校全体高中生的身高信息,采取了以下两种方案:方案一:采用比例分配的分层随机抽样方法,抽收了样本量为n 的样本,得到如图所示的频数分布表和频率分布直方图.方案二:采用分层随机抽样方法,抽取了男、女生样本量均为25的样本,计算得到男生样本的均值为170,方差为16,女生样本的均值为160,方差为20.身高(单位:cm)[145,155)[155,165)[165,175)[175,185)[185,195]频数mpq64(1)根据图表信息,求n ,q 并补充完整频率分布直方图,估计该校高中生的身高均值;(同一组中的数据以这组数据所在区间中点的值为代表)(2)计算方案二中总样本的均值及方差;(3)计算两种方案总样本均值的差,并说明用方案二总样本的均值作为总体均值的估计合适吗?为什么?解:(1)因为身高在区间[185,195]的频率为0.008×10=0.08,频数为4,所以样本量n =40.08=50,m =0.008×10×50=4,p =0.04×10×50=20,q =50-4-20-6-4=16,所以身高在[165,175)的频率为1650=0.32,小矩形的高为0.032,所以身高在[175,185)的频率为650=0.12,小矩形的高为0.012,由此补全频率分布直方图:由频率分布直方图可知样本的身高均值为(150×0.008+160×0.04+170×0.032+180×0.012+190×0.008)×10=167.2,所以由样本估计总体可知,估计该校高中生的身高均值为167.2.(2)把男生样本记为x 1,x 2,x 3,…,x 25,其均值为x -,方差为s 2x ,把女生样本记为y 1,y 2,y 3,…,y 25,其均值为y -,方差为s 2y ,总体样本均值记为z -,方差记为s 2,所以z -=2525+25x -+2525+25y -=25×170+25×16050=165,s 2=150{25[s 2x +(x --z -)2]+25[s 2y +(y --z -)2]}=150{25[16+(170-165)2]+25[20+(160-165)2]}=43.(3)两种方案总样本均值的差为167.2-165=2.2,所以用方案二总体样本均值作为总体均值的估计不合适,原因是没有进行等比例的分层随机抽样,每个个体被抽到的可能性不同,因此代表性较差.。
2021年高三数学第一轮复习资料讲练测-专题10.2 用样本估计总体(讲)(解析版)
专题10.2 用样本估计总体1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一 频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=;极差组数第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率.频率组距知识点二 茎叶图统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.知识点三 样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把称为a 1,a 2,…,a n 这n 个数的平均数.a 1+a 2+…+a n n(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为,则这组数据的标准差和方差分别是x -s =,1n[(x 1-x - )2+(x 2-x - )2+…+(x n -x - )2]s 2=[(x 1-)2+(x 2-)2+…+(x n -)2].1nx - x - x - 【知识必备】1.频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m +a .x - x -(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n的方差为a 2s 2.考点一 茎叶图及其应用【典例1】(河北衡水二中2019届调研)(1)中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成就按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为( )Error!|1 2 5 6 80 0 1 2 4 5 7 80 2 2 3 3 3 4 5 5 6 90 2 2 3 4 4 4 5 7 7 8 96 6 8 9)A.2B.4C.5D.6(2)为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,则甲地该月11时的平均气温的标准差为( )A.2B.C.10D.210【答案】(1)A (2)B【解析】(1)由茎叶图可得,获“诗词达人”称号的有8人,据该次比赛的成就按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为8×=2(人).1040(2)甲地该月5天11时的气温数据(单位:℃)为28,29,30,30+m ,32;乙地该月5天11时的气温数据(单位:℃)为26,28,29,31,31,则乙地该月11时的平均气温为(26+28+29+31+31)÷5=29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m +32)÷5=30,解得m =1.则甲地该月11时的平均气温的标准差为=.15×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]2【方法技巧】1.茎叶图的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息.【变式1】(黑龙江哈尔滨三中2019届模拟)空气质量指数 (Air Quality Index ,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI 记录数据中,随机抽取10个,用茎叶图记录如下.根据该统计数据,估计此地该年AQI 大于100的天数约为________(该年为365天).【答案】146【解析】该样本中AQI 大于100的频数是4,频率为,25由此估计该地全年AQI 大于100的频率为,25估计此地该年AQI 大于100的天数约为365×=146.25考点二 频率分布直方图【典例2】(山西太原五中2019届模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x 人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.(1)求x ;(2)求抽取的x 人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.【解析】(1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴=0.05,∴x =120.6x(2)设中位数为a ,则0.01×5+0.07×5+(a -30)×0.06=0.5,∴a =≈32,则中位数为32.953(3)(ⅰ)5个年龄组成绩的平均数为1=×(93+96+97+94+90)=94,方差为s =×[(-1)2+22+32+02x - 152115+(-4)2]=6.5个职业组成绩的平均数为2=×(93+98+94+95+90)=94,方差为s =×[(-1)2+42+02+12+(-x -152154)2]=6.8.(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).【方法技巧】1.频率分布直方图的性质.(1)小长方形的面积=组距×=频率;频率组距(2)各小长方形的面积之和等于1;(3)小长方形的高=,所有小长方形的高的和为.频率组矩1组距2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.【变式2】(陕西延安中学2019届模拟)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频率分布表.A 地区用户满意度评分的频率分布直方图图①B 地区用户满意度评分的频率分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户和满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.【解析】(1)作出频率分布直方图如图:通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.考点三样本的数字特征【典例3】【2019年高考全国Ⅲ卷理数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70.(1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【答案】(1)a =0.35,b =0.10;(2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00.【解析】(1)由已知得0.70=a +0.20+0.15,故a =0.35.b =1–0.05–0.15–0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.【举一反三】(2017·全国Ⅰ卷) (1)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x 1,x 2,…,x n 的平均数B.x 1,x 2,…,x n 的标准差C.x 1,x 2,…,x n 的最大值D.x 1,x 2,…,x n 的中位数(2)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s 2,x -则( )A.=4,s 2<2B.=4,s 2>2x -x - C.>4,s 2<2 D.>4,s 2>2x -x -【答案】(1)B (2)A【解析】(1)刻画评估这种农作物亩产量稳定程度的指标是标准差.(2)∵某7个数的平均数为4,∴这7个数的和为4×7=28,∵加入一个新数据4,∴==4.又∵x -28+48这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2==<2,故选A.7×2+(4-4)2874【方法技巧】1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.【变式3】(浙江学军中学2019届模拟)(1)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.(2)某班男女生各10名同学最近一周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下:假设每名同学最近一周平均每天的锻炼时间是互相独立的.①男生每天锻炼的时间差别小,女生每天锻炼的时间差别大;②从平均值分析,男生每天锻炼的时间比女生多;③男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;④从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大.其中符合茎叶图所给数据的结论是( )A.①②③B.②③④C.①②④D.①③④【答案】(1)2 (2)C【解析】(1)甲=(87+91+90+89+93)=90,x -15乙=(89+90+91+88+92)=90,x - 15s =[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,2甲15s =[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.2乙15(2)由茎叶图知,男生每天锻炼时间差别小,女生差别大,①正确.男生平均每天锻炼时间超过65分钟的概率p 1==,女生平均每天锻炼时间超过65分钟的概率p 2=51012=,p 1>p 2,因此④正确.41025设男生、女生两组数据的平均数分别为甲,乙,标准差分别为s 甲,s 乙.x - x - 易求甲=65.2,乙=61.8,知甲>乙,②正确.x - x - x - x -又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散,∴s 甲<s 乙,③错误,因此符合茎叶图所给数据的结论是①②④.。
2021年高考数学一轮精选练习:58《用样本估计总体》(含解析)
2021年高考数学一轮精选练习:58《用样本估计总体》一、选择题1.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个小长方形的面积和的25,且样本容量为140,则中间一组的频数为( )A.28B.40C.56D.602.某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则m +n 的值是( )A.10B.11C.12D.133.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为s 2,则( )A.x =4,s 2<2 B.x =4,s 2>2 C.x >4,s 2<2 D.x >4,s 2>24.甲、乙两组数的数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数相同的是( )A.极差B.方差C.平均数D.中位数5.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A.56B.60C.120D.1406.某班男女生各10名同学最近一周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下:假设每名同学最近一周平均每天的锻炼时间是互相独立的. ①男生每天锻炼的时间差别小,女生每天锻炼的时间差别大; ②从平均值分析,男生每天锻炼的时间比女生多;③男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;④从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大.其中符合茎叶图所给数据的结论是( )A.①②③B.②③④C.①②④D.①③④7.某学校A 、B 两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差.①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差; ④B 班兴趣小组成绩的标准差大于A 班兴趣小组成绩的标准差. 其中正确结论的编号为( A )A.①④B.②③C.②④D.①③二、填空题8.设样本数据x 1,x 2,…,x 2 018的方差是4,若y i =2x i -1(i=1,2,…,2 018),则y 1,y 2,…,y 2 018的方差为 .9.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有 株树木的底部周长小于100 cm.10.一组数据1,10,5,2,x,2,且2<x <5,若该数据的众数是中位数的23倍,则该数据的方差为 .11.某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a= ;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 .三、解答题12.“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45),得到如图所示的频率分布直方图,已知第一组有6人.(1)求x;(2)求抽取的x人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户,五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.13.在一个文艺比赛中,12名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分,如图是两个评判组对同一选手打分的茎叶图:(1)求A组数的众数和B组数的中位数;(2)对每一组计算用于衡量相似性的数值,回答:小组A与小组B哪一个更像是由专业人士组成的?并说明理由.14.全世界越来越关注环境保护问题,某监测站点于2016年8月某日起连续n天监测空气质量指数(AQI),数据统计如下表:(1)根据所给统计表和频率分布直方图中的信息求出n,m的值,并完成频率分布直方图;(2)由频率分布直方图,求该组数据的平均数与中位数;(3)在空气质量指数分别为(50,100]和(150,200]的监测数据中,用分层抽样的方法抽取5天,从中任意选取2天,求事件A“两天空气质量等级都为良”的概率.答案解析1.答案为:B ;解析:设中间一组的频数为x ,因为中间一个小长方形的面积等于其他8个小长方形的面积和的25,所以其他8组的频数和为52x ,由x +52x=140,解得x=40.2.答案为:C ;解析:∵甲组学生成绩的平均数是88,∴由茎叶图可知78+86+84+88+95+90+m +92=88×7,∴m=3, ∵乙组学生成绩的中位数是89,∴n=9,∴m +n=12.3.答案为:A ;解析:∵某7个数的平均数为4,∴这7个数的和为4×7=28,∵加入一个新数据4,∴x -=28+48=4,又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+4-428=74<2,故选A.4.答案为:C ;解析:由题中茎叶图中数据的分布,可知方差不同,极差不同,甲的中位数为16+212=18.5,乙的中位数为14+182=16,x 甲=5+16+12+25+21+376=583,x 乙=1+6+14+18+38+396=583,所以甲、乙的平均数相同.故选C.5.答案为:D ;解析:由频率分布直方图知200名学生每周的自习时间不少于22.5小时的频率为 1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.6.答案为:C ;解析:由茎叶图知,男生每天锻炼时间差别小,女生差别大,①正确.男生平均每天锻炼时间超过65分钟的概率P 1=510=12,女生平均每天锻炼时间超过65分钟的概率P 2=410=25,P 1>P 2,因此④正确.设男生、女生两组数据的平均数分别为x 甲,x 乙,标准差分别为s 甲,s 乙. 易求x 甲=65.2,x 乙=61.8,知x 甲>x 乙,②正确.又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散,∴s 甲<s 乙,③错误, 因此符合茎叶图所给数据的结论是①②④.7.答案为:A ;解析:A 班兴趣小组的平均成绩为53+62+64+…+92+9515=78,其方差为115×[(53-78)2+(62-78)2+…+(95-78)2]=121.6,则其标准差为121.6≈11.03;B 班兴趣小组的平均成绩为45+48+51+…+9115=66,其方差为115×[(45-66)2+(48-66)2+…+(91-66)2]=175.2,则其标准差为175.2≈13.24.故选A.一、填空题8.答案为:16;解析:设样本数据的平均数为x ,则y i =2x i -1的平均数为2x -1,则y 1,y 2,…,y 2 018的方差为12 018[(2x 1-1-2x +1)2+(2x 2-1-2x +1)2+…+(2x 2 018-1-2x +1)2]=4×12 018[(x 1-x )2+(x 2-x )2+…+(x 2 018-x )2]=4×4=16.9.答案为:24;解析:底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60, 所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24.10.答案为:9;解析:根据题意知,该组数据的众数是2,则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x,5,10,则2+x2=3,解得x=4,所以这组数据的平均数为x =16×(1+2+2+4+5+10)=4,方差为s 2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.11.答案为:(1)3,(2)6000;解析:(1)由频率分布直方图可知:0.1×(0.2+0.8+1.5+2.0+2.5+a)=1,解得a=3. (2)消费金额在区间[0.5,0.9]内的购物者的频率为0.1×(3.0+2.0+0.8+0.2)=0.6,所以所求购物者的人数为0.6×10 000=6 000.二、解答题12.解:(1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x=0.05,∴x=120. (2)设中位数为a ,则0.01×5+0.07×5+(a -30)×0.06=0.5,∴a=953≈32,则中位数为32.(3)(ⅰ)5个年龄组成绩的平均数为x 1=15×(93+96+97+94+90)=94,方差为s 21=15×[(-1)2+22+32+02+(-4)2]=6.5个职业组成绩的平均数为x 2=15×(93+98+94+95+90)=94,方差为s 22=15×[(-1)2+42+02+12+(-4)2]=6.8.(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定. 感想合理即可.13.解:(1)由茎叶图可得:A 组数据的众数为47,B 组数据的中位数为55+582=56.5.(2)小组A ,B 数据的平均数分别为x A =112(42+42+44+45+46+47+47+47+49+50+50+55)=56412=47,x B =112(36+42+46+47+49+55+58+62+66+68+70+73)=67212=56,小组A ,B 数据的方差分别为 s 2A =112[(42-47)2+(42-47)2+…+(55-47)2]= 112(25+25+9+4+1+0+0+0+4+9+9+64)=12.5, s 2B =112[(36-56)2+(42-56)2+…+(73-56)2] =112(400+196+100+81+49+1+4+36+100+144+196+289)=133. 因为s 2A <s 2B ,所以A 组成员的相似程度高,由于专业裁判给分更符合专业规则, 相似程度应该高,因此A 组更像是由专业人士组成的.14.解:(1)∵0.004×50=20n,∴n=100,∵20+40+m +10+5=100,∴m=25. 40100×50=0.008;25100×50=0.005;10100×50=0.002;5100×50=0.001.由此完成频率分布直方图,如图:(2)由频率分布直方图得该组数据的平均数为25×0.004×50+75×0.008×50+125×0.005×50+175×0.002×50+225×0.001×50=95,∵[0,50]的频率为0.004×50=0.2,(50,100]的频率为0.008×50=0.4,∴中位数为50+0.5-0.20.4×50=87.5.(3)由题意知在空气质量指数为(50,100]和(150,200]的监测天数中分别抽取4天和1天, 在所抽取的5天中,将空气质量指数为(50,100]的4天分别记为a ,b ,c ,d ; 将空气质量指数为(150,200]的1天记为e ,从中任取2天的基本事件为(a ,b),(a ,c),(a ,d),(a ,e),(b ,c),(b ,d),(b ,e),(c ,d),(c ,e),(d ,e),共10个,其中事件A “两天空气质量等级都为良”包含的基本事件为(a ,b),(a ,c),(a ,d),(b ,c),(b ,d),(c ,d),共6个,所以P(A)=610=35.。
2021年高考数学大一轮复习 课时限时检测(五十五)用样本估计总体
2021年高考数学大一轮复习课时限时检测(五十五)用样本估计总体一、选择题(每小题5分,共30分)1.(xx·陕西高考)对一批产品的长度(单位:毫米)进行抽样检测,下图9-2-10为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上为一等品,在区间[15,20)和[25,30)上为二等品,在区间[10,15)和[30,35]上为三等品,用频率估计概率,现从该批产品中随机抽取1件,则其为二等品的概率是( )图9-2-10A.0.09 B.0.20 C.0.25 D.0.45【答案】D2.(xx·福建高考)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70)[70,80),[80,90),[90,100]加以统计,得到如图9-2-11所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )图9-2-11A.588 B.480C.450 D.120【答案】 B3.(xx·重庆高考)右面茎叶图9-2-12记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )A .2,5B .5,5C .5,8D .8,8【答案】 C4.(xx·山东高考)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:89⎪⎪⎪7 74 0 1 0 x 9 1图9-2-13则7个剩余分数的方差为( ) A.1169B.367 C .36 D.677【答案】 B5.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图9-2-14所示,假设得分值的中位数为m e ,众数为m 0.平均值为x ,则( )图9-2-14A .m e =m 0=xB .m e =m 0<xC .m e <m 0=xD .m 0<m e <x【答案】 D6.(xx·四川高考)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图9-2-15所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )【答案】 A二、填空题(每小题5分,共15分)7.如图9-2-16是某高三学生进入高中三年来第1次到14次的数学考试成绩茎叶图,根据茎叶图计算数据的中位数为.图9-2-16【答案】94.58.(xx·湖北高考)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图9-2-17所示.(1)直方图中x的值为;(2)在这些用户中,用电量落在区间[100,250)内的户数为.图9-2-17【答案】(1)0.004 4 (2)709.在一项大西瓜品种的实验中,共收获甲种大西瓜13个、图9-2-18乙种大西瓜11个,并把这些大西瓜的重量(单位:斤,1斤=500克)制成了茎叶图,如图9-2-18所示,据此茎叶图写出对甲乙两种大西瓜重量的两条统计结论是:(1) ;(2) .【答案】(1)甲种大西瓜的平均重量大于乙种大西瓜(2)甲种大西瓜的产量比乙种大西瓜稳定三、解答题(本大题共3小题,共35分)10.(10分)有同一型号的汽车100辆.为了解这种汽车每耗油1 L所行路程的情况,现从中随机抽出10辆在同一条件下进行耗油1 L所行路程试验,得到如下样本数据(单位:km):13.7,12.7,14.4,13.8,13.3,12.5,13.5,13.6,13.1,13.4.其分组如下:分组频数频率[12.45,12.95)[12.95,13.45)[13.45,13.95)[13.95,14.45)合计10 1.0(1)(2)根据频率分布表,在给定坐标系(如图)中画出频率分布直方图,并根据样本估计总体数据落在[12.95,13.95)中的概率.【解】(1)频率分布表:分组频数频率[12.45,12.95)20.2[12.95,13.45)30.3[13.45,13.95)40.4[13.95,14.45)10.1合计10 1.0(2)估计总体数据落在[12.95,13.95)中的概率为(0.6+0.8)×0.5=0.7.11.(12分)在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按照5天一组分组统计,绘制了频率分布直方图(如图9-2-19所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列各题.图9-2-19(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪一组获奖率较高?【解】 (1)依题意可算出第三组的频率为42+3+4+6+4+1=15,设共有n 件作品参加评比,则12n =15,∴n =60. (2)由频率分布直方图,可看出第四组上交作品数量最多, 共有60×620=18(件). (3)第四组获奖率为1018=59,第六组获奖率为260×120=23=69.所以第六组获奖率较高.12.(13分)随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图9-2-20.图9-2-20(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两名身高不低于173 cm的同学,求身高为176 cm 的同学被抽中的概率.【解】(1)乙班的平均身高较高.(可由茎叶图判断或计算得出)(2)因为甲班的平均身高为x=110∑10i=1x i=170(cm),所以甲班的样本方差s2=110∑10i=1(x i-x)2=110[2×122+2×92+2×22+12+72+82+02]=57.2.(3)从乙班这10名同学中随机抽取两名身高不低于173 cm的同学,共有10种不同的取法:(173,176),(173,178),(173,179),(173,181),(176,178),(176,179),(176,181),(178,179),(178,181),(179,181).设A表示随机事件“抽到身高为176 cm的同学”,则A中的基本事件有四个:(173,176),(176,178),(176,179),(176,181).故所求概率为P(A)=410=25.25370 631A 挚32791 8017 耗540104 9CA8 鲨30197 75F5 痵 36979 9073 遳38318 95AE 閮35024 88D0 裐23668 5C74屴QF34300 85FC 藼?25732 6484 撄。
高三数学专项训练题:用样本估计
高三数学专项训练题:用样本估计高三是十分重要的时期,同窗们要为行将到来的高考做好预备,查字典数学网提供了2021年高三数学专项训练题,希望对大家有用。
2021年高三数学专项训练题:用样本估量一、选择题1.学校为了调查先生在课外读物方面的支出状况,抽出了一个容量为n且支出在[20,60)元的样本,其频率散布直方图如下图,其中支出在[50,60)元的同窗有30人,那么n的值为( B )(A)90 (B)100 (C)900 (D)1000解析:支出在[50,60)元的频率为1-0.36-0.24-0.1=0.3,因此 =0.3,故n=100.应选B.2.容量为20的样本数据,分组后的频数如表:分组 [10,20) [20,30) [30,40) [40,50) [5 0,60) [60,70) 频数 2 3 4 5 4 2那么样本数据落在区间[10,40)的频率为( B )(A)0.35 (B)0.45 (C)0.55 (D)0.65解析:由表知[10,40)的频数为2+ 3+4=9,所以样本数据落在区间[10,40)的频率为 =0.45.应选B.3.在某次测量中失掉的A样本数据如下:82,84,84,86,86,86,88,88,88,88.假定B样本数据恰恰是A样本数据每个都加2后所得数据,那么A,B两样本的以下数字特征对应相反的是( D )(A)众数 (B)平均数 (C)中位数 (D)规范差解析:由题原来众数88变为90,中位数由86变为88,平均数添加2.所以每个数与平均数的差不变,即规范差不变.应选D.4.某中学高三从甲、乙两个班中各选出7名先生参与数学竞赛,他们取得的效果(总分值100分)的茎叶图如图,其中甲班先生效果的众数是85,乙班先生效果的中位数是83,那么x+y 的值为( B )(A)7 (B)8 (C)9 (D)10解析:由甲班先生效果的众数是85知x=5,由乙班先生效果中位数是83,得y=3.所以x+y=8.应选B.5.某校甲、乙两个班级各有编号为1,2,3,4,5的五名先生停止投篮练习,每人投10次,投中的次数如表:先生 1号 2号 3号 4号 5号甲班 6 7 7 8 7乙班 6 7 6 7 9那么以上两组数据的方差中较小的一个为s2,那么s2=( A ) (A) (B) (C) (D)4解析:甲班的平均数为 = =7,甲班的方差为乙班的平均数为 = =7,乙班的方差为∵ ,s2= .应选A.6.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎叶图,后来有一个数据模糊,无法识别,在图中以x表示:8 7 79 4 0 1 0 x 9 1那么7个剩余分数的方差为( B )(A) (B) (C)36 (D)解析:依据茎叶图,去掉1个最低分87,1个最高分99,那么 [87+94+90+91+90+(90+x)+91]=91,x=4.s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]应选B.7.(2021年高考四川卷)某学校随机抽取20个班,调查各班中有网上购物阅历的人数,所得数据的茎叶图如下图.以组距为5的数据分组成[0,5),[5,10),,[30,35),[35,40]时,所作的频率散布直方图是( A )解析:法一由茎叶图知,各组频数统计如表:分组区间 [0,5) [5,10) [10,15) [15,20) [20,25) [25,30) [30,35) [35,40]频数 1 1 4 2 4 3 3 20.01 0.01 0.04 0.02 0.04 0.03 0.03 0.02此表对应的频率散布直方图为选项A,应选A.法二选项C、D组距为10与题意不符,舍去,又由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、也区分相等,比拟A、B两个选项知A正确,应选A.二、填空题8.如下图是某赛季甲、乙两名篮球运发动每场竞赛得分的茎叶图,那么甲、乙两人竞赛得分的中位数之和是.解析:甲竞赛得分的中位数为28,乙竞赛得分的中位数为36, 所以甲、乙两人竞赛得分的中位数之和为28+36=64.答案:649.总体的各集体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5,假定要使该总体的方差最小,那么a,b的取值区分是,.解析:∵中位数为10.5,=10.5,即a+b=21.=10,s2=[(2-10)2+(3-10)22+(7-10)2+(a-10)2+(b-10)2+(12-10)2+ (13.7-10)2+(18.3-10)2+(20-10)2].令y=(a-10)2+(b-10)2=2a2-42a+221=2(a- )2+ ,当a=10.5时,y取最小值,方差s2也取最小值.a=10.5,b=10.5.答案:10.5 10.510.某商场调查旅游鞋的销售状况,随机抽取了局部顾客的购鞋尺寸,整理得如下频率散布直方图,其中直方图从左至右的前3个小矩形的面积之比为1∶2∶3,那么购鞋尺寸在[39.5,43.5)内的顾客所占百分比为.解析:后两个小组的频率为(0.0375+0.0875)2=0.25,所以前3个小组的频率为1-0.25=0.75,又前3个小组的面积比为1∶2∶3,即前3个小组的面积比即频率比为1∶2∶3.所以第三小组的频率为 0.75=0.375,第四小组的频率为0.08752=0.175,所以购鞋尺寸在[39.5,43.5)的频率为0.375+0.175=0.55= 55%.答案:55%11.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数区分为a1,a2,那么a1与a2的大小关系是.解析:去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2a1.答案:a2a1希望提供的2021年高三数学专项训练题,可以协助大家做好的高考冲刺温习,在高考中取得好效果!。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
考点65 用样本估计总体1.已知某班级部分同学一次测验的成绩统计如下茎叶图所示,则其中位数和众数分别为()A.95,94B.92,86C.99,86 D.95,91【答案】B【解析】由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故中位数为92,出现次数最多的为众数,故众数为86,故选B.2.若数据x1,x2,x3,…,x n的平均数为x=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3x n+1的平均数和方差分别为()A.5,2 B.16,2C.16,18 D.16,9【答案】C【解析】∵x1,x2,x3,…,x n的平均数为5,∴x1+x2+x3+…+x nn=5.∴3x1+3x2+3x3+…+3x nn+1=3×5+1=16.∵x1,x2,x3,…,x n的方差为2,∴3x1+1,3x2+1,3x3+1,…,3x n+1的方差是32×2=18.故选C.3.为了解学生“阳光体育”活动的情况,随机统计了n名学生的“阳光体育”活动时间(单位:分钟),所得数据都在区间[10,110]内,其频率分布直方图如图所示.已知活动时间在[10,35)内的频数为80,则n的值为()A.700 B.800C.850 D.900【答案】B【解析】根据频率分布直方图,知组距为25,所以活动时间在[10,35)内的频率为0.1.因为活动时间在[10,35)内的频数为80,所以n=800.1=800.4.为了了解某市市民对共享单车布点的满意程度,从该市市民中随机抽查若干人,按年龄(单位:岁)分组,得到样本的频率分布直方图如图,其中年龄在[30,40)内的有500人,年龄在[20,30)内的有200人,则m的值为()A.0.012 B.0.011C.0.010 D.0.009【答案】C【解析】由题意,年龄在[30,40)内的频率为0.025×10=0.25,则抽查的市民共有5000.25=2 000人.因为年龄在[20,30)内的有200人,所以m=2002 00010=0.010.5.已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为()A.95,94 B.92,86C.99,86 D.95,91【答案】B【解析】由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B.6.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是()A.0.05 B.0.25C.0.5 D.0.7【答案】D【解析】由题意知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为1420=0.7.7.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为( )A .1B .2C .3D .4【答案】B【解析】由题图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,设模糊数字为x ,由30+x +342=33,易得被污染的数字为2. 8.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x 的值等于( )A .0.12B .0.012C .0.18D .0.018【答案】D【解析】由题意知0.054×10+10×x +0.01×10+0.006×10×3=1,解得x =0.018.9.某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为( )A .6万元B .8万元C .10万元D .12万元【答案】C【解析】设11时到12时的销售额为x 万元,依题意有2.5x =0.100.40,解得x =10.10.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )【答案】A【解析】由分组可知C ,D 一定不对;由茎叶图可知[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,频率分布直方图中矩形的高应相等,可排除B.11.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A.3,5 B .5,5 C .3,7 D .5,7【答案】A【解析】由题意,甲组数据为56,62,65,70+x,74,乙组数据为59,61,67,60+y,78,要使两组数据中位数相等,有65=60+y ,所以y =5,又平均数相同,则56+62+65+70+x +745=59+61+67+65+785,解得x=3.12.生产车间的甲、乙两位工人生产同一种零件,这种零件的标准尺寸为85 mm ,现分别从他们生产的零件中各随机抽取8件检测,其尺寸用茎叶图表示如图(单位:mm),则估计( )A.甲、乙生产的零件尺寸的中位数相等 B .甲、乙生产的零件质量相当C .甲生产的零件质量比乙生产的零件质量好D .乙生产的零件质量比甲生产的零件质量好 【答案】D【解析】甲的零件尺寸是: 93,89,88,85,84,82,79,78; 乙的零件尺寸是: 90,88,86,85,85,84,84,78; 故甲的中位数是:85+842=84.5,乙的中位数是:85+852=85;故A 错误;根据数据分析,乙的数据稳定, 故乙生产的零件质量比甲生产的零件质量好, 故B ,C 错误.13.一个样本a,3,5,7的平均数是b ,且a ,b 分别是数列{2n -2}(n ∈N *)的第2项和第4项,则这个样本的方差是( ) A .3 B .4 C .5 D .6【答案】C【解析】因为样本a,3,5,7的平均数是b ,且a ,b 分别是数列{2n -2}(n ∈N *)的第2项和第4项,所以a =22-2=1,b =24-2=4,所以s 2=14[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5. 14.检测600个某产品的质量(单位:g ),得到的直方图中,前三组的长方形的高度成等差数列,后三组对应的长方形的高度成公比为0.5的等比数列,已知检测的质量在100.5~105.5之间的产品数为150,则质量在115.5~120.5的长方形高度为( )A.112 B .130C.16 D .160【答案】D【解析】根据题意,质量在100.5~105.5之间的产品数为150,频率为150600=0.25;前三组的长方形的高度成等差数列,设公差为d , 则根据频率和为1,得(0.25-d )+0.25+(0.25+d )+12(0.25+d )+14(0.25+d )=1,解得d =112.所以质量在115.5~120.5的频率是14×⎝⎛⎭⎫0.25+112=112,对应小长方形的高为112÷5=160. 15.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个小长方形的面积和的25,且样本容量为140,则中间一组的频数为( )A .28B .40C .56D .60 【答案】B【解析】设中间一组的频数为x ,因为中间一个小长方形的面积等于其他8个小长方形的面积和的25,所以其他8组的频数和为52x ,由x +52x =140,解得x =40.16.在样本的频率分布直方图中,共有11个小长方形.若中间一个小长方形的面积等于其他10个小长方形的面积和的14,且样本容量为160,则中间一组的频数为________.【答案】32【解析】由题意可设中间小长方形的面积为x ,则其余小长方形的面积和为4x ,所以5x =1,x =0.2,则中间一组的频数为160×0.2=32.17.某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n -m 的值是________.【答案】6【解析】由甲组学生成绩的平均数是88,可得70+80×3+90×3+8+4+6+8+2+m +57=88,解得m=3.由乙组学生成绩的中位数是89,可得n =9,所以n -m =6.18.若1,2,3,4,m 这五个数的平均数为3,则这五个数的方差为________. 【答案】2【解析】由1+2+3+4+m 5=3,得m =5,所以这五个数的方差为15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.19.某学校共有教师300人,其中中级教师有192人,高级教师与初级教师的人数比为5∶4.为了解教师专业发展需求,现采用分层抽样的方法进行调查,在抽取的样本中有中级教师64人,则该样本中的高级教师人数为________. 【答案】20【解析】由题意可知,高级教师有(300-192)×55+4=60(人),抽样比k =n N =64192=13.故该样本中高级教师的人数为60×13=20.20.为了普及环保知识,增强环保意识,某大学有300名员工参加环保知识测试,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.现在要从第1,3,4组中用分层抽样的方法抽取16人,则在第4组中抽取的人数为________.【答案】6【解析】根据频率分布直方图得,第1,3,4组的频率之比为1∶4∶3,所以用分层抽样的方法抽取16人时,在第4组中应抽取的人数为16×31+4+3=6.21.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如表:学生 1号 2号 3号 4号 5号 甲班67787【答案】25【解析】由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25.22.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:(1)求a 、b 、c 的值;(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分. 【答案】【解析】(1)由题意可得,b =1-(0.015+0.125+0.5+0.31)=0.05, a =200×0.05=10,c =200×0.5=100.(2)根据已知,在抽出的200人的数学成绩中,及格的有162人. 所以P =162200=81100=0.81.(3)这次数学测验样本的平均分为x =16×3+32.1×10+55×25+74×100+88×62200=73,所以这次数学测验的年级平均分大约为73分.23.为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:小时)如下:248 256 232 243 188 268 278 266 289 312 274 296 288 302 295 228 287 217 329 283 (1)完成下面的频率分布表,并做出频率分布直方图;[220,240)[240,260)[260,280)[280,300)[300,320)[320,340]合计0.05(2)估计8(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.【答案】(1)频率分布表及频率分布直方图如下所示:分组频数频率频率/组距[180,200)10.050.002 5[200,220)10.050.002 5[220,240)20.100.005 0[240,260)30.150.007 5[260,280)40.200.010 0[280,300)60.300.015 0[300,320)20.100.005 0[320,340]10.050.002 5合计20 1.000.05(2) 280 (3) 269【解析】(1)频率分布表及频率分布直方图如下所示:分组频数频率频率/组距[180,200)10.050.002 5[200,220)10.050.002 5[220,240)20.100.005 0[240,260)30.150.007 5[260,280) 4 0.20 0.010 0 [280,300) 6 0.30 0.015 0 [300,320) 2 0.10 0.005 0 [320,340] 1 0.05 0.002 5 合计201.000.05(2)由题意可得8×(0.30+0.10+0.05)=3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x =190×0.05+210×0.05+230×0.10+250×0.15+270×0.20+290×0.30+310×0.10+330×0.05=269(小时),所以样本的平均无故障连续使用时限为269小时.24.如图是某市有关部门根据该市干部的月收入情况画出的样本频率分布直方图,已知图中第一组的频数为4 000,请根据该图提供的信息,解答下列问题.(1)为了分析干部的收入与年龄、职业等方面的关系,必须从样本中按月收入用分层抽样方法抽出100人作进一步分析,则月收入在[1 500,2 000)的这组中应抽取多少人? (2)试估计样本数据的中位数. 【答案】(1) 20 (2) 1 750【解析】(1)由题知,月收入在[1 000,1 500)的频率为0.000 8×500=0.4,又月收入在[1 000,1 500)的有4 000人,故样本容量n =4 0000.4=10 000.4 又月收入在[1 500,2 000)的频率为0.000 4×500=0.2,月收入在[1 500,2 000)的人数为0.2×10 000=2 000,从10 000人中用分层抽样的方法抽出100人,则月收入在[1 500,2 000)的这组中应抽取100×2 00010 000=20(人). (2)月收入在[1 000,2 000)的频率为0.4+0.2=0.6>0.5,故样本数据的中位数为1 500+0.5-0.40.000 4=1 500+250=1 750.25.随着移动互联网的发展,与餐饮美食相关的手机应用软件层出不穷.现从使用A 和B 两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如下:(1)试估计使用A 款订餐软件的50个商家的“平均送达时间”的众数及平均数;(2)根据以上抽样调查数据,将频率视为概率,回答下列问题:①能否认为使用B 款订餐软件“平均送达时间”不超过40分钟的商家达到75%?②如果你要从A 和B 两款订餐软件中选择一款订餐,你会选择哪款?说明理由.【答案】(1) 40 (2) 可以认为【解析】(1)依题意可得,使用A 款订餐软件的50个商家的“平均送达时间”的众数为55.使用A 款订餐软件的50个商家的“平均送达时间”的平均数为15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40.(2)①使用B 款订餐软件“平均送达时间”不超过40分钟的商家的比例估计值为0.04+0.20+0.56=0.80=80%>75%.故可以认为使用B 款订餐软件“平均送达时间”不超过40分钟的商家达到75%.②使用B 款订餐软件的50个商家的“平均送达时间”的平均数为15×0.04+25×0.2+35×0.56+45×0.14+55×0.04+65×0.02=35<40,所以选B 款订餐软件.。