高考必考题型复习 用样本估计总体

合集下载

用样本的数字特征估计总体-高考数学复习

用样本的数字特征估计总体-高考数学复习

1. (多选)如图是某班50名学生期中考试数学成绩的频率分布直方
图,其中成绩分组区间是[40,50),
[50,60),[60,70),[70,80),
[80,90),[90,100],则下列说
法正确的是(

A. 图中的 x 的值为0.018
B. 该班50 名学生期中考试数学成绩的众数是75
C. 该班50 名学生期中考试数学成绩的中位数是72
目录
1
C O N T E N T S
2
3
知识 逐点夯实
考点 分类突破
课时 跟踪检测
PART
1
知识 逐点夯实
课前自修
必备知识 系统梳理 基础重落实
目录
高中总复习·数学
1. 总体百分位数的估计
(1)百分位数
定义
意义
百 一组数据的第 p 百分位数是这样一个值,
分 它使得这组数据中 至少
有 p %的数据小
为 ,第二层抽取 n 个,即 y 1, y 2,…, yn ,平均数为 ,则


x 1, x 2,…, xm , y 1, y 2,…, yn 的平均数 =




.


(2)中位数:将一组数据按大小依次排列,处于
最中间 位置

的一个数据(或最中间两个数据的平均数)叫做这组数据的
目录
高中总复习·数学
2. 平均数、方差的公式推广
若数据 x 1 , x 2 ,…, x n 的平均数为 ത ,方差为 s 2 ,那么 mx 1 +
a , mx 2 + a , mx 3 + a ,…, mx n + a 的平均数是 m ത + a ,方

最新高考一轮总复习《10.2 用样本估计总体》

最新高考一轮总复习《10.2 用样本估计总体》

如果直方图在右边“拖尾”(如图(2)),那么平均数大于中位数;
如果直方图在左边“拖尾”(如图(3)),那么平均数小于中位数.
问题思考
在频率分布直方图中,如何确定中位数?
在频率分布直方图中,中位数左边和右边的直方图的面积相等.
4.方差和标准差
假设一组数据是 x1,x2,…,xn,用表示这组数据的平均数.
解 ①由题图可得甲、乙两人五次测试的成绩得分分别为
甲:10,13,12,14,16;乙:13,14,12,12,14.
则甲 =
2

2

=
=
10+13+12+14+16
=13,

5
=
13+14+12+12+14
=13,
5
1
2
2
2
2
2
×[(10-13)
+(13-13)
+(12-13)
+(14-13)
中的中间数据,由于样本数据在区间
[13,14)内的频率为0.02,在区间[14,15)内
的频率为0.18,在区间[15,16)内的频率为
0.36,0.02+0.18+0.36>0.5,所以中位数落
在区间[15,16)内,设中位数为x,
95
则0.02+0.18+(x-15)×0.36=0.5,得 x= 6 .
解离散程度参数的统计含义.
3.结合实例,能用样本估计总体的取值规律.
4.结合实例,能用样本估计百分位数,理解百分位数的统计含义.
备考指导
用样本估计总体在高考中主要以选择题或填空题的形式出现,在概率、统

第2节 用样本估计总体--2025年高考数学复习讲义及练习解析

第2节  用样本估计总体--2025年高考数学复习讲义及练习解析

第二节用样本估计总体课标解读考向预测1.会用统计图表对总体进行估计,会求n 个数据的第p 百分位数.2.能用样本的数字特征估计总体集中趋势和总体离散程度.用样本估计总体在高考中出题频率较高,常结合频率分布直方图、样本的数字特征出题.预计2025年高考将会以与统计图表的识读、成对数据的统计分析相综合的形式呈现.必备知识——强基础1.总体百分位数的估计(1)第p 百分位数的定义一般地,一组数据的第p 百分位数是这样一个值,它使得这组数据中至少有01p %的数据小于或等于这个值,且至少有(100-p )%的数据大于或等于这个值.(2)四分位数常用的分位数有第25百分位数,第50百分位数(即中位数),第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第0225百分位数也称为第一四分位数或下四分位数,第0375百分位数也称为第三四分位数或上四分位数.2.样本的数字特征(1)众数:一组数据中04出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于05最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把06a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数.(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].3.总体平均数、方差、标准差与样本平均数、方差、标准差名称定义总体均值(总体平均数)、方差、标准差一般式:如果总体中有N个个体,它们的变量值分别为Y1,Y2,…,Y N,则称Y-=Y1+Y2+…+Y NN=1N∑Ni=1Y i为07总体均值,又称总体平均数,称S2=1N∑Ni=1(Y i-Y-)2为08总体方差,S=S2为09总体标准差加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体均值为Y-=101N∑ki=1f i Y i,总体方差为S2=111N∑ki=1f i(Y i-Y-)2样本均值(样本平均数)、方差、标准差如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,y n,则称y-=y1+y2+…+y nn=1n∑ni=1y i为12样本均值,又称样本平均数,称s2=1n∑ni=1(y i-y-)2为13样本方差,s=s2为14样本标准差说明:(1)在简单随机抽样中,我们常用样本平均数、方差、标准差去估计总体平均数、方差、标准差.(2)总体平均数、方差、标准差是一个确定的数,样本平均数、方差、标准差具有随机性(因为样本具有随机性).(3)一般情况下,样本量越大,估计越准确1.频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.平均数、方差的公式推广若数据x1,x2,…,x n的平均数为x-,方差为s2,那么mx1+a,mx2+a,mx3+a,…,mx n +a的平均数是m x-+a,方差为m2s2.1.概念辨析(正确的打“√”,错误的打“×”)(1)对一组数据来说,平均数和中位数总是非常接近.()(2)一组数据的方差越大,说明这组数据越集中.()(3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.()答案(1)×(2)×(3)√2.小题热身(1)(人教A 必修第二册习题9.2T1改编)下列一组数据的第25百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A .3.2B .3.0C .4.4D .2.5答案A解析把该组数据按照由小到大的顺序排列,可得2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i =10×25%=2.5,不是整数,得第3个数据3.2是第25百分位数.(2)(多选)(人教B 必修第二册习题5-1B T3改编)给出一组数据:1,3,3,5,5,5,下列说法正确的是()A .这组数据的极差为4B .这组数据的平均数为3C .这组数据的中位数为4D .这组数据的众数为3和5答案AC解析这组数据的极差为5-1=4,A 正确;这组数据的平均数为1+3×2+5×36=113,B 错误;这组数据的中位数为3+52=4,C 正确;这组数据的众数为5,D 错误.(3)(人教B 必修第二册练习B T4改编)某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用比例分配的分层随机抽样的方法从3个分厂生产的电子产品中共抽取100件进行使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的平均使用寿命分别为980h ,1020h ,1032h ,则抽取的100件产品的平均使用寿命为________h.答案1013解析由比例分配的分层随机抽样的知识可知,从第一、二、三分厂抽取的电子产品件数分别为25,50,25,则抽取的100件产品的平均使用寿命为1100×(980×25+1020×50+1032×25)=1013(h).(4)已知一组数据的频率分布直方图如图,则众数是________,平均数是________.答案6567解析因为最高小长方形底边中点的横坐标为65,所以众数为65;平均数x -=(55×0.030+65×0.040+75×0.015+85×0.010+95×0.005)×10=67.考点探究——提素养考点一百分位数的计算例1(1)(2023·江苏南通海安质量监测)“双减”政策实施后,学生的课外阅读增多.某班50名学生到图书馆借书数量统计如下:借书数量/本5678910频数/人58131194则这50名学生的借书数量的上四分位数是()A .8B .8.5C .9D .10答案C解析由50×75%=37.5,故第75百分位数为借书数量从小到大排序后的第38个,又5+8+13+11=37<38<5+8+13+11+9=46,故上四分位数(第75百分位数)是9.(2)某校为了了解高三年级学生的身体素质状况,在开学初举行了一场身体素质体能测试,以便对体能不达标的学生进行有针对性的训练,促进他们体能的提升,现从整个年级测试成绩中抽取100名学生的测试成绩,并把测试成绩分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组,绘制成频率分布直方图(如图所示).其中分数在[90,100]这一组内的纵坐标为a ,则该次体能测试成绩的80%分位数约为________分.答案92解析由频率分布直方图知,10×(0.002+0.004+0.014+0.020+a+0.035)=1,得a=0.025.因为0.02+0.04+0.14+0.20+0.35=0.75,所以该次体能测试成绩的80%分位数落在[90,100]内,设其为x,则由(x-90)×0.025=0.05,解得x=92.【通性通法】计算一组n个数据第p百分位数的步骤【巩固迁移】1.为了养成良好的运动习惯,某人记录了自己一周内每天的运动时长(单位:分钟),分别为53,57,45,61,79,49,x,若这组数据的第80百分位数与第60百分位数的差为3,则x =()A.58或64B.59或64C.58D.59答案A解析将已知的6个数从小到大排序为45,49,53,57,61,79.若x≤57,则这组数据的第80百分位数与第60百分位数分别为61和57,它们的差为4,不符合条件;若x≥79,则这组数据的第80百分位数与第60百分位数分别为79和61,它们的差为18,不符合条件;若57<x<79,则这组数据的第80百分位数与第60百分位数分别为x和61(或61和x),则|x-61|=3,解得x=58或x=64.故选A.2.(2024·安徽十校联考)学校组织班级知识竞赛,某班的8名学生的成绩(单位:分)分别是68,63,77,76,82,88,92,93,则这8名学生成绩的75%分位数是()A.88分B.89分C.90分D.92分答案C解析8名学生的成绩从小到大排列为63,68,76,77,82,88,92,93,因为8×75%=6,所以75%分位数为第6个数和第7个数的平均数,即12×(88+92)=90(分).考点二总体集中趋势的估计例2(1)(2024·山东临沂模拟)10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则()A.a>b>c B.c>b>aC.c>a>b D.b>c>a答案B解析将生产的件数由小到大排列为10,12,14,14,15,15,16,17,17,17,a=110×(15+17+14+10+15+17+17+16+14+12)=14.7,b=15,c=17.因此c>b>a.故选B.(2)(多选)(2023·湖北荆州中学模拟)某公司为提高职工政治素养,对全体职工进行了一次时事政治测试,随机抽取了100名职工的成绩,并将其制成如图所示的频率分布直方图,以样本估计总体,则下列结论中正确的是()A.该公司职工的测试成绩不低于60分的人数约占总人数的80%B.该公司职工测试成绩的中位数约为70分C.该公司职工测试成绩的平均值约为68分D.该公司职工测试成绩的众数约为60分答案BC解析对于A,该公司职工的测试成绩不低于60分的频率为(0.02+0.015)×20=0.70,∴该公司职工的测试成绩不低于60分的人数约占总人数的70%,故A错误;对于B,测试成绩在[20,60)的频率为(0.005+0.01)×20=0.3,测试成绩在[60,80)的频率为0.02×20=0.4,∴该公司职工测试成绩的中位数约为60+0.5-0.30.4×20=70分,故B 正确;对于C ,该公司职工测试成绩的平均值约为x -=30×0.005×20+50×0.01×20+70×0.02×20+90×0.015×20=68分,故C 正确;对于D ,该公司职工测试成绩的众数约为60+802=70分,故D 错误.故选BC.【通性通法】频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:各组区间的中点值与对应频率之积的和.【巩固迁移】3.某市市民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w =3时,估计该市居民该月的人均水费.解(1)如题图所示,用水量在[0.5,2)的频率为(0.2+0.3+0.4)×0.5=0.45,用水量在[0.5,3)的频率为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于2立方米的频率为0.45,用水量小于等于3立方米的频率为0.85,又w 为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w 至少定为3.(2)当w =3时,该市居民该月的人均水费估计为(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=10.5(元).即当w =3时,该市居民该月的人均水费估计为10.5元.考点三总体离散程度的估计例3甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.解(1)x -甲=18×(82+81+79+78+95+88+93+84)=85,x -乙=18×(92+95+80+75+83+80+90+85)=85,s 2甲=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,s 2乙=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41.(2)由(1)知x -甲=x -乙,s 2甲<s 2乙,甲的成绩较稳定,所以派甲参赛比较合适.【通性通法】标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.【巩固迁移】4.(2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为x i ,y i (i =1,2,…,10).试验结果如下:试验序号i 12345678910伸缩率x i545533551522575544541568596548伸缩率y i536527543530560533522550576536记z i =x i -y i (i =1,2,…,10),z 1,z 2,…,z 10的样本平均数为z -,样本方差为s 2.(1)求z -,s 2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果z -≥2s 210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).解(1)x -=110×(545+533+551+522+575+544+541+568+596+548)=552.3,y -=110×(536+527+543+530+560+533+522+550+576+536)=541.3,z -=x --y -=552.3-541.3=11,z i =x i -y i 的值分别为9,6,8,-8,15,11,19,18,20,12,故s 2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)由(1)知,z -=11,2s 210=2 6.1=24.4,故有z -≥2s 210,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.考点四分层随机抽样的均值与方差例4为调查某地区中学生每天的睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间的均值为9小时,方差为0.5,抽取高中生1200人,其每天睡眠时间的均值为8小时,方差为1,则估计该地区中学生每天睡眠时间的方差为________.答案 1.04解析该地区中学生每天睡眠时间的平均数为8001200+800×9+12001200+800×8=8.4(小时),该地区中学生每天睡眠时间的方差为8001200+800×[0.5+(9-8.4)2]+12001200+800×[1+(8-8.4)2]=1.04.【通性通法】在分层随机抽样中,如果第一层的样本量为m ,平均值为x -,方差为s 21;第二层的样本量为n ,平均值为y -,方差为s 22,则样本的平均值为w -=m x -+n y -m +n,样本的方差为s 2=1m +n {m [s 21+(x --w -)2]+n [s 22+(y --w -)2]}.特别地,在比例分配的分层随机抽样中,我们可以直接用样本平均数w -估计总体平均数W -,用样本方差s 2估计总体方差S 2.【巩固迁移】5.(2023·安徽宣城模拟)某学校有男生400人,女生600人,为调查该校全体学生每天运动时间的情况,按照男女比例通过分层随机抽样的方法取到一个样本,样本中男生每天运动时间的平均值为80分钟,方差为10,女生每天运动时间的平均值为60分钟,方差为20.结合数据,估计该校全体学生每天运动时间的方差为()A .15B .16C .96D .112答案D解析由题意,用比例分配的分层随机抽样的方式抽取样本,且该样本中男、女生的比为400600=23,不妨设抽取的男、女生人数分别为2n ,3n ,那么样本的总数为5n .则所有样本的平均值为15n ×(80×2n +60×3n )=68,方差为2n 5n ×[10+(80-68)2]+3n5n×[20+(60-68)2]=112.故选D.6.为了了解全区科级干部“党风廉政知识”的学习情况,采用比例分配的分层随机抽样方法,从全区320名正科级干部和1280名副科级干部中抽取40名科级干部预测全区科级干部“党风廉政知识”的学习情况.现将这40名科级干部分为正科级干部组和副科级干部组,利用同一份试卷分别进行测试.经过测试后,两组各自将测试成绩统计分析如下表:分组人数平均成绩正科级干部组a 80副科级干部组b70则40名科级干部测试成绩的平均分x -=________.答案72解析样本量与总体中的个体数的比为40320+1280=140,则抽取的正科级干部人数a =320×140=8,副科级干部人数b =1280×140=32.所以这40名科级干部测试成绩的平均分x -=80×8+70×3240=72.课时作业一、单项选择题1.(2023·天津河西区三模)学校组织班级知识竞赛,某班的12名学生的成绩(单位:分)分别是58,67,73,74,76,82,82,87,90,92,93,98,则这12名学生成绩的第三四分位数是()A .88分B .89分C .90分D .91分答案D解析12名学生的成绩(单位:分)由小到大排列为58,67,73,74,76,82,82,87,90,92,93,98,∵12×75%=9,∴这12名学生成绩的第三四分位数是90+922=91(分).2.(2024·重庆南开中学月考)为了解某高中学生的身高情况,按年级采用比例分配的分层随机抽样的方法抽取样本,抽到高一、高二、高三年级的学生人数分别为100,200,300,样本中高一、高二、高三这三个年级学生的平均身高分别为x -,y -,z -,则估计该高中学生的平均身高为()A .16x -+13y -+12z-B .x -+y -+z -2C .12x -+13y -+16z-D .x -+y -+z -3答案A解析样本量为100+200+300=600,样本平均数为100600x -+200600y -+300600z -=16x -+13y -+12z -,所以估计该高中学生的平均身高为16x -+13y -+12z -.3.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则()A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差答案B解析讲座前问卷答题的正确率的中位数为70%+75%2=72.5%>70%,故A 错误;讲座后问卷答题的正确率只有一个是80%,4个是85%,剩下的全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,故B 正确;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,故C 错误;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,故D 错误.故选B.4.给定一组数据5,5,4,3,3,3,2,2,2,1,则这组数据()A .众数为2B .平均数为2.5C .方差为1.6D .标准差为4答案C解析由题中数据可得,众数为2和3,故A 错误;平均数x -=5+5+…+2+110=3,故B错误;方差s 2=(5-3)2+(5-3)2+…+(2-3)2+(1-3)210=1.6,标准差为 1.6≠4,故C 正确,D 错误.5.(2023·河北唐山一中模拟)对某种电子元件使用寿命跟踪调查,所得样本的频率分布直方图如图.由图可知,这一批电子元件使用寿命的85%分位数为()A .500hB .450hC .350hD .550h答案A解析电子元件寿命小于500h 的百分比为+32000+1400+85%,则这批电子元件使用寿命的85%分位数为500h .故选A .6.某市教育部门组织高中教师在暑假期间进行培训,培训后统一举行测试.随机抽取100名教师的测试成绩(单位:分,满分100分)进行统计,得到如图所示的频率分布折线图,则下列说法正确的是()A .这100名教师的测试成绩的极差是20分B .这100名教师的测试成绩的众数是90分C .这100名教师的测试成绩的中位数是87.5分D .这100名教师中测试成绩不低于90分的人数占比超过50%答案C解析对于A ,由题意知,这100名教师的测试成绩的最高分与最低分无法确定,故极差无法确定,故A 错误;对于B ,由题图易知这100名教师的测试成绩的众数为87.5分,故B 错误;对于C ,设这100名教师的测试成绩的中位数为x 分,则(0.02+0.04)×5+(x -85)×0.08=0.5,解得x =87.5,故C 正确;对于D ,这100名教师中测试成绩不低于90分的人数占比为(0.03+0.03)×5×100%=30%,30%<50%,故D 错误.故选C.7.已知两组数据x 1,x 2,x 3,x 4,x 5和y 1,y 2,y 3,y 4,y 5的中位数、方差均相同,则两组数据合并为一组数据后,()A .中位数一定不变,方差可能变大B .中位数一定不变,方差可能变小C .中位数可能改变,方差可能变大D .中位数可能改变,方差可能变小答案A解析不妨设x 1≤x 2≤x 3≤x 4≤x 5,y 1≤y 2≤y 3≤y 4≤y 5,则两组数据x 1,x 2,x 3,x 4,x 5和y 1,y 2,y 3,y 4,y 5的中位数分别为x 3,y 3,则x 3=y 3,两组数据合并为一组数据后,中位数为x 3+y 32=x 3=y 3,故中位数一定不变,设x 1,x 2,x 3,x 4,x 5的平均数为x -,方差为s 21,y 1,y 2,y 3,y 4,y 5的平均数为y -,方差为s 21,则∑5i =1x i =5x -,∑5i =1x 2i =5(s 21+x -2),∑5i =1y i =5y -,∑5i =1y 2i =5(s 21+y -2),则两组数据合并为一组数据后的平均数z -=110(∑5i =1x i +∑5i =1y i )=110(5x -+5y -)=x -+y -2,方差s 2=110[∑5i =1(x i -z -)2+∑5i =1(y i -z -)2]=110(∑5i =1x 2i +∑5i =1y 2i -10z -2)=110[5(s 21+x -2)+5(s 21+y -2)-10z -2]=s 21+x -2+y -22-z -2=s 21+x -2+y -22-=s 21+(x --y -)24≥s 21,当且仅当x -=y -时,等号成立,故方差可能变大,一定不会变小.故选A.8.某高校分配给某中学一个保送名额,该中学进行校内举荐评选,评选条件除了要求该生获得该校“三好学生”称号,还要求学生在近期连续3次大型考试中,每次考试的名次都在全校前5名(每次考试无并列名次).现有甲、乙、丙、丁四位同学都获得了“三好学生”称号,四位同学在近期连续3次大型考试名次的数据分别为甲同学:平均数为3,众数为2;乙同学:中位数为3,众数为3;丙同学:众数为3,方差小于3;丁同学:平均数为3,方差小于3.则一定符合推荐要求的同学是()A .甲和乙B .乙和丁C .丙和丁D .甲和丁答案D解析对于甲同学,平均数为3,众数为2,则3次考试的成绩的名次为2,2,5,满足要求;对于乙同学,中位数为3,众数为3,可举反例:3,3,6,不满足要求;对于丙同学,众数为3,方差小于3,可举特例:3,3,6,则平均数为4,方差s 2=13×[2×(3-4)2+(6-4)2]=2<3,不满足要求;对于丁同学,平均数为3,方差小于3,设丁同学3次考试的名次分别为x 1,x 2,x 3,若x 1,x 2,x 3中至少有一个大于等于6,则方差s 2=13[(x 1-3)2+(x 2-3)2+(x 3-3)2]>3,与已知条件矛盾,所以x 1,x 2,x 3均不大于5,满足要求.二、多项选择题9.(2024·重庆模拟)一组数据按从小到大的顺序排列为2,3,3,x ,7,10,若这组数据的平均数是中位数的54倍,则下列说法正确的是()A .x =4B .众数为3C .中位数为4D .方差为233答案BCD解析一组数据按从小到大的顺序排列为2,3,3,x ,7,10,∵这组数据的平均数是中位数的54倍,∴16×(2+3+3+x +7+10)=54×3+x 2,解得x =5,故A 错误;众数为3,故B 正确;中位数为3+52=4,故C 正确;平均数为16×(2+3+3+5+7+10)=5,方差为16×[(2-5)2+(3-5)2+(3-5)2+(5-5)2+(7-5)2+(10-5)2]=233,故D 正确.故选BCD.10.(2023·湖北武汉二中模拟)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列说法正确的是()A .甲的成绩的平均数等于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的第80百分位数等于乙的成绩的第80百分位数D .甲的成绩的极差大于乙的成绩的极差答案AC解析由题图可得,甲的成绩的平均数为4+5+6+7+85=6,乙的成绩的平均数为3×5+6+95=6,A 正确;甲的成绩的中位数为6,乙的成绩的中位数为5,B 错误;甲的成绩的第80百分位数为7+82=7.5,乙的成绩的第80百分位数为6+92=7.5,所以二者相等,C 正确;甲的成绩的极差为8-4=4,乙的成绩的极差为9-5=4,D 错误.故选AC.三、填空题11.(2023·四川资阳中学第一次质量检测)某歌手电视大奖赛中,七位评委对某选手打出如下分数:7.9,8.1,8.4,8.5,8.5,8.7,9.9,则其第50百分位数为________.答案8.5解析由题意可知,共有7个数据并且已经按照从小到大的顺序排列,其第50百分位数即为这组数据的中位数,所以其第50百分位数是第4个数据,为8.5.12.(2024·江西八所重点中学联考)某工厂为了解产品的生产情况,随机抽取了50个样本,若样本数据x 1,x 2,…,x 50的方差为8,则数据3x 1-1,3x 2-1,…,3x 50-1的方差为________.答案72解析样本数据x 1,x 2,…,x 50的方差为8,所以数据3x 1-1,3x 2-1,…,3x 50-1的方差为32×8=72.13.若已知30个数x 1,x 2,…,x 30的平均数为6,方差为9;现从原30个数中剔除x 1,x 2,…,x 10这10个数,且剔除的这10个数的平均数为8,方差为5,则剩余的20个数x 11,x 12,…,x 30的方差为________.答案8解析由题意得x 1+x 2+…+x 30=6×30=180,x 21+x 22+…+x 230=9×30+30×62=1350,x 1+x 2+…+x 10=8×10=80,x 21+x 22+…+x 210=5×10+10×82=690,所以剩余的20个数的平均数为180-8020=5,x 211+x 212+…+x 230=1350-690=660,所以剩余的20个数的方差为660-20×2520=8.14.已知一个样本的样本量为10,平均数为15,方差为3,现从样本中去掉一个数据15,此时样本的平均数为x -,方差为s 2,则x -=________,s 2=________.答案15103解析设这10个数据为x 1,x 2,…,x 9,15,则x -=15×10-159=15.又s 2=(x 1-15)2+(x 2-15)2+…+(x 9-15)29,(x 1-15)2+(x 2-15)2+…+(x 9-15)2+(15-15)210=3,所以s 2=309=103.四、解答题15.(2023·哈尔滨九中三模)某经销商采购了一批水果,根据某些评价指标进行打分,现从中随机抽取20筐(每筐1kg),得分数据如下:17,23,29,31,34,40,46,50,51,51,58,62,62,68,71,78,79,80,85,95.根据以往的大数据认定:得分在区间(0,25],(25,50],(50,75],(75,100]内的分别对应四级、三级、二级、一级.(1)试求这20筐水果得分的平均数;(2)用样本估计总体,经销商参考以下两种销售方案进行销售:方案一:将得分的平均数换算为等级,按换算后的等级出售;方案二:分等级出售.不同等级水果的售价如下表所示:等级一级二级三级四级售价(万元/吨)21.81.41.2请从经销商的角度,根据售价分析采用哪种销售方案较好,并说明理由.解(1)这20筐水果得分的平均数为120×(17+23+29+31+34+40+46+50+51+51+58+62+62+68+71+78+79+80+85+95)=55.5.(2)方案一:由于得分的平均数55.5∈(50,75],所以可以估计这批水果的销售单价为1.8万元/吨.方案二:设这批水果售价的平均值为x -万元/吨,由已知数据得,得分在(0,25]内的有17,23,共2个,所以估计四级水果所占比例为110;得分在(25,50]内的有29,31,34,40,46,50,共6个,所以估计三级水果所占比例为310;得分在(50,75]内的有51,51,58,62,62,68,71,共7个,所以估计二级水果所占比例为720;得分在(75,100]内的有78,79,80,85,95,共5个,所以估计一级水果所占比例为14.则x -=2×14+1.8×720+1.4×310+1.2×110=1.67(万元/吨).所以从经销商的角度考虑,采用方案一的售价较高,所以采用方案一较好.16.电动摩托车的续航里程,是指电动摩托车在蓄电池满电量的情况下一次能行驶的最大距离,为了解A ,B 两个不同型号电动摩托车的续航里程,现从某卖场库存电动摩托车中随机抽取A ,B 两个型号的电动摩托车各5台,在相同条件下进行测试,统计结果如下:电动摩托车编号12345A 型续航里程(km)120125122124124B 型续航里程(km)118123127120a已知A ,B 两个型号被测试电动摩托车续航里程的平均值相等,(1)求a 的值;(2)小李需要购买一款电动摩托车,从中位数和方差相结合的角度,帮小李选择一款电动摩托车,并说明理由.解(1)因为A ,B 两个型号被测试电动摩托车续航里程的平均值相等,所以120+125+122+124+1245=118+123+127+120+a5,解得a =127.(2)A 型号被测试电动摩托车续航里程从小到大排列为120,122,124,124,125;B 型号被测试电动摩托车续航里程从小到大排列为118,120,123,127,127.所以A 型号被测试电动摩托车续航里程的中位数为124km ,B 型号被测试电动摩托车续航里程的中位数为123km ,即A 型号的中位数大于B 型号的中位数,A 型号被测试电动摩托车续航里程的平均数为x -A =120+125+122+124+1245=123,则A 型号被测试电动摩托车续航里程的方差为s 2A =(120-123)2+(125-123)2+(122-123)2+2×(124-123)25=165,B 型号被测试电动摩托车续航里程的方差为s 2B =(118-123)2+(123-123)2+(120-123)2+2×(127-123)25=665,所以B 型号的方差大于A 型号的方差,所以B 型号被测试电动摩托车续航里程数不稳定,波动比较大,而A 型号的中位数大于B 型号的中位数,所以小李应选择A 型号电动摩托车.17.(多选)(2024·重庆诊断)为了解市民对亚运会体育节目收视情况,随机抽取了200名观众进行调查,其中女性占40%.根据调查结果分别绘制出男、女观众收看亚运会系列节目时长的频率分布直方图,则下列说法正确的是()A .m =0.1B .男观众收看节目时长的众数为8小时C .女观众收看节目的平均时长小于男观众收看节目的平均时长D .收看节目达到9小时的观众中女性人数是男性人数的13答案ABC解析由男观众收看亚运会系列节目时长的频率分布直方图,得(0.050+0.075×2+0.200+m )×2=1,解得m =0.1,故A 正确;由男观众收看亚运会系列节目时长的频率分布直方图,得男观众收看节目时长的众数为7+92=8小时,故B 正确;女观众收看节目的平均时长为(4×0.1+6×0.2+8×0.15+10×0.05)×2=6.6(小时),男观众收看节目的平均时长为(4×0.05+6×0.075+8×0.2+10×0.1+12×0.075)×2=8.3(小时),女观众收看节目的平均时长小于男观众收看节目的平均时长,故C 正确;收看节目达到9小时的观众中,女性人数为200×40%×0.05×2=8,男性人数为200×60%×0.175×2=42,故D 错误.18.(多选)(2023·湖北武汉调研)某市今年夏天迎来罕见的高温炎热天气,当地气象部门统计。

2024版高考数学总复习:用样本估计总体课件

2024版高考数学总复习:用样本估计总体课件
据的平均数.
4.样本的数字特征
1
(x
+x
+…+x
)
1
2
n
如果有n个数据x1,x2,…,xn,那么平均数为=________________,
ҧ

标准差为s=
1

1 − ҧ
2
+ 2 − ҧ
2
+ ⋯ + − ҧ
2
1
2+(x -)
2+…+(x -)
2]
[(x

)
ҧ
ҧ
ҧ
1
2
n

方差为s2=____________________________________.
2
3
4
5
D
解析:由频率分布直方图知,评分在区间[82,86)内的影视作品
的频率为(86-82)×0.05=0.2,故评分在区间[82,86)内的影视作品
数量是400×0.2=80.
1
2
3
4
5
5.已知样本量为200,在样本的频率分布直方图中,共有n个小长方
形.若中间一个小长方形的面积等于其余(n-1)个小长方形面积和
第二步:决定组数和组距,组距=______;
组数
分组
第三步:将数据_____,通常对组内数值所在区间取左闭右开区间,
最后一组取闭区间;
第四步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图(如图).
频率
组距
横轴表示样本数据,纵轴表示______,每个小长方形的面积表示样

(1)若数据x1 ,x2 ,…,xn 的平均数为 ,则mx

2025年高考数学一轮复习课时作业-用样本估计总体【含解析】

2025年高考数学一轮复习课时作业-用样本估计总体【含解析】

2025年高考数学一轮复习课时作业-用样本估计总体【原卷版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.642.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.183.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,924.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.56.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.7.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.8.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.2810.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.12.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.2025年高考数学一轮复习课时作业-用样本估计总体【解析版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.64【解析】选C.将6名学生该日在校体育锻炼时长记录从小到大排列为45,51,59,62,66,70,因为80%×6=4.8,所以该组数据的80%分位数为66.2.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.18【解析】选B.志愿者的总人数为20=50,所以第三组的人数为50×0.36=18,(0.24+0.16)×1有疗效的人数为18-6=12.3.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,92【解析】选D.因为一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,所以另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为3×2-2=4,方差为32×12=92.4.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等【解析】选D.将A,B两家企业10天内已处理的废水的某项指标值的检测结果从小到大排列:A企业:43,63,65,72,73,75,78,81,86,98.B企业:37,58,61,65,68,68,71,77,82,94.A企业该指标值的极差为98-43=55,B企业该指标值的极差为94-37=57,A错误;A企业该指标值的中位数为73+752=74,B企业该指标值的中位数为68+682=68,B错误;A企业该指标值的平均数为43+63+65+72+73+75+78+81+86+9810=73.4,B企业该指标值的平均数为37+58+61+65+68+68+71+77+82+9410=68.1,C错误;由上可知,B企业该指标值的众数与中位数都为68,D正确.5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.5【解析】选BCD.选项A,乙同学体温的极差为36.5-36.3=0.2,故A错误;选项B,从题中折线图上可以看出,乙同学的体温比甲同学的体温更稳定,故B正确;选项C,乙同学的体温从低到高依次为36.3℃,36.3℃,36.4℃,36.4℃,36.4℃, 36.5℃,36.5℃,故众数为36.4,而中位数和平均数都是36.4,故C正确;选项D,甲同学的体温从低到高依次为36.2℃,36.2℃,36.4℃,36.4℃,36.5℃, 36.5℃,36.6℃,由70%×7=4.9,可知数据的第70百分位数为第5项数据36.5,故D 正确.6.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.【解析】根据题意,设今年计划招聘的硕士生为x人,博士生为y人,又由现有研究员300人,其中本科生有300×20%=60(人),硕士生有300×40%=120(人),=0.15,=0.4,解得 =40, =60.答案:407.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.【解析】由题意得m-2=10,所以m=12,所以该组数据的平均数为 =2+4+8+124=132,由方差的计算公式可知:s2=14 2-+(4-132)2+(8-132)2+12- =594.答案:5948.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【解析】(1)甲=18×(82+81+79+78+95+88+93+84)=85,乙=18×(92+95+80+75+83+80+90+85)=85,甲2=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2] =35.5,乙2=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2] =41.(2)由(1)知甲=乙,甲2< 乙2,甲的成绩较稳定,所以派甲参赛比较合适.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28【解析】选D.垫球数在区间[5,25)内的人数占总人数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总人数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%,所以第75百分位数位于区间[25,30)内,且25+5×0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.10.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差【解析】选BD.对于A,如1,2,2,2,3,5的平均数为2.5,而2,2,2,3的平均数为2.25,不相等,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,其中位数为 3+ 42,x2,x3,x4,x5的中位数为 3+ 42,所以B正确;对于C,x1,x2,x3,x4,x5,x6的波动更大,所以C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x5-x2≤x6-x1,故D正确.11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.【解析】因为(0.01+0.01+m+0.02+0.02)×10=1,所以m=0.04,又0.1+0.1+0.4=0.6, 0.1+0.1+0.4+0.2=0.8,所以第65百分位数位于第4组中,设第65百分位数为a,则0.1+0.1+0.4+(a-80)×0.02=0.65,解得a=82.5.答案:82.512.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.【解析】(1)由题中频率分布直方图知(0.01+m+0.04+0.02)×10=1,解得m=0.03;设此次竞赛活动学生成绩的中位数为x0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x0<90,由(x0-80)×0.04=0.5-0.4,得x0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由题中频率分布直方图及(1)知, =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-8210×0.4=0.52,则获奖的学生有500×0.52=260(名),所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.。

高考(理)总复习资料:第9章 第2讲 用样本估计总体

高考(理)总复习资料:第9章 第2讲 用样本估计总体
28
• ①甲同学成绩的中位数大于乙同学成绩的中 位数;
• ②甲同学的平均分比乙同学高; • ③甲同学的平均分比乙同学低; • ④甲同学成绩的方差小于乙同学成绩的方
差. • 上解析面:说甲法的中正位确数的81,是乙_的__中_位__数_8_7..5,故①错, x 甲= 81•,答x 案乙=:85③,故④②错,③对,由茎叶图知甲成绩比较稳定,
D. x 甲> x 乙,m甲<m乙
• [审题视点] 仔细观察茎叶图.中位数为一列
数中最中间的那个,当数有偶数个时,中位
数[解为析]中甲间数两据个集中数于的前平半段均,数而.乙数es据集中于后半段,
所以
x
甲<
x
乙;m甲=
18+22 2
=20,m乙=
27+31 2
=29,所以m甲
<m乙,所以选B.
• [答案] B
• [答案] C
32
1.平均数和方差都是重要的数字特征,是对总体一种简 明的阐述.平均数、中位数、众数描述总体的集中趋势,方 差和标准差描述波动大小.
2. 平均数、方差公式的推广 若数据x1,x2,…,xn的平均数为 x ,方差为s2,则数据 mx1+a,mx2+a,…,mxn+a的平均数为m x +a,方差为 m2s2.
33
• [变式探究] [2013·西安质检]某校甲、乙两 个班级各有5名编号为1,2,3,4,5的学生进行投 篮练习,每人投10次,投中的次数如下表:
学生 1号 2号 3号 4号 5号
甲班 6
7
7
8
7
乙班 6
7
6
7
9
34
则以上两组数据的方差中较小的一个为s2,则s2=( )

高考数学专题复习:用样本估计总体数字特征

高考数学专题复习:用样本估计总体数字特征

高考数学专题复习:用样本估计总体数字特征一、单选题1.已知一组数据1x ,2x ,3x ,4x ,5x ,6x 的方差是13,那么另一组数据121x -,221x -,321x -,421x -,521x -,621x -的方差是( )A .13B .23C .43D .832.已知样本9,x ,10,y ,11的平均数是10,标准差是2,则xy 的值为( ) A .96B .97C .91D .873.给定一组数据:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,则这组数据的第25百分位数是( ) A .3.0B .3.2C .4.4D .5.34.若样本1x ,2x ,…n x ,的平均数.方差分别为x 、2s ,则样本135x +,235x +,35n x +,的平均数.方差分别为( ) A .x 、2s B .35x +、2s C .35x +、29sD .35x +、()235s +5.某学校有男生400人,女生600人.为调查该校全体学生每天睡眠时间,采用分层抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为( ). A .0.45B .0.62C .0.7D .0.766.下表是校篮球队某队员若干场比赛的得分数据.则该队员得分的40百分位数是( ) A .5B .6C .7D .87.四名同学各掷骰子5次,记录每次骰子出现的点数并分别对每位同学掷得的点数进行统计处理,在四名同学以下的统计结果中,可以判断出该同学所掷骰子一定没有出现点数1的是( )A .平均数为4,中位数为5B .平均数为5,方差为2.4C .中位数为4,众数为5D .中位数为4,方差为2.88.已知一组数据如下:1,2,5,6,11,则该组数据的方差为( ) A .12.4B .12.3C .12.2D .12.19.已知一组数据的平均数是3,方差是4,且这组数据的平方和是这组数据和的平方的19,则这组数据的个数是( ) A .10B .13C .15D .1610.小明和小红5次考试数学成绩统计如下:则成绩较为稳定的那个同学成绩的方差为( ) A .110B .108C .22D .411.已知一组数据的频率分布直方图如图所示,则估计该组数据的平均数为( )A .64B .65C .66D .6712.已知一组数据为85,87,88,90,92,则这组数据的第60百分位数为( ) A .87 B .87.5 C .89 D .91二、填空题13.数据35124a a a a a ,,,,的方差22222123450.8)20(s a a a a a =++-++,则样本数据121a +,221a +,345212121a a a +++,,的平均数为________. 14.甲、乙两名学生的六次数学测验成绩(百分制)的茎叶图如图所示.①甲同学成绩的中位数小于乙同学成绩的中位数; ②甲同学的平均分比乙同学的平均分高; ③甲同学的平均分比乙同学的平均分低; ④甲同学成绩的方差小于乙同学成绩的方差. 上面说法正确的是________.15.在某中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,若不知道样本数据,只知道抽取了男生30人,其身高平均数170x =,抽取了女生20人,其身高平均数160y =.据此估计高一年级全体学生身高的值为________.16.已知样本数据1x ,2x ,3x ,4x ,5x 的方差为2,则样本数据132x -,232x -,332x -,432x -,532x -的方差为________. 三、解答题17.某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.(1)求直方图中x 的值; (2)求月平均用电量的中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户?18.某校对高一期中数学考试成绩(单位:分)进行分析,随机抽取100名学生,将分数按照[30,50),[50,70),[70,90),[90,110),[110,130),[130,150]分成6组,制成了如图所示的频率分布直方图:(1)估计该校高一期中数学考试成绩的均值;(2)估计该校高一期中数学考试成绩的第80百分位数.19.某种产品的质量以其质量指标值m 衡量,并按照质量指标值m 划分等级如下:现在从某企业生产的这种产品中随机抽取了200件作为样本,检验其质量指标值m ,得到的频率分布直方图如图所示(每组只含最小值,不含最大值).(1)求第75百分位数(精确到0.1);(2)在样本中,按照产品等级用比例分配的分层随机抽样的方法抽取8件产品,则这8件产品中,一等品的件数是多少;(3)将频率视为概率,已知该企业的这种产品中每件一等品的利润是10元,每件二等品和三等品的利润都是6元,试估计该企业销售600件这种产品,所获利润是多少元.20.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[)90,100.50,60,[)80,90,[]60,70,[)70,80,[)(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分,众数,中位数.参考答案1.C 【分析】利用方差的性质求解. 【详解】因为数据1x ,2x ,3x ,4x ,5x ,6x 的方差是13,由方差的性质知,数据121x -,221x -,321x -,421x -,521x -,621x -的方差是214233⨯=.故选:C. 2.C 【分析】由平均数得20x y +=,由标准差得()()22101018x y -+-=,联立可得xy . 【详解】 依题意得91011105x y++++=,则20x y +=①.()()()()()()()222222221129101010111010102101055x y x y ⎡⎤⎡⎤=-+-+-+-+-=+-+-⎣⎦⎣⎦,则()()22101018x y -+-=②.由①②得22218x y +=,所以()()2224002189122x y x y xy +-+-===. 故选:C. 3.B 【分析】根据1025% 2.5⨯=,判断该组数据的第25百分位数即可. 【详解】这组数据是从小到大排序的,共10个数,而1025% 2.5⨯=,所以这组数据的第25百分位数是第3个数据,即3.2. 故选:B. 4.C【分析】由样本数据由i x 变为35i x +,结合平均数、方差的性质,即求新样本中的平均数、方差. 【详解】由题意,12...n x x x x n-+++=,2211()n i i s x x n -==-∑,∴样本135x +,235x +,35n x +的平均数135x x --=+,而2219s s =. 故选:C 5.D 【分析】利用均值的计算公式以及方差的计算公式,准确运算,即可求解. 【详解】由题意,总体的均值为4006007.577.210001000⨯+⨯=, 根据分层抽样的性质,可得总体的方差为:22400600[1(7.57.2)][0.5(7.27)]0.4360.4240.7610001000⨯+-+⨯+-=+=. 故选:D. 6.C 【分析】按所给数据求出各得分的频率,然后根据百分位数定义计算. 【详解】由所给数据,总数为212311111++++++=, 得分3,6,7,10,11,13,30的频率分别为2123111,,,,,,11111111111111, 前3个得分频率和为540%11>,前2个得分的频率和为340%11<,因此40百分位数应该是第三个频率211对应的得分为7分. 故选:C . 7.B 【分析】依据数字特征的定义,依次对选项验证即可. 【详解】解:对于选项A ,1,2,5,6,6符合条件,故A 错,对于选项B ,若平均数为5且出现点数1,则只能为1,6,6,6,6,此时方差为22(15)4(65)45-+⨯-=,故B 对,对于选项C ,1,2,4,5,5符合条件,故C 错, 对于选项D ,1,4,4,5,6,平均数为()11445645++++=,方差()()()2221145464 2.85⎡⎤-+-+-=⎣⎦,符合条件,故D 错, 故选:B . 8.A 【分析】先求出平均数,再根据平均数计算即可求得方差. 【详解】 ()112561155x =++++=,()()()()()2222221621525556511512.455s ⎡⎤=-+-+-+-+-==⎣⎦ 故选:A 9.B 【分析】设这组数据分别为12,,.,n x x x ⋯,根据平均数公式及方差公式即可得的12.3n x x x n ++⋯+=,()()()2221233.34n x x x n -+-+⋯+-=,从而得到22212.n x x x ++⋯+,再依题意得到方程,解得即可; 【详解】解:设这组数据分别为12,,.,n x x x ⋯,则12.3n x x x n ++⋯+=,()()()2221233.34,n x x x n -+-+⋯+-=所以()()()2222221212.6.33.34,n n x x x x x x n ++⋯+-++⋯++++⋯+=所以()22212.1894,n x x x n n n ++⋯+-+=从而22212.13n x x x n ++⋯+=.因为这组数据的平方和是这组数据和的平方的19,所以()2211339n n n ⨯==,解得13n =或0n =(舍去). 故选:B 10.D 【分析】依次求得两位同学的成绩的平均数,再根据结果求得两位同学成绩的方差即可得出结果. 【详解】小明数学成绩的平均值为11(107111110109113)1105x =++++=,所以成绩的方差为22122221(107110)(111110)(110110)(109110)(113110)45s ⎡⎤=-+-+-+-+-=⎣⎦ 小红数学成绩的平均值为21(99110111108112)1085x =++++=,所以成绩的方差为22222221(99108)(110108)(111108)(108108)(112108)225s ⎡⎤=-+-+-+-+-=⎣⎦. 因为2212s s <,所以小明同学的成绩更稳定,方差为21=4s .故选:D 11.D 【分析】根据频率分布直方图的平均数的计算公式,准确计算,即可求解. 【详解】根据频率分布直方图的平均数的计算公式,可得:(550.03650.04750.015850.01950.005)1067x =⨯+⨯+⨯+⨯+⨯⨯=. 故选:D. 12.C 【分析】根据一组数的百分位数的定义直接计算即可. 【详解】该组数据从小到大排序为85,87,88,90,92,共5个数据,而560%3⨯=, 所以这组数据的第60百分位数为8890892+=. 故选:C.13.9或7- 【分析】设样本数据35124a a a a a ,,,,的平均数为a ,推出2580a =,解得4a =±,由此即可求出结果. 【详解】 由题意知,222222123450.2(80)s a a a a a =++++-,设样本数据35124a a a a a ,,,,的平均数为a ,则222222123450.2[()()()()()]s a a a a a a a a a a =-+-+-+-+-22222212345123450.2[2()5]a a a a a a a a a a a a =++++-+++++ 222222123450.2(5)a a a a a a =++++-,所以2580a =,解得4a =±,又12345222221a a a a a ++1,+1,+1,+1,的平均数为21a +, 当4a =时,21=9a +; 当4a =-时,21=-7a +. 故答案为:9或-7 14.①③④ 【分析】根据茎叶图中的数据,对题目中的命题进行分析、判断正误即可. 【详解】解:根据茎叶图中数据知,对于①,甲同学成绩的中位数是1(8082)812⨯+=,乙同学成绩的中位数是1(8788)87.52⨯+=,所以甲的中位数小于乙的中位数,①正确;对于②,甲同学的平均分为1(727680828690)816⨯+++++=, 乙同学的平均分为1(697887889296)856⨯+++++=, 所以甲同学的平均分比乙同学的平均分低,②错误; 对于③,甲同学的平均分比乙同学的平均分低,③正确;对于④,计算甲的方差为2222221107[(9)(5)(1)159]63⨯-+-+-+++=, 乙的方差为2222221244[(16)(7)23711]63⨯-+-++++=, 所以甲的方差小于乙的方差,④正确.所以正确的命题序号是①③④.故答案为:①③④.15.166【分析】根据平均数的计算公式即可求出结果.【详解】 估计高一年级全体学生身高的值为301702016016650⨯+⨯=, 故答案为:16616.18【分析】利用方差的性质求解即可.【详解】样本数据1x ,2x ,3x ,4x ,5x 的方差为22S =, 所以样本数据132x -,232x -,332x -,432x -,532x -的方差为:23218⨯=.故答案为:1817.(1)0.0075;(2)中位数是224;(3)5户.【分析】(1)根据小矩形的面积之和等于1即可求x 的值;(2)根据中位数左右两侧小矩形面积等于0.5可得中位数;(3)先计算每个区间抽取的户数,再计算抽样比例,即可求解.【详解】(1)由直方图的性质得()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=, 解得:0.0075x =;(2)因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+-=,解得:224a =,所以月平均用电量的中位数是224.(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=户,月平均用电量为[)240,260的用户有0.00752010015⨯⨯=户,月平均用电量为[)260,280的用户有0.0052010010⨯⨯=户,月平均用电量为[]280,300的用户有0.0025201005⨯⨯=户, 抽样比为112515105+++=15, 所以月平均用电量在[)220,240的用户抽取12555⨯=户. 18.(1)93分;(2)115分.【分析】(1)由每组数据中点值乘以频率相加可得均值;(2)计算出110分以下的频率和为0.75,因此80%分位数在[)110130,,还需频率0.05,区间[)110130,的频率是0.2,还需通过计算可得结论. 【详解】解:(1)数学成绩在:[)3050,频率0.0050200.1⨯=, [)5070,频率0.0050200.1⨯=, [)7090,频率0.0075200.15⨯=, [)90110,频率0.0200200.4⨯=, [)110130,频率0.0100200.2⨯=, []130150,频率0.0025200.05⨯=,样本均值为:400.1600.1800.151000.41200.21400.0593⨯+⨯+⨯+⨯+⨯+⨯=,可以估计样本数据中数学成绩均值为93分,据此可以估计该校高一下学期期中数学考试成绩估计93分.(2)由(1)知样本数据中数学考试成绩在110分以下所占比例为0.10.10.150.40.75+++=在130分以下所占比例为0.750.20.95+=因此,80%分位数一定位于[)110130,内,由 0.80.75110201150.950.75-+⨯=-, 可以估计样本数据的第80百分位数约为115分,据此可以估计该校高一下学期期中数学考试成绩第80百分位数约为115分19.(1)109.8;(2)3;(3)4500(元).【分析】(1)先利用频率分布直方图的性质求出0.030x =,由第75百分位数在图中表现为该数的左侧频率为0.75,根据这一点可求第75百分位数;(2)先根据频率分布直方图以及等级划分规则算出三种等级的频率,从而得样本中各等级的件数,再利用分层随机抽样的按比例抽取求解;(3)根据(2)中算出的频率求利润的估计值.【详解】(1)由题得,()0.00250.00900.01000.02000.02600.0025101x ++++++⨯=,解得0.030x =.又[65,105)的频率为0.625,[105,115)的频率为0.26,所以第75百分位数在[105,115)内第75百分位数为0.750.62510510109.80.26-+⨯≈. (2)由频率分布直方图以及等级划分规则可知,样本中三等品、二等品、一等品的频率分别为(0.00250.0100)100.125+⨯=,(0.02000.0300)100.5+⨯=,(0.02600.00900.0025)100.375++⨯=.所以在200件样本中,三等品、二等品、一等品的件数分别为25,100,75,所以按照产品等级用比例分配分层随机抽样的方法抽取8件产品, 则应抽取的一等品的件数分别为7583200⨯=. (3)由(2)知,从该企业的这种产品中任取一件是一等品的概率为0.375,是二等品或三等品的概率为0.625.故该企业销售600件这种产品,所获利润约为6000.375106000.62564500⨯⨯+⨯⨯=(元) 20.(1)0.005;(2)平均分为73,众数为65,中位数为2153. 【分析】(1)根据概率之和等于1,即所以小矩形的面积之和等于1,即可求解;(2)根据平均分,众数,中位数的概念结合频率分布直方图即可求出平均分,众数,中位数.【详解】解:(1)由频率分布直方图可得:()1020.020.030.041a ⨯+++=,∴0.005a =.(2)平均分550.00510650.0410750.0310850.0210950.0051073⨯⨯+⨯⨯+⨯⨯⨯⨯+⨯⨯=+(分) 众数为60702+=65分. 中位数为()0.50.005100.0410215700.033-⨯+⨯+=(分).。

高考数学专题复习:用样本估计总体

高考数学专题复习:用样本估计总体

高考数学专题复习:用样本估计总体一、单选题1.某班50名学生在一次百米测试中,成绩全部不小于13秒且小于19秒,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;…;第六组,成绩大于等于18秒且小于19秒,如图是按上述分组方法得到的频率分布直方图,设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y的值分别是()A.90%,35 B.90%,45C.10%,35 D.10%,452.某同学郑一粒均匀的骰子5次,记录每次骰子出现的点数,若其中至少出现了1次点数6,则这组数据不可能得出的统计结果是()A.平均数为3,中位数为2 B.中位数为3,众数为2C.平均数为2,方差为3 D.中位数为3,方差为2.83.某中学有10个学生社团,每个社团的人数分别是70,60,60,50,60,40,40,30,30,10,则这组数据的平均数,众数,中位数的和为()A.165 B.160 C.150 D.1704.四名同学各掷一枚骰子5次,分别记录每次骰子出现的点数.根据下面四名同学的统计结果,可以判断出一定没有出现点数6的是()A.平均数为2,方差为2.4 B.中位数为3,众数为2C.平均数为3,中位数为2 D.中位数为3,方差为2.85.某市2020年各月的平均气温(℃)数据的茎叶图如下,则这组数据的中位数是()A .21B .22C .22.5D .236.为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近的6次数学测试的分数进行统计,甲、乙两人的得分情况如茎叶图所示,若甲、乙两人的平均成绩分别是 ,x x 甲乙,则下列说法正确的是( )A . x x >甲乙,乙比甲成绩稳定,应选乙参加比赛B . x x >甲乙,甲比乙成绩稳定,应选甲参加比赛C . x x <甲乙,甲比乙成绩稳定,应选甲参加比赛D . x x <甲乙,乙比甲成绩稳定,应选乙参加比赛7.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为2s ,则( )A .242,x s ==B .24,2x s =>C .24,2x s =<D .24,2x s ><8.某校高一年级一名学生七次月考数学成绩(满分100分)分别为78,82,84,84,86,89,96,则这名学生七次月考数学成绩的第80百分位数为( ) A .82B .84C .89D .969.某校高一甲、乙两个班分别有男生24名、15名,现用比例分配的分层随机抽样方法从两班男生中抽取样本量为13的样本,对两个班男生的平均身高进行评估.已知甲班、乙班男生身高的样本平均数分别为175cm 、177.6cm ,以所抽取样本的平均身高作为两个班男生的平均身高,则两个班男生的平均身高为( )A .176cmB .176.3cmC .176.6cmD .176.9cm10.设一组样本数据12,,n x x x 的平均值为2,则数据1229,29,,29n x x x ++⋅⋅⋅+的平均值为( ) A .11B .12C .13D .1411.某同学掷骰子4次,并记录了每次骰子出现的点数,得出平均数为2,方差为12的统计结果,则下列点数中一定不出现的是( ) A .1B .2C .3D .512.某单位共有A 、B 、C 三个部门,三部门人员平均年龄分别为38岁、24岁、42岁,又已知A 和B 两部门人员平均年龄为30岁,B 和C 两部门人员平均年龄为34岁,则该单位全体人员的平均年龄为( ) A .34岁 B .35岁C .36岁D .37岁二、填空题13.一组数6,5,4,3,3,3,2,2,2,1的80%分位数为________.14.学校进行30秒跳绳测试,某小组8名同学的跳绳个数如下面的茎叶图所示,则该组数据的方差为________.15.某企业生产甲、乙两种产品,现从一批产品中随机抽取两种产品各5件进行检测,检测量结果如下:由于表格被污损,数据a ,b 看不清,统计员只记得甲、乙两种产品检测数据的平均数和方差都相等,则ab =________.16.已知样本数据1x ,2x ,⋯,2020x 的平均数与方差分别是m 和n ,若2(1i i y x i =-+=,2,⋯,2020),且样本数据的1y ,2y ,⋯,2020y 平均数与方差分别是n 和m ,则222122020x x x ++⋯+=________.三、解答题17.高一年级期末考试成绩各分数段[)0,90,[)90,105,[)105,120,[)120,135,[]135,150的频率分布如下图.(Ⅰ)计算高一年级所有同学成绩的中位数;(Ⅱ)用各分数段的中间值代替各分数段的平均值,并且删去[)0,90,[]135,150两个分数段,试估计高一年级期末考试成绩的平均值;(Ⅲ)若高一年级有1000人,把成绩从低到高编号,用系统抽样的方法从中抽取一个容量为20的样本,其中一个个体的编号为63,请写出抽样在[)105,120之间的个体的编号.18.20名学生某次数学考试成绩(单位:分)的频率分布直方图如图.(1)求频率分布直方图中a 的值;(2)估计总体中成绩落在[)50,60中的学生人数;(3)根据频率分布直方图估计20名学生数学考试成绩的众数,中位数;19.甲、乙两位同学要参加数学竞赛,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,绘制成茎叶图如下(单位:分).(1)分别写出甲、乙两位同学6次预赛成绩的众数、中位数;(2)计算甲、乙两位同学6次预赛成绩的平均数与方差,并判断谁的成绩更稳定.20.现有某城市100户居民的月平均用电量(单位:度)的数据,根据这些数据,以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图所示.(1)确定直方图中x 的值,并求月平均用电量的众数和中位数;(2)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层随机抽样的方法抽取11户居民,则月平均用电量在[)220,240内的用户中应抽取多少户?21.下表为30位学生参加语文竞赛的成绩,并由小到大排列.(1)求第一、二、三四分位数;(2)求第10百分位数;(3)求第95百分位数.22.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)求直方图中x的值;(2)①求在这些用户中,用电量在区间[100,250)内的居民数;②如果按分层抽样方法,在这些用户中按1:10的比例抽取用户进一步调查,那么用电量在[150,200)内的居民数应抽取多少?参考答案1.A 【分析】频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率.建立相应的关系式,即可求得. 【详解】解:从频率分布直方图上可以看出1(0.060.04)0.9x =-+=,50(0.360.34)35y =⨯+=,故选:A . 2.C 【分析】对于选项ABD ,举出满足条件且出现点数为6的例子,对于选项C ,由于至少出现一个点数6,结合平均数为2,计算方差即可判断作答. 【详解】对于A ,中位数为2的5个点数是1,1,2,5,6,平均数为1125635++++=,选项A 可能出现;对于B ,中位数为3,众数为2的5个点数是2,2,3,4,6或2,2,3,5,6均符合要求,即选项B 可能出现;对于C ,因平均数为2,且至少出现了1次点数6,则方差221(62) 3.25s >-=,即方差不可能为3,选项C 不可能出现;对于D ,中位数为3的5个点数是1,2,3,3,6,平均数为1233635++++=,方差2222221[(13)(23)(33)(33)(63)] 2.85s =-+-+-+-+-=,选项D 可能出现.故选:C 3.C 【分析】将数字从小到大(或从大到小)排列,得到众数和中位数,再算出平均数,即可得到答案. 【详解】人数分别是10,30,30,40,40,50,60,60,60,70,则众数为60,中位数为4050452+=,平均数为103030404050606060704510+++++++++=,∴平均数,众数,中位数的和为:60+45+45=150. 故选:C. 4.A 【分析】选项A ,利用反证法说明一定含6,选项BCD 中依次举例说明可能含有6即可. 【详解】对于A ,若平均数为2,且出现点数6,则方差221(62) 3.2 2.45S >-=>,所以当平均数为2,方差为2.4时,一定不会出现点数6,所以A 可以判断;对于B ,当掷骰子出现的结果为2,2,3,4,6时,满足中位数为3,众数为2,可以出现点6,所以B 不能判断;对于C ,当掷骰子出现的结果为1,1,2,5,6时,满足平均数为3,中位数为2,可以出现点6,所以C 不能判断;对于D ,当掷骰子出现的结果为1,2,3,3,6时,满足中位数为3,则平均数为1(12336)35x =++++=,方差为2222221[(13)(23)(33)(33)(63)] 2.85S =-+-+-+-+-=,所以可以出现点6,所以D 不能判断. 故选:A. 5.B 【分析】由茎叶图得到数据最中间的两个数是21和23,即得解. 【详解】由茎叶图可知,数据最中间的两个数是21和23, 所以数据的中位数为21+23=222. 故选:B 6.D 【分析】根据茎叶图中的数据计算平均数得的平均数是82,乙的平均数是87,再根据茎叶图分析甲与乙的稳定性即可得答案. 【详解】由茎叶图可知,甲的平均数是727879858692826+++++=,乙的平均数是788687879193876+++++=,所以乙的平均数大于甲的平均数,即 x x <甲乙, 从茎叶图可以看出乙的成绩比较稳定,应选乙参加比赛. 故选:D. 7.C 【分析】由已知条件,根据平均数和方差的计算公式进行求解即可. 【详解】 根据题意有47448x ⨯+==, 而()22724428s ⨯+-=<.故选:C. 8.C 【分析】利用百分位数的定义分析求解即可. 【详解】解:因为780% 5.6⨯=,所以这名学生七次月考数学成绩的第80百分位数为89. 故选:C. 9.A 【分析】由题知13个的样本中,甲班男生有8人,乙班男生有5人,进而得两个班男生的平均身高为()11758177.6517613⨯+⨯=. 【详解】解:根据题意,抽出来的13个的样本中,甲班男生有241382415⨯=+人,乙班男生有151352415⨯=+人,所以根据题意得两个班男生的平均身高为()11758177.6517613⨯+⨯= 故选:A 10.C 【分析】利用平均数公式求解即可. 【详解】 因为122nx x x n+++=,所以12292929n x x x n++++++,()122913n x x x n+++=+=,故选:C. 11.D 【分析】利用方差的公式检验四个选项的正误即可得正确选项. 【详解】当有一个数是5,则()25291442-=>,所以5一定不出现;当有一个数是3时,()23211442-=<,所以3可能出现; 当有一个数是2时,()2221042-=<,所以2可能出现; 当有一个数是1时,()21211442-=<,所以1可能出现;故选:D. 12.B 【分析】设A 、B 、C 三个部门的人数分别为,,a b c ,根据已知条件列出方程组可求出34a b =,54c b =,然后再根据平均数的计算公式,即可求出该单位全体人员的平均年龄.【详解】设A 、B 、C 三个部门的人数分别为,,a b c ,由题意得382430244234a b a b b c b c+⎧=⎪⎪+⎨+⎪=⎪+⎩,所以3454a b c b ⎧=⎪⎪⎨⎪=⎪⎩, 所以该单位全体人员的平均年龄为3538244238244244353544b b b a bc a b c b b b ⨯++⨯++==++++. 故选:B13.4.5【分析】将数据按从小到大的顺序排列,第8和第9个数的平均数即可.【详解】一组数6,5,4,3,3,3,2,2,2,1按从小到大的顺序排列,可得1,2,2,2,3,3,3,4,5,6,共10个,由1080%8⨯=,所以该组数据的80%分位数为45 4.52+=, 故答案为:4.5.14.17.5【分析】先求出该组数据的平均数,再由方差公式即可求出.【详解】 由图可知,该组数据的平均数为4144454750515254488+++++++=, 所以方差为()()()()2222222217431234617.58⎡⎤⨯-+-+-+-++++=⎣⎦. 故答案为:17.5.15.72【分析】求出均值可得17a b +=,再由方差相等可得()()22881a b -+-=,解方程组即可求解.【详解】77+7.5+9+9.56+8.5+8.5+=8=55a x xb ++==甲乙,可得17a b += ①, ()()()()()22222878787.58989.5 5.5D =-+-+-+-+-=甲 ,则()()()()()2222286888.588.58 5.5D a b =-+-+-+-+-=乙,可得()()22881a b -+-= ②, 由①②可得89,98a a b b ==⎧⎧⎨⎨==⎩⎩,所以72ab = , 故答案为:72 .16.4040【分析】由样本数据的平均数、方差的性质列方程组求出1m =,1n =,从而2221220201[(1)(1)(1)]12020x x x -+-+⋅⋅⋅+-=,由此能求出222122020x x x ++⋯+的值. 【详解】由题意得:2m n m n -+=⎧⎨=⎩, 解得1m =,1n =, ∴2221220201[(1)(1)(1)]12020x x x -+-+⋅⋅⋅+-=, 22212202012202020202()2020x x x x x x ∴++⋯++-++⋅⋅⋅+=,2221220201220202()220204040x x x x x x ∴++⋯+=++⋅⋅⋅+=⨯=.故答案为:4040.17.(Ⅰ)110分;(Ⅱ)111.5分;(Ⅲ)413,463,513,563,613,663.【分析】(1)根据中位数的概念即可求解;(Ⅱ)结合加权平均数的计算公式即可求出结果;(Ⅲ)由系统抽样中等间隔即可求出结果.【详解】(1)由题图可知[)0,90和[)90,105分数段内的人数占总人数的40%,故中位数在[)105,120分数段内从低到高13处,则中位数为1105151103+⨯=(分). (Ⅱ)[)90,105,[)105,120,[)120,135三个分数段的中间值分别为97.5,112.5,127.5,人数比为25%:30%:20%5:6:4=,则估计高一年级期末考试成绩的平均值为97.55112.56127.54111.5564⨯+⨯+⨯=++(分). (Ⅲ)由题图可得[)0,90分数段内有150人,[)90,105分数段内有250人,[)105,120分数段内有300人,则[)105,120分数段内的编号是从401到700,由题意,两个相邻样本的编号差为10005020=,则在分数段[)105,120内抽取的个体的编号为413,463,513,563,613,663. 18.(1)0.005a =;(2)2人;(3)众数为75,中位数为5407. 【分析】(1)由频率和为1可求出a 的值;(2)先求出成绩落在[)50,60的频率,从而可求出频数;(3)由图可知众数在第3组,从而可得众数为7080752+=,由于前2组的频率和小于0.5,前3组的频率和大于0.5,所以中位数在第3组,列方程可求得结果【详解】(1)()23762101a a a a a ++++⨯=,解得0.005a =.(2)由频率分布直方图得成绩落在[)50,60中的频率为2100.1a ⨯=,∴估计总体中成绩落在[)50,60中的学生人数为:200.12⨯=人.(3)根据频率分布直方图估计20名学生数学考试成绩的众数为:7080752+=, 由于前2组的频率和10(0.010.015)0.250.5⨯+=<,前3组的频率和10(0.010.0150.035)0.60.5⨯++=>,所以中位数在第3组,设中位数为x ,则()()0.010.015100.035700.5x +⨯+-= 解得5407x =,所以中位数为540719.(1)甲同学6次预赛成绩的众数为82分,中位数为82分,乙同学6次预赛成绩的众数为85分,中位数为81.5分;(2)甲同学预赛的平均成绩82分;乙同学预赛的平均成绩81分,甲同学预赛成绩的方差为313;乙同学预赛成绩的方差为13;甲同学成绩更稳定. 【分析】(1)甲同学的6次预赛成绩分别为:78,79,82,82,83,88;乙同学的6次预赛成绩分别为:76,77,80,83,85,85,进而可得答案;(2)根据茎叶图,计算即可得平均数与方差,再根据数字特征的意义即可得答案.【详解】(1)由茎叶图可知,甲同学的6次预赛成绩分别为:78,79,82,82,83,88;乙同学的6次预赛成绩分别为:76,77,80,83,85,85;所以,甲同学6次预赛成绩的众数为82分,中位数为8282822+=(分),乙同学6次预赛成绩的众数为85分,中位数为808381.52+=(分) (2)甲同学预赛的平均成绩121223880826x --++++=+=分 乙同学预赛的平均成绩243035580816x --++++=+=分, 甲同学预赛成绩的方差为22222221131(7882)(7982)(8282)(8282)(8382)(8882)63s ⎡⎤=-+-+-+-+-+-=⎣⎦ 乙同学预赛成绩的方差为222222221(7681)(7781)(8081)(8381)(8581)(8581)136s ⎡⎤=-+-+-+-+-+-=⎣⎦ 由2221s s >,所以,甲同学成绩更稳定20.(1)0.0075x =,众数为230度,中位数224度;(2)5户.【分析】(1)由频率和为1列方程可求出x 的值,由[)220,240对应的频数最大,可求出众数,由前3组的频率和小于0.5,前4组的频率和大于0.5,所以中位数在第4组,设中位数为t 度,则0.50.45220200.25t -=+⨯; (2)利用分层抽样的比进行求解即可【详解】(1)因为()0.0020.00250.0050.00950.0110.0125201x ++++++⨯=,所以0.0075x =; 由频率分布直方图可知:[)220,240对应的频数最大,所以众数为230度;因为前三组频率之和为()0.0020.00950.011200.450.5++⨯=<,第四组频率为0.0125200.25⨯=,且0.450.250.70.5+=>,所以中位数在第四组数据中,设中位数为t 度, 所以0.50.45220202240.25t -=+⨯=. (2)因为[)220,240,[)240,260,[)260,280,[]280,300的频率之比为()()()()0.012520:0.007520:0.00520:0.0025205:3:2:1⨯⨯⨯⨯=,所以月平均用电量在[)220,240内的用户中应抽取:51155321⨯=+++户, 答:月平均用电量在[)220,240内的用户中应抽取5户.21.(1)第一四分位数为65,第二四分位数为75.5,第三四分位数为85;(2)56.5;(3)99.【分析】(1)由30×25%,30×50%,30×75%分别确定第一、二、三四分位数的位置即可; (2)由30×10%确定第10百分位数的位置; (3)由30×95%确定第95百分位数的位置 【详解】解:(1)30×25%=7.5,取第8项数据,所以第一四分位数为65,30×50%=15,取第15、16项数据的平均数,所以第二四分位数为75762+=75.5;30×75%=22.5,取第23项数据,所以第三四分位数为85.(2)30×10%=3,取第3、4项数据的平均数,所以第10百分位数为55582+=56.5. (3)30×95%=28.5,取第29项数据,所以第95百分位数为99. 22.(1)x =0.0044;(2)①70户;②3(户).【分析】(1)由频率分布直方图,列出方程,能求出直方图中x 的值.(2)①先求出用电量在[100,250)内的频率为0.7,由此能求出在这些用户中,用电量在区间[100,250)内的居民数.②用电量在[150,200)内的户数为30户,由此利用分层抽样的性质能求出用电量在[150,200)内的居民数应该抽取的户数.【详解】(1)由频率分布直方图得:(0.0012+0.0024×2+0.0036+x+0.0060)×50=1,解得直方图中x=0.0044.(2)①用电量在[100,250)内的频率为:(0.0036+0.0060+0.0044)×50=0.7,∴在这些用户中,用电量在区间[100,250)内的居民数为100×0.7=70户.②用电量在[150,200)内的户数为0.0060×50×100=30(户),按分层抽样方法,在这些用户中按1:10的比例抽取用户进一步调查,用电量在[150,200)内的居民数应该抽取:130310⨯=(户).。

高考数学一轮复习 10.2 用样本估计总体

高考数学一轮复习 10.2 用样本估计总体
A
关闭 关闭
6 解析 答案
知识梳理
-7-
知识梳理
双击自测
12345
3.如图是某学校举行的运动会上,七位评委为某体操项目打出的分数 的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别 为( )
A.84,4.84 B.84,1.6
C.85,1.6 D.85,4
去掉最高分 93,最低分 79. 平均分为15(84+84+86+84+87)=85,
,反映了
样本数据的离散程度.
4
知识梳理
-5-
知识梳理
双击自测
12345
1.下列结论正确的打“√”,错误的打“×”. (1)一组数据的平均数一定大于这组数据中的每个数据.( ) (2)一组数据的方差越大,说明这组数据的波动越大.( ) (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内 的频率越大.( ) (4)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一 次.( )
特征估计总体的基本数字特
征,理解用样本估计总体的思 想. 5.会用随机抽样的基本方法和
样本估计总体的思想解决一
些简单的实际问题.
五年考题 统计
命题规律
2011 全 国,文 19 2012 全 国,文 18 2013 全国 Ⅰ,文 18 2013 全国 Ⅱ,文 19 2014 全国 Ⅰ,文 18 2014 全国 Ⅱ,文 19

.
关闭
������乙 = 5+6+95+10+5=7,������乙2 = 15[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=4.4,∵������甲2 > ������乙2 ,

高考数学复习13-2用样本估计总体

高考数学复习13-2用样本估计总体

[71,81)
6
6 30
[81,91)
10
10 30
[91,101)
5
5 30
[101,111)
2
2 30
单击此处编辑母版文本样式 第二级 • 第三级 – 第四级 »第五级
(3)答对下述两条中的一条即可: (i)该市一个月中空气污染指数有 2 天处于优的水平,占当月 天数的115.有 26 天处于良的水平,占当月天数的1135.处于优或良的 天数共有 28 天,占当月天数的1145.说明该市空气质量基本良好. (ii)轻微污染有 2 天,占当月天数的115.污染指数在 80 以上的接 近轻微污染的天数有 15 天,加上处于轻微污染的天数,共有 17 天, 占当月天数的1370,超过 50%.说明该市空气质量有待进一步改善.
(3)在[1.38,1.42)范围内最多. 估计纤度大于 1.42 的概率为29+11000+2=0.41 或 0.29+ 0.10+0.02=0.41.
单击此处编辑母版文本样式 第二级 • 第三级 – 第四级 »第五级
单击此处编辑母版文本样式 第二级 • 第三级 – 第四级 »第五级
谢谢!
设 A 表示随机事件“所抽取的两件样品的重量之差不超过 2 克”,则 A 的基本事件有 4 种:
(108,109),(108,110),(109,110),(110,112). 故所求概率为 P(A)=145.
单击此处编辑母版文本样式 第二级 • 第三级 – 第四级 »第五级
[解] 根据统计知识可知,需要计算两组数据的 x 与 s2, 然后加以比较,最后再作出判断.
单击此处编辑母版文本样式 第二级 • 第三级 – 第四级 »第五级
单击此处编辑母版文本样式 第二级 • 第三级 – 第四级 »第五级

高考数学复习点拨 用样本估计总体的图、表及其应用

高考数学复习点拨 用样本估计总体的图、表及其应用

用样本估计总体的图、表及其应用数据日益成为一种重要的信息,要学会处理各种信息,尤其是数字信息,收集、整理与分析信息的能力已经成为信息时代每一个公民基本素养的一部分.统计所提供的“运用数据进行推断”的思考方法已经成为现代社会一种普遍适用并且强有力的思维方式.统计图表就是表达和分析数据的重要工具,它不仅可以帮助我们从数据中获得有用的信息,还可以帮助我们直观、准确地理解相应的结果.用样本估计总体的方法在高中数学中主要有频率分布表、频率分布直方图、频率分布折线图、总体密度曲线、茎叶图、频率分布扇形图等.本文举例说明用样本估计总体的图、表及其应用.例1 青少年视力水平的下降已经引起全社会的关注,某校为了了解高二年级500名学生的视力情况,从中抽查了一部分学生视力,通过数据处理,得到如下频率分布表和频率分布直方图:请你根据给出的图表回答:(1)填写频率分布表中未完成部分的数据.(2)在这个问题中,总体是_____,样本容量是_____.(3)在频率分布直方图中梯形ABCD的面积是_____.(4)请问:用样本估计总体,可以得到哪些信息(写一条即可)_____.解析:(1)第二列从上至下两空分别填15、50;第三列从上至下两空分别填、.(2)总体是500名学生的视力情况,样本容量是50.(3)在频率分布直方图中梯形ABCD的面积是.(4)本题有多个结论,只要是根据频率分布表或频率分布直方图的有关信息,并且用样本估计总体所反映的结论都是合理的即可.例如,该校高二年级学生视力在[,)内的人数最多,约250人;该校高二年级学生视力在以上的与视力在以下的人数基本相等,各有20人左右等.点评:本题主要考查同学们对于频率分布表和频率分布直方图的掌握情况,考查同学们的识图、读图的能力,以及灵活运用图、表解决实际问题的能力.例2 甲、乙两人在相同条件下打靶十次,每次打靶的成绩情况如图:(1)请填写下表:平均数中位数命中9环以上次数甲7乙(2)从下列三个不同角度对这次测验结果进行分析:从平均数和中位数相结合看,谁的成绩好些从平均数和命中9环以上的次数相结合看,谁的成绩好些从折线图两人射击命中环数的走势看,谁更有潜力解析:(1)甲的数据为:2,4,6,7,7,8,8,9,9,10,所以甲的中位数为,命中9环以上次数为3.乙的数据为:5,6,6,7,7,7,7,8,8,9,所以乙的平均数为7,乙的中位数为7,命中9环以上次数为1.(2)从平均数和中位数相结合看,甲成绩比乙稳定;从平均数和命中9环以上的次数相结合看,甲成绩比乙好一些;从折线图两人射击命中环数的走势看,甲的潜力更大一些.例3 在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数进行比较分析,得到什么结论解析:(1)根据题设所给数据画出茎叶图,如下:(2)电脑杂志上每个句子的字数集中在10~30之间,中位数为;而报纸上每个句子的字数集中在20~40之间,中位数为.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少,这说明电脑杂志作为科普读物需要简明,通俗易懂.点评:茎叶图在样本数据较少、较为集中且位数不多时比较适用.由于它较好的保留了原始数据,所以它可以帮助我们分析样本数据的大致频率分布,还可以用来分析样本数据的一些数字特征,如初中接触到的众数、中位数、平均数等.例4 英才学校的四个年级学生分布如扇形图,通过对全体学生暑假期间所读课外书情况的调查,制成各年级读书情况的条形图.已知英才学校被调查的四个年级共有学生1500人,则(1)高一年级学生暑假期间共读课外书_____本;(2)暑假期间读课外书总量最少的是_____年级的学生,共读课外书_____本;(3)该校暑假期间四个年级人均读课外书_____本.解析:初一年级学生暑假期间读课外书的人数是1500×28%=420,共读课外书420×=2352本.初二年级学生暑假期间读课外书的人数是1500×24%=360,共读课外书360×=2376本.高二年级学生暑假期间读课外书的人数是1500×22%=330,共读课外书330×=2409本.所以高一年级学生暑假期间读课外书的人数是330=390,共读课外书390×=2418本.该校暑假期间四个年级人均读课外书为(2352+2376+2409+2418)÷1500= .为了正确的用样本估计总体,用样本的图、表估计总体的分布,应当做好以下几点:1.牢固掌握概念之间、图表之间的区别和联系,及其在实际问题中的应用.2.能读懂频率分布表、频率分布直方图、频率分布折线图、总体密度曲线、茎叶图、频率分布扇形图等,会分析图表和处理数据,会解决实际问题,注重能力培养,加大训练力度.3.统计离不开数据,计算较繁,应当有意识的培养认真、耐心、细致的学习态度和习惯。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第38练用样本估计总体[题型分析·高考展望]用样本估计总体在高考中也是热点部分,考查形式主要是选择题、填空题或是与概率结合的综合性解答题,重点是频率分布直方图以及数字特征,属于比较简单的题目.体验高考1.(2015·湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:13003456688891411122233445556678 15012233 3若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3B.4C.5D.6答案 B解析由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.选B.2.(2015·课标全国Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案 D解析从2006年起,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确;2007年二氧化硫排放量较2006年降低了很多,B选项正确;虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,即C 选项正确;自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误.故选D.3.(2016·课标全国丙)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案 D解析由题意知,平均最高气温高于20 ℃的有六月,七月,八月,故选D.4.(2016·山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图知,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案 D解析由题图知,组距为2.5,故每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,∴这200名学生中每周的自习时间不少于22.5小时的人数是200×0.7=140,故选D.5.(2015·湖北)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案 (1)3 (2)6 000解析 (1)由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a ×0.1=1,解得a =3.(2)消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.高考必会题型题型一 频率分布直方图的应用例1 (2015·广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,得x =0.007 5, 所以直方图中x 的值是0.007 5.(2)月平均用电量的众数是220+2402=230.因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5,得a =224,所以月平均用电量的中位数是224.(3)月平均用电量为[220,240)的用户有0.012 5×20×100=25(户),月平均用电量为[240,260)的用户有0.007 5×20×100=15(户),月平均用电量为[260,280)的用户有0.005×20×100=10(户),月平均用电量为[280,300]的用户有0.002 5×20×100=5(户),抽取比例=1125+15+10+5=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).点评 利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.(2)平均数:平均数是频率分布直方图的“重心”,等于图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)众数:在频率分布直方图中,众数是最高的矩形底边的中点的横坐标.变式训练1 (2016·课标全国乙)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图.记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数. (1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件? 解 (1)当x ≤19时,y =3 800;当x >19时,y =3 800+500(x -19)=500x -5 700. 所以y 与x 的函数解析式为y =⎩⎪⎨⎪⎧3 800,x ≤19,500x -5 700,x >19(x ∈N ). (2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.(3)若每台机器在购机的同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1100(3 800×70+4 300×20+4 800×10)=4 000, 若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1100(4 000×90+4 500×10)=4 050. 比较两个平均数可知,购买1台机器的同时应购买19个易损零件. 题型二 茎叶图的应用例2 (1)为了检查某高三毕业班学生的体重状况,从该班随机抽取了10位学生进行称重,如图为10位学生体重的茎叶图,其中图中左边是体重的十位数字,右边是个位数字,则这10位学生体重的平均数与中位数之差为( )A.0.1B.0.2C.0.3D.0.4(2)在“某市中学生歌手大赛”比赛现场上七位评委为某选手打出的分数的茎叶图如图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A.5和1.6B.85和1.6C.85和0.4D.5和0.4 答案 (1)C (2)B解析 (1)平均数为x =54.8,中位数为12(53+56)=54.5,∴这10位学生体重的平均数与中位数之差为: 54.8-54.5=0.3.故选C.(2)x =15(4+4+4+6+7)+80=85,所以s 2=15[3(84-85)2+(86-85)2+(87-85)2]=1.6,故选B.点评 由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等.变式训练2 (1)某公司将职员每月的工作业绩用1~30的自然数表示,甲、乙两职员在2010年1~8月份的工作业绩的茎叶图如图,则下列说法正确的是( )A.两职员的平均业绩相同,甲职员的业绩比乙职员的业绩稳定B.两职员的平均业绩不同,甲职员的业绩比乙职员的业绩稳定C.两职员的平均业绩相同,乙职员的业绩比甲职员的业绩稳定D.两职员的平均业绩不同,乙职员的业绩比甲职员的业绩稳定(2)如图为甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是( )A.56B.57C.58D.59 答案 (1)C (2)B解析 (1)由茎叶图可得:x 甲=18(12+15+18+20+20+22+25+28)=20,x 乙=18(14+15+17+19+21+23+25+26)=20,s 2甲=18(82+52+22+0+0+22+52+82)=934, s 2甲=18(62+52+32+1+1+32+52+62)=714, 由平均数和方差可知,两职员的平均业绩相同, 乙职员的业绩比甲职员的业绩稳定.(2)由茎叶图知,甲共13个数据,中间的一个是32,乙共11个数据,中间的一个是25,所以甲和乙得分的中位数的和为57,故选B. 题型三 用样本的数字特征估计总体的数字特征例3 (1)一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( ) A.57.2,3.6 B.57.2,56.4 C.62.8,63.6 D.62.8,3.6(2)某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个,命中个数的茎叶图如图,则下列结论中错误的是________.(填序号)①甲的极差是29;②乙的众数是21;③甲罚球命中率比乙高;④甲的中位数是24. 答案 (1)D (2)④解析 (1)设这组数据分别为x 1,x 2,…,x n , 则x =1n(x 1+x 2+…+x n ),方差为s 2=1n[(x 1-x )2+…+(x n -x )2],每一组数据都加60后,x ′=1n (x 1+x 2+…+x n +60n )=x +60=62.8,方差s ′2=1n[(x 1+60-62.8)2+…+(x n +60-62.8)2]=s 2=3.6.(2)由茎叶图知,甲的最大值为37,最小值为8,所以甲的极差为29,故①对;乙的数据中出现次数最多的是21,所以②对;甲的命中个数集中在20,而乙的命中个数集中在10和20,所以甲罚球命中率大,故③对;甲中间的两个数为22,24,所以甲的中位数为22+242=23,故④不对. 故答案应填④.点评 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.变式训练3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 解 (1)由题图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.高考题型精练1.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15人,则该班的学生人数是( )A.45B.50C.55D.60 答案 B解析 低于60分的人数的频率为0.015×20=0.3, 所以该班人数15÷0.3=50(人).2.某赛季,甲,乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用茎叶图表示,如图,则甲,乙两名运动员得分的中位数分别为( )A.20,18B.13,19C.19,13D.18,20 答案 C解析 中位数为一组数据由小到大排列后位于中间的一个数或两个数的平均数,所以中位数为19,13.3.如图是某社区工会对当地企业工人月收入情况进行一次抽样调查后画出的频率分布直方图,其中月收入在[1.5,2)千元的频数为300,则此次抽样的样本容量为( )A.1 000B.2 000C.3 000D.4 000 答案 A解析 由频率分布直方图,得月收入在[1.5,2)千元的频率为P =0.6×0.5=0.3, 所以此次抽样的样本容量为3000.3=1 000,故选A. 4.甲、乙两同学用茎叶图记录高三前5次数学测试的成绩,如图所示,他们在分析对比成绩变化时,发现乙同学成绩的一个数字看不清楚了,若已知乙的平均成绩低于甲的平均成绩,则看不清楚的数字为( )A.0B.3C.6D.9 答案 A解析 设看不清的数字为x ,甲的平均成绩为99+100+101+102+1035=101,所以93+94+97+110+(110+x )5<101,x <1,所以x =0,故选A.5.如图是一容量为100的样本的重量的频率分布直方图,则由图可估计样本重量的中位数为( )A.11B.11.5C.12D.12.5 答案 C解析 由频率分布直方图,可估计样本重量的中位数在第二组,设中位数比10大x ,由题意可得,0.06×5+x ×0.1=0.5,得x =2, 所以中位数为12,故选C.6.已知两组样本数据{x 1,x 2,…,x n }的平均数为h ,{y 1,y 2,…,y m }的平均数为k ,则把两组数据合并成一组以后,这组样本的平均数为( ) A.h +k 2 B.nh +mk m +n C.mh +nk m +n D.h +k m +n答案 B解析 因为样本数据{x 1,x 2,…,x n }的平均数为h , {y 1,y 2,…,y m }的平均数为k ,所以第一组数据和为nh ,第二组数据和为mk , 因此把两组数据合并成一组以后, 这组样本的平均数为nh +mk m +n,故选B.7.从向阳小区抽取100户居民进行月用电量调查,为制定阶梯电价提供数据,发现其用电量都在50到350度之间,制作频率分布直方图的工作人员粗心大意,位置t 处未标明数据,你认为t 等于( )A.0.004 1B.0.004 2C.0.004 3D.0.004 4 答案 D解析 由题意得,50×(0.006+t +0.003 6+0.002 4×2+0.001 2)=1, t =0.004 4.8.10名工人某天生产同一零件,生产的件数分别为15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( ) A.a >b >c B.b >c >a C.c >a >b D.c >b >a 答案 D解析 易得a =14.7,b =15,c =17,故选D.9.如图是某青年歌手大奖赛上七位评委为甲,乙两名选手打出的分数的茎叶图(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a 1,a 2,则a 1,a 2的大小关系是________.(填a 1>a 2,a 2>a 1,a 1=a 2).答案 a 2>a 1解析 由题意可知,a 1=81+85×3+845=84,a 2=84×3+86+875=85, 所以a 2>a 1.10.已知一组正数x 1,x 2,x 3,x 4的方差s 2=14(x 21+x 22+x 23+x 24-16),则数据x 1+2,x 2+2,x 3+2,x 4+2的平均数为________.答案 4解析 由题意4x 2=16,x =2,所以(x 1+2)+(x 2+2)+(x 3+2)+(x 4+2)4=x 1+x 2+x 3+x 44+2=4. 11.(2016·四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解 (1)由频率分布直方图可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a ,解得a =0.30.(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x 吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04.12.(2016·北京)某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.解(1)如题图所示,用水量在[0.5,2)的频率的和为(0.2+0.3+0.4)×0.5=0.45<0.8,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于3立方米的频率为0.85,又w为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).即该市居民该月的人均水费估计为10.5元.。

相关文档
最新文档