2024年广东省高考数学一轮复习第9章第2讲:用样本估计总体(附答案解析)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2024年广东省高考数学一轮复习第9章第2讲:用样本估计
总体
考试要求 1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.能用数字特征估计总体集中趋势和总体离散程度.
知识梳理
1.百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.平均数、中位数和众数
(1)平均数:x=1
n
(x1+x2+…+x n).
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).
(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).
3.方差和标准差
(1)方差:s2=1
n错误!(x i -x)2或1
n错误!
2i-x2.
(2)标准差:s=错误!.
4.总体(样本)方差和总体(样本)标准差
(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体平均数为Y,则总
体方差S2=1
N错误!(Y i
-Y)2.
(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,
其中Y i出现的频数为f i(i=1,2,…,k),则总体方差为S2=1
N错误!i
(Y i-Y)2.
常用结论
1.若x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,…,mx n+a的平均数为m x+a.
2.数据x1,x2,…,x n与数据x1′=x1+a,x2′=x2+a,…,x n′=x n+a的方差相等,即
数据经过平移后方差不变.
3.若x1,x2,…,x n的方差为s2,那么ax1+b,ax2+b,…,ax n+b的方差为a2s2.
思考辨析
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.(×)
(2)方差与标准差具有相同的单位.(×)
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(√)
(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√)
教材改编题
1.若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为()
A.2B.4C.6D.8
答案D
解析根据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据2x1,2x2,…,2x9的方差为22s2=8.
2.某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为()
A.88.5B.89C.91D.89.5
答案B
解析7次的训练成绩从小到大排列为85,86,87,88,88,89,90,
7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数据,即89.
3.某校体育节10名旗手的身高(单位:cm)分别为175,178,176,180,179,175,176,179,180,179,则中位数为________.
答案178.5
解析把10名旗手的身高从小到大排列为175,175,176,176,178,179,179,179,180,180,
则178+179
2=178.5,所以所求中位数为178.5.
题型一样本的数字特征和百分位数的估计
例1(1)从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位数分别为()
A.92,85B.92,88
C.95,88D.96,85
答案B
解析数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经按照由小到大
的顺序排列,计算10×25%=2.5,取第三个数,所以第25百分位数是88.延伸探究本例中,第70百分位数是多少?

10×70%=7,第70百分位数是第7项与第8项的平均数,为
92+96
2
=94.(2)(多选)(2023·哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物(PM 2.5)的观测值:396275268225168166
176
173
188
168
141
157
若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发生改变的是()
A .极差
B .中位数
C .众数
D .平均数
答案ABD
解析
根据题意,若在此组数据中增加一个比现有的最大值大25的数据,即最大值变为396
+25=421,极差为最大值与最小值的差,要发生改变;
加入数据前,中位数为1
2×(173+176)=174.5,加入数据后,中位数为176,发生改变;
众数为数据中出现次数最多的数,不会改变;
若加入数据前,平均数为x ,加入数据后,平均数为12x +42113>x
,发生改变.
思维升华
计算一组n 个数据第p 百分位数的步骤
跟踪训练1(1)某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为
85,90,93,99,101,103,116,130,则这8名学生数学成绩的第75百分位数为()
A .102
B .103
C .109.5
D .116
答案C 解析
这组数据已经按照由小到大的数据排列,8×75%=6,则这8名学生数学成绩的第75
百分位数为第6个数与第7个数的平均数,即为
103+116
2
=109.5.(2)(多选)冬季奥林匹克运动会,是世界规模最大的冬季综合性运动会.自1924年起,每四年举办一届.2022年2月在北京举办了第24届冬季奥林匹克运动会,为了宣传奥运精神,红星实验学校组织了甲、乙两个社团,利用一周的时间对外进行宣传,将每天宣传的次数绘制成
如图所示的频数分布折线图,则()
A .甲社团宣传次数的众数小于乙社团宣传次数的众数
B .甲社团宣传次数的极差大于乙社团宣传次数的极差
C .甲社团宣传次数的平均数大于乙社团宣传次数的平均数
D .甲社团宣传次数的方差大于乙社团宣传次数的方差答案ABD
解析
观察每天宣传次数的频数分布折线图,
甲社团宣传次数的众数、乙社团宣传次数的众数分别为2,3,A 正确;甲社团宣传次数的极差、乙社团宣传次数的极差分别为3,2,B 正确;
甲社团宣传次数的平均数x 1=2+2+3+2+5+4+3
7=3,乙社团宣传次数的平均数x 2=
2+2+3+4+3+3+4
7
=3,C 不正确;
甲社团宣传次数的方差s 21=17×[3×(2-3)2+2×(3-3)2+(5-3)2+(4-3)2]=87,乙社团宣传次数的方差s 22=17×[2×(2-3)2+3×(3-3)2+2×(4-3)2
]=47,D 正确.
题型二总体集中趋势的估计
例2
为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校
举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.
(1)求图中m 的值,并估计此次竞赛活动学生成绩的中位数;
(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.解
(1)由频率分布直方图知(0.01+m +0.04+0.02)×10=1,解得m =0.03;
设此次竞赛活动学生成绩的中位数为x 0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,
从而可得80<x 0<90,由(x 0-80)×0.04=0.5-0.4,得x 0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由频率分布直方图及(1)知,
x =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-82
10
×0.4=0.52,则获奖的学生有500×0.52=260(名),
所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.思维升华
频率分布直方图中的数字特征
(1)众数:最高矩形的底边中点的横坐标.
(2)中位数:中位数左边和右边的矩形的面积和应该相等.
(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.跟踪训练2
(2022·哈尔滨模拟)治理沙漠化离不开优质的树苗,现从苗圃中随机地抽测了200
株树苗的高度(单位:cm),得到如图所示的频率分布直方图.
(1)求直方图中a 的值及众数、中位数;
(2)若树苗高度在185cm 及以上是可以移栽的合格树苗.从样本中用比例分配的分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格树苗分别应抽取多少株?解
(1)∵(0.0015+0.0110+0.0225+0.0300+a +0.0080+0.0020)×10=1,
∴a =0.0250,众数为
185+195
2
=190,设中位数为x ,∵(0.0015+0.0110+0.0225)×10=0.35<0.5,
(0.0015+0.0110+0.0225+0.0300)×10=0.65>0.5,
则185<x<195,
0.35+0.0300×(x-185)=0.5,
∴x=190.
故a=0.0250,众数为190,中位数为190.
(2)由题意可知,合格树苗所占频率为(0.0300+0.0250+0.0080+0.0020)×10=0.65,不合格树苗所占频率为1-0.65=0.35,
所以不合格树苗抽取20×0.35=7(株),合格树苗抽取20×0.65=13(株),
故不合格树苗、合格树苗应分别抽取7株和13株.
题型三总体离散程度的估计
例3(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下.
旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s21和s22.
(1)求x,y,s21,s22;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s21+s22
10,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
解(1)由表格中的数据易得x=1
10×(-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.3)+
10.0=10.0,
y=1
10×(0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.5)+10.0=10.3,
s21=1
10×[(9.7-10.0)
2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,
s22=1
10×[(10.0-10.3)
2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.
(2)由(1)中数据可得y -x =10.3-10.0=0.3,而2
s 21+s 2
2
10
=25
(s 21+s 2
2)=0.0304,显然有y -x >2s 21+s 2
2
10
著提高.思维升华
总体离散程度的估计
标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.跟踪训练3
(2022·济宁模拟)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间
参加的若干次预赛成绩中随机抽取8次,记录如下:
甲8281797895889384乙
92
95
80
75
83
80
90
85
(1)求两位学生预赛成绩的平均数和方差;
(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.解
(1)x 甲=1
8
×(82+81+79+78+95+88+93+84)=85,
x 乙=18
×(92+95+80+75+83+80+90+85)=85,
s 2甲=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84
-85)2]=35.5,
s 2乙=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85
-85)2]=41.
(2)由(1)知x 甲=x 乙,s 2甲<s 2
乙,
甲的成绩较稳定,所以派甲参赛比较合适.
课时精练
1.为做好疫情防控工作,某校坚持落实“双测温两报告”制度,以下是某宿舍6名学生某日上午的体温记录:36.3,36.1,36.4,36.7,36.5,36.6(单位:℃),则该组数据的第80百分位数为(
)
A .36.7
B .36.6
C .36.5
D .36.4
答案B
解析
将6名学生该日上午的体温记录从小到大排列为36.1,36.3,36.4,36.5,36.6,36.7,
因为80%×6=4.8,所以该组数据的第80百分位数为36.6.
2.(2022·南京模拟)已知一组数据x 1,x 2,x 3,x 4,x 5的平均数为2,方差为1
2,则另一组数据
3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数、方差分别为()
A .2,
1
2B .2,1
C .4,
3
2
D .4,
9
2
答案D
解析
因为一组数据x 1,x 2,x 3,x 4,x 5的平均数为2,方差为1
2

所以另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数为3×2-2=4,方差为32×12=9
2
.
3.(多选)成立时间少于10年、估值超过10亿美元且未上市的企业称为独角兽企业.2022年中国新经济独角兽企业分布较广泛、覆盖居民生活的各个方面.如图为2022年中国新经济独角兽企业TOP100的行业分布图,在中国新经济独角兽企业TOP100榜单中,京、沪、粤三地的企业数量共同占比达到70%.下列说法正确的是(
)
A .随着智能出行与共享经济观念的普及,汽车交通行业备受投资者关注
B .在该TOP100榜单中独角兽企业数量的中位数是3
C .在中国新经济独角兽企业TOP100榜单中,京、沪、粤三地的企业超过82家
D .2022年中国新经济独角兽企业TOP100榜单中,企业服务、汽车交通、先进制造行业的企业数量共同占比超过30%答案AD
解析A 选项,由图可知,汽车交通行业在独角兽企业TOP100榜单中数量较多,故A 选项
正确;
B 选项,数据为11,10,10,10,10,9,7,6,4,4,4,4,3,2,2,2,2,则中位数为4,故B 选项不正确;
C 选项,100×70%=70<82,故C 选项不正确;
D 选项,企业服务、汽车交通、先进制造行业的企业数量共同占比为
11+10+10
100
×100%=
31%>30%,故D 选项正确.
4.(多选)习近平总书记强调,要坚持健康第一的教育理念,加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级学生每周在校体育锻炼时长(单位:小时)进行了统计,得到如下频率分布表:
分组[2,3)[3,4)[4,5)[5,6]频率
0.25
0.30
0.20
0.25
则下列关于高一年级学生每周体育锻炼时长的说法中正确的是()
A .众数约为2.5
B .中位数约为3.83
C .平均数为3.95
D .第80百分位数约为5.2答案BCD
解析
对于A ,根据频率分布表可得,高一年级学生每周体育锻炼时长的众数为
3+4
2
=3.5,故A 错误;
对于B ,设高一年级学生每周体育锻炼时长的中位数为x ,则0.25+x -3
4-3
×0.30=0.5,解得x ≈3.83,故B 正确;
对于C ,高一年级学生每周体育锻炼时长的平均数为0.25×2.5+0.30×3.5+0.20×4.5+0.25×5.5=3.95,故C 正确;
对于D ,因为0.25+0.30+0.20+0.05=0.80,所以高一年级学生每周体育锻炼时长的第80百分位数约为5+0.05
0.25
=5.2,故D 正确.
5.(多选)第24届冬奥会于2022年2月4日在国家体育场鸟巢举行了盛大开幕式.在冬奥会的志愿者选拔工作中,某高校承办了面试工作,面试成绩满分100分,现随机抽取了80名候选者的面试成绩并分为五组,绘制成如图所示的频率分布直方图,则下列说法正确的是(每组数据以区间的中点值为代表)(
)
A.b的值为0.25
B.候选者面试成绩的中位数约为69.4
C.在被抽取的候选者中,成绩在区间[65,75)之间的候选者有30人
D.估计候选者的面试成绩的平均数约为69.5
答案BD
解析对于A,由(0.005+b+0.045+0.02+0.005)×10=1,解得b=0.025,故A错误;
对于B,设候选者面试成绩的中位数为x,则(0.005+0.025)×10+(x-65)×0.045=0.5,解得x≈69.4,故B正确;
对于C,成绩在区间[65,75)的频率为0.045×10=0.45,故人数为80×0.45=36,故C错误;对于D,50×0.005×10+60×0.025×10+70×0.045×10+80×0.02×10+90×0.005×10=69.5,故D正确.
6.(2023·云南师大附中模拟)根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①,②,③,④,依次计算得到结果如下:
①平均数x<4;
②平均数x<4且极差小于或等于3;
③平均数x<4且标准差s≤4;
④众数等于5且极差小于或等于4.
则4组样本中一定符合入冬指标的共有()
A.1组B.2组C.3组D.4组
答案B
解析①举反例:0,0,0,4,11,其平均数x=3<4.但不符合入冬指标;
②假设有数据大于或等于10,由极差小于或等于3可知,
则此组数据中的最小值为10-3=7,此时数据的平均数必然大于7,与x<4矛盾,故假设错误.则此组数据全部小于10.符合入冬指标;
③举反例:1,1,1,1,11,平均数x=3<4,且标准差s=4.但不符合入冬指标;
④在众数等于5且极差小于等于4时,最大数不超过9.符合入冬指标.7.(2022·福州模拟)电影《长津湖》点燃了人们心中对英雄的崇敬之情,也更加显示出如今和平生活的来之不易.某影院记录了观看此片的70位观众的年龄,其中年龄位于区间[10,20)内的有10位,位于区间[20,30)内的有20位,位于区间[30,40)内的有25位,位于区间[40,50]内的有15位,则这70位观众年龄的众数的估计值为________.
答案35
解析由于25>20>15>10,故众数位于区间[30,40)内,所以众数的估计值为30+402
=35.8.(2023·沧州模拟)已知某样本数据分别为1,2,3,a ,6,若样本平均数x =3,则样本方差s 2=________.
答案145解析由题设,得x =1+2+3+a +65
=3,可得a =3,所以s 2=15错误!(x i -x )2=145.9.(2023·南通模拟)某学校对高一某班的同学进行了身高(单位:cm)调查,将得到的数据进行适当分组后(除最后一组为闭区间外其余每组为左闭右开区间),画出如图所示的频率分布直方图.
(1)求m 的值;
(2)估计全班同学身高的中位数;
(3)估计全班同学身高的平均数及方差(同一组中的数据用该组区间的中点值作代表).解(1)由频率分布直方图可得(m +0.010+0.010+0.015+0.040)×10=1,解得m =0.025.
(2)设全班同学身高的中位数为x ,由题可知x ∈[165,175),得0.10+0.15+(x -165)×0.040=0.5,
解得x =171.25,
故估计全班同学身高的中位数为171.25.
(3)估计全班同学身高的平均数为150×0.10+160×0.15+170×0.40+180×0.25+190×0.10=171,
估计全班同学身高的方差为(150-171)2×0.10+(160-171)2×0.15+(170-171)2×0.40+(180-171)2×0.25+(190-171)2×0.10=119.
10.对参加某次数学竞赛的1000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.
(1)根据直方图完成以下表格;
成绩[50,60)[60,70)[70,80)[80,90)[90,100]
频数
(2)求参赛选手初赛成绩的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛的选手成绩?
解(1)填表如下:
成绩[50,60)[60,70)[70,80)[80,90)[90,100]
频数50150350350100
(2)平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78,
方差为(55-78)2×0.05+(65-78)2×0.15+(75-78)2×0.35+(85-78)2×0.35+(95-78)2×0.1=101.
(3)进入复赛的选手成绩为80+350-(380-100)
350×10=82(分),
所以初赛成绩为82分及以上的选手均可进入复赛.(说明:回答82分以上,或82分及以上均可).
11.(2022·天津模拟)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5~40之间.估计垫球数的样本数据的第75百分位数是()
A.17.5B.18.75C.27D.28
答案D
解析垫球数在区间[5,25)内的人数占总数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%;所以第75百分位数位于区间[25,30)内,且25+5×
0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.
12.(2022·上海模拟)若等差数列{x n }的公差为3,则x 1,x 2,x 3,…,x 9的方差为________.答案60
解析
由等差数列{x n }的公差为3,可知x =x 1+x 2+…+x 99=x 1+x 92×99=x 1+x 92=x 5,所以方差s 2=19[(x 1-x 5)2+(x 2-x 5)2+…+(x 9-x 5)2]=19(16d 2+9d 2+4d 2+d 2)×2=203d 2=203
×9=60.
13.(多选)某学校规定,若五个工作日内学校某天有超过3个人的体温测量值高于37.5℃,则需全员进行核酸检测.该校统计了五个工作日内每天体温超过37.5℃的人数,则根据这组数据的下列信息,能断定该校不需全员进行核酸检测的是(
)A .中位数是1,平均数是1
B .中位数是1,众数是0
C .中位数是2,众数是2
D .平均数是2,方差是0.8
答案
AD 解析对于A ,因为中位数是1,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为a ,b ,1,c ,d ,
因为平均数是1,所以a +b +1+c +d =5,若d =4,则a =b =c =0,与中位数是1矛盾,故A 正确;
对于B ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为0,0,1,2,4,满足中位数是1,众数是0,但有一天超过3人,故B 错误;
对于C ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为0,2,2,3,4,满足中位数是2,众数是2,但有一天超过3人,故C 错误;
对于D ,设五个工作日内每天体温超过37.5℃的人数按从小到大的顺序排列为a ,b ,c ,d ,e ,因为平均数是2,方差是0.8,则a +b +c +d +e =10,15
[(a -2)2+(b -2)2+(c -2)2+(d -2)2+(e -2)2]=0.8,即(a -2)2+(b -2)2+(c -2)2+(d -2)2+(e -2)2=4,
则e≤4,若e=4,从方差角度来说a=b=c=d=2,不满足a+b+c+d+e=10,
所以e<4,同理a,b,c,d均小于4,故D正确.
14.(多选)已知一组数据丢失了一个大于3的数据,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的2倍,则丢失的数据可能是()
A.4B.12C.18D.20
答案AC
解析设丢失的数据为x,则这七个数据的平均数为31+x
7,众数是3,
若3<x<5,则中位数为x,此时31+x
7+3=2x,解得x=4;
若x≥5,则中位数为5,此时31+x
7+3=2×5,解得x=18.
综上所述,丢失的数据可能是4或18.。

相关文档
最新文档