2025年高考数学一轮复习(新高考版)第9章 §9.2 用样本估计总体
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
把10名旗手的身高从小到大排列为175,175,176,176,178,179,179,179, 180,180, 则178+2 179=178.5,所以所求中位数为 178.5.
第
二 部 分
探究核心题型
题型一 样本的数字特征和百分位数的估计
例1 (1)从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,
为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为
S2=N1
k
fi(Yi-
Y
)2.
i=1
常用结论
1.若 x1,x2,…,xn 的平均数为 x ,那么 mx1+a,mx2+a,…,mxn+ a 的平均数为 m x +a. 2.数据x1,x2,…,xn与数据x1′=x1+a,x2′=x2+a,…,xn′ =xn+a 的方差相等,即数据经过平移后方差不变. 3.若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b 的方差为a2s2.
延伸探究 本例中,第70百分位数是多少? 10×70%=7,第 70 百分位数是第 7 项与第 8 项的平均数,为92+2 96=94.
(2)(多选)(2023·哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物
(PM2.5)的观测值: 396 275 268 225 168 166 176 173
√A.甲社团宣传次数的众数小于乙社团宣传次数的众数 √B.甲社团宣传次数的极差大于乙社团宣传次数的极差
C.甲社团宣传次数的平均数大于乙社团宣传次数的平均数
√D.甲社团宣传次数的方差大于乙社团宣传次数的方差
观察每天宣传次数的频数分布折线图, 甲社团宣传次数的众数、乙社团宣传 次数的众数分别为2,3,A正确; 甲社团宣传次数的极差、乙社团宣传 次数的极差分别为3,2,B正确; 甲社团宣传次数的平均数 x 1=2+2+3+72+5+4+3=3,乙社团宣传 次数的平均数 x 2=2+2+3+47+3+3+4=3,C 不正确;
的第80百分位数为
√ A.88.5 B.89
C.91
D.89.5
7次的训练成绩从小到大排列为85,86,87,88,88,89,90, 7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数 据,即89.
教材改编题
3.某校体育节10名旗手的身高(单位:cm)分别为175,178,176,180,179,175, 176,179,180,179,则中位数为__1_7_8_._5__.
思考辨析
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.( × ) (2)方差与标准差具有相同的单位.( × )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,
方差不变.( √ )
(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.
188 168 141 157
若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发
生改变的是
√A.极差
C.众数
√B.中位数 √D.平均数
根据题意,若在此组数据中增加一个比现有的最大值大25的数据,
即最大值变为396+25=421,极差为最大值与最小值的差,要发生
改变; 加入数据前,中位数为12×(173+176)=174.5,加入数据后,中位数
数为
A.102
√ B.103
C.109.5 D.116
这组数据已经按照由小到大的数据排列,8×75%=6,则这8名学生 数学成绩的第75百分位数为第6个数与第7个数的平均数, 即为103+2 116=109.5.
(2)(多选)冬季奥林匹克运动会,是世界规模 最大的冬季综合性运动会.自1924年起,每四 年举办一届.2022年2月在北京举办了第24届 冬季奥林匹克运动会,为了宣传奥运精神, 红星实验学校组织了甲、乙两个社团,利用 一周的时间对外进行宣传,将每天宣传的次数绘制成如图所示的频数分布折线 图,则
甲社团宣传次数的方差 s21=17×[3×(2-3)2+2×(3-3)2+(5-3)2+(4 -3)2]=87, 乙社团宣传次数的方差 s22=17× [2×(2-3)2+3×(3-3)2+2×(4
-3)2]=47,D 正确.
题型二 总体集中趋势的估计
例2 为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产 党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次 竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩 均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这 50 名 学 生 的 成 绩 ( 单 位 : 分 ) 进 行 分 组 , 第 一 组 [60,70),第二组[70,80),第三组[80,90),第四组 [90,100],得到如图所示的频率分布直方图. (1)求图中m的值,并估计此次竞赛活动学生成绩 的中位数;
由频率分布直方图知(0.01+m+0.04+0.02)×10 =1,解得m=0.03; 设此次竞赛活动学生成绩的中位数为x0,因为 数据落在[60,80)内的频率为0.4,落在[60,90)内 的频率为0.8, 从而可得80<x0<90,由(x0-80)×0.04=0.5-0.4,得x0=82.5, 所以估计此次竞赛活动学生成绩的中位数为82.5.
(2)根据频率分布直方图,估计此次竞赛活动成 绩的平均数.若对成绩不低于平均数的同学进行 奖励,请估计在参赛的500名学生中有多少名 学生获奖.
由频率分布直方图及(1)知, x =65×0.1+75×0.3+85×0.4+95×0.2=82, 此次竞赛活动学生成绩不低于 82 的频率为 0.2 +901-082×0.4=0.52, 则获奖的学生有500×0.52=260(名), 所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有 260名学生获奖.
第九章 统计与成对数据的统计分析
§9.2 用样本估计总体
考试要求
1.会用统计图表对总体进行估计,会求n个数据的第p百分位数. 2.能用数字特征估计总体集中趋势和总体离散程度.
内容索引
第一部分
落实主干知识
第二部分
探究核心题型
第三部分
课时精练
第
一 部 分Biblioteka 落实主干知识知识梳理
1.百分位数 一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少 有_p_%_的数据小于或等于这个值,且至少有(100-p)%的数据_大__于__或__等__于__ 这个值. 2.平均数、中位数和众数 (1)平均数:x=__1n_(x_1_+__x_2_+__…__+__xn_)_.
∵(0.001 5+0.011 0+0.022 5+0.030 0+a+0.008 0+0.002 0)×10=1, ∴a=0.025 0,众数为185+2 195=190, 设中位数为x,∵(0.001 5+0.011 0 +0.022 5)×10=0.35<0.5, (0.001 5+0.011 0+0.022 5+0.030 0) ×10=0.65>0.5, 则185<x<195, 0.35+0.030 0×(x-185)=0.5,
(√)
教材改编题
1.若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为
A.2
B.4
C.6
√D.8
根据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据2x1, 2x2,…,2x9的方差为22s2=8.
教材改编题
2.某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩
为 176,发生改变;
众数为数据中出现次数最多的数,不会改变;
若加入数据前,平均数为
x
,加入数据后,平均数为12
x +421 13 >
x
,
发生改变.
思维升华
计算一组n个数据第p百分位数的步骤
跟踪训练1 (1)某中学高一年级8名学生某次考试的数学成绩(满分150分)
分别为85,90,93,99,101,103,116,130,则这8名学生数学成绩的第75百分位
∴x=190. 故a=0.025 0,众数为190,中位数为190.
(2)若树苗高度在185 cm及以上是可以移栽的合格树苗.从样本中用比例分 配的分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格 树苗分别应抽取多少株?
由题意可知,合格树苗所占频率为(0.030 0+0.025 0+0.008 0+0.002 0) ×10=0.65,不合格树苗所占频 率为1-0.65=0.35, 所以不合格树苗抽取20×0.35= 7(株),合格树苗抽取20×0.65= 13(株), 故不合格树苗、合格树苗应分别 抽取7株和13株.
n
x2i -
x
2.
i=1
1n
n
xi-
x
2
(2)标准差:s=______i_=_1 ________.
知识梳理
4.总体(样本)方差和总体(样本)标准差
(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体
平均数为
Y
,则总体方差
S2=N1
N
(Yi-
Y
)2.
i=1
(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记
由表格中的数据易得 x =110×(-0.2+0.3+0+0.2-0.1-0.2+0+0.1 +0.2-0.3)+10.0=10.0,
y =110×(0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.5)+10.0=10.3, s21=110×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2 +(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036, s22=110×[(10.0 - 10.3)2 + 3×(10.1 - 10.3)2 + (10.3 - 10.3)2 + 2×(10.4 - 10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果 y - x ≥2 s21+ 10s22,则认为新设备生产产品的该项指标的均值较旧设备 有显著提高,否则不认为有显著提高).
题型三 总体离散程度的估计
例3 (2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新 设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产 了10件产品,得到各件产品该项指标数据如下.
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7 新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5 旧设备和新设备生产产品的该项指标的样本平均数分别记为 x 和 y ,样 本方差分别记为 s21和 s22. (1)求 x , y ,s21,s22;
92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位
数分别为
A.92,85
√B.92,88
C.95,88
D.96,85
数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经 按照由小到大的顺序排列,计算10×25%=2.5,取第三个数,所以第 25百分位数是88.
思维升华
频率分布直方图中的数字特征 (1)众数:最高矩形的底边中点的横坐标. (2)中位数:中位数左边和右边的矩形的面积和应该相等. (3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对 应频率之积的和.
跟踪训练2 (2022·哈尔滨模拟)治理 沙漠化离不开优质的树苗,现从苗 圃中随机地抽测了200株树苗的高度 (单位:cm),得到如图所示的频率分 布直方图. (1)求直方图中a的值及众数、中位数;
知识梳理
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最_中__间_ 的一个数据(当数据个数是奇数时)或最中间两个数据的 平均数 (当数据个 数是偶数时). (3)众数:一组数据中出现次数 最多 的数据(即频数最大值所对应的样本 数据).
知识梳理
3.方差和标准差
(1)方差:s2=__1n_i=n_1_(_x_i-__x_)_2_或1n
第
二 部 分
探究核心题型
题型一 样本的数字特征和百分位数的估计
例1 (1)从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,
为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为
S2=N1
k
fi(Yi-
Y
)2.
i=1
常用结论
1.若 x1,x2,…,xn 的平均数为 x ,那么 mx1+a,mx2+a,…,mxn+ a 的平均数为 m x +a. 2.数据x1,x2,…,xn与数据x1′=x1+a,x2′=x2+a,…,xn′ =xn+a 的方差相等,即数据经过平移后方差不变. 3.若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b 的方差为a2s2.
延伸探究 本例中,第70百分位数是多少? 10×70%=7,第 70 百分位数是第 7 项与第 8 项的平均数,为92+2 96=94.
(2)(多选)(2023·哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物
(PM2.5)的观测值: 396 275 268 225 168 166 176 173
√A.甲社团宣传次数的众数小于乙社团宣传次数的众数 √B.甲社团宣传次数的极差大于乙社团宣传次数的极差
C.甲社团宣传次数的平均数大于乙社团宣传次数的平均数
√D.甲社团宣传次数的方差大于乙社团宣传次数的方差
观察每天宣传次数的频数分布折线图, 甲社团宣传次数的众数、乙社团宣传 次数的众数分别为2,3,A正确; 甲社团宣传次数的极差、乙社团宣传 次数的极差分别为3,2,B正确; 甲社团宣传次数的平均数 x 1=2+2+3+72+5+4+3=3,乙社团宣传 次数的平均数 x 2=2+2+3+47+3+3+4=3,C 不正确;
的第80百分位数为
√ A.88.5 B.89
C.91
D.89.5
7次的训练成绩从小到大排列为85,86,87,88,88,89,90, 7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数 据,即89.
教材改编题
3.某校体育节10名旗手的身高(单位:cm)分别为175,178,176,180,179,175, 176,179,180,179,则中位数为__1_7_8_._5__.
思考辨析
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.( × ) (2)方差与标准差具有相同的单位.( × )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,
方差不变.( √ )
(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.
188 168 141 157
若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发
生改变的是
√A.极差
C.众数
√B.中位数 √D.平均数
根据题意,若在此组数据中增加一个比现有的最大值大25的数据,
即最大值变为396+25=421,极差为最大值与最小值的差,要发生
改变; 加入数据前,中位数为12×(173+176)=174.5,加入数据后,中位数
数为
A.102
√ B.103
C.109.5 D.116
这组数据已经按照由小到大的数据排列,8×75%=6,则这8名学生 数学成绩的第75百分位数为第6个数与第7个数的平均数, 即为103+2 116=109.5.
(2)(多选)冬季奥林匹克运动会,是世界规模 最大的冬季综合性运动会.自1924年起,每四 年举办一届.2022年2月在北京举办了第24届 冬季奥林匹克运动会,为了宣传奥运精神, 红星实验学校组织了甲、乙两个社团,利用 一周的时间对外进行宣传,将每天宣传的次数绘制成如图所示的频数分布折线 图,则
甲社团宣传次数的方差 s21=17×[3×(2-3)2+2×(3-3)2+(5-3)2+(4 -3)2]=87, 乙社团宣传次数的方差 s22=17× [2×(2-3)2+3×(3-3)2+2×(4
-3)2]=47,D 正确.
题型二 总体集中趋势的估计
例2 为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产 党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次 竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩 均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这 50 名 学 生 的 成 绩 ( 单 位 : 分 ) 进 行 分 组 , 第 一 组 [60,70),第二组[70,80),第三组[80,90),第四组 [90,100],得到如图所示的频率分布直方图. (1)求图中m的值,并估计此次竞赛活动学生成绩 的中位数;
由频率分布直方图知(0.01+m+0.04+0.02)×10 =1,解得m=0.03; 设此次竞赛活动学生成绩的中位数为x0,因为 数据落在[60,80)内的频率为0.4,落在[60,90)内 的频率为0.8, 从而可得80<x0<90,由(x0-80)×0.04=0.5-0.4,得x0=82.5, 所以估计此次竞赛活动学生成绩的中位数为82.5.
(2)根据频率分布直方图,估计此次竞赛活动成 绩的平均数.若对成绩不低于平均数的同学进行 奖励,请估计在参赛的500名学生中有多少名 学生获奖.
由频率分布直方图及(1)知, x =65×0.1+75×0.3+85×0.4+95×0.2=82, 此次竞赛活动学生成绩不低于 82 的频率为 0.2 +901-082×0.4=0.52, 则获奖的学生有500×0.52=260(名), 所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有 260名学生获奖.
第九章 统计与成对数据的统计分析
§9.2 用样本估计总体
考试要求
1.会用统计图表对总体进行估计,会求n个数据的第p百分位数. 2.能用数字特征估计总体集中趋势和总体离散程度.
内容索引
第一部分
落实主干知识
第二部分
探究核心题型
第三部分
课时精练
第
一 部 分Biblioteka 落实主干知识知识梳理
1.百分位数 一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少 有_p_%_的数据小于或等于这个值,且至少有(100-p)%的数据_大__于__或__等__于__ 这个值. 2.平均数、中位数和众数 (1)平均数:x=__1n_(x_1_+__x_2_+__…__+__xn_)_.
∵(0.001 5+0.011 0+0.022 5+0.030 0+a+0.008 0+0.002 0)×10=1, ∴a=0.025 0,众数为185+2 195=190, 设中位数为x,∵(0.001 5+0.011 0 +0.022 5)×10=0.35<0.5, (0.001 5+0.011 0+0.022 5+0.030 0) ×10=0.65>0.5, 则185<x<195, 0.35+0.030 0×(x-185)=0.5,
(√)
教材改编题
1.若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为
A.2
B.4
C.6
√D.8
根据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据2x1, 2x2,…,2x9的方差为22s2=8.
教材改编题
2.某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩
为 176,发生改变;
众数为数据中出现次数最多的数,不会改变;
若加入数据前,平均数为
x
,加入数据后,平均数为12
x +421 13 >
x
,
发生改变.
思维升华
计算一组n个数据第p百分位数的步骤
跟踪训练1 (1)某中学高一年级8名学生某次考试的数学成绩(满分150分)
分别为85,90,93,99,101,103,116,130,则这8名学生数学成绩的第75百分位
∴x=190. 故a=0.025 0,众数为190,中位数为190.
(2)若树苗高度在185 cm及以上是可以移栽的合格树苗.从样本中用比例分 配的分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格 树苗分别应抽取多少株?
由题意可知,合格树苗所占频率为(0.030 0+0.025 0+0.008 0+0.002 0) ×10=0.65,不合格树苗所占频 率为1-0.65=0.35, 所以不合格树苗抽取20×0.35= 7(株),合格树苗抽取20×0.65= 13(株), 故不合格树苗、合格树苗应分别 抽取7株和13株.
n
x2i -
x
2.
i=1
1n
n
xi-
x
2
(2)标准差:s=______i_=_1 ________.
知识梳理
4.总体(样本)方差和总体(样本)标准差
(1)一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体
平均数为
Y
,则总体方差
S2=N1
N
(Yi-
Y
)2.
i=1
(2)加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记
由表格中的数据易得 x =110×(-0.2+0.3+0+0.2-0.1-0.2+0+0.1 +0.2-0.3)+10.0=10.0,
y =110×(0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.5)+10.0=10.3, s21=110×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2 +(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036, s22=110×[(10.0 - 10.3)2 + 3×(10.1 - 10.3)2 + (10.3 - 10.3)2 + 2×(10.4 - 10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果 y - x ≥2 s21+ 10s22,则认为新设备生产产品的该项指标的均值较旧设备 有显著提高,否则不认为有显著提高).
题型三 总体离散程度的估计
例3 (2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新 设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产 了10件产品,得到各件产品该项指标数据如下.
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7 新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5 旧设备和新设备生产产品的该项指标的样本平均数分别记为 x 和 y ,样 本方差分别记为 s21和 s22. (1)求 x , y ,s21,s22;
92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位
数分别为
A.92,85
√B.92,88
C.95,88
D.96,85
数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经 按照由小到大的顺序排列,计算10×25%=2.5,取第三个数,所以第 25百分位数是88.
思维升华
频率分布直方图中的数字特征 (1)众数:最高矩形的底边中点的横坐标. (2)中位数:中位数左边和右边的矩形的面积和应该相等. (3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对 应频率之积的和.
跟踪训练2 (2022·哈尔滨模拟)治理 沙漠化离不开优质的树苗,现从苗 圃中随机地抽测了200株树苗的高度 (单位:cm),得到如图所示的频率分 布直方图. (1)求直方图中a的值及众数、中位数;
知识梳理
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最_中__间_ 的一个数据(当数据个数是奇数时)或最中间两个数据的 平均数 (当数据个 数是偶数时). (3)众数:一组数据中出现次数 最多 的数据(即频数最大值所对应的样本 数据).
知识梳理
3.方差和标准差
(1)方差:s2=__1n_i=n_1_(_x_i-__x_)_2_或1n