高考专题:用样本估计总体
用样本的数字特征估计总体-高考数学复习
1. (多选)如图是某班50名学生期中考试数学成绩的频率分布直方
图,其中成绩分组区间是[40,50),
[50,60),[60,70),[70,80),
[80,90),[90,100],则下列说
法正确的是(
)
A. 图中的 x 的值为0.018
B. 该班50 名学生期中考试数学成绩的众数是75
C. 该班50 名学生期中考试数学成绩的中位数是72
目录
1
C O N T E N T S
2
3
知识 逐点夯实
考点 分类突破
课时 跟踪检测
PART
1
知识 逐点夯实
课前自修
必备知识 系统梳理 基础重落实
目录
高中总复习·数学
1. 总体百分位数的估计
(1)百分位数
定义
意义
百 一组数据的第 p 百分位数是这样一个值,
分 它使得这组数据中 至少
有 p %的数据小
为 ,第二层抽取 n 个,即 y 1, y 2,…, yn ,平均数为 ,则
x 1, x 2,…, xm , y 1, y 2,…, yn 的平均数 =
+
+
.
+
(2)中位数:将一组数据按大小依次排列,处于
最中间 位置
的一个数据(或最中间两个数据的平均数)叫做这组数据的
目录
高中总复习·数学
2. 平均数、方差的公式推广
若数据 x 1 , x 2 ,…, x n 的平均数为 ത ,方差为 s 2 ,那么 mx 1 +
a , mx 2 + a , mx 3 + a ,…, mx n + a 的平均数是 m ത + a ,方
第二节 用样本估计总体-高考状元之路
第二节 用样本估计总体预习设计 基础备考知识梳理1.频率分布直方图(1)通常我们对总体作出的估计一般分成两种,一种是用 估计总体的分布,另一种是用 估计总体的数字特征.(2)在频率分布直方图中,纵轴表示 ,数据落在各小组内的频率用 表示.各小长方 形的面积总和2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的 ,就得到频率分布折线图.(2)总体密度曲线:随着 的增加,作图时 增加, 减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.茎叶图的优点用茎叶图表示数据有两个突出的优点: 一是从统计图上没有 的损失,所有的 都可以从茎叶图中得到; 二是茎叶图可以在比赛时 方便记录与表示.4.标准差和方差(1)标准差是样本数据到平均数的一种(2)标准差:=s(3)方差:=2sn x (是样本数据,砚是样本容量,x 是样本平均数). 5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积 ,由此可以估计中位数的值.(2抨均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的(3)众数:在频率分布直方图中,众数是最高的矩形的中点的典题热身1.已知一个样本中的数据为..0,15.0,13.0,15.0,12.0,14.0,13.0,16.0,15.0,17.0则该样本的众数、中位数分别是( )15.0,14.0.A 14.0,15.0.B 15.0,15.0.C 145.0,15.0.D答案:D2.已知一个样本中的数据为,5,4,3,2,1那么该样本的标准差为( )1.A2.B3.C 2.D答案:B3.(2011.潍坊模拟)甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如下图所示,若甲、乙两人的平均成绩分别,乙甲、X X 则下列结论正确的是 ( );.乙甲X X A < 乙比甲成绩稳定;.乙甲X X B >甲比乙成绩稳定乙甲X X C >.乙比甲成绩稳定;.乙甲X X D <甲比乙成绩稳定答案:A4.一个容量为32的样本,分成5组,已知第三组的频率为0.375,则另外四组的频数之和为 答案:205.为了了解某地区高三学生身体发育情况,抽查了该地区100名年龄在17.5岁~18岁的男生体重(kg),得到频率分布直方图如下图所示.则样本数据落在[62.5,64.5)内的频率是 .这100名学生的体重的众数是答案:14.0 5.65课堂设计 方法备考题型一 频率分布直方图的绘制与应用【倒1】为了解某校初中毕业男生的体能状况,从该校初中毕业班学生中抽取若干名男生进行铅球测试,把所得数据(精确到0.1 m)进行整理后,分成6组画出频率分布直方图的一部分(如下图),已知从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30.第6小组的频数是7.(1)请将频率分布直方图补充完整,(3)若成绩在8.0 m 以上(含8.0 m)的为合格,试求这次铅球黼试的成绩的合格率.题型二 茎叶图的应用【例2】在某电脑杂志的一篇文章中,每个句子的字数如下:,15,25,14,27,36,19,20,24,26,15,18,27,23,17,3,28,101.17,27,24,11,22在某报纸的一篇文章中,每个句子中所含的字的个数如下:,22,13,27,41,36,12,35,27,33,41,32,19,28,24,33,39,27.22,32,46,18,23(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?题型三 用样本的数字特征估计总体的数字特征【例3】甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价,技法巧点(1)用样本频率分布来估计总体分布的重点是:频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布,难点是频率分布表和频率分布直方图的理解及应用,在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致,通过频率分布表和频率分布直方图可以对总体作出估计.(2)几种表示频率分布的方法的优点与不足:①频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便. ②频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式,但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
最新高考一轮总复习《10.2 用样本估计总体》
如果直方图在右边“拖尾”(如图(2)),那么平均数大于中位数;
如果直方图在左边“拖尾”(如图(3)),那么平均数小于中位数.
问题思考
在频率分布直方图中,如何确定中位数?
在频率分布直方图中,中位数左边和右边的直方图的面积相等.
4.方差和标准差
假设一组数据是 x1,x2,…,xn,用表示这组数据的平均数.
解 ①由题图可得甲、乙两人五次测试的成绩得分分别为
甲:10,13,12,14,16;乙:13,14,12,12,14.
则甲 =
2
甲
2
乙
=
=
10+13+12+14+16
=13,
乙
5
=
13+14+12+12+14
=13,
5
1
2
2
2
2
2
×[(10-13)
+(13-13)
+(12-13)
+(14-13)
中的中间数据,由于样本数据在区间
[13,14)内的频率为0.02,在区间[14,15)内
的频率为0.18,在区间[15,16)内的频率为
0.36,0.02+0.18+0.36>0.5,所以中位数落
在区间[15,16)内,设中位数为x,
95
则0.02+0.18+(x-15)×0.36=0.5,得 x= 6 .
解离散程度参数的统计含义.
3.结合实例,能用样本估计总体的取值规律.
4.结合实例,能用样本估计百分位数,理解百分位数的统计含义.
备考指导
用样本估计总体在高考中主要以选择题或填空题的形式出现,在概率、统
用样本估计总体(高三一轮复习)
数学 N 必备知识 自主学习 关键能力 互动探究
— 12 —
解析 因为红队每场比赛平均失球个数是1.6,蓝队每场比赛平均失球个数是 2.2,所以平均来说,红队比蓝队防守技术好,故A错误;因为蓝队每场比赛平均失 球个数是2.2,全年比赛失球个数的标准差为0.4,所以蓝队经常失球,故B错误;因 为红队全年比赛失球个数的标准差为1.1,蓝队全年比赛失球个数的标准差为0.4,所 以红队有时表现很差,有时表现又非常好,故C正确;因为红队全年比赛失球个数 的标准差为1.1,蓝队全年比赛失球个数的标准差为0.4,所以蓝队比红队技术水平更 稳定,故D错误.
例1 (1)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了部
分党员,对他们一周的党史学习时间进行了统计,统计数据如下表所示:
党史学习时间(小时) 7 8 9 10 11
党员人数
6 10 9 7 8
数学 N 必备知识 自主学习 关键能力 互动探究
— 16 —
则该单位党员一周学习党史时间的众数及第50百分位数分别是( D )
排列得,10,12,14,14,15,15,16,17,17,17,则有b=12×(15+15)=15,c=17. 所以c>b>a.
数学 N 必备知识 自主学习 关键能力 互动探究
— 11 —
4.(易错题)在某次足球联赛上,红队每场比赛平均失球个数是1.6,全年比赛失 球个数的标准差是1.1;蓝队每场比赛平均失球个数是2.2,全年比赛失球个数的标准 差是0.4.则下列说法正确的是( C )
数学 N 必备知识 自主学习 关键能力 互动探究
高考数学 用样本估计总体 专题
高考数学用样本估计总体专题课下练兵场命题报告难度及题号知识点容易题(题号)中等题(题号)稍难题(题号)用样本的频率分布估计总体的频率分布1、3、4812茎叶图的应用2、911用样本的数字特征估计总体的数字特征56、7、10一、选择题1.一个容量为20的样本数据,分组后,组别与频数如下:组别(10,20](20,30](30,40](40,50](50,60](60,70]频数23454 2 则样本在(20,50]上的频率为() A.12%B.40% C.60% D.70%解析:本题考查样本的频率运算.据表知样本分布在(20,50]的频数3+4+5=12,故其频率为1220=0.6.答案:C2.甲、乙两名同学在五次《数学基本能力》测试中,成绩统计用茎叶图表示如下,若甲、乙两人的平均成绩分别是X甲、X乙,则下列结论正确的是()A.X甲>X乙,甲比乙成绩稳定B.X甲>X乙,乙比甲成绩稳定C.X甲<X乙,甲比乙成绩稳定D.X甲<X乙,乙比甲成绩稳定解析:由茎叶图知识,可知道甲的成绩为68、69、70、71、72,平均成绩为70;乙的成绩为63、68、69、69、71,平均成绩为68;再比较标准差:甲的标准差为15[(68-70)2+(69-70)2+(70-70)2+(71-70)2+(72-70)2]=2,乙的标准差为15[(63-68)2+(68-68)2+(69-68)2+(69-68)2+(71-68)2]=655>2,故甲比乙的成绩稳定.答案:A3.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)的汽车大约有()A.30辆B.40辆C.60辆D.80辆解析:面积为频率,在[50,60)的频率为0.3,所以大约有200×0.3=60辆.答案:C4.(2009·福建高考)一个容量为100的样本,其数据的分组与各组的频数如下:组别频数(0,10]12(10,20]13(20,30]24(30,40]15(40,50]16(50,60]13(60,70]7则样本数据落在(10,40]()A.0.13 B.0.39 C.0.52 D.0.64解析:由列表知样本数据落在(10,40]上的频数为52,∴频率为0.52.5.甲、乙两射击运动员进行比赛,射击相同的次数,已知两运动员射击的环数稳定在7,8,9,10环,他们的成绩频率分布条形图如下:由乙击中8环及甲击中10环的概率与甲击中环数的平均值都正确的一组数据依次是() A.0.350.258.1 B.0.350.258.8C.0.250.358.1 D.0.250.358.8解析:乙击中8环的概率为1-0.2-0.2-0.35=0.25;甲击中10环的概率为1-0.2-0.15-0.3=0.35;甲击中环数的平均值为7×0.2+8×0.15+9×0.3+10×0.35=8.8.答案:D6.(2009·四川高考)设矩形的长为a,宽为b,其比满足b:a=5-12≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是() A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定解析:x甲=0.598+0.625+0.628+0.595+0.6395=0.617,x 乙=0.618+0.613+0.592+0.622+0.6205=0.613,∴x甲与0.618更接近.二、填空题7.已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是____________.解析:这10个数的中位数为a+b2=10.5.这10个数的平均数为10.要使总体方差最小,即(a-10)2+(b-10)2最小.又∵(a-10)2+(b-10)2=(21-b-10)2+(b-10)2=(11-b)2+(b-10)2=2b2-42b+221,∴当b=10.5时,(a-10)2+(b-10)2取得最小值.又∵a+b=21,∴a=10.5,b=10.5.答案:10.5,10.58.某地教育部门为了解学生在数学答卷中的有关信息,从上次考试的10 000名考生的数学试卷中,用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图).则这10 000人中数学成绩在段的约是________人.解析:本题考查了频率直方图的一些知识,由图在的频率为0.008×10,所以在10 000人中成绩在的学生有10 000×0.008×10=800人.答案:8009.(2010·珠海模拟)如图是CBA篮球联赛中,甲乙两名运动员某赛季一些场次得分的茎叶图,则平均得分高的运动员是________.解析:从茎叶图上可得甲得分:8,10,15,16,22,23,25,26,27,32,平均值为20.4;乙得分:8,12,14,17,18,19,21,27,28,29,平均值为19.3,∴平均得分高的运动员是甲. 答案:甲 三、解答题10.甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位 mm): 甲:99,100,98,100,100,103 乙:99,100,102,99,100,100(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求. 解:(1) x 甲=99+100+98+100+100+1036=100 mm ,x 乙=99+100+102+99+100+1006=100 mm , 甲2S =16=73 mm 2. 2乙S =16=1 mm 2.(2)因为甲2S >甲2S ,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.11.甲、乙两位学生参加数学竞赛培训,在培训期间,他们参加的5项预赛成绩记录如下:甲 82 82 79 95 87 乙9575809085(1)用茎叶图表示这两组数据;(2)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(3)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?说明理由. 解:(1)作出茎叶图如下:(2)记甲被抽到的成绩为x ,乙被抽到的成绩为y ,用数对(x ,y )表示基本事件: (82,95) (82,75) (82,80) (82,90) (82,85) (82,95) (82,75) (82,80) (82,90) (82,85) (79,95) (79,75) (79,80) (79,90) (79,85) (95,95) (95,75) (95,80) (95,90) (95,85) (87,95) (87,75) (87,80) (87,90) (87,85) 基本事件总数n =25.记“甲的成绩比乙高”为事件A ,事件A 包含的基本事件: (82,75) (82,80) (82,75) (82,80) (79,75) (95,75) (95,80) (95,90) (95,85) (87,85) (87,75) (87, 80) 事件A 包含的基本事件数是m =12. 所以P (A )=m n =1225.(3)派甲参赛比较合适.理由如下: x甲=85,x 乙=85,2甲S =31.6,2乙S =50.∵x甲=x 乙,2甲S <2乙S ,∴甲的成绩较稳定,派甲参赛比较合适.12.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8. (1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图; (3)估计成绩在[60,90)分的学生比例;(4)估计成绩在85分以下的学生比例.解:(1)频率分布表如下:成绩分组频数频率频率/组距[40,50)20.040.004[50,60)30.060.006[60,70)100.20.02[70,80)150.30.03[80,90)120.240.024[90,100)80.160.016合计5010.1 (2)频率分布直方图和折线图为:(3)所求的学生比例为0.2+0.3+0.24=0.74=74%.(4)所求的学生比例为1-(0.12+0.16)=1-0.28=0.72=72%.。
高中数学用样本估计总体
总体中所有个体值与总体平均数之差的平方的平均数,是衡量数据分散程度的量 。总体方差是参数,而样本方差是统计量。
样本比例和总体比例
样本比例
样本中某事件发生的次数与样本容量 的比值,用于估计总体比例。计算公 式为 $frac{a}{n}$,其中 $a$ 是事 件发生的次数,$n$ 是样本容量。
高中数学用样本估计总体
汇报人: 202X-01-02
contents
目录
• 样本和总体 • 用样本估计总体 • 样本估计总体的误差 • 用样本估计总体的应用 • 案例分析
01
样本和总体
样本和总体的定义
总体
研究对象的全体集合,表示为N。
样本
从总体中随机抽取的一部分个体,表示为n。
样本和总体的关系
05
案例分析
案例一:某品牌电视的市场占有率
总结词
通过调查某地区一定数量的家庭或零售商,了解他们购买电视的品牌偏好,从而估算该品牌电视在该 地区的整体市场占有率。
详细描述
选取一定数量的家庭或零售商作为样本,通过问卷调查或访谈的方式了解他们购买电视的品牌偏好。 然后,根据样本数据计算该品牌电视的市场占有率,并使用合适的统计方法对结果进行估计和误差分 析。
总体比例
总体中某事件发生的次数与总体容量 的比值。在统计学中,总体比例通常 作为参数来估计。
03
样本估计总体的误差
抽样误差和非抽样误差
抽样误差
由于从总体中随机抽取样本而产 生的误差,这种误差可以通过增 加样本量和提高样本代表性来减 小。
非抽样误差
由于调查过程中的非随机因素, 如测量误差、记录误差等而产生 的误差,这种误差难以控制和消 除。
案例二:某班级的数学成绩分布
高考数学《随机抽样与用样本估计总体》真题含答案
高考数学《随机抽样与用样本估计总体》真题含答案一、选择题1.某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9位代表,得到的数据分别为36,36,37,37,40,43,43,44,44,若用样本估计总体,年龄在(x -s ,x +s)内的人数占公司人数的百分比是(其中x 是平均数,s 为标准差,结果精确到1%)( )A .14%B .25%C .56%D .67% 答案:C解析:因为x -=36+36+37+37+40+43+43+44+449=40,s 2=19 (16+16+9+9+0+9+9+16+16)=1009 ,即s =103 ,年龄在(x - -s ,x -+s)即⎝⎛⎭⎫1103,1303 内的人数为5,所以所求百分比为59≈0.56=56%,故选C . 2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140 答案:D解析:由频率分布直方图知,200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.3.[2024·九省联考]样本数据16,24,14,10,20,30,12,14,40的中位数为( ) A .14 B .16 C .18 D .20 答案:B解析:将这些数据从小到大排列可得:10,12,14,14,16,20,24,30,40,则其中位数为16.故选B.4.[2024·新课标Ⅱ卷]某农业研究部门在面积相等的100块稻田上种植一种新型水稻,根据表中数据,下列结论中正确的是()A.100块稻田亩产量的中位数小于1 050 kgB.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200 kg至300 kg之间D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间答案:C解析:A选项,因为6+12+18=36<50,36+30=66>50,所以100块稻田亩产量的中位数不小于1 050 kg, A错误;B选项,因为100块稻田中亩产量低于1 100 kg的稻田有66块,所占比例为66%<80%,所以B错误;C选项,100块稻田亩产量的极差的最大值小于1 200-900=300,最小值大于1 150-950=200,所以极差介于200 kg至300 kg之间,C正确;D选项,同一组中的数据都用左端点值来估计,则这100块稻田亩产量的平均值的最小值为1100×(6×900+12×950+18×1 000+30×1 050+24×1 100+10×1 150)=1 042>1 000,所以平均值不介于900 kg至1 000 kg之间,D错误.故选C.5.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案:A解析:设建设前经济收入为a ,则建设后经济收入为2a ,由题图可得下表:根据上表可知B 、C 、D 均正确,A 不正确,故选A .6.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( )A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差 答案:B解析:由统计图可知,讲座前这10位社区居民问卷答题的正确率分别为65%,60%,70%,60%,65%,75%,90%,85%,80%,95%.对于A 项,将这10个数据从小到大排列为60%,60%,65%,65%,70%,75%,80%,85%,90%,95%,因此这10个数据的中位数是第5个与第6个数的平均数,为70%+75%2 =72.5%>70%,A 错误.对于B 项,由统计图可知,讲座后这10位社区居民问卷答题的正确率分别为90%,85%,80%,90%,85%,85%,95%,100%,85%,100%,所以讲座后这10位社区居民问卷答题的正确率的平均数为110×(90%+85%+80%+90%+85%+85%+95%+100%+85%+100%)=89.5%>85%,B 正确.对于C 项,讲座后这10位社区居民问卷答题的正确率的方差s 2后 =110 ×[(90%-89.5%)2+(85%-89.5%)2+…+(85%-89.5%)2+(100%-89.5%)2]=42.2510 000 ,所以标准差s 后=6.5%.讲座前这10位社区居民问卷答题的正确率的平均数为110 ×(60%+60%+65%+65%+70%+75%+80%+85%+90%+95%)=74.5%,所以讲座前这10位社区居民问卷答题的正确率的方差为s 2前 =110×[(60%-74.5%)2+(60%-74.5%)2+…+(90%-74.5%)2+(95%-74.5%)2]=142.2510 000 ,所以标准差s 前≈11.93%.所以s 前>s 后,C 错误.对于D 项,讲座前问卷答题的正确率的极差为95%-60%=35%,讲座后问卷答题的正确率的极差为100%-80%=20%,D 错误.故选B .7.(多选)有一组样本数据x 1,x 2,…,x n ,由这组数据得到新样本数据y 1,y 2,…,y n ,其中y i =x i +c(i =1,2,…,n),c 为非零常数,则( )A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样本数据的样本极差相同 答案:CD解析:A :E(y)=E(x +c)=E(x)+c 且c ≠0,故平均数不相同,错误;B :若第一组中位数为x i ,则第二组的中位数为y i =x i +c ,显然不相同,错误;C :D(y)=D(x)+D(c)=D(x),故方差相同,正确.D :由极差的定义知:若第一组的极差为x max -x min ,则第二组的极差为y max -y min =(x max+c)-(x min +c)=x max -x min ,故极差相同,正确.故选CD .8.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差 答案:C解析:甲的平均数是4+5+6+7+85 =6,中位数是6,极差是4,方差是(-2)2+(-1)2+02+12+225=2;乙的平均数是5+5+5+6+95=6,中位数是5,极差是4,方差是(-1)2+(-1)2+(-1)2+02+325 =125,比较可得选项C 正确.9根据上表可得经验回归方程为y ^ =6.3x +a ^,下列说法正确的是( ) A .回归直线y ^ =6.3x +a ^必经过样本点(2,19),(6,44)B .这组数据的样本点中心(x - ,y - )未必在回归直线y ^ =6.3x +a ^上 C .回归系数6.3的含义是广告费用每增加1万元,销售额实际增加6.3万元 D .据此模型预报广告费用为7万元时销售额约为50.9万元 答案:D解析:由表格中的数据可得x - =2+3+4+5+65 =4,y - =19+25+34+38+445=32,将点(x - ,y - )的坐标代入经验回归方程得6.3×4+a ^=32, 解得a ^=6.8,所以回归方程为y ^=6.3x +6.8.对于A 选项,当x =2时,y ^=6.3×2+6.8=19.4,A 选项错误;对于B 选项,这组数据的样本点中心(x - ,y - )必在回归直线y ^ =6.3x +a ^上,B 选项错误;对于C 选项,回归系数6.3的含义是广告费用每增加1万元,销售额约增加6.3万元,C 选项错误;对于D 选项,当x =7时,y ^=6.3×7+6.8=50.9,所以据此模型预报广告费用为7万元时销售额约为50.9万元,D 选项正确.故选D .二、填空题10.已知一组数据4,2a ,3-a ,5,6的平均数为4,则a 的值是________. 答案:2解析:由平均数公式可得4+2a +(3-a )+5+65=4,解得a =2.11.某电子商务公司对10 000名网络购物者2021年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 答案:(1)3 (2)6 000解析:(1)0.1×(0.2+0.8+1.5+2.0+2.5+a)=1,解得a =3.(2)消费金额在区间[0.5,0.9]内的购物者的频率为0.1×(3.0+2.0+0.8+0.2)=0.6,所以所求购物者的人数为0.6×10 000=6 000.12.在一容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1■,■,那么这组数据的方差s 2可能的最大值是________.答案:32.8解析:设这组数据的最后两个数据为10+x ,y(x ∈N ,x ≤9) ∵9+10+11+10+x +y =10×5=50, ∴x +y =10,∴y =10-x .∴s 2=15 [1+0+1+x 2+(y -10)2]=15 (2+2x 2).∵x ≤9,∴当x =9时,s 2取得最大值32.8.[能力提升]13.[2024·重庆南开中学月考]今年入夏以来,我市天气反复,降雨频繁.如图统计了上个月前15天的气温,以及相对去年同期的气温差(今年气温-去年气温,单位:摄氏度),以下判断错误的是( )A.今年每天气温都比去年同期的气温高B.今年的气温的平均值比去年同期的气温的平均值低C.去年8~11号气温持续上升D.今年8号气温最低答案:A解析:由图可知,1号温差为负值,所以今年1号气温低于去年同期的气温,故选项A 不正确;除6,7号,今年气温略高于去年同期的气温外,其他日子,今年气温都低于去年同期的气温,所以今年的气温的平均值比去年同期的气温的平均值低,选项B正确;今年8~11号气温上升,但是气温差逐渐下降,说明去年8~11号气温持续上升,选项C正确;由图可知,今年8号气温最低,选项D正确.故选A.14.(多选)[2023·新课标Ⅰ卷]有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差答案:BD解析:取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为223=663,故A,C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.综上,选BD.15.已知一组正数x 1,x 2,x 3的方差s 2=13 (x 21 +x 22 +x 23 -12),则数据x 1+1,x 2+1,x 3+1的平均数为________. 答案:3解析:∵s 2=13 [(x 1-x - )2+(x 2-x - )2+(x 3-x -)2]=13 ⎣⎡⎦⎤x 21 +x 22 +x 23 -2x -(x 1+x 2+x 3)+3x -2 =13 ⎣⎡⎦⎤x 21 +x 22 +x 23 -3x -2 , 又s 2=13 (x 21 +x 22 +x 23 -12), ∴3x - 2=12,∴x -=2.∴x 1+1,x 2+1,x 3+1的平均数为x 1+x 2+x 3+33=3.16.已知样本容量为200,在样本的频率分布直方图中,共有n 个小矩形,若中间一个小矩形的面积等于其余(n -1)个小矩形面积和的13,则该组的频数为________.答案:50解析:设除中间一个小矩形外的(n -1)个小矩形面积的和为P ,则中间一个小矩形面积为13 P ,P +13 P =1,P =34 ,则中间一个小矩形的面积等于13 P =14 ,200×14 =50,即该组的频数为50.。
《用样本估计总体》典型例题
《用样本估计总体》典型例题【考情分析】用样本的频率分布估计总体分布的有关问题在高考中的常考题型有两个:(1)根据频率分布表和频率分布直方图进行频数或频率的计算,这种考查形式出现的频率很高;(2)频率分布直方图的绘制,这种考查形式常出现在解答题中,用样本的数字特征估计总体的数字特征也是高考中的常考题型,从近几年高考命题的趋势可以看出,对本节概念的考查开始逐步朝着对数据分析能力考查的方向发展,题目往往需结合相关数字特征的统计意义进行求解.题型1统计图表的信息读取(逻辑推理)典例1、[推测解释能力](2018·全国卷I)某地区经过1年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下列结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半思路本题以实际生活为背景考查了统计图表信息提取的知识,图表命题涉及广泛,解决本题时要注意题目条件中的“农村的经济收入增加了一倍,实现翻番”,否则计算出错,导致判断失误.解析方法一(通解)设建设前经济收入为a,则建设后经济收入为2a,则由图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以只有A是错误的.方法二(优解)因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.答案A题型2与统计图表有关的计算(数据分析)典例2、[分析计算能力(2020-天津卷)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),⋯,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A.10B.18C.20D.36×组距,进行求解思路本题通过分析、读取频率分布直方图中数据的信息,利用公式频率=频率组距运算.解析根据题意,在被抽取的零件中,直径落在区间[5.43,5.47)内的频率为(6.25+5.00)×0.02= 0.225,则个数为80×0.225=18.答案 B题型3数字特征的含义与计算(数据分析)典例3-1[概括理解能力](全国II卷)为了评估一种农作物的种植效果,选了n块地作试验田.这n 块地的亩产量(单位:kg)分别为x1,x2,x3,⋯,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x1,x2,x3,⋯,x n的平均数B.x1,x2,x3,⋯,x n的标准差C.x1,x2,x3,⋯,x n的最大值D.x1,x2,x3,⋯,x n的中位数思路 本题依据数据的数字特征的意义,分析判断数据运用数字特征进行评价时,应从平均数、众数、中位数、方差、极差等多个角度对这组数据进行分析,全面考虑各数字特征的优缺点. 解析 平均数和中位数都能反映一组数据的集中趋势,而且平均数能反映一组数据的平均水平;标准差和方差都能反映一组数据的稳定程度.答案 B典例3-2、(2019-江苏卷)已知一组数据6,7,8,9,10,则该组数据的方差是_________.思路 本题考查了平均数和方差的计算公式,解决本题的关键是熟记平均数和方差的计算公式,本题考查了学生的分析计算能力和数学运算核心素养.解析 由平均数公式可得这组数据的平均数为8,则方差为(−2)2+(−1)2+0+0+12+226=53. 答案 53题型4用样本数字特征估计总体数字特征的简单计算典例4、[简单问题解决能力]某学校高一年级共有三个班,按优秀率进行评选.1班30人,优秀率30%,2班35人,优秀率60%,三班35人,优秀率40%,则全年级优秀率为_________.解析 本题通过优秀率、加权平均数来考查样本估计总体的数字特征,分析题意,根据班级优秀率求解全年级优秀率.由于某学校高一年级共有三个班,按优秀率进行评选:1班30人,优秀率30%,2班35人,优秀率60%,三班35人,优秀率40%,则全年级优秀率为:30×30%+35×60%+35×40%30+35+35=44%.答案 44%题型5用样本数字特征估计总体数字特征的综合计算(数学建模)典例5、[综合问题解决能力](2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲,乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).思路本题属于样本平均值估计总体的综合应用,根据频率分布直方图的特征,通过数据分析,在频率分布直方距计算a的值.解析(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1−0.05−0.15−0.70=0.10. (2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。
2025年高考数学一轮复习课时作业-用样本估计总体【含解析】
2025年高考数学一轮复习课时作业-用样本估计总体【原卷版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.642.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.183.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,924.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.56.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.7.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.8.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.2810.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.12.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.2025年高考数学一轮复习课时作业-用样本估计总体【解析版】(时间:45分钟分值:70分)【基础落实练】1.(5分)为加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级6名学生某日在校体育锻炼时长(单位:分钟)进行了统计,记录如下:45,62,51,70,66,59,则该组数据的80%分位数为()A.51B.62C.66D.64【解析】选C.将6名学生该日在校体育锻炼时长记录从小到大排列为45,51,59,62,66,70,因为80%×6=4.8,所以该组数据的80%分位数为66.2.(5分)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.18【解析】选B.志愿者的总人数为20=50,所以第三组的人数为50×0.36=18,(0.24+0.16)×1有疗效的人数为18-6=12.3.(5分)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,则另一组数据3x1-2, 3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,12B.2,1C.4,32D.4,92【解析】选D.因为一组数据x1,x2,x3,x4,x5的平均数为2,方差为12,所以另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为3×2-2=4,方差为32×12=92.4.(5分)某地为践行“绿水青山就是金山银山”的人与自然和谐共生的发展理念,对该地企业已处理的废水进行实时监测.下表是对A,B两家企业10天内已处理的废水的某项指标值的检测结果.下列说法正确的是()A43727398638665758178B82687137616558687794A.A企业该指标值的极差较大B.A企业该指标值的中位数较小C.B企业该指标值的平均数较大D.B企业该指标值的众数与中位数相等【解析】选D.将A,B两家企业10天内已处理的废水的某项指标值的检测结果从小到大排列:A企业:43,63,65,72,73,75,78,81,86,98.B企业:37,58,61,65,68,68,71,77,82,94.A企业该指标值的极差为98-43=55,B企业该指标值的极差为94-37=57,A错误;A企业该指标值的中位数为73+752=74,B企业该指标值的中位数为68+682=68,B错误;A企业该指标值的平均数为43+63+65+72+73+75+78+81+86+9810=73.4,B企业该指标值的平均数为37+58+61+65+68+68+71+77+82+9410=68.1,C错误;由上可知,B企业该指标值的众数与中位数都为68,D正确.5.(5分)(多选题)(2024·湛江模拟)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有()A.乙同学体温的极差为0.4B.乙同学的体温比甲同学的体温更稳定C.乙同学体温的众数为36.4,中位数与平均数相等D.甲同学体温的第70百分位数为36.5【解析】选BCD.选项A,乙同学体温的极差为36.5-36.3=0.2,故A错误;选项B,从题中折线图上可以看出,乙同学的体温比甲同学的体温更稳定,故B正确;选项C,乙同学的体温从低到高依次为36.3℃,36.3℃,36.4℃,36.4℃,36.4℃, 36.5℃,36.5℃,故众数为36.4,而中位数和平均数都是36.4,故C正确;选项D,甲同学的体温从低到高依次为36.2℃,36.2℃,36.4℃,36.4℃,36.5℃, 36.5℃,36.6℃,由70%×7=4.9,可知数据的第70百分位数为第5项数据36.5,故D 正确.6.(5分)某汽车研究院现有300名研究员,他们的学历情况如图所示,该研究院今年计划招聘一批新研究员,并决定不再招聘本科生,且使得招聘后本科生的比例下降到15%,硕士生的比例不变,则该研究院今年计划招聘的硕士生人数为________.【解析】根据题意,设今年计划招聘的硕士生为x人,博士生为y人,又由现有研究员300人,其中本科生有300×20%=60(人),硕士生有300×40%=120(人),=0.15,=0.4,解得 =40, =60.答案:407.(5分)(2023·厦门模拟)已知样本数据2,4,8,m的极差为10,其中m>0,则该组数据的方差为__________.【解析】由题意得m-2=10,所以m=12,所以该组数据的平均数为 =2+4+8+124=132,由方差的计算公式可知:s2=14 2-+(4-132)2+(8-132)2+12- =594.答案:5948.(10分)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.【解析】(1)甲=18×(82+81+79+78+95+88+93+84)=85,乙=18×(92+95+80+75+83+80+90+85)=85,甲2=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2] =35.5,乙2=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2] =41.(2)由(1)知甲=乙,甲2< 乙2,甲的成绩较稳定,所以派甲参赛比较合适.【能力提升练】9.(5分)某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布直方图,所有同学垫球数都在5至40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28【解析】选D.垫球数在区间[5,25)内的人数占总人数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总人数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%,所以第75百分位数位于区间[25,30)内,且25+5×0.75-0.60.85-0.6=28,所以估计垫球数的样本数据的第75百分位数是28.10.(5分)(多选题)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,x3,x4,x5,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x3,x4,x5,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x3,x4,x5,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x3,x4,x5,x6的极差【解析】选BD.对于A,如1,2,2,2,3,5的平均数为2.5,而2,2,2,3的平均数为2.25,不相等,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,其中位数为 3+ 42,x2,x3,x4,x5的中位数为 3+ 42,所以B正确;对于C,x1,x2,x3,x4,x5,x6的波动更大,所以C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x5-x2≤x6-x1,故D正确.11.(5分)(2024·重庆模拟)某学校为了更好地关注青少年的心理健康,对某年级的全体同学进行了一次心理健康测试,测试成绩满分为100分,其中1600名同学的测试成绩的频率分布直方图如图所示,则这1600名同学测试成绩的第65百分位数为__________.【解析】因为(0.01+0.01+m+0.02+0.02)×10=1,所以m=0.04,又0.1+0.1+0.4=0.6, 0.1+0.1+0.4+0.2=0.8,所以第65百分位数位于第4组中,设第65百分位数为a,则0.1+0.1+0.4+(a-80)×0.02=0.65,解得a=82.5.答案:82.512.(10分)为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.【解析】(1)由题中频率分布直方图知(0.01+m+0.04+0.02)×10=1,解得m=0.03;设此次竞赛活动学生成绩的中位数为x0,因为数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x0<90,由(x0-80)×0.04=0.5-0.4,得x0=82.5,所以估计此次竞赛活动学生成绩的中位数为82.5.(2)由题中频率分布直方图及(1)知, =65×0.1+75×0.3+85×0.4+95×0.2=82,此次竞赛活动学生成绩不低于82的频率为0.2+90-8210×0.4=0.52,则获奖的学生有500×0.52=260(名),所以估计此次竞赛活动成绩的平均数为82,在参赛的500名学生中有260名学生获奖.。
高考(理)总复习资料:第9章 第2讲 用样本估计总体
• ①甲同学成绩的中位数大于乙同学成绩的中 位数;
• ②甲同学的平均分比乙同学高; • ③甲同学的平均分比乙同学低; • ④甲同学成绩的方差小于乙同学成绩的方
差. • 上解析面:说甲法的中正位确数的81,是乙_的__中_位__数_8_7..5,故①错, x 甲= 81•,答x 案乙=:85③,故④②错,③对,由茎叶图知甲成绩比较稳定,
D. x 甲> x 乙,m甲<m乙
• [审题视点] 仔细观察茎叶图.中位数为一列
数中最中间的那个,当数有偶数个时,中位
数[解为析]中甲间数两据个集中数于的前平半段均,数而.乙数es据集中于后半段,
所以
x
甲<
x
乙;m甲=
18+22 2
=20,m乙=
27+31 2
=29,所以m甲
<m乙,所以选B.
• [答案] B
• [答案] C
32
1.平均数和方差都是重要的数字特征,是对总体一种简 明的阐述.平均数、中位数、众数描述总体的集中趋势,方 差和标准差描述波动大小.
2. 平均数、方差公式的推广 若数据x1,x2,…,xn的平均数为 x ,方差为s2,则数据 mx1+a,mx2+a,…,mxn+a的平均数为m x +a,方差为 m2s2.
33
• [变式探究] [2013·西安质检]某校甲、乙两 个班级各有5名编号为1,2,3,4,5的学生进行投 篮练习,每人投10次,投中的次数如下表:
学生 1号 2号 3号 4号 5号
甲班 6
7
7
8
7
乙班 6
7
6
7
9
34
则以上两组数据的方差中较小的一个为s2,则s2=( )
2025年高考数学一轮复习-10.2-用样本估计总体【课件】
将一组数据按从小到大或从大到小的顺序排列,处在________的一个数据(当数据个数是奇数时)或最中间两个数据的________(当数据个数是偶数时)叫做这组数据的中位数
众数
一组数中出现次数最多的数据(即频数最大值所对应的样本数据)叫做这组数据的众数
[提醒] 平均数反映了数据取值的平均水平.
A. B. C. D.
√
解析:选A.由频率分布直方图可知众数 ;中位数应落在70到80区间内,则有 ,解得 ;平均数 .所以 ,故选A.
2.(2023·山东聊城模拟)已知 , , , 的平均值为6,方差为3,则 , , , 的平均值为____,方差为____.
11
人数
3
6
5
4
2
A. B. C. D.
√
解析:抽取的工人总数为20, ,那么第60百分位数是所有数据从小到大排序的第12项与第13项数据的平均数,第12项与第13项数据分别为9, ,所以第60百分位数是9.故选B.
(2)(2023·天津市南开中学模拟)为了解“双减”政策实施后学生每天的体育活动时间,研究人员随机调查了某地区1 000名学生每天进行体育运动的时间,按照时长(单位: )分成6组:第一组 ,第二
A.中位数 B.平均数 C.方差 D.极差
解析:选A.记9个原始评分分别为 , , , , , , , , (按从小到大的顺序排列),易知 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数.
√
3.(人A必修第二册 例2变条件、变设问)一个容量为20的样本,其数据按从小到大的顺序排列为: , , , , , , , , , , , , , , , , , , , ,则该组数据的第75百分位数为______,第86百分位数为____.
高考数学科学复习创新方案:用样本估计总体
用样本估计总体[课程标准]1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.2.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.3.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.会计算样本均值和样本方差,结合具体实例,掌握分层随机抽样的样本均值和样本方差.4.能用样本估计总体的取值规律.5.能用样本估计百分位数,理解百分位数的统计含义.1.频率分布表、频率分布直方图的制作步骤及意义2.频率分布折线图用线段连接频率分布直方图中各个矩形上面一边的06中点,就得到频率分布折线图.3.不同统计图的特点及适用类型(1)不同的统计图在表示数据上的特点扇形图主要用于直观描述各类数据占总数的07比例,条形图和直方图主要用于直观描述不同类别或分组数据的08频数和09频率,折线图主要用于描述数据随10时间的变化趋势.(2)不同的统计图适用的数据类型条形图适用于描述11离散型的数据,直方图适用于描述12连续型的数据.4.百分位数(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据13小于或等于这个值,且至少有(100-p)%的数据14大于或等于这个值.(2)计算步骤:计算一组n个数据的第p百分位数的步骤:第1步,按15从小到大排列原始数据.第2步,计算i=16n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第17j 项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的18平均数.5.总体集中趋势的估计(1)平均数、中位数和众数等都是刻画“19中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.(2)一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用20平均数、21中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用22众数.6.频率分布直方图中平均数、中位数、众数的求法(1)样本平均数:可以用每个小矩形底边中点的23横坐标与小矩形面积的乘积之和近似代替.(2)在频率分布直方图中,中位数左边和右边的直方图的面积应该24相等.(3)将最高小矩形所在的区间25中点的横坐标作为众数的估计值.7.方差、标准差(1)假设一组数据为x 1,x 2,…,x n ,则①平均数x -=x 1+x 2+…+x n n,②方差s 2=261n ∑n i =1__(x i -x -)2,③标准差s =271n ∑n i =1(x i -x -)2.(2)如果总体中所有个体的变量值分别为Y 1,Y 2,…,Y N ,总体平均数为Y -,则称S 2=1N ∑N i =1(Y i -Y -)2为总体方差,S =S 2为总体标准差.如果总体的N 个变量值中,不同的值共有k (k ≤N )个,不妨记为Y 1,Y 2,…,Y k ,其中Y i 出现的频数为f i (i =1,2,…,k ),则总体方差为S 2=1N ∑k i =1f i (Y i -Y -)2.(3)如果一个样本中个体的变量值分别为y 1,y 2,…,y n ,样本平均数为y -,则称s 2=1n ∑n i =1(y i -y -)2为样本方差,s =s 2为样本标准差.(4)标准差刻画了数据的离散程度或波动幅度,标准差28越大,数据的离散程度越大;标准差29越小,数据的离散程度越小.(5)分层随机抽样的均值与方差分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为w -,样本方差为s 2.以分两层抽样的情况为例,假设第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x -,方差为s 21;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y -,方差为s 22.则x -=1m ∑m i =1x i ,s 21=1m ∑m i =1(x i -x -)2,y -=1n ∑n i =1y i ,s 22=1n∑n i =1(y i -y -)2.则①w -=30m m +n x -+n m +n y -,②s 2=311m +n {m [s 21+(x --w -)2]+n [s 22+(y --w -)2]}=321m +n (ms 21+ns 22)+mn m +n (x --y -)2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a .(2)若数据x 1,x 2,…,x n 的方差为s 2,则:①数据x 1+a ,x2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.1.(多选)(2021·新高考Ⅱ卷)下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的是()A .样本x 1,x 2,…,x n 的标准差B .样本x 1,x 2,…,x n 的中位数C .样本x 1,x 2,…,x n 的极差D .样本x 1,x 2,…,x n 的平均数答案AC 解析由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势.故选AC.2.(多选)给出一组数据:1,3,3,5,5,5,下列说法正确的是()A .这组数据的极差为4B.这组数据的平均数为3 C.这组数据的中位数为4 D.这组数据的众数为3和5答案AC解析这组数据的极差为5-1=4,A正确;平均数为1+3×2+5×36=113,B错误;中位数为3+52=4,C正确;众数为5,D错误.3.设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01B.0.1C.1D.10答案C解析因为数据ax i+b(i=1,2,…,n)的方差是数据x i(i=1,2,…,n)的方差的a2倍,所以所求数据的方差为102×0.01=1.故选C.4.从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是()A.20B.40C.64D.80答案D解析由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.050×4=80.故选D.5.(人教B必修第二册5.1.2练习A T2改编)90,92,92,93,93,94,95,96,99,100的75%分位数为________,80%分位数为________.答案9697.5解析10×75%=7.5,10×80%=8,所以75%分位数为x8=96,80%分位数为x8+x9 2=96+992=97.5.多角度探究突破角度扇形图例1(多选)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案BCD解析设新农村建设前的收入为M,则新农村建设后的收入为2M,新农村建设前种植收入为0.6M,新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,所以C正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选BCD.角度折线图例2(2023·乌鲁木齐二模)如图为2012~2022年我国电子信息制造业企业和工业企业利润总额增速情况折线图,根据该图,下列结论正确的是()A.2012~2022年电子信息制造业企业利润总额逐年递增B.2017~2022年工业企业利润总额逐年递增C.2012~2017年电子信息制造业企业利润总额均较上一年实现增长,且其增速均快于当年工业企业利润总额增速D.2019~2022年工业企业利润总额增速的均值大于电子信息制造业企业利润总额增速的均值答案C解析对于A,由折线图可知,2018年电子信息制造业企业利润总额增速为负值,利润总额较上一年下降,A错误;对于B,由折线图可知,2019年工业企业利润总额增速为负值,利润总额较上一年下降,B错误;对于C,2012~2017年电子信息制造业企业利润总额增速为正,利润总额较上一年增长,且其增速大于当年工业企业利润总额增速,C正确;对于D,2019~2022年中,工业企业利润总额增速都小于电子信息制造业企业利润总额增速,则这几年中工业企业利润总额增速的均值小于电子信息制造业企业利润总额增速的均值,D错误.故选C.角度频率分布直方图例3(1)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8B.12C.16D.18答案B=50,所以第三组的人数为解析志愿者的总人数为20(0.24+0.16)×150×0.36=18,有疗效的人数为18-6=12.故选B.(2)(多选)(2024·菏泽东明县开学考试)某小区为了让居民了解更多垃圾分类的知识,对500名小区居民进行了培训,并进行了培训结果测试,从中随机抽取50名居民的成绩(单位:分),按照[50,60),[60,70),…,[90,100]分成5组,并制成了如图所示的频率分布直方图,则下列结论正确的是()A.所抽取的50名居民成绩的平均数约为74B.所抽取的50名居民成绩的中位数约为75C.50名居民成绩的众数约为85D.参加培训的居民中约有100人的成绩不低于85分答案AD解析因为频率和为1,可得0.1+0.3+0.3+10x+0.1=1,所以m=0.02,所抽取的50名居民成绩的平均数约为55×0.1+65×0.3+75×0.3+85×0.2+95×0.1=74,故A正确;设中位数为x,因为0.1+0.3<0.5,0.1+0.3+0.3>0.5,所以x∈(70,80),所以0.1+0.3+0.03(x-70)=0.5,所以x=70+103≠75,故B错误;50名居民成绩的众数无法由频率分布直方图判断出来,故C错误;成绩不低于85分的频率为0.2×0.5+0.1=0.2,参加培训的居民中成绩不低于85分的约有0.2×500=100人,故D正确.故选AD.常见统计图的特点(1)通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)准确理解频率分布直方图的数据特点①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆;②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.1.(多选)(2023·太原模拟)十项全能是田径运动中全能项目的一种,是由跑、跳、投等10个田径项目组成的综合性男子比赛项目,比赛成绩是按照国际田径联合会制定的专门田径运动会全能评分表将各个单项成绩所得的评分加起来计算的,总分多者为优胜者.如图是某次十项全能比赛中甲、乙两名运动员的各个单项得分的雷达图,则下列说法正确的是()A.在400米跑项目中,甲的得分比乙的得分低B.在跳高和标枪项目中,甲、乙水平相当C.甲的各项得分比乙的各项得分更均衡D.甲的各项得分的极差比乙的各项得分的极差大答案BD解析对于A,由雷达图可知,400米跑项目中,甲的得分比乙的得分高,A 错误;对于B,由雷达图可知,在跳高和标枪项目中,甲、乙水平相当,B正确;对于C,甲的各项得分的波动较大,乙的各项得分均在(600,800]内,波动较小,C错误;对于D,甲的各项得分的极差约为1000-470=530,乙的各项得分的极差小于200,D正确.故选BD.2.(多选)(2023·济南三模)某学校组建了辩论、英文剧场、民族舞、无人机和数学建模五个社团,高一学生全员参加,且每位学生只能参加一个社团.学校根据学生参加情况绘制如下统计图,已知无人机社团和数学建模社团的人数相等,则下列说法正确的是()A.高一年级学生人数为120B.无人机社团的人数为17C.若按比例分层随机抽样从各社团选派20人,则无人机社团选派的人数为3D.若甲、乙、丙三人报名参加社团,则共有60种不同的报名方法答案AC解析由题中所给的数据可知,民族舞社团的人数为12,占高一年级学生人数的比例为10%,所以高一年级学生人数为12÷10%=120,英文剧场社团的人数为120×35%=42,辩论社团的人数为30,无人机社团的人数=数学建模社团的人数=(120-42-30-12)÷2=18,占高一年级学生人数的比例是18×100%=15%,120A正确,B错误;按比例分层随机抽样20人,无人机社团应派出20×15%=3人,C正确;甲、乙、丙三人报名参加社团,每人有5种选法,共有53=125种不同的报名方法,D错误.故选AC.多角度探究突破角度总体百分位数的估计例4(1)一组数据为6,47,49,15,42,41,7,39,43,40,36,则这组数据的一个四分位数是()A.15B.25C.50D.75答案A解析将该组数据由小到大排列的结果为6,7,15,36,39,40,41,42,43,47,49,一共11个数,由11×25%=2.75,11×50%=5.5,11×75%=8.25,故第25百分位数是15,第50百分位数是40,第75百分位数是43.故选A.(2)如图是将高三某班80名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的模拟考试成绩的80%分位数是________(结果保留两位小数).答案124.44解析由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为70%+0.0225×10×100%=92.5%,因此,80%分位数一定位于[120,130)内.由120+0.80-0.70≈124.44,故此班的模拟考试成绩的80%分位数约为124.44.0.0225角度比例分配的分层随机抽样的均值与方差例5(多选)(2023·大连二十四中模拟)大连市教育局为了解二十四中学、第八中学、育明中学三所学校的学生文学经典名著的年阅读量,采用比例分配的分层随机抽样方法抽取了一个容量为120的样本.其中,从二十四中学抽取容量为35的样本,平均数为4,方差为9;从第八中学抽取容量为40的样本,平均数为7,方差为15;从育明中学抽取容量为45的样本,平均数为8,方差为21.据此估计,三所学校的学生文学经典名著的年阅读量的()A.均值为6.3B.均值为6.5C.方差为17.52D.方差为18.25答案BD解析设二十四中学、第八中学、育明中学三组数据中每个人的数据分别为x i(i=1,2,3,…,35),y i(i=1,2,3,…,40),z i(i=1,2,3,…,45),均值===6.5,方差=+=++==1×[(9+2.52)×35+(15+0.52)×40+(21+1201.52)×45]=18.25.故选BD.角度均值方差的应用例6(2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为x i,y i(i=1,2,…,10).试验结果如下:试验序号i12345678910伸缩率x i545533551522575544541568596548伸缩率y i536527543530560533522550576536记z i=x i-y i(i=1,2,…,10),z1,z2,…,z10的样本平均数为z-,样本方差为s2.(1)求z-,s2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果z-≥2s210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).解(1)x-=110×(545+533+551+522+575+544+541+568+596+548)=552.3,y-=110×(536+527+543+530+560+533+522+550+576+536)=541.3,z-=x--y-=552.3-541.3=11,z i=x i-y i的值分别为9,6,8,-8,15,11,19,18,20,12,故s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)由(1)知,z-=11,2s210=26.1=24.4,故有z-≥2s210,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.1.频率分布直方图中第p百分位数的计算(1)确定百分位数所在的区间[a,b].(2)确定小于a和小于b的数据所占的百分比分别为f a%,f b%,则第p百分位数为a+p%-f a%f b%-f a%×(b-a).2.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.(2)方差的简化计算公式:s2=1n [(x21+x22+…+x2n)-n x-2],或写成s2=1n(x21+x22+…+x2n)-x-2,即方差等于原始数据平方的平均数减去平均数的平方.1.(2023·合肥模拟)若一组样本数据x1,x2,…,x n的平均数为10,另一组样本数据2x1+4,2x2+4,…,2x n+4的方差为8,则两组样本数据合并为一组样本数据后的平均数和方差分别为()A.17,54B.17,48C.15,54D.15,48答案A解析由题意可知,数据x1,x2,…,x n的平均数为10,则=10,则=10n,所以数据2x1+4,2x2+4,…,2x n+4的平均数为=1n错误!(2x i+4)=2n错误!i +4=2×10+4=24,方差为s′2=1n错误!(2x i+4)-(2x-+4)]2=4n错误!(x i-10)2=4n错误!2i-4n×n×102=-400=8,所以=102n,将两组数据合并后,新数据x1,x2,…,x n,2x1+4,2x2+4,…,2x n+4的平均数为==12错误!=1×(3×10+4)=17,方差为s″2==21(5×102n-860n+458n)=54.故选A.2n2.有13位同学参加学校组织的才艺表演比赛,已知他们所得的分数互不相同,共设7个获奖名额,某同学知道自己的比赛分数后,要判断自己能否获奖,在这13名同学成绩的统计量中只需知道一个量,它是________(填“众数”“中位数”或“平均数”).答案中位数解析因为7位获奖者的分数肯定是13名参赛选手中较高的,所以把13个不同的分数按从小到大排序,只要知道自己的分数和中位数就可以知道是否获奖了.3.(2024·西安开学考试)某校开展了航天知识竞赛活动,竞赛分为初赛和复赛两个阶段.全校共有1000名学生参加,将他们的初赛成绩(成绩都在[50,100]内)分为[50,60),[60,70),[70,80),[80,90),[90,100]5组,得到如图所示的频率分布直方图.(1)求a的值,并估计全校学生初赛成绩的平均数(同一组中的数据以这组数据的中间值作为代表);(2)若规定初赛成绩前20%的学生进入复赛,试估计进入复赛的分数线n.解(1)由(0.010+0.020+a+0.030+0.005)×10=1,解得a=0.035,所以全校学生初赛成绩的平均数估计为55×0.1+65×0.2+75×0.35+85×0.3+95×0.05=75.(2)由频率分布直方图可知,成绩在[80,100]内的频率为0.35>0.2,成绩在[90,100]内的频率为0.05<0.2,则分数线n 位于区间[80,90)内,故n =90-0.2-0.050.3×10=85.课时作业一、单项选择题1.(2024·吕梁开学考试)一组数据按从小到大的顺序排列为1,3,5,6,m ,10,12,13,若该组数据的中位数是极差的58,则该组数据的第60百分位数是()A .7.5B .8C .9D .9.5答案C解析这组数据一共8个数,中位数是6+m 2,极差为13-1=12,所以6+m2=12×58,解得m =9,又8×60%=4.8,则该组数据的第60百分位数是第5个数据9.故选C.2.已知数据x 1,x 2,x 3,x 4,x 5,x 6的平均数是5,方差是9,则x 21+x 22+x 23+x 24+x 25+x 26=()A .159B .204C .231D .636答案B解析根据题意,数据x 1,x 2,x 3,x 4,x 5,x 6的平均数x -=5,方差s 2=9,则s 2=16(x 21+x 22+x 23+x 24+x 25+x 26)-x -2=9,变形可得x 21+x 22+x 23+x 24+x 25+x 26=204.故选B.3.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案A解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均可能受影响.故选A.4.(2023·滨州二模)某组样本数据的频率分布直方图如图所示,设该组样本数据的众数、平均数、第一四分位数分别为x1,x2,x3,则x1,x2,x3的大小关系是(注:同一组中的数据用该组区间中点值近似代替)()A.x3<x1<x2B.x2<x1<x3C.x1<x3<x2D.x1<x2<x3答案A=2.5,即x1=2.5,平均数x2=解析由频率分布直方图可知,众数为2+320.2×1.5+0.24×2.5+0.2×3.5+0.16×4.5+0.12×5.5+0.04×6.5+0.04×7.5=3.54,显然第一四分位数位于[2,3)之间,则0.2+(x3-2)×0.24=0.25,解得x3≈2.208,所以x3<x1<x2.故选A.5.(2023·商洛模拟)如图为国家统计局于2023年1月20日发布的2016~2022年全国R&D经费总量与R&D经费与GDP之比的数据图表,则()A.R&D经费总量的平均数超过23000亿元B.R&D经费总量的中位数为19678亿元C.R&D经费与GDP之比的极差为0.45%D.R&D经费与GDP之比增幅最大的是2021年到2022年答案C解析对于A,R&D经费总量的平均数为1×(15677+17606+19678+221447+24393+27956+30870)≈22617.7,所以A错误;对于B,R&D经费总量的中位数为22144亿元,所以B错误;对于C,R&D经费与GDP之比的极差为2.55%-2.10%=0.45%,所以C正确;对于D,R&D经费与GDP之比增幅最大的是2019年到2020年,所以D错误.故选C.6.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差答案B=72.5%>70%,故A 解析讲座前问卷答题的正确率的中位数为70%+75%2错误;讲座后问卷答题的正确率只有一个是80%,4个是85%,剩下的全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,故B正确;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,故C错误;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,故D错误.故选B.7.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B 点表示四月的平均最低气温约为5℃.下列叙述不正确的是()A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个答案D解析由图形可得各月的平均最低气温都在0℃以上,A正确;七月的平均温差约为10℃,而一月的平均温差约为5℃,故B正确;三月和十一月的平均最高气温都在10℃左右,基本相同,C正确;平均最高气温高于20℃的月份为六月、七月、八月,只有3个,D错误.8.(2024·重庆南岸模拟)已知某人收集了一个样本量为50的一组数据,并求得其平均数为70,方差为75,现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90,在对错误的数据进行更正后,重新求得样本的平均数为X-,方差为s2,则()A.X-<70,s2>75B.X->70,s2<75C.X-=70,s2>75D.X-=70,s2<75答案D解析因为80+70=60+90,因此平均数不变,即X-=70,设其他48个数据依次为a1,a2,…,a48,因此(a1-70)2+(a2-70)2+…+(a48-70)2+(60-70)2+(90-70)2=50×75,(a1-70)2+(a2-70)2+…+(a48-70)2+(80-70)2+(70-70)2=50×s2,所以50(s2-75)=100-400-100=-400<0,所以s2<75.故选D.二、多项选择题9.(2023·新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差答案BD解析对于A,设x2,x3,x4,x5的平均数为m,x1,x2,…,x6的平均数为n,则n-m=x1+x2+x3+x4+x5+x66-x2+x3+x4+x54=2(x1+x6)-(x2+x3+x4+x5)12,因为没有确定2(x1+x6),x2+x3+x4+x5的大小关系,所以无法判断m,n的大小,例如1,2,3,4,5,6,可得m=n=3.5,又如1,1,1,1,1,7,可得m=1,n=2,再如1,2,2,2,2,2,可得m=2,n=116,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,可知x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数,均为x3+x42,故B正确;对于C,因为x1是最小值,x6是最大值,则x2,x3,x4,x5的波动性不大于x1,x2,…,x6的波动性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标准差,例如2,4,6,8,10,12,则平均数n=16×(2+4+6+8+10+12)=7,标准差s1=16×[(2-7)2+(4-7)2+(6-7)2+(8-7)2+(10-7)2+(12-7)2]=1053,而4,6,8,10的平均数m=14×(4+6+8+10)=7,标准差s2=14×[(4-7)2+(6-7)2+(8-7)2+(10-7)2]=5,显然1053>5,即s1>s2,故C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x6-x1≥x5-x2,当且仅当x1=x2,x5=x6时,等号成立,故D正确.故选BD.10.某中学举行安全知识竞赛,对全校参赛的1000名学生的得分情况进行了统计,把得分数据按照[50,60),[60,70),[70,80),[80,90),[90,100]分成了5组,绘制了如图所示的频率分布直方图,根据图中信息,下列说法正确的是()A.这组数据的极差为50B.这组数据的众数约为76C.这组数据的中位数约为5407D.这组数据的第75百分位数约为85答案CD解析由频率分布直方图无法得到这组数据的最大值和最小值,故这组数据的极差无法准确判断,故A错误;这组数据的众数约为12×(70+80)=75,故B错误;因为(0.005+0.02)×10=0.25<0.5,0.25+0.035×10=0.6>0.5,所以中位数位于[70,80)之间,设中位数为x,则0.25+(x-70)×0.035=0.5,解得x=540,即7,故C正确;0.6+0.03×10=0.9>0.75,故第75百分位这组数据的中位数约为5407=85,故D正确.故选CD.数约为80+0.75-0.60.0311.在发生某公共卫生事件期间,我国有关机构规定:“该事件在一段时间没有发生规模群体感染的标志为连续10天,每天新增加疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,不一定符合该标志的是() A.甲地总体均值为3,中位数为4B.乙地总体均值为2,总体方差大于0C.丙地中位数为3,众数为3D.丁地总体均值为2,总体方差为3答案ABC解析平均数和中位数不能确定某一天的病例不超过7人,A不一定符合该标志;当总体方差大于0时,不知道总体方差的具体数值,因此不能确定数据的波动大小,B不一定符合该标志;中位数和众数也不能确定某一天的病例不超过7人,C不一定符合该标志;当总体均值为2时,若有一个数据超过7,则方差就超过3,D一定符合该标志.故选ABC.三、填空题12.从甲、乙、丙三个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下:甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.三个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数?甲:________,乙:________,丙:________.答案众数平均数中位数解析甲、乙、丙三个厂家从不同角度描述了一组数据的特征,甲:该组数=8;据8出现的次数最多;乙:该组数据的平均数x-=4+6×3+8+9+12+138=8.丙:该组数据的中位数是7+9213.某校组织学生参与航天知识竞答活动,某班8位同学的成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是________(写出一个满足条件的m值即可).答案7或8或9或10(填上述四个数中任意一个均可)解析7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为6,7,7,8,8,9,10,则7×0.25=1.75,故第25百分位数为第二个数即7,所以7,6,8,9,8,7,10,m这组数据的第25百分位数为7,而8×0.25=2,所以7为从小到大排列后第二个数与第三个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.14.(2024·邯郸一中期末)土壤修复是使遭受污染的土壤恢复正常功能的技术受到不同程度的污染,但随着新发展理念的深入贯彻落措施.中国现有耕地有近15实,国家对环境保护工作越来越重视.2021年我国正式启动(含已招标项目,不含未招标、流标项目)的土壤修复工程项目共510个,合同总金额为121.56亿元,覆盖全国除西藏、港、澳、台的30个省(区、市).如图为2021年30个省(区、市)土壤修复工程类项目数量的前十名,则这30个省(区、市)土壤修复工程类项目数据的第80百分位数是________,若图中未列出的其他20个省(区、市)土壤修复工程类项目数量的方差为44.7,则这30个省(区、市)土壤修复工程类项目数据的总体方差为________.。
高考数学专题复习:用样本估计总体数字特征
高考数学专题复习:用样本估计总体数字特征一、单选题1.已知一组数据1x ,2x ,3x ,4x ,5x ,6x 的方差是13,那么另一组数据121x -,221x -,321x -,421x -,521x -,621x -的方差是( )A .13B .23C .43D .832.已知样本9,x ,10,y ,11的平均数是10,标准差是2,则xy 的值为( ) A .96B .97C .91D .873.给定一组数据:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,则这组数据的第25百分位数是( ) A .3.0B .3.2C .4.4D .5.34.若样本1x ,2x ,…n x ,的平均数.方差分别为x 、2s ,则样本135x +,235x +,35n x +,的平均数.方差分别为( ) A .x 、2s B .35x +、2s C .35x +、29sD .35x +、()235s +5.某学校有男生400人,女生600人.为调查该校全体学生每天睡眠时间,采用分层抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为( ). A .0.45B .0.62C .0.7D .0.766.下表是校篮球队某队员若干场比赛的得分数据.则该队员得分的40百分位数是( ) A .5B .6C .7D .87.四名同学各掷骰子5次,记录每次骰子出现的点数并分别对每位同学掷得的点数进行统计处理,在四名同学以下的统计结果中,可以判断出该同学所掷骰子一定没有出现点数1的是( )A .平均数为4,中位数为5B .平均数为5,方差为2.4C .中位数为4,众数为5D .中位数为4,方差为2.88.已知一组数据如下:1,2,5,6,11,则该组数据的方差为( ) A .12.4B .12.3C .12.2D .12.19.已知一组数据的平均数是3,方差是4,且这组数据的平方和是这组数据和的平方的19,则这组数据的个数是( ) A .10B .13C .15D .1610.小明和小红5次考试数学成绩统计如下:则成绩较为稳定的那个同学成绩的方差为( ) A .110B .108C .22D .411.已知一组数据的频率分布直方图如图所示,则估计该组数据的平均数为( )A .64B .65C .66D .6712.已知一组数据为85,87,88,90,92,则这组数据的第60百分位数为( ) A .87 B .87.5 C .89 D .91二、填空题13.数据35124a a a a a ,,,,的方差22222123450.8)20(s a a a a a =++-++,则样本数据121a +,221a +,345212121a a a +++,,的平均数为________. 14.甲、乙两名学生的六次数学测验成绩(百分制)的茎叶图如图所示.①甲同学成绩的中位数小于乙同学成绩的中位数; ②甲同学的平均分比乙同学的平均分高; ③甲同学的平均分比乙同学的平均分低; ④甲同学成绩的方差小于乙同学成绩的方差. 上面说法正确的是________.15.在某中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,若不知道样本数据,只知道抽取了男生30人,其身高平均数170x =,抽取了女生20人,其身高平均数160y =.据此估计高一年级全体学生身高的值为________.16.已知样本数据1x ,2x ,3x ,4x ,5x 的方差为2,则样本数据132x -,232x -,332x -,432x -,532x -的方差为________. 三、解答题17.某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.(1)求直方图中x 的值; (2)求月平均用电量的中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户?18.某校对高一期中数学考试成绩(单位:分)进行分析,随机抽取100名学生,将分数按照[30,50),[50,70),[70,90),[90,110),[110,130),[130,150]分成6组,制成了如图所示的频率分布直方图:(1)估计该校高一期中数学考试成绩的均值;(2)估计该校高一期中数学考试成绩的第80百分位数.19.某种产品的质量以其质量指标值m 衡量,并按照质量指标值m 划分等级如下:现在从某企业生产的这种产品中随机抽取了200件作为样本,检验其质量指标值m ,得到的频率分布直方图如图所示(每组只含最小值,不含最大值).(1)求第75百分位数(精确到0.1);(2)在样本中,按照产品等级用比例分配的分层随机抽样的方法抽取8件产品,则这8件产品中,一等品的件数是多少;(3)将频率视为概率,已知该企业的这种产品中每件一等品的利润是10元,每件二等品和三等品的利润都是6元,试估计该企业销售600件这种产品,所获利润是多少元.20.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[)90,100.50,60,[)80,90,[]60,70,[)70,80,[)(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分,众数,中位数.参考答案1.C 【分析】利用方差的性质求解. 【详解】因为数据1x ,2x ,3x ,4x ,5x ,6x 的方差是13,由方差的性质知,数据121x -,221x -,321x -,421x -,521x -,621x -的方差是214233⨯=.故选:C. 2.C 【分析】由平均数得20x y +=,由标准差得()()22101018x y -+-=,联立可得xy . 【详解】 依题意得91011105x y++++=,则20x y +=①.()()()()()()()222222221129101010111010102101055x y x y ⎡⎤⎡⎤=-+-+-+-+-=+-+-⎣⎦⎣⎦,则()()22101018x y -+-=②.由①②得22218x y +=,所以()()2224002189122x y x y xy +-+-===. 故选:C. 3.B 【分析】根据1025% 2.5⨯=,判断该组数据的第25百分位数即可. 【详解】这组数据是从小到大排序的,共10个数,而1025% 2.5⨯=,所以这组数据的第25百分位数是第3个数据,即3.2. 故选:B. 4.C【分析】由样本数据由i x 变为35i x +,结合平均数、方差的性质,即求新样本中的平均数、方差. 【详解】由题意,12...n x x x x n-+++=,2211()n i i s x x n -==-∑,∴样本135x +,235x +,35n x +的平均数135x x --=+,而2219s s =. 故选:C 5.D 【分析】利用均值的计算公式以及方差的计算公式,准确运算,即可求解. 【详解】由题意,总体的均值为4006007.577.210001000⨯+⨯=, 根据分层抽样的性质,可得总体的方差为:22400600[1(7.57.2)][0.5(7.27)]0.4360.4240.7610001000⨯+-+⨯+-=+=. 故选:D. 6.C 【分析】按所给数据求出各得分的频率,然后根据百分位数定义计算. 【详解】由所给数据,总数为212311111++++++=, 得分3,6,7,10,11,13,30的频率分别为2123111,,,,,,11111111111111, 前3个得分频率和为540%11>,前2个得分的频率和为340%11<,因此40百分位数应该是第三个频率211对应的得分为7分. 故选:C . 7.B 【分析】依据数字特征的定义,依次对选项验证即可. 【详解】解:对于选项A ,1,2,5,6,6符合条件,故A 错,对于选项B ,若平均数为5且出现点数1,则只能为1,6,6,6,6,此时方差为22(15)4(65)45-+⨯-=,故B 对,对于选项C ,1,2,4,5,5符合条件,故C 错, 对于选项D ,1,4,4,5,6,平均数为()11445645++++=,方差()()()2221145464 2.85⎡⎤-+-+-=⎣⎦,符合条件,故D 错, 故选:B . 8.A 【分析】先求出平均数,再根据平均数计算即可求得方差. 【详解】 ()112561155x =++++=,()()()()()2222221621525556511512.455s ⎡⎤=-+-+-+-+-==⎣⎦ 故选:A 9.B 【分析】设这组数据分别为12,,.,n x x x ⋯,根据平均数公式及方差公式即可得的12.3n x x x n ++⋯+=,()()()2221233.34n x x x n -+-+⋯+-=,从而得到22212.n x x x ++⋯+,再依题意得到方程,解得即可; 【详解】解:设这组数据分别为12,,.,n x x x ⋯,则12.3n x x x n ++⋯+=,()()()2221233.34,n x x x n -+-+⋯+-=所以()()()2222221212.6.33.34,n n x x x x x x n ++⋯+-++⋯++++⋯+=所以()22212.1894,n x x x n n n ++⋯+-+=从而22212.13n x x x n ++⋯+=.因为这组数据的平方和是这组数据和的平方的19,所以()2211339n n n ⨯==,解得13n =或0n =(舍去). 故选:B 10.D 【分析】依次求得两位同学的成绩的平均数,再根据结果求得两位同学成绩的方差即可得出结果. 【详解】小明数学成绩的平均值为11(107111110109113)1105x =++++=,所以成绩的方差为22122221(107110)(111110)(110110)(109110)(113110)45s ⎡⎤=-+-+-+-+-=⎣⎦ 小红数学成绩的平均值为21(99110111108112)1085x =++++=,所以成绩的方差为22222221(99108)(110108)(111108)(108108)(112108)225s ⎡⎤=-+-+-+-+-=⎣⎦. 因为2212s s <,所以小明同学的成绩更稳定,方差为21=4s .故选:D 11.D 【分析】根据频率分布直方图的平均数的计算公式,准确计算,即可求解. 【详解】根据频率分布直方图的平均数的计算公式,可得:(550.03650.04750.015850.01950.005)1067x =⨯+⨯+⨯+⨯+⨯⨯=. 故选:D. 12.C 【分析】根据一组数的百分位数的定义直接计算即可. 【详解】该组数据从小到大排序为85,87,88,90,92,共5个数据,而560%3⨯=, 所以这组数据的第60百分位数为8890892+=. 故选:C.13.9或7- 【分析】设样本数据35124a a a a a ,,,,的平均数为a ,推出2580a =,解得4a =±,由此即可求出结果. 【详解】 由题意知,222222123450.2(80)s a a a a a =++++-,设样本数据35124a a a a a ,,,,的平均数为a ,则222222123450.2[()()()()()]s a a a a a a a a a a =-+-+-+-+-22222212345123450.2[2()5]a a a a a a a a a a a a =++++-+++++ 222222123450.2(5)a a a a a a =++++-,所以2580a =,解得4a =±,又12345222221a a a a a ++1,+1,+1,+1,的平均数为21a +, 当4a =时,21=9a +; 当4a =-时,21=-7a +. 故答案为:9或-7 14.①③④ 【分析】根据茎叶图中的数据,对题目中的命题进行分析、判断正误即可. 【详解】解:根据茎叶图中数据知,对于①,甲同学成绩的中位数是1(8082)812⨯+=,乙同学成绩的中位数是1(8788)87.52⨯+=,所以甲的中位数小于乙的中位数,①正确;对于②,甲同学的平均分为1(727680828690)816⨯+++++=, 乙同学的平均分为1(697887889296)856⨯+++++=, 所以甲同学的平均分比乙同学的平均分低,②错误; 对于③,甲同学的平均分比乙同学的平均分低,③正确;对于④,计算甲的方差为2222221107[(9)(5)(1)159]63⨯-+-+-+++=, 乙的方差为2222221244[(16)(7)23711]63⨯-+-++++=, 所以甲的方差小于乙的方差,④正确.所以正确的命题序号是①③④.故答案为:①③④.15.166【分析】根据平均数的计算公式即可求出结果.【详解】 估计高一年级全体学生身高的值为301702016016650⨯+⨯=, 故答案为:16616.18【分析】利用方差的性质求解即可.【详解】样本数据1x ,2x ,3x ,4x ,5x 的方差为22S =, 所以样本数据132x -,232x -,332x -,432x -,532x -的方差为:23218⨯=.故答案为:1817.(1)0.0075;(2)中位数是224;(3)5户.【分析】(1)根据小矩形的面积之和等于1即可求x 的值;(2)根据中位数左右两侧小矩形面积等于0.5可得中位数;(3)先计算每个区间抽取的户数,再计算抽样比例,即可求解.【详解】(1)由直方图的性质得()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=, 解得:0.0075x =;(2)因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+-=,解得:224a =,所以月平均用电量的中位数是224.(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=户,月平均用电量为[)240,260的用户有0.00752010015⨯⨯=户,月平均用电量为[)260,280的用户有0.0052010010⨯⨯=户,月平均用电量为[]280,300的用户有0.0025201005⨯⨯=户, 抽样比为112515105+++=15, 所以月平均用电量在[)220,240的用户抽取12555⨯=户. 18.(1)93分;(2)115分.【分析】(1)由每组数据中点值乘以频率相加可得均值;(2)计算出110分以下的频率和为0.75,因此80%分位数在[)110130,,还需频率0.05,区间[)110130,的频率是0.2,还需通过计算可得结论. 【详解】解:(1)数学成绩在:[)3050,频率0.0050200.1⨯=, [)5070,频率0.0050200.1⨯=, [)7090,频率0.0075200.15⨯=, [)90110,频率0.0200200.4⨯=, [)110130,频率0.0100200.2⨯=, []130150,频率0.0025200.05⨯=,样本均值为:400.1600.1800.151000.41200.21400.0593⨯+⨯+⨯+⨯+⨯+⨯=,可以估计样本数据中数学成绩均值为93分,据此可以估计该校高一下学期期中数学考试成绩估计93分.(2)由(1)知样本数据中数学考试成绩在110分以下所占比例为0.10.10.150.40.75+++=在130分以下所占比例为0.750.20.95+=因此,80%分位数一定位于[)110130,内,由 0.80.75110201150.950.75-+⨯=-, 可以估计样本数据的第80百分位数约为115分,据此可以估计该校高一下学期期中数学考试成绩第80百分位数约为115分19.(1)109.8;(2)3;(3)4500(元).【分析】(1)先利用频率分布直方图的性质求出0.030x =,由第75百分位数在图中表现为该数的左侧频率为0.75,根据这一点可求第75百分位数;(2)先根据频率分布直方图以及等级划分规则算出三种等级的频率,从而得样本中各等级的件数,再利用分层随机抽样的按比例抽取求解;(3)根据(2)中算出的频率求利润的估计值.【详解】(1)由题得,()0.00250.00900.01000.02000.02600.0025101x ++++++⨯=,解得0.030x =.又[65,105)的频率为0.625,[105,115)的频率为0.26,所以第75百分位数在[105,115)内第75百分位数为0.750.62510510109.80.26-+⨯≈. (2)由频率分布直方图以及等级划分规则可知,样本中三等品、二等品、一等品的频率分别为(0.00250.0100)100.125+⨯=,(0.02000.0300)100.5+⨯=,(0.02600.00900.0025)100.375++⨯=.所以在200件样本中,三等品、二等品、一等品的件数分别为25,100,75,所以按照产品等级用比例分配分层随机抽样的方法抽取8件产品, 则应抽取的一等品的件数分别为7583200⨯=. (3)由(2)知,从该企业的这种产品中任取一件是一等品的概率为0.375,是二等品或三等品的概率为0.625.故该企业销售600件这种产品,所获利润约为6000.375106000.62564500⨯⨯+⨯⨯=(元) 20.(1)0.005;(2)平均分为73,众数为65,中位数为2153. 【分析】(1)根据概率之和等于1,即所以小矩形的面积之和等于1,即可求解;(2)根据平均分,众数,中位数的概念结合频率分布直方图即可求出平均分,众数,中位数.【详解】解:(1)由频率分布直方图可得:()1020.020.030.041a ⨯+++=,∴0.005a =.(2)平均分550.00510650.0410750.0310850.0210950.0051073⨯⨯+⨯⨯+⨯⨯⨯⨯+⨯⨯=+(分) 众数为60702+=65分. 中位数为()0.50.005100.0410215700.033-⨯+⨯+=(分).。
用样本估计总体
月收入(元)
1000 1500 2000 2500 3000 3500 4000
练习1、如图是150辆汽车通过某路段 时速度的频率分布直方图,则速度在[60, 60 辆. 70)的汽车大约有______
在频率分布直方图中,依次连接各小长 方形上端的中点,就得到一条折线,这条 折线称为频率分布折线图.
练习3、以往招生Biblioteka 计显示,某所大学录 取的新生高考总分的中位数基本稳定在550 分,若某同学今年高考得了520分,他想报 考这所大学还需收集哪些信息?
要点: (1)查往年录取的新生的平均分数.若平均数 小于中位数很多,说明最低录取线较低,可以 报考; (2)查往年录取的新生高考总分的标准差.若 标准差较大,说明新生的录取分数较分散,最 低录取线可能较低,可以考虑报考.
标准差的取值范围是什么?标准差为0 的样本数据有何特点? s≥0,标准差为0的样本数据都相等. 方差的意义: 方差(或标准差)越大离散程度越大,数 据较分散; 方差(或标准差)越小离散程度越小,数 据较集中在平均数周围.
例 2 、有两个班级,每班各自按学号随 机选出 5 名学生,测验铅球成绩,以考察 体育达标程度,测验成绩如下:单位(米) 甲 9.1 7.8 8.5 6.9 5.2 乙 8.8 7.2 7.3 7.5 6.7 两个班相比较,哪个班整体实力强一些 ?
制作频率分布直方图的方法: (1)求极差(即一组数据中最大值与最小 值的差); (2)决定组距与组数;(样本容量不超过
100时,组数常分成5~12组)
(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图.
注:频率分布直方图中
高三总复习用样本估计总体
用样本本去估计总体知识梳理:1.作频率分布直方图的步骤:(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图注:频率分布直方图中小正方形的面积=组距×组距频率=频率。
2.频率分布折线图和总体密度曲线折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。
3.用茎叶图刻画数据的两个优点,(1)所有数据都可以从数据中得到;(2)茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据较大时,茎叶图的效果就不是很好了.4.平均数、众数、中位数、标准差和方差(1)、平均数:平均数是用来表示数据的平均水平。
一般用来表示,计算公式:(2)、众数:一组数据中出现次数最多的数。
(3)、中位数:将数据从小到大的顺序排列,若有奇数个数,则最中间的数是中位数。
若有偶数个数,则中间两个数的平均数是中位数。
(4)、标准差:是样本数据到平均数的一种平均距离,用来刻画数据的分散程度,一般用s 来表示,计算公式: ,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小。
(5)方差:方差是标准差的平方,它也可以用来刻画数据的分散程度,计算公式: 。
5.有样本频率分布估计总体分布通常分为两种情况:(1)、当总体中的个体取不同值很少时,其频率分布表由所取样本的不同值及其相应频率表示,就是相应的条形图;(2)、当总体中的个体不同值很多时,就用频率分布直方图来表示相应的样本的频率分布。
6、利用频率分布直方图来估计众数、中位数、平均数在频率分布直方图中,众数的估计值......是其中最高矩形底边中点的横坐标;中位数...的估计值等于频率分...的左边和右边的直方图面积相等;平均数布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。
高考数学总复习考点知识专题讲解57---用样本估计总体
2.在如图所示的茎叶图所示的数据中,众数和中位数分 别是( B )
A.23,26 B.31,26 C.24,30 D.26,30
[解析] 由茎叶图得到所有的数据从小到大排列依次为 12,14,20,23,25,26,30,31,31,41,42 , ∴ 众 数 和 中 位 数 分 别 为 31,26.故选 B.
的一个数据(或两个 它对极端值的不敏感有 数据的平均数)
时也会成为缺点
平均数
平均数与每一个样本数
如果有 n 个数据 x1,据有关,可以反映出更
x2,…,xn,那么这 多的关于样本数据全体
n 个数的平均数 x = 的信息,但平均数受数
x1+x2+…+xn ________n______
据中的极端值的影响较 大,使平均数在估计总
中国 CBA 篮球赛中甲、乙两篮球运动员上赛季某些场 次比赛的得分如下:
甲:12,15,24,25,31,31,36,36,37,39,44,49. 乙:8,13,14,16,21,23,24,26,28,33,38,39. (1)画出两组数据的茎叶图; (2)试比较这两位运动员的得分水平.
[解] (1)为便于对比分析,可将茎放在中间共用,叶分 列左、右两侧.如图.
某城市 100 户居民的月平均用电量(单位:千瓦时),以 [160,180) , [180,200) , [200,220) , [220,240) , [240,260) , [260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中 x 的值; (2)求月平均用电量的众数和中位数; (3)在月平均用电量为[200,240),[240,260),[260,280), [280,300]的四组用户中,用分层抽样的方法抽取 11 户居民, 则月平均用电量在[220,240]的用户中应抽取多少户?
高考数学专题复习:用样本估计总体
高考数学专题复习:用样本估计总体一、单选题1.某班50名学生在一次百米测试中,成绩全部不小于13秒且小于19秒,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;…;第六组,成绩大于等于18秒且小于19秒,如图是按上述分组方法得到的频率分布直方图,设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y的值分别是()A.90%,35 B.90%,45C.10%,35 D.10%,452.某同学郑一粒均匀的骰子5次,记录每次骰子出现的点数,若其中至少出现了1次点数6,则这组数据不可能得出的统计结果是()A.平均数为3,中位数为2 B.中位数为3,众数为2C.平均数为2,方差为3 D.中位数为3,方差为2.83.某中学有10个学生社团,每个社团的人数分别是70,60,60,50,60,40,40,30,30,10,则这组数据的平均数,众数,中位数的和为()A.165 B.160 C.150 D.1704.四名同学各掷一枚骰子5次,分别记录每次骰子出现的点数.根据下面四名同学的统计结果,可以判断出一定没有出现点数6的是()A.平均数为2,方差为2.4 B.中位数为3,众数为2C.平均数为3,中位数为2 D.中位数为3,方差为2.85.某市2020年各月的平均气温(℃)数据的茎叶图如下,则这组数据的中位数是()A .21B .22C .22.5D .236.为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近的6次数学测试的分数进行统计,甲、乙两人的得分情况如茎叶图所示,若甲、乙两人的平均成绩分别是 ,x x 甲乙,则下列说法正确的是( )A . x x >甲乙,乙比甲成绩稳定,应选乙参加比赛B . x x >甲乙,甲比乙成绩稳定,应选甲参加比赛C . x x <甲乙,甲比乙成绩稳定,应选甲参加比赛D . x x <甲乙,乙比甲成绩稳定,应选乙参加比赛7.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为2s ,则( )A .242,x s ==B .24,2x s =>C .24,2x s =<D .24,2x s ><8.某校高一年级一名学生七次月考数学成绩(满分100分)分别为78,82,84,84,86,89,96,则这名学生七次月考数学成绩的第80百分位数为( ) A .82B .84C .89D .969.某校高一甲、乙两个班分别有男生24名、15名,现用比例分配的分层随机抽样方法从两班男生中抽取样本量为13的样本,对两个班男生的平均身高进行评估.已知甲班、乙班男生身高的样本平均数分别为175cm 、177.6cm ,以所抽取样本的平均身高作为两个班男生的平均身高,则两个班男生的平均身高为( )A .176cmB .176.3cmC .176.6cmD .176.9cm10.设一组样本数据12,,n x x x 的平均值为2,则数据1229,29,,29n x x x ++⋅⋅⋅+的平均值为( ) A .11B .12C .13D .1411.某同学掷骰子4次,并记录了每次骰子出现的点数,得出平均数为2,方差为12的统计结果,则下列点数中一定不出现的是( ) A .1B .2C .3D .512.某单位共有A 、B 、C 三个部门,三部门人员平均年龄分别为38岁、24岁、42岁,又已知A 和B 两部门人员平均年龄为30岁,B 和C 两部门人员平均年龄为34岁,则该单位全体人员的平均年龄为( ) A .34岁 B .35岁C .36岁D .37岁二、填空题13.一组数6,5,4,3,3,3,2,2,2,1的80%分位数为________.14.学校进行30秒跳绳测试,某小组8名同学的跳绳个数如下面的茎叶图所示,则该组数据的方差为________.15.某企业生产甲、乙两种产品,现从一批产品中随机抽取两种产品各5件进行检测,检测量结果如下:由于表格被污损,数据a ,b 看不清,统计员只记得甲、乙两种产品检测数据的平均数和方差都相等,则ab =________.16.已知样本数据1x ,2x ,⋯,2020x 的平均数与方差分别是m 和n ,若2(1i i y x i =-+=,2,⋯,2020),且样本数据的1y ,2y ,⋯,2020y 平均数与方差分别是n 和m ,则222122020x x x ++⋯+=________.三、解答题17.高一年级期末考试成绩各分数段[)0,90,[)90,105,[)105,120,[)120,135,[]135,150的频率分布如下图.(Ⅰ)计算高一年级所有同学成绩的中位数;(Ⅱ)用各分数段的中间值代替各分数段的平均值,并且删去[)0,90,[]135,150两个分数段,试估计高一年级期末考试成绩的平均值;(Ⅲ)若高一年级有1000人,把成绩从低到高编号,用系统抽样的方法从中抽取一个容量为20的样本,其中一个个体的编号为63,请写出抽样在[)105,120之间的个体的编号.18.20名学生某次数学考试成绩(单位:分)的频率分布直方图如图.(1)求频率分布直方图中a 的值;(2)估计总体中成绩落在[)50,60中的学生人数;(3)根据频率分布直方图估计20名学生数学考试成绩的众数,中位数;19.甲、乙两位同学要参加数学竞赛,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,绘制成茎叶图如下(单位:分).(1)分别写出甲、乙两位同学6次预赛成绩的众数、中位数;(2)计算甲、乙两位同学6次预赛成绩的平均数与方差,并判断谁的成绩更稳定.20.现有某城市100户居民的月平均用电量(单位:度)的数据,根据这些数据,以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图所示.(1)确定直方图中x 的值,并求月平均用电量的众数和中位数;(2)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层随机抽样的方法抽取11户居民,则月平均用电量在[)220,240内的用户中应抽取多少户?21.下表为30位学生参加语文竞赛的成绩,并由小到大排列.(1)求第一、二、三四分位数;(2)求第10百分位数;(3)求第95百分位数.22.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)求直方图中x的值;(2)①求在这些用户中,用电量在区间[100,250)内的居民数;②如果按分层抽样方法,在这些用户中按1:10的比例抽取用户进一步调查,那么用电量在[150,200)内的居民数应抽取多少?参考答案1.A 【分析】频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率.建立相应的关系式,即可求得. 【详解】解:从频率分布直方图上可以看出1(0.060.04)0.9x =-+=,50(0.360.34)35y =⨯+=,故选:A . 2.C 【分析】对于选项ABD ,举出满足条件且出现点数为6的例子,对于选项C ,由于至少出现一个点数6,结合平均数为2,计算方差即可判断作答. 【详解】对于A ,中位数为2的5个点数是1,1,2,5,6,平均数为1125635++++=,选项A 可能出现;对于B ,中位数为3,众数为2的5个点数是2,2,3,4,6或2,2,3,5,6均符合要求,即选项B 可能出现;对于C ,因平均数为2,且至少出现了1次点数6,则方差221(62) 3.25s >-=,即方差不可能为3,选项C 不可能出现;对于D ,中位数为3的5个点数是1,2,3,3,6,平均数为1233635++++=,方差2222221[(13)(23)(33)(33)(63)] 2.85s =-+-+-+-+-=,选项D 可能出现.故选:C 3.C 【分析】将数字从小到大(或从大到小)排列,得到众数和中位数,再算出平均数,即可得到答案. 【详解】人数分别是10,30,30,40,40,50,60,60,60,70,则众数为60,中位数为4050452+=,平均数为103030404050606060704510+++++++++=,∴平均数,众数,中位数的和为:60+45+45=150. 故选:C. 4.A 【分析】选项A ,利用反证法说明一定含6,选项BCD 中依次举例说明可能含有6即可. 【详解】对于A ,若平均数为2,且出现点数6,则方差221(62) 3.2 2.45S >-=>,所以当平均数为2,方差为2.4时,一定不会出现点数6,所以A 可以判断;对于B ,当掷骰子出现的结果为2,2,3,4,6时,满足中位数为3,众数为2,可以出现点6,所以B 不能判断;对于C ,当掷骰子出现的结果为1,1,2,5,6时,满足平均数为3,中位数为2,可以出现点6,所以C 不能判断;对于D ,当掷骰子出现的结果为1,2,3,3,6时,满足中位数为3,则平均数为1(12336)35x =++++=,方差为2222221[(13)(23)(33)(33)(63)] 2.85S =-+-+-+-+-=,所以可以出现点6,所以D 不能判断. 故选:A. 5.B 【分析】由茎叶图得到数据最中间的两个数是21和23,即得解. 【详解】由茎叶图可知,数据最中间的两个数是21和23, 所以数据的中位数为21+23=222. 故选:B 6.D 【分析】根据茎叶图中的数据计算平均数得的平均数是82,乙的平均数是87,再根据茎叶图分析甲与乙的稳定性即可得答案. 【详解】由茎叶图可知,甲的平均数是727879858692826+++++=,乙的平均数是788687879193876+++++=,所以乙的平均数大于甲的平均数,即 x x <甲乙, 从茎叶图可以看出乙的成绩比较稳定,应选乙参加比赛. 故选:D. 7.C 【分析】由已知条件,根据平均数和方差的计算公式进行求解即可. 【详解】 根据题意有47448x ⨯+==, 而()22724428s ⨯+-=<.故选:C. 8.C 【分析】利用百分位数的定义分析求解即可. 【详解】解:因为780% 5.6⨯=,所以这名学生七次月考数学成绩的第80百分位数为89. 故选:C. 9.A 【分析】由题知13个的样本中,甲班男生有8人,乙班男生有5人,进而得两个班男生的平均身高为()11758177.6517613⨯+⨯=. 【详解】解:根据题意,抽出来的13个的样本中,甲班男生有241382415⨯=+人,乙班男生有151352415⨯=+人,所以根据题意得两个班男生的平均身高为()11758177.6517613⨯+⨯= 故选:A 10.C 【分析】利用平均数公式求解即可. 【详解】 因为122nx x x n+++=,所以12292929n x x x n++++++,()122913n x x x n+++=+=,故选:C. 11.D 【分析】利用方差的公式检验四个选项的正误即可得正确选项. 【详解】当有一个数是5,则()25291442-=>,所以5一定不出现;当有一个数是3时,()23211442-=<,所以3可能出现; 当有一个数是2时,()2221042-=<,所以2可能出现; 当有一个数是1时,()21211442-=<,所以1可能出现;故选:D. 12.B 【分析】设A 、B 、C 三个部门的人数分别为,,a b c ,根据已知条件列出方程组可求出34a b =,54c b =,然后再根据平均数的计算公式,即可求出该单位全体人员的平均年龄.【详解】设A 、B 、C 三个部门的人数分别为,,a b c ,由题意得382430244234a b a b b c b c+⎧=⎪⎪+⎨+⎪=⎪+⎩,所以3454a b c b ⎧=⎪⎪⎨⎪=⎪⎩, 所以该单位全体人员的平均年龄为3538244238244244353544b b b a bc a b c b b b ⨯++⨯++==++++. 故选:B13.4.5【分析】将数据按从小到大的顺序排列,第8和第9个数的平均数即可.【详解】一组数6,5,4,3,3,3,2,2,2,1按从小到大的顺序排列,可得1,2,2,2,3,3,3,4,5,6,共10个,由1080%8⨯=,所以该组数据的80%分位数为45 4.52+=, 故答案为:4.5.14.17.5【分析】先求出该组数据的平均数,再由方差公式即可求出.【详解】 由图可知,该组数据的平均数为4144454750515254488+++++++=, 所以方差为()()()()2222222217431234617.58⎡⎤⨯-+-+-+-++++=⎣⎦. 故答案为:17.5.15.72【分析】求出均值可得17a b +=,再由方差相等可得()()22881a b -+-=,解方程组即可求解.【详解】77+7.5+9+9.56+8.5+8.5+=8=55a x xb ++==甲乙,可得17a b += ①, ()()()()()22222878787.58989.5 5.5D =-+-+-+-+-=甲 ,则()()()()()2222286888.588.58 5.5D a b =-+-+-+-+-=乙,可得()()22881a b -+-= ②, 由①②可得89,98a a b b ==⎧⎧⎨⎨==⎩⎩,所以72ab = , 故答案为:72 .16.4040【分析】由样本数据的平均数、方差的性质列方程组求出1m =,1n =,从而2221220201[(1)(1)(1)]12020x x x -+-+⋅⋅⋅+-=,由此能求出222122020x x x ++⋯+的值. 【详解】由题意得:2m n m n -+=⎧⎨=⎩, 解得1m =,1n =, ∴2221220201[(1)(1)(1)]12020x x x -+-+⋅⋅⋅+-=, 22212202012202020202()2020x x x x x x ∴++⋯++-++⋅⋅⋅+=,2221220201220202()220204040x x x x x x ∴++⋯+=++⋅⋅⋅+=⨯=.故答案为:4040.17.(Ⅰ)110分;(Ⅱ)111.5分;(Ⅲ)413,463,513,563,613,663.【分析】(1)根据中位数的概念即可求解;(Ⅱ)结合加权平均数的计算公式即可求出结果;(Ⅲ)由系统抽样中等间隔即可求出结果.【详解】(1)由题图可知[)0,90和[)90,105分数段内的人数占总人数的40%,故中位数在[)105,120分数段内从低到高13处,则中位数为1105151103+⨯=(分). (Ⅱ)[)90,105,[)105,120,[)120,135三个分数段的中间值分别为97.5,112.5,127.5,人数比为25%:30%:20%5:6:4=,则估计高一年级期末考试成绩的平均值为97.55112.56127.54111.5564⨯+⨯+⨯=++(分). (Ⅲ)由题图可得[)0,90分数段内有150人,[)90,105分数段内有250人,[)105,120分数段内有300人,则[)105,120分数段内的编号是从401到700,由题意,两个相邻样本的编号差为10005020=,则在分数段[)105,120内抽取的个体的编号为413,463,513,563,613,663. 18.(1)0.005a =;(2)2人;(3)众数为75,中位数为5407. 【分析】(1)由频率和为1可求出a 的值;(2)先求出成绩落在[)50,60的频率,从而可求出频数;(3)由图可知众数在第3组,从而可得众数为7080752+=,由于前2组的频率和小于0.5,前3组的频率和大于0.5,所以中位数在第3组,列方程可求得结果【详解】(1)()23762101a a a a a ++++⨯=,解得0.005a =.(2)由频率分布直方图得成绩落在[)50,60中的频率为2100.1a ⨯=,∴估计总体中成绩落在[)50,60中的学生人数为:200.12⨯=人.(3)根据频率分布直方图估计20名学生数学考试成绩的众数为:7080752+=, 由于前2组的频率和10(0.010.015)0.250.5⨯+=<,前3组的频率和10(0.010.0150.035)0.60.5⨯++=>,所以中位数在第3组,设中位数为x ,则()()0.010.015100.035700.5x +⨯+-= 解得5407x =,所以中位数为540719.(1)甲同学6次预赛成绩的众数为82分,中位数为82分,乙同学6次预赛成绩的众数为85分,中位数为81.5分;(2)甲同学预赛的平均成绩82分;乙同学预赛的平均成绩81分,甲同学预赛成绩的方差为313;乙同学预赛成绩的方差为13;甲同学成绩更稳定. 【分析】(1)甲同学的6次预赛成绩分别为:78,79,82,82,83,88;乙同学的6次预赛成绩分别为:76,77,80,83,85,85,进而可得答案;(2)根据茎叶图,计算即可得平均数与方差,再根据数字特征的意义即可得答案.【详解】(1)由茎叶图可知,甲同学的6次预赛成绩分别为:78,79,82,82,83,88;乙同学的6次预赛成绩分别为:76,77,80,83,85,85;所以,甲同学6次预赛成绩的众数为82分,中位数为8282822+=(分),乙同学6次预赛成绩的众数为85分,中位数为808381.52+=(分) (2)甲同学预赛的平均成绩121223880826x --++++=+=分 乙同学预赛的平均成绩243035580816x --++++=+=分, 甲同学预赛成绩的方差为22222221131(7882)(7982)(8282)(8282)(8382)(8882)63s ⎡⎤=-+-+-+-+-+-=⎣⎦ 乙同学预赛成绩的方差为222222221(7681)(7781)(8081)(8381)(8581)(8581)136s ⎡⎤=-+-+-+-+-+-=⎣⎦ 由2221s s >,所以,甲同学成绩更稳定20.(1)0.0075x =,众数为230度,中位数224度;(2)5户.【分析】(1)由频率和为1列方程可求出x 的值,由[)220,240对应的频数最大,可求出众数,由前3组的频率和小于0.5,前4组的频率和大于0.5,所以中位数在第4组,设中位数为t 度,则0.50.45220200.25t -=+⨯; (2)利用分层抽样的比进行求解即可【详解】(1)因为()0.0020.00250.0050.00950.0110.0125201x ++++++⨯=,所以0.0075x =; 由频率分布直方图可知:[)220,240对应的频数最大,所以众数为230度;因为前三组频率之和为()0.0020.00950.011200.450.5++⨯=<,第四组频率为0.0125200.25⨯=,且0.450.250.70.5+=>,所以中位数在第四组数据中,设中位数为t 度, 所以0.50.45220202240.25t -=+⨯=. (2)因为[)220,240,[)240,260,[)260,280,[]280,300的频率之比为()()()()0.012520:0.007520:0.00520:0.0025205:3:2:1⨯⨯⨯⨯=,所以月平均用电量在[)220,240内的用户中应抽取:51155321⨯=+++户, 答:月平均用电量在[)220,240内的用户中应抽取5户.21.(1)第一四分位数为65,第二四分位数为75.5,第三四分位数为85;(2)56.5;(3)99.【分析】(1)由30×25%,30×50%,30×75%分别确定第一、二、三四分位数的位置即可; (2)由30×10%确定第10百分位数的位置; (3)由30×95%确定第95百分位数的位置 【详解】解:(1)30×25%=7.5,取第8项数据,所以第一四分位数为65,30×50%=15,取第15、16项数据的平均数,所以第二四分位数为75762+=75.5;30×75%=22.5,取第23项数据,所以第三四分位数为85.(2)30×10%=3,取第3、4项数据的平均数,所以第10百分位数为55582+=56.5. (3)30×95%=28.5,取第29项数据,所以第95百分位数为99. 22.(1)x =0.0044;(2)①70户;②3(户).【分析】(1)由频率分布直方图,列出方程,能求出直方图中x 的值.(2)①先求出用电量在[100,250)内的频率为0.7,由此能求出在这些用户中,用电量在区间[100,250)内的居民数.②用电量在[150,200)内的户数为30户,由此利用分层抽样的性质能求出用电量在[150,200)内的居民数应该抽取的户数.【详解】(1)由频率分布直方图得:(0.0012+0.0024×2+0.0036+x+0.0060)×50=1,解得直方图中x=0.0044.(2)①用电量在[100,250)内的频率为:(0.0036+0.0060+0.0044)×50=0.7,∴在这些用户中,用电量在区间[100,250)内的居民数为100×0.7=70户.②用电量在[150,200)内的户数为0.0060×50×100=30(户),按分层抽样方法,在这些用户中按1:10的比例抽取用户进一步调查,用电量在[150,200)内的居民数应该抽取:130310⨯=(户).。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用样本估计总体1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数. 4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差:(3)方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数).知识拓展1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.题组一 思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × )题组二 教材改编2.[P100A 组T2(1)]一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )A .4B .8C .12D .16 答案 B解析 设频数为n ,则n 32=0.25,∴n =32×14=8.3.[P81A 组T1]若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92答案 A解析 ∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.4.[P71T1]如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有______人.答案 25解析 0.5×0.5×100=25.题组三 易错自纠5.若数据x 1,x 2,x 3,…,x n 的平均数x =5,方差s 2=2,则数据3x 1+1,3x 2+1,3x 3+1,…,3x n +1的平均数和方差分别为( ) A .5,2 B .16,2 C .16,18D .16,9答案 C解析∵x1,x2,x3,…,x n的平均数为5,∴x1+x2+x3+…+x nn=5,∴3x1+3x2+3x3+…+3x nn+1=3×5+1=16,∵x1,x2,x3,…,x n的方差为2,∴3x1+1,3x2+1,3x3+1,…,3x n+1的方差是32×2=18.6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为x,则m,n,x的大小关系为________.(用“<”连接)答案n<m<x解析由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现次数最多,故n=5;x=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.故n<m<x.题型一茎叶图的应用1.(优质试题·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5 B.5,5 C.3,7 D.5,7答案 A解析甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x=3.故选A.2.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图所示.据此可估计该校上学期400名教师中,使用多媒体进行教学次数在[16,30)内的人数为()A.100 B.160C.200 D.280答案 B解析观察茎叶图,抽取的20名教师中使用多媒体教学次数在[16,30)内的有8人,所以该区间段的频率为820=0.4,因此全校400名教师使用多媒体教学次数在[16,30)内的有400×0.4=160(人).思维升华茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.题型二频率分布直方图的绘制与应用命题点1用频率分布直方图求频率、频数典例(优质试题·山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.140答案 D解析设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.命题点2用频率分布直方图估计总体典例(优质试题·四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)估计全市居民中月均用水量不低于3吨的人数为3.6万.理由如下:由(1)知,100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000. (3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.思维升华(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.(2)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.跟踪训练(优质试题·北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5, 所以总体中分数在区间[40,50)内的人数估计为400×5100=20.(3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30,所以样本中的男生人数为30×2=60, 女生人数为100-60=40,所以样本中男生和女生人数的比例为60∶40=3∶2,所以根据分层抽样原理,估计总体中男生和女生人数的比例为3∶2.题型三 用样本的数字特征估计总体的数字特征典例 (1)某市有210名初中生参加数学竞赛预赛,随机调阅了60名学生的答卷,成绩如表:①求样本的平均成绩和标准差(精确到0.01分);②若规定预赛成绩在7分或7分以上的学生参加复赛,试估计有多少名学生可以进入复赛. 解 ①x =160×(4×6+5×15+6×21+7×12+8×3+9×3)=6,s 2=160×[6×(4-6)2+15×(5-6)2+21×(6-6)2+12×(7-6)2+3×(8-6)2+3×(9-6)2]=1.5.∴s ≈1.22,故样本的平均成绩为6分,标准差约为1.22分.②在60名选手中,有12+3+3=18(名)学生预赛成绩在7分或7分以上,∴210人中有1860×210=63(名)学生的预赛成绩在7分或7分以上,故大约有63名学生可以参加复赛. (2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:①分别求出两人得分的平均数与方差;②根据图和上面算得的结果,对两人的训练成绩作出评价. 解 ①由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13;x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4; s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. ②由s 2甲>s 2乙,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.跟踪训练 某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. 解 (1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数x甲=1015=23; 方差为s 2甲=115⎣⎡⎦⎤⎝⎛⎭⎫1-232×10+⎝⎛⎭⎫0-232×5=29.乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数x乙=915=35; 方差为s 2乙=115⎣⎡⎦⎤⎝⎛⎭⎫1-352×9+⎝⎛⎭⎫0-352×6=625.因为x 甲>x乙,s 2甲<s 2乙,所以甲组的研发水平优于乙组.(2)记恰有一组研发成功为事件E ,在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),共7个.因此事件E 发生的频率为715.用频率估计概率,即得所求概率为P (E )=715.高考中频率分布直方图的应用考点分析 频率分布直方图是高考考查的热点,考查频率很高,题型有选择题,填空题,也有解答题,难度为中低档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.典例 (12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.。