2021版高考数学一轮复习第九章统计与统计案例9.2用样本估计总体教学案苏教版
2025数学大一轮复习讲义苏教版 第九章 用样本估计总体
第二部分
探究核心题型
题型一 样本的数字特征的估计
例1 (1)(多选)(2023·荆门联考)某单位为了解该单位党员开展学习党史知识 活动情况,随机抽取了30名党员,对他们一周的党史学习时间进行了统计, 统计数据如下.则下列对该单位党员一周学习党史时间的叙述,正确的有
党史学习时间(小时) 党员人数
自主诊断
1.判断下列结论是否正确.(请在括号中打“√”或“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.( × ) (2)方差与标准差具有相同的单位.( × )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,
方差不变.( √ )
(4)在频率直方图中,可以用最高的小长方形底边中点的横坐标作为众
平均环数 方差
甲
乙
丙
丁
8.5 8.8 8.8
8
3.5 3.5 2.1 8.7
由平均数及方差的定义知,丙的平均成绩较高且较稳定,是最佳人选.
自主诊断
4.有一组数据:-1,a,-2,3,4,2,它们的中位数是1,则这组数据 的平均数是___1___.
数据-1,a,-2,3,4,2,已知除a以外的数据从小到大排序为 -2,-1,2,3,4,要使得中位数为1,则a在第3位或第4位, 即2+2 a=1,a=0,经检验符合题意, 所以这组数据的平均数是-2-1+06+2+3+4=1.
7 8 9 10 11 487 6 5
√A.众数是8 √C.平均数是9
B.40百分位数为8
√D.中位数是9
由题意,随机抽取30名党员, 由表可知,党史学习时间为8小时的人最多,为8人,故众数是8,故 A正确; 因为 30×14000=12,40 百分位数为8+2 9=8.5,故 B 错误; 平均数为310×(7×4+8×8+9×7+10×6+11×5)=9,故 C 正确; 因为共有30名党员,故中位数为第15项和第16项的平均数,因为第 15项和第16项均为9,故中位数为9,故D正确.
高考数学一轮复习 第九章 统计与统计案例 9.2 用样本估计总体课件 苏教苏教高三全册数学课件
主 回
2,则数据2x1,2x2,2x3,2x4,2x5的标准差为
.
课
顾
后
2 2 [由s2=1n
课
堂 考
8,标准差为2
2.]
限
(xi- x )2=2,则数据2x1,2x2,2x3,2x4,2x5的方差是 时 集
训
点
探
究
返
首
12/11/2021
页
第十五页,共四十八页。
16
4.如图是 100 位居民月均用水量的频率分布直方图,则月均用
点
探 究
②数据ax1,ax2,…,axn的方差为a2s2.
返
首
12/11/2021
页
第十页,共四十八页。
11
课
前
自
一、思考辨析(正确的打“√”,错误的打“×”)
主
回 顾
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中
课 后
趋势.
限
( )时
课 堂
(2)一组数据的方差越大,说明这组数据越集中.
考点1 样本的数字特征的计算与应用
课 前
利用样本的数字特征解决决策问题的依据
自
主 回
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一 课
顾
组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程
后
限
度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越
时 集
课
训
堂 考
稳定.
点
探
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字
课 后
中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.
高考数学一轮复习全套课时作业9-2线性回归分析与统计案例
作业9.2线性回归分析与统计案例一、单项选择题1.甲、乙、丙、丁四位同学各自对A ,B 两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m ,如下表:则哪位同学的试验结果体现A ,B 两变量有更强的线性相关性()A .甲B .乙C .丙D .丁2.某工厂某产品产量x(千件)与单位成本y(元)满足回归直线方程y ^=77.36-1.82x ,则以下说法中正确的是()A .当产量为1千件时,单位成本为75.54元B .当产量为2千件时,单位成本为73.72元C .产量每增加1000件,单位成本约下降1.82元D .产量每减少1000件,单位成本约下降1.82元3.(2021·郑州质检)某研究机构对儿童记忆能力x 和识图能力y 进行统计分析,得到如下数据:由表中数据,求得线性回归方程为y ^=45x +a ^.若某儿童的记忆能力为12,则他的识图能力约为()A .9.2B .9.5C .9.8D .104.(2021·济宁邹城市模拟)2020年初,新型冠状病毒(COVID -19)引起的肺炎疫情暴发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:可得y 关于x 的二次回归方程为y ^=6x 2+a ,则此回归模型第4周的残差(实际值与预报值之差)为()A .5B .4C .1D .05.(2021·长春质检)某学校为了采取治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:则认为“是否同意限定区域停车与家长的性别有关”的把握约为()A .0.1%B .0.5%C .99.5%D .99.9%附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d.6.(2021·衡水中学模拟)某公司某型号无人机以其小巧轻便、高效机动、影像清晰、智能化、用途广等突出特点,得到广大用户的青睐,该型号无人机近5年销售量数据统计如下表所示.根据表中的数据用最小二乘法求得y 关于x 的线性回归方程为y ^=6.5x +t ,则可以预测2022年该型号无人机的销量大约为()A .50万件B .54.5万件C .55万件D .58万件7.(2021·运城市高三模拟)根据散点图,对两个具有非线性关系的相关变量x ,y 进行回归分析,设u =lny ,v =(x -4)2,利用最小二乘法,得到线性回归方程为u ^=-0.5v +2,则变量y 的最大值的估计值是()A .eB .e 2C .ln2D .2ln28.(2021·保定市易县中学高三模拟)下图是某市2014年到2020年贫困户的户数y(单位:万户)与时间t 的条形图(时间t 的取值1,2,…,7依次对应2014年至2020年).若y 关于t 的线性回归方程为y ^=-0.5t +a ,则a =()A .2.2B .4.2C .6.2D .6.4二、多项选择题9.(2021·山东泰安二中等校联考)设某中学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n)用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中正确的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该中学某个女生的身高增加1cm ,则其体重约增加0.85kgD .若该中学某个女生的身高为160cm ,则可断定其体重必为50.29kg10.(2021·合肥肥东县高三调研)某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:厘米),图1为选取的15名志愿者身高与臂展的折线图,图2为身高与臂展所对应的散点图,并求得其回归方程为y ^=1.16x -30.75,以下结论中正确的是()A .15名志愿者身高的极差小于臂展的极差B .15名志愿者身高和臂展成正相关关系C .可估计身高为190厘米的人臂展大约为189.65厘米D .身高相差10厘米的两人臂展都相差11.6厘米三、填空题与解答题11.已知具有相关关系的两个变量x ,y 的一组观测数据如下表所示,若据此利用最小二乘法得到回归方程y ^=0.7x +0.35,则m =________.12.(2021·江苏省马坝高中高二期中)为了判断高中二年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P(K 2≥3.841)≈0.05,P(K 2≥5.024)≈0.025.则认为是否选修文科与性别有关系出错的可能性为________.13.(2021·山东德州期末)某研究性学习小组研究学生玩手机对学习的影响,部分统计数据如下表:经计算K 2的值,则有________%的把握认为玩手机对学习有影响.附:14.用指数模型y =c·e kx 去拟合一组数据时,为了求出回归方程,设z =lny ,变换后得到线性回归直线方程z =0.3x +4,则常数c 的值为________,k 的值为________.15.(2021·重庆市高三二诊)近几年来,热饮越来越受到年轻人的欢迎.一个研究性学习小组为了研究气温对热饮销售的影响,统计了学校门口一个热饮店在2019年1月份某6天白天的平均气温和热饮销售量,得到以下数据:(1)求销售量y 关于气温x 的回归直线方程,若某天白天的平均气温为16℃,估计当天的热饮销售量;(2)根据表格中的数据计算R 2(精确到0.001),由此解释平均气温对销售量变化的影响.16.已知由样本数据点集合{(x i ,y i )|i =1,2,…,n},求得的回归直线方程为y ^=1.5x +0.5,且x -=3,现发现两个数据点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的回归直线l 的斜率为1.2,则()A .变量x 与y 具有负相关关系B .去除后的回归方程为y ^=1.2x +1.4C .去除后y 的估计值增加速度变快D .去除后相应于样本点(2,3.75)的残差为0.0517.(2021·辽宁大连市高三第三次模拟)盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某款盲盒内可能装有某一套玩偶的A ,B ,C 三种样式,且每个盲盒只装一个.(1)若每个盲盒装有A ,B ,C 三种样式玩偶的概率相同.某同学已经有了A 样式的玩偶,若他再购买两个这款盲盒,恰好能收集齐这三种样式的概率是多少?(2)某销售网点为调查该款盲盒的受欢迎程度,随机发放了200份问卷,并全部收回.经统计,有30%的人购买了该款盲盒,在这些购买者当中,女生占23;而在未购买者当中,男生女生各占50%.请根据以上信息填写下表,并分析是否有95%的把握认为“购买该款盲盒与性别有关”?(3)该销售网点已经售卖该款盲盒6周,并记录了销售情况,如下表:由于电脑故障,第2周数据现已丢失,该销售网点负责人决定用第4,5,6周的数据求线性回归方程,再用第1,3周的数据进行检验.①请用第4,5,6周的数据求出y 关于x 的线性回归方程y ^=b ^x +a ^;②若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2盒,则认为得到的线性回归方程是可靠的,试问①中所得的线性回归方程是否可靠?女生男生总计购买未购买总计作业9.2线性回归分析与统计案例参考答案1.答案D 解析|r|越大,m 越小,线性相关性越强.故选D.2.答案C 解析令f(x)=77.36-1.82x ,因为f(x +1)-f(x)=77.36-1.82(x +1)-77.36+1.82x =-1.82,所以产量每增加1000件,单位成本约下降1.82元.故选C.3.答案B解析由表中数据得x -=7,y -=5.5,由点(x -,y -)在直线y ^=45x +a ^上,得a ^=-110,即线性回归方程为y ^=45x -110.所以当x =12时,y ^=45×12-110=9.5,即他的识图能力约为9.5.故选B.4.答案A解析设t =x 2,则t -=15(1+4+9+16+25)=11,y -=15(2+17+36+93+142)=58,a =58-6×11=-8.所以y ^=6x 2-8.令x =4,得e ^4=y 4-y ^4=93-6×42+8=5.故选A.5.答案C解析因为K 2的观测值k =50×(20×15-5×10)225×25×30×20≈8.333>7.879,所以约有99.5%的把握认为“是否同意限定区域停车与家长的性别有关”.6.答案B 解析x -=0+1+2+3+45=2,y =10+15+20+30+355=22.又因为直线y ^=6.5x +t 过点(2,22),故6.5×2+t =22,解得t =9.故预测2022年该型号无人机的销量大约为y ^=6.5×7+9=54.5(万件).故选B.7.答案B解析将u =lny ,v =(x -4)2代入线性回归方程u ^=-0.5v +2得:lny =-0.5(x -4)2+2,即y =e -0.5(x -4)2+2,当x =4时,-0.5(x -4)2+2取到最大值2,因为y =e x 在R 上单调递增,所以当x =4时,y =e -0.5(x -4)2+2取到最大值e 2.故选B.8.答案C解析本题考查线性回归方程.依题意,得t -=1+2+…+77=4,y -=5.6+5.2+4.8+4.4+3.4+3.3+2.77=4.2,所以4.2=-0.5×4+a ,所以a =6.2.故选C.9.答案ABC解析本题考查线性回归方程的理解和应用.由最小二乘法建立的回归方程可知,回归直线y ^=0.85x -85.71一定过样本点的中心(x -,y -),因此B 正确;由x 的系数0.85>0可知变量y 与x 具有正的线性相关关系,因此A 正确;由x 的系数为0.85可知,若某个女生的身高增加1cm ,则其体重约增加0.85kg ,因此C 正确;当某个女生的身高为160cm 时,体重约为50.29kg ,不是一定为50.29kg ,因此D 不正确.故选ABC.10.答案ABC解析身高极差大约为18,臂展极差大约为23,故A 正确;很明显根据散点图象以及回归直线得到,身高矮臂展就会短一些,身高高臂展就长一些,故B 正确;身高为190厘米,代入回归方程可得到臂展估计值等于189.65厘米,但是不是准确值,故C 正确;身高相差10厘米的两人臂展的估计值相差11.6厘米,但并不是准确值,回归方程上的点并不都是准确的样本点,故D 不正确.故选ABC.11.答案3解析x -=3+4+5+64=4.5,y -=2.5+m +4+4.54=11+m4,所以样本点的中心为因为回归方程为y ^=0.7x +0.35,样本点的中心在回归直线上,所以11+m 4=0.7×4.5+0.35,解得m =3.12.答案5%解析根据表中的数据,得到K 2的观测值k =50×(13×20-10×7)223×27×20×30≈4.844,因为4.844>3.841,所以认为是否选修文科与性别有关系出错的可能性为5%.13.答案99.5解析本题考查独立性检验的应用.由表中数据,计算K 2的观测值k =30×(4×2-8×16)212×18×20×10=10,且10>7.879,则有99.5%的把握认为玩手机对学习有影响.14.答案e 40.3解析因为y =c·e kx ,所以两边取对数,可得lny =ln(c·e kx )=lnc +kx ,由z =lny ,可得z =lnc +kx ,又z=0.3x +4,∴lnc =4,c =e 4,k =0.3.15.答案(1)y ^=-3x +150102杯(2)R 2≈0.967,平均气温解释了96.7%的销售量变化(或销售量变化有96.7%是由平均气温引起的)解析(1)由题知,x -=5,y -=135,从而x -20361013y 161146138133120112x i -x --7-5-2158y i -y-26113-2-15-23∑6i =1(x i -x -)(y i -y -)=(-7)×26+(-5)×11+(-2)×3+1×(-2)+5×(-15)+8×(-23)=-504,∑6i =1(x i -x -)2=(-7)2+(-5)2+(-2)2+12+52+82=168,则b ^=∑6i =1(x i -x -)(y i -y -)∑6i =1(x i -x -)2=-504168=-3,a ^=y --b ^x -=135-(-3)×5=150.所以,销售量y 关于气温x 的回归直线方程为:y ^=-3x +150.当x =16时,y ^=-3×16+150=102.因此,某天白天的平均气温为16℃时,估计可以卖出102杯热饮.(2)x -20361013y 161146138133120112y ^156150141132120111y i -y^5-4-311∑6i =1(y i -y ^i )2=52+(-4)2+(-3)2+12+02+12=52,∑6i =1(y i -y -)2=262+112+32+(-2)2+(-15)2+(-23)2=1564.R 2=1-∑6i =1(y i -y ^i )2∑6i =1(y i -y -)2=1-521564≈0.967.所以,平均气温解释了96.7%的销售量变化(或销售量变化有96.7%是由平均气温引起的).16.答案B解析因为去除误差较大的两点后重新求得的回归直线l 的斜率为1.2,所以变量x 与y 具有正相关关系,故A 错误;当x -=3时,y -=3×1.5+0.5=5,故样本点的中心是(3,5),且去除数据点(1.2,2.2)和(4.8,7.8)后,样本点的中心还是(3,5),又∵去除数据点(1.2,2.2)和(4.8,7.8)后重新求得的回归直线l 的斜率为1.2,故5=3×1.2+a ,解得a =1.4,即回归直线方程为y ^=1.2x +1.4,故B 正确;因为1.5>1.2,所以去除后y 的估计值增加速度变慢,故C 错误;因为y ^=1.2×2+1.4=3.8,所以y -y ^=3.75-3.8=-0.05,故D 错误.17.答案(1)29(2)填表见解析,有95%的把握认为“购买该款盲盒与性别有关”(3)①y ^=2.5x +14.5②可靠解析(1)由题意,基本事件空间为Ω={(A ,A),(A ,B),(A ,C),(B ,A),(B ,B),(B ,C),(C ,A),(C ,B),(C ,C)},其中基本事件的个数为9个,设事件D 为:“他恰好能收集齐这三种样式”,则D ={(B ,C),(C ,B)},其中基本事件的个数为2,所以他恰好能收集齐这三种样式的概率为P(D)=29.(2)补充2×2列联表如下:女生男生总计购买402060未购买7070140总计11090200则K 2=200×(40×70-20×70)260×140×110×90≈4.714.又因为4.714>3.841,故有95%的把握认为“购买该款盲盒与性别有关”.(3)①由数据,求得x -=5,y -=27.由公式求得b ^=(4-5)(25-27)+(5-5)(26-27)+(6-5)(30-27)(4-5)2+(5-5)2+(6-5)2=52,a ^=27-52×5=14.5,所以y 关于x 的线性回归方程为y ^=2.5x +14.5.②当x =1时,y ^=2.5×1+14.5=17,|17-16|<2;当x =3时,y ^=2.5×3+14.5=22,|22-23|<2.所以,①中所得到的线性回归方程是可靠的.。
高考数学一轮复习 第9章 统计、统计案例 第2讲 用样本估计总体学案
第2讲 用样本估计总体板块一 知识梳理·自主学习[必备知识]考点1 用样本的频率分布估计总体分布1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.3.茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.考点2 用样本的数字特征估计总体的数字特征1.众数:一组数据中出现次数最多的数.2.中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.3.平均数:x -=x 1+x 2+…+x n n,反映了一组数据的平均水平. 4.标准差:是样本数据到平均数的一种平均距离,s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]. 5.方差:s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x -是样本平均数).[必会结论]频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[考点自测]1.判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( )(3)一组数据的方差越大,说明这组数据越集中.( )(4)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( )(5)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )答案(1)√(2)×(3)×(4)√(5)×2.[2017·芜湖模拟]某市中心购物商场在“双11”开展的“买三免一”促销活动异常火爆,对当日8时至22时的销售额进行统计,以组距为2小时的频率分布直方图如图所示,已知12时至16时的销售额为90万元,则10时至12时销售额为( )A.120万元 B.100万元 C.80万元 D.60万元答案 D解析由图可知12时至16时频率为0.45,销售额90万元,10时至12时频率为0.3,销售额为0.30.45×90=60万元.故选D.3.如图是2017年某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和众数依次为( )A.85,84 B.84,85 C.86,84 D.84,86答案 A解析 由图可知去掉一个最高分和一个最低分后,所剩数据为84,84,86,84,87,则平均数为85,众数为84.4.[课本改编]在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为( ) A .28 B .40 C .56 D .60答案 B解析 设中间一个小长方形面积为x ,其他8个长方形面积为52x ,因此x +52x =1,∴x =27. 所以中间一组的频数为140×27=40.故选B. 5.[2015·湖北高考]某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 答案 (1)3 (2)6000解析 (1)由0.1×1.5+0.1×2.5+0.1×a +0.1×2.0+0.1×0.8+0.1×0.2=1,解得a =3.(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10000=6000.板块二 典例探究·考向突破考向 频率分布直方图的应用例 1 [2016·山东高考]某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A.56 B.60 C.120 D.140答案 D解析由频率分布直方图知这200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D.触类旁通应用频率分布直方图应注意的问题(1)频率分布直方图是从各个小组数据在样本容量中所占比例大小的角度,表示数据分布的规律.(2)图中各小长方形的面积等于相应各组的频率,它直观反映了数据在各个小组的频率的大小.(3)要把握一个基本公式:频率=频数样本容量.【变式训练1】为了解某校高三学生联考的数学成绩情况,从该校参加联考学生的数学成绩中抽取一个样本,并分成五组,绘成如图所示的频率分布直方图,已知第一组至第五组的频率之比为1∶2∶8∶6∶3,第五组的频数为6,则样本容量为________.答案40解析因为第一组至第五组的频率之比为1∶2∶8∶6∶3,所以可设第一组至第五组的频率分别为k,2k,8k,6k,3k,又频率之和为1,所以k+2k+8k+6k+3k=1,解得k=120=0.05,所以第五组的频率为3×0.05=0.15,又第五组的频数为6,所以样本容量为60.15=40.考向 茎叶图的应用例 2 [2017·山东高考]如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7答案 A解析 甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x )=15×(59+61+67+65+78), ∴x =3.故选A.触类旁通茎叶图的绘制及应用(1)一般制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大顺序由上到下列出.(2)估计数字特征,给定两组数据的茎叶图,“重心”下移者平均数较大,数据集中者方差较小.【变式训练2】 [2018·长沙模拟]下面的茎叶图是某班学生在一次数学测试时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C .女生成绩和男生成绩的中位数分别为82,80D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重答案 C解析15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A正确;17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误.考向数字特征的应用命题角度1 样本数字特征与直方图交汇例 3 [2018·益阳模拟]为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是( )A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5C.该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320D.该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32答案 D解析由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值27.5;1分钟仰卧起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30的人数为320;1分钟仰卧起坐的次数少于20的频率为0.1,所以估计1分钟仰卧起坐的次数少于20的人数为160.故D错.命题角度2 样本的数字特征与茎叶图例 4 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为________.答案 367 解析 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,x =4.s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.命题角度3 样本的数字特征与优化决策问题例 5 某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间的产品较稳定.解 (1)因为间隔时间相同,所以是系统抽样.(2)茎叶图如下:(3)甲车间:平均值:x 1=17(102+101+99+98+103+98+99)=100, 方差:s 21=17[(102-100)2+(101-100)2+…+(99-100)2]=247. 乙车间:平均值:x 2=17(110+115+90+85+75+115+110)=100, 方差:s 22=17[(110-100)2+(115-100)2+…+(110-100)2]=16007. ∵x 1=x 2,s 21<s 22,∴甲车间的产品较稳定.触类旁通(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差)分析稳定情况.(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小.核心规律1.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质.2.众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.3.某些数据的变动对中位数可能没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.满分策略1.正确理解频率分布直方图(1)纵轴表示频率组距,即小长方形的高=频率组距; (2)小长方形的面积=组距×频率组距=频率; (3)数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.2.茎叶图中一定要分清茎、叶的含义.3.求解中位数时一定要注意先对原始数据进行排序后才能求解.板块三 启智培优·破译高考易错警示系列11——频率分布直方图中概念不清致误[2016·四川高考]我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)估计居民月均用水量的中位数.错因分析 (1)在频率分布直方图中,小矩形的面积表示频率,纵坐标表示频率组距,解本题时,易把纵坐标误认为频率而致误.(2)频率分布直方图中中位数左右两边小长方形的面积相等,解本题时由于中位数的概念不清易出错.解 (1)由频率分布直方图,可知:月均用水量在 [0,0.5)的频率为0.08×0.5=0.04. 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a ,解得a =0.30.(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)设中位数为x 吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x <2.5.由0.50×(x -2)=0.5-0.48,解得x =2.04.故可估计居民月均用水量的中位数为2.04.答题启示 条形统计图(直方图)中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.跟踪训练某城市100户居民的月平均用电量(单位:度),以[160, 180),[180, 200),[200, 220),[220, 240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解 (1)依题意,20×(0.002+0.0095+0.011+0.0125+x +0.005+0.0025)=1,解得x =0.0075.(2)由图可知,最高矩形的数据组为[220,240), ∴众数为220+2402=230. ∵[160,220)的频率之和为(0.002+0.0095+0.011)×20=0.45,依题意,设中位数为y ,∴0.45+(y -220)×0.0125=0.5.解得y =224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.01250.0125+0.0075+0.005+0.0025=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5户. 板块四 模拟演练·提能增分[A 级 基础达标]1.[2017·全国卷Ⅰ]为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数答案 B解析 因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.2.[2018·湖南模拟]在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )A .3B .4C .5D .6答案 B解析 由茎叶图可知,在区间[139,151]的人数为20,再由系统抽样的性质可知人数为20×735=4人. 3.[2018·广州联考]学校为了解学生在课外读物方面的支出情况,抽取了n 位同学进行调查,结果显示这些同学的支出都在[10,50)(单位:元),其中支出在[30,50)(单位:元)的同学有67人,其频率分布直方图如图所示,则n的值为( )A.100 B.120 C.130 D.390答案 A解析由图知[10,30)的频率为:(0.023+0.01)×10=0.33,[30,50)的频率为1-0.33=0.67,所以n=670.67=100,故选A.4.[2018·郑州质量预测]PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据某地某日早7点到晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是( )A.甲B.乙C.甲、乙相等D.无法确定答案 A解析从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地浓度的方差较小.5.甲、乙两人在一次射击比赛中射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数 B .甲的成绩的中位数等于乙的成绩的中位数 C .甲的成绩的方差小于乙的成绩的方差 D .甲的成绩的极差小于乙的成绩的极差 答案 C解析 甲的平均数是4+5+6+7+85=6,中位数是6,极差是4,方差是(-2)2+(-1)2+02+12+225=2;乙的平均数是5+5+5+6+95=6,中位数是5,极差是4,方差是(-1)2+(-1)2+(-1)2+02+325=125,故选C.6.[2018·金华模拟]设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( )A .1+a,4B .1+a,4+aC .1,4D .1,4+a答案 A解析 由均值和方差的定义及性质可知:y =x +a =1+a ,s 2y =s 2x =4.故选A. 7.[2015·重庆高考]重庆市2013年各月的平均气温(℃)数据的茎叶图如下:则这组数据的中位数是( ) A .19 B .20 C .21.5 D .23 答案 B解析 由茎叶图知,平均气温在20 ℃以下的有5个月,在20 ℃以上的也有5个月,恰好是20 ℃的有2个月,由中位数的定义知,这组数据的中位数为20.选B.8.[2018·聊城模拟]某校女子篮球队7名运动员身高(单位:厘米)分布的茎叶图如图,已知记录的平均身高为175 cm ,但有一名运动员的身高记录不清楚,其末位数记为x ,那么x 的值为________.答案 2解析 由题意有:175×7=180×2+170×5+1+1+2+x +4+5⇒x =2.9.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲10 8 99 9乙101799.答案 甲解析 x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定.10.某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].则(1)图中的x =________;(2)若上学所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有________名学生可以申请住宿.答案 (1)0.0125 (2)72解析 x 等于该组的频率除以组距20.由频率分布直方图知20x =1-20×(0.025+0.0065+0.003+0.003),解得x =0.0125.上学时间不少于1小时的学生频率为0.12,因此估计有0.12×600=72(名)学生可以申请住宿.[B 级 知能提升]1.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是( )A .35B .48C .60D .75 答案 C解析 设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.0375+0.0125)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =5+15+250.75=60.2.[2015·安徽高考]若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .32 答案 C解析 已知样本数据x 1,x 2,…,x 10的标准差为s =8,则s 2=64,数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16.3.如图所示的茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70~99分),若甲、乙两组学生的平均成绩一样,则a =________;甲、乙两组学生的成绩相对整齐的是________.答案 5 甲组解析 由题意可知75+88+89+98+90+a 5=76+85+89+98+975=89,解得a =5.因为s 2甲=15×(142+1+0+92+62)=3145,s 2乙=15×(132+42+0+92+82)=3305,所以s 2甲<s 2乙,故成绩相对整齐的是甲组.4.[2018·南宁模拟]某班级准备从甲、乙两人中选一人参加某项比赛,已知在一个学期10次考试中,甲、乙两人的成绩(单位:分)的茎叶图如图所示.(1)你认为选派谁参赛更合适?并说明理由;(2)若从甲、乙两人90分以上的成绩中各随机抽取1次,求抽到的2次成绩均大于95分的概率.解 (1)由茎叶图可知,甲的平均成绩, x -甲=79+84+85+87+87+88+93+94+96+9710=89,乙的平均成绩x -乙=75+77+85+88+89+89+95+96+97+9910=89,甲、乙的平均成绩相等.又甲成绩的方差s 2甲=110[(79-89)2+(84-89)2+(85-89)2+(87-89)2+(87-89)2+(88-89)2+(93-89)2+(94-89)2+(96-89)2+(97-89)2]=30.4,乙成绩的方差s 2乙=110[(75-89)2+(77-89)2+(85-89)2+(88-89)2+(89-89)2+(89-89)2+(95-89)2+(96-89)2+(97-89)2+(99-89)2]=60.6,故甲成绩的方差小于乙成绩的方差,因此选派甲参赛更合适.(2)从甲、乙两人90分以上的成绩中各随机抽取1次的不同结果有(93,95),(93,96),(93,97),(93,99),(94,95),(94,96),(94,97),(94,99),(96,95),(96,96),(96,97),(96,99),(97,95),(97,96),(97,97),(97,99),共16种.记“抽到的2次成绩均大于95分”为事件A ,则事件A 的结果有(96,96),(96,97),(96,99),(97,96),(97,97),(97,99),共6种.因此抽到的2次成绩均大于95分的概率P (A )=616=38.5.[2017·云南统一检测]某校1200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:成绩分组 频数 频率 平均分 [0,20)30.0116(1)求(2)如果从这1200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解 (1)由题意可得,b =1-(0.015+0.125+0.5+0.31)=0.05,a =200×0.05=10,c =200×0.5=100.(2)根据已知,在抽出的200人的数学成绩中,及格的有162人. ∴P =162200=81100=0.81.(3)这次数学测验样本的平均分为x -=16×3+32.1×10+55×25+74×100+88×62200=73,∴这次数学测验的年级平均分大约为73分.。
2022届高考数学统考一轮复习第9章统计与统计案例第2节用样本估计总体教师用书教案理新人教版2021
用样本估计总体[考试要求] 1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.常用统计图表(1)作频率分布直方图的步骤:①求极差(即一组数据中最大值与最小值的差).②决定组距与组数.③将数据分组.④列频率分布表.⑤画频率分布直方图.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本数据落在该组内的频率.各小矩形的面积和为1.(3)频率分布折线图和总体密度曲线①频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(4)茎叶图的画法步骤:第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的右(左)侧.2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把x=x1+x2+…+x nn称为x1,x2,…,x n这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,x n的平均数为x,则这组数据的标准差和方差分别是s=1n[x1-x2+x2-x2+…+x n-x2];s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].[常用结论]1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mx n +a的平均数是m x+a.(2)数据x1,x2,…,x n的方差为s2.①数据x1+a,x2+a,…,x n+a的方差也为s2;②数据ax1,ax2,…,ax n的方差为a2s2.一、易错易误辨析(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(2)一组数据的方差越大,说明这组数据越集中.( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )[答案](1)√(2)×(3)√(4)×二、教材习题衍生1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( ) A.4 B.8 C.12 D.16B[设频数为n,则n32=0.25,∴n=32×0.25=8.]2.若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是( )A.91.5和91.5 B.91.5和92C.91和91.5 D.92和92A [∵这组数据为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5, 平均数x =87+89+90+91+92+93+94+968=91.5.] 3.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)X 围内的居民有人.25[0.5×0.5×100=25.]考点一 样本的数字特征的计算与应用利用样本的数字特征解决决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)方差的简化计算公式:s 2=1n [(x 21+x 22+…+x 2n )-n x 2],或写成s 2=1n (x 21+x 22+…+x 2n )-x 2,即方差等于原数据平方的平均数减去平均数的平方.这8个数的平均数为x ,方差为s 2,则( )A .x =4,s 2<2B .x =4,s 2>2C .x >4,s 2<2D .x >4,s 2>2A [∵某7个数的平均数为4,∴这7个数的和为4×7=28,∵加入一个新数据4,∴x =28+48=4.又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+4-428=74<2,故选A .] 2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )甲 乙A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差C [根据条形统计图可知甲的中靶情况为4环、5环、6环、7环、8环;乙的中靶情况为5环、5环、5环、6环、9环.x 甲=15(4+5+6+7+8)=6,x 乙=15(5×3+6+9)=6,甲的成绩的方差为4-62+5-62+6-62+7-62+8-625=2,乙的成绩的方差为5-62×3+6-62+9-625=2.4;甲的成绩的极差为4环,乙的成绩的极差为4环;甲的成绩的中位数为6环,乙的成绩的中位数为5环,综上可知C 正确,故选C .]3.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为( )A .1B .2C .3D .4D [由题意可知⎩⎪⎨⎪⎧ 15x +y +10+11+9=10,15[x -102+y -102+1+1]=2,∴⎩⎪⎨⎪⎧x +y =20,x 2+y 2=208. ∴(x +y )2=x 2+y 2+2xy ,即208+2xy =400,∴xy =96.∴(x -y )2=x 2+y 2-2xy =16,∴|x -y |=4,故选D .]4.(2020·全国卷Ⅰ)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A ,B ,C ,D 四个等级.加工业务约定:对于A 级品、B 级品、C 级品,厂家每件分别收取加工费90元,50元,20元;对于D 级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级 AB C D 频数40 20 20 20等级 AB C D 频数28 17 34 21 (1)(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?[解](1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A 级品的概率的估计值为40100=0.4; 乙分厂加工出来的一件产品为A 级品的概率的估计值为28100=0.28. (2)由数据知甲分厂加工出来的100件产品利润的频数分布表为利润 6525 -5 -75 频数 40 20 20 20因此甲分厂加工出来的100件产品的平均利润为65×40+25×20-5×20-75×20100=15. 由数据知乙分厂加工出来的100件产品利润的频数分布表为利润 730 0 -70 频数 28 17 34 21因此乙分厂加工出来的70×28+30×17+0×34-70×21100=10. 比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.考点二 茎叶图1.茎叶图的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.注意“叶”中数不一定按大小次数排列.2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息.3.以茎叶图为载体,一般考查中位数、平均数、方差.1.(2020·某某模拟)中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成绩,按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为( )A .2B .4C .5D .6A [由茎叶图可得,获“诗词达人”称号的有8人,据该次比赛的成绩按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为8×1040=2(人).] 2.(2020·某某质检)为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,则甲地该月11时的平均气温的标准差为( )A .2B . 2C .10D .10B [甲地该月5天11时的气温数据(单位:℃)为28,29,30,30+m,32;乙地该月5天11时的气温数据(单位:℃)为26,28,29,31,31,则乙地该月11时的平均气温为(26+28+29+31+31)÷5=29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m +32)÷5=30,解得m =1.则甲地该月11时的平均气温的标准差为15×[28-302+29-302+30-302+31-302+32-302]= 2.] 3.空气质量指数 (Air Qualit y Inde x ,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI 记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI 大于100的天数约为(该年为365天).146[该样本中AQI 大于100的频数是4,频率为25, 由此估计该地全年AQI 大于100的频率为25, 估计此地该年AQI 大于100的天数约为365×25=146.] 考点三 频率分布直方图频率、频数、样本容量的计算方法(1)频率组距×组距=频率. (2)频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是( )A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5C.该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320D.该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32(2)(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图:甲离子残留百分比直方图乙离子残留百分比直方图记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.①求乙离子残留百分比直方图中a ,b 的值;②分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).(1)D [由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值27.5;1分钟仰卧起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30的人数为320;1分钟仰卧起坐的次数少于20的频率为0.1,所以估计1分钟仰卧起坐的次数少于20的人数为160.故选D .](2)[解]①由已知得0.70=a +0.20+0.15,故a =0.35.b =1-0.05-0.15-0.70=0.10.②甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.点评:(1)频率分布直方图的纵坐标是频率组距,而不是频率,切莫与条形图混淆. (2)频率分布直方图考查时,重视求平均数、中位数、方差,计算要准确,解决突破口是各个矩形面积之和为1.[跟进训练]1.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a ,最大频率为0.32,则a 的值为( )A.64 B.54 C.48 D.27B[前两组中的频数为100×(0.05+0.11)=16.因为后五组频数和为62,所以前三组为38.所以第三组频数为22.又最大频率为0.32,对应的最大频数为0.32×100=32.所以a=22+32=54.]2.(2020·某某模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.(1)求x;(2)求抽取的x人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.[解](1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x=0.05,∴x =120. (2)设中位数为a ,则0.01×5+0.07×5+(a -30)×0.06=0.5,∴a =953≈32,则中位数为32. (3)(ⅰ)5个年龄组成绩的平均数为x 1=15×(93+96+97+94+90)=94,方差为s 21=15×[(-1)2+22+32+02+(-4)2]=6.5个职业组成绩的平均数为x 2=15×(93+98+94+95+90)=94,方差为s 22=15×[(-1)2+42+02+12+(-4)2]=6.8.(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).。
2021高考数学一轮复习第九章统计与统计案例第2节用样本估计总体课件
答案:C
2021高考数学一轮复习第九章统计与统计案 例第2节用样本估计总体课件
23
2021/4/17
3.《中国诗词大会》的播出引发了全民
的读书热,某小学语文老师在班里开展了
一次诗词默写比赛,班里 40 名学生得分数
据的茎叶图如图所示.若规定得分不小于
85 分的学生得到“诗词达人”的称号,小于 85 分且不小
2021/4/17
2021高考数学一轮复习第九章统计与统计案 例第2节用样本估计总体课件
13
解析:这组数据由小到大排列为 87,89,90,91,
92,93,94,96,
所以中位数是91+2 92=91.5,
平
均
数
-x
=
87+89+90+91+92+93+94+96 8
=
91.5.
答案:A
2021/4/17
2021高考数学一轮复习第九章统计与统计案 例第2节用样本估计总体课件
10
解析:(1)平均数、众数与中位数都在一定程度上反 映了数据的集中趋势.
(2)方差越大,这组数据越离散. 频率
(3)小矩形的面积=组距×组距=频率. (4)茎相同的数据,叶可不用按从小到大的顺序写, 相同的数据要重复记录,故(4)错误. 答案:(1)√ (2)× (3)√ (4)×
据集中者方差较小.
2.利用茎叶图解题的关键是抓住“叶”的分布特征, 准确从中提炼信息.
2021高考数学一轮复习第九章统计与统计案 例第2节用样本估计总体课件
26
考点 2 频率分布直方图(讲练互动) [典例] (2019·全国卷Ⅲ)为了解甲、乙两种离子在小 鼠体内的残留程度,进行如下试验:将 200 只小鼠随机分 成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲离子 溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体 积相同、摩尔浓度相同.经过一段时间后用某种科学方法 测算出残留在小鼠体内离子的百分比.根据试验数据分别 得到如下直方图:
2021高考数学(江苏专用)一轮复习学案:第九章 9.1 随机抽样、用样本估计总体 (含解析)
§9.1随机抽样、用样本估计总体1.随机抽样(1)简单随机抽样①定义:一般地,从个体数为N的总体中逐个不放回地取出n个个体作为样本(n<N),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样.②最常用的简单随机抽样方法有两种——抽签法和随机数表法.(2)分层抽样①定义:一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样,所分成的各个部分称为“层”.②分层抽样的应用范围:当总体由差异明显的几个部分组成时,往往选用分层抽样的方法.2.用样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.(2)①频率分布折线图:如果将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,那么就得到频率分布折线图.②总体分布的密度曲线:如果将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.3.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =x 1+x 2+…+x nn,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s =(5)方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数).概念方法微思考1.简单随机抽样和分层抽样有什么共同点和联系? 提示 (1)抽样过程中每个个体被抽取的机会相等. (2)分层抽样中各层抽样时采用简单随机抽样. 2.平均数、标准差与方差反映了数据的哪些特征?提示 平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.题组一 思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( × ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) 题组二 教材改编2.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( ) A .33,34,33 B .25,56,19 C .20,40,30 D .30,50,20答案 B解析 设在不到35岁的员工抽取x 人,则100500=x125,所以x =25,同理可得这三个年龄段抽取人数分别为25,56,19.3.如图是100位居民月均用水量的频率分布直方图,则月均用水量在[2,2.5)范围内的居民有______人.答案25解析0.5×0.5×100=25.题组三易错自纠4.(多选)下表是某电器销售公司2019年度各类电器营业收入占比和净利润占比统计表:则下列判断中正确的是()A.该公司2019年度冰箱类电器销售亏损B.该公司2019年度小家电类电器营业收入和净利润相同C.该公司2019年度净利润主要由空调类电器销售提供D.剔除冰箱类电器销售数据后,该公司2019年度空调类电器销售净利润占比将会降低答案ACD解析根据表中数据知,该公司2019年度冰箱类电器销售净利润占比为-0.48%,是亏损的,A正确;小家电类电器营业收入占比和净利润占比是相同的,但收入与净利润不一定相同,B错误;该公司2019年度空调类电器净利润占比为95.80%,是主要利润来源,C正确;所以剔除冰箱类电器销售数据后,该公司2019年度空调类电器销售净利润占比将会降低,D正确.故选ACD.5.(2020·惠州调研)某高校调查了320名学生每周的自习时间(单位:小时)制成了下图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20],(20,22.5],(22.5,25],(25,27.5],(27.5,30].根据频率分布直方图,这320名学生中每周的自习时间不足22.5小时的人数是()A.70 B.72 C.248 D.200答案 B解析由频率分布直方图可得,320名学生中每周的自习时间不足22.5小时的人数是320×(0.02+0.07)×2.5=72(人).故选B.6.若数据x1,x2,x3,…,x n的平均数x=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3x n+1的平均数和方差分别为________.答案16,18解析∵x1,x2,x3,…,x n的平均数为5,∴x1+x2+x3+…+x nn=5,∴3x1+3x2+3x3+…+3x nn+1=3×5+1=16,∵x1,x2,x3,…,x n的方差为2,∴3x1+1,3x2+1,3x3+1,…,3x n+1的方差是32×2=18.抽样方法1.用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( ) A.110,110 B.310,15 C.15,310 D.310,310答案 A解析 方法一 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110.故选A.方法二 第一次被抽到,显然为110;第二次被抽到,首先第一次不能被抽到,第二次抽才被抽到.可能性为910·19=110.故选A.2.某校要从高一、高二、高三共2 012名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2 012名学生中剔除12名,再从剩下的2 000名学生中按分层抽样的方法抽取50名,则下面对每名学生入选的概率描述正确的是________.(填序号) ①都相等且为502 012;②都相等且为140;③不完全相等.答案 ①解析 根据分层抽样的定义可得,每个个体被抽到的概率都等于502 012.3.(2019·安徽毛坦厂中学模拟)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种,10种,30种,20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是________. 答案 6解析 本题主要考查对分层抽样的理解.抽样比为2040+10+30+20=15,则抽取的植物油类种数是10×15=2,抽取的果蔬类食品种数是20×15=4,所以抽取的植物油类与果蔬类食品种数之和是2+4=6.思维升华 (1)简单随机抽样是分层抽样的基础,是一种等概率的抽样,由定义应抓住以下特点:①它要求总体个数较少;②它是从总体中逐个抽取的;③它是一种不放回抽样.(2)分层抽样适用于总体中个体差异较大的情况.统计图表及应用命题点1 扇形图例1 (2018·全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下扇形图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案 A解析设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:故选A.命题点2折线图例2(2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案 A解析对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A.命题点3频率分布直方图例3(2019·南昌调研)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图.(1)直方图中x 的值为________;(2)在这些用户中,月用电量落在区间[100,250)内的户数为________. 答案 (1)0.004 4 (2)70解析 (1)由频率分布直方图知数据落在[200,250)内的频率为1-(0.002 4+0.003 6+0.006 0+0.002 4+0.001 2)×50=0.22,于是x =0.2250=0.004 4.(2)因为数据落在[100,250)内的频率为(0.003 6+0.006 0+0.004 4)×50=0.7,所以所求户数为0.7×100=70.思维升华 (1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系. (2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)准确理解频率分布直方图的数据特点:①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.跟踪训练1 (1)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.200,20 B.100,20C.200,10 D.100,10答案 A解析由图①得样本容量为(3 500+2 000+4 500)×2%=10 000×2%=200,抽取的高中生人数为2 000×2%=40(人),则近视人数为40×0.5=20(人),故选A.(2)(多选)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高.如图是2017年9月到2018年2月这半年来,某个关键词的搜索指数变化的统计图.根据该统计图判断,下列结论不正确的是()A.这半年来,网民对该关键词相关的信息关注度呈周期性变化B.这半年来,网民对该关键词相关的信息关注度不断减弱C.从该关键词的搜索指数来看,2017年10月的方差小于11月的方差D.从该关键词的搜索指数来看,2017年12月的平均值大于2018年1月的平均值答案ABC解析由统计图可知,这半年来,该关键词的搜索指数变化的周期性并不显著,A项错误;由统计图可知,这半年来,该关键词的搜索指数的整体减弱趋势不显著,B项错误;由统计图可知,2017年10月该关键词的搜索指数波动较大,11月的波动较小,所以2017年10月的方差大于11月的方差,C项错误;由统计图可知,2017年12月该关键词的搜索指数大多高于10 000,该月平均值大于10 000,2018年1月该关键词的搜索指数大多低于10 000,该月平均值小于10 000,D项正确,故选ABC.(3)(2019·昆明模拟)为了解学生“阳光体育”活动的情况,随机统计了n名学生的“阳光体育”活动时间(单位:分钟),所得数据都在区间[10,110]内,其频率分布直方图如图所示.已知活动时间在[10,35)内的频数为80,则n的值为()A.700 B.800 C.850 D.900答案 B解析根据频率分布直方图,知组距为25,所以活动时间在[10,35)内的频率为0.1,因为活动时间在[10,35)内的频数为80,所以n=800.1=800.用样本的数字特征估计总体的数字特征1.(2019·全国Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案 A解析记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.2.某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分情况如图所示,假设得分值的中位数为m e,平均数为x,众数为m0,则()A.m e=m0=x B.m e=m0<xC .m e <m 0<xD .m 0<m e <x答案 D解析 由图知m 0=5.由中位数的定义知应该是第15个数与第16个数的平均值,由图知将数据从小到大排,第15个数是5,第16个数是6,所以m e =5+62=5.5.x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230≈5.97>5.5, 所以m 0<m e <x .3.(2019·全国Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________. 答案 0.98解析 经停该站高铁列车所有车次的平均正点率的估计值为10×0.97+20×0.98+10×0.9910+20+10=0.98.4.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):如果甲、乙两人中只有1人入选,则入选的最佳人选应是________. 答案 甲解析 由题意可得x 甲=x 乙=9,又∵s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25, s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,∴甲更稳定,故最佳人选应是甲.思维升华 (1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值.实际应用时,需先计算样本数据的平均数,分析平均水平,再计算方差(标准差)分析稳定情况.(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小.1.为确保食品安全,某市质检部门检查了1 000袋方便面的质量,抽查总量的2%,在这个问题中,下列说法正确的是()A.总体是指这1 000袋方便面B.个体是1袋方便面C.样本是按2%抽取的20袋方便面D.样本容量为20答案 D解析总体是指这1 000袋方便面的质量,A中说法错误;个体是指1袋方便面的质量,B 中说法错误;样本是指按照2%抽取的20袋方便面的质量,C中说法错误;样本容量为20,D中说法正确.2.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A .100B .150C .200D .250 答案 A解析 方法一 由题意可得70n -70=3 5001 500,解得n =100.方法二 由题意,得抽样比为703 500=150,总体容量为3 500+1 500=5 000,故n =5 000×150=100.3.(2020·镇江模拟)如图为某省高考数学(理)卷近三年难易程度的对比图(图中数据为分值).根据对比图,给出正面三个结论:①近三年容易题分值逐年增加;②近三年中档题分值所占比例最高的年份是2017年;③2018年的容易题与中档题的分值之和占总分的90%以上.其中正确结论的个数为( )A .0B .1C .2D .3 答案 C解析 根据对比图得,2016年,2017年,2018年容易题分值分别为40,55,96,逐年增加,①正确;近三年中档题分值所占比例最高的年份是2016年,②错误;2018年的容易题与中档题的分值之和为96+42=138,138150=0.92>90%,③正确.故选C.4.(2019·全国Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( ) A .0.5 B .0.6 C .0.7 D .0.8 答案 C解析 根据题意阅读过《红楼梦》《西游记》的人数用韦恩图表示如下:所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为70100=0.7.5.高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为:x ,y,105,109,110.已知该同学五次数学成绩数据的平均数为108,方差为35.2,则|x -y |的值为( ) A .15 B .16 C .17 D .18答案 D解析 由题意得,x +y +105+109+1105=108,①(x -108)2+(y -108)2+9+1+45=35.2,②由①②解得⎩⎪⎨⎪⎧ x =99,y =117或⎩⎪⎨⎪⎧x =117,y =99,所以|x -y |=18.故选D.6.若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则2x 1+3,2x 2+3,…,2x n +3的平均数和方差分别为( ) A.x 和s 2 B .2x +3和4s 2 C .2x +3和s 2 D .2x +3和4s 2+12s +9答案 B解析 方法一 平均数为1n (2x 1+3+2x 2+3+…+2x n +3)=1n [2(x 1+x 2+…+x n )+3n ]=2x +3;方差为1n {[(2x 1+3)-(2x +3)]2+[(2x 2+3)-(2x +3)]2+…+[(2x n +3)-(2x +3)]2}=1n[4(x1-x)2+4(x2-x)2+…+4(x n-x)2]=4s2.方法二原数据乘以2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数和方差分别是2x+3和4s2.7.(多选)(2020·山东模拟)下图为某地区2006年~2018年地方财政预算内收入、城乡居民储蓄年末余额折线图.根据该折线图可知,该地区2006年~2018年()A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势B.财政预算内收入、城乡居民储蓄年末余额的逐年增长速度相同C.财政预算内收入年平均增长量高于城乡居民储蓄年末余额年平均增长量D.城乡居民储蓄年末余额与财政预算内收入的差额逐年增大答案AD解析由图可以看出两条曲线均在上升,选项A正确;图中两曲线间隔越来越大,说明年增长速度不同,差额逐年增大,选项B错误,选项D正确;又从图中可以看出财政预算内收入年平均增长量应该小于城乡居民储蓄年末余额年平均增长量,选项C错误.故选AD. 8.(多选)(2020·广东华附、省实、广雅、深中四校联考)随着人民生活水平的提高,对城市空气质量的关注度也逐步增大,下图是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格天气,下面四种说法正确的是()A .1月至8月空气合格天数超过20天的月份有5个B .第二季度与第一季度相比,空气合格天数的比重下降了C .8月是空气质量最好的一个月D .6月的空气质量最差 答案 ABC解析 1月至8月空气合格天数超过20天的月份有:1月,2月,6月,7月,8月,共5个,所以A 是正确的;第一季度合格天数的比重为22+26+1931+29+31≈0.736 3,第二季度合格天数的比重为19+13+2530+31+30≈0.626 4,所以第二季度与第一季度相比,空气质量合格的天数的比重下降了,所以B 是正确的;8月空气质量合格天气达到30天,是空气质量最好的一个月,所以C 是正确的;5月空气质量合格天气只有13天,5月份的空气质量最差,所以D 是错误的,故选ABC.9.(2019·江苏)已知一组数据6,7,8,8,9,10,则该组数据的方差是________. 答案 53解析 数据6,7,8,8,9,10的平均数是6+7+8+8+9+106=8,则方差是4+1+0+0+1+46=53.10.为了了解一批产品的长度(单位:毫米)情况,现抽取容量为400的样本进行检测,如图是检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则样本中三等品的件数为________.答案 100解析 由题意得,三等品的长度在区间[10,15),[15,20)和[35,40]内,根据频率分布直方图可得三等品的频率为(0.012 5+0.025 0+0.012 5)×5=0.25, ∴样本中三等品的件数为400×0.25=100.11.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):如果甲、乙两人中只有1人入选,则入选的最佳人选应是________. 答案 甲解析 由题意可得x 甲=x 乙=9,又∵s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25, s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,∴甲更稳定,故最佳人选应是甲.12.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________. 答案 10解析 设5个班级中参加的人数分别为x 1,x 2,x 3,x 4,x 5,则由题意知x 1+x 2+x 3+x 4+x 55=7,(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20,五个整数的平方和为20,则必为0+1+1+9+9=20,由|x-7|=3可得x=10或x=4.由|x-7|=1可得x=8或x=6.由上可知参加的人数分别为4,6,7,8,10,故最大值为10.13.(2019·榆林模拟)为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2017年1月至2018年7月的调查数据得出的中国仓储指数,绘制出如下折线图.根据该折线图,下列结论正确的是()A.2017年各月的仓储指数最大值是在3月份B.2018年1月至7月的仓储指数的中位数为55C.2018年1月与4月的仓储指数的平均数为52D.2017年1月至4月的仓储指数相对于2018年1月至4月,波动性更大答案 D解析2017年各月的仓储指数最大值是在11月份,所以A错误;由图可知,2018年1月至7月的仓储指数的中位数约为53,所以B错误;2018年1月与4月的仓储指数的平均数为51+552=53,所以C错误;由图可知,2017年1月至4月的仓储指数比2018年1月至4月的仓储指数波动更大,故选D.14.(多选)“微信运动”是腾讯开发的一个记录跑步或行走情况(步数里程)的公众号,用户通过该公众号可查看自己某时间段的运动情况.某人根据2018年1月至2018年11月期间每月跑步的里程(单位:十公里)的数据绘制了下面的折线图.根据该折线图,下列结论正确的是()A.月跑步里程逐月增加B.月跑步里程最大值出现在10月C.月跑步里程的中位数为5月份对应的里程数D.1月至5月的月跑步里程相对于6月至11月波动性更小,变化比较平稳答案BCD解析在A中,2月跑步里程比1月的小,8月跑步里程比7月的小,11月跑步里程比10月的小,故A错误;在B中,月跑步里程10月最大,故B正确;在C中,月跑步里程高峰期大致在9,10月,从小到大依次为2月、8月、3月、4月、1月、5月、7月、6月、11月、9月、10月,故C正确;在D中,1月至5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳,故D正确.故选BCD.15.气象意义上从春季进入夏季的标志为:连续5天每天日平均温度不低于22 ℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数,单位:℃).①甲地:5个数据的中位数为24,众数为22;②乙地:5个数据的中位数为27,平均数为24;③丙地:5个数据中有一个数据是32,平均数为26,方差为10.2.则肯定进入夏季的地区有________个.答案 2解析甲地肯定进入夏季,因为众数为22,所以22 ℃至少出现两次,若有一天低于22 ℃,则中位数不可能为24;丙地肯定进入,10.2×5-(32-26)2≥(26-x)2,所以15≥(26-x)2,若x≤22不成立;乙地不一定进入,如13,23,27,28,29,故答案为2.16.共享单车入驻某市一周年以来,因其“绿色出行,低碳环保”的理念而备受人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等三个方面的信息,在全市范围内发放5 000份调查问卷,回收到有效问卷3 125份,现从中随机抽取80份,分别对使用者的年龄段、26~35岁使用者的使用频率、26~35岁使用者的满意度进行汇总,得到如下三个表格:表(一)表(二)表(三)(1)依据上述表格完成下列三个统计图:(2)某城区现有常住人口30万,请用样本估计总体的思想,试估计年龄在26岁~35岁之间,每月使用共享单车在7~14次的人数.解(1)(2)由表(一)可知:年龄在26岁~35岁之间的有40人,占总抽取人数的一半,用样本估计总体的思想可知,某城区30万人口中年龄在26岁~35岁之间的约有30×12=15(万人);又年龄在26岁~35岁之间每月使用共享单车在7~14次之间的有10人,占总抽取人数的14,用样本估计总体的思想可知,城区年龄在26岁~35岁之间每月使用共享单车在7~14次之间的约有15×14=154(万人),所以年龄在26岁~35岁之间,每月使用共享单车在7~14次之间的人数约为154万人.。
(江苏专用)高考数学总复习 第九章第3课时 用样本估计总体课件
4.甲、乙两人比赛射击,两人所得的平 均环数相同,其中甲所得环数的方差为5. 乙所得环数如下:5、6、9、10、5,那 么这两人中成绩较稳定的是________.
解析:-x =5+6+95+10+5=7. s2乙=15[(5-7)2+(6-7)2+(9-7)2+ (10-7)2+(5-7)2]=4.4. ∵s2甲>s2乙,∴乙的成绩较稳定. 答案:乙
2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直 方图中各小长方形上端的_中__点___,就 得频率分布折线图.
(2)总体密度曲线:随着__样__本__容__量__的 增加,作图时_所__分__的__组__数___增加, _组__距__减小,相应的频率分布折线图会 越来越接近于_一__条__光__滑__曲__线____,即总 体密度曲线.
第九章 统计与算法初步
第3课时 用样本估计总体
回归教材•夯实双基
基础梳理 1.作频率分布直方图的步骤 (1)求极差(即一组数据中_最__大__值__与 _最__小__值__的差).
(2)确定_组__距__与__组__数__. (3)将数据__分__组___. (4)列__频__率__分__布__表__. (5)画__频__率__分__布__直__方__图___.
用 C 表示“选出的两名同学的植树总棵 数为 19”这一事件,则 C 中的结果有 4 个,它们是:(A1,B4),(A2,B4),(A3, B2),(A4,B2).故所求概率为 P(C)=146 =14.
【规律小结】 1.茎叶图适用的原则 样本数据较少时,效果较好.样本数据 较多时,枝叶会很长不方便记录,此方 法不实用. 2.茎叶图的优点 (1)能够保留原始数据; (2)展示数据的分布情况.
高考数学一轮复习 第九章 统计与统计案例 9.1 随机抽样教学案 苏教版-苏教版高三全册数学教学案
第九章统计与统计案例全国卷五年考情图解高考命题规律把握1.考查形式高考在本章一般命制1~2道小题或者1道解答题,分值占5~22分.2.考查内容统计与统计案例的命题以一道小题或一道大题的形式考查,难度中等.主要以生活中的实际问题为背景,考查随机抽样与样本估计总体、线性回归方程的求解与运用、独立性检验问题.3.备考策略从2019年高考试题可以看出,统计与概率、随机变量及其分布的综合特点明显.对回归分析的考查越来越注重.第一节随机抽样[最新考纲] 1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本.3.了解分层抽样和系统抽样方法.4.会用随机抽样的基本方法解决一些简单的实际问题.1.简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.2.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围当总体由差异明显的几个部分组成时,往往选用分层抽样.[常用结论]1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.一、思考辨析(正确的打“√〞,错误的打“×〞)(1)简单随机抽样中每个个体被抽到的机会不一样,与先后有关.( )(2)简单随机抽样是一种不放回抽样.( )(3)在抽签法中,先抽的人抽中的可能性大.( )(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( ) [答案](1)×(2)√(3)×(4)×二、教材改编1.在“世界读书日〞前夕,为了了解某地 5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( ) A.总体B.个体C.样本的容量D.从总体中抽取的一个样本A[由题目条件知,5 000名居民的阅读时间的全体是总体;其中1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.]2.某学校为了了解高中一年级、二年级、三年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,那么最合理的抽样方法是( )A.抽签法B.随机抽样C.分层抽样法D.随机数法C[总体由差异明显的几部分组成,故最合理的抽样方法是分层抽样法.应选C.]3.利用简单随机抽样从含有8个个体的总体中抽取一个容量为4的样本,那么总体中每个个体被抽到的概率是.1 2[总体个数为N=8,样本容量为M=4,那么每一个个体被抽到的概率为P=MN=48=12.]4.以下抽样试验中,适合用抽签法的是( )A.从某厂生产的5 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5 000件产品中抽取10件进行质量检验B[因为A,D中总体的个体数较大,不适合用抽签法;C中甲、乙两厂生产的产品质量可能差别较大,因此未达到搅拌均匀的条件,也不适合用抽签法;B中总体容量和样本容量都较小,且同厂生产的产品可视为搅拌均匀了.应选B.]考点1 简单随机抽样(1)简单随机抽样需满足:①被抽取样本的总体的个体数有限;②逐个抽取;③是不放回抽取;④是等可能抽取.(2)简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).1.以下抽取样本的方式属于简单随机抽样的个数为( )①从无限多个个体中抽取100个个体作为样本;②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③从20件玩具中一次性抽取3件进行质量检验;④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A.0 B.1 C.2 D.3A[①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样,因为它是有放回抽样;③不是简单随机抽样,因为这是“一次性〞抽取,而不是“逐个〞抽取;④不是简单随机抽样,因为不是等可能抽样.应选A.]2.总体由编号为01,02,03,…,49,50的50个个体组成,利用随机数表(以下选取了随机数表中的第1行和第2行)选取5个个体,选取方法是从随机数表第1行的第9列和第10列数字开始由左向右读取,那么选出来的第4个个体的编号为( )66 67 40 67 14 64 05 71 95 86 11 05 65 09 68 76 83 20 37 9057 16 00 11 66 14 90 84 45 11 75 73 88 05 90 52 83 20 37 90A .05B .09C .11D .20B [从随机数表第1行的第9列和第10列数字开始由左向右读取,符合条件的编号有14,05,11,05,09,因为05出现了两次,所以选出来的第4个个体的编号为09.应选B.]3.利用简单随机抽样,从n 个个体中抽取一个容量为10的样本.假设第二次抽取时,余下的每个个体被抽到的概率为13,那么在整个抽样过程中,每个个体被抽到的概率为( ) A.14B.13C.514D.1027C [根据题意得,9n -1=13,解得n =28.故每个个体被抽到的概率为1028=514.] 应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,将超过总体号码或出现重复号码的数字舍去.考点2 分层抽样分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.(1)(2018·全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,那么最合适的抽样方法是 .(2)(2019·洛阳一模)某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,那么样本容量和抽取的高中生近视人数分别为( )图甲 图乙A .100,10B .100,20C .200,10D .200,20(1)分层抽样 (2)D [(1)因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.(2)由题得样本容量为(3 500+2 000+4 500)×2%=10 000×2%=200,抽取的高中生人数为2 000×2%=40人,那么近视人数为40×0.5=20人,应选D.]进行分层抽样的相关计算时,常用到的两个关系(1)抽样比=样本容量n 总体的个体数N =该层抽取的个体数该层的个体数. (2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.[教师备选例题]1.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,那么该样本中的老年教师人数为( ) 类别人数 老年教师 900中年教师 1 800青年教师 1 600合计4 300 A.90C .180D .300C [设该样本中的老年教师人数为x ,由题意及分层抽样的特点得x 900=320 1 600,故x =180.应选C.]2.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.假设样本中有50件产品由甲设备生产,那么乙设备生产的产品总数为 件.1 800 [由题设,抽样比为804 800=160.设甲设备生产的产品总数为x 件,那么x 60=50,所以x =3 000.故乙设备生产的产品总数为4 800-3 000=1 800.] 1.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N ,其中甲社区有驾驶员96人.假设在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,那么这四个社区驾驶员的总人数N 为( )A .101B .808C .1 212D .2 012B [甲社区每个个体被抽取的概率为1296=18,样本容量为12+21+25+43=101,所以四个社区中驾驶员的总人数N =10118=808.] 2.为了了解高一、高二、高三学生的身体状况,现用分层抽样的方法抽取一个容量为1 200的样本,三个年级学生人数之比依次为k ∶5∶3,高一年级共抽取了240人,那么高三年级抽取的人数为 .360 [因为高一年级抽取学生的比例为2401 200=15,所以k k +5+3=15,解得k =2,故高三年级抽取的人数为1 200×32+5+3=360.]。
(山东专用)2021新高考数学一轮复习 第九章 统计、统计案例 9.2 用样本估计总体学案(含解析)
第二节用样本估计总体课标要求考情分析1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(平均数、标准差),并给出合理解释.4.会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.1.本节是用样本估计总体,是统计学的基础,以考查频率分布直方图、茎叶图、平均数、方差、标准差为主,同时考查对样本估计总体的思想的理解.2.本节在高考题中主要是以选择题和填空题为主,属于中低档题目.知识点一用样本的频率分布估计总体分布1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.知识点二用样本的数字特征估计总体的数字特征1.众数、中位数、平均数数字特征概念优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使它无法客观地反映总体特征中位数把一组数据按从小到大顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n个数据x1,x2,…,x n,那么这n个数的平均数x=x1+x2+…+x nn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低(1)标准差是样本数据到平均数的一种平均距离. (2)标准差:s =1n[x 1-x2+x 2-x2+…+x n -x2].(3)方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数).平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,则mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)若数据x 1,x 2,…,x n 的方差为s 2,则数据ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2.1.思考辨析判断下列结论正误(在括号内打“√”或“×”)(1)在频率分布直方图中,小矩形的高表示频率.( × ) (2)频率分布直方图中各个长方形的面积之和为1.( √ )(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( × ) (4)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (5)一组数据的方差越大,说明这组数据的波动越大.( √ ) 2.小题热身(1)某便利店记录了100天某商品的日需求量(单位:件),整理得下表:日需求量n /件14 15 16 18 20 频率0.10.20.30.20.2A .16件B .16.2件C .16.6件D .16.8件(2)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是( A )A.91.5和91.5 B.91.5和92C.91和91.5 D.92和92(3)某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检测后所作的频率分布直方图,则从图中可以看出被处罚的汽车大约有( B )A.30辆B.40辆C.60辆D.80辆(4)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( B ) A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数(5)从某选手的7个得分中去掉1个最高分,去掉1个最低分后,剩余5个得分的平均数为91分,如图所示是该选手得分的茎叶图,其中有一个数字模糊,无法辨认,在图中用x 表示,则剩余5个得分的方差为6.解析:(1)由题意可知,日平均需求量为14×0.1+15×0.2+16×0.3+18×0.2+20×0.2=16.8(件).(2)这组数据由小到大排列为87,89,90,91,92,93,94,96, ∴中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.(3)从频率分布直方图知,车速大于或等于70 km/h 的频率为0.02×10=0.2.由于样本容量为200,故“超速”被罚的汽车约有200×0.2=40(辆).(4)标准差能反映一组数据的稳定程度.故选B.(5)去掉一个最高分99分,一个最低分87分,剩余的得分为93分,90分,(90+x )分,91分,87分,则93+90+90+x +91+875=91,解得x =4,所以这5个数的方差s 2=15[(91-93)2+(91-90)2+(91-94)2+(91-91)2+(91-87)2]=6.考点一 统计图表的应用命题方向1 频率分布直方图的应用【例1】 (2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.命题方向2 各种图表的比较【例2】(1)某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A结伴步行,B自行乘车,C家人接送,D其他方式,并将收集的数据整理绘制成如下两幅不完整的统计图.根据图中信息,可知本次抽查的学生中A类人数是( )A.30 B.40C.42 D.48(2)下图为国家统计局发布的2019年上半年全国居民消费价格指数(CPI)数据折线图,(注:同比是今年第n个月与去年第n个月之比,环比是现在的统计周期和上一个统计周期之比)下列说法错误的是( )A.2019年6月CPI环比下降0.1%,同比上涨1.9%B.2019年3月CPI环比下降1.1%,同比上涨2.1%C.2019年2月CPI环比上涨0.6%,同比上涨1.4%D.2019年6月CPI同比涨幅比上月略微扩大0.1个百分点【解析】(1)根据选择D方式的有18人,占15%,得总人数为1815%=120,故选择A方式的人数为120-42-30-18=30.故选A.(2)2019年2月CPI环比上涨1.2%,同比上涨2.9%,故C错误,A,B,D均正确,适合题意的选项为C.【答案】(1)A (2)C方法技巧 1.1准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.2在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.2.通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.3.折线图可以显示随时间根据常用比例放置而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.4.由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.1.(方向1)某校对高二(1)班的数学期末考试成绩进行了统计,发现该班学生的分数都在90到140之间,其频率分布直方图如下图所示.若分数在130~140的人数为2,则分数在100~120的人数为( B )A .12B .28C .32D .40解析:(1)分数在130~140的频率为1-10×(0.01+0.025+0.045+0.015)=0.05,根据对应关系得分数在100~120的人数为0.025+0.0450.005×2=28,故选B.2.(方向2)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布的饼状图、90后从事互联网行业岗位分布条形图,则下列结论中不一定正确的是( D )注:90后指1990年1月1日至1999年12月31日出生的人,80后指1980年1月1日至1989年12月31日出生的人,80前指1979年12月31日及以前出生的人.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比80后多解析:对于A:由整个互联网行业从业者年龄分布的饼状图可知,互联网行业从业者中90后占了56%,所以A正确;对于B:由两个统计图知,互联网行业从事技术岗位的90后人数占总人数的56%×39.6%=22.176%,已经超过了20%,所以整个互联网行业从事技术岗位的人数肯定会超过总人数的20%,所以B正确;对于C:由两个统计图知,互联网行业从事运营岗位的人数90后占总人数的56%×17%=9.52%,超过了80前互联网行业从业者人数,所以C 正确;对于D:由两个统计图知互联网行业80后的人数占41%,但没有80后的岗位分布图,因此无法判断互联网行业中从事技术岗位的人数90后与80后谁多谁少,故D错误,选D.3.(方向2)随着我国经济实力的不断提升,居民收入也在不断增加.某家庭2018年全年的收入与2014年全年的收入相比增加了一倍,实现翻番.同时该家庭的消费结构随之也发生了变化,现统计了该家庭这两年不同品类的消费额占全年总收入的比例,得到了如下折线图:则下列结论中正确的是( C )A.该家庭2018年食品的消费额是2014年食品的消费额的一半B.该家庭2018年教育医疗的消费额与2014年教育医疗的消费额相当C.该家庭2018年休闲旅游的消费额是2014年休闲旅游的消费额的五倍D.该家庭2018年生活用品的消费额是2014年生活用品的消费额的两倍解析:设该家庭2014年全年收入为a,则2018年全年收入为2a.对于A,2018年食品消费额为0.2×2a=0.4a,2014年食品消费额为0.4a,故两者相等,A不正确.对于B,2018年教育医疗消费额为0.2×2a=0.4a,2014年教育医疗消费额为0.2a,故B不正确.对于C,2018年休闲旅游消费额为0.25×a=0.5a,2014年休闲旅游消费额为0.1a,故C正确.对于D,2018年生活用品的消费额为0.3×2a=0.6a,2014年生活用品的消费额为0.15a,故D不正确.考点二样本的数字特征及应用命题方向1 平均数、众数、中位数【例3】某地区某村的前3年的经济收入(单位:万元)分别为100,200,300,其统计数据的中位数为x,平均数为y.今年经过政府新农村建设后,该村经济收入(单位:万元)在上年基础上翻番,则在这4年里经济收入的统计数据中,下列说法正确的是( ) A.中位数为x,平均数为1.5yB.中位数为1.25x,平均数为yC.中位数为1.25x,平均数为1.5yD.中位数为1.5x,平均数为2y【解析】由数据100,200,300可得,前3年统计数据的中位数x=200,平均数y=100+200+300=200.根据题意得第4年该村的经济收入的统计数据为600,则由数据3100,200,300,600可得,这4年统计数据的中位数为200+3002=250=1.25x,平均数为100+200+300+6004=300=1.5y,故选C.【答案】 C命题方向2 样本方差与标准差【例4】(1)在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93.去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为( )A.92,2.8 B.92,2C.93,2 D.93,2.8(2)为了解本市居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区进行了“家庭每月日常消费额”的调查.他们将调查所得到的数据分别绘制成频率分布直方图(如图所示),记甲、乙、丙所调查数据的标准差分别为s1,s2,s3,则它们的大小关系为________(用“>”连接).(3)对参加某次数学竞赛的1 000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.①根据直方图完成以下表格; 成绩 [50,60)[60,70)[70,80)[80,90)[90,100]频数②求参赛选手初赛成绩的平均数及方差(同一组中的数据用该组区间的中点值作代表); ③如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛选手的成绩? 【解析】 (1)由题意所剩数据:90,90,93,94,93. 所以平均数x =90+90+93+94+935=92.方差s 2=15[(90-92)2+(90-92)2+(93-92)2+(93-92)2+(94-92)2]=2.8.(2)根据频率分布直方图知,甲的数据的两端的数字较多,离平均值较远,表现的最分散,标准差最大;乙的数据,分布均匀,没有甲组偏离平均值的程度大,标准差比甲组中的小;丙的数据绝大部分都集中在平均值左右,数据表现的最集中,标准差最小.故s 1>s 2>s 3.(3)解:①填表如下: 成绩 [50,60) [60,70) [70,80) [80,90) [90,100] 频数50150350350100②平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78,方差s 2=(-23)2×0.05+(-13)2×0.15+(-3)2×0.35+72×0.35+172×0.1=101. ③进入复赛选手的成绩为80+350-380-100350×10=82(分),所以初赛成绩为82分及其以上的选手均可进入复赛.(说明:回答82分以上,或82分及其以上均可)【答案】(1)A (2)s1>s2>s3方法技巧1.平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.2.利用频率分布直方图估计样本的数字特征的方法:①中位数:在频率分布直方图中,中位数左边和右边的小矩形的面积相等,由此可以估计中位数的值.②平均数:平均数的估计值等于每个小矩形的面积分别乘小矩形底边中点的横坐标之和.③众数:最高的矩形的中点的横坐标.1.(方向1)(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( A )A.中位数B.平均数C.方差D.极差解析:记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.2.(方向1)(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为0.98.解析:本题主要考查用样本估计总体,意在考查学生的数据处理能力、运算求解能力,考查的核心素养是数据分析、数学运算.经停该站高铁列车所有车次的平均正点率的估计值为10×0.97+20×0.98+10×0.9910+20+10=0.98.3.(方向2)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数 2 24 53 14 7(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例; (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:74≈8.602.解:(1)根据产值增长率频率分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100 i =15n i (y i -y )2=1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6,s =0.029 6=0.02×74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.学习至此,请完成课时作业58第二节 用样本估计总体课标要求考情分析1.了解分布的意义和作用,会列频率分布表,1.本节是用样本估计总体,是统计学的基础,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(平均数、标准差),并给出合理解释.4.会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.以考查频率分布直方图、茎叶图、平均数、方差、标准差为主,同时考查对样本估计总体的思想的理解.2.本节在高考题中主要是以选择题和填空题为主,属于中低档题目.知识点一用样本的频率分布估计总体分布1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的. 3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.知识点二 用样本的数字特征估计总体的数字特征 1.众数、中位数、平均数 数字特征概念优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使它无法客观地反映总体特征 中位数把一组数据按从小到大顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的平均数x =x 1+x 2+…+x nn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差:s =1n[x 1-x2+x 2-x2+…+x n -x2].(3)方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n是样本数据,n是样本容量,x是样本平均数).平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为x,则mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m x+a.(2)若数据x1,x2,…,x n的方差为s2,则数据ax1+b,ax2+b,…,ax n+b的方差为a2s2.1.思考辨析判断下列结论正误(在括号内打“√”或“×”)(1)在频率分布直方图中,小矩形的高表示频率.( ×)(2)频率分布直方图中各个长方形的面积之和为1.( √)(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( ×)(4)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √)(5)一组数据的方差越大,说明这组数据的波动越大.( √)2.小题热身(1)某便利店记录了100天某商品的日需求量(单位:件),整理得下表:日需求量n/件1415161820频率0.10.20.30.20.2 试估计该商品日平均需求量为( D )A.16件B.16.2件C.16.6件D.16.8件(2)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是( A )A.91.5和91.5 B.91.5和92C .91和91.5D .92和92(3)某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检测后所作的频率分布直方图,则从图中可以看出被处罚的汽车大约有( B )A .30辆B .40辆C .60辆D .80辆(4)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( B )A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数(5)从某选手的7个得分中去掉1个最高分,去掉1个最低分后,剩余5个得分的平均数为91分,如图所示是该选手得分的茎叶图,其中有一个数字模糊,无法辨认,在图中用x 表示,则剩余5个得分的方差为6.解析:(1)由题意可知,日平均需求量为14×0.1+15×0.2+16×0.3+18×0.2+20×0.2=16.8(件).(2)这组数据由小到大排列为87,89,90,91,92,93,94,96, ∴中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.(3)从频率分布直方图知,车速大于或等于70 km/h 的频率为0.02×10=0.2.由于样本容量为200,故“超速”被罚的汽车约有200×0.2=40(辆).(4)标准差能反映一组数据的稳定程度.故选B.(5)去掉一个最高分99分,一个最低分87分,剩余的得分为93分,90分,(90+x )分,91分,87分,则93+90+90+x +91+875=91,解得x =4,所以这5个数的方差s 2=15[(91-93)2+(91-90)2+(91-94)2+(91-91)2+(91-87)2]=6.考点一 统计图表的应用命题方向1 频率分布直方图的应用【例1】 (2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70.(1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.命题方向2 各种图表的比较【例2】(1)某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A结伴步行,B自行乘车,C家人接送,D其他方式,并将收集的数据整理绘制成如下两幅不完整的统计图.根据图中信息,可知本次抽查的学生中A类人数是( )A.30 B.40C.42 D.48(2)下图为国家统计局发布的2019年上半年全国居民消费价格指数(CPI)数据折线图,(注:同比是今年第n个月与去年第n个月之比,环比是现在的统计周期和上一个统计周期之比)下列说法错误的是( )A.2019年6月CPI环比下降0.1%,同比上涨1.9% B.2019年3月CPI环比下降1.1%,同比上涨2.1% C.2019年2月CPI环比上涨0.6%,同比上涨1.4% D.2019年6月CPI同比涨幅比上月略微扩大0.1个百分点【解析】(1)根据选择D方式的有18人,占15%,得总人数为1815%=120,故选择A方式的人数为120-42-30-18=30.故选A.(2)2019年2月CPI环比上涨1.2%,同比上涨2.9%,故C错误,A,B,D均正确,适合题意的选项为C.【答案】(1)A (2)C1.1准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.2在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.,2.通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.,3.折线图可以显示随时间根据常用比例放置而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.4.由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.1.(方向1)某校对高二(1)班的数学期末考试成绩进行了统计,发现该班学生的分数都。
近年高考数学一轮复习第9章统计与统计案例9.2用样本估计总体课后作业文(2021年整理)
2019版高考数学一轮复习第9章统计与统计案例9.2 用样本估计总体课后作业文编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2019版高考数学一轮复习第9章统计与统计案例9.2 用样本估计总体课后作业文)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2019版高考数学一轮复习第9章统计与统计案例9.2 用样本估计总体课后作业文的全部内容。
9.2 用样本估计总体[基础送分 提速狂刷练]一、选择题1.(2015·安徽高考)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .32答案 C解析 设样本数据x 1,x 2,…,x 10的标准差为s ,则s =8,可知数据2x 1-1,2x 2-1,…,2x 10-1的标准差为2s =16.故选C 。
2.(2018·保定联考)在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为( )A .28B .40C .56D .60答案 B解析 设中间一个小长方形面积为x ,其他8个长方形面积为错误!x ,因此x +52x =1,解得x =错误!,所以中间一组的频数为140×错误!=40。
故选B 。
3.(2017·哈尔滨四校统考)一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n },若a 3=8,且a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是( )A .13,12B .13,13C .12,13D .13,14答案 B解析 设等差数列{a n }的公差为d (d ≠0),a 3=8,a 1a 7=a 错误!=64,(8-2d )(8+4d )=64,(4-d )(2+d )=8,2d -d 2=0,又d ≠0,故d =2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为错误!=错误!=13,中位数为错误!=13.故选B 。
2021版高考数学一轮复习 第九章 统计与统计案例 9.3 变量间的相关关系与统计案例教学案 苏教版
第三节变量间的相关关系与统计案例[最新考纲] 1。
会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归系数公式不要求记忆)。
3。
了解回归分析的基本思想、方法及其简单应用。
4。
了解独立性检验(只要求2×2列联表)的思想、方法及其初步应用.1.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(2)回归方程:方程错误!=错误!x+错误!是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n)的回归方程,其中错误!,错误!是待定参数.3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n),其中(错误!,错误!)称为样本点的中心.(3)相关系数当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0。
75时,认为两个变量有很强的线性相关性.4.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y 1y2总计x1a b a+bx2c d c+d总计a+c b+d a+b+c+d构造一个随机变量K2=错误!,其中n=a+b+c+d为样本容量.错误!1.回归直线必过样本点的中心(x,错误!).2.当两个变量的相关系数|r|=1时,两个变量呈函数关系.一、思考辨析(正确的打“√”,错误的打“×")(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( )(2)通过回归直线方程可以估计预报变量的取值和变化趋势.()(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.()(4)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.()[答案](1)√(2)√(3)×(4)√二、教材改编1.在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的是( )A.模型1的相关指数R2为0。
高中数学第九章统计9.2用样本估计总体(3)教案新人教A版必修第二册
本节《普通高中课程标准数学教科书-必修二(人教A 版)第九章《9.2.2总体百分位数的估计》,本节课通过探究栏目提出“居民生活用水定额管理问题”,在制定水价问题中提出,总体百分位数的估计的概念,让学生尝试运用总体百分位数的估计来解决实际问题,体会总体百分位数的估计的意义和作用,体会用样本估计总体的思想与方法。
从而发展学生的直观想象、逻辑推理、数学建模的核心素养。
掌握求一组数据的百分位的基本步骤:1.数学建模:在具体情境中运用百分位数解决问题;2.逻辑推理:求总体百分位数的基本步骤;3.数学运算:会求总体百分位数4.数据分析:体会百分位数的意义1.教学重点:理解百分位数的概念及其简单应用2.教学难点:掌握求一组数据的百分位的基本步骤:多媒体三、达标检测1.下列一组数据的第25百分位数是( )解把该组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i2.知100个数据的第75百分位数是9.3,则下列说法正确的是( )解析:因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,选C3.某公司2018年在各个项目中总投资500万元,如图是几类项目的投资占比情况,已知在1万元以上的项目投资中,少于3万元的项目投资占 ,那么不少于3万元的项目投资共有( )4. 为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗?解:由题意知分别落在各区间上的频数为在[80,90)上有60×0.15=9,在[90,100)上有60×0.25=15,在[100,110)上有60×0.3=18,在[110,120)上有60×0.2=12,在[120,130]上有60×0.1=6.从以上数据可知第50百分位数一定落在区间[100,110)上,综上可知,第50百分位数和第75百分位数分别估计为103.3cm,112.5 cm.5.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,50,95百分位数;2)请你找出珍珠质量较小的前15%的珍珠质量;3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.解(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,则第25百分位数是错误!=8.15,第50百分位数是错误!=8.5,第95百分位数是第12个数据为9.9.(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.6.某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式.(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b 的值.(3)根据(2)中求得的数据a=0.001 5,b=0.002 0.计算用电量的75%分位数.[解] (1)当0≤x≤200时,yx;当200<x≤400时,y=0.5×200+0.8×(xx-60;当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140. 所以y与x之间的函数解析式为y=本节课通过探究栏目提出“居民生活用水定额管理问题”,在制定水价问题中提出,总体百分位数的估计的概念,让学生尝试运用总体百分位数的估计来解决实际问题,体会总体百分位数的估计的意义和作用教学中要注重学生的主体地位,调动学生积极性,使数学教学成为数学活动的教学。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节用样本估计总体[最新考纲] 1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.常用统计图表(1)作频率分布直方图的步骤:①求极差(即一组数据中最大值与最小值的差).②决定组距与组数.③将数据分组.④列频率分布表.⑤画频率分布直方图.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本数据落在该组内的频率.各小矩形的面积和为1.(3)频率分布折线图和总体密度曲线①频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把x =x 1+x 2+…+x nn称为x 1,x 2,…,x n 这n 个数的平均数.(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x ,则这组数据的标准差和方差分别是s =1n[x 1-x2+x 2-x2+…+x n -x2];s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].[常用结论]1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.一、思考辨析(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. ( )(2)一组数据的方差越大,说明这组数据越集中. ( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )(4) 已知样本数据x 1,x 2,…,x n 的均值x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为10.( )[答案](1)√ (2)× (3)√ (4)× 二、教材改编1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( ) A .4 B .8 C .12 D .16B [设频数为n ,则n32=0.25,∴n =32×14=8.]2.若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92A [∵这组数据为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.]3.(2019·盐城模拟)已知一组数据x 1,x 2,x 3,x 4,x 5的方差是2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的标准差为 .22 [由s 2=1n(x i -x )2=2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的方差是8,标准差为2 2.]4.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有 人.25 [0.5×0.5×100=25.]考点1 样本的数字特征的计算与应用 利用样本的数字特征解决决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.1.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差A [设9位评委评分按从小到大排列为x 1<x 2<x 3<x 4…<x 8<x 9,则原始中位数为x 5,去掉最低分x 1,最高分x 9后剩余x 2<x 3<x 4…<x 8,中位数仍为x 5,∴A 正确.]2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )甲 乙A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差C [根据条形统计图可知甲的中靶情况为4环、5环、6环、7环、8环;乙的中靶情况为5环、5环、5环、6环、9环.x 甲=15(4+5+6+7+8)=6,x 乙=15(5×3+6+9)=6,甲的成绩的方差为4-62+5-62+6-62+7-62+8-625=2,乙的成绩的方差为5-62×3+6-62+9-625=2.4;甲的成绩的极差为4环,乙的成绩的极差为4环;甲的成绩的中位数为6环,乙的成绩的中位数为5环,综上可知C 正确,故选C.]3.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为( )A .1B .2C .3D .4 D [由题意可知⎩⎪⎨⎪⎧15x +y +10+11+9=10,15[x -102+y -102+1+1]=2,∴⎩⎪⎨⎪⎧x +y =20,x 2+y 2=208.∴(x +y )2=x 2+y 2+2xy ,即208+2xy =400,∴xy =96.∴(x -y )2=x 2+y 2-2xy =16, ∴|x -y |=4,故选D.]4.(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.y 的分组 [-0.20,0) [0,0.20) [0.20,0.40) [0.40,0.60) [0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例; (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:74≈8.602.[解](1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y -=1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s 2==1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7] =0.029 6,s =0.029 6=0.02×74≈0.17,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.方差的简化计算公式:s 2=1n [(x 21+x 22+…+x 2n )-n x 2],或写成s 2=1n (x 21+x 22+…+x 2n )-x 2,即方差等于原数据平方的平均数减去平均数的平方.考点2 频率分布直方图频率、频数、样本容量的计算方法(1)频率组距×组距=频率. (2)频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.(1)(2019·益阳模拟)为了了解某校九年级1 600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是( )A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5C.该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320D.该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32(2)(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.①求乙离子残留百分比直方图中a,b的值;②分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).(1)D[由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值27.5;1分钟仰卧起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30的人数为320;1分钟仰卧起坐的次数少于20的频率为0.1,所以估计1分钟仰卧起坐的次数少于20的人数为160.故D 错误.](2)[解] ①由已知得0.70=a +0.20+0.15,故a =0.35.b =1-0.05-0.15-0.70=0.10.②甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05. 乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.频率分布直方图的纵坐标是频率组距,而不是频率,切莫与条形图混淆.[教师备选例题](2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m 3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)[解](1)如图所示:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m 3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m 3的概率的估计值为0.48. (3)该家庭未使用节水龙头50天日用水量的平均数为x -1=150(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x -2=150(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m 3).1.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a ,最大频率为0.32,则a 的值为( )A .64B .54C .48D .27B [前两组中的频数为100×(0.05+0.11)=16.因为后五组频数和为62,所以前三组为38.所以第三组频数为22.又最大频率为0.32,对应的最大频数为0.32×100=32.所以a =22+32=54.]2.某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解](1)(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,解得x =0.007 5.即直方图中x 的值为0.007 5.(2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5, (0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5, ∴月平均用电量的中位数在[220,240)内.设中位数为a ,则0.45+0.012 5×(a -220)=0.5,解得a =224,即中位数为224. (3)月平均用电量在[220,240)的用户有0.012 5×20×100=25(户).同理可得月平均用电量在[240,260)的用户有15户,月平均用电量在[260,280)的用户有10户,月平均用电量在[280,300]的用户有5户,故抽取比例为1125+15+10+5=15.∴月平均用电量在[220,240)的用户中应抽取25×15=5(户).。