用样本估计总体
用样本估计总体
9.2 用样本估计总体班级姓名一、学习目标:(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差及方差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.二、学习建议:(1)统计图表是统计中的主要工具,学会从图表中提取有关的数据信息、进行统计推断的方法.(2)加强运算能力的培养,统计的数字计算较繁,要有良好的运算习惯,通过统计的复习提高运算能力.三、自主预习1.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8.知识链接1:列频率分布表、画频率分布直方图的步骤(1)计算极差,即计算一组数据中的差;(2)决定与;(3)将数据分组;(4)列表;(5)画频率分布直方图.注:①频率分布直方图是用小长方形的来表示在各个区间内取值的频率.直角坐标系中的纵轴表示的比值,即小长方形面积=×=频率;②各组频率的和等于,即所有长方形面积的和等于;③频率分布表在数量表示上比较,但不够、,不利于分析数据分布的;④从频率分布直方图可以清楚地看出数据分布的,但是从直方图本身得不出.2.连接频率分布直方图中各个小长方形上端的,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条曲线,统计中称这条曲线为______密度曲线.总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.2.某公司甲、乙两名职员,自进入公司以来的阶段考核成绩如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人考核成绩的茎叶图,请根据茎叶图对两人的成绩进行比较.知识链接2:茎叶图的制作方法将所有的两位数的位数字作为茎(若是三位数,则将数字作为茎),位数字作为叶,若是两组数据,则共用一个茎,茎按从小到大的顺序从上向下排列,共茎的叶一般按从大到小或从小到大同行列出.在制作茎叶图时,重复的数字要记录,不能遗漏,特别是叶的部分,同一数据出现几次,就要在图中列出几次3.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:(1)在这个问题中,总体、个体、样本和样本容量各是什么?(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径.42)其中产量比较稳定的小麦品种是.知识链接3:众数、中位数与平均数(1)众数:一组数据中出现最多的数据叫做众数;(2)中位数:将一组数据从小到大(或从大到小)依次排列,把数据(或的平均数)叫做中位数,中位数把样本数据分成了相同数目的两部分;(3)平均数:x1,x2,…,x n的平均数x=___________________________注:由于众数仅能刻画某一数据出现的次数较多,对极端值不敏感,而又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.标准差与方差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s表示.s=____________________________________________四、当堂检测区1.某校对高三年级的学生进行体检,现将高三男生的体重(kg )数据进行整理后分成五组,并绘制频率分布直方图(如图).根据一般标准,高三男生的体重超过65 kg 属于偏胖,低于55 kg 属于偏瘦.已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25,0.20,0.10,0.05,第二小组的频数为400,则该校高三年级的男生总数和体重正常的频率分别为 ( ) A .1000,0.50 B .800,0.50 C .800,0.60 D .1000,0.602用上表分组资料计算病人平均等待时间的估计值3.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为 ( )A .65 B .65C . 2D .24.观看下面两名选手全垒打数据的茎叶图,对他们的表现进行比较.1961年扬基队外垒手马利斯打破了鲁斯的一个赛季打出60个全垒打的记录.下面是扬基队的历年比赛中的鲁斯和马利斯每年击出的全垒打的比较图:鲁斯 马利斯0 81 3 4 6 52 23 6 8 54 3 3 9 9 7 6 6 1 1 49 4 4 50 6 15.为检测,某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,而极品8件,三级品13件,次品14件.(1)列出样本频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计辞呈商品为二极品或三极品的概率约是多少6.某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:cm)(1)列出频率分布表;(2)画出频率分布直方图;(3)估计数据落在[150,170]范围内的概率.五、课堂小结:1.众数、中位数、平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,是最重要的量.(2) 的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起的变动,而中位数和众数都不具备此性质.(3)众数考查各数据出现的,当一组数据中有不少数据多次出现时,众数往往更能反映问题.(4)中位数仅与数据的有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.2.茎叶图刻画数据的优点(1)所有数据信息都在茎叶图中看到.(2)茎叶图便于记录和表示,且能够展示数据的分布情况.3.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的相等,由此可以估计中位数的值.(2)平均数:平均数是频率分布直方图的“重心”,等于图中.(3)众数:在频率分布直方图中,众数是的横坐标.9.2 用样本估计总体班级 姓名一、学习目标:(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差及方差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.二、学习建议:(1)统计图表是统计中的主要工具,学会从图表中提取有关的数据信息、进行统计推断的方法. (2)加强运算能力的培养,统计的数字计算较繁,要有良好的运算习惯,通过统计的复习提高运算能力. 三、自主预习1.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分): [40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8.知识链接1:列频率分布表、画频率分布直方图的步骤(1)计算极差,即计算一组数据中__最大值与最小值______的差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.注:①频率分布表列出的是在各个不同区间内取值的频率,频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率.直角坐标系中的纵轴表示频率与组距的比值,即小长方形面积=组距×频率组距=频率;②各组频率的和等于1,即所有长方形面积的和等于1;③频率分布表在数量表示上比较确切,但不够直观、形象,不利于分析数据分布的总体态势;④从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容.2.连接频率分布直方图中各个小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为______密度曲线.总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.2.某公司甲、乙两名职员,自进入公司以来的阶段考核成绩如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107; 乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人考核成绩的茎叶图,请根据茎叶图对两人的成绩进行比较.从这个茎叶图上可看出,乙的得分情况是大致对称的,中位数是98;甲的得分情况除一个特殊得分外,也大致对称,中位数是88.因此乙成绩比较稳定,总体得分情况比甲好.知识链接2:茎叶图的制作方法将所有的两位数的十位数字作为茎(若是三位数,则将百位,十位数字作为茎),个位数字作为叶,若是两组数据,则共用一个茎,茎按从小到大的顺序从上向下排列,共茎的叶一般按从大到小或从小到大同行列出.在制作茎叶图时,重复的数字要重复记录,不能遗漏,特别是叶的部分,同一数据出现几次,就要在图中列出几次3.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:(1)在这个问题中,总体、个体、样本和样本容量各是什么?(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径. 解析: (1)总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的20颗手榴弹的杀伤半径;样本容量是20.(2)在20个数据中,10出现了6次,次数最多,所以众数是10(米).20个数据从小到大排列,第10个和第11个数据是最中间的两个数,分别为9(米)和10(米),所以中位数是21(9+10)=9.5(米). 样本平均数4.9)112311610495817(201=⨯+⨯+⨯+⨯+⨯+⨯=x (米)所以,估计这批手榴弹的平均杀伤半径约为9.4米.2)其中产量比较稳定的小麦品种是 甲 .解析:x ¯甲 = 1 5( 9.8 + 9.9 + 10.1 + 10 + 10.2) = 10.0,x ¯乙 = 1 5( 9.4 + 10.3 + 10.8 + 9.7 + 9.8) = 10.0; s 2甲 = 1 5( 9.82 + … + 10.22) – 102 = 0.02,s 2甲 = 1 5( 9.42 + … + 9.82) – 102= 0.244 > 0.02 .知识链接3:众数、中位数与平均数(1)众数:一组数据中出现_次数_最多的数据叫做众数;(2)中位数:将一组数据从小到大(或从大到小)依次排列,把_中间_数据(或___中间两数据__的平均数)叫做中位数,中位数把样本数据分成了相同数目的两部分;(3)平均数:x 1,x 2,…,x n 的平均数x =___________________________注:由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.标准差与方差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.s =____________________________________________注:由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.四、当堂检测区1.某校对高三年级的学生进行体检,现将高三男生的体重(kg )数据进行整理后分成五组,并绘制频率分布直方图(如图).根据一般标准,高三男生的体重超过65 kg 属于偏胖,低于55 kg 属于偏瘦.已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25,0.20,0.10,0.05,第二小组的频数为400,则该校高三年级的男生总数和体重正常的频率分别为 ( D ) A .1000,0.50 B .800,0.50 C .800,0.60 D .1000,0.60[思路] 先求第二小组的频率,结合其频数,就可以得出男生总数,正常体重学生所占频率为第二和第三小组频率之和.[解析] 据题意,得第二小组的频率为1-(0.25+0.20+0.10+0.05)=0.40,且其频数为400,设高三年级男生总数为n ,则有400n =0.40,∴n =1000.体重正常的学生所占的频率为第二和第三小组频率之和,即0.20+0.40=0.60.2[解答] 等待时间在[0,5)内的4个人的等待总时间的估计值为0+52×4=10;等待时间在[5,10)内的8个人的等待总时间的估计值为5+102×8=60;同理,其余三个时间段等待总时间的估计值分别为62.5,35,22.5.所以病人平均等待时间的估计值为10+60+62.5+35+22.54+8+5+2+1=9.5(分钟).3.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为 ( D )A .65 B .65C . 2D .2 [解析] 由题意知15(a +0+1+2+3)=1,解得a =-1,所以样本方差为s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故选D.4.观看下面两名选手全垒打数据的茎叶图,对他们的表现进行比较.1961年扬基队外垒手马利斯打破了鲁斯的一个赛季打出60个全垒打的记录.下面是扬基队的历年比赛中的鲁斯和马利斯每年击出的全垒打的比较图:鲁斯 马利斯0 81 3 4 6 52 23 6 8 54 3 3 9 9 7 6 6 1 1 49 4 4 50 6 1解析:鲁斯的成绩相对集中,稳定在46左右;马利斯成绩相对发散,成绩稳定在26左右. 5.为检测,某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,而极品8件,三级品13件,次品14件.(1)列出样本频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计辞呈商品为二极品或三极品的概率约是多少(2)样本频率分布的条形图为:(3)此种产品为二极品或三极品的概率约为0.27+0.43=0.7. 点评:条形图中纵坐标一般是频数或频率.6.某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:cm ) (1)列出频率分布表;(2)画出频率分布直方图;(3)估计数据落在[150,170]范围内的概率. 解析:(1)根据题意可列出频率分布表: (2)频率分布直方图如下:(3)数据落在[150,170]范围内的概率约为0.825.五、课堂小结:1.众数、中位数、平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质.(3)众数考查各数据出现的频率,当一组数据中有不少数据多次出现时,众数往往更能反映问题.(4)中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.2.茎叶图刻画数据的优点(1)所有数据信息都可以在茎叶图中看到.(2)茎叶图便于记录和表示,且能够展示数据的分布情况.3.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.(2)平均数:平均数是频率分布直方图的“重心”,等于图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)众数:在频率分布直方图中,众数是最高的矩形底边的中点的横坐标.。
5.1.4用样本估计总体(原卷版)
频数
频率
10
24
2
合计
1
(1)写出表中 、 及图中 的值(不需过程);
(2)若该校高三年级学生有240人,试估计该校高三年级学生参加社区服务的次数在区间 上的人数;
(3)估计该校高三年级学生参加社区服务次数的中位数.(结果精确到0.01)
【变式11】4.(2023·高一课时练习)某校240名学生参加某次数学选择题测验(共10题每题1分),随机调查了20个学生的成绩如下:
A.a的值为0.005
B.估计这组数据的众数为75
C.估计这组数据的第85百分位数为86
D.估计成绩低于60分的有25人
【变式13】3.(2022·安徽·涡阳县第九中学高一期末)某县在创文明县城期间安排了“垃圾分类知识普及实践活动”.为了解市民的学习成果,该县从某社区随机抽取了160名市民作为样本进行测试,记录他们的成绩,测试卷满分为100分,将数据收集,并整理得到频率分布直方图,如图所示:
(1)求频率分布直方图中a的值;
(2)估计该100名射击爱好者的射击平均得分(求平均值时同一组数据用该组区间的中点值作代表);
(3)该俱乐部计划招募成绩位列前10%的滑雪爱好者组成集训队备战明年的滑雪俱乐部联盟赛,请根据图中信息,估计集训队入围成绩(记为k).
【变式21】3.(2023下·湖南益阳·高一统考期末)某校有高一学生1000人,其中男生 600人,女生 400人,为了解该校全体高一学生的身高信息,甲与乙分别进行了调查.
成绩
1分
2分
3分
4分
5分
6分
7分
8分
9分
10分
人数
6
0
0
2
4
2
用样本估算总体
用样本估算总体
◎ 用样本估算总体的定义
用样本估计总体的两个手段:
(1)用样本的频率分布估计总体的分布;
(2)用样本的数字特征估计总体的数字特征,需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本的容量越大,估计的结果也就越精确。
◎ 用样本估算总体的知识扩展
用样本估计总体的两个手段:
(1)用样本的频率分布估计总体的分布;
(2)用样本的数字特征估计总体的数字特征,需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本的容量越大,估计的结果也就越精确。
◎ 用样本估算总体的教学目标
1、通过实例,体会用样本估计总体的思想。
2、能够根据统计结果作出合理的判断和推测,能与同学进行交流,用清晰的语言表达自己的观点。
3、根据有关问题查找资料或调查,用随机抽样的方法选取样本,能用样本的平均数和方差,从而对总体有个体有个合理的估计和推测。
◎ 用样本估算总体的考试要求
能力要求:了解
课时要求:40
考试频率:选考
分值比重:2。
用样本估计总体
用样本估计总体要用样本估计总体的平均数和方差,首先需要了解一些基本概念和方法。
这篇文章将从样本、总体、样本估计等方面进行讨论,并介绍一些常见的样本估计方法。
1.样本与总体:样本是指从总体中选取的一部分观察值,总体是指研究对象的全部观察值的集合。
通常情况下,我们无法直接获得总体的所有观察值,但可以通过选取一部分样本来对总体进行估计。
2.样本估计:样本估计是通过对样本数据进行分析,得出对总体的一些参数的估计值。
常见的参数包括总体的平均数、方差、比例等。
3.样本的选择:为了保证样本的代表性,需要采用一定的抽样方法。
简单随机抽样是常用的抽样方法之一,它的特点是每个样本被选中的概率相等。
其他常用的抽样方法包括等距抽样、分层抽样等。
4.样本均值的估计:样本均值是用来估计总体均值的一个重要指标。
样本均值的估计值可以通过计算样本观察值的平均数得到。
假设样本的观察值为x1, x2, ..., xn,样本均值的估计公式为:样本均值的估计值 = (x1 + x2 + ... + xn) / n。
其中,n表示样本容量。
5.样本方差的估计:样本方差是用来估计总体方差的一个重要指标。
样本方差的估计值可以通过计算样本观察值与样本均值之差的平方的平均数得到。
假设样本的观察值为x1, x2, ..., xn,样本方差的估计公式为:样本方差的估计值= ((x1 - 样本均值的估计值)^2 + (x2 - 样本均值的估计值)^2 + ... + (xn - 样本均值的估计值)^2) / (n - 1)。
其中,n表示样本容量。
6.置信区间:在样本估计中,通常需要给出一个区间估计来反映估计值的准确程度。
置信区间是一个包含总体参数真值的区间,置信度表示该区间包含总体参数真值的概率。
置信区间的计算需要考虑样本容量、样本分布以及所选的置信水平等因素。
综上所述,通过样本对总体的平均数和方差进行估计是统计学中常见的问题。
根据样本均值的估计和样本方差的估计公式,可以计算出相应的估计值。
随机抽样-用样本估计总体
2.[2017全国卷Ⅰ]为评估一种农作物的种 植效果,选了n块地作试验田.这n块地的 亩产量(单位:kg)分别为x1,x2,…,xn,下 面给出的指标中可以用来评估这种农作物 亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差 C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
2.用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数。 (2)中位数:将数据按大小顺序排列,若有奇数个数,则最中间的数是中 位数;若有偶数个数,则中间两数的平均数是中位数。
(3)平均数:-x =_x_1+__x_2_+_n_…__+__x_n___ ______,反映了一组数据的平均水平。
B.某车间包装一种产品,在自动传送带上,每隔 5分钟抽一包产品,称其质量是否合格
C.某校分别从行政、教师、后勤人员中抽取2人、 14人、4人了解学校机构改革的意见
D.用抽签法从10件产品中选取3件进行质量检验
[答案] D
[解析] A,B不是简单随机抽样,因为抽 取的个体间的间隔是固定的;C也不是,因 为总体的个体有明显的层次;D是简单随机 抽样中的抽签法.故选D.
A.480 B.481
C.482 D.483
[答案] C
[解析] 根据系统抽样的定义可知,样本的 编号成等差数列,令a1=7,a2=32,d=25, 所以7+25(n-1)≤500,所以n≤20,最大编 号为7+25×19=482.
4.[2019山东临沂模拟]某班共有52人,现根
据学生的学号,用系统抽样的方法,抽取 一个容量为4的样本,已知3号、29号、42
号同学在样本中,那么样本中还有一个同 学的学号是( )
A.10
☆☆用样本估计总体
组距
0.5
4、列出频率分布表.(填写频率/组距一栏) 5、画出频率分布直方图。
思考: 频率分布条形图和频率分布直方图是两个 相同的概念吗? 有什么区别?
频率分布的条形图和频率分布直方图的区别
两者是不同的概念; 横轴:两者表示内容相同 纵轴:两者表示的内容不相同 频率分布条形图的纵轴(长方形的高)表示频率 频率分布直方图的纵轴(长方形的高)表示 频率与组距的比值, 其相应组距上的频率等于该组距上长方形的面积。
总体密度曲线反映了总体在各个范围内取值的
百分比,精确地反映了总体的分布规律。是研究总
体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布
规律,即越精确地反映了总体在各个范围内取值
百分比。
表示样本的分布的方法: 3.频率分布折线图 1.频率分布表 样本频率分布中, 分组 个数累计 频数 频率 当样本容量无限增 大,组距无限缩小
频率分布
样本中所有数据(或数据组)的频数和 样本容量的比,叫做该数据的频率。 所有数据(或数据组)的频数的分布 变化规律叫做样本的频率分布。
频率分布的表示形式有:
①样本频率分布表 ②样本频率分布图 样本频率分布条形图 样本频率分布直方图 ③样本频率分布折线图
1、抛掷硬币的大量重复试验的结果: 频率分布表: 样本容量为72 088
分 组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5] 合计
频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100
用样本估计总体
0.0005 0.0004 0.0003 0.0002 0.0001
频率/组距
月收入(元)
1000 1500 2000 2500 3000 3500 4000
课堂练习
3.为了解某校高三学生的视力情况,随机地抽
查了该校 100 名高三学生的视力情况,得到频率
分布直方图,如右,由于不慎将部分数据丢失,
但知道前 4 组的频数成等比数列,后 6 组的频数
频率
组成距 等差数列,设最大频率为 a,视力在 4.6 到 5.0
之间的学生数为 b,则 a,b 的值分别为( A )
A. 0.27,78
频率/组距
B. 0.27,83
C. 2.7,78
0.3
D. 2.7,83
0.2
0.16
0.1 0.08
0.1 0.08 0.04
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
同样一组数据,如果组距不同,横轴、纵轴的单位 不同,得到的图的形状也会不同.不同的形状给人以不 同的印象,这种印象有时会影响我们对总体的判断.分 别以1和0.1为组距重新作图,然后谈谈你对图的印象.
第一步: 求极差: (数据组中最大值与最小值的差距) 最大值= 4.3 最小值= 0.2 所以极差= 4.3-0.2 = 4.1
第二步: 决定组距与组数: (注意取整) 当样本容量不超过100时, 按照数据的多少, 常
分成5~12组.
为方便组距的选择应力求“取整”.
本题如果组距为0.5(t).
则
组数=
频率 组距 0.5 0.4 0.3 0.2 0.1
用样本估计总体(频率分布直方图、平均数、方差等)
s2
1 10
4 (2 5)2
2 (5 5)2
4 (8 5)2
7.2
3.(2015 江苏苏州市高三上调考)如图是小王
所做的六套数学附加题得分(满分 40)的茎叶
图,则其平均得分为 .
JSY33
第 3 题图
【考点】茎叶图.
【答案】 31.
【分析】 根据茎叶图的数据,得;
数据的平均分为
x = 18 28 30 32 38 40 =31. 6
55、在公路发展的早期,它们的趋势还能顺从地貌,即沿河流或森林的边缘发展。可 如今,公路已无所不在,狼、熊等原本可以自由游荡的动物种群被分割得七零八落。 与大型动物的种群相比,较小动物的种群在数量上具有更大的波动性,更容易发生杂 居现象。这段话主要讲述的是 。 A.公路发展的趋势 B.公路对动物的影响 C.动物生存状态的变化 D.不同动物的不同命运
56、从3月下旬到10月上旬,太阳在地球上直射位置的移动规律是: A.赤道→南回归线→赤道 B.赤道→北回归线→赤道 C.南回归线→赤道→北回归线
D.人权是个人权利和集体人权的统一
67、在觅食过程中,成百上千只蚂蚁在蚁穴和食物所在处之间来来往往,最终都能够 在相对最短时间内得到食物,却从来不会有拥堵现象出现。德国科学家赫尔冰发现, 避免道路拥堵是基于蚂蚁之间的交流。在一条路有可能出现拥堵时,返回的蚂蚁就向 迎面过来的同伴发出信息素,让它选择另一条路。他认为,人类可以采取相同方法减 少车辆拥塞现象。
这段文字的主旨是 。
A.城市发展面临危机 B.城市是人类文明的中心所在 C.城市的演进伴随着各种问题 D.城市要健康发展必须积极有效地应对各种挑战
69、1983年,沃伦和马歇尔发现人的胃内有幽螺菌(HP),并分离培养成功,为常见的 胃病病因和诊治作出了划时代的贡献。世界上约1/3人口感染HP,我国感染率较高, 儿童占50%以上,成人占70%以上。HP主要通过口口传播,也可经中介物如餐具、牙 具或患者排泄物污染他人的手或食物从而导致感染。防止儿童感染HP,在防止青少年 胃病,促进儿童健康成长和社会公共卫生等方面都有重大意义。
9.2用样本估计总体
授课主题用样本估计总体教学目标1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.4.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学内容1.频率分布直方图(1)列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且=极差组距组数;③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:①==⨯频率小长方形的面积组距频率组距,②个小长方形的面积等于1,③1==频率小长方形的高,所有小长方形的高的和组距组距.(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x=来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地n;n①众数、中位数、平均数都是描述一组数据集中趋势的量,平均数是最重要的量;x的平均数为x,则一组数,,n的平均数为用样本的标准差估计总体的标准差)数据的离散程度可以用极差、方差或标准差来描述;定义样本方差为222212()()()n x x x x x x s n-+-++-=;简化公式:22222121[()]n s x x x nx n=+++-=2222121()n x x x x n+++-(方差等于原数据平方的平均数减去平均数的平方)(4)样本的标准差是方差的算术平方根.样本标准差22212()()()0n x x x x x x s s n-+-++-=≥,.标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围. (5)方差相关结论:①如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n x a x a x a +++的方差为2s ;②如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n kx kx kx 的方差为22k s 。
用样本估计总体
月收入(元)
1000 1500 2000 2500 3000 3500 4000
练习1、如图是150辆汽车通过某路段 时速度的频率分布直方图,则速度在[60, 60 辆. 70)的汽车大约有______
在频率分布直方图中,依次连接各小长 方形上端的中点,就得到一条折线,这条 折线称为频率分布折线图.
练习3、以往招生Biblioteka 计显示,某所大学录 取的新生高考总分的中位数基本稳定在550 分,若某同学今年高考得了520分,他想报 考这所大学还需收集哪些信息?
要点: (1)查往年录取的新生的平均分数.若平均数 小于中位数很多,说明最低录取线较低,可以 报考; (2)查往年录取的新生高考总分的标准差.若 标准差较大,说明新生的录取分数较分散,最 低录取线可能较低,可以考虑报考.
标准差的取值范围是什么?标准差为0 的样本数据有何特点? s≥0,标准差为0的样本数据都相等. 方差的意义: 方差(或标准差)越大离散程度越大,数 据较分散; 方差(或标准差)越小离散程度越小,数 据较集中在平均数周围.
例 2 、有两个班级,每班各自按学号随 机选出 5 名学生,测验铅球成绩,以考察 体育达标程度,测验成绩如下:单位(米) 甲 9.1 7.8 8.5 6.9 5.2 乙 8.8 7.2 7.3 7.5 6.7 两个班相比较,哪个班整体实力强一些 ?
制作频率分布直方图的方法: (1)求极差(即一组数据中最大值与最小 值的差); (2)决定组距与组数;(样本容量不超过
100时,组数常分成5~12组)
(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图.
注:频率分布直方图中
第1讲 随机抽样、用样本估计总体
第1讲随机抽样、用样本估计总体一、知识梳理1.随机抽样(1)简单随机抽样①定义:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),且每次抽取时总体内的各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.②常用方法:抽签法和随机数法.(2)分层抽样①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.②适用范围:适用于总体由差异比较明显的几个部分组成时.2.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数. (4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是s = 1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2], s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].常用结论1.不论哪种抽样方法,总体中的每一个个体入样的概率是相同的.2.会用三个关系频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.3.巧用四个有关的结论(1)若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x-+a ;(2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;(3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2;(4)s 2=1n ∑n i =1 (x i -x -)2=1n ∑n i =1x 2i-x -2,即各数平方的平均数减去平均数的平方. 二、教材衍化1.某校为了解学生学习的情况,采用分层抽样的方法从高一2 400人、高二2 000人、高三n 人中,抽取90人进行问卷调查.已知高一被抽取的人数为36,那么高三被抽取的人数为________.解析:由分层抽样可得 2 4002 400+2 000+n×90=36,则n =1 600,所以高三被抽取的人数为 1 6002 400+2 000+1 600×90=24. 答案:242.已知一组数据6,7,8,8,9,10,则该组数据的方差是________.答案:533.某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在第________组.解析:由题图可得,前四组的频率为(0.037 5+0.062 5+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,故中位数落在第4组.答案:4一、思考辨析判断正误(正确的打“√”,错误的打“×”)(1)简单随机抽样是一种不放回抽样.()(2)在抽签法中,先抽的人抽中的可能性大.()(3)一组数据的方差越大,说明这组数据的波动越大.()(4)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.()(5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.()(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.()答案:(1)√(2)×(3)√(4)√(5)√(6)√二、易错纠偏常见误区|(1)随机数表法的规则不熟出错;(2)频率分布直方图识图不清;1.假设要考察某公司生产的狂犬疫苗的剂量是否达标,现用随机数法从500支疫苗中抽取50支进行检验,利用随机数表抽取样本时,先将500支疫苗按000,001, (499)行编号,若从随机数表第7行第8列的数开始向右读,则抽取的第3支疫苗的编号为________.(下面摘取了随机数表的第7行至第9行)84 42 17 53 3157 24 55 06 8877 04 74 47 6721 76 33 50 2583 92 12 06 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 7933 21 12 34 2978 64 56 07 8252 42 07 44 3815 51 00 13 4299 66 02 79 54解析:由题意得,从随机数表第7行第8列的数开始向右读,符合条件的前三个编号依次是331,455,068,故抽取的第3支疫苗的编号是068.答案:0682.我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.解析:依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.答案:50考点一随机抽样(基础型)复习指导| 1.理解随机抽样的必要性和重要性.2.学会用简单随机抽样的方法从总体中抽取样本.3.通过对实例的分析,了解分层抽样的方法.核心素养:数据分析1.(2020·重庆中山外国语学校模拟)如饼图,某学校共有教师120人,从中选出一个30人的样本,其中被选出的青年女教师的人数为()A.12B.6C.4D.3解析:选D .青年教师的人数为120×30%=36,所以青年女教师为12人,故青年女教师被选出的人数为12×30120=3.故选D . 2.(2020·武汉市武昌区调研考试)已知某射击运动员每次射击击中目标的概率都为80%.现采用随机模拟的方法估计该运动员4次射击至少3次击中目标的概率:先由计算器产生0到9之间取整数值的随机数,指定0,1表示没有击中目标,2,3,4,5,6,7,8,9表示击中目标;再以每4个随机数为一组,代表4次射击的结果.经随机模拟产生了如下20组随机数:7527 0293 7140 9857 0347 4373 8636 6947 1417 4698 0371 6233 2616 8045 6011 3661 9597 7424 7610 4281据此估计,该射击运动员4次射击至少3次击中目标的概率为________.解析:4次射击中有1次或2次击中目标的有:0371,6011,7610,1417,7140,所以所求概率P =1-520=1520=0.75. 答案:0.753.一支田径队有男运动员56人,女运动员m 人,用分层抽样抽出一个容量为n 的样本,在这个样本中随机取一个当队长的概率为128,且样本中的男队员比女队员多4人,则m =________.解析:由题意知n =28,设其中有男队员x 人,女队员有y 人.则⎩⎪⎨⎪⎧x +y =28,x -y =4,56m =x y .解得x =16,y =12,m =42.答案:42(1)抽签法与随机数法的适用情况①抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.②一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)分层抽样问题类型及解题思路①求某层应抽个体数量,根据该层所占总体的比例计算.②已知某层个体数量,求总体容量,根据分层抽样即按比例抽样,列比例式进行计算.③确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.考点二样本的数字特征(应用型)复习指导| 1.通过实例理解样本数据的标准差的意义和作用,学会计算数据的标准差.2.能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.核心素养:数据分析、数学运算(1)在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93.去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为( )A .92,2.8B .92,2C .93,2D .93,2.8(2)(2020·盐城模拟)已知一组数据x 1,x 2,x 3,x 4,x 5的方差是2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的标准差为________.【解析】 (1)由题意得所剩数据:90,90,93,94,93.所以平均数x -=90+90+93+94+935=92. 方差s 2=15[(90-92)2+(90-92)2+(93-92)2+(93-92)2+(94-92)2]=2.8. (2)由s 2=1n i =1n (x i -x -)2=2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的方差是8,标准差为2 2. 【答案】 (1)A (2)2 2【迁移探究】 (变条件)本例(2)增加条件“x 1,x 2,x 3,x 4,x 5的平均数为2”,求数据2x 1+3,2x 2+3,2x 3+3,2x 4+3,2x 5+3的平均数和方差.解:数据2x 1+3,2x 2+3,2x 3+3,2x 4+3,2x 5+3的平均数为2×2+3=7,方差为22×2=8.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s2=1n[(x21+x22+…+x2n)-n x-2],或写成s2=1n(x21+x22+…+x2n)-x-2,即方差等于原数据平方的平均数减去平均数的平方.1.(2020·昆明市诊断测试)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作试验基地.这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,x n,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是()A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数解析:选B .平均数、中位数可以反映一组数据的集中程度;方差、标准差可以反映一组数据的波动大小,同时也反映这组数据的稳定程度.故选B .2.(2020·甘肃、青海、宁夏联考)从某小学随机抽取100名同学,将他们的身高(单位:厘米)分布情况汇总如下:A .119.3B .119.7C .123.3D .126.7解析:选C .由题意知身高在(100,110],(110,120],(120,130]内的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x ,则(x -120)×0.310=0.1,解得x ≈123.3.故选C .3.一组数据1,10,5,2,x ,2,且2<x <5,若该数据的众数是中位数的23倍,则该数据的方差为________.解析:根据题意知,该组数据的众数是2,则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x ,5,10,则2+x2=3,解得x =4,所以这组数据的平均数为 x -=16×(1+2+2+4+5+10)=4,方差为s 2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.答案:9考点三 频率分布直方图(应用型)复习指导| 1.通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图,体会它们各自的特点.2.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性.核心素养:直观想象、数据分析角度一求样本的频率、频数(2020·福建五校第二次联考)某服装店对过去100天其实体店和网店的销售量(单位:件)进行了统计,制成频率分布直方图如下:(1)若将上述频率视为概率,已知该服装店过去100天的销售中,实体店和网店销售量都不低于50的概率为0.24,求过去100天的销售中,实体店和网店至少有一边销售量不低于50的天数;(2)若将上述频率视为概率,已知该服装店实体店每天的人工成本为500元,门市成本为1 200元,每售出一件利润为50元,求该实体店一天获利不低于800元的概率.【解】(1)由题意知,网店销售量不低于50共有(0.068+0.046+0.010+0.008)×5×100=66(天),实体店销售量不低于50共有(0.032+0.020+0.012×2)×5×100=38(天),实体店和网店销售量都不低于50的天数为100×0.24=24,故实体店和网店至少有一边销售量不低于50的天数为66+38-24=80.(2)由题意,设该实体店一天售出x件,则获利为(50x-1 700)元,50x-1 700≥800⇒x ≥50.记该实体店一天获利不低于800元为事件A,则P(A)=P(x≥50)=(0.032+0.020+0.012+0.012)×5=0.38.故该实体店一天获利不低于800元的概率为0.38.角度二求样本的数字特征(2019·高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.(1)频率、频数、样本容量的计算方法①频率组距×组距=频率;②频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.(2)频率分布直方图中数字特征的计算①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.1.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为( )A .28B .40C .56D .60解析:选B .设中间一组的频数为x ,因为中间一个小长方形的面积等于其他8个长方形的面积和的25,所以其他8组的频数和为52x ,由x +52x =140,解得x =40.2.(2020·武昌区调研考试)对参加某次数学竞赛的1 000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.(1)根据直方图完成以下表格;(2)); (3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛选手的成绩? 解:(1)填表如下:(2)平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78, 方差s 2=(-23)2×0.05+(-13)2×0.15+(-3)2×0.35+72×0.35+172×0.1=101. (3)进入复赛选手的成绩为80+350-(380-100)350×10=82(分),所以初赛成绩为82分及其以上的选手均可进入复赛.(说明:回答82分以上,或82分及其以上均可)[基础题组练]1.某班有34位同学,座位号记为01,02,…,34,用下面的随机数表选取5组数作为参加青年志愿者活动的五位同学的座号.选取方法是从随机数表第一行的第6列数字开始,由左到右依次选取两个数字,则选出来的第4个志愿者的座号是( )49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 A .23B .09C .02D .16解析:选D .从随机数表第一行的第6列数字3开始,由左到右依次选取两个数字,不超过34的依次为21,32,09,16,17,故第4个志愿者的座号为16.2.(2020·陕西汉中重点中学联考)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如下表所示:若在“不喜欢的男性青年观众”中抽取了6人,则n =( )A .12B .16C .20D .24解析:选D .由题意得3030+10+30+50=30120=6n,解得n =24.故选D .3.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差解析:选A .记9个原始评分分别为a ,b ,c ,d ,e ,f ,g ,h ,i (按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A .4.(多选)某学生5次考试的成绩(单位:分)分别为85,67,m ,80,93,其中m >0.若该学生在这5次考试中成绩的中位数为80,则得分的平均数可能为( )A .70B .75C .80D .85解析:选ABC .已知的四次成绩按照由小到大的顺序排列为67,80,85,93,该学生这5次考试成绩的中位数为80,则m ≤80,所以平均数85+67+m +80+935≤81,可知平均数可能为70,75,80,不可能为85.故选ABC .5.(多选)从某地区年龄在25~55岁的人员中,随机抽取100人,了解他们对今年两会热点问题的看法,绘制出频率分布直方图,如图所示,则下列说法正确的是( )A .抽取的100人中,年龄在40~45岁的人数大约为20B .抽取的100人中,年龄在35~45岁的人数大约为40C .抽取的100人中,年龄在40~50岁的人数大约为50D .抽取的100人中,年龄在35~50岁的人数大约为60解析:选AD .根据频率分布直方图的性质得(0.01+0.05+0.06+a +0.02+0.02)×5=1,解得a =0.04,所以抽取的100人中,年龄在40~45岁的大约为0.04×5×100=20,所以A 正确;年龄在35~45岁的人数大约为(0.06+0.04)×5×100=50,所以B 不正确;年龄在40~50岁的人数大约为(0.04+0.02)×5×100=30,所以C 不正确;年龄在35~50岁的人数大约为(0.06+0.04+0.02)×5×100=60,所以D 正确.故选AD .6.(2020·开封市定位考试)某工厂生产A ,B ,C 三种不同型号的产品,产品数量之比为k ∶5∶3,现用分层抽样的方法抽出一个容量为120的样本,已知A 种型号产品共抽取了24件,则C 种型号产品抽取的件数为________.解析:依题意得24120=k k +5+3,解得k =2,所以C 种型号产品抽取的件数为32+5+3×120=36.答案:367.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是________.解析:由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好.答案:丙8.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.解析:设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.则志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.答案:(1)0.04(2)4409.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:(1)求a、b、c(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解:(1)由题意可得,b =1-(0.015+0.125+0.5+0.31)=0.05,a =200×0.05=10,c =200×0.5=100.(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.所以P =162200=0.81. (3)这次数学测验样本的平均分为x -=16×3+32.1×10+55×25+74×100+88×62200=73, 所以这次数学测验的年级平均分大约为73分.10.为了解甲、乙两个快递公司的工作状况,假设同一个公司快递员的工作状况基本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30天)的快递件数记录结果中随机抽取10天的数据,制图如下:每名快递员完成一件货物投递可获得的劳务费情况如下:甲公司规定每件4.5元;乙公司规定每天35件以内(含35件)的部分每件4元,超出35件的部分每件7元.(1)根据图中数据写出甲公司员工A 在这10天投递的快递件数的平均数和众数;(2)根据图中数据估算两公司的每位员工在该月所得的劳务费.解:(1)甲公司员工A 在这10天投递的快递件数的平均数为36,众数为33.(2)根据题图中数据,可估算甲公司的每位员工该月所得劳务费为 4.5×36×30=4 860(元),易知乙公司员工B 每天所得劳务费X 的可能取值为136,147,154,189,203,所以乙公司的每位员工该月所得劳务费约为110×(136×1+147×3+154×2+189×3+203×1)×30=165.5×30=4 965(元). [综合题组练]1.(2020·安徽五校联盟第二次质检)数据a 1,a 2,a 3,…,a n 的方差为σ2,则数据2a 1,2a 2,2a 3,…,2a n 的方差为( )A .σ22B .σ2C .2σ2D .4σ2解析:选D .设a 1,a 2,a 3,…,a n 的平均数为a ,则2a 1,2a 2,2a 3,…,2a n 的平均数为2a ,σ2=(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n. 则2a 1,2a 2,2a 3,…,2a n 的方差为(2a 1-2a )2+(2a 2-2a )2+(2a 3-2a )2+…+(2a n -2a )2n=4×(a 1-a )2+(a 2-a )2+(a 3-a )2+…+(a n -a )2n=4σ2.故选D . 2.(多选)新闻出版业不断推进供给侧结构性改革,深入推动优化升级和融合发展,持续提高优质出版产品供给,实现了行业的良性发展.下面是2015年至2019年我国新闻出版业和数字出版业营收情况,则下列说法正确的是( )A .2015年至2019年我国新闻出版业和数字出版业营收均逐年增加B .2019年我国数字出版业营收超过2015年我国数字出版业营收的2倍C .2019年我国新闻出版业营收超过2015年我国新闻出版业营收的1.5倍D .2019年我国数字出版业营收占新闻出版业营收的比例未超过三分之一解析:选ABD .根据图示数据可知A 正确;1 935.5×2=3 871<5 720.9,故B 正确;16 635.3×1.5=24 952.95>23 595.8,故C 不正确;23 595.8×13≈7 865>5 720.9,故D 正确.故选ABD .3.甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.解:(1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.x -甲=10+13+12+14+165=13; x -乙=13+14+12+12+145=13, s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4; s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙,可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.4.(2020·广州市调研测试)某蔬果经销商销售某种蔬果,售价为每千克25元,成本为每千克15元.销售宗旨是当天进货当天销售.如果当天卖不出去,未售出的全部降价以每千克10元处理完.根据以往的销售情况,按[0,100),[100,200),[200,300),[300,400),[400,500]进行分组,得到如图所示的频率分布直方图.(1)根据频率分布直方图计算该种蔬果日需求量的平均数x -(同一组中的数据用该组区间中点值代表);(2)该经销商某天购进了250千克该种蔬果,假设当天的需求量为x 千克(0≤x ≤500),利润为y 元.求y 关于x 的函数关系式,并结合频率分布直方图估计利润y 不小于1 750元的概率.解:(1)x -=50×0.001 0×100+150×0.002 0×100+250×0.003 0×100+350×0.0025×100+450×0.001 5×100=265.故该种蔬果日需求量的平均数为265千克.(2)当日需求量不低于250千克时,利润y =(25-15)×250=2 500(元),当日需求量低于250千克时,利润y =(25-15)x -(250-x )×5=15x -1 250(元),所以y =⎩⎨⎧15x -1 250,0≤x <2502 500,250≤x ≤500, 由y ≥1 750,得200≤x ≤500,所以P (y ≥1 750)=P (200≤x ≤500)=0.003 0×100+0.002 5×100+0.001 5×100=0.7. 故估计利润y 不小于1 750元的概率为0.7.。
《用样本估计总体》统计(总体取值规律的估计)
由于样本是总体的一个随机抽样,因 此样本方差可以作为总体方差的估计 。在统计学中,这种用样本方差来估 计总体方差的方法称为二次估计。二 次估计是一种对总体参数的间接估计 方法,通常用于描述一个未知的、但 感兴趣的参数。
估计的准确性
虽然样本方差可以作为总体方差的估 计,但这种估计的准确性取决于样本 的代表性。如果样本是总体的一个随 机抽样,那么样本方差与总体方差之 间的差异通常会较小,从而使得估计 较为准确。然而,如果样本不是随机 抽样,那么样本方差可能会偏离总体 方差,从而使得估计不准确。
估计的准确性
虽然样本中位数可以作为总体中位数 的估计,但这种估计的准确性取决于 样本的代表性。如果样本是总体的一 个随机抽样,那么样本中位数与总体 中位数之间的差异通常会较小,从而 使得估计较为准确。然而,如果样本 不是随机抽样,那么样本中位数可能 会偏离总体中位数,从而使得估计不 准确。
总体取值规律的估
加权中位数
将每个观测值乘以相应的权重后加总,再除以权重的 总和得到的值。它常用于分析不同组观测数据之间的 比较。
方差和标准差
要点一
方差
每个观测值与均值之差的平方的总和再除以观测次数 。它反映的是一组数据的离散程度。
要点二
标准差
方差的平方根。它也反映了一组数据的离散程度,并 且与方差一样,标准差越大,数据点越分散;标准差 越小,数据点越集的调查分析
总结词
通过抽样调查,我们能够了解该城市居民的收入情况 ,并估计总体特征。
详细描述
首先,我们需要在城市中随机抽取一定数量的居民作 为样本。然后,收集这些居民的收入数据,并计算样 本的平均收入、中位数、标准差等统计指标。通过这 些指标,我们可以估计该城市居民的总体平均收入、 中位数、标准差等特征。此外,我们还可以计算样本 的方差、标准误、置信区间等指标,以评估样本估计 总体的准确性。
4.2 用样本估计总体
C.众数是6吨
答案:D
D.极差是4吨
3.(嘉兴·中考)李大伯有一片果林,共有80棵果树.某 日,李大伯开始采摘今年第一批成熟的果子,他随机选取 2棵果树共摘得10个果子,质量分别为(单位:㎏): 0.28,0.26,0.24,0.23,0.25,0.24,0.26,0.26,
0.25,0.23.以此估算,李大伯收获的这批果子的单个质
)
2.(凉山·中考)2010年因干旱影响,凉山州政府鼓 励居民节约用水,为了解居民用水情况,在某小区随机抽 查了20户家庭的月用水量,结果如下表: 月用水量(吨) 户数 4 4 5 5 6 7 8 3 9 1 )
则关于这20户家庭的月用水量,下列说法错误的是( A.中位数是6吨 B.平均数是5.8吨
4.2
用样本估计总体
1.计算样本平均数和标准差使学生认识到只有样本容量
足够大,才能比较准确地反映总体的特性,这样的样本 才可靠,体会只有可靠的样本,才能用样本去估计总体.
2.通过实例,使学生体会用样本估计总体的思想,能够
根据统计结果作出合理的判断和推测,能与同学进行交 流,用清晰的语言表达自己的观点.
随机数 (学号) 成绩
111 80
254 86
167 66
94 91
276 67
它的频数分布直方图、平均成绩和标准差分别如下:
另外,同学们也分别选取了一些样本,它们同样也包含 五个个体,如下表:
随机数 132 245 78 73 5 98 89 75 随机数 (学号) 成绩 90 72 167 86 86 83 275 82 54 82
(3)合适. (4)不合适.虽然调查的家庭很多,但仅仅增加调查的数量, 不一定能够提高调查质量,本题中所调查的仅代表上因特 网的家庭,不能代表全部的家庭,因此这样的抽样调查不 具有普遍代表性.
用样本估计总体
思考1:上述100个数据中的最大值和最 小值分别是什么?由此说明样本数据的 变化范围是什么?
0.2~4.3
思考2:样本数据中的最大值和最小值 的差称为极差.如果将上述100个数据 按组距为0.5进行分组,那么这些数据 共分为多少组?
(4.3-0.2)÷0.5=8.2
思考3:以组距为0.5进行分组,上述100 个数据共分为9组,各组数据的取值范围 可以如何设定?
(2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
思考4:样本数据的频率分布直方图是 根据频率分布表画出来的,一般地,频 率分布直方图的作图步骤如何?
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点, 在纵轴上标出 [153.5,156.5) [156.5,159.5) [159.5,162.5) [162.5,165.5) [165.5,168.5) [168.5,171.5) [171.5,174.5) [174.5,177.5) [177.5,180.5]
合计
频数 1 1 4 5 8 11 6 2 1 1 40
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
频率 组距 0.5 0.4 0.3 0.2 0.1
宽度:组距
高度:
频率 组距
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
上图称为频率分布直方图,其中横轴 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高 度在数量上有何特点?
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
《统计》统计与概率(用样本估计总体)
备择假设
与零假设相反的假设,通常表示 待检验的效应或结果。
假设检验的步骤
通过选择适当的统计量,根据样本 数据计算统计量的值,然后根据预 先设定的显著性水平判断是否拒绝 零假设。
单总体参数的假设检验
平均值的假设检验
对于单样本平均值的假设检验,可以选择t检验或z检验,根据样本数据的分布情况选择合适的统计量 。
疗方案。
市场调研中的假设检验与置信区间应用
总结词
市场调研中假设检验与置信区间应用可以帮助企业了 解市场趋势和客户需求,制定更加精准的市场策略。
详细描述
在市场调研中,假设检验和置信区间可以用来评估市 场趋势的可靠性,例如消费者购买意愿、市场占有率 等。通过统计分析,可以得出更加准确的市场预测, 帮助企业制定更加精准的市场策略。
用样本中位数估计总体中位数
对于对称分布的数据,中位数和均值是相等的,因此可以用样本中位数来估计总体中位数。对于偏态分布的数 据,由于中位数对异常值不敏感,因此用样本中位数估计总体中位数更为可靠。
05
假设检验与置信区间
假设检验的基本原理
零假设
在假设检验中,首先需要设定 一个零假设,即没有待检验的
效应或结果。
详细描述
Excel提供了多种统计插件和工具,可以轻 松地完成假设检验和置信区间的计算。通 过输入数据和选择相应的统计函数,可以 快速得到结果,并对其进行解释和应用。
医学领域中的假设检验与置信区间应用
总结词
详细描述
医学领域中广泛应用假设检验和置信区间来 评估治疗效果和制定治疗方案。
在医学研究中,假设检验和置信区间被用来 评估治疗效果,例如药物疗效、手术效果等 。通过比较实验组和对照组的差异,可以得 出治疗方法的优劣,从而制定更加有效的治
用样本估计总体
组数
总体密度曲线
各个范围内取值的百分比
总体在
用样本的数字特征估计总体的数字特征 众数、中位数、平均数 众数:在一组数据中,出现次数 的数据叫做 这组数据的众数. 中位数:将一组数据按大小依次排列,把处在 位置的一个数据(或最中间两个数据的平均数) 叫做这组数据的 . 平均数:样本数据的算术平均数.即 = .
题型三
思维启迪
解析
探究提高
用样本的数字特征估计总体的数字特征
题型分类·深度剖析
题型三
思维启迪
解析
探究提高
用样本的数字特征估计总体的数字特征
题型分类·深度剖析
D
思想方法·感悟提高
方 法 与 技 巧
思想方法·感悟提高 失 误 与 防 范
A组 专项基础训练
2
3
4
5
6
7
8
9
1
练出高分
解 析
最多
最中
间
中位数
(2)样本方差、标准差 标准差s= 其中xn是 ,n是 , 是 . 是反映总体波动大小的特征数,样本方差是 标准差的 .通常用样本方差估计总体方差,当 时,样本方差很接近总体方差.
2
3
4
5
6
7
8
9
1
练出高分
解 析
A组 专项基础训练
2
3
4
5
6
7
8
9
1
练出高分
解 析
A组 专项基础训练
2
3
4
5
6
7
8
9
1
练出高分
解 析
1,1,3,3
A组 专项基础训练
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用样本估计总体一、基础知识1.频率分布直方图(1)纵轴表示频率组距,即小长方形的高=频率组距;(2)小长方形的面积=组距×频率组距=频率;(3)各个小方形的面积总和等于1 . 2.频率分布表的画法第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.3.茎叶图茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.4.中位数、众数、平均数的定义(1)中位数将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(2)众数一组数据中出现次数最多的数据叫做这组数据的众数.(3)平均数一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,x n的平均数x=1n(x1+x2+…+x n).5.样本的数字特征如果有n个数据x1,x2,…,x n,那么这n个数的(1)平均数x=1n(x1+x2+…+x n).(2)标准差s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].(3)方差s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].二、常用结论1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为x,则mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m x+a.(2)若数据x1,x2,…,x n的方差为s2,则数据ax1+b,ax2+b,…,ax n+b 的方差为a2s2.考点一茎叶图[典例](优质试题·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7 D.5,7[解析]由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以15×[56+62+65+74+(70+x )]=15×(59+61+67+65+78),解得x =3.[答案] A[解题技法] 茎叶图的应用(1)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.(2)给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中者方差较小.[专题训练]1.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为( )A .1B .2C .3D .4解析:选B 由图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,易得被污染的数字为2.2.甲、乙两名篮球运动员5场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为x 甲,x 乙,则下列结论正确的是( )A.x 甲<x 乙;乙比甲得分稳定B.x 甲>x 乙;甲比乙得分稳定C.x 甲>x 乙;乙比甲得分稳定D.x 甲<x 乙;甲比乙得分稳定解析:选A因为x甲=2+7+8+16+225=11,x乙=8+12+18+21+255=16.8,所以x甲<x乙且乙比甲成绩稳定.考点二频率分布直方图[典例]某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数.[解](1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,解得x=0.007 5.即直方图中x的值为0.007 5.(2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,(0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5,∴月平均用电量的中位数在[220,240)内.设中位数为a,则0.45+0.012 5×(a-220)=0.5,解得a=224,即中位数为224.[变透练清]1.某校随机抽取20个班,调查各班有出国意向的人数,所得数据的茎叶图如图所示.以5为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],所作的频率分布直方图是()解析:选A以5为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],各组的频数依次为1,1,4,2,4,3,3,2,可知画出的频率分布直方图为选项A中的图.2.(变结论)在本例条件下,在月平均电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取________户.解析:月平均用电量在[220,240)的用户有0.012 5×20×100=25(户).同理可得月平均用电量在[240,260)的用户有15户,月平均用电量在[260,280]的用户有10户,月平均用电量在[280,300]的用户有5户,故抽取比例为1125+15+10+5=1 5.所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).答案:53.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由.解:(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]6组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)估计全市居民中月均用水量不低于3吨的人数为3.6万.理由如下:由(1)知,100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000=3.6(万).考点三样本的数字特征考法(一)样本的数字特征与频率分布直方图交汇[典例](优质试题·辽宁师范大学附属中学模拟)某校初三年级有400名学生,随机抽查了40名学生测试1分钟仰卧起坐的成绩(单位:次),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是()A.该校初三学生1分钟仰卧起坐的次数的中位数为25B.该校初三学生1分钟仰卧起坐的次数的众数为24C.该校初三学生1分钟仰卧起坐的次数超过30的人数约有80D.该校初三学生1分钟仰卧起坐的次数少于20的人数约为8[解析]第一组数据的频率为0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三组数据的频率为0.08×5=0.4,∴中位数在第三组内,设中位数为25+x,则x×0.08=0.5-0.1-0.3=0.1,∴x=1.25,∴中位数为26.25,故A错误;第三组数据所在的矩形最高,第三组数据的中间值为27.5,∴众数为27.5,故B 错误;1分钟仰卧起坐的次数超过30的频率为0.2,∴超过30次的人数为400×0.2=80,故C正确;1分钟仰卧起坐的次数少于20的频率为0.1,∴1分钟仰卧起坐的次数少于20的人数为400×0.1=40,故D错误.故选C.[答案] C[解题技法]频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考法(二)样本的数字特征与茎叶图交汇[典例]将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为________.[解析] 由茎叶图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4.故s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367. [答案] 367[解题技法]样本的数字特征与茎叶图综合问题的注意点(1)在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.(2)茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据,因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.考法(三) 样本的数字特征与优化决策问题交汇[典例] (优质试题·周口调研)甲、乙两人在相同条件下各射击10次,每次中靶环数情况如图所示.(1)请填写下表(写出计算过程):(2)①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);③从折线图上两人射击命中环数的走势看(分析谁更有潜力).[解]由题图,知甲射击10次中靶环数分别为9,5,7,8,7,6,8,6,7,7.将它们由小到大排列为5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数分别为2,4,6,8,7,7,8,9,9,10.将它们由小到大排列为2,4,6,7,7,8,8,9,9,10.(1)x甲=110×(5+6×2+7×4+8×2+9)=7(环),x乙=110×(2+4+6+7×2+8×2+9×2+10)=7(环),s2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,s2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]=110×(25+9+1+0+2+8+9)=5.4.填表如下:(2)①∵平均数相同,s2甲<s2乙,∴甲成绩比乙稳定.②∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.③∵甲成绩在平均数上下波动,而乙处于上升势头,从第三次以后就没有比甲少的情况发生,∴乙更有潜力.[解题技法]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[专题训练]1.对某商店一个月内每天的顾客人数进行统计,得到样本的茎叶图(如图所示),则该样本中的中位数、众数、极差分别是()A.46,45,56B.46,45,53C.47,45,56 D.45,47,53解析:选A样本共30个,中位数为45+472=46;显然样本数据出现次数最多的为45,故众数为45;极差为68-12=56,故选A.2.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:() A.甲B.乙C.丙D.丁解析:选C由表格中数据可知,乙、丙平均环数最高,但丙方差最小,说明成绩好,且技术稳定,选C.3.某仪器厂从新生产的一批零件中随机抽取40个进行检测,如图是根据抽样检测得到的零件的质量(单位:克)绘制的频率分布直方图,样本数据按照[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96]分成8组,将其按从左到右的顺序分别记为第一组,第二组,……,第八组.则样本数据的中位数在第________组.解析:由题图可得,前四组的频率为(0.037 5+0.062 5+0.075 0+0.100 0)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.100 0×2=8,故中位数在第四组.答案:四[课时跟踪检测]A级1.一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本在[40,60)内的数据个数为()A.14B.15C.16 D.17解析:选B由题意,样本中数据在[20,60)上的频数为30×0.8=24,所以估计样本在[40,60)内的数据个数为24-4-5=15.2.(优质试题·长春质检)如图所示是某学校某年级的三个班在一学期内的六次数学测试的平均成绩y关于测试序号x的函数图象,为了容易看出一个班级的成绩变化,将离散的点用虚线连接,根据图象,给出下列结论:①一班成绩始终高于年级平均水平,整体成绩比较好;②二班成绩不够稳定,波动程度较大;③三班成绩虽然多数时间低于年级平均水平,但在稳步提升.其中正确结论的个数为()A.0 B.1C.2 D.3解析:选D①由图可知一班每次考试的平均成绩都在年级平均成绩之上,故①正确.②由图可知二班平均成绩的图象高低变化明显,可知成绩不稳定,波动程度较大,故②正确.③由图可知三班平均成绩的图象呈上升趋势,并且图象的大部分都在年级平均成绩图象的下方,故③正确.故选D.3.(优质试题·贵阳检测)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是()A.15 B.18C.20 D.25解析:选A根据频率分布直方图,得第二小组的频率是0.04×10=0.4,∵频数是40,∴样本容量是400.4=100,又成绩在80~100分的频率是(0.01+0.005)×10=0.15,∴成绩在80~100分的学生人数是100×0.15=15.故选A.4.优质试题年4月,泉州有四处湿地被列入福建省首批重要湿地名录,某同学决定从其中A,B两地选择一处进行实地考察.因此,他通过网站了解上周去过这两个地方的人对它们的综合评分,并将评分数据记录为右图的茎叶图,记A,B两地综合评分数据的均值分别为x A,x B,方差分别为s2A,s2B.若以备受好评为依据,则下述判断较合理的是()A.因为x A>x B,s2A>s2B,所以应该去A地B.因为x A>x B,s2A<s2B,所以应该去A地C.因为x A<x B,s2A>s2B,所以应该去B地D.因为x A<x B,s2A<s2B,所以应该去B地解析:选B因为x A=16×(72+86+87+89+92+94)≈86.67,x B=16×(74+73+88+86+95+94)=85,s 2A ≈16[(72-86.67)2+(86-86.67)2+(87-86.67)2+(89-86.67)2+(92-86.67)2+(94-86.67)2]≈50.56,s 2B =16[(74-85)2+(73-85)2+(88-85)2+(86-85)2+(95-85)2+(94-85)2]=76,所以x A >x B ,s 2A <s 2B (A 数据集中,B 数据分散),所以A 地好评分高,且评价稳定.故选B.5.(优质试题·青岛三中期中)已知数据x 1,x 2,…,x n 的平均数x =5,方差s 2=4,则数据3x 1+7,3x 2+7,…,3x n +7的平均数和标准差分别为( )A .15,36B .22,6C .15,6D .22,36解析:选B ∵x 1,x 2,x 3,…,x n 的平均数为5,∴x 1+x 2+…+x n n =5,∴3x 1+3x 2+…+3x n n +7=3(x 1+x 2+…+x n )n+7=3×5+7=22.∵x 1,x 2,x 3,…,x n 的方差为4,∴3x 1+7,3x 2+7,3x 3+7,…,3x n +7的方差是32×4=36,故数据3x 1+7,3x 2+7,…,3x n +7的平均数和标准差分别为22,6,故选B.6.(优质试题·江苏高考)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.解析:这5位裁判打出的分数分别是89,89,90,91,91,因此这5位裁判打出的分数的平均数为89+89+90+91+915=90. 答案:907.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.解析:设被抽查的美术生的人数为n,因为后2个小组的频率之和为(0.037 5+0.012 5)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n=5+15+250.75=60.答案:608.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为________.解析:由题意知这组数据的平均数为10,方差为2,可得x+y=20,(x-10)2+(y-10)2=8,设x=10+t,y=10-t,由(x-10)2+(y-10)2=8得t2=4,所以|x-y|=2|t|=4.答案:49.某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;。