2021年高中数学选修本(文科)总体分布的估计(1)
高三数学课件总体分布的估计优选PPT文档
频率 组距
25.235 25.295 25.355 25.415 25.475 25.535
产品尺寸
频率分布直方图中每个小矩形的面积就是样本中 数据落在该组内的频率. 样本的容量越大,所分组数越多,各组的频率就越 接近于总体在相应各组取值的概率.当样本的容量 无限增大,分组的组距无限缩小,那么频率分布直 方图就会无限接近于一条光滑的曲线——总体密度 曲线.
0.2. 由总体密度曲线可知,总体在区间(a,b)内取值的概率就是由x轴、直线x=a、x=b以及总体密度曲线所围成的图形的面积.
样本的容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率. 频率分布条形图的横轴表示试验的结果,纵轴表示频率
0.1. 当样本的容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑的曲线——总体密度曲线.
这种总体取值的概率分布规律通常称为总体分布
相应的概率.由此可得下表: 解:(1)样本的频率分布表
把正面向上的结果记为0,反面向上的结果记为1,则上面的频率分布表还可以用下面的条形图来表示 解:(1)样本的频率分布表
把正面向上的结果记为0,反面向上的结果记为1,则上面的频率分布表还可以用下面的条形图来表示
频率[1分1布.条3形5图,1的1横.轴4表5示] 试验的结7果,纵轴表示频率
0.07
由总体密度曲线可知,总体在区间(a,b)内取值的概率就是由x轴、直线x=a、x=b以及总体密度曲线所围成的图形的面积.
解:(1)样本的频率分布表
产品 一级品
频数 5
频率 0.17
二级品
人教版高中数学教案-总体分布的估计
7 8 9944647 3第二課時總體分佈的估計【學習目標】1、會列頻率分佈表,畫頻率分佈長條圖、頻率折線圖和莖葉圖。
;2、會用樣本頻率分佈估計總體分佈。
【考綱要求】總體分佈的估計為A級要求【基礎自測】1、某人在同一條件下射靶50次,其中射中5環或5環以下2次,射中6環3次,射中7環9次,射中8環21次,射中9環11次,射中10環4次,該射擊者射中7環—9環的概率約是_______________。
2、一個容量為100的樣本分成若干組,已知某組的頻率為0.4,則該組的頻數是_____________3、為了瞭解某地區高三學生的體重情況,抽查了該地區內100名年齡為17歲~18歲的男生的體重(kg)情況,得到頻率分佈長條圖如圖所示, 則這100名學生中體重在[58.5,60.5] 學生的人數____________4、右圖是2006年中央電視臺舉辦的挑戰主持人大賽上,七位評委為某選手打出的分數的莖葉統計圖,去掉一個最高分和一個最低分後,所剩資料的平均數和方差分別為______________[典型例析]例1:下表給出了某校500名12歲男孩中用隨機抽樣得出的120人的身高(單位cm)(1)列出樣本頻率分佈表﹔(2)畫出頻率分佈長條圖;(3)估計身高小於134cm的人數占總人數的百分比.。
例2從高三學生中抽取50名同學參加數學競賽,成績的分組及各組的頻數如下:(單位:分)[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出樣本的頻率分佈表;(2)畫出頻率分佈長條圖;(3)估計成績在[60,90)分的學生比例;(4)估計成績在85分以下的學生比例.。
频率分布直方图125.45130.45160.45身高频率组距0.036
总体分布的估计
张家港市后塍高级中学 周明
统计学中的两个核心问题: ① 如何从总体中抽取样本? ② 如何用样本估计总体?
总体分布:总体 __取__值__的__概__率_分__布__规__律___ 叫做总体分布;
总体分布反映了总体在各个范围内取值的 _概__率__,通常用样本的 _频__率__ 分布去估计总 体分布,一般说来,样本的容量越大,这种 估计就越 精__确___.
[30, 33) 10 0.10 0.95
[33, 36) 5 0.05 1.00 合计 100 1.00
频率分布的直方图
频率 组距
0.10 0.08 0.06 0.04 0.02
分组 [12, 15) [15, 18) [18, 21) [21, 24) [24, 27) [27, 30) [30, 33) [33, 36)
[24, 27) 0.69
0.6
[27, 30) 0.85
0.4
[30, 33) 0.95
0.2
[33, 36) 1.00
样本数据
12 15 18 21 24 27 30 33 36
例2、一个容量为100的样本,数据的分组和
各组的一些相关信息如下:
分 组 频数 频率 累积频率 ③ 根椐累
合计
55
55
频率
0.109 0.127 0.255 0.309 0.091 0.073 0.036 1.00
频率分布直方图
频率
0.06
组距
0.05
0.04
0.03
0.02
0.01
125.45 130.45
分组 [125.45, 130.45) [130.45, 135.45) [135.45, 140.45) [140.45, 145.45) [145.45, 150.45) [150.45, 155.45) [155.45, 160.45)
高中数学《总体分布的估计》教案1(1) 新人教A版必修3
总体分布的估计(1)用样本的数字特征估计总体的数字特征教学目标:知识与技能(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识。
过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。
重点与难点重点:用样本平均数和标准差估计总体的平均数与标准差。
难点:能应用相关知识解决简单的实际问题。
教学设想【创设情境】在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。
——用样本的数字特征估计总体的数字特征(板出课题)。
【探究新知】<一>、众数、中位数、平均数〖探究〗:P62(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。
例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见课本第62页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。
鼎尖教案人教版高中数学选修系列14总体分布的估计共一课时
鼎尖教案】人教版高中数学选修系列:14 总体分布的估计共一课时§1.4 总体分布的估计课时安排1 课时从容说课总体的分布就是相应的随机变量的概率分布. 当总体中的个体取不同的数值很少时, 其频率分布表中所取样本的不同数值及其相应的频率,其几何表示就是相应的条形图, 这里的" 总体中的个体取不同数值很少", 并不是指" 总体中的个体数很少". 当总体中的个体取不同数值较多,甚至无限时, 对其频率分布的研究要像前面连续型随机变量频率分布一样, 其几何图形是频率直方图.样本的频率分布与相应总体分布的关系, 即频率分布将随着样本容量的增大而更加接近总体分布. 当样本容量无限增大, 分组的组距无限缩小时, 频率分布直方图就会演变成一条光滑曲线-- 反映总体分布的概率密度曲线.在教学时,我们利用多媒体课件进行演示, 增强直观效果.要求学生一定要掌握如下两点:(1) 会制作条形图与直方图, 并搞清区别. 前者频率分布表中列出的是几个不同数值的频率, 相应的条形图是用其高度来表示的各个取值的频率;后者的频率分布表列出的是在各个不同区间内取值的频率, 相应的直方图是用图形面积的大小来表示各个区间内取值的频率.(2)能根据样本的分布去估计总体的分布. 可以选几道小的题目进行训练.第八课时课题§1.4 总体分布的估计教学目标一、教学知识点1. 深刻理解总体取值的概率分布规律即总体分布.2. 理解并掌握频率分布表和频率分布直方图, 理解累积频率3. 掌握总体密度曲线, 理解总体密度曲线的含义及作用.二、能力训练要求1. 会用样本频率分布去估计总体分布.2. 能列出频率分布表(含累积频率)能画出频率分布的条形直方图;会画出累积频率的分布图.三、德育渗透目标1. 培养学生收集信息、处理信息的能力, 学会生存、学会劳动.2. 培养学生的辩证唯物主义观点(主要是运动观点、审美观点).3. 培养学生动手操作能力、高度概括能力, 数形结合、分类讨论思想.4. 培养从函数的角度去认识累积分布函数的认识论观点. 教学重点总体分布的概念和总体密度曲线的概念的建立是本课时的重点内容. 用样本估计总体涉及两方面的问题:一是如何用样本的某种特征数去估计总体的相应的特征数;二是如何用样本的频率去估计总体分布.教学难点总体分布和总体密度曲线的概念的建立是本课时的教学难点将总体与随机变量沟通后, 总体的分布也就是相应的随机变量的概率分布. 学会从另一个角度来看问题, 即利用化归思想来研究总体分布.教学方法建构主义观点在高中数学课堂教学中的实践, 在初中已作了初步介绍:提出了总体、个体、样本、样本容量等概念, 并用样本平均数去估计总体平均数. 在这个前提下, 我们进一步学习用样本的分布去估计总体的分布, 于是将初中的概念和观点"用样本平均数去估计总体平均数"进行同化和顺应, 最终达到了建构的要求.教具准备实物投影仪(或幻灯机和胶片或多媒体课件)利用现代化教学工具来演示两个例子的数据表和频率分布的直方图. 幻灯片记作:§ 1.4 A 学习概率时, 我们介绍的历史上所做的抛掷硬币的大量重复试验, 试验结果如下表(从大量的重复试验中取出容量为72088 的样本)试验结果频数频率概率正面向上361240.50110.5 反面向上359640.49890.5幻灯片:记作§ 1.4 B 振华机电工具有限责任公司的检验科, 对该公司的某生产车间规定尺寸为25.40 mm勺一大堆产品中任取100件进行尺寸关的检验, 测得它们的实际尺寸如下:25.3925.3625.3425.4225.4525.3825.3925.4225.4725.35 25.4125.4325.4425.4825.4525.4325.4625.4025.5125.4 525.4025.3925.4125.3625.38 25.3125.5625.4325.4025.38 25.3725.4425.3325.4625.40 25.4925.3425.4225.5025.3725.3525.3225.4525.4025.2 725.4325.5425.3925.4525.4325.40 25.43 25.44 25.41 25.53 25.3725.3825.2425.4425.4025.3625.4225.3925.4625.3 825.3525.3125.3425.4025.3 625.4125.3225.3825.4225.4 025.3325.3725.4125.4925.3 525.4725.3425.3025.3925.3 625.4625.2925.4025.3725.3 325.4025.3525.4125.3725.4 725.3925.4225.4725.3825.39教学过程I.课题导入同学们, 在初中我们学习过样本的频率分布, 上学期我们又学习了概率知识,在学习概率时, 我们介绍的历史上所做的抛掷硬币的大量重复试验,(此时打出幻灯片A), 在这个问题中, 抛掷硬币试验的结果的全体构成一个总体(为便于研究问题, 可把出现"正面向上"的结果记为0,把出现"反面向上"的结果记为1), 每次抛掷硬币的结果是总体中的一个个体. 那么, 上面的表格就是从总体中抽取的容量为72088 的相当大的样本的频率分布表. 这个分布图还可以用如图1- 4 所示的条形图表示.(条形图是用其高度来表示取各值的频率)图1-4 我们看到,随着试验次数的不断增加,出现"正面向上"和"反面向上"的频率值都越来越接近于0.5, 在它附近摆动. 当试验次数无限增大时, 两种试验结果的频率值就成为相应的概率(见幻灯片中的表). 表中排除了抽样造成的误差, 精确地反映了总体取值的概率分布规律. 这种总体取值的概率分布规律通常称为总体分布.(板书课题)□.讲授新课[师]什么叫总体分布?你们能从刚才我们的研究中进行总结和概括吗?[生]总体取值的概率分布规律叫做总体分布. [师]从上例可以看出, 我们是用样本的频率分布来估计总体分布的, 那么我们如何操作呢?下面我们再看一个问题(打出幻灯片§ 1.1.4 B), 请同学们看银幕上的100个数据.如果把这堆产品中产品尺寸的全体看作一个总体, 那么上面的数据的含义是什么?[生]这100个数据就是从总体中抽取的一个容量为100 的样本.[师]这道例题与前一个例子(抛掷硬币问题)是相同的吗?[生]这两个问题是不同的,抛掷硬币的例子中, 尽管抛掷硬币的次数达到72088次, 即样本容量为72088,但所取不同值仅有2个(用0和1表示). 从这里我们也可看出"总体中的个体取不同数值很少"并不是指" 总体中的个体数很少", 而第二个问题的总体取值较多, 不能一个一个地取, 我们可以分层次、分段地取值,即在某一段内,这种尺寸的个数有几个, 然后再计算频率, 再作出条形图.[师]刚才这位同学说,对于这个问题, 分层次或分段地取值, 用我们的数学术语来讲就是这里的总体可以在一个实数区间内取值( 称为连续型总体), 你们能用初中学过的方法来求它们的频数、频率吗?[生甲]这100 个数据中最小的是25.24, 最大的是25.56. 组成一个区间[ 25.24,25.56 ], 区间长度为0.32, 将长度进行十等分, 这样区间就被等分为10个长度相等的区间, 即 [25.24,25.272),[ 25.272,25.304), [25.304,25.336),..., [25.528,25.56 ]. 然后在各个区间上进行统计,例如, 第一个区间上有两个值,频数为2, 频率为0.02. 第二个区间上也有2 个值,频数为2,频率为0.02. 继续下去.列出表格,再画出频率分布的直方图即可.[生乙]我赞同他的观点和方法, 但我想改进区间的两端数字有利于操作. 例如, 区间两端点的千分位上的数字全部写为5, 即划分为[ 25.235,25.265), [ 25.265,25.295),[ 25.295,25.325), [25.325,25.355),..., [ 25.505,25.535),[25.535,25.565). 这样将这些数字划到11 个实数区间内, 我们列表进行统计,如第一个区间只有一个数值, 第二个区间内有2个数值,第三个区间有5个数值,..., 第10个区间内有 2 个数值, 第11 个区间内也有2 个数值. 然后再分别计算出频率、累积频率 , 最后作出图形 . [师]这两位同学的解决问题的方法是非常好的 . 第一个同学 敢于突破常规 , 利用区间划分的方法来解决问题 , 虽然对于区 间两个端点数字而言无规律 ,但不妨碍我们的统计 , 如果区间 划分得再细一点 ,那么统计的结果更具有说服力 . 而第二位同 学他着眼于区间的两个端点的数值 ,便于书写和记忆 , 这样的 划分比第一位同学的区间段多了 1段. 其实他们的数学思想 方法和操作步骤都是一样的 . 下面我们就以第二位同学所说 的区间划分来解决本题 . 请同学们先统计各区间段上的尺寸 的个数 , 写出它们的频数、频率、累积频率 . 并设计表格填写 .生]分 组个数累计频 数频 率累积频率25.355,25.385) 正正正正 180.180.38 [25.385,25.415) 正正正正正 250.250.63[ 25.415,25.445)正正正正 160.160.79 [25.445,25.475) 正正正 130.130.92 25.475,25.505) 正 40.040.9625.505,25.535) 正 20.020.98[ 25.535,25.565) 正 20.021.00 合 计 1001.0025.235,25.265)10.010.01 25.265,25.295) 正 20.020.0325.295,25.325) 正 50.050.0825.325,25.355)正正正 120.120.20[师]这位同学设计的表格很好. 根据表格数字,你们计算产品尺寸小于25.295 mm勺频率,产品尺寸小于25.325 mm勺频[生]产品尺寸小于25.295 mm的频率为0.01+0.02=0.03,产品尺寸小于25.325 mm的频率是0.01+0.02+0.05=0.08.[师]你们能计算产品尺寸小于25.385 mm的频率吗?[生](众生齐声回答)0.38![师]怎么计算出来的?[生](众生齐声回答)产品尺寸小于25.385m的频率等于前五组相加, 即为0.01+0.02+0.05+0.12+0.18=0.38.[生](另一个学生站起来说)也可以这样做, 前三组的频率之和为0.08, 前四组的频率之和为0.08+0.12=0.20, 那么前五组的频率之和为0.20+0.18=0.38.[师]他的这种算法是很好的!要充分利用前面的工作成果你们把这些频率的和叫什么?(进行命题)[生甲]频率的迭加.[生乙]频率的累计.[生丙]累积频率. 因为它是由前面的频率累加起来的, 所以我们把它称为累积频率, 也就是"积累" 的意思.(课堂上, 学生的争论不休是正常现象, 这是进步的表现, 是创新启动, 这时教师要当好裁判员, 这就需要教师要有更高超的教学技艺和精湛的业务知识)[师]我认为这三位学生的命题都是对的,都突出了这个数值的真实含义及形成的过程. 这种样本数据小于某一数值的频率, 通常叫做累积频率.请同学们将上述表格中补上一个栏目" 累积频率", 并把各数值填写进去.(这时将表格中后补的部分用虚线框起来)[师]根据频率分布表, 我们能否作出频率分布直方图呢?[生]可以, 我来试试看.图1- 5 [师]从刚才这位同学所画的图形可以得到什么结论呢?[生]这张图表明了所抽取的100件产品中,尺寸落在各个小组内的频率的大小.样本容量越大,所分组数越多, 各组的频率就越接近于总体在相应各组取值的概率.[师]设想这样一个问题,样本容量无限增大, 分组的组距无限缩小, 那么频率分布直方图又作如何变化?(渗透极限思想)[生]频率分布直方图就会无限接近于一条光滑曲线.(说着说着,她走到黑板前, 把图画了出来)图1-6[师]我们把这条曲线叫做总体密度曲线, 它反映了总体分布, 即反映了总体在各个范围内取值的概率.根据这条曲线, 图中带斜线部分的面积,就是总体在区间(a,b)内取值的概率. 同学们, 能根据这个图(曲线)得到什么结论呢?[生]通常我们不易知道一个总体的分布情况, 但往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布. 样本容量越大, 这种估计就越精确.[师]频率分布表中,已列出各组右端点的累积频率, 可以画出累积频率分布图, 常把它放在频率分布直方图的正下方, 横轴表示产品的尺寸的长度,纵轴表示累积频率. 如何作出累积频率分布图呢?[生]建立坐标系, 横轴表示产品的长度,纵轴表示累积频率, 按照表中的各累积频率,在图中描出相应的各点. 如分点25.325 的累积频率为0.08, 就在图中描出横坐标是25.325 、纵坐标是0.08 的一个点, 然后用线段将各点依次连结起来, 得到一条折线, 它就是累积频率分布图.图1-7[师]频率分布和累积频率分布, 从不同的角度反映了一组数据的分布情况, 起着相互补充的作用.利用样本的累积分布图可以对总体的相应情况进行估计. 如何估计长度小于25.40 mm勺产品尺寸的概率?[生]可以在累积频率分布图中找到横坐标是25.40 mm的点, 然后量出这一点的纵坐标为0.505,即长度小于25.40 mm的产品的概率约为0.505.[师]我们知道, 当样本容量无限增大、分组的组距无限缩小时, 频率分布直方图就会趋近于一条光滑曲线-- 总体密度曲线.相应地,累积频率分布图也会趋近于一条光滑曲线-- 累积分布曲线. 它反映了总体的累积分布规律, 即曲线上任意一点P(a,b) 的纵坐标b, 表示总体取小于a 的值的概率.图1-8m.课堂练习课本P28练习1、2(学生解答用投影放出).IV.补充练习(2004 年南通市模拟题)有同一型号的汽车100辆,为了解这种汽车每耗油1 L 所行路程的情况, 现从中随机抽出10 辆在同一条件下进行耗油 1 L 所行路程实验, 得到如下样本数据( 单位:km):13.7,12.7,14.4,13.8,13.3,12.5,13.5,13.6,13.1,13.4. 并分组如下:分组[ 12.45,12.95)[12.95,13.45)[13.45,13.95)[13.95,14.45)频数频率(1) 完成上面的频率分布表;(2) 根据上表,在给定坐标系中(图1-9)画出频率分布直方图并根据样本估计总体数据落在[ 12.95,13.95) 中的概率;(3) 根据样本, 对总体的期望值进行估计.图 1 -9解:(1) 频率分布表:分组[ 12.45,12.95)[12.95,13.45)[13.45,13.95)[13.95,14.45)合计频数234110 频率0.20.30.40.11.0(2) 频率分布直方图如下:图1-10估计总体数据落在[ 12.95,13.95) 中的概率为0.7.二总体的期望值为134V .课时小结这节课我们共同研究了总体分布的概率、总体密度曲线、累积分布曲线, 这些都是建立在能正确求出频率分布表的基础上的. 请同学们总结其频率分布的步骤:[生]第一步, 计算最大值与最小值的差;第二步, 决定组距与组数,用差值比组距,如0.32 一0.03=,决定分成11组;第三步,决定分点, 使分点比数据多一位小数, 并且把第1 小组的起点稍微减小一点, 那么, 所分的11 个小组可以是 [25.235,25.265), [25.265,25.295),...,[25.535,25.565);第四步, 列出频率分布表;第五步, 画出频率分布直方图.[师]由于累积频率分布图是一条折线, 利用它可以近似得到样本数据在任意两端点值之间的频率( 它等于这两个端点值之间的累积频率之差), 在这一点上它比频率分布直方图优越因为利用频率分布直方图求两端点值之间的频率时, 这两个端点一般限于分组时的端点值. 从函数的角度去认识累积分布函数, 实际上是相应的概率密度函数的一个原函数.课后作业(一)课本P291、2、3.(二)预习课本P32§ 1.5正态分布至P32倒数第9行.板书设计§ 1.4 总体分布的估计一、总体分布的定义:总体取值的概率分布规律叫做总体分布.二、抛掷硬币的试验结果频率分布直方图产品尺寸检测频率分布表分组个数累计频数频率累积频率。
2021-2022年新高考版高三数学课件(新课标)11.4 抽样方法与总体分布的估计(试题部分)
1 / 15§11.4 抽样方法与总体分布的估计基础篇固本夯基【基础集训】考点一 随机抽样1.在简单随机抽样中,某一个个体被抽到的可能性( )A.与第几次有关,第一次可能性最大B.与第几次有关,第一次可能性最小C.与第几次无关,与抽取的第几个样本有关D.与第几次无关,每次可能性相等答案 D2.某单位员工按年龄分为A,B,C 三组,其人数之比为5∶4∶1,现用分层抽样的方法从总体中抽取一个容量为20的样本,已知C 组中甲、乙二人均被抽到的概率是145,则该单位员工总数为( )A.110B.100C.900D.800答案 B3.《中国诗词大会》的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成绩,按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词能手”称号的人数为( )A.2B.4C.5D.6答案 B4.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工 人.答案 10考点二 用样本估计总体5.甲、乙两组数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数相同的是( )A.极差B.方差C.平均数D.中位数答案 C6.为比较甲、乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月5天11时的平均气温比乙地该月5天11时的平均气温高1 ℃,则甲地该月5天11时的气温数据的标准差为( )甲 乙9 8 2 6 8 92 m 03 1 1A.2B.√2C.10D.√10。
2019-2020年高中数学选修本(文科)总体期望值的估计
2019-2020年高中数学选修本(文科)总体期望值的估计教学目标:1、使学生掌握用样本的平均数去估计总体期望值。
2、培养学生分析数据的能力。
教学重点:计算样本(总体)的平均数)(1321n x x x x nx ++++=-- 教学难点:适当抽样提高样本的代表性。
教学过程:一、引言:在初中,总体平均数(又称为总体期望值)描述了一个总体的平均水平。
对很多总体来说,它的平均数不易求得,常用容易求得的样本平均数:)(1321n x x x x nx ++++=-- 对它进行估计,而且常用两个样本平均数的大小去近似地比较相应的两个总体的平均数的大小。
二、新课:例1、在一批试验田里对某早稻品种进行丰产栽培试验,抽测了其中15块试验田的单位面积(单位面积的大小为)的产量如下:(单位:KG )504 402 492 495 500 501 405 409460 486 460 371 420 456 395这批试验田的平均单位面积产量约是多少?例2、某校高二年级进行一次数学测试,抽取40人,算出其平均成绩为80分,为准确起见,后来又抽取50人,算出其平均成绩为83分,通过两次抽样的结果,估计这次数学测试的平均成绩。
例3、被誉为“杂交水稻之父” 的中国科学院院士袁隆平,为了得到良种水稻,进行了大量试验,下表是在10个试验点对A 、B 两个品种的对比试验结果:试估计哪个品种的平均产量更高一些?三、小结 :用样本的平均数去估计总体平均数(总体期望值)简单易行,因而用途十分广泛,但估计的结果具有一定的近似性,甚至可能出现较大的偏差与疏误,这与确定性数学中通过逻辑推理得到肯定的结论的情况有所不同,学习中要注意体会。
为了使样本更充分地反映总体的情况,可在条件许可的情况下,适当增加样本容量,并力求使抽样方法更加合理,以提高样本的代表性。
四、作业:1、已知10个数据:1203 1201 1194 1200 1204 1201 1199 1204 1195 1199它们的平均数是( )A 1300B 1200C 1100D 14002、若M个数的平均数是X, N个数的平均数是Y,则这M+N个数的平均数是( )A B C D3、某工厂研制A、B两种灯泡,为了比较这两种灯泡的平均使用寿命,从这两种灯泡中各抽10只进行的使用寿命试验,得到如下数据(单位:小时)A。
2021版高考文科数学人教A版一轮复习 六十二 用样本估计总体
温馨提示:此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。
关闭Word文档返回原板块。
核心素养测评六十二用样本估计总体(30分钟60分)一、选择题(每小题5分,共25分)1.某学生在一门功课的22次考试中,所得分数的茎叶图如图所示,则此学生该门功课考试成绩的极差与中位数之和为( )A.117B.118C.118.5D.119.5【解析】选B.22次考试成绩最高为98分,最低为56分,所以极差为98-56=42,从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试成绩的极差与中位数之和为42+76=118.2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20), [20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A.56B.60C.120D.140【解析】选D.由频率分布直方图可知,每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.3.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差【解析】选A.9个数据去掉最高分与最低分2个,最中间的数据没变,所以不变的数字特征是中位数.4.(2020·芜湖模拟)由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于-1,那么对于样本1,x1,-x2,x3,-x4,x5的中位数可以表示为( )A. B.C. D.【解析】选C.因为x1<x2<x3<x4<x5<-1,所以x1<x3<x5<1<-x4<-x2,则该组样本的中位数为中间两数的平均数,即.5.(2020·潍坊模拟)如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,三星销量约占30%,苹果销量约占20%),根据该图,以下结论中一定正确的是 ( )A.四个季度中,每季度三星和苹果总销量之和均不低于华为的销量B.苹果第二季度的销量小于第三季度的销量C.第一季度销量最大的为三星,销量最小的为苹果D.华为的全年销量最大【解析】选D.对于A,第四季度中,华为销量大于50%,三星和苹果总销量之和低于华为的销量,故A错误;对于B,每个季度的销量不确定,根据每个季度的百分比无法比较苹果在第二、三季度销量的多少;对于C,第一季度销量最大的是华为,故C错误;对于D,由图知,四个季度华为的销量占比都最大,所以华为的全年销量最大,D正确.二、填空题(每小题5分,共15分)6.(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________.【解析】由题意,该组数据的平均数为=8,所以该组数据的方差是[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=.答案:7.(2020·阳泉模拟)如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是________. 世纪金榜导学号①众数是9;②平均数是10;③中位数是9;④标准差是3.4.【解析】由题意可知,该组数据分别为:7,8,9,9,9,10,11,12,12,13, 该组数据的众数为9,平均数为=10,中位数为=9.5,标准差为=,因此,①②正确.答案:①②8.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)频率分布直方图中x的值为________.(2)在这些用户中,用电量落在区间[100,250)内的户数为________.世纪金榜导学号【解析】(1)由频率分布直方图中各小矩形的总面积为1,得(0.0012+0.002 4×2+0.003 6+x+0.006 0)×50=1,解得x=0.004 4.(2)用电量在[100,250)内的频率为(0.003 6+0.004 4+0.006 0)×50=0.7,故用电量落在区间[100,250)内的户数为100×0.7=70.答案:(1)0.004 4 (2)70三、解答题(每小题10分,共20分)9.为庆祝国庆节,某中学团委组织了“歌颂祖国,爱我中华”知识竞赛,从参加考试的学生中抽出60名,将其成绩(成绩均为整数)分成[40,50),[50,60),…, [90,100]六组,并画出如图所示的部分频率分布直方图,观察图形,回答下列问题:(1)求第四组的频率,并补全这个频率分布直方图.(2)估计这次考试的及格率(60分及以上为及格)和平均分.【解析】(1)因为各组的频率和等于1,所以第四组的频率为1-(0.025+0.015×2+0.010+0.005)×10=0.3.补全的频率分布直方图如图所示.(2)依题意可得第三、四、五、六组的频率之和为(0.015+0.030+0.025+0.005)×10=0.75,则可估计这次考试的及格率是75%.因为抽取学生的平均分约为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分),所以可估计这次考试的平均分为71分. 10.为了比较两种治疗失眠症的药(分别称为A药, B药)的疗效,随机选取18位患者服用A药,18位患者服用B药,这36位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下: 服用A药的18位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.22.5 2.6 1.2 2.7 1.5 2.93.0 3.1 2.3服用B药的18位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.31.6 0.5 1.8 0.62.1 1.1 2.5 1.2 2.7(1)分别计算两组数据的平均数(小数点后保留两位小数),从计算结果看哪种药疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?并说明理由.世纪金榜导学号【解析】(1)服用A药的18位患者日平均增加的睡眠时间的平均数为=(0.6+1.2+2.7+…+3.0+3.1+2.3)≈2.23(h)服用B药的18位患者日平均增加的睡眠时间的平均数为=(3.2+1.7+1.9+…+2.5+1.2+2.7)≈1.67(h),因为2.23>1.67,所以A种药的疗效更好.(2)由观测结果可绘制如图茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.(15分钟35分)1.(5分)(2020·福州模拟)某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数与平均数分别为 ( )A.20,22.5B.22.5,25C.22.5,22.75D.22.75,22.75【解析】选C.根据频率分布直方图,得平均数为5×(12.5×0.02+17.5×0.04+22.5×0.08+27.5×0.03+32.5×0.03)=22.75,因为0.02×5+0.04×5=0.3<0.5,0.3+0.08×5=0.7>0.5,所以中位数应在20~25内,设中位数为x,则0.3+(x-20)×0.08=0.5,解得x=22.5,所以这批产品的中位数是22.5.2.(5分)(2020·郑州模拟)某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则4x+2y的值是( )A.12B.14C.16D.18【解析】选A.因为中位数为12,所以x+y=4,数据的平均数为×(2+2+3+4+ x+y+20+19+19+20+21)=11.4,要使该总体的标准差最小,即方差最小,所以(10+x-11.4)2+(10+y-11.4)2=(x-1.4)2+(y-1.4)2≥2=0.72,当且仅当x-1.4=y-1.4,即x=y=2时取等号,此时总体标准差最小,4x+2y=12.3.(5分)(2020·阳泉模拟)气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)①甲地5个数据的中位数为24,众数为22;②乙地5个数据的中位数为27,总体均值为24;③丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8. 则肯定进入夏季的地区有________.(填序号)【解析】①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22,22,24,25,26,其连续5天的日平均气温均不低于22;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19,20,27,27,27时,可知其连续5天的日平均温度有低于22 ℃的,故不确定;③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22.则肯定进入夏季的地区有甲、丙两地.答案:①③4.(10分)(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例.(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 世纪金榜导学号附:≈8.602.【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.产值负增长的企业频率为=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)=(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=n i=[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6,所以s==0.02×≈0.17,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.5.(10分)(2020·昆明模拟)栀子原产于中国,喜温暖湿润、阳光充足的环境,较耐寒.叶,四季常绿;花,芳香素雅.绿叶白花,格外清丽.某地区引种了一批栀子作为绿化景观植物,一段时间后,从该批栀子中随机抽取100棵测量植株高度,并以此测量数据作为样本,得到该样本的频率分布直方图,其中不高于1.50 m的植株高度茎叶图如图所示. 世纪金榜导学号(1)求植株高度频率分布直方图中a,b,c的值.(2)在植株高度频率分布直方图中,同一组中的数据用该区间的中点值代表,植株高度落入该区间的频率作为植株高度取该区间中点值的频率,估计这批栀子植株高度的平均值.【解析】(1)由茎叶图知,a==0.5,b==1.由频率分布直方图知(0.5+1+c+3+4)×0.1=1,所以c=1.5.(2)这批栀子植株高度的平均值的估计值为(1.35×0.5+1.45×1+1.55×3+1.65×4+1.75×1.5)×0.1=1.60(m). 【拓广探索练】(2020·佛山模拟)某高中非毕业班学生人数分布情况如表,为了了解这2 000个学生的体重情况,从中随机抽取160个学生并测量其体重数据,根据测量数据制作了如图所示的频率分布直方图. 世纪金榜导学号性别男生女生合计年级高一年级550 650 1 200高二年级425 375 800合计975 1 025 2 000(1)为了使抽取的160个样品更具代表性,宜采取分层抽样,请你给出一个你认为合适的分层抽样方案,并确定每层应抽取的样品个数.(2)根据频率分布直方图,求x的值,并估计全体非毕业班学生中体重在[45,75)内的人数.(3)已知高一全体学生的平均体重为58.50 kg,高二全体学生的平均体重为61.25 kg,试估计全体非毕业班学生的平均体重.【解析】(1)方案一:考虑到体重应与年级及性别均有关,最合理的分层应分为以下四层:高一男生、高一女生、高二男生、高二女生高一男生:×160=44(人),高一女生:×160=52(人),高二男生:×160=34(人),高二女生:×160=30(人),方案二:按性别分为两层,男生与女生:男生人数:×160=78(人),女生人数:×160=82(人).方案三:按年级分为两层,高一学生与高二学生:高一人数:×160=96(人),高二人数:×160=64(人).(2)体重在[70,80)内的学生人数的频率:1-(0.075+0.2+0.275+0.225+0.05+0.025)=0.15,x==0.015,体重在[45,75)内人数的频率为:0.1+0.275+0.225+0.075=0.675,所以估计全体非毕业班学生体重在[45,75)内的人数为:2 000×0.675= 1 350(人).(3)设高一全体学生的平均体重为=58.5 kg,频率为P1=×100%=60%.高二全体学生的平均体重为=61.25 kg,频率为P2=×100%=40%, 则估计全体非毕业班学生的平均体重为·P1+·P2=58.50×60%+61.25×40%=59.6 (kg).答:估计全校非毕业班学生的平均体重为59.6 kg.关闭Word文档返回原板块快乐分享,知识无界!感谢您的下载!由Ruize收集整理!。
最新-2021学年高中数学北师大版必修3课件:151 估计总体的分布 52 估计总体的数字特征 精品
2
0.1
3
0.15
8
0.4
4
0.2
3
0.15
20
1
(2)
(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得 众数 126,事实上,众数的精确值为 125.(2)图中虚线对应的数据是 125+2×58= 126.25 , 事 实 上 中 位 数 为 125.5. 使 用 “ 组 中 值 ” 求 平 均 数 x = 122×0.1 + 124×0.15+126×0.4+128×0.2+130×0.15=126.3,平均数的精确值为 x = 125.75.
[基础·初探]
教材整理 1 基本概念
阅读教材 P32~P36“练习”以上部分,完成下列问题. 1.频率分布表和频率分布直方图
(1)频率分布表编制的方法步骤:
计算极差
决定 ――→
__组__数__与__组__距__
决定 ――→
_分__点__
列出 ――→
频率分布表
(2)
2.频率分布折线图 (1)在频率分布直方图中,按照分组原则,在左边和右边各加一个区间,从 所加的左边区间的__中__点__开始,用线段依次连接各个矩形的顶端中点,直至右 边所加区间的中点,就可以得到一条折线,我们称之为___频__率__折__线__图___. (2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来 越稳定于总体在相应区间内取值的_概__率___.也就是说,一般地,样本容量越大, 用样本的频率分布去估计总体的分布就越_精__确___. (3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长 度则会相应随之减__小___,相应的频率折线图就会越来越接近于一条__光__滑__曲__线___.
高一数学总体分布估计
分组 [25.235,25.265) [25.265,25.295) [25.295,25.325) [25.325,25.355) [25.355,25.385) [25.385,25.415) [25.415,25.445) [25.445,25.475) [25.475,25.505) [25.505,25.535) [25.535,25.565)
总Байду номын сангаас分布
山沟里几个自然村,居住着清一色的朝鲜族。初去的时候,我感觉像似到了朝鲜国。 朝鲜族居住的房子,屋檐很宽。房子正面的屋檐下砌了台阶,人进屋的时候,要将鞋脱在屋外的台阶上。屋子里是一整面的大炕,没有屋地,炕的一头有一溜活动的地板,地板头上与大炕一平的是做饭 的锅灶。做饭的时候,要掀开地板,蹲到下面去烧火。饭做好,再将地板铺好。 鲜族人爱干净,讲究的人家都有一个被厨,每天早起,将被子整整齐齐的叠进去,屋子里便显得清净,舒爽。刚到生产队时,有一户人家搬到山外去了,我们便住了那房子,房子挺大,也是满屋炕,中 间一道拉门,女同学住一间,我们住一间。晚上,隔着纸糊的拉门,有点儿响动,相互听得清清楚楚。我们早起不叠被,只将被子连同褥子一起卷起来,靠墙边上。一些村民看了直摇头,大概是嫌我们 不利索吧。我们都不在意,每日劳动,精疲力尽的,哪顾得上这些。有同学说:成大事,不拘小节!
抽样序号
1 2 3 4 5 6 7 8 9 10
n=25
m
m/n
1
0.04
4
0.16
0
0.00
0
0.00
1
0.04
1
0.04
2
0.08
0
0.00
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2021年高中数学选修本(文科)总体分布的估计(1)
教学目标通过统计案例,会用样本频率分布估计总体分布
教学重点用样本频率分布估计总体分布
教学难点频率分布表和频率分布直方图的绘制
教学过程
一引入
在统计中,为了考察一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况。
这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。
下面我们先通过案例来介绍总体分布的估计。
二案例分析
例1为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下(单位:kg)
试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计。
解:按照下列步骤获得样本的频率分布.
(1)求最大值与最小值的差.
在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76—55=21)所得的差告诉我们,这组数据的变动范围有多大.
(2)确定组距与组数.
如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数适合的.于是组距为2,组数为11.(3)决定分点.
根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是
[54.5,56.5),[56.5,58.5),…,[74.5,76.5).
(4)列频率分布表
如表①频率分布表
(5)绘制频率分布直方图.
频率分布直方图如图1-1所示
由于图中各小长方形的面积等于相应各组的频率,这个图形的面积的形式反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分步表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计,体重在(64.5,66.5)kg 的学生最多,约占学生总数的16%;体重小于58.5kg 的学生较少,约占8%;等等. 四 小结
获得样本的频率分布的步骤:(1)求最大值与最小值的差;(2)确定组距与组数;(3)决定分点;(4)列频率分布表;(5)绘制频率分布直方图. 五 作业
54.5
56.558.574.572.5 66.568.570.576.5
62.560.564.5。