高中数学第一章统计5152估计总体的分布估计总体的数字特征教学案北师大版

合集下载

数学ⅲ北师大版1.5.2估计总体的数字特征教案

数学ⅲ北师大版1.5.2估计总体的数字特征教案

数学ⅲ北师大版1.5.2估计总体的数字特征教案5.2可能总体的数字特征一可能总体的数字特征假设随机抽样得到的样本为x x x n 12,,, ,我们把nx x x x n+++=21和nx x x x x x s s 222212)()()(-++-+-==分别称为样本均值和样本标准差,用它们来分别可能总体的均值和标准差、 注意:〔1〕假如把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变;〔2〕假如把一组数据中的每一个数据乘以一个共同的常数k ,标准差变为原来的k 倍 注意:用样本的数字特征可能总体的数字特征分两类: a) 用样本平均数可能总体平均数、样本的平均数可能总体的平均数时,样本的平均数只是总体的平均数的近似、、b) 用样本方差、标准差可能总体方差、标准差、样本容量越大,可能就越精确、用样本可能总体时,假如抽样的方法比较合理,那么样本能够反映总体的信息,但从样本得到的信息会有偏差、在上面的活动中,尽管所有的样本都来自同一总体,从这些样本中所得到的有关总体的可能仍然可能互不相同,这一现象是由抽样的随机性引起的、假如抽样方案没有问题的话,那么这些结论之因此不同,其缘故就在于样本的随机性、在随机抽样中,这种偏差是不可幸免的、尽管我们从样本数据得到的分布、均值和标准差〔通常称之样本分布、样本均值和样本标准差〕并不是总体真正的分布、均值和标准差,而只是总体的一个可能,但这种可能是合理的,特别是当样本特别大时,它们真的反映了总体的信息、例1为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换、某校使用的100只日光灯在必须换掉前的使用天数如下,试可能这种日光灯的平均使用寿命和标准差、解:各组中值分别为165,195,225,285,315,345,375,由此算得平均数约为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267、9≈268(天)、这些组中值的方差为1/100×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2128、60(天2)、 故所求的标准差约466.2128≈〔天〕因此,可能这种日光灯的平均使用寿命约为268天,标准差约为46天、例2甲、乙两种水稻试验品种连续5年的平均单位面积产量如下〔单位:t/hm 2〕,试依照这组数据可能哪一种水稻品种的产量比较稳定、解:甲品种的样本平均数为10,样本方差为02.0])102.10()1010()101.10()109.9()108.9[(5122222=-+-+-+-+-⨯ 乙品种的样本平均数也为10,样本方差为24.0])108.9()107.9()108.10()103.10()104.9[(5122222=-+-+-+-+-⨯ 因为0、24>0、02,因此由这组数据能够认为甲种水稻的产量比较稳定、 例3下面是某校日睡眠时间的抽样频率分布表〔单位:小时〕试可能该校学生的日睡眠平均时间、解1:可先要计算总睡眠时间,然后除以总人数,得样本的平均数、 因为该校这100名学生的总睡眠时间约为739275.8625.83775.73325.71775.6525.6=⨯+⨯+⨯+⨯+⨯+⨯〔小时〕 因此样本的平均日睡眠时间约为39.7100739=÷〔小时〕 答:可能该校学生的日睡眠平均时间为39.7小时、解2:求组中值与对应频率之积的和、39.702.075.806.025.837.075.733.025.717.075.605.025.6=⨯+⨯+⨯+⨯+⨯+⨯答:可能该校学生的日睡眠平均时间为39.7小时、例4为了解中学生的身体发育情况,对某一中学同年龄的50名男生的身高进行了测量结果如下〔单位:cm 〕:〔1〕列出样本的频率分布表,画出频率分布直方图; 〔2〕可能该中学身高大于172cm 的概率及同年龄的高度; 〔3〕可能该中学那个年龄的平均身高和稳定程度、 解:〔1〕样本频率分布表为:频率分布直方图如图1—6—25所示:图1—6—25〔2〕因为数据大于172cm 的频率为48.012.036.0=+ 因此能够可能数据大于172cm 的概率为0、48、〔3〕因为样本的平均数为170、1cm ,标准差为5、6cm ,因此能够可能该中学那个同年龄的高度约为170、1cm ,偏差约为5、6cm 、例5〔2006年湖南卷,文〕某高校有甲、乙两个数学建模兴趣班、其中甲班有40人,乙班50人、现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,那么该校数学建模兴趣班的平均成绩是分、解:填85、 练习题1、甲、乙两中学生在一年里学科平均分相等,但他们的方差不相等,正确评价他们的学习情况是〔〕A 、因为他们的平均分相等,因此他们的学习水平一样;B 、成绩尽管一样,方差较大,说明潜力大,学习态度踏实;C 、表面上看这两个学生平均成绩一样,但方差小的学习成绩稳定;D 、平均分相等,方差不等,说明学习水平不一样,方差较小的同学,学习成绩不稳定,忽高忽低、2、在方差的计算公式])20()20()20[(10121022212-++-+-=x x x s 中,数字10和20分别表示()A 、样本的容量和方差B 、平均数和样本的容量C 、样本的方差和平均数D 、样本的容量和平均数3、某市在非典期间一手抓防治非典,一手抓经济进展,下表是利群超市五月份一周的依照上述统计结果,你可能利群超市今年五月份的总利润是〔〕 A.6.51万元B.6.4万元C.1.47万元D.5.88万元4、某单位为了查找高产稳定的油菜品种,选了三个不同的油菜品种进行试验,每一品种在五块试验田上试种,每块试验田的面积为0、7公顷,产量情况如下表,试评定哪一个品种既高产又稳定?人体产生危害、在30条鱼的样本中发明的汞含量是: 〔1〕用前两位数作为茎,画出样本数据的茎叶图; 〔2〕描述一下汞含量的分布特点;〔3〕从实际情况看,许多鱼的汞含量超标在于有些鱼在出售之前没有被检查过、每批这种鱼的平均汞含量都比1、00ppm 大吗?〔4〕求上述样本数据的平均数和标准差;〔5〕有多少鱼的汞含量在平均数与2倍标准差的和〔差〕的范围内?。

高中数学第一章统计1.5.2估计总体的数字特征备课资料北师大版必修3201703080361

高中数学第一章统计1.5.2估计总体的数字特征备课资料北师大版必修3201703080361

高中数学第一章统计 1.5.2 估计总体的数字特征备课资料北师大版必修3备选习题1.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有()A.a>b>cB.b>c>aC.c>a>bD.c>b>a答案:D2.下列说法错误的是()A.在统计里,把所需考察对象的全体叫作总体B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大答案:B3.下列说法中,正确的是()A.数据5,4,4,3,5,2的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半D.频率分布直方图中各小长方形的面积等于相应各组的频数答案:C4.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为s12=13.2,s22=26.26,则()A.甲班10名学生的成绩比乙班10名学生的成绩整齐B.乙班10名学生的成绩比甲班10名学生的成绩整齐C.甲、乙两班10名学生的成绩一样整齐D.不能比较甲、乙两班10名学生成绩的整齐程度答案:A5.下列说法正确的是()A.根据样本估计总体,其误差与所选择的样本容量无关B.方差和标准差具有相同的单位C.从总体中可以抽取不同的几个样本D.如果容量相同的两个样本的方差满足s12<s22,那么推得总体也满足s12<s22是错的答案:C精美句子1、善思则能“从无字句处读书”。

读沙漠,读出了它坦荡豪放的胸怀;读太阳,读出了它普照万物的无私;读春雨,读出了它润物无声的柔情。

读大海,读出了它气势磅礴的豪情。

读石灰,读出了它粉身碎骨不变色的清白。

2、幸福幸福是“临行密密缝,意恐迟迟归”的牵挂;幸福是“春种一粒粟,秋收千颗子”的收获. 幸福是“采菊东篱下,悠然见南山”的闲适;幸福是“奇闻共欣赏,疑义相与析”的愉悦。

高中数学1-5-2估计总体的数字特征课件北师大版必修

高中数学1-5-2估计总体的数字特征课件北师大版必修

是对总体的一种简明的描述.它们所反映的情况有着 重要的实际意义,所以,不仅需要掌握其计算公式和 方法,还要学会通过这些数据分析其含义,从而为正 确决策提供依据.
【训练2】 某公司的33名职工的月工资(单位:元)如下:
职务 董事长 副董事长 董事 总经理 人数
工资
经理 5
2 500
管理员 3
2 000
(3)去掉李某的工资后,再计算平均工资,这能代表打工
人员这个月的收入水平吗?
(4)根据以上计算,以统计的观点,你对(3)的结果有什么
看法?
[思路探索] 本题主要考查利用统计知识对生活中的问题作 出合理的判断与决策.对于收入的平均水平可以用中位 数、平均数或众数表示,不同的解释有不同的含义,要注 意极端数据对平均值的影响.
统计量
组别 第一组 第二组
平均分数 90 80
标准差 6 4
求全班的平均成绩和标准差.

设第一组20名学生的成绩为xi(i=1,2,…,20),
第二组20名学生的成绩为yi(i=1,2,…,20). 1 依题意有: (x1+x2+…+x20)=90, 20 1 (y +y +…+y20)=80, 20 1 2 故全班平均成绩为: 20(90+80) - x 0= =85(分). 40 平均成绩- x 0=85(分),又设全班 40 名学生的标准差为 s,
【题后反思】 平均数和方差、标准差都是对一个总体特 征的描述,平均数反映了总体的平均水平,它也能反映一 个总体数据的分布规律;标准差及方差描述了样本数据对
平均数的离散程度,标准差越小,表明各个样本数据在样
本平均数的周围越集中.要求会用函数型计算器求样本的 平均数和标准差
及方差,并能根据所得数据来分析样本的特征,进而估计

(新)高中数学第一章统计1_5_1估计总体的分布教案北师大版必修3

(新)高中数学第一章统计1_5_1估计总体的分布教案北师大版必修3

5.1 估计总体的分布整体设计教学分析教科书通过问题的探究,使学生学会列频率分布表、画频率分布直方图、频率分布折线图.教科书在这里主要介绍有关频率分布的列表和画图的方法,而关于频率分布的随机性和规律性方面则给教师留下了较大的发挥空间.教师可以通过初中有关随机事件的知识,也可以利用计算机多媒体技术,引导学生进一步体会由样本确定的频率分布表和频率分布直方图的随机性;通过初中有关频率与概率之间的关系,了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想.由于可以用样本频率分布直方图估计总体分布,因此可以用样本频率分布特征来估计相应的总体分布特征,这就提供了估计总体特征的另一种途径,其意义在于:在没有原始数据而仅有频率分布的情况下,此方法可以估计总体的分布特征.三维目标1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图,理解数形结合的数学思想和逻辑推理的数学方法.3.通过对样本分析和总体估计的过程,感受数学对实际生活的需要,通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.重点难点教学重点:会列频率分布表,画频率分布直方图和频率折线图.教学难点:能通过样本的频率分布估计总体的分布.课时安排1课时教学过程导入新课思路1.在NBA的2006赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49,50;乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29,33.请问从上面的数据中你能否看出甲、乙两名运动员,在2006赛季中,哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板书课题).思路2.如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温.7月25日至8月10日41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8 32.58月8日至8月24日28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.1 32.8 29.8 25.6 24.7 30.0 30.1 29.5 30.3 32.8怎样通过上表中的数据,分析比较两时间段内的高温(≥33 ℃)状况?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.思路3.讨论:我们要了解我校学生每月零花钱的情况, 应该怎样进行抽样?提问:学习了哪些抽样方法?一般在什么时候选取什么样的抽样方法呢?讨论:通过抽样方法收集数据的目的是什么?(从中寻找所包含的信息,用样本去估计总体)指出两种估计手段:一是用样本的频率分布估计总体的分布,二是用样本的数字特征(平均数、标准差等)估计总体的数字特征.这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.推进新课新知探究提出问题(1)我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)(2)什么是频率分布?(3)频率分布直方图的特征是什么?(4)什么是频率分布折线图?讨论结果:(1)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格来改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚地看到整个样本数据的频率分布情况. (2)频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图来反映样本的频率分布.(3)频率分布直方图的特征:①从频率分布直方图可以清楚地看出数据分布的总体趋势.②从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断.(4)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.应用示例思路1例 1 1895年,在伦敦有106块男性头盖骨被挖掘出土.经考证,头盖骨的主人死于1665—1666年之间的大瘟疫.人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:mm):146 141 139 140 145 141 142 131 142 140 144 140138 139 147 139 141 137 141 132 140 140 141 143134 146 134 142 133 149 140 140 143 143 149 136141 143 143 141 138 136 138 144 136 145 143 137142 146 140 148 140 140 139 139 144 138 146 153148 152 143 140 141 145 148 139 136 141 140 139158 135 132 148 142 145 145 121 129 143 148 138149 146 141 142 144 137 153 148 144 138 150 148138 145 145 142 143 143 148 141 145 141请你估计在1665—1666年之间,英国男性头盖骨宽度的分布情况.解:这里,如果把总体看作是1665—1666年之间的英国男性头盖骨的宽度,那么我们就是要通过上面挖掘出土得到的样本信息,来估计总体的分布情况.但从上面的数据很难直接估计出总体的分布情况,为此,我们可以先将以上数据按每个数据出现的频数和频率汇成下表: 宽度/mm 频数 频率 宽度/mm 频数 频率121 1 0.009 142 7 0.066129 1 0.009 143 10 0.094131 1 0.009 144 5 0.047132 2 0.019 145 8 0.075133 1 0.009 146 5 0.047134 2 0.019 147 1 0.009135 1 0.009 148 8 0.075136 4 0.038 149 3 0.028137 3 0.028 150 1 0.009138 7 0.066 152 2 0.019139 7 0.066 153 1 0.009140 12 0.113 158 1 0.009141 12 0.113从表格中,我们就能估计出总体大致的分布情况了,如在1665—1666年之间,英国男性头盖骨宽度主要在140—150 mm 之间,130 mm 以下以及150 mm 以上所占的比率相对较小等.但是,这些关于分布情况的描述仍不够形象,为了得到更为直观的信息,我们可以再将表中的数据按照下面的方式分组:宽度分组(Δx i )频数(n i ) 频率(f i ) i i x f 120—125 mm1 0.009 0.001 8 125—130 mm1 0.009 0.001 8 130—135 mm6 0.057 0.011 4 135—140 mm22 0.208 0.041 6 140—145 mm46 0.434 0.086 8 145—150 mm25 0.236 0.047 2 150—155 mm4 0.038 0.007 6 155—160 mm 1 0.009 0.001 8先画频数分布直方图(图1).进一步,我们还可以将图1中纵坐标的频数换成ii x f ,便可以得到图2.图1图2点评:当样本量较大时,样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的概率.因此,我们就可以用样本的频率分布直方图来估计总体在任意区间内取值的频率,也即总体的分布情况.变式训练1.有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.(1)列出学生参加运动队的频率分布表.(2)画出频率分布条形图.解:(1)参加足球队记为1,参加篮球队记为2,参加排球队记为3,参加乒乓球队记为4,得频率分布表如下:试验结果 频数 频率参加足球队(记为1) 30 0.30参加篮球队(记为2) 27 0.27参加排球队(记为3) 23 0.23参加乒乓球队(记为4) 20 0.20合计 100 1.00(2)由上表可知频率分布条形图如图3:图32.为了了解中学生的身体发育情况,对某中学17岁的60名女生的身高进行了测量,结果如下(单位cm):154 159 166 169 159 156 166 162 158156 166 160 164 160 157 151 157 161158 153 158 164 158 163 158 153 157162 159 154 165 166 157 151 146 151160 165 158 163 163 162 161 154 165162 159 157 159 149 164 168 159 153列出样本的频率分布表;绘出频率分布直方图.解:列频率分布表如下:宽度分组(Δx i) 个数累计频数(n i) 频率(f i) 145.5—148.5 1 0.017148.5—151.5 3 0.050151.5—154.5 6 0.100154.5—157.5 8 0.133157.5—160.5 18 0.300160.5—163.5 11 0.183163.5—166.5 10 0.167166.5—169.5 3 0.050 合计60 1.000 根据上述数据绘制频率分布直方图如图4:图4以上两种情况的不同之处在于,前者的频率分布表列出的是几个不同数值的频率,相应的条形图是用其高度表示取各个值的频率;后者的频率分布表列出的是在不同区间内取值的频率,相应的直方图是用图表面积的大小来表示在各个区间内取值的频率.我们在处理一个数理问题时可以采用样本的频率分布估计总体分布的方法,这是因为,频率分布随着样本容量的增大更加接近于总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布的直方图就演变成一条光滑的曲线——总体密度曲线.这条曲线是客观存在的,但是我们却很难将它准确地画出,我们只能用样本的频率分布去对它进行估计.基于频率分布与相应的总体分布有这种关系,再加上我们通常并不知道一个总体的分布,我们往往是从一个总体中抽取一个样本,用样本的频率去估计相应的总体分布.一般说来,样本的容量越大,这种估计就越精确.思路2例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm). 区间界限/cm 122—126 126—130 130—134 134—138 138—142 人数 5 8 10 22 33人数20 11 6 5(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:宽度分组(Δx i) 频数(n i) 频率(f i) 122—126 5 0.04126—130 8 0.07130—134 10 0.08134—138 22 0.18138—142 33 0.28142—146 20 0.17146—150 11 0.09150—154 6 0.05154—158 5 0.04合计120 1(2)其频率分布直方图如图5:图5(3)由样本频率分布表可知身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.变式训练从某校高一年级的1 002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162 160 170 168 164 174 170 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166 作出该样本的频率分布表,并估计身高不小于170(cm)的同学所占的百分率.解:频率分布表如下:宽度分组(Δx i ) 频数累计 频数(n i ) 频率(f i ) 150.5—153.5 4 4 0.04153.5—156.5 12 8 0.08156.5—159.5 20 8 0.08159.5—162.5 31 11 0.11162.5—165.5 53 22 0.22165.5—168.5 72 19 0.19168.5—171.5 86 14 0.14171.5—174.5 93 7 0.07174.5—177.5 97 4 0.04177.5—180.5 100 3 0.03合计 100 1根据频率分布表可以估计,估计身高不小于170(cm)的同学所占的百分率为(0.14×5.1685.1711705.171--+0.07+0.04+0.03)×100%=21%. 例 2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图6),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.图6 分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为391517424+++++=0.08; 又因为频率=样本容量第二小组频数,所以样本容量=08.012=第二小组频率第二小组频数=150. (2)由图可估计该学校高一学生的达标率约为39151742391517++++++++×100%=88%. (3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组.知能训练1.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5], 9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的( )A.91%B.92%C.95%D.30%答案:A2.一个容量为20的样本数据,数据的分组及各组的频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2. 则样本在区间(-∞,50)上的频率为( )A.0.5B.0.7C.0.25D.0.05答案:B3.一个高中研究性学习小组对本地区2000年至2002年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如图7),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭___________万盒.快餐公司个数情况图 快餐公司盒饭年销售量的平均数情况图图7答案:85拓展提升为了了解一大片经济林生长情况,随机测量其中的100株的底部周长,得到如下数据表(单位:cm ).135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 109 124 87 131 97 102 123 104 104 128 105 123 111 103 105 92 114 108 104 102129 126 97 100 115 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108 123 119 98 121 101 113 102 103 104 108(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100 cm 的树木约占多少?周长不小于120 cm 的树木约占多少?解:(1)这组数据的最大值为135,最小值为80, 极差为55,可将其分为11组,组距为5. 频率分布表如下:宽度分组(Δx i ) 频数(n i ) 频率(f i )i i x f 80—85 1 0.010.002 85—90 2 0.020.004 90—95 4 0.040.008 95—100 14 0.140.028 100—105 24 0.240.048 105—110 15 0.150.030 110—115 12 0.120.024 115—120 9 0.090.018 120—125 11 0.110.022 125—130 6 0.060.012 130—135 2 0.020.004 合计 1001 0.2 (2)频率分布直方图如图8:图8(3)从频率分布表得,样本中小于100的频率为0.01+0.02+0.04+0.14=0.21,样本中不小于120的频率为0.11+0.06+0.02=0.19,估计该片经济林中底部周长小于100 cm 的树木约占21%,周长不小于120 cm 的树木约占19%.课堂小结总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.作业习题1—5 1、2.设计感想本节课是高一新课程必修三第二章《统计》中的第二节《用样本估计总体》的第一节课,尽管用样本估计总体是一种实用性很强,操作烦琐、麻烦的工作,但却是统计学中常用的方法,在生产、生活中应用非常广泛.用样本估计总体,其实就是一种“以偏概全”,“以部分代替全部”的思想.虽然有贬义的成分,但我们还是要认真去教好学好,而且,这也是平时考试和高考中的重点内容之一.本节要解决的问题就是:为何要用样本估计总体——社会生产、生活的实际需要(必要性),如比赛、竞技中预测结果,评判质量谁好谁差,水平谁高谁低经常要用到.如何去用样本估计总体——用样本的频率分布去估计总体的频率分布;怎样用样本估计总体——作出样本频率分布表或频率分布直方图,懂得用“数据”语言说话.另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育并增强学生的自信心,使学生养成良好的学习态度.。

高中数学 第一章 统计 1.5 用样本估计总体 1.5.2 估计总体的数字特征教案 北师大版必修3

高中数学 第一章 统计 1.5 用样本估计总体 1.5.2 估计总体的数字特征教案 北师大版必修3

1.5.2估计总体的数字特征本节教材分析一、三维目标1、知识与技能(1)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.(2)会用样本的基本数字特征估计总体的基本数字特征.(3)形成对数据处理过程进行初步评价的意识.2、过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.3、情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.二、教学重点:用样本平均数和标准差估计总体的平均数与标准差.三、教学难点:能应用相关知识解决简单的实际问题.四、教学建议教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计.教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题, 通过小资料栏目“估计二战期间德国坦克的总数”,让学生进一步体会分布的数字特征在实际中的应用.新课导入设计导入一在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征.导入二用随机抽样的方法获得样本,我们就会得到一组数据,统计思想的本质就是用样本估计总体.用样本估计总体,一般有两种方法:一是用样本的频率分布估计总体分布;二是用样本的数字特征估计总体的数字特征.第一种方法我们已经学习了啦,本节我们继续学习第二种方法.教学流程:↓1.创设情景,揭示课题上一节我们学习了用图、表组织样本数据,并且学习了如何通过图、表提供的信息,用样本的频率分布估计总体的分布. 在日常生活中,我们往往并不需要了解总体的分布形态,而是关心总体的某一数字特征,例如:居民月均用水量问题,我们关心的是数字,而不是总体的分布形态.因此我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征(板出课题).2.探究:(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?我们初中时学习众数、中位数、平均数等数字特征.我们共同回忆一下?什么是众数、中位数、平均数?众数—一一组数中出现次数最多的数.中位数——将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数——将所有数相加再除以这组数的个数,所得到得数.热身训练:求下列各组数据的众数、中位数、平均数 (1)1 ,2,3,3,3,4,6,7,7,8,8,8 (2)1 ,2,3,3,3,4,6,7,8,9,9 答案:(1) 众数是:3和8 中位数是:5 平均数是:5(2) 众数是:3 中位数是:4 平均数是:5 例如,在上一节抽样调查的100位居民的月均用水量的数据中,我们如何得知这一组样本数据的众数、中位数和平均数 ? 众 数=2.3(t )、中位数=2.0(t )、平均数=1.973(t )那么从频率分布直方图你能得到这些数据的众数,中位数,平均数吗? 3. 如何在频率直方图中估计众数、中位数、平均数呢?1) 如何从频率分布直方图中估计众数?学生交流讨论,回答从频率分布直方图可以看出:月均用水量的众数是 2.25t (最高的矩形的中点),它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少. 思考1:请大家看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?0.10.20.30.4月均用水量/t表2-1 100为居民的月均用水量(单位:t)请学生思考交流,回答这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.显然通过频率分布直方图的估计精度较低,其估计结果与数据分组有关,在不能得到样本数据,只能得到频率分布直方图的情况下,也可以估计总体的特征.归纳总结:因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间[2,2.5)的小长方形的面积最大,即这组的频率是最大的,也就是说月均用水量在区间[2,2.5)内的居民最多,即众数就是在区间[2,2.5)内. 众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标.2) 如何从频率分布直方图估计中位数?学生交流讨论,回答分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等. 由此可以估计中位数的值. 设中位数为x ,则5.05.0)2(22.015.008.004.0=⨯-++++x求出02.2=x在上图中,红色虚线代表居民月平均用水量的中位数的估计值.其左边的直方图的面积是2.20.61.81.21.01.52.02.22.52.82.4 0.8 1.7 1.0 1.0 1.6 2.1 2.3 2.6 2.5 2.4 0.5 1.5 1.2 1.4 1.7 2.1 2.4 2.7 2.6 2.3 0.9 1.6 1.3 1.3 1.8 2.3 2.3 2.8 2.5 2.0 0.7 1.8 1.4 1.3 1.9 2.4 2.4 2.93.04.3 0.8 1.9 3.5 1.4 1.8 2.3 2.4 2.9 3.2 4.1 0.6 1.7 3.6 1.3 1.7 2.2 2.3 2.8 3.3 3.8 0.5 1.5 3.7 1.2 1.6 2.1 2.3 2.7 3.2 0.4 0.3 0.4 0.2 1.2 1.5 2.2 2.2 2.6 3.4 1.6 1.9 1.8 1.6 1.0 1.5 2.0 2.0 2.5 3.1 观察频率分布直方图估计中位数频率 00.10.20.30.40.50.6月均用水量/t50个单位.右边的直方图的面积也是50个单位.由此可以估计出中位数的值为2.02. 思考2:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(样本数据的频率分布直方图把原始的一些数据给遗失了)3) 如何从频率分布直方图中估计平均数?学生交流讨论,回答平均数等于是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.以上图为例来讲解求解过程;02.202.025.404.075.306.025.314.075.225 .025.222.075.115.025.108.075.004.025.0=⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯平均数为2.02由此居民的月用水量的平均数是2.02t.大部分居民的月均用水量在中部(2.02t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考3:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?让学生讨论,并举例优点:对极端数据不敏感的方法能够有效地预防错误数据的影响.对极端值不敏感有利的例子:如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,如:考察表中2-1中的数据如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能过有效地预防错误数据的影响.用抗极端数据强的中位数表示数据的中心值更准确.缺点:(1)出现错误的数据也不知道;(2)对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作.这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业.4)对众数,中位数,平均数估计总体数字特征的认识(1)样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表示样本数据中的很少一部分信息.(2) 中位数不受少数几个极端值的影响, 容易计算,它仅利用了数据排在中间的数据的信息.(3)样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.探究:“用数据说话”这是我们经常可以听到的一句话.但是数据有时也会被利用,从而产生误导.例如一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多,尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?以员工平均工资收入水平去描述他们单位的收入情况.这是不合理的,因为这些员工当中,少数经理层次的收入与大多数一般员工收入的差别比较大,平均数受数据中的极端值的影响大,所以平均数不能反映该单位员工的收入水平.这个老板的话有误导与蒙骗行 例题例:某公司的33名职工的月工资(单位:元)如下表:(1) 求该公司职工月工资的平均数、中位数、众数.(2) 若董事长、副董事长的工资分别从5500元、5000元提升到30000元、20000元,那么公司职工新的平均数、中位数和众数又是什么?(3) 你认为哪个统计量更能反映这个公司员工的工资水平? 解析:(1)公司职工月工资的平均数为:2091336900033201500320005250030002350050005500≈=⨯+⨯+⨯++⨯++=x(元) 若把所有数据从大到小排序,则得到:中位数是1500元,众数是1500元.(2)若董事长、副董事长的工资提升后,职工月工资的平均数为:3288331085003320150032000525003000235002000030000≈=⨯+⨯+⨯++⨯++=x (元)中位数是1500元,众位是1500元.(3)在这个问题中,中位数和众数都能反映出这个公司员工的工资水平,因为公司少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平. 巩固练习假设你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元人民币,另外25个项目的投资是20~100万元。

高中数学 第一章 统计 估计总体的分布教案 北师大版必修3 教案

高中数学 第一章 统计 估计总体的分布教案 北师大版必修3 教案

§1.5估计总体的分布(一)一、教学目标:1、知识与技能:(1)通过实例体会分布的意义和作用。

(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。

(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。

2、过程与方法:通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。

3、情感态度与价值观:通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。

二、重点与难点:重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。

难点:能通过样本的频率分布估计总体的分布。

三、教学方法:探究归纳,思考交流四、教学设想(一)、创设情境在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50;乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板出课题)。

(二)、探究新知〖探究〗:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a 的部分按议价收费。

如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。

11 1.5.2估计总体的数字特征 教案

11   1.5.2估计总体的数字特征  教案
课堂检测内容
1.课本39页练习
2.为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.
天数
151180
181210
211240
241270
271300
301330
331360
361390
灯泡数
1
11
科目:数学教师: 授课时间: 第周 星期二 年月日
单元(章节)课题
北师大版必修三 第一章 统计
本节课题
1.5.2 估计总体的数字特征
三维目标
1、知识与技能
(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。(3)会用样本的基本数字特征估计总体的基本数字特征。(4)形成对数据处理过程进行初步评价的意识。2、过程与方法
18
20
25
16
7
2
课后作业布置
必做:课本第40页A组第3 题。
选做:课本第31页A组第4 题
预习内容布置
预习课本46页1.7《相关性》内容。
学生阅读课本估计总体数字特征相关内容.
1、怎么利用样本的平均数估计总体?
2、怎么利用样本的方差估计总体?
3、样本的数据估计总体分布,对样本有什么要求?
引导学生回顾旧知,为
本节新知识的学习奠定基础
导引新课
培养学生自学能力
培养学生合作探究能力
学生回顾统计图表所学的主要内容
对估计总体数字特征展开学习
探讨样本频率分布直方图在实际案例中的作用

高中数学 第一章 统计 1.5.2 估计总体的数字特征学案(含解析)北师大版必修3-北师大版高一必修

高中数学 第一章 统计 1.5.2 估计总体的数字特征学案(含解析)北师大版必修3-北师大版高一必修

5.2 估计总体的数字特征知识点平均数与方差、标准差[填一填]1.平均数如果有n个数x1,x2,…,x n,那么x=x1+x2+…+x nn,叫作这n个数的平均数.2.样本的方差与标准差(1)数据的离散程度可以用极差、方差或标准差来描述.样本方差描述了一组数据围绕平均数波动的大小.一般地,设样本的元素为x1,x2,…,x n,样本的平均数为x,定义s2=(x1-x)2+(x2-x)2+…+(x n-x)2n,s2表示样本方差.(2)为了得到以样本数据的单位表示的波动幅度,通常要求出样本方差的算术平方根.s=(x1-x)2+(x2-x)2+…+(x n-x)2n,s表示样本的标准差.(3)计算样本数据x1,x2,…,x n的标准差的算法步骤为:S1算出样本数据的平均数x.S2算出x i-x,其中i=1,2,…,n;S3算出x i-x的平方,其中i=1,2,…,n;S4算出样本方差;S5算出样本标准差.[答一答]平均数与标准差在估计总体时有何差异?提示:平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们对总体作出片面的判断,样本中的极端值对平均数的影响较大,所以平均数有时难以反映样本数据的实际状态.当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度,就由标准差来衡量.标准差反映了各个样本数据聚集于样本平均数周围的程度.标准差越小,表明各个样本数据在样本平均数周围越集中;反之,标准差越大,表明各个样本数据在样本平均数的两边越分散.(1)从数字特征上描述一组数据的情况平均数、众数、中位数描述其集中趋势,方差、极差和标准差描述其波动大小,也可以说方差、标准差和极差反映各个数据与其平均数的离散程度.(2)方差和标准差的运用一组数据的方差或标准差越大,说明这组数据波动越大,方差的单位是原数据的单位的平方,标准差的单位与原单位相同.类型一方差、标准差的计算【例1】某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679求以上两组数据的方差及标准差.【思路探究】 解答本题的关键是掌握方差、标准差的计算公式和求解步骤. 【解】 x甲=6+7×3+85=7, x 乙=6×2+7×2+95=7,s 2甲=15[(6-7)2+3×(7-7)2+(8-7)2]=25=0.4, s 2乙=15[2×(6-7)2+2×(7-7)2+(9-7)2]=65=1.2, 所以它们的标准差分别为:105,305. 规律方法 (1)方差的计算①基本公式s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].②简化计算公式:s 2=1n [(x 21+x 22+…+x 2n )-x 2],或写成s 2=1n (x 21+x 22+…+x 2n )-x 2,即方差等于原数据平方的平均数减去平均数的平方.(2)平均数、方差的性质①如果x 1,x 2,x 3,…,x n 的平均数是x ,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x +a .②数据x 1,x 2,…,x n 与数据x 1+a ,x 2+a ,…,x n +a 的方差相等. ③如果x 1,x 2,…,x n 的方差为s 2, 那么ax 1,ax 2,…,ax n 的方差为a 2s 2.本例中的各数据都增加1,试计算以上两组数据的平均数与方差. 解:x甲=7+8+8+9+85=8,x乙=7+8+7+8+105=8,s2甲=15[(7-8)2+(8-8)2+(8-8)2+(9-8)2+(8-8)2]=0.4.s2乙=15[(7-8)2+(8-8)2+(7-8)2+(8-8)2+(10-8)2]=1.2.类型二从茎叶图表示的数据估计总体【例2】从甲、乙两个品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),由抽测结果设计了如图所示的茎叶图.根据茎叶图,将甲、乙两个品种的棉花的纤维长度做比较,写出两个统计结论.【思路探究】分析出样本的分布,来估计总体的分布,分析出样本的数字特征,来估计总体的数字特征,从而达到比较两个总体的目的.【解】从不同的角度分析,可得如下结论:①乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度).②甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中,或甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大).③甲品种棉花的纤维长度的中位数为307 mm ,乙品种棉花的纤维长度的中位数为318 mm.④乙品种棉花的纤维长度基本上是对称的,而且大多集中在平均数附近.甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,分布较均匀.注:答案不唯一,写出两个即可.规律方法 一般来讲,总体所包含的个体数往往是很多的,总体的数字特征,尤其是平均数与标准差很难求出,通常的做法是用样本的平均数与标准差去估计总体的平均数与标准差,从而反映总体的平均水平和稳定性.这与前面用样本的频率分布来近似地代替总体分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.若该日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中优秀工人的人数为4.解析:因为样本均值为17+19+20+21+25+306=22,所以样本中优秀工人占的比例为26=13,而12×13=4,故推断该车间12名工人中有4名优秀工人.类型三平均数、方差的应用【例3】两台机床同时生产直径(单位:cm)为10的圆形截面零件,为了检验产品质量,质量检验员从两台机床的产品中各抽出4件进行测量,结果如下:机床甲109.81010.2机床乙10.1109.910如果你是质量检验员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求?【思路探究】在刻画样本数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.【解】(1)先计算平均直径:x甲=14×(10+9.8+10+10.2)=10,x乙=14×(10.1+10+9.9+10)=10.由于x甲=x乙,因此仅由平均直径不能反映两台机床生产的零件的质量优劣.(2)再计算方差:s2甲=14×[(10-10)2+(9.8-10)2+(10-10)2+(10.2-10)2]=0.02,s2乙=14×[(10.1-10)2+(10-10)2+(9.9-10)2+(10-10)2]=0.005.s2甲>s2乙,这说明乙机床生产出的零件直径波动小,因此从产品质量稳定性的角度考虑,乙机床生产的零件质量更符合要求.规律方法样本的平均数和方差是两个重要的数字特征.在应用平均数和方差解决实际问题时,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由方差研究其与平均数的偏离程度.甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2)品种第一年第二年第三年第四年第五年甲 9.8 9.9 10.1 10 10.2 乙9.410.310.89.79.8根据这组数据判断应该选择哪一种小麦进行推广. 解:甲种冬小麦的平均单位面积产量 x 甲=9.8+9.9+10.1+10+10.25=10,乙种冬小麦的平均单位面积产量x 乙=9.4+10.3+10.8+9.7+9.85=10,则甲、乙两种冬小麦平均单位面积产量相同.甲种冬小麦平均单位面积产量的方差为s 2甲=15×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02,乙种冬小麦平均单位面积产量的方差为s 2乙=15×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244,则s 2甲=0.02<s 2乙=0.244,所以甲种冬小麦的平均单位面积产量比较稳定,因此选择甲种冬小麦进行推广.——易错警示—— 因不理解相关联的两个样 本的数据特征而出错【例4】 一组数据的方差是s 2,将这组数据中的每一个数都乘以2,得到一组新数据,其方差是( )A.12s 2 B .2s 2 C .4s 2 D .s 2【错解】 B【错解分析】 因为本题中新数据的每一个数都是原数据的2倍,因而盲目地选B 得到方差也是原方差的2倍.【正解】 设一组数据x 1,x 2,…,x n , 则s 2=(x 1-x )2+(x 2-x )2+…+(x n -x )2n ,将每一个数乘以2,则x ′=2x .所以s ′2=(2x 1-2x )2+(2x 2-2x )2+…+(2x n -2x )2n=4n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]=4s 2. 故答案选C. 【答案】 C【纠错心得】 若新样本中的每一个数据是原样本中每个数据的2倍,则新样本的平均数是原样本平均数的2倍,方差为原来的4倍,标准差为原来的2倍.如果数据x 1,x 2,x 3,…,x n 的平均数为10,方差为2,则数据7x 1-2,7x 2-2,7x 3-2,…,7x n -2的平均数为68,方差为98.解析:平均数=7×10-2=68;方差=72×2=98,故答案为68,98.一、选择题1.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8;全年比赛进球个数的标准差为0.3.下列说法:①甲队的技术比乙队好;②乙队发挥比甲队稳定;③乙队几乎每场都进球;④甲队的表现时好时坏.其中正确的个数有( D )A .1个B .2个C .3个D .4个解析:四种说法都正确,甲队的平均进球数多于乙队,故第一句正确;乙队标准差较小,说明技术水平稳定;甲队平均进球数是3.2,但其标准差却是3,离散程度较大,由此可判断甲队表现不稳定;乙队平均进球数是1.8,标准差只有0.3,每场的进球数相差不多,可见乙队的确很少不进球.2.期中考试以后,班长算出了全班40人数学成绩的平均分数为M ,如果把M 当成一个同学的分数,与原来的40个分数一起算出这41个分数的平均值为N ,那么MN 为( B )A.4041 B .1 C.4140D .2 解析:由于原来40个人的成绩的平均分当成一个同学的分数,那么这41个分数的平均值仍然为M ,即M =N .故应选B.二、填空题3.某校高中年级开设了丰富多彩的校本课程,甲、乙两班各随机抽取了5名学生的学分,用茎叶图表示(如下图).s 1,s 2分别表示甲、乙两班各自5名学生学分的标准差,则s 1<s 2.(填“>”“<”或“=”)解析:由茎叶图可计算得x甲=14,x 乙=14,则s 1=15(62+32+02+12+82)=22, s 2=15(82+72+42+102+92)=62, ∴s 1<s 2.本题考查统计初步及茎叶图的信息处理问题,可以通过图中数据的对称性从直观上进行观察,也可以通过正确的计算进行比较.三、解答题4.甲、乙两人学习成绩的茎叶图如图所示.(1)分别求出这两名同学学习成绩的平均数和标准差;(2)比较这两名同学的成绩,谈谈你的看法.解:(1)x甲≈87,s甲≈12.7;x乙≈93,s乙≈11.2.(2)由于x甲<x乙,s甲>s乙,所以甲的学习成绩没有乙的学习成绩好,也没有乙的学习成绩稳定.。

高中数学北师大版必修三1.5.2 教学设计 《估计总体的数字特征》

高中数学北师大版必修三1.5.2 教学设计 《估计总体的数字特征》

《估计总体的数字特征》教材通过探究引导学生思考实际问题,引出总体分布的估计问题,该实例贯穿本节始终,通过对该问题的探究,使学生学会列频率分布表、画频率分布直方图和频率分布折线图。

教师通过初中有关频率与概率之间的关系,了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想。

【知识与能力目标】会求样本的众数、中位数、平均数、标准差和方差;理解用样本的数字特征估计总体的数字特征的方法;会应用相关知识解决简单的统计实际问题。

【过程与方法目标】通过对生活中的实例的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。

【情感态度价值观目标】感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。

【教学重点】用样本的平均数和标准差估计总体的平均数和标准差。

【教学难点】让学生体会数字特征的随机性和对实际问题进行判断决策时的应用。

电子课件调整、相应的教具带好、熟悉学生名单、电子白板要调试好。

一、导入部分下表是某次辩论赛中甲、乙双方辩手的成绩,如果以此来评定胜负你认为哪方是 优胜者?为什么? 设计意图:从生活实际切入,激发了学生的学习兴趣,又为新知作好铺垫。

二、研探新知,建构概念1、电子白板投影出上面实例。

2、教师组织学生分组讨论:先让学生分析,师生一起归纳。

估计总体的数字特征利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这个估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息。

n 个样本数据x 1,x 2,…,x n 的平均数 x =1n (x 1+x 2+⋯+x n ) ,则有n x = (x 1+x 2+⋯+x n )设样本的元素为x 1,x 2,…,x n ,样本的平均数为x ,则样本的方差s 2= 1n [(x 1−x)2+(x 2−x)2+⋯+(x n −x )2] 样本方差的算术平方根即为样本的标准差,即。

高中数学 第一章 统计 1.5.2 估计总体的数字特征教案 北师大版必修3

高中数学 第一章 统计 1.5.2 估计总体的数字特征教案 北师大版必修3

5.2 估计总体的数字特征整体设计教学分析教科书通过现实生活中的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.三维目标1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识与现实世界的联系.重点难点教学重点:根据实际问题从样本数据中提取基本的数字特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简单的实际问题.课时安排1课时教学过程导入新课思路 1.平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.如某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从50万名中学生中抽出的50名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态,于是我们学习从另外的角度来考察样本数据的统计量——标准差.(教师板书课题)思路2.在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下:甲运动员:7,8,6,8,6,5,9,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.我们不难求得,x甲=7,x乙=7,两个人射击的平均成绩是一样的,那么,是否两个人就没有水平差距呢?图1从图1直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此这节课我们从另外的角度来考察这两组数据,引入课题:标准差.推进新课新知探究提出问题1.如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?2.有甲、乙两种钢筋,现从中各抽取一个样本(如下表)检查它们的抗拉强度(单位:23.某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对比实验,年亩产量分别如下(单位:千克):甲: 600, 880, 880, 620, 960, 570, 900(平均773);乙: 800, 860, 850, 750, 750, 800, 700(平均787).请你用所学统计学的知识,说明选择哪种品种推广更好?4.全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均收入达到了1.6万元,民政局即宣布该市市民生活水平已达到小康水平,你认为这样的结论是否符合实际?5.如何考查样本数据的离散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程度?讨论结果:1.利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字(最高矩形的中点).估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.图2由图2可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的差称为极差(range).由上图可以看出,乙的极差较大,数据点较分散;甲的极差较小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论了.3.选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.4.不符合实际.原因是样本太小,没有代表性.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的离散程度.5.把问题3中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的离散程度小,如何用数字去刻画这种离散程度呢?考察样本数据的离散程度的大小,最常用的统计量是方差和标准差.标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示.所谓“平均距离”,其含义可作如下理解:假设样本数据是x1,x2,…,x n,x表示这组数据的平均数.x i到x的距离是|x i-x|(i=1,2,…,n).于是,样本数据x1,x2,…,x n到x的“平均距离”是s =|x 1-x |+|x 2-x |+…+|x n -x |n. 由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差:s =1nx 1-x 2+x 2-x 2+…+x n -x 2]. 意义:标准差用来表示数据的稳定性,标准差越大,数据的离散程度就越大,也就越不稳定;标准差越小,数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差s ≥0,当s =0时,意味着所有的样本数据都等于样本平均数.标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数x =1.973,标准差s =0.868,所以x +s =2.841,x +2s =3.709;x -s =1.105,x -2s =0.237.这100个数据中,在区间[x -2s ,x +2s ]=[0.237,3.709]外的只有4个,也就是说,[x -2s ,x +2s ]几乎包含了所有样本数据. 从数学的角度考虑,人们有时用标准差的平方s 2——方差来代替标准差,作为测量样本数据离散程度的工具,其中s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,现实中应用比较广泛的是标准差. 应用示例思路11画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:四组样本数据的条形图如图3:图3四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的离散程度是不一样的.例2 甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.46 25.32 25.45 25.39 25.3625.34 25.42 25.45 25.38 25.4225.39 25.43 25.39 25.40 25.4425.40 25.42 25.35 25.41 25.39乙25.40 25.43 25.44 25.48 25.4825.47 25.49 25.49 25.36 25.3425.33 25.43 25.43 25.32 25.4725.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.解:用计算器计算可得x甲≈25.401,x乙≈25.406;s甲≈0.037,s乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s甲<s乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性.变式训练某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格).解:因为运用计算器计算可得100×12+90×30+80×18+70×24+60×12+50×4=79.40,100(12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%.思路2例1 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根解:甲品种的样本平均数为10,样本方差为[(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24.因为0.24>0.02,所以由这组数据可以认为甲种水稻的产量比较稳定.例2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).这些组中值的方差为1100×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60(天2).故所求的标准差约为 2 128.60≈46(天).答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天.知能训练(1)在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为________. (2)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1,ax 2,…,ax n 的方差为________.(3)在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单答案:(1)9.5,0.016 (2)a 2s 2(3)由x 甲=33,x 乙=33,s 2甲=473>s 2乙=373,可知乙的成绩比甲稳定,应选乙参加比赛更合适.拓展提升某养鱼专业户在一个鱼塘内放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克15元,请问,这个专业户还应该了解什么?怎样去了解?请你为他设计一个方案.解:这个专业户应了解鱼的总质量,可以先捕出一些鱼(设有x 条),做上标记后放回鱼塘,过一段时间再捕出一些鱼(设有a 条),观察其中带有标记的鱼的条数,作为一个样本来估计总体,则a 条鱼中带有标记的条数a =鱼塘中所有带有标记的鱼的条数x 鱼塘中鱼的总条数. 这样就可以求得鱼塘中鱼的总条数,同时把第二次捕出的鱼的平均质量求出来,就可以估计鱼塘中鱼的平均质量,进而估计全部鱼的质量,最后估计出收入.课堂小结1.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水平.用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也就越精确.作业习题1—5 3.设计感想统计学科,最大的特点就是与现实生活的密切联系,也是新教科书的亮点.仅仅想借助“死记硬背一些概念及公式,简单模仿课本例题”来学习,是绝对不行的.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性.这种偏差是不可避免的.虽然我们从样本数据得到的分布、均值和标准差并不是总体的真正分布、均值和标准差,而只是总体的一个估计,但这种估计是合理的,特别是当样本的容量很大时,它们确实反映了总体的信息.教师建议:亲身经历“提出问题,收集数据,分析数据,并作出合理决策”的过程,在此过程中不仅可以加深对概念等知识的深刻理解,更重要的是发展了思维,培养了分析及解决问题能力,同时在情感、意志等领域也得到了协调发展,这才是学校学习的科学而全面的目标,习题设置有层次,尽量源于教科书,又高于教科书,这也是高考命题原则.备课资料备选习题1.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有( ).A.a>b>c B.b>c>a C.c>a>b D.c>b>a答案:D2.下列说法错误的是( ).A.在统计里,把所需考察对象的全体叫作总体B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大答案:B3.下列说法中,正确的是( ).A.数据5,4,4,3,5,2的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半D.频率分布直方图中各小长方形的面积等于相应各组的频数答案:C4.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为s21= 13.2,s22=26.26,则( ).A.甲班10名学生的成绩比乙班10名学生的成绩整齐B.乙班10名学生的成绩比甲班10名学生的成绩整齐C.甲、乙两班10名学生的成绩一样整齐D.不能比较甲、乙两班10名学生成绩的整齐程度答案:A5.下列说法正确的是( ).A.根据样本估计总体,其误差与所选择的样本容量无关B.方差和标准差具有相同的单位C.从总体中可以抽取不同的几个样本D.如果容量相同的两个样本的方差满足s21<s22,那么推得总体也满足s21<s22是错的答案:C。

高中数学第一章统计1.5.1估计总体的分布1.5.2估计总体的数字特征学案北师大版必修3

高中数学第一章统计1.5.1估计总体的分布1.5.2估计总体的数字特征学案北师大版必修3

高中数学第一章统计1.5.1估计总体的分布1.5.2估计总体的数字特征学案北师大版必修31.5.2 估计总体的数字特征1.理解并会运用样本的频率分布估计总体的分布,通过实例体会分布的意义和作用.(重点)2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图及频率折线图.(难点)3.能根据给出的频率分布直方图解决具体问题.(难点)[基础·初探]教材整理1 基本概念阅读教材P 32~P 36“练习”以上部分,完成下列问题. 1.频率分布表和频率分布直方图 (1)频率分布表编制的方法步骤:计算极差――→决定组数与组距――→决定分点――→列出频率分布表(2)2.频率分布折线图(1)在频率分布直方图中,按照分组原则,在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的概率.也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确.(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.判断(正确的打“√”,错误的打“×”)(1)频率分布直方图中的纵坐标指的是频率的值.( ) (2)频率分布直方图中各小矩形的面积之和可以不为1.( ) (3)将数据分组时,一般要求各组的组距相等.( ) 【解析】 (1)×,纵坐标指的是频率与组距的比值. (2)×,各小矩形的面积之和一定为1.(3)√,对数据进行分组时,一般要求各组的组距相等. 【答案】 (1)× (2)× (3)√教材整理2 用样本的平均数、方差与标准差 估计总体的数字特征阅读教材P 37第二自然段至P 39“练习”以上部分,完成下列问题. 用样本的平均数、方差与标准差估计总体的数字特征利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这个估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息.n 个样本数据x 1,x 2,…,x n 的平均数x =1n(x 1+x 2+…+x n ),则有n x =x 1+x 2+…+x n .设样本的元素为x 1,x 2,…,x n ,样本的平均数为x ,则样本的方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] .样本方差的算术平方根即为样本的标准差, 即s =1n []x 1-x2+x 2-x2+…+x n -x2.判断(正确的打“√”,错误的打“×”)(1)在用样本估计总体分布的过程中,样本容量越大,估计越精确.( ) (2)样本平均数一定大于总体平均数.( )(3)样本标准差与总体标准差的大小关系无法确定.( ) 【解析】 (1)√,样本容量越大,估计越精确. (2)×,样本平均数与总体平均数的大小关系不确定. (3)√,可能大于也可能小于.【答案】(1)√(2)×(3)√[小组合作型]画频率分布直方图、折线图已知一个样本:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23, 25,27,29,25,28.【导学号:63580011】(1)列出样本的频率分布表;(2)画出频率分布直方图和频率折线图;(3)根据频率分布直方图,估计总体出现在23~28内的频率是多少.【精彩点拨】根据绘制频率分布直方图和频率折线图的步骤进行.【自主解答】(1)计算极差:30-21=9.决定组距和组数:取组距为2.∵92=412,∴共分5组.决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下5组:[20.5,22.5),[22.5,24.5),[24.5,26.5),[26.5,28.5),[28.5,30.5].列出频率分布表如下:分组频数频率频率/组距[20.5,22.5)20.10.05[22.5,24.5)30.150.075[24.5,26.5)80.40.2[26.5,28.5)40.20.1[28.5,30.5]30.150.075合计20 1.00(2)作出频率分布直方图如下:取各小长方形上的中点并用线段连接就构成了频率折线图,如上图.(3)由频率分布表和频率分布直方图观察得:样本值出现在23~28之间的频率为0.15+0.40+0.2=0.75,所以可以估计总体中出现在23~28之间的数的频率约为0.75.绘制频率分布直方图的具体步骤:1求极差:一组数据的最大值与最小值的差称为极差.2决定组距与组数:数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过120时,按照数据的多少,常分成5~12组.为方便起见,组距的选择应力求“取整”.3将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.[再练一题]1.下表给出了某校从500名12岁男孩中随机抽选出的120人的身高情况(单位:cm):身高范围[122,126)[126,130)[130,134)[134,138)[138,142) 人数58102233身高范围[142,146)[146,150)[150,154)[154,158]人数20116 5(2)画出频率分布直方图;(3)估计身高低于134 cm的人数占总人数的百分比.【解】(1)样本频率分布表如下所示:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158]50.04合计120 1.00(2)频率分布直方图如图所示.(3)由样本频率分布表可知,身高低于134 cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以可以估计身高低于134 cm 的人数占总人数的19 %.频率分布直方图的应用为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如图1­5­1所示,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.图1­5­1(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少? 【精彩点拨】 (1)各小长方形面积之比即为相应的频率之比,从而可算出第二小组的频率.利用频率=频数样本容量,可求样本容量.(2)由图可知次数在110次以上的频率,从而可求达标率.【自主解答】 (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150.(2)由图可估计该校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.频率分布直方图的性质: 1因为小矩形的面积=组距×频率÷组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2在频率分布直方图中,各小矩形的面积之和等于1. 3频数÷相应的频率=样本容量.[再练一题]2.某校开展了一次小制作评比活动,作品上交时间为5月1日至30日.评委会把同学们上交作品的件数按5天一组分组统计,绘制了如图1­5­2所示的频率分布直方图.已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答有关问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数最多?有多少件?图1­5­2(3)经过评比,第四组和第六组分别有10件、2件作品获奖,则这两组哪组获奖率较高? 【解】 (1)依题意知,第三组的频率为42+3+4+6+4+1=0.2,又因为第三组的频数为12,故本次活动的参评作品有120.2=60(件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×62+3+4+6+4+1=18(件).(3)第四组的获奖率是1018=59.因为第六组上交的作品数量为60×12+3+4+6+4+1=3件,所以第六组的获奖率为23.而23>59,显然第六组的获奖率较高.[探究共研型]估计总体的数字特征探究1 如何从频率分布直方图中估计中位数?【提示】在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.探究2 在条形统计图中怎样估计众数?【提示】众数是最高矩形的中点的横坐标.探究3 怎样估计平均数?【提示】平均数的估计值等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和.已知一组数据:125,121,123,125,127,129,125,128,130,129,126,124, 125, 127, 126, 122,124, 125,126,128.(1)填写下面的频率分布表:分组频数频率[121,123)[123,125)[125,127)[127,129)[129,131]合计(2)(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数.【精彩点拨】(1)根据频数与频率的概念填写表格;(2)利用作频率分布直方图的步骤作图;(3)根据直方图中求数字特征的方法求解.【自主解答】(1)分组频数频率[121,123)20.1[123,125)30.15[125,127)80.4[127,129)40.2[129,131] 3 0.15 合计201(2)(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的精确值为125;(2)图中虚线对应的数据是125+2×58=126.25,事实上中位数为125.5.使用“组中值”求平均数x =122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,平均数的精确值为x =125.75.1.平均数、中位数、众数、极差、方差等统计量是将多个数据“加工”成一个数据,能更清楚地反映这组数据的某些重要特征,要理解这些统计量表达的信息.2.利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.[再练一题]3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图1­5­3所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.图1­5­3求:(1)高一参赛学生成绩的众数、中位数; (2)高一参赛学生的平均成绩.【解】 (1)由图可知众数为65,又∵第一个小矩形的面积为0.3, ∴设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5,∴中位数为60+5=65.(2)依题意,x =55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67, ∴平均成绩约为67分.1.当收集到的数据量很大时,比较合适的统计图是( ) A .茎叶图 B .频率分布直方图 C .频率折线图D .频率分布表【解析】 当收集到的数据量很大时,一般用频率分布直方图. 【答案】 B2.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,则|a -b |=( )A .hm B.mhC.h mD .h +m【解析】频率组距=h ,故|a -b |=组距=频率h =mh. 【答案】 B3.某班的全体学生参加英语测试,成绩的频率分布直方图如图1­5­4,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )图1­5­4A .45B .50C .55D .60【解析】 成绩在[20,40)和[40,60)的频率分别是0.1,0.2,则低于60分的频率是0.3,设该班学生总数为m ,则15m=0.3,m =50.【答案】 B4.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图如图1­5­5.由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.图1­5­5【解析】∵0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,∴a=0.030,设身高在[120,130),[130,140),[140,150]三组的分别有x,y,z人.∴x100=0.030×10,∴x=30,同理y=20,z=10.∴从[140,150]中抽取1030+20+10×18=3.【答案】0.030 35.公交车的数量太多容易造成资源的浪费,太少又难以满足乘客的需求.为此,公交公司在某站台随机调查了80名乘客,他们的候车时间如下所示(单位:分):1714201210241817122131928534725182811531121110161291013191012121622172316151611931321822199232815212812111415 311621825512152016122820122815832189(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图;(2)候车时间15分钟以上的比例是多少?你能为公交公司提出什么建议?【解】(1)该数据中最大值为34,最小值为1,两者之差为33,故取组距为5,分为7组.时间分组(Δx i)频数(n i)频率(f i)f i Δx i0~560.0750.0155~1090.1130.02310~15220.2750.05515~20220.2750.05520~25100.1250.02525~3080.1000.02030~3530.0380.008频率分布直方图如下图所示:频率折线图如下图所示:(2)候车时间不低于15分钟的百分比为0.275+0.125+0.100+0.038=0.538=53.8%,公交公司可以适当增加公交车的数量.11。

高中数学第一章统计1_5_1估计总体的分布教案北师大版必修3

高中数学第一章统计1_5_1估计总体的分布教案北师大版必修3

5.1 估计总体的分布整体设计教学分析教科书通过问题的探究,使学生学会列频率分布表、画频率分布直方图、频率分布折线图.教科书在这里主要介绍有关频率分布的列表和画图的方法,而关于频率分布的随机性和规律性方面则给教师留下了较大的发挥空间.教师可以通过初中有关随机事件的知识,也可以利用计算机多媒体技术,引导学生进一步体会由样本确定的频率分布表和频率分布直方图的随机性;通过初中有关频率与概率之间的关系,了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想.由于可以用样本频率分布直方图估计总体分布,因此可以用样本频率分布特征来估计相应的总体分布特征,这就提供了估计总体特征的另一种途径,其意义在于:在没有原始数据而仅有频率分布的情况下,此方法可以估计总体的分布特征.三维目标1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图,理解数形结合的数学思想和逻辑推理的数学方法.3.通过对样本分析和总体估计的过程,感受数学对实际生活的需要,通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.重点难点教学重点:会列频率分布表,画频率分布直方图和频率折线图.教学难点:能通过样本的频率分布估计总体的分布.课时安排1课时教学过程导入新课思路1.在NBA的2006赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49,50;乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29,33.请问从上面的数据中你能否看出甲、乙两名运动员,在2006赛季中,哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板书课题).思路2.如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温.7月25日至8月10日41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8 32.58月8日至8月24日28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.1 32.8 29.8 25.6 24.7 30.0 30.1 29.5 30.3 32.8怎样通过上表中的数据,分析比较两时间段内的高温(≥33 ℃)状况?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.思路3.讨论:我们要了解我校学生每月零花钱的情况, 应该怎样进行抽样?提问:学习了哪些抽样方法?一般在什么时候选取什么样的抽样方法呢?讨论:通过抽样方法收集数据的目的是什么?(从中寻找所包含的信息,用样本去估计总体)指出两种估计手段:一是用样本的频率分布估计总体的分布,二是用样本的数字特征(平均数、标准差等)估计总体的数字特征.这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.推进新课新知探究提出问题(1)我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)(2)什么是频率分布?(3)频率分布直方图的特征是什么?(4)什么是频率分布折线图?讨论结果:(1)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格来改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚地看到整个样本数据的频率分布情况. (2)频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图来反映样本的频率分布.(3)频率分布直方图的特征:①从频率分布直方图可以清楚地看出数据分布的总体趋势.②从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断.(4)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.应用示例思路1例 1 1895年,在伦敦有106块男性头盖骨被挖掘出土.经考证,头盖骨的主人死于1665—1666年之间的大瘟疫.人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:mm):146 141 139 140 145 141 142 131 142 140 144 140138 139 147 139 141 137 141 132 140 140 141 143134 146 134 142 133 149 140 140 143 143 149 136141 143 143 141 138 136 138 144 136 145 143 137142 146 140 148 140 140 139 139 144 138 146 153148 152 143 140 141 145 148 139 136 141 140 139158 135 132 148 142 145 145 121 129 143 148 138149 146 141 142 144 137 153 148 144 138 150 148138 145 145 142 143 143 148 141 145 141请你估计在1665—1666年之间,英国男性头盖骨宽度的分布情况.解:这里,如果把总体看作是1665—1666年之间的英国男性头盖骨的宽度,那么我们就是要通过上面挖掘出土得到的样本信息,来估计总体的分布情况.但从上面的数据很难直接估计出总体的分布情况,为此,我们可以先将以上数据按每个数据出现的频数和频率汇成下表: 宽度/mm 频数 频率 宽度/mm 频数 频率 121 1 0.009 142 7 0.066129 1 0.009 143 10 0.094131 1 0.009 144 5 0.047132 2 0.019 145 8 0.075133 1 0.009 146 5 0.047134 2 0.019 147 1 0.009135 1 0.009 148 8 0.075136 4 0.038 149 3 0.028137 3 0.028 150 1 0.009138 7 0.066 152 2 0.019139 7 0.066 153 1 0.009140 12 0.113 158 1 0.009141 12 0.113从表格中,我们就能估计出总体大致的分布情况了,如在1665—1666年之间,英国男性头盖骨宽度主要在140—150 mm 之间,130 mm 以下以及150 mm 以上所占的比率相对较小等.但是,这些关于分布情况的描述仍不够形象,为了得到更为直观的信息,我们可以再将表中的数据按照下面的方式分组:宽度分组(Δx i ) 频数(n i ) 频率(f i )120—125 mm 1 0.009 0.001 8125—130 mm 1 0.009 0.001 8130—135 mm 6 0.057 0.011 4135—140 mm 22 0.208 0.041 6140—145 mm 46 0.434 0.086 8145—150 mm 25 0.236 0.047 2150—155 mm 4 0.038 0.007 6155—160 mm 1 0.009 0.001 8先画频数分布直方图(图1).进一步,我们还可以将图1中纵坐标的频数换成ii x f ,便可以得到图2.图1图2点评:当样本量较大时,样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的概率.因此,我们就可以用样本的频率分布直方图来估计总体在任意区间内取值的频率,也即总体的分布情况.变式训练1.有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.(1)列出学生参加运动队的频率分布表.(2)画出频率分布条形图.解:(1)参加足球队记为1,参加篮球队记为2,参加排球队记为3,参加乒乓球队记为4,得频率分布表如下:试验结果频数频率参加足球队(记为1)30 0.30参加篮球队(记为2)27 0.27参加排球队(记为3)23 0.23参加乒乓球队(记为4)20 0.20合计100 1.00(2)由上表可知频率分布条形图如图3:图32.为了了解中学生的身体发育情况,对某中学17岁的60名女生的身高进行了测量,结果如下(单位cm):154 159 166 169 159 156 166 162 158156 166 160 164 160 157 151 157 161158 153 158 164 158 163 158 153 157162 159 154 165 166 157 151 146 151160 165 158 163 163 162 161 154 165162 159 157 159 149 164 168 159 153列出样本的频率分布表;绘出频率分布直方图.解:列频率分布表如下:宽度分组(Δx i) 个数累计频数(n i) 频率(f i) 145.5—148.5 1 0.017148.5—151.5 3 0.050151.5—154.5 6 0.100154.5—157.5 8 0.133157.5—160.5 18 0.300160.5—163.5 11 0.183163.5—166.5 10 0.167166.5—169.5 3 0.050 合计60 1.000 根据上述数据绘制频率分布直方图如图4:图4以上两种情况的不同之处在于,前者的频率分布表列出的是几个不同数值的频率,相应的条形图是用其高度表示取各个值的频率;后者的频率分布表列出的是在不同区间内取值的频率,相应的直方图是用图表面积的大小来表示在各个区间内取值的频率.我们在处理一个数理问题时可以采用样本的频率分布估计总体分布的方法,这是因为,频率分布随着样本容量的增大更加接近于总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布的直方图就演变成一条光滑的曲线——总体密度曲线.这条曲线是客观存在的,但是我们却很难将它准确地画出,我们只能用样本的频率分布去对它进行估计.基于频率分布与相应的总体分布有这种关系,再加上我们通常并不知道一个总体的分布,我们往往是从一个总体中抽取一个样本,用样本的频率去估计相应的总体分布.一般说来,样本的容量越大,这种估计就越精确.思路2例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm). 区间界限/cm 122—126 126—130 130—134 134—138 138—142区间界限/cm 142—146 146—150 150—154 154—158 人数20 11 6 5(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:宽度分组(Δx i) 频数(n i) 频率(f i) 122—126 5 0.04126—130 8 0.07130—134 10 0.08134—138 22 0.18138—142 33 0.28142—146 20 0.17146—150 11 0.09150—154 6 0.05154—158 5 0.04合计120 1(2)其频率分布直方图如图5:图5(3)由样本频率分布表可知身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.变式训练从某校高一年级的1 002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162 160 170 168 164 174 170 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166 作出该样本的频率分布表,并估计身高不小于170(cm)的同学所占的百分率. 解:频率分布表如下:宽度分组(Δx i ) 频数累计 频数(n i ) 频率(f i ) 150.5—153.5 4 4 0.04153.5—156.5 12 8 0.08156.5—159.5 20 8 0.08159.5—162.5 31 11 0.11162.5—165.5 53 22 0.22165.5—168.5 72 19 0.19168.5—171.5 86 14 0.14171.5—174.5 93 7 0.07174.5—177.5 97 4 0.04177.5—180.5 100 3 0.03合计 100 1根据频率分布表可以估计,估计身高不小于170(cm)的同学所占的百分率为(0.14×5.1685.1711705.171--+0.07+0.04+0.03)×100%=21%. 例 2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图6),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.图6分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为391517424+++++=0.08; 又因为频率=样本容量第二小组频数,所以样本容量=08.012=第二小组频率第二小组频数=150. (2)由图可估计该学校高一学生的达标率约为39151742391517++++++++×100%=88%. (3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组.知能训练1.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5], 9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的()A.91%B.92%C.95%D.30%答案:A2.一个容量为20的样本数据,数据的分组及各组的频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2.则样本在区间(-∞,50)上的频率为()A.0.5B.0.7答案:B3.一个高中研究性学习小组对本地区2000年至2002年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如图7),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭___________万盒.快餐公司个数情况图快餐公司盒饭年销售量的平均数情况图图7答案:85拓展提升为了了解一大片经济林生长情况,随机测量其中的100株的底部周长,得到如下数据表(单位:cm).135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 109 124 87 131 97 102 123 104 104 128 105 123 111 103 105 92 114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108 123 119 98 121 101 113 102 103 104 108 (1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100 cm的树木约占多少?周长不小于120 cm的树木约占多少?解:(1)这组数据的最大值为135,最小值为80, 极差为55,可将其分为11组,组距为5. 频率分布表如下:宽度分组(Δx i) 频数(n i) 频率(f i)80—85 1 0.01 0.00285—90 2 0.02 0.00490—95 4 0.04 0.00895—100 14 0.14 0.028100—105 24 0.24 0.048105—110 15 0.15 0.030110—115 12 0.12 0.024115—120 9 0.09 0.018120—125 11 0.11 0.022125—130 6 0.06 0.012130—135 2 0.02 0.004合计100 1 0.2(2)频率分布直方图如图8:图8(3)从频率分布表得,样本中小于100的频率为0.01+0.02+0.04+0.14=0.21,样本中不小于120的频率为0.11+0.06+0.02=0.19,估计该片经济林中底部周长小于100 cm的树木约占21%,周长不小于120 cm的树木约占19%.课堂小结总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.作业习题1—5 1、2.设计感想本节课是高一新课程必修三第二章《统计》中的第二节《用样本估计总体》的第一节课,尽管用样本估计总体是一种实用性很强,操作烦琐、麻烦的工作,但却是统计学中常用的方法,在生产、生活中应用非常广泛.用样本估计总体,其实就是一种“以偏概全”,“以部分代替全部”的思想.虽然有贬义的成分,但我们还是要认真去教好学好,而且,这也是平时考试和高考中的重点内容之一.本节要解决的问题就是:为何要用样本估计总体——社会生产、生活的实际需要(必要性),如比赛、竞技中预测结果,评判质量谁好谁差,水平谁高谁低经常要用到.如何去用样本估计总体——用样本的频率分布去估计总体的频率分布;怎样用样本估计总体——作出样本频率分布表或频率分布直方图,懂得用“数据”语言说话.另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育并增强学生的自信心,使学生养成良好的学习态度.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5.1 & 5.2 估计总体的分布 估计总体的数字特征预习课本P32~39,思考并完成以下问题 (1)频率分布直方图纵轴的含义是什么?(2)频率分布直方图的制作步骤是什么?(3)如何画频率分布折线图?[新知初探]1.频率分布直方图在频率分布直方图中,每个小矩形的宽度为Δx i (分组的宽度),高为f iΔx i,小矩形的面积恰为相应的频率f i ,图中所有小矩形的面积之和等于1.2.作频率分布直方图的步骤(1)求极差.即一组数中最大值和最小值的差.(2)决定组距与组数.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.(3)将数据分组.(4)列频率分布表,各小组的频率=小组频数样本容量.(5)画频率分布直方图.[点睛] (1)一般地,样本容量越大,所分组数越多,为方便起见,组距的选择力求“取整”,当样本容量不超过120时,按照数据的多少,通常分成5~12组.(2)画频率分布直方图时,同一组数据,分组时组距要相等,每个矩形的高与频率成正比,这点应特别注意.3.频率分布折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越接近于一条光滑曲线.[小试身手]1.判断正误.(正确的打“√”,错误的打“×”)(1)频率分布直方图中每个小矩形的面积等于相应组的频数.( ) (2)频率分布直方图的面积为样本的频数.( )(3)频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比.( ) (4)从频率分布直方图中可以清楚地看出数据的内容.( ) 答案:(1)× (2)× (3)√ (4)×2.一个容量为80的样本最大值是140,最小值是51,组距为10,则可以分成( ) A .10组 B .9组 C .8组D .7组解析:选B 组数=极差/组距,本题中的极差=140-51=89,所以组数为8.9≈9. 3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,则|a -b |=( )A .hm B.mhC.h mD .h +m解析:选B频率组距=h ,故|a -b |=组距=频率h =mh. 4.一个容量为n 的样本,分成若干组,已知某组的频数和频率分别为50和0.25,则n =________.解析:由题意得50n=0.25,所以n =200.答案:200画频率分布直方图、折线图[典例] 得到如下数据(单位:cm):135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 109 124 87 131 97 102 123 104 104 128 1051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)列出频率分布表;(2)画出频率分布直方图及频率折线图;(3)估计该片经济林中底部周长小于100 cm的树占多少,底部周长不小于120 cm的树占多少.[解] (1)这组数据的最大的数为135,最小的数为80,最大的数与最小的数的差为55,可将该组数据分为11组,组距为5.频率分布表如下:底部周长分组(Δx i)/cm频数(n i)频率(f i)f i Δx i[80,85)10.010.002[85,90)20.020.004[90,95)40.040.008[95,100)140.140.028[100,105)240.240.048[105,110)150.150.030[110,115)120.120.024[115,120)90.090.018[120,125)110.110.022[125,130)60.060.012[130,135]20.020.004(2)频率分布直方图和频率折线图如下图所示.(3)从频率分布表得,样本中底部周长小于100 cm的频率为0.01+0.02+0.04+0.14=0.21,样本中底部周长不小于120 cm 的频率为0.11+0.06+0.02=0.19.所以估计该片经济林中底部周长小于100 cm 的树占21%,底部周长不小于120 cm 的树占19%.(1)分点的决定方法:若数据为整数,则减去0.5作为分点数;若数据是小数点后一位的数,则减去0.05作为分点数;依次类推.(2)画频率分布直方图中小矩形的高的方法:①小矩形的高=频率组距;②假设频数为1的小矩形的高为h ,则频数为k 的小矩形的高为kh .[活学活用]为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出的频率分布表如下:组别 频数 频率 145.5~149.5 1 0.02 149.5~153.5 4 0.08 153.5~157.5 20 0.40 157.5~161.5 15 0.30 161.5~165.5 80.16165.5~169.5m n 合计MN(1)(2)画出频率分布直方图;(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5 cm 以上的频率.解:(1)法一:N =1,n =1-(0.02+0.08+0.40+0.30+0.16)=0.04,8m =0.160.04,∴m=2,M =1+4+20+15+8+2=50.法二:M =10.02=50,m =50-(1+4+20+15+8)=2,N =1,n =m M =250=0.04.(2)作出直角坐标系,组距为4,纵轴表示f iΔx i,横轴表示身高,画出频率分布直方图如图所示.(3)由频率分布直方图可知:样本中在153.5~157.5范围内的人数最多,且身高在161.5 cm 以上的频率为0.16+0.04=0.2,由此可估计全体女生中身高在153.5~157.5范围内的人数最多,九年级学生中女生的身高在161.5 cm 以上的频率估计为0.2.频率分布直方图的应用[典例] 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少? [解] (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150.(2)由图可估计该校高一学生的达标率约为 17+15+9+32+4+17+15+9+3×100%=88%.频率分布直方图中的性质(1)图中每个小矩形的面积表示相应各组的频率,即小矩形的面积=组距×频率组距=频率.(2)在频率分布直方图中,各小矩形的面积的总和等于1.(3)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. (4)频率分布直方图中,各小矩形的面积之比等于频率之比,各小矩形的高度之比也等于频率之比.[活学活用]1.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图,估计样本数据落在区间[10,12)内的频数为( )A .18B .36C .54D .72解析:选B 样本数据落在区间[10,12)内的频率为1-(0.02×2+0.05×2+0.15×2+0.19×2)=0.18,所以样本数据落在区间[10,12)内的频数为0.18×200=36.2.为提高全省高中教师的新课程实施能力,全面推进素质教育,山东省对全省高中教师进行了全员网络远程培训.培训结束后,某市为了解参训教师的成绩情况,从本市参加培训的5 000名教师中随机抽取了100名,对他们的成绩(单位:分)进行统计分析,并画出了成绩的频率分布直方图如下.根据频率分布直方图,完成下面问题:(1)这100名教师培训成绩的中位数应在哪个小组?请说明理由;(2)如果成绩在300分以上(含300分)者为优秀学员,估计该市优秀学员的人数. 解:(1)100个数据的中位数是第50和第51两个数据的平均数,前两个小组的频率和为0.002×100×2=0.4,其频数为0.4×100=40<50,故中位数不在前两个小组;前三个小组的频率之和为(0.002+0.002+0.004)×100=0.8,频数之和为0.8×100=80>50,故中位数应在第三小组.(2)由频率分布直方图可知,优秀学员的频率为(0.001+0.001)×100=0.2,所以估计该市优秀学员的人数为5 000×0.2=1 000(人).估计总体的数字特征[典例] 为了检验产品质量,质量检验员从两台机床的产品中各抽出4件进行测量,结果如下:机床甲 10 9.8 10 10.2 机床乙10.1109.910如果你是质量检验员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求?[解] (1)先计算平均直径:x 甲=14×(10+9.8+10+10.2)=10, x 乙=14×(10.1+10+9.9+10)=10.由于x 甲=x 乙,因此仅由平均直径不能反映两台机床生产的零件的质量优劣. (2)再计算方差:s 2甲=14×[(10-10)2+(9.8-10)2+(10-10)2+(10.2-10)2]=0.02,s 2乙=14×[(10.1-10)2+(10-10)2+(9.9-10)2+(10-10)2]=0.005.s 2甲>s 2乙,这说明乙机床生产出的零件直径波动小,因此从产品质量稳定性的角度考虑,乙机床生产的零件质量更符合要求.样本的平均数和方差是两个重要的数字特征.在应用平均数和方差解决实际问题时,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由方差研究其与平均数的偏离程度.[活学活用]为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100支日光灯在必须换掉前的使用天数如下表:天数151~181~211~241~271~301~331~361~180 210 240 270 300 330 360 390 日光灯数111182025167 2(2)若定期更换,可选择多长时间统一更换合适?解:(1)各组的平均值分别为165.5,195.5,225.5,255.5,285.5,315.5,345.5,375.5,由此可估计这种日光灯的平均使用寿命为165.5×1%+195.5×11%+225.5×18%+255.5×20%+285.5×25%+315.5×16%+345.5×7%+375.5×2%=268.4(天).(2)s2=1100[1×(165.5-268.4)2+11×(195.5-268.4)2+18×(225.5-268.4)2+20×(255.5-268.4)2+25×(285.5-268.4)2+16×(315.5-268.4)2+7×(345.5-268.4)2+2×(375.5-268.4)2]=2 128.59,故标准差s= 2 128.59≈46(天).由上可知这种日光灯的平均使用寿命为268.4天,标准差约为46天,故可在222天到314天内统一更换较合适.[层级一学业水平达标]1.从一堆苹果中任取10个,称得它们的质量如下(单位:克):125 120 122 105 130 114 116 95 120 134则样本数据落在[114.5,124.5)内的频率为( )A.0.2 B.0.3C.0.4 D.0.5解析:选C 依题意,样本数据落在[114.5,124.5)内的频数为4,故对应频率为4÷10=0.4.2.下列说法中错误的是( )①用样本的频率分布估计总体频率分布时,样本容量越大,所分的组数越多,估计越精确;②一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n 的值为240;③频率分布直方图中,小矩形的高等于该组的频率;④将频率分布直方图中小矩形上面一边的一个端点顺次连接起来,就可以得到频率折线图.A.①③B.②③④C.②③④D.①②③④解析:选C 大样本往往更接近于总体,所以①正确;②中n =40÷0.125=320; ③中频率分布直方图中,小矩形的高等于该小组的频率/组距;④中应将频率分布直方图中各小矩形上端的中点顺次连接起来得到频率折线图. 3.在样本频率分布直方图中,某个小矩形的面积是其他小矩形面积之和的14,已知样本容量是80,则该组的频数为( )A .20B .16C .30D .35解析:选B 设该组的频数为x ,则其他组的频数之和为4x ,由样本容量是80,得x +4x =80,解得x =16,即该组的频数为16.4.某校为了解高一学生寒假期间的阅读情况,抽查并统计了100名同学的某一周阅读时间,绘制了频率分布直方图(如图所示),那么这100名学生中阅读时间在[4,8)小时内的人数为________.解析:根据频率分布直方图,可得阅读时间在[4,8)小时内的频率为(0.12+0.15)×2=0.54,所以这100名学生中阅读时间在[4,8)小时内的人数为100×0.54=54.答案:54[层级二 应试能力达标]1.已知样本:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11,那么频率为0.4的范围是( )A .5.5~7.5B .7.5~9.5C .9.5~11.5D .11.5~13.5解析:选C 只要列出频率分布表,依次对照就可以找出答案.频率分布表如下:分组 频数 频率 5.5~7.5 2 0.1 7.5~9.5 6 0.3 9.5~11.5 8 0.4 11.5~13.5 4 0.2 合计2012.对某种电子元件使用寿命跟踪调查得如图所示的样本频率分布直方图,由图可知一批电子元件中寿命在100~300小时的电子元件的数量与寿命在300~600小时的电子元件的数量比是( )A.12B.13C.14D.16解析:选C 因为“频率之比=数量之比”,所以所求为⎝⎛⎭⎪⎫12 000+32 000∶⎝ ⎛⎭⎪⎫1400+1250+32 000=1∶4,故选C. 3.样本容量为100的频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在[6,10)内的频数为a ,样本数据落在[2,10)内的频率为b ,则a ,b 分别是( )A .32,0.4B .8,0.1C .32,0.1D .8,0.4解析:选A 样本数据落在[6,10)内的频率为0.08×4=0.32,则a =100×0.32=32;由于样本数据落在[2,6)内的频率为0.02×4=0.08,则样本数据落在[2,10)内的频率b =0.08+0.32=0.4.4.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A.588 B.480C.450 D.120解析:选B 成绩在[40,60)的频率p1=(0.005+0.015)×10=0.2,成绩不少于60分的频率p2=1-0.2=0.8,所以成绩不少于60分的学生人数约为600×0.8=480.5.《中华人民共和国道路交通安全法》规定;车辆驾驶员血液酒精浓度在20~80 mg/100 mL(不含80)之间,属于酒后驾车;血液酒精浓度在80 mg/100 mL(含80)以上时,属醉酒驾车.据《法制晚报》报道,某年2月15日至2月28日,全国查处酒后驾车和醉酒驾车共28 800人,如图是对这28 800人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为________.解析:(0.01×10+0.005×10)×28 800=4 320.答案:4 3206.下图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.解析:最左边两个小矩形的面积之和为0.10×1+0.12×1=0.22,城市总数为11÷0.22=50,最右边小矩形的面积为0.18×1=0.18,故样本中平均气温不低于25.5 ℃的城市个数为50×0.18=9.答案:97.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.解析:因为频率分布直方图中的各个小矩形的面积之和为1,所以有10×(0.005+0.035+a +0.020+0.010)=1,解得a =0.030.由频率分布直方图可知在[120,130),[130,140),[140,150]三组内的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为100×10×0.010=10,所以从身高在[140,150]内抽取的学生人数为1860×10=3.答案:38.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高? 解:(1)依题意知第三组的频率为 42+3+4+6+4+1=15.又∵第三组频数为12, ∴本次活动的参评作品数为1215=60件. (2)由频率分布直方图,可以看出第四组上交的作品数量最多,共有60×62+3+4+6+4+1=18件.(3)第四组获奖率是1018=59.第六组上交的作品数为60×12+3+4+6+4+1=3件.∴第六组的获奖率为23,显然第六组的获奖率较高.9.为增强市民节能环保意识,某市向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:分组(单位:岁)频数 频率 [20,25) 5 0.05 [25,30) ① 0.20 [30,35) 35 ② [35,40) 30 0.30 [40,45] 10 0.10 合计1001.00(1)(2)补全频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在[30,35)的人数.解:(1)设年龄在[25,30)内的频数为x ,年龄在[30,35)的频率为y , 法一:根据题意可得x100=0.20,35100=y , 解得x =20,y =0.35.法二:由题意得5+x +35+30+10=100, 0.05+0.20+y +0.30+0.10=1, 得x =20,y =0.35.故①②位置应分别填20,0.35.(2)由频率分布表知年龄在[25,30)内的频率是0.20,组距是5,所以频率组距=0.205=0.04.补全频率分布直方图,如下图所示:根据频率分布直方图估计这500名志愿者中年龄在[30,35)的人数为500×0.35=175.。

相关文档
最新文档