高中数学第2章统计22总体分布的估计221频率分布表备课素材苏教版3.
高中数学:22《总体分布的估计》课件必修三
0.45 0.4
不同,横轴、纵轴单位不
0.35
0.3 0.25
0.2 0.15
同,得到的图的性状也会 组距1.0 不同.不同的形状给人不同
0.1
0.05
0
1
2
3
4
5
的印象,这种印象会影响 我们对总体的判断.
从图中我们可以看到,月均 用水量在区间[2,2.5)内 的居民最多,在[1.5,2) 内次之,大部分居民的月 均用水量都在[1,3)之间.
数学:第二章第二节《总 体分布的估计》精品课件
PPT(苏教版必修3)
复习回顾:
1.频数与频率
频数是指一组数据中,某范围内的数据出现 的次数;把频数除以数据的总个数,就得到频率.
2.频率分布表
当总体很大或不便于获得时,可以用样本的 频率分布估计总体的频率分布.我们把反映总体 频率分布的表格称为频率分布表.
合计
频数累计 4Biblioteka 12 27 49 74 88 94 98
100
频数 4 8 15 22 25 24 6 4 2
100
频率 0.04 0.08 0.15 0.22 0.25 0.24 0.06 0.04 0.02 1
画频率分布直方图
频率/组距
0.50 0.40 0.30 0.20 0.10
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
问题引入:
我国是世界上严重缺水的国 家之一,城市缺水问题较为突出. 某市政府为了节约生活用水,计 划在本市试行居民生活用水定额 管理,即确定一个居民月用水量 标准a,用水量不超过a的部分按 平价收费,超出a的部分按议价 收费.如果希望大部分居民的日常 生活不受影响,那么a定为多少 比较合理?
高中数学 第2章《统计》频率分布表 精品导学案 苏教版必修三
江苏省响水中学高中数学第2章《统计》频率分布表导学案苏教版必修3学习目标1.通过具体问题,复习用频率颁表表示总体分布这一内容,掌握列频率分布表的方法。
2.初步感受用样本频率分布估计总体频率分布规律的思想。
一、基础知识导学1.频数:___ ___________________ _频率:_____________________________________2.频率分布表的定义:3.全距:_____________________________组距:________________________________4.编制频率分布表的步骤:(1)(2)(3)二、基础学习交流从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm).试作出该样本的频率分布表.三、重点难点探究探究一张老师为了分析一次数学考试情况,全班抽了50人,将分数分为5组.第一组到第三组的频数分别是10,23,11,第四组的频率是0.08,那么落在第五组89.5——99.5的频数是多少?频率是多少?全校300人中分数在89.5——99.5中的约有多少人?探究二某文工团有演职人员共有100 人,其中乐队15人,歌队20人,曲艺队30人,舞队25人职员10人.(1)列出各队的频率分布表;(2)求曲艺队的频率.探究三一个容量为20的样本数据,分组后组距与频数如下:组距(20,30] (30,40] (40,50] ( 50,60] ( 60,70] (70,80] 频数 2 3 4 5 4 2 -∞上的频率求样本在区间(,50]四、基础智能检测1.一个容量为20的数据样本,分组与频数为[10,20]2个、(20,30]3个、(30,40]4个、-∞上的可能性为(40,50] 5个、(50,60]4个、(60,70]2个,则样本数据在区间(,50]()A. 5%B. 25%C. 50%D. 70%2.下面是不同厂家生产的手提式电脑的重量,试列出其频率分布表:1.92.0 2.1 2.4 2.4 2.83.2 2.3 1.5 2.62.6 1.9 2.4 2.2 1.6 1.7 1.7 1.8 1.83.03.在进行分组分析时,每一组的频率是指( )A.这组的频数与组距的比值B.这组的频数与样本容量的比值C.组距与数据总和的比值D.平均数与这组的频数的比值教师个人研修总结在新课改的形式下,如何激发教师的教研热情,提升教师的教研能力和学校整体的教研实效,是摆在每一个学校面前的一项重要的“校本工程”。
高中数学第2章统计2.2总体分布的估计2.2.1频率分布表教案苏教版必修3
2.2.1 频率分布表整体设计教材分析“频率分布表”这一节主要通过探究“北京地区的气温分布状况问题”逐步引入频率分布表.用例题说明分布表的编制过程.在实际应用中,很多问题的解答需要总体分布的信息,而总体分布则需要用样本来估计,在“北京地区的气温分布状况问题”中,要解决的是怎样通过已知数据分析比较两时间段的高温状况.频率分布是总体分布的一种近似,频率分布表具有如下特性:(1)教科书中只给出了样本容量不超过100时,分组数k在5~12组之间的情形.(2)频率分布表中的数字与分组数(组距)有关.(3)通过样本的改变让学生体会频率分布表的随机性.(4)由于随着样本容量的增加,频率分布表中的各个频率会稳定在总体相应分组的概率之上,要让学生体会频率分布表的这种随样本容量增加的规律性.(5)由于频率分布表编制的工作量一般很大,课本介绍了利用Excel制作频率分布表的方法和步骤.三维目标1.通过实例体会分布的意义和作用;学会列频率分布表;体会频率分布表的特点.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的概率分布估计总体分布.3.能根据实际问题的需求合理地选取样本,并作出合理的解释,会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.4.在教学过程中,通过学生的相互交流,来加深对频率分布表概念的理解,增强学生数学交流能力,培养学生倾听、接受别人意见的优良品质.5.通过引导学生欣赏蕴含在我们生活中与频率分布表有关的实际问题,使学生感受数学、走进数学.重点难点教学重点:用样本频率分布估计总体分布.教学难点:1.对总体分布概念的理解;2.频率分布表的编制.课时安排1课时教学过程导入新课设计思路一:(实例导入)教师出示投影胶片1:为了了解7月25日至8月24日北京地区的气温分布状况,我们对以往年份这段时间的日最高气温进行抽样,并对得到的数据进行分析.我们随机抽取近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:℃):7月25日至8月10日41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.88月 828.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.132.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3日至8月24日怎样通过上表中的数据,分析比较两时间段的高温(≥33 ℃)状况呢?上面两样本中的高温天数的频率用下表表示:时间总天数高温天数(频数)频率7月25日至8月10日17 11 0.6478月 8日至8月24日17 2 0.118 由此表可以发现,近年来,北京地区7月25日至8月10日的高温天气的频率明显高于8月 8日至8月24日.上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.引入课题,板书课题——用样本频率分布估计总体分布.设计思路二:(情境导入)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某城市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准为a,用水量不超过a的部分按平价收费,超出部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出标准,需要做哪些工作?分析:如果标准太高,会影响居民的日常生活;如果标准太低,则不利于节水.为了确定一个较为合理的标准a,必须了解全市居民的日常用水量的分布情况.比如月均用水量在哪个范围内的居民最多,他们占全市居民的百分比情况等.由于城市的居民较多,不可能也没有必要一一调查,那如何处理呢?可以采用随机抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设通过抽样我们获得了100位居民某年的月均用水量(单位:吨).推进新课新知探究(给出投影胶片2:100位居民的月均用水量)100位居民的月均用水量(单位:吨).分析:上面这些数字能告诉我们什么呢?可以看出居民月均用水量的最小值为0.2,最大值为4.3,其他在0.2到4.3之间. 除此以外,很难发现这100位居民的用水量的其他信息了.实际上,我们很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理和分析.分析研究:分析数据的一种基本方法是用紧凑的表格改变数据的排列方式.或者用图形将它们画出来.表格可以改变数据的构成形式,为我们提供了解释数据的新方式.作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.这就是我们初中学过的频数分布图和频数分布表,在此基础上我们从各个小组数据在样本容量中所占比例大小的角度进一步研究频率分布表.1.首先求极差,如何求?是多少?求极差即一组数据中的最大值与最小值的差.4.3-0.2=4.1,说明样本数据的变化范围是4.1.2.如何选定适当的组距与组数?组数是越多越好吗?通常是就样本的量而定,抽取样本的量也要视实际问题的需要来确定,并非越多越好.本例样本量是100,组数为8~12组比较适当,组距力求取整.在此问题中,如果取组距为0.5,那么有:组数=2.85.01.4==组距极差 因此可以将数据分为9组.3.选定组距与组数后为进一步分析数据还需要确定分点,将数据分组.进行数据分组后可以详细地记录每组数据在所抽取的样本中占的频数及频率.组数少了,频数及频率就有可能相应的变大,因此,样本的频率分布表可随组数的变化而改变.第N 组的频率=样本容量组频数第N 上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表(frequency distribution table ).一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=组数全距; (2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.其中,整个取值区间的长度称为全距;分成的区间的长度称为组距.频率分布表的优点是:能直接反映数据在各范围内的频率和频数;其缺点是:不能直观地反映数据的频率分布.应用示例例1 从规定尺寸为25.40 mm 的一堆产品中任意抽取100件,测得它们的实际尺寸如下:制作频率分布表.分析: 根据编制频率分布表的步骤完成.解:如果把这对产品的尺寸的全体看作一个总体,则上面数据就是从总体抽取的一个容量为100的样本.在这组数据中,最小值为25.24,最大值为25.56,他们相差0.32,可取区间[25.235,25.565].我们可将此区间分成11个区间,每个区间的长度为0.03,计出每个区间内的频数,并计算相应的频率,将结果填入下表:分组 频数累计 频数 频率[25.235,25.265) 1 1 0.01[25.265,25.295) 3 2 0.01[25.295,25.325) 8 5 0.05[25.325,25.355) 20 12 0.12[25.355,25.385) 38 18 0.18[25.385,25.415) 63 25 0.25[25.415,25.445) 79 16 0.16[25.445,25.475) 92 13 0.13[25.475,25.505) 96 4 0.04[25.505,25.535) 98 2 0.02[25.535,25.565]100 2 0.02合计100 1.00 点评:这张表给出了产品尺寸处于各个区间内的个数和频率,由此可估计这一堆产品的尺寸分布情况,这就是该样本的频率分布表.在表中频数是指落在各小组内的数据的个数.频率是各组的频数与数据总数的比值.由上面的制表过程可得编制频率分布表的步骤如下:(1)计算数据中最大值与最小值的差,算出了这个差就可以知道这组数据的变动范围有多大.(2)决定组数与组距.将这一组数据分组,目的是要描述数据的分布规律,要根据数据的多少来确定分组的数目.一般来说,数据越多,分的组也越多.(3)决定分点.要使分点比数据多一位小数,并且把第一组的下限略去或把第一组的起点稍减小一点.(4)列频率分布表.登记频数,计算频率,列出频率分布表.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.在编制频率分布表时,若题目已给出了组距和组数,可以直接列出频率分布表.例2 在编制频率分布表时,①组距不变时,不同的起始点不影响分组数;②组距不变,分组数不变时,不同起始点对应的频率分布表中的各组频率一定是不同的;③分组数越多,频率分布表就越准确地反映总体的情况.以上结论中正确的共有()A.0个B.1个C.2个D.3个分析:①错,不同的起始点可能会引起组数的增加;②错,有可能相同;③错,只能是更准确地反映样本的情况,而不是总体.答案:A点评:使学生更好地理解频率分布表的制作.例3 有一个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.(1)列出样本的频率分布表;(2)估计数据小于30.5的可能性是百分之几?分析:此题已给出了组距和组数,可以直接列出频率分布表.解:(1) 样本的频率分布表如下:分组频数频率[12.5,15.5) 6 0.06[15.5,18.5)16 0.16[18.5,21.5)18 0.18[21.5,24.5)22 0.22[24.5,27.5)20 0.20[27.5,30.5) 10 0.10[30.5,33.5] 8 0.08合计 100 1.00(2)数据大于等于30.5的频率是0.08,所以小于30.5的频率是0.92,所以数据小于30.5的可能性是92%.点评:解决总体分布估计问题的一般精简程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=组数频数). 例4 根据中国银行的外汇牌价,2005年1季度的60个工作日中,欧元的现汇买入价(100欧元的外汇可兑换的人民币)的分组与各组频数如下:[1 050,1 060),1;[1 060,1 070),7;[1 070,1 080),20;[1 080,1 090),11;[1 090,1 100),13;[1 100,1 110),6;[1 110,1 120],2.(1)列出欧元的现汇买入价的频率分布表;(2)估计欧元的现汇买入价在区间1 065~1 105内的频率;(3)如果欧元的现汇买入价不超过x 的频率的估计为0.95,求此x.分析:第1问学生已无障碍,下面两问要结合对频率分布表中分布意义的理解.解:(1)欧元的现汇买入价的频率分布表为分组 频数 频率[1 050,1 060) 1 0.017[1 060,1 070) 7 0.117[1 070,1 080) 20 0.333[1 080,1 090) 11 0.183[1 090,1 100) 13 0.217[1 100,1 110) 6 0.100[1 110,1 120] 2 0.033合计 60 1.00(2)欧元的现汇买入价在区间1 065~1 105内的频率的估计值为 0.117×1060107010651070--+0.333+0.183+0.217+0.100×1100111011001105--=0.84. (3)因为0.017+0.117+0.333+0.183+0.217=0.867<0.95,0.017+0.117+0.333+0.183+0.217+0.100=0.967>0.95,所以x 在区间[1 100,1 110)内,且满足0.867+0.100×110011101100--x =0.95,所以x≈1 108.3.即欧元的现汇买入价不超过1 108.3的频率的估计为0.95.点评:通过对生活实例的分析,使学生更好地体会分布的意义和作用.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.知能训练对某电子元件进行寿命追踪调查,情况如下:寿命(h ) 100~200 200~300 300~400 400~500 500~600 个数 20 30 80 40 30(1)列出频率分布表;(2)估计电子元件寿命在100 h~400 h以内的概率;(3)估计电子元件寿命在400 h以上的概率.解:(1)频率分布表:寿命频数频率100~200 20 0.1200~300 30 0.15300~400 80 0.40400~500 40 0.20500~600 30 0.15合计200 1(2)频率分布表可以算出,寿命在100 h~400 h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100 h~400 h的概率为0.65.(3)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35 .点评:结合例题配套练习,让学生熟练掌握解题过程.课堂小结总体分布情况可以通过样本来估计,频率分布是总体分布的一种近似.频率分布表编制步骤:①求极差;②决定组距与组数;③将数据分组;④列频率分布表.频率分布表具有如下特性:①分组的变化可以引起频率分布表的结构的变化.②随机性:频率分布表是由样本决定的,因此它们会随样本的改变而改变,而样本是随机抽取的.③规律性:由于频率趋近于概率的原则,若固定分组,随着样本容量的增加,频率分布表中的各个频率会稳定在总体相应分组的概率之上.作业1.课本习题2.2 1.2.现实生活中,很多问题的解决需要总体分布的信息,而总体分布需要用样本来估计.如身高、体重、考试成绩、农作物产量、某种特定新产品的各种质量指标、股票价格等.请自己查阅资料做进一步的调查了解,作出分析判断,提出建议.要注意抽样的合理性与可操作性.设计感想研究分布规律的方法应在解决实际问题的过程中探索出来,所以制作频率分布表的过程或步骤应该是在结合实例的基础上,一边实践一边总结,因此一开始例题的解决过程应是探索过程.。
高中数学 第二章 统计 2.2.1 频率分布表教案 苏教版必修3
2.2.1 频率分布表教学目标:1.了解频数、频率的概念,了解全距、组距的概念;2.能正确地编制频率分布表;会用样本频率分布去估计总体分布;3.通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.教学重点:用样本频率分布估计总体分布;教学难点:对总体分布概念的理解;频率分布表的绘制.教学方法:1.通过实例体会频率分布表的意义和作用,会列频率分布表,体会频率分布表的特点.2.能根据实际问题的需求合理地选取样本,并作出合理的解释,会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学过程:一、问题情境如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温:二、学生活动o)状况?问题:怎样通过上表中的数据,分析比较两时间段内的高温(33C三、建构数学一般地:当总体很大或不便获取时,用样本的频率分布去估计总体频率分布;把反映总体频率分布的表格称为频率分布表.四、数学运用例1 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表.并估计身高不小于170的同学的所占的百分率.解:(1)在全部数据中找出最大值180与最小值151,它们相差(极差)29,确定全距为30,决定组距为3;(2)将区间[150.5,180.5]分成10组;分别是[150.5,153.5),[153.5,156.5),…,[177.5,180.5);(3)从第一组[150.5,153.5)开始分别统计各组的频数,再计算各组的频率,列频率分布表:根据频率分布表可以估计,估计身高不小于170的同学的所占的百分率为:171.5170[0.140.070.040.03]100%21%171.5168.5-⨯+++⨯=-.一般地编制频率分布表的步骤如下:(1)求全距,决定组数和组距;全距是指整个取值区间的长度,组距是指分成的区间的长度;(2)分组,通常对组内的数值所在的区间取左闭右开区间,最后一组取闭区间; (3)登记频数,计算频率,列出频率分布表.例2 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)(1)列出样本频率分布表;(2)估计身高小于134cm的人数占总人数的百分比.分析根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.2.练习.(1)课本第55~56页练习第1,4题.五、要点归纳与方法小结本节课学习了以下内容1.总体分布的频率、频数的概念;2.绘制频率分布表的一般步骤.。
高中数学第2章统计2.2总体分布的估计2.2.2频率分布直方图与折线图教案苏教版必修3
2.2.2 频率分布直方图与折线图整体设计教材分析这一节主要通过频率分布表来探究频率分布直方图直观意义、作图方法与作图步骤,并在此根底上使学生能画出频率分布折线图,总体密度曲线.由于作统计图表操作性很强,所以在教学中要使学生在明确图表含义前提下,让学生自己动手作图.关于总体密度曲线,需要使学生了解:总体在区间〔a,b〕内取值百分比就是教科书图2.23中阴影局部面积,通过思考栏目两个问题要使学生了解到,有总体没有密度曲线,例如总体是掷骰子试验所有可能出现结果;总体密度曲线与总体分布相互唯一确定.三维目标1.认识频率分布直方图、频率分布折线图与总体密度曲线特点.2.能正确画出频率分布直方图、频率分布折线图、总体密度曲线.3.通过组织学生观察频率分布直方图、频率分布折线图、总体密度曲线特点,用图形直观方法引出它们概念,有利于学生对概念了解.4.教学中引导学生自己动手作图,在作图过程中去体会概念、形成概念,培养学生用运动变化观点认识它们辩证关系,感受自然界辩证法,使学生体会知识之间有机联系,感受数学整体性,激发学生学习兴趣.重点难点教学重点:1.频率分布直方图、频率分布折线图、总体密度曲线概念以及它们之间辩证关系;2.画频率分布直方图、频率分布折线图、总体密度曲线.教学难点:1.体会分布意义与作用.2.对总体分布概念理解,统计思想初步形成.课时安排1课时教学过程导入新课分析数据一种根本方法是用图形将它们画出来,或者用紧凑表格改变数据排列方式.作图可以到达两个目,一是从数据中提取信息,二是利用图形传递信息.表格那么是改变数据构成形式,为我们提供解释数据新方式.这就是我们初中学过频数分布图与频数分布表,在此根底上我们从各个小组数据在样本容量中所占比例大小角度进一步研究频率分布直方图.推进新课新知探究频数分布表虽然能表达出数据分布规律,但它并不直观,为了直观地表达出数据分布规律,我们需要画频率分布直方图.在初中,已学过如何绘制频数直方图,它能直观地表达数据分布规律.同样我们可以用直方图来反映样本频率分布规律.可以利用直方图反映样本频率分布规律,这样直方图称为频率分布直方图,简称频率直方图.一般地,作频率分布直方图方法为:把横轴分成假设干段,每一线段对应一个组组距,然后以此线段为底作一矩形,它高等于该组,这样得出一系列矩形,每个矩形面积恰好是该组上频率.这些矩形就构成了频率分布直方图.频率分布直方图两种类型:用样本频率分布估计总体分布通常分为两种情况:〔1〕当总体中个体取不同数值很少时,其频率分布表由所取样本不同值及其相应频率表示,其几何表示就是相应条形图.条形图中纵轴表示是频率,条形图高为该组数据频率.但应注意“总体中个体取不同数值很少〞并不是指“总体中个数很少〞.〔2〕当总体中个体取不同值较多,甚至无限时,对其频率分布研究用到初中学过整理样本数据知识,用频率分布直方图来表示相应样本频率分布.频率分布直方图优点与缺点:频率分布直方图比频率分布表更直观、形象地反映了样本分布规律;但绘制频率分布直方图过程比拟复杂,且它不能直接表达数据频数分布.将频率分布直方图中各相邻矩形上底边中点顺次连结起来,就得到频率分布折线图,简称频率折线图.如果将样本容量取得足够大,分组组距取得足够小,那么相应频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布密度曲线.如以下图所示.总体密度曲线反映了总体在各个范围内取值百分比.根据这条曲线,可求出总体在区间(a,b)内取值概率等于总体密度曲线,直线x=a,x=b及x轴所围图形面积.说明:〔1〕有总体没有总体密度曲线.例如总体是抛掷硬币〔骰子〕大量重复试验所有可能出现结果.〔2〕总体密度曲线与总体分布是相互唯一确定.如果总体分布,就可以得到密度曲线函数表达式,从而用函数理论去研究它.〔3〕我们所面临情况是总体分布未知,因此可以通过样本频率折线近似,但不能够通过样本数据准确地画出总体密度曲线.应用例如例1 下表是某学校一个星期中收交来失物件数,请将5天中收交来失物数用条形图表示.分析:当总体中个体取不同数值很少时,可用频数条形图或频率条形图来表示.解:用Excel作条形图:〔1〕在Excel工作表中输入数据,光标停留在数据区中;〔2〕选择“插入/图表〞,在弹出对话框中点击“柱形图〞;〔3〕点击“完成〞.如以下图:点评:利用Excel画图很方便.例2 作出上面例1中数据频率分布直方图、频率折线图与密度曲线.分析:根据绘制频率分布直方图、频率折线图与密度曲线过程解题.解:频率分布直方图:〔1〕先制作频率分布表〔上面已完成〕,然后作直角坐标系,以横轴表示身高,纵轴表示;〔2〕在横轴上标上表示150.5,153.5,156.5,…,180.5点〔为方便起见,起始点可适当前移〕;〔3〕在上面标出各点中,分别以连接相邻两点线段为底作矩形,高等于该组.至此,就得到了这组数据频率分布直方图,如下图:频率分布折线图:取直方图中各相邻矩形上底边中点顺次连结,再将矩形边去除,得频率折线图如图.总体分布密度曲线:可近似地表示为:点评:〔1〕频率分布直方图比频率分布表更直观、形象地反映了样本分布规律,如在164附近到达“峰值〞,并具有一定对称性,这说明这批学生身高在164 cm附近较为集中.另外还可看出,特别高与特别矮学生较少.〔2〕在频率分布直方图根底上,取直方图中各小矩形上底边中点顺次连结起来时需注意:取值区间两端点需分别向外延伸半个组距,以使折线首尾分别与横轴相连.〔3〕频率分布折线图优点是它能反映数据变化趋势,但它不能直接表达数据分布规律.例3 以下图是某单位50名职工年龄〔取正整数〕频率分布直方图,各小长方形高AE∶BF∶CG∶DH=2∶4∶3∶1,由图中提供信息,答复以下问题〔直接写出答案〕:〔1〕第二小组频率与频数分别是多少?〔2〕不小于38岁但小于46岁职工频率是多少?〔3〕假设46岁职工有一人,那么46岁以上职工有几人? 分析:此题主要考察小矩形长、宽、面积含义.解:〔1〕设DH=x ,那么CG=3x,BF=4x,AE=2x.所以, (x+3x+4x+2x)×4=1.所以,x=401.所以第二小组频率:4×401×4=52,频数:25×50=20.〔2〕4×401×4+3×401×4=107=0.7. 〔3〕4×401×50-1=4. 点评:注意每个小矩形长与宽含义及小矩形面积=组距×=频率,各小矩形面积表示相应各组频率,频率分布直方图以面积形式反映了数据落在各小组频率大小.在频率分布直方图中,各小长方形面积总与等于1.例4 为了了解一大片经济林生长情况,随机测量其中100株树木底部周长,得到如下数据表〔单位:cm 〕:〔1〕编制频率分布表;〔3〕估计该片经济林中底部周长小于100 cm树木约占多少,底部周长不小于120 cm树木约占多少.解:〔1〕从表中可以看出,这组数据最大值为135,最小值为80,故全距为55,可将其分为11组,组距为5.从第一组[80,85〕开场,将各组频数、频率与填入下表中.(2)这组数据频率直方图如以下图所示.(3)从频率分布表可以看出,该样本中小于100频率为0.01+0.02+0.04+0.14=0.21,不小于120频率为0.11+0.06+0.02=0.19,故可估计该片经济树林中底部周长小于100 cm树木约占21%,底部周长不小于120 cm树木约占19%.知能训练1.在样本频率分布直方图中,共有11个小矩形,假设中间一个小矩形面积等于其它10个小矩形面积与1/4,且样本容量为160,那么中间一组频数为〔〕2.从一条生产线上每隔30分钟取一件产品,共取了n件,测得其尺寸后,画得其频率分布直方图如图,尺寸在[15,45]内频数为46,那么尺寸在[20,25]内产品个数为〔〕3.为了解各年龄段观众对某电视剧收视情况,某校一个研究性学习小组,调查了局部观众收视情况,并分成A、B、C、D、E、F六组进展整理,其频率分布直方图如下图,那么:〔1〕E组频率为_________________;〔3〕假设该村观众人数为1 200,估计该村50岁以上观众有_______________人.解答:1.A 2.B 3.〔1〕0.24 〔2〕略〔3〕432课堂小结〔1〕正确利用频率分布直方图、频率折线图与密度曲线三种分布描述方法,都能得到一些有关分布主要特点,如分布是否具有单峰性、是否具有对称性、样本点落在各分组中频率等,这些主要特点受样本随机性影响比拟小,更接近于总体分布相应特点.〔2〕频率分布表与频率分布直方图之间密切关系是显然,它们只不过是一样数据两种不同表达方式.〔3〕当总体中个体取不同数值很少〔并不是总体中个数很少〕时,其频率分布表由所取样本不同数值及其相应频率来表示,其几何表示就是相应条形图.作业1.课本习题2.2 2、3、4、5.2.请班上每个同学估计一下自己每天课外学习时间〔单位:分钟〕,然后作出课外学习时间频率分布表、频率分布直方图、频率分布折线图、总体密度曲线.你认为能否由这些估计出你们学校学生课外学习时间分布情况?可以用它来估计该地区学生课外学习时间分布情况吗?为什么?设计感想由于初中学过频数条形图,所以学生在刚接触画频率分布直方图时,学生很自然想法是以纵轴表示频率.教师应肯定学生想法,并按此想法操作,然后向学生说明这样做虽然直观与容易理解,但为了与后续学习内容中密度曲线、正态分布曲线〔理科〕等衔接,而频率分布直方图另一种画法,在以后学习中可充分表达其优点.这样做,既保护了学生学习积极性,也激发了学生对数学好奇心.。
高中数学第2章统计2.2总体分布的估计名师导航学案苏教版必修3201710314108
2.2 总体分布的估计名师导航三点剖析一、频率分布表1.定义总体分布反映了总体在各个范围内取值的频率,由于总体很大或不便于获得,因此我们可以利用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.2.列频率分布表的步骤在初中我们所接触的频率表是通过历史上所做的抛硬币的大量重复试验得到的.在这个试验中,抛掷硬币试验的结果的全体构成一个总体,每次试验的结果是总体中的一个个体,如果我们从中抽取一个容量为72 088的样本,其中正面向上的结果数为36 124,反面向上的结果数为35 964,则我们就可以得到如下一个频率分布表:这类试验只有两种结果,比较简单,下面我们就通过实例来研究较为复杂的频率分布表的制作方法.例如:从规定尺寸为25.的一堆产品中任意抽取100件,测得它们的实际尺寸如下:25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.47 25.35 25.41 25.43 25.4425.49 25.45 25.43 25.46 25.40 25.51 25.45 25.40 25.39 25.41 25.36 25.38 25.3125.56 25.43 25.40 25.38 25.37 25.44 25.33 25.46 25.40 25.39 25.34 25.42 25.5025.37 25.35 25.32 25.45 25.40 25.27 25.43 25.54 25.39 25.45 25.43 25.40 25.4325.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46 25.3825.35 25.31 25.34 25.40 25.36 25.41 25.32 25.38 25.42 25.40 25.33 25.37 25.4125.49 25.35 25.47 25.34 25.30 25.39 25.36 25.46 25.29 25.40 25.37 25.33 25.4025.35 25.41 25.37 25.47 25.39 25.42 25.47 25.38 25.39如果把这堆产品的尺寸的全体看作一个总体,则上面数据就是从总体抽取的一个容量为100的样本.在这组数据中,最小值为25.24,最大值为25.56,它们相差0.32,可取区间[25.235,25.565].我们可将此区间分成11个区间,每个区间长度为0.03,再统计出每个区间内的频数,并计算相应的频率,将结果填入下表:这张表给出了产品尺寸处于各个区间内的个数和频率,由此可估计这一堆产品的尺寸分布情况,这就是该样本的频率分布表.在表中频数是指落在各小组内的数据的个数.频率是各组的频数与数据总数的比值由上面的制表过程可得编制频率分布表的步骤如下:(1)计算数据中最大值与最小值的差,算出了这个差就可以知道这组数据的变动范围有多大.(2)决定组数与组距.将这一批数据分组,目的是要描述数据的分布规律,要根据数据的多少来确定分组的数目.一般来说,数据越多,分的组也越多.(3)决定分点.要使分点比数据多一位小数,并且把第1组的下限略去或把第1组的起点稍减小一点.(4)列频率分布表.登记频数,计算频率,列出频率分布表.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.在编制频率分布表时,若题目已给出了组距和组数,可以直接列出频率分布表.3.频率分布的优点和缺点频率分布表的优点是:能直接反映数据在各范围内的频数和频率;其缺点是:不能直观地反映数据的频率分布, 分布表是否正确.二、频率分布直方图1.定义频率分布表虽然能体现出数据的分布规律,但它并不直观,为了直观地体现数据数的分布规律,我们需要画频率分布直方图.在初中,我学过如何绘制频数直方图,它能直观地体现数据的分布规律.同样我们可以用直方图来反映样本的频率分布规律.这种反映样本的频率分布规律的直方图称为频率分布直方图,简称频率直方图.2.绘制频率分布直方图的步骤为了形象地说明绘制频率分布直方图的步骤,我们还以具体的实例来说明频率分布直方图的画法.例如:有一个容量为50的样本数据的分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5), 4.列出样本的频率分布表,画出频率分布直方图分析:本题主要考查频率分布表的编制和频率分布直方图的绘制及频率分布表的应用.由于题中数据已分组,所以在列频率分布表时,只要直接计算出每小组数据的频率填入表中即可.解:样本的频率分布表、频率分布直方图如下:频率分布表频率分布直方图(如图6-1所示):图6-1所以,要绘制此样本的频率分布直方图,有以下几步:频率;(1)先列出频率分布表,然后作出直角坐标系,以横轴表示身高,纵轴表示组距(2)在横轴上标上12.5,15.5,…,33.5表示的点(为了方便,第一个数据点可以前移);频率, (3)在上面标出的各点中,分别以相邻两点为端点的线段为底边作矩形,其高等于组距至此,就得到了这组数据的频率分布直方图.一般地,画频率分布直方图方法如下:把横轴分为若干段,每一段对应一组的组距,然后以线段为底,作一个矩形,它的高等频率,作出一系列的矩形;每个矩形的面积恰好是该组的频率,这些矩形就构成于该组的组距了频率分布直方图.在频率分布直方图中各个小矩形的面积和等于1.3.频率分布直方图的两种类型用样本频率分布估计总体分布通常分两种情况:(1)当总体中的个体取不同数值很少时,其频率分布表由所取的样本的不同值及其相应频率表示,其几何表示就是相应的条形图.条形图中,纵轴表示的是频率,条形图的高为该组数据的频率.但应注意:“总体中的个体取不同数值很少”并不是指“总体中的个数很少.”例如:前面所接触到的抛掷硬币的试验中,尽管样本的容量达到了72088,但试验结果只有两种,即正面向上和反面向上.如果记“正面向上”的结果为0,记“反面向上”为1,则样本中数据只有两个取值.此时,该样本的频率分布表的几何表示就为相应的条形图. (2)当总体中个体取不同值较多,甚至无限时,对其频率分布研究用到初中学过的整理样本数据的知识,用频率分布直方图来表示相应的样本的频率分布.4.频率分布直方图的优点和缺点频率分布直方图虽然能直观体现数的分布规律,但要绘制频率分布直方图过程比较复杂,且它不能直接体现数据的频数分布.三、频率折线图与总体的密度曲线1.频率折线图的定义将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就可以得到一条折线,这条折线就是本组数据的频率折线图.2.频率折线图的画法频率折线图是在频率分布直方图的基础上,取直方图中各小矩形的上底边的中点连结而成的.画频率折线图时还应注意:取值区间两端点需分别向外延伸半个组距,以使折线首尾分别与横轴相连.3.频率折线图的优点与缺点频率折线图的优点是它能反映数据的变化趋势,但它不能直接体现数据的分布规律. 4.总体的密度曲线在画频率折线图时,如果将样本容量取得足够大,分组的组距取得足够小,这条折线将趋于一条曲线,这一曲线为总体的密度曲线,它能反映出总体分布规律.例如:为了估计某产品寿命的分布,对产品进行抽样检验,记录如下(单位:小时):203 397 597 402 102 303 289 312 501 316 488 355 585 355413 316 197 479 384 278 522 363 234 432 357 566 111 333467 265 326 534 318 552 323 188 352 447 452 337 123 370399 445 365 549 248 316 459 331 176 554 368 412 374 251327 489 329 246 316 475 311 260 133 314 426 366 213 495335 540 338 407 586 331 290 368 410 167 320 510 364 276305 417 307 524 573 326 146 227 317 407 369 214 504 425153 214(1)作出频率分布表;(2)画出频率分布直方图和频率折线图;(3)估计产品寿命在200~500h以内的百分率;(4)估计产品寿命在400h以上的百分率.分析:此题中样本数据取不同的值较多,属于总体分布的第二种情况.将样本中数据适当分组统计各组中数据的频数,计算其频率即可.解:(1)该组数据中最小值为102,最大值为597,差为495,可分为5组.列表如下:(2)频率分布直方图和频率折线图如下(如图6-2所示):频率分布直方图频率折线图图6-2(3)200~500 h以内的百分率为1-15%=85%.(4)产品寿命在400h以上的百分率为20%+15%=35%.四、茎叶图1.平均数、中位数和众数一般地,对于n 个数x 1,x 2,…,x n ,我们把nx x x n+++ 21叫做这n 个数的算术平均数,简称平均数.平均数常用于表示一组数据的平均水平.计算平均数时,所有数据都参加运算,它能充分利用数据所描述的信息,因此在生活中较为常用,但它易受端点值的影响.例如:某公司职工月工资表如下:经计算,该公司职工月平均工资为2 000元,但除经理和副经理之外其他员工的工资均小于2 000元,这就是因为平均数受端点值6 000和500的影响.一般地,n 个数据根据大小顺序排列后,处于中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.由中位数的定义可知,当数据的个数是奇数时最中间的一个数据是中位数;当数据的个数是偶数时,则最中间两个数据的平均数是中位数.中位数受端点值的影响小,但不能充分利用所有数据的信息.例如:在上面某公司职工月工资表中的中位数是1 300.众数则是一组数据中出现次数最多的那个数据.如在上面某公司职工月工资表中众数则是平均数、中位数和众数均能反映一组数据的平均水平,在一组数据中平均数和中位数只有一个,众数则可以有多个例如:在数据1.5,1.5,1.6,1.65,1和1.7,1.7,1.75,2.1中,平均数为1.7;中位数为1.675;众数则为1.5和1.7.2.茎叶图制作茎叶图的方法是:当所给数据为一位数时,可将0作为茎叶较长的茎,而它本身作为叶;当所给数据为两位数时,将所有两位数的十位数字作为“茎”,个位数字作为“叶”;当所给的数据为三位数时,可将百位和十位作为茎,而个位作为叶.茎相同的数据共用一个茎,茎按从小到大的顺序从上到下排列,共用茎的叶一般要按从大到小(也可以从小到大)的顺序同行排出.制作茎叶图时,一般用一个竖线将茎叶隔开,竖线的左边是茎,右边是叶.由茎叶图我们可以粗略地看出一组数据的平均数、中位数、众数的范围.茎叶图不但可以分析单组数据,也可以对两组数据进行对比.当列两组数据的茎叶图时,它们可以共同用一个茎.3.茎叶图的优点和缺点茎叶图的优点是:所有信息都可以从茎叶图中得到体现,而且茎叶图便于记录和表示;它既可以分析单组数据,也可以对两组数据进行比较.茎叶图的缺点是:茎叶图不方便表示位数在三位以上的数据.问题探究问题:为了了解一大片经济树林的生长情况,随机测量其中的100株的底部周长,得到如下数据(长度单位为cm):135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112109 124 87 131 97 102 123 104 104 128105 123 111 103 105 92 114 108 104 102129 126 97 100 115 111 106 117 104 109111 89 110 121 80 120 121 104 108 118129 99 90 99 121 123 107 111 91 10099 101 116 97 102 108 101 95 107 101102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108 该用什么样的方法来估计经济树林的生长情况?探究:用样本估计可用频率分布表、频率分布直方图和频率折线图.它们有着各自的特点:频率分布表编制比较简单且能体现出数据在各范围出现的次数和频率,但它不能直观地反映数据的频率分布;频率分布直方图虽然能直观体现数的分布规律,但要绘制频率分布直方图过程比较复杂,且它不能直接体现数据的频数分布;频率折线图的优点是它能反映数据的变化趋势,但它不能直接体现数据的分布规律.所以,本题采用何种方法来估计经济树林的生长情况,要视具体要求而定,例如:估计这片经济林中底部周长少于100cm的树木约占多少?不少于120cm的树木约占多少?我们可采用频率分布表,这是因为它能直接体现出数据在各范围内出现的次数和频率.如果要考查某一范围内数据的变化情况,则可采用频率折线图.精题精讲例1.为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下表(单位:kg):试根据上述数据列出样本的频率分布表,并对相应的总体分布做出估计.思路解析该组数据中最小值为55,最大值为76,它们的差是76-55=21,可取区间[54.5,76.5],并将此区间分为11个区间,每个区间的长度为2,再统计每个区间内的频数并计算频率,列表即可.解析:按照下列步骤获得样本的频率分布:(1)求最大值与最小值的差.在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76-55=21,所得的差告诉我们,这组数据的变动范围有多大.(2)确定组距与组数.如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数是适合的.于是组距为2,组数为11.(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5).(4)列频率分布表.频率分布表在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计体重在[64.5,66.5)kg的学生最多,约占学生总数的16%;体重小于58.5 kg的学生较少,约占8%等等.绿色通道一般地,列频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=全距/组数;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.频数累计是指本组数据及本组数据以前各组数据的和.频率分布表有两条较为明显的性质:①各组的频数和为样本中数据的个数;②各组的频率和为1.例2.下表给出了某校120名12岁男孩的身高资料(单位:cm):(1)列出样本的频率分布表; (2)画出频率分布直方图;(3)根据样本的频率分布图,估计身高小于134cm 的人数约占总人数的百分比;(4)如果该校所在的地区,12岁男孩有12万人,根据上面的统计结果,你能估计出身高在150 cm 以上的男孩大约有多少人?(5)如果样本容量再大一些,组距再小一些,请你想象一下,直方图中的小矩形会发生什么变化?思路解析由于题目中数据已分组,则可直接列频率分布表.由于频率分布图能直观地体现出样本的频率分布,则由图直接进行估计.由频率分布表可知身高在150cm 的频率为241201 ,所以,估计出身高在150cm 以上的男孩大约11 000人.如果样本容量再大一些,组距再小一些,频率分布直方图中的各个小矩形就会越来越细.当样本容量充分大时,图中的组距充分缩短,从而图中的小矩形的上底的连线就变成光滑的曲线. 答案:(1)列频率分布表如下:(2)频率分布直方图分布如下(如图6-3所示):图6-3(3)身高小于134cm的学生数约占总数的19%.(4)身高在150cm以上的男孩大约11 000人.(5)各个小矩形就会越来越细,当样本容量充分大时,图中的组距充分缩短,图中的小矩形的上底的连线就变成光滑的曲线.例3.为制定本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高作调查,现有三种调查方案:①测量少体校中180名男子篮球、排球队员的身高;②查阅有关外地180名男生身高的统计资料;③在本市的市区和郊县各任选一所完全中学、两所初级中学,在这六所学校有关的年级(1)班中,用抽签的方法分别选出10名男生,然后测量他们的身高.(1)为了达到估计本市初中这三个年级男生身高分布的目的,你认为采用上述哪一种调查方案比较合理,为什么?(2)下表中的数据是使用某种调查方法获得的:(注:每组可含最低值、不含最高值)根据表中的数据填写表中的空格.根据填写的数据绘制频数分布直方图.思路解析本题考查了抽样方法的选择和频数分布直方图的绘制,由于在统计中收集数据必须用随机抽样的方法所抽取的数据才具有代表性,则宜用方案③.又所抽的数据中已分组,则可直接计算各组数据的频数分布和直接绘制频数分布直方图.解析:(1)在统计中收集数据必须用随机抽样的方法所抽取的数据才具有代表性.①中,少体校的男子篮球、排球的运动员的身高一定高于一般的情况,因此无法用测量的结果去估计总体的结果.②中,用外地学生的身高也不能准确地反映本地学生身高的实际情况.③中的抽样方法符合随机的抽样,因此用方案③比较合理.(2)①上表中的频数从上到下依次为15,33,96,33,3.②直方图如图6-4所示.绿色通道统计中数据的获得要合理、公平、具有代表性,这是解决问题的第一关.它直接影响着统计的结果,影响正确结论的得出,也就影响着正确决策的制定.例4.从某校参加初中毕业考试的学生的成绩中,抽取了30名学生的数学成绩,分数如下: 90,85,84,86,87,98,79,85,90,93,68,95,85,71,78,61,94,88,77,100,70,97,85,68,99,88,85,92,93,97.这个样本数据的频率分布表如下:填空(1)这个样本数据的众数是_________分.(2)列频率分布表时,所取的组距为_________分.(3)在这个频率分布表中,数据落在94.5~99.5分范围内的频数为_________.(4)在这个频率分布表中,数据落在74.5~79.5分范围内的频率为_________.(5)在这个频率分布表中,频率最大的一组数据的范围是_________分.(6)估计这个学校初中毕业考试的数学成绩在80分以上(含80分)的约占_________%.思路解析(1)众数是一组数据中出现次数最多的数,它的数量可以是多个.在本题中落在84.5~89.5分范围内的数据的个数最多,而这组数据的组中值为85分,则可以用85分来代表这组数据.(2)考查频率分布表制作过程中组距的划分,由于该组数据所取的区间为[59.5,104.5],最大值与最小值的差为45,又整个区间被分为9组,则组距为5.(3)考查识表能力,由所给的频率分布表可知,在94.5~99.5分的频率数为5.(4)考查识表能力,由所给的频率分布表可知,数据落在74.5~79.5分范围内的频数为3,则由频率的计算公式可得,数据落在74.5~79.5分范围内的频率为0.100.(5)考查识表能力,由所给的频率分布表可知,表中频数的最大值为9,它的分布范围为84.5~89.5分.(6)考查识表能力,当某一范围由几组数据组成时,则在这一范围内数据出现的频率为构成这一范围各组数据出现的频率的和.答案:(1)85 (2)5 (3)5 (4)0.100 (5)84.5~89.5 (6)73.3(7)频率分布直方图和折线图如图6-5所示:图6-5绿色通道一般地,将频率分布直方图中各个矩形上底的中点顺次连结起来,就得到一条折线,我们称之为本组数据的频率分布折线图.如果将样本的容量取得足够大,分组的组距取得足够小,则这条折线将趋近于一条曲线,我们称之为总体分布的密度曲线.例5.甲、乙两篮球运动员上一个赛季的得分如下:甲:21,25,31,31,14,34,32,41,50,23,8.乙:13,34,35,34,23,24,41,50,32,37,32.试比较两人的得分水平.思路解析当所给数据为两位数时,将所有两位数的十位数字作为“茎”,个位数字作为“叶”.当列两组数据的茎叶图时,它们可以共同用一个茎.解析:画茎叶图(如图6-6所示),由图可知,乙运动员的得分大致对称,其平均数、众数、中位数都是30多分,比甲稳定.图6-6绿色通道用茎叶图刻画数据有两个优点:一是所有信息从图中可以得到;二是茎叶图便于记录和表示,但茎叶图对于表示三位数以上的数据是不够方便的.。
【精品】高中数学第二章统计2-2-1频率分布表2-2-2频率分布直方图与折线图一学案苏教版必修3
2.2.1 频率分布表 2.2.2 频率分布直方图与折线图(一)学习目标 1.体会分布的意义和作用;2.学会用频率分布表,画频率分布直方图表示样本数据;3.能通过频率分布表或频率分布直方图对数据做出总体统计.知识点一用样本估计总体思考还记得我们抽样的初衷吗?梳理用样本估计总体的两种情况:(1)用样本的____________估计总体的频率分布.(2)用样本的数字特征估计总体的数字特征.知识点二频率分布表思考通过抽样获得的数据有什么缺点?梳理一般地,制作频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=________;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.知识点三频率分布表与频率分布直方图思考表格与图形,哪个更直观?梳理一般地,(1)在频率分布直方图中,纵轴表示________,数据落在各小组内的频率用__________________来表示,各小长方形的面积的总和等于______.(2)将频率分布直方图中各相邻的矩形的______底边的______点顺次连结起来,就得到频率分布折线图.(3)当样本容量足够______时,组距足够______时,频率分布折线图就趋近于总体分布的密度曲线.类型一 利用原始数据绘制频率分布表例1 从某校高一年级的1 002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,并估计身高不小于170(cm)的同学所占的百分率.反思与感悟 分组时先找到最大值和最小值,以便于确定分组的起点和终点.组距的选择应力求“取整”.区间端点要不重不漏,以便每个数据进且只进一个组.跟踪训练1 有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人. (1)列出学生参加运动队的频率分布表; (2)画出频率直方图.类型二 根据频率分布表绘制频率分布直方图例2 下表给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.反思与感悟频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.跟踪训练2 从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表(含累积频率);(2)画出频率分布直方图;(3)估计成绩在[60,90)分的学生比例.类型三频率分布表及频率分布直方图的应用例3 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?。
高中数学第2章统计2.2总体分布的估计2.2.1频率分布表目标导引素材苏教版必修3
频率分布表
一览众山小
诱学·导入
材料:很多事例让我们感到了分析体育彩票规律重要性:通化一位彩民通过长期地投资终于中得500万大奖使很多彩民都感慨不已,长春市三位先生通过体彩数据具体分析后用1万元中出了500万体彩特等奖和50万体彩特别奖更是让彩民震惊,而他们成绩多是来源于长期关注与细致分析讨论,所以,要想中得大奖,数据分析应该是彩民捷径.
问题:每一期体彩信息原始状态往往散乱无序,带有一定随机性,那么彩民之所以能中大奖所用“推测〞方法有科学依据吗?
导入:体育彩票市场曾创造了无数神话,相当一局部中奖者在谈及自己中奖经历时都表示,他们能够中奖,是经过长期研究体育彩票走势、中奖号码分布特点后〔即作出频率分布表〕精心选号结果.所以说彩民之所以能中大奖“推测〞方法是科学,“推测〞结果是比拟可靠,以此为依据而作决策也是比拟正确.
温故·知新
1.抛掷一枚硬币假设干次,你能否列出它频率分布表?
2.我们通过随机抽样方法在总体中抽取样本就得到了一组数据,怎样从得到这组数据信息来研究总体信息呢?
用样本频率分布与数字特征来估计总体频率分布与数字特征.虽然我们每次抽样所获得样本数据各不一样,但总体频率分布与数字特征是不会改变.。
高中数学 第2章 统计 2.2 总体分布的估计 第1课时 频率分布表 频率分布直方图与折线图课件 苏教版必修3
40.03 40.00 39.98 40.00 39.99 40.00 39.98 40.01 39.98 39.99 40.00 39.99 39.95 40.01 40.02 39.98 40.00 39.99 40.00 39.96
(3)成绩不低于 110 分的同学能参加决赛的频率为 0.08+0.04+0.02=0.14,所以估计该校能参加决赛的 人数大约为 600×0.14=84.
[一点通] 1.在列频率分布表时,全距、组距、组数有如下 关系:
全距
全距
பைடு நூலகம்
(1)若组距为整数,则组距=组数.
(2)若全组距距不为整数,则全组距距的整数部分+1=组数.
1.频率分布表 (1) 定 义 : 当 总 体 _很__大__ 或 不___便__于__获__得_ 时 , 可 以 用 _样__本__的__频__率__分布估计总体的频率分布.我们把反映_总__体__频__率__ 分布的表格称为频率分布表. (2)绘制的步骤:
全距 ①求全距,决定组数和组距,组距=组数. ②分组,通常对组内数值所在区间取_左__闭__右__开__区间,最 后一组取闭区间. ③登记_频__数__,计算_频__率__,列出频率分布表.
2.组距和组数的确定没有固定的标准,将数据分组时,组
数力求合适,使数据的分布规律能较清楚地呈现出来,组数太
多或太少,都会影响我们了解数据的分布情况,若样本容量不
超过 100,按照数据的多少常分为 5~12 组,一般样本容量越大, 所分组数越多.
1. 从全校参加科技知识竞赛的学生试卷 中,抽取一个样本,考察竞赛的成绩 分布.将样本分成 5 组,绘成频率分 布直方图(如图),图中从左到右各小组 的小长方形的高的比是 1∶3∶6∶4∶2,最右边一组的 频数是 6. 请结合频率分布直方图提供的信息,解答下列问题: (1)样本的容量是多少? (2)列出频率分布表.
高中数学 2.2.1 频率分布表课件 苏教版必修3
__频__数__(p__ín与sh_ù_数)__据__(s_h_ù_j_ù_)_总__个的数比值.
2.反映__总___体___频率分布的表格称为频率分布表.
栏 目
3.编制(biānzhì)频率分布表的步骤:(1)求全距,决定
链 接
________和________,(2)分组,通常对组内数值组所数在区
58. 5
72
73. 5
56
67
70 57.5 65.5 68
71 75
62
68. 5
62.5
66
59. 5
63.5
64.5
67.5
73
68
栏 目
链
55
72 66.5 74
63
60
55.5
70
64. 5
58
接
64
70. 5
57
62.5 65
69 71.5 73
62 58
76
71
66 63.5 56 59.5 63.5 65
间组取_距______________,最后一组取________,(3)登记频
数,左计闭算右_开__区__间___,列出_______闭_.区间
频率
频率分布表
第六页,共28页。
自主 学习
栏
4.全距也叫___极__差___,它实际上是所取的全部样本
目 链
(yàngběn最)数大据值中与__最_小__值_____ ______的差.,
接
第七页,共28页。
栏 目 链 接
第八页,共28页。
要点 导航
一、频率(pínlǜ)分布表
一般地,当总体很大或者不便于获得时,可以
江苏省响水中学高中数学 第2章《统计》频率分布表导学案 苏教版必修3
江苏省响水中学高中数学第2章《统计》频率分布表导学案苏教版必修3学习目标1.通过具体问题,复习用频率颁表表示总体分布这一内容,掌握列频率分布表的方法。
2.初步感受用样本频率分布估计总体频率分布规律的思想。
一、基础知识导学1.频数:___ ___________________ _频率:_____________________________________2.频率分布表的定义:3.全距: _____________________________组距:________________________________4.编制频率分布表的步骤:(1)(2)(3)二、基础学习交流从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm).试作出该样本的频率分布表.三、重点难点探究探究一张老师为了分析一次数学考试情况,全班抽了50人,将分数分为5组.第一组到第三组的频数分别是10,23,11,第四组的频率是0.08,那么落在第五组89.5——99.5的频数是多少?频率是多少?全校300人中分数在89.5——99.5中的约有多少人?探究二某文工团有演职人员共有100 人,其中乐队15人,歌队20人,曲艺队30人,舞队25人职员10人.(1)列出各队的频率分布表;(2)求曲艺队的频率.探究三一个容量为20的样本数据,分组后组距与频数如下:组距(20,30] (30,40] (40,50] ( 50,60] ( 60,70] (70,80] 频数 2 3 4 5 4 2-∞上的频率求样本在区间(,50]四、基础智能检测1.一个容量为20的数据样本,分组与频数为[10,20]2个、(20,30]3个、(30,40]4个、-∞上的可能性为(40,50] 5个、(50,60]4个、(60,70]2个,则样本数据在区间(,50]()A. 5%B. 25%C. 50%D. 70%2.下面是不同厂家生产的手提式电脑的重量,试列出其频率分布表:1.92.0 2.1 2.4 2.4 2.83.2 2.3 1.5 2.62.6 1.9 2.4 2.2 1.6 1.7 1.7 1.8 1.83.03.在进行分组分析时,每一组的频率是指( )A.这组的频数与组距的比值B.这组的频数与样本容量的比值C.组距与数据总和的比值D.平均数与这组的频数的比值。
高中数学第二章统计2.2.1频率分布表教案苏教版必修
2.2.1 频率分布表教学目标:1.了解频数、频率的概念,了解全距、组距的概念;2.能正确地编制频率分布表;会用样本频率分布去估计总体分布;3.通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.教学重点:用样本频率分布估计总体分布;教学难点:对总体分布概念的理解;频率分布表的绘制.教学方法:1.通过实例体会频率分布表的意义和作用,会列频率分布表,体会频率分布表的特点.2.能根据实际问题的需求合理地选取样本,并作出合理的解释,会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学过程:一、问题情境如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温:二、学生活动)状况?问题:怎样通过上表中的数据,分析比较两时间段内的高温(33C三、建构数学一般地:当总体很大或不便获取时,用样本的频率分布去估计总体频率分布;把反映总体频率分布的表格称为频率分布表.四、数学运用例1 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表.并估计身高不小于170的同学的所占的百分率.解:(1)在全部数据中找出最大值180与最小值151,它们相差(极差)29,确定全距为30,决定组距为3;(2)将区间[150.5,180.5]分成10组;分别是[150.5,153.5),[153.5,156.5),…,[177.5,180.5);(3)从第一组[150.5,153.5)开始分别统计各组的频数,再计算各组的频率,列频率分布表:根据频率分布表可以估计,估计身高不小于170的同学的所占的百分率为:171.5170[0.140.070.040.03]100%21%171.5168.5-⨯+++⨯=-.一般地编制频率分布表的步骤如下:(1)求全距,决定组数和组距;全距是指整个取值区间的长度,组距是指分成的区间的长度;(2)分组,通常对组内的数值所在的区间取左闭右开区间,最后一组取闭区间; (3)登记频数,计算频率,列出频率分布表.例2 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)(1)列出样本频率分布表;(2)估计身高小于134cm的人数占总人数的百分比.分析根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.2.练习.(1)课本第55~56页练习第1,4题.五、要点归纳与方法小结本节课学习了以下内容1.总体分布的频率、频数的概念;2.绘制频率分布表的一般步骤.精美句子1、善思则能“从无字句处读书”。
高中数学 第2章 统计 2.2 总体分布的估计 2.2.1 频率分布表备课素材 苏教版必修3
2.2.1 频率分布表备课资料备用习题1.如下表:分组频数频率分组频数频率[10.75,10.85) 3 [11.25,11.35)20[10.85,10.95) 9 [11.35,11.45)7[10.95,11.05) 13 [11.45,11.55)4[11.05,11.15) 16 [11.55,11.65]2[11.15,11.25)26 合计100(1)完成上面的频率分布表.(2)根据上表,估计数据落在[10.95,11.35]范围内的概率约为多少?答案:(1)略.(2)数据落在[10.95,11.35]范围内的频率为0.13+0.16+0.26+0.20=0.75,∴落在[10.95,11.35]内的概率约为0.75.2.为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下(单位:kg):试根据上述数据编制样本的频率分布表,并对相应的总体分布作出估计.解:按照下列步骤获得样本的频率分布表.(1)求最大值与最小值的差.在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76-55=21,所得的差告诉我们,这组数据的变动范围有多大.(2)确定组距与组数.如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数是适合的.于是组距为2,组数为11.(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5].(4)列频率分布表如下:。
高中数学第2章2.2总体分布的估计课件苏教必修3.ppt
并且各个小矩形的面积之和等于 1.
3.茎叶图可以表示三位数吗? 提示:可以,前2位作为茎,最后一位作为叶, 茎叶图最好表示两位数.
考点一
课堂互动讲练
考点突破 频率分布表,频率分布直方图,折线图
频率分布直方图的特点: 频率
(1)纵轴表示组距,即矩形的高,以横轴上相邻两 点为端点的线段是矩形的底.
例2 (本题满分14分)美国历届总统中,就任时年纪 最小的是罗斯福,他于1901年就任,当时年仅42岁; 就任时年纪最大的是里根,他于1981年就任,当时 69岁.下面按时间顺序(从1789年的华盛顿到2009年 的奥巴马,共44任)给出了历届美国总统就任时的年 龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,5
(3)茎叶图的优缺点 用茎叶图刻画数据有两个优点:一是所有的信息都 可以从这个茎叶图中得到;二是茎叶图便于记录和 表示.但茎叶图表示三位或三位以上的数据时不够 方便.茎叶图如果表示三位数可把这组数据的前两 位作为茎,第三位数作为叶.
问题探究
1.将样本的数据进行分组的目的是什么? 提示:从样本中的一个数字中很难直接看出样本 所包含的信息,通过分组并计算其频率,目的是 通过描述样本数据分布的特征,从而估计总体的 分布情况. 2.频率分布直方图以怎样的形式反映了数据落在 各个小组内的频率大小?
分组
[145.5,149.5) [149.5,153.5) [153.5,157.5) [157.5,161.5) [161.5,165.5) [165.5,169.5]
合计
频数累计 1 5 25 40 48 50
频数 1 4 20 15 8 2 50
高中数学第2章统计2.2总体分布的估计2.2.1频率分布表自我检测苏教版必修320171017517
2.2.1 频率分布表自我检测基础达标一、选择题1.某人从湖中打了一网鱼共m条,做上记号放入湖中,数日后又打了一网共n条,其中有k 条有记号,则湖中有鱼__________条()A.nkB.m·nkC.m·knD.无法估计答案:B2.有一个容量为50的样本,数据的分组及各组的频数如下,[12.5,15.5)3 [24.5,27.5)10[15.5,18.5)8[27.5,30.5)5[18.5,21.5)9[30.5,33.5)4[21.5,24.5)11则数据落在[15.5,24.5)的频率约是()A.0.44 B.0.51C.0.52 D.0.56答案:D3.一单位有职工80人,其中业务人员56人,管理人员8人,服务人员16人,为了解职工的某种情况,决定采用分层抽样的方法抽取一个容量为10的样本,每个管理人员被抽到的频率为()A.B.1/24C.D.1/8答案:D4.已知样本10,8,6,10,8,13,11,10,12,7,8,9,10,11,12,9,10,11,9,12,那么频率为0.2 的范围是()A.5.5~B.7.5~9.5C.9.5~11.D.11.5~13.5答案:D二、填空题5.一个容量为20的样本,分组后,组距与频率如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2.则样本在区间(50,+∞)上的频率为___________.答案:0.36.下列是100户居民用水量(单位:吨)分布情况:(0.5,1]10户,(1,1.5]16户,(1.5,2]22户,(2,2.5]26户,(2.5,3]14户,(3,3.5]8户,(3.5,4]4户,用水量在(1.5,3]范围内的频率为________.答案:0.62更上一层1.某中学高一年级有400人,高二年级有320人,高三有280人,以每人被抽取的频率为0.2,向该中学抽取一个样本容量为n的样本,则n=__________.答案:2002.某商场4月份随机抽查了6天的营业额,结果分别如下(单位:万元):2.8,3.2,3.4,3.7,3.0,3.1,试估算该商场4月份的总营业额,大约是__________万元.答案:963.在边长为a的正方形中随意撒一把豆子,落在阴影部分的豆子数为N,落在阴影外的豆子数为M,则可估计阴影部分的面积为.答案:M NNa24.某班有50名学生,在学校组织的一次数学质量抽测中,如果按照抽测成绩的分数段[60,65),[65,70),…,[95,100)进行分组,得到的分布情况如下图所示.求(1)该班抽测成绩在[70,85)之间的人数;(2)该班抽测成绩不低于85分的人数占全班总人数的百分比.解析:从分布图可以看出,抽测成绩各分数段的人数依次为:[60,65)1人;[65,70)2人;[70,75)10人;[75,80)16人;[80,85)12 人;[85,90)6人;[90,95)2人;[95,100)1人.(1)该班抽测成绩在[70,85)之间的人数为38人.(2)该班抽测成绩不低于85分的占总人数的18%.。
高中数学第2章统计2.2总体分布的估计2.2.1频率分布表自我检测苏教版必修320171017517
2.2.1 频率分布表自我检测基础达标一、选择题1.某人从湖中打了一网鱼共m 条,做上记号放入湖中,数日后又打了一网共n 条,其中有k 条有记号,则湖中有鱼__________条( )A .kn .m·k n C .m·n k .无法估计答案:B2.有一个容量为50的样本,数据的分组及各组的频数如下,[12.5,15.5) 3 [24.5,27.5) 10[15.5,18.5) 8 [27.5,30.5) 5[18.5,21.5) 9 [30.5,33.5) 4[21.5,24.5) 11则数据落在[15.5,24.5)的频率约是( )A .0.44B .0.51C .0.52D .0.56答案:D3.一单位有职工80人,其中业务人员56人,管理人员8人,服务人员16人,为了解职工的某种情况,决定采用分层抽样的方法抽取一个容量为10的样本,每个管理人员被抽到的频率为( )A ..1/24C .1/.1/8答案:D4.已知样本10,8,6,10,8,13,11,10,12,7,8,9,10,11,12,9,10,11,9,12,那么频率为0.2 的范围是( )A .5.5~.7.5~9.5C .9.5~11..11.5~13.5答案:D二、填空题5.一个容量为20的样本,分组后,组距与频率如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2.则样本在区间(50,+∞)上的频率为___________. 答案:0.36.下列是100户居民用水量(单位:吨)分布情况:(0.5,1]10户,(1,1.5]16户,(1.5,2]22户,(2,2.5]26户,(2.5,3]14户,(3,3.5]8户,(3.5,4]4户,用水量在(1.5,3]范围内的频率为________.答案:0.62更上一层1.某中学高一年级有400人,高二年级有320人,高三有280人,以每人被抽取的频率为0.2,向该中学抽取一个样本容量为n 的样本,则n=__________.答案:2002.某商场4月份随机抽查了6天的营业额,结果分别如下(单位:万元):2.8,3.2,3.4,3.7,3.0,3.1,试估算该商场4月份的总营业额,大约是__________万元.答案:963.在边长为a 的正方形中随意撒一把豆子,落在阴影部分的豆子数为N,落在阴影外的豆子数为M,则可估计阴影部分的面积为.答案:NM N a 2 4.某班有50名学生,在学校组织的一次数学质量抽测中,如果按照抽测成绩的分数段[60,65),[65,70),…,[95,100)进行分组,得到的分布情况如下图所示.求(1)该班抽测成绩在[70,85)之间的人数;(2)该班抽测成绩不低于85分的人数占全班总人数的百分比.解析:从分布图可以看出,抽测成绩各分数段的人数依次为:[60,65)1人;[65,70)2人;[70,75)10人;[75,80)16人;[80,85)12人;[85,90)6人;[90,95)2人;[95,100)1人.(1)该班抽测成绩在[70,85)之间的人数为38人.(2)该班抽测成绩不低于85分的占总人数的18%.。
高中数学第2章统计2.2总体分布的估计互动课堂学案苏教版必修3
2.2 总体分布估计互动课堂疏导引导总体分布反映了总体在各个范围内取值频率,由于总体很大或不便于获得,因此我们可以利用样本频率分布估计总体频率分布.我们把反映总体频率分布表格称为频率分布表.疑难疏引〔1〕在频率分布表中,频数是指落在各小组内数据个数.频率是各组频数与数据总数比值.〔2〕编制频率分布表步骤如下:①计算数据中最大值与最小值差,算出了这个差就可以知道这组数据变动范围有多大.②决定组数与组距.将这一批数据分组,目是要描述数据分布规律,要根据数据多少来确定分组数目.一般来说,数据越多,分组也越多;通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.③决定分点.要使分点比数据多一位小数,并且把第1组下限略去或把第1组起点稍减小一点.④列频率分布表.登记频数,计算频率,列出频率分布表.频率分布表能反映数据在某一范围内出现可能性.如果这一范围是由几组数据组成,那么其出现可能性为这几组数据频率之与.在编制频率分布表时,假设题目已给出了组距与组数,可以直接列出频率分布表.〔3〕频率分布表优点与缺点频率分布表优点是:能直接反映数据在各范围内频数与频率;其缺点是:不能直观地反映数据频率分布,分布表是否正确.案例1 某班50名同学参加数学测验,成绩分组及各组频数如下:[40,50〕,2;[50,60〕,3;[60,70〕,10;[70,80〕,15;[80,90〕,12;[90,100],8.列出样本频率分布表.【探究】频率分布表如下:规律总结频率分布表有两条较为明显性质:①各组频数之与为样本数据个数.②各组频率与为1.频率分布表虽然能表达出数据分布规律,但它并不直观,为了直观地表达数据个数分布规律,我们需要画频率分布直方图.在初中,我们学过如何绘制频数直方图,它能直观地表达数据分布规律.同样我们可以用直方图来反映样本频率分布规律.这种反映样本频率分布规律直方图称为频率分布直方图,简称频率直方图.疑难疏引〔1〕绘制频率分布直方图步骤把横轴分为假设干段,每一段对应一组组距,然后以线段为底,作一个矩形,它高等于该组,作出一系列矩形;每个矩形面积恰好是该组频率,这些矩形就构成了频率分布直方图.在频率分布直方图中各个小矩形面积与等于1.在这里,要特别注意纵轴表示.〔2〕频率分布直方图两种类型用样本频率分布估计总体分布通常分两种情况:①当总体中个体取不同数值很少时,其频率分布表由所取样本不同值及其相应频率表示,其几何表示就是相应条形图.条形图中,纵轴表示是频率,条形图高为该组数据频率.但应注意:“总体中个体取不同数值很少〞并不是指“总体中个数很少.〞例如:抛掷硬币试验中,尽管样本容量到达了72 088,但试验结果只有两种,即正面向上与反面向上.如果记“正面向上〞结果为0,记“反面向上〞为1,那么样本中数据只有两个取值.此时,该样本频率分布表几何表示就为相应条形图.②当总体中个体取不同值较多,甚至无限时,对其频率分布研究用到初中学过整理样本数据知识,用频率分布直方图来表示相应样本频率分布.〔3〕频率分布直方图优点与缺点频率分布直方图虽然能直观表达数分布规律,但要绘制频率分布直方图过程比拟复杂,且它不能直接表达数据频数分布.案例2 下表给出了从某校500名12岁男生中用简单随机抽样得出120人身高资料〔单位:厘米〕〔1〕列出样本频率分布表;〔2〕画出频率分布直方图;〔3〕估计身上下于134厘米人数占总人数百分比与身高在区间[134,146〕〔厘米〕内人数占总人数百分比.【探究】〔1〕样本频率分布表:〔2〕样本频率分布直方图如以下图所示.〔3〕样本中身上下于134厘米男生出现频率为≈0.19,∴由样本频率可估计该校身上下于134厘米男生占这500名12岁男生总数19%.∵样本中身高在区间[134,146〕〔厘米〕内男生出现频率为=0.625,∴估计该校500名12岁男生中身高在区间[134,146〕〔厘米〕内有62.5%.规律总结按要求制表、绘图,并根据样本分布估计总体分布时,要合理分组,并准确找出各组频数,而相应频率是通过求频数与样本容量比计算出来.此题条件已完成前期工作〔即抽样、分组、确定频数〕.制作频率分布表,画频率分布直方图,注意纵轴表示不是频率,而是频率与组距之比.体会用样本估计总体统计思想方法.〔1〕频率折线图定义将频率分布直方图中各相邻矩形上底边中点顺次连结起来,就可以得到一条折线,这条折线就是本组数据频率折线图.〔2〕频率折线图画法频率折线图是在频率分布直方图根底上,取直方图中各小矩形上底边中点连结而成.画频率折线图时还应注意:取值区间两端点需分别向外延伸半个组距,以使折线首尾分别与横轴相连.〔3〕频率折线图优点与缺点频率折线图优点是它能反映数据变化趋势,但它不能直接表达数据分布规律.〔4〕总体分布密度曲线在画频率折线图时,如果将样本容量取得足够大,分组组距取得足够小,这条折线将趋于一条曲线,这一曲线为总体密度曲线,它能反映出总体分布规律.疑难疏引〔1〕总体密度曲线准确地反映了一个总体在各个区域取值规律,根据这条曲线,总体在〔a,b〕内取值百分率就是总体密度曲线与直线x=a,x=b及x轴所围成图形面积.〔2〕总体密度曲线呈中间高、两边低“钟〞形分布,总体数据大致呈对称分布,并且大局部数据都集中在靠近中间区间内.制作茎叶图方法是:当所给数据为一位数时,可将0作为茎叶较长茎,而它本身作为叶;当所给数据为两位数时,将所有两位数十位数字作为“茎〞,个位数字作为“叶〞;当所给数据为三位数时,可将百位与十位作为茎,而个位作为叶.茎一样数据共用一个茎,茎按从小到大顺序从上到下排列,共用茎叶一般要按从大到小(也可以从小到大)顺序同行排出.制作茎叶图时,一般用一个竖线将茎叶隔开.由茎叶图我们可以粗略地看出一组数据平均数、中位数、众数范围.茎叶图不但可以分析单组数据,也可以对两组数据进展比照.当列两组数据茎叶图时,它们可以共同用一个茎.茎叶图优点与缺点:茎叶图优点是:所有信息都可以从茎叶图中得到表达,而且茎叶图便于记录与表示;它既可以分析单组数据,也可以对两组数据进展比拟.茎叶图缺点是:茎叶图不方便表示位数在三位以上数据.案例3 某赛季甲、乙两名篮球运发动每场比赛得分情况如下:甲得分:12,15,24,25,31,31,36,36,37,39,44,49,50.乙得分:8,13,14,16,23,26,28,33,38,39,51.〔1〕画出甲、乙两名运发动得分数据茎叶图;〔2〕根据茎叶图分析甲、乙两运发动水平.【探究】当所给数据为两位数时,将所有两位数十位数字作为“茎〞,个位数字作为“叶〞.当列两组数据茎叶图时,它们可以共同用一个茎.【解析】按照作茎叶图方法首先画出茎叶图,然后分析.〔1〕作出茎叶图如以下图所示:〔2〕由上面茎叶图可以看出,甲运发动得分情况是大致对称,中位数是36;乙运发动得分情况除一个特殊得分外,也大致对称,中位数是26.因此甲运发动发挥比拟稳定,总体得分情况比乙运发动好.规律总结在样本数据较少时,用茎叶图表示数据效果较好,它不但可以保存所有信息,而且还可以随时记录,这对数据记录与表示都能带来方便.画茎叶图步骤如下:〔1〕将每个数据分为茎〔高位〕与叶〔低位〕两局部,此例中茎为十位上数字,叶为个位上数字.〔2〕将最小茎与最大茎之间数按大小次序排成一列,写在左〔右〕侧.〔3〕将各数据叶按大小次序写在其茎右〔左〕侧.〔4〕当数据是由整数局部与小数局部组成时,可以把整数局部作为茎,小数局部作为叶.〔5〕比拟时从数据分布对称性、中位数、稳定性等几个方面来比拟.活学巧用1.在用样本频率估计总体分布过程中,以下说法中正确是〔〕A.总体容量越大,估计越准确B.总体容量越小,估计越准确C.样本容量越大,估计越准确D.样本容量越小,估计越准确解析:总体分布是指总体取值分布规律,这种分布我们一般是不知道.用样本去估计总体,是研究统计问题一个根本思想,对于不易知道总体分布,常常用样本频率分布对它进展估计.样本容量越大,这种估计就越准确.用样本估计思想就是用局部考察全体、用离散考察连续、用有限考察无限思想,是用观察测量值来探究客观规律一种重要根本思想.答案:C2.一个容量为80样本最大值是140,最小值是51,组距是10,那么可以分成〔〕A.10组B.9组C.8组解析:极差=140-51=89,89=8.9不为整数.∵=10∴组数应为9.答案:B3.样本:10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,11,9,10,11,12.那么频率为0.2范围是〔〕B.7.5— C解析:只要列出频率分布表,就可找到答案,频率分布表如下:分组频率累计频数频率2684合计0从表中可以知道频率为0.2范围是11.5—13.5.答案:D4.在频率分布直方图中,各个矩形面积表示〔〕解析:在频率分布直方图中,数据落在各小组内频率用各小长方形面积表示.答案:B5.观察新生婴儿体重,其频率分布直方图如以下图所示,那么新生婴儿体重在[2 700,3 000]频率为〔〕B. C解析:此题考察总体分布频率分布直方图.由图可知:频率=×组距,易知:=0.001,组距=3 000-2 700=300,∴频率=0.001×300=0.3.答案:D6.某校为了了解学生课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间数据,结果用下面条形图表示.根据条形图可得这50名学生这一天平均每人课外阅读时间为〔〕小时解析:500.5 201.5)(11025⨯++⨯+⨯=0.9.答案:B7.对50台某种电子设备寿命逐台进展测试,得到以下数据〔单位:小时〕910,1 220,1 280,20,2 330,900,860,1 450,1 220,550,160,2 020,1 590,1 730,490,1 620,560,530,500,240,1 280,60,190,290,740,1 160,220,910, 40,1 410,3 650,3 410,70,510,1 270,610,310,220,370,60,1 750,890,790,1 280,570,760,50,1 530,1 860,1 280.(1)列出样本频率分布表;〔2〕画出频率分布直方图;〔3〕根据所得结果估计,寿命小于2 500小时百分比约是多少?解析:〔1〕频率分布表如下:〔2〕频率分布直方图如以下图所示.〔3〕观察上图表知,小于2 500小时约占96%.8.在案例2中,怎样画出频率分布折线图呢?解析:把频率分布直方图各个长方形上边中点用线段连接起来,就得到频率分布折线图如下.9.对于样本频率分布折线图与总体密度曲线关系,以下说法中正确是〔〕D.如果样本容量无限增大,分组组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线解析:因为如果样本容量无限增大,分组组距无限缩小,那么频率分布折线图就会无限地接近于一条光滑曲线,这条曲线就是总体密度曲线.答案:D点评:频率分布指是一个样本数据在各个小范围内所占比例大小.一般用频率分布直方图反映样本频率分布.〔1〕频率分布直方图中纵轴表示,频率=.〔2〕频率分布表中各组中频数之与等于样本容量,各组中频率之与等于1.〔3〕频率分布表与频率分布直方图是一组数据频率分布两种不同形式,前者准确,后者直观.〔4〕频率分布折线图依赖于频率分布直方图.〔5〕总体密度曲线是总体中个体数较多,样本容量很大,样本分组数很多,这时频率分布折线图接近于一条光滑曲线.10.某公司职工月工资表如下:〔1〕求该公司职工月工资平均数、中位数、众数;〔2〕假设副董事长工资从5 000元提升到20 000元,董事长工资从5 500元提升到30 000元,那么新平均数、中位数、众数又是什么?〔准确到元〕〔3〕你认为哪个统计量更能反映这个公司职工工资水平?结合此问题谈一谈人看法.解析:〔1〕平均数是2 090元,中位数是1 500元,众数是1 500元.〔2〕平均数是3 288元,中位数是1 500元,众数是1 500元.〔3〕在这个问题中,中位数或众数均能反映该公司职工工资水平.因为公司中少数人工资额与大多数人工资额差异较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司职工工资水平. 11.甲、乙两个小组各10名学生英语口语测试成绩如下〔单位:分〕:甲组76 90 84 86 81 87 86 82 85 83乙组82 84 85 89 79 80 91 89 79 74用茎叶图表示两小组成绩,并判断哪个小组成绩更整齐一些.解:茎叶图表示如下:容易看出甲组成绩较集中,即甲组成绩更整齐一些.点评:用茎叶图分析数据直观、清晰,所有信息都可以从这个茎叶图中得到.。
高中数学 第2章 统计 2.2 总体分布的估计讲义 苏教版必修3-苏教版高一必修3数学教案
2.2 总体分布的估计学习目标核心素养1.通过对实例的分析,体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率分布折线图,体会它们各自的特点,感受它们在揭示表面上杂乱无序的数据所蕴涵的规律中的作用.(重点)3.会利用样本数据的四种图表估计总体分布.1.通过对问题中数据样本进行分析,培养学生数据分析的数学核心素养.2.通过对样本数据的计算来培养学生数学运算的数学核心素养.1.频率分布表当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布,我们把反映总体频率分布的表格称为频率分布表.2.频率分布直方图(1)我们将整个取值区间的长度称为全距,分成的区间的长度称为组距.(2)把横轴分成若干段,每一段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组的频率,这些矩形就构成了频率分布直方图.思考1:(1)对数据分组时,组距、组数的确定有没有固定的标准?(2)当样本容量不超过100时,分多少组合适?[提示] (1)组距与组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.在确定分组区间的端点,即分点时,应对分点进行适当调整,使分点比数据多一位小数,并确保每个数据均能落在一个区间内,而不是处于区间的端点.(2)组数与样本容量有关,一般地,样本容量越大,分的组数也越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.3.频率分布折线图如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图,简称频率折线图.4.总体分布的密度曲线如果将样本容量取的足够大,分组的组距取的足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.思考2:几种表示样本分布的方法有什么区别与联系?[提示]总体频率分布规律的,其联系如下:1.下列关于频率分布直方图的说法,正确的是( )A.直方图的高表示取某数的频率B.直方图的高表示该组上的个体在样本中出现的频数与组距的比值C.直方图的高表示该组上的个体在样本中出现的频率D.直方图的高表示该组上的个体在样本中出现的频率与组距的比值D[频率分布直方图的高表示该组上的个体在样本中出现的频率与组距的比值.]2.将一批数据分成四组,列出频率分布表,其中第一组的频率是0.27,第二组与第四组的频率之和为0.54,那么第三组的频率是________.0.19 [根据题意知,四个组的频率之和为1,所以第三组的频率为1-0.27-0.54=0.19.]3.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60]的同学有30人,若想在这n个人中抽取50个人,则在[50,60]之间应抽取的人数为________.15[根据频率分布直方图得总人数n=301-0.01+0.024+0.036×10=100,依题意知,应采取分层抽样,再根据分层抽样的特点,则在[50,60]之间应抽取的人数为50×30100=15.]频率分布表的制作及应用分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70] 频数23454 2(2)已知一个样本数据:27 23 25 27 29 31 27 30 32 3128 26 27 29 28 24 26 27 28 30以2为组距,列出频率分布表.思路点拨:(1)数据落在区间[10,40)内的频数为9,样本容量为20,所求频率P =920=0.45.故填0.45.(2)依据频率分布表的制作步骤来进行,注意确定分点时,为了避免出现某一数据所在组别不能确定的情况,可以使分点比已知数据多一位小数,并且把第一组的起点稍微减小,故本题的第一组的起点可定为22.5.(1)0.45(2)[解] ①计算最大值与最小值的差:最大值为32,最小值为23,它们的差为32-23=9.②已知组距为2,决定组数:因为92=4.5,所以组数为5.③决定分点:[22.5,24.5),[24.5,26.5),[26.5,28.5),[28.5,30.5),[30.5,32.5].④列频率分布表如下:1.频率、频数和样本容量的关系为频率=样本容量,利用此式可知二求一.2.制作频率分布表的步骤(1)求全距,决定组数与组距,组距=全距组数;(2)分组,通常对组内数值所在区间取左闭右开区间(或左开右闭区间),最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.提醒:(1)在制作频率分布表时,分组过多或过少都不好.分组过多会给制作频率分布表带来困难,分组过少虽减少了操作,但不能很好地反映总体情况.一般样本容量越大,所分组数应越多.当样本容量不超过100时,按照数据的多少,常分成5组至12组.(2)所分的组数应力求“取整”.组数k =全距组距,若k ∈Z ,则组数为k ;否则,组数为大于k 的最小整数,这时需适当增大全距,在两端同时增加适当的范围.(3)在决定分点时,应避免将样本中的数据作为分点,常将分点的数值取比样本中的数据多一位小数.1.一个容量为n 的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n 等于________.120 [某一组的频率等于该组的频数与样本容量的比.由于30n=0.25,所以n =120.]2.对某电子元件进行寿命追踪调查,情况如下:(2)估计寿命在100 h ~400 h 以内的电子元件所占的百分比. [解] (1)寿命频数频率累计频率100~200200.100.10200~300300.150.25300~400800.400.65400~500400.200.85500~600300.15 1合计200 1(2)由频率分布表可以看出,寿命在100 h~400 h的电子元件出现的频率为0.65,因此我们估计寿命在100 h~400 h的电子元件所占的百分比为65%.频率分布直方图、折线图的制作与应用1 L所行路程的情况,现从中随机抽出10辆在同一条件下进行耗油 1 L所行路程试验,得到如下样本数据(单位:km):13.7,12.7,14.4, 13.8,13.3,12.5,13.5,13.6,13.1,13.4,其分组如下:分组频数频率[12.45,12.95)[12.95,13.45)[13.45,13.95)[13.95,14.45]合计10 1.0(1)(2)根据上表,在给定坐标系中画出频率分布直方图及频率分布折线图;(3)根据上述图表,估计总体数据落在[12.95,13.95)中的可能性.思路点拨:(1)依据频率分布表的制作步骤完成上面的频率分布表.(2)依据制作频率分布直方图及频率分布折线图的方法步骤绘制频率分布直方图及频率分布折线图.(3)计算出样本数据落在[12.95,13.95)中的频率. [解] (1)频率分布表:(3)根据上述图表,可知数据落在[12.95,13.95)中的频率为0.3+0.4=0.7,故总体数据落在[12.95,13.95)中的可能性为0.7.1.制作频率分布直方图的方法步骤 (1)制作频率分布表.(2)建立直角坐标系:把横轴分成若干段,每一段对应一个组的组距,纵轴表示频率组距.(3)画矩形:在横轴上标明各组端点值,以相邻两点间的线段为底,作高等于该组的频率组距的矩形,这样得到一系列矩形,就构成了频率分布直方图.2.频率分布折线图的制作步骤 (1)取每个矩形上底边中点. (2)顺次连接各个中点.(3)取值区间两端点需分别向外延伸半个组距,并取此组距上在x 轴上的点与折线的首、尾分别相连.3.解决频率分布直方图的相关计算,需掌握下列关系式: (1)频率组距×组距=频率,即小长方形的高乘以宽即为落在相应区间数据的频率.(2)频数样本容量=频率,此关系式的变形为频数频率=样本容量.提醒:频率分布直方图中,每个矩形的高为频率组距,面积为对应组的频率.3.如图是容量为100的样本的频率分布直方图,试根据图中的数据填空:样本数据落在[6,10)内的频率为________,样本数据落在[10,14)内的频率为________.0.32 0.36 [样本数据落在[6,10)内的频率为0.08×4=0.32,样本数据落在[10,14)内的频率为0.09×4=0.36.]4.通过全国人口普查工作,得到我国人口的年龄频率分布直方图如图,那么在一个总人口数为200万的城市中,年龄在[20,60)之间的人大约有________万.116 [在频率分布直方图中,小矩形的面积表示频率,年龄在[20,60)之间的频率约为(0.018+0.011)×20=0.58,200×0.58=116(万),故年龄在[20,60)之间的人大约有116万.]1.本节课的重点是会列频率分布表,会画频率分布直方图、频率分布折线图,难点是理解用样本的频率分布估计总体分布的方法.2.本节课要重点掌握的规律方法(1)绘制频率分布直方图的步骤.(2)会用频率分布直方图的意义解决问题.1.对于样本频率分布折线图与总体分布的密度曲线的关系,下列说法正确的是( )A.频率分布折线图与总体分布的密度曲线无关B.频率分布折线图就是总体分布的密度曲线C.样本容量很大的频率分布折线图就是总体分布的密度曲线D.如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限趋于总体分布的密度曲线D[总体分布的密度曲线通常都是用样本频率分布估计出来的.如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于一条光滑曲线,这条曲线就是总体分布的密度曲线.]2.容量为100的某个样本,数据拆分为10组,并填写频率分布表,若前七组频率之和为0.79,而剩下三组的频率依次相差0.05,则剩下的三组中频率最高的一组的频率为________.0.12 [设剩下的三组中频率最高的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1,而由频率总和为1,得0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.]3.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5),2;[15.5,19.5),4;[19.5,23.5),9;[23.5,27.5),18;[27.5,31.5),11;[31.5,35.5),12;[35.5,39.5),7;[39.5,43.5],3.根据样本的频率分布,估计大于或等于31.5的数据约占_______.13 [根据各组数据可知,符合条件的数据占12+7+366=13.] 4.在一个容量为80的样本中,数据的最大值是140,最小值是56,组距是10,则应将样本数据分为多少组?[解] 当全距组距不是整数时,组数=⎣⎢⎡⎦⎥⎤全距组距+1.本题全距=140-56=84,组距为10,故应分9组.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2.1 频率分布表
备课资料
备用习题
1.如下表:
分组频数频率分组频数频率
[10.75,10.85) 3 [11.25,
11.35)
20
[10.85,10.95) 9 [11.35,
11.45)
7
[10.95,11.05) 13 [11.45,
11.55)
4
[11.05,11.15) 16 [11.55,
11.65]
2
[11.15,
11.25)
26 合计100
(1)完成上面的频率分布表.
(2)根据上表,估计数据落在[10.95,11.35]范围内的概率约为多少?
答案:(1)略.
(2)数据落在[10.95,11.35]范围内的频率为0.13+0.16+0.26+0.20=0.75,
∴落在[10.95,11.35]内的概率约为0.75.
2.为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下(单位:kg):
试根据上述数据编制样本的频率分布表,并对相应的总体分布作出估计.
解:按照下列步骤获得样本的频率分布表.
(1)求最大值与最小值的差.
在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76-55=21,所得的差告诉我们,这组数据的变动范围有多大.
(2)确定组距与组数.
如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数是适合的.于是组距为2,组数为11.
(3)决定分点.
根据本例中数据的特点,第1小组的起点可取为54.5,终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5].
(4)列频率分布表如下:。