高中数学第2章统计2.2总体分布的估计2.2.2频率分布直方图与折线图教材梳理导学案苏教版必修3
高中数学第2章统计2.2总体分布的估计2.2.1频率分布表教案苏教版必修3
2.2.1 频率分布表整体设计教材分析“频率分布表”这一节主要通过探究“北京地区的气温分布状况问题”逐步引入频率分布表.用例题说明分布表的编制过程.在实际应用中,很多问题的解答需要总体分布的信息,而总体分布则需要用样本来估计,在“北京地区的气温分布状况问题”中,要解决的是怎样通过已知数据分析比较两时间段的高温状况.频率分布是总体分布的一种近似,频率分布表具有如下特性:(1)教科书中只给出了样本容量不超过100时,分组数k在5~12组之间的情形.(2)频率分布表中的数字与分组数(组距)有关.(3)通过样本的改变让学生体会频率分布表的随机性.(4)由于随着样本容量的增加,频率分布表中的各个频率会稳定在总体相应分组的概率之上,要让学生体会频率分布表的这种随样本容量增加的规律性.(5)由于频率分布表编制的工作量一般很大,课本介绍了利用Excel制作频率分布表的方法和步骤.三维目标1.通过实例体会分布的意义和作用;学会列频率分布表;体会频率分布表的特点.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的概率分布估计总体分布.3.能根据实际问题的需求合理地选取样本,并作出合理的解释,会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.4.在教学过程中,通过学生的相互交流,来加深对频率分布表概念的理解,增强学生数学交流能力,培养学生倾听、接受别人意见的优良品质.5.通过引导学生欣赏蕴含在我们生活中与频率分布表有关的实际问题,使学生感受数学、走进数学.重点难点教学重点:用样本频率分布估计总体分布.教学难点:1.对总体分布概念的理解;2.频率分布表的编制.课时安排1课时教学过程导入新课设计思路一:(实例导入)教师出示投影胶片1:为了了解7月25日至8月24日北京地区的气温分布状况,我们对以往年份这段时间的日最高气温进行抽样,并对得到的数据进行分析.我们随机抽取近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:℃):7月25日至8月10日41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.88月 828.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.132.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3日至8月24日怎样通过上表中的数据,分析比较两时间段的高温(≥33 ℃)状况呢?上面两样本中的高温天数的频率用下表表示:时间总天数高温天数(频数)频率7月25日至8月10日17 11 0.6478月 8日至8月24日17 2 0.118 由此表可以发现,近年来,北京地区7月25日至8月10日的高温天气的频率明显高于8月 8日至8月24日.上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.引入课题,板书课题——用样本频率分布估计总体分布.设计思路二:(情境导入)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某城市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准为a,用水量不超过a的部分按平价收费,超出部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出标准,需要做哪些工作?分析:如果标准太高,会影响居民的日常生活;如果标准太低,则不利于节水.为了确定一个较为合理的标准a,必须了解全市居民的日常用水量的分布情况.比如月均用水量在哪个范围内的居民最多,他们占全市居民的百分比情况等.由于城市的居民较多,不可能也没有必要一一调查,那如何处理呢?可以采用随机抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设通过抽样我们获得了100位居民某年的月均用水量(单位:吨).推进新课新知探究(给出投影胶片2:100位居民的月均用水量)100位居民的月均用水量(单位:吨).分析:上面这些数字能告诉我们什么呢?可以看出居民月均用水量的最小值为0.2,最大值为4.3,其他在0.2到4.3之间. 除此以外,很难发现这100位居民的用水量的其他信息了.实际上,我们很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理和分析.分析研究:分析数据的一种基本方法是用紧凑的表格改变数据的排列方式.或者用图形将它们画出来.表格可以改变数据的构成形式,为我们提供了解释数据的新方式.作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.这就是我们初中学过的频数分布图和频数分布表,在此基础上我们从各个小组数据在样本容量中所占比例大小的角度进一步研究频率分布表.1.首先求极差,如何求?是多少?求极差即一组数据中的最大值与最小值的差.4.3-0.2=4.1,说明样本数据的变化范围是4.1.2.如何选定适当的组距与组数?组数是越多越好吗?通常是就样本的量而定,抽取样本的量也要视实际问题的需要来确定,并非越多越好.本例样本量是100,组数为8~12组比较适当,组距力求取整.在此问题中,如果取组距为0.5,那么有:组数=2.85.01.4==组距极差 因此可以将数据分为9组.3.选定组距与组数后为进一步分析数据还需要确定分点,将数据分组.进行数据分组后可以详细地记录每组数据在所抽取的样本中占的频数及频率.组数少了,频数及频率就有可能相应的变大,因此,样本的频率分布表可随组数的变化而改变.第N 组的频率=样本容量组频数第N 上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表(frequency distribution table ).一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=组数全距; (2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.其中,整个取值区间的长度称为全距;分成的区间的长度称为组距.频率分布表的优点是:能直接反映数据在各范围内的频率和频数;其缺点是:不能直观地反映数据的频率分布.应用示例例1 从规定尺寸为25.40 mm 的一堆产品中任意抽取100件,测得它们的实际尺寸如下:制作频率分布表.分析: 根据编制频率分布表的步骤完成.解:如果把这对产品的尺寸的全体看作一个总体,则上面数据就是从总体抽取的一个容量为100的样本.在这组数据中,最小值为25.24,最大值为25.56,他们相差0.32,可取区间[25.235,25.565].我们可将此区间分成11个区间,每个区间的长度为0.03,计出每个区间内的频数,并计算相应的频率,将结果填入下表:分组 频数累计 频数 频率[25.235,25.265) 1 1 0.01[25.265,25.295) 3 2 0.01[25.295,25.325) 8 5 0.05[25.325,25.355) 20 12 0.12[25.355,25.385) 38 18 0.18[25.385,25.415) 63 25 0.25[25.415,25.445) 79 16 0.16[25.445,25.475) 92 13 0.13[25.475,25.505) 96 4 0.04[25.505,25.535) 98 2 0.02[25.535,25.565]100 2 0.02合计100 1.00 点评:这张表给出了产品尺寸处于各个区间内的个数和频率,由此可估计这一堆产品的尺寸分布情况,这就是该样本的频率分布表.在表中频数是指落在各小组内的数据的个数.频率是各组的频数与数据总数的比值.由上面的制表过程可得编制频率分布表的步骤如下:(1)计算数据中最大值与最小值的差,算出了这个差就可以知道这组数据的变动范围有多大.(2)决定组数与组距.将这一组数据分组,目的是要描述数据的分布规律,要根据数据的多少来确定分组的数目.一般来说,数据越多,分的组也越多.(3)决定分点.要使分点比数据多一位小数,并且把第一组的下限略去或把第一组的起点稍减小一点.(4)列频率分布表.登记频数,计算频率,列出频率分布表.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.在编制频率分布表时,若题目已给出了组距和组数,可以直接列出频率分布表.例2 在编制频率分布表时,①组距不变时,不同的起始点不影响分组数;②组距不变,分组数不变时,不同起始点对应的频率分布表中的各组频率一定是不同的;③分组数越多,频率分布表就越准确地反映总体的情况.以上结论中正确的共有()A.0个B.1个C.2个D.3个分析:①错,不同的起始点可能会引起组数的增加;②错,有可能相同;③错,只能是更准确地反映样本的情况,而不是总体.答案:A点评:使学生更好地理解频率分布表的制作.例3 有一个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.(1)列出样本的频率分布表;(2)估计数据小于30.5的可能性是百分之几?分析:此题已给出了组距和组数,可以直接列出频率分布表.解:(1) 样本的频率分布表如下:分组频数频率[12.5,15.5) 6 0.06[15.5,18.5)16 0.16[18.5,21.5)18 0.18[21.5,24.5)22 0.22[24.5,27.5)20 0.20[27.5,30.5) 10 0.10[30.5,33.5] 8 0.08合计 100 1.00(2)数据大于等于30.5的频率是0.08,所以小于30.5的频率是0.92,所以数据小于30.5的可能性是92%.点评:解决总体分布估计问题的一般精简程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=组数频数). 例4 根据中国银行的外汇牌价,2005年1季度的60个工作日中,欧元的现汇买入价(100欧元的外汇可兑换的人民币)的分组与各组频数如下:[1 050,1 060),1;[1 060,1 070),7;[1 070,1 080),20;[1 080,1 090),11;[1 090,1 100),13;[1 100,1 110),6;[1 110,1 120],2.(1)列出欧元的现汇买入价的频率分布表;(2)估计欧元的现汇买入价在区间1 065~1 105内的频率;(3)如果欧元的现汇买入价不超过x 的频率的估计为0.95,求此x.分析:第1问学生已无障碍,下面两问要结合对频率分布表中分布意义的理解.解:(1)欧元的现汇买入价的频率分布表为分组 频数 频率[1 050,1 060) 1 0.017[1 060,1 070) 7 0.117[1 070,1 080) 20 0.333[1 080,1 090) 11 0.183[1 090,1 100) 13 0.217[1 100,1 110) 6 0.100[1 110,1 120] 2 0.033合计 60 1.00(2)欧元的现汇买入价在区间1 065~1 105内的频率的估计值为 0.117×1060107010651070--+0.333+0.183+0.217+0.100×1100111011001105--=0.84. (3)因为0.017+0.117+0.333+0.183+0.217=0.867<0.95,0.017+0.117+0.333+0.183+0.217+0.100=0.967>0.95,所以x 在区间[1 100,1 110)内,且满足0.867+0.100×110011101100--x =0.95,所以x≈1 108.3.即欧元的现汇买入价不超过1 108.3的频率的估计为0.95.点评:通过对生活实例的分析,使学生更好地体会分布的意义和作用.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.知能训练对某电子元件进行寿命追踪调查,情况如下:寿命(h ) 100~200 200~300 300~400 400~500 500~600 个数 20 30 80 40 30(1)列出频率分布表;(2)估计电子元件寿命在100 h~400 h以内的概率;(3)估计电子元件寿命在400 h以上的概率.解:(1)频率分布表:寿命频数频率100~200 20 0.1200~300 30 0.15300~400 80 0.40400~500 40 0.20500~600 30 0.15合计200 1(2)频率分布表可以算出,寿命在100 h~400 h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100 h~400 h的概率为0.65.(3)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35 .点评:结合例题配套练习,让学生熟练掌握解题过程.课堂小结总体分布情况可以通过样本来估计,频率分布是总体分布的一种近似.频率分布表编制步骤:①求极差;②决定组距与组数;③将数据分组;④列频率分布表.频率分布表具有如下特性:①分组的变化可以引起频率分布表的结构的变化.②随机性:频率分布表是由样本决定的,因此它们会随样本的改变而改变,而样本是随机抽取的.③规律性:由于频率趋近于概率的原则,若固定分组,随着样本容量的增加,频率分布表中的各个频率会稳定在总体相应分组的概率之上.作业1.课本习题2.2 1.2.现实生活中,很多问题的解决需要总体分布的信息,而总体分布需要用样本来估计.如身高、体重、考试成绩、农作物产量、某种特定新产品的各种质量指标、股票价格等.请自己查阅资料做进一步的调查了解,作出分析判断,提出建议.要注意抽样的合理性与可操作性.设计感想研究分布规律的方法应在解决实际问题的过程中探索出来,所以制作频率分布表的过程或步骤应该是在结合实例的基础上,一边实践一边总结,因此一开始例题的解决过程应是探索过程.。
高中数学第2章统计2.2总体分布的估计2.2.2频率分布直方图与折线图教案苏教版必修32017103
2.2.2 频率分布直方图与折线图整体设计教材分析这一节主要通过频率分布表来探究频率分布直方图的直观意义、作图方法和作图步骤,并在此基础上使学生能画出频率分布折线图,总体密度曲线.由于作统计图表的操作性很强,所以在教学中要使学生在明确图表的含义的前提下,让学生自己动手作图.关于总体密度曲线,需要使学生了解:总体在区间(a,b)内取值的百分比就是教科书图2.23中阴影部分的面积,通过思考栏目的两个问题要使学生了解到,有的总体没有密度曲线,例如总体是掷骰子试验的所有可能出现的结果;总体密度曲线与总体分布相互唯一确定.三维目标1.认识频率分布直方图、频率分布折线图和总体密度曲线的特点.2.能正确画出频率分布直方图、频率分布折线图、总体密度曲线.3.通过组织学生观察频率分布直方图、频率分布折线图、总体密度曲线的特点,用图形直观的方法引出它们的概念,有利于学生对概念的了解.4.教学中引导学生自己动手作图,在作图的过程中去体会概念、形成概念,培养学生用运动变化的观点认识它们的辩证关系,感受自然界的辩证法,使学生体会知识之间的有机联系,感受数学的整体性,激发学生的学习兴趣.重点难点教学重点:1.频率分布直方图、频率分布折线图、总体密度曲线的概念以及它们之间的辩证关系;2.画频率分布直方图、频率分布折线图、总体密度曲线.教学难点:1.体会分布的意义和作用.2.对总体分布概念的理解,统计思想的初步形成.课时安排1课时教学过程导入新课分析数据的一种基本方法是用图形将它们画出来,或者用紧凑的表格改变数据的排列方式.作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是改变数据的构成形式,为我们提供解释数据的新方式.这就是我们初中学过的频数分布图和频数分布表,在此基础上我们从各个小组数据在样本容量中所占比例大小的角度进一步研究频率分布直方图.推进新课新知探究频数分布表虽然能体现出数据的分布规律,但它并不直观,为了直观地体现出数据的分布规律,我们需要画频率分布直方图.在初中,已学过如何绘制频数直方图,它能直观地体现数据的分布规律.同样我们可以用直方图来反映样本的频率分布规律.可以利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图,简称频率直方图.一般地,作频率分布直方图的方法为:把横轴分成若干段,每一线段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的组距频率,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.频率分布直方图的两种类型:用样本频率分布估计总体分布通常分为两种情况:(1)当总体中的个体取不同数值很少时,其频率分布表由所取的样本的不同值及其相应频率表示,其几何表示就是相应的条形图.条形图中纵轴表示的是频率,条形图的高为该组数据的频率.但应注意“总体中的个体取不同数值很少”并不是指“总体中的个数很少”.(2)当总体中个体取不同值较多,甚至无限时,对其频率分布研究用到初中学过的整理样本数据的知识,用频率分布直方图来表示相应的样本的频率分布.频率分布直方图的优点和缺点:频率分布直方图比频率分布表更直观、形象地反映了样本的分布规律;但绘制频率分布直方图的过程比较复杂,且它不能直接体现数据的频数分布.将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图,简称频率折线图.如果将样本容量取得足够大,分组的组距取得足够小,则相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.如下图所示.总体密度曲线反映了总体在各个范围内取值的百分比.根据这条曲线,可求出总体在区间(a ,b)内取值的概率等于总体密度曲线,直线x=a ,x=b 及x 轴所围图形的面积.说明:(1)有的总体没有总体密度曲线.例如总体是抛掷硬币(骰子)的大量重复试验的所有可能出现的结果.(2)总体密度曲线与总体分布是相互唯一确定的.如果总体分布已知,就可以得到密度曲线的函数表达式,从而用函数的理论去研究它.(3)我们所面临的情况是总体分布未知,因此可以通过样本频率折线近似,但不能够通过样本数据准确地画出总体密度曲线.应用示例例1 下表是某学校一个星期中收交来的失物件数,请将5天中收交来的失物数用条形图表示.分析:当总体中的个体取不同数值很少时,可用频数条形图或频率条形图来表示.解:用Excel 作条形图:(1)在Excel 工作表中输入数据,光标停留在数据区中;(2)选择“插入/图表”,在弹出的对话框中点击“柱形图”;(3)点击“完成”.如下图:点评:利用Excel 画图很方便.例2 作出上面例1中数据的频率分布直方图、频率折线图和密度曲线.分析:根据绘制频率分布直方图、频率折线图和密度曲线的过程解题.解:频率分布直方图:(1)先制作频率分布表(上面已完成),然后作直角坐标系,以横轴表示身高,纵轴表示组距频率; (2)在横轴上标上表示150.5,153.5,156.5,…,180.5的点(为方便起见,起始点可适当前移);(3)在上面标出的各点中,分别以连接相邻两点的线段为底作矩形,高等于该组的组距频率. 至此,就得到了这组数据的频率分布直方图,如图所示:频率分布折线图:取直方图中各相邻矩形的上底边的中点顺次连结,再将矩形的边去除,得频率折线图如图.总体分布的密度曲线:可近似地表示为:点评:(1)频率分布直方图比频率分布表更直观、形象地反映了样本的分布规律,如在164附近达到“峰值”,并具有一定的对称性,这说明这批学生的身高在164 cm 附近较为集中.另外还可看出,特别高和特别矮的学生较少.(2)在频率分布直方图的基础上,取直方图中各小矩形的上底边的中点顺次连结起来时需注意:取值区间两端点需分别向外延伸半个组距,以使折线首尾分别与横轴相连.(3)频率分布折线图的优点是它能反映数据的变化趋势,但它不能直接体现数据的分布规律.例 3 下图是某单位50名职工的年龄(取正整数)的频率分布直方图,各小长方形的高AE∶BF∶CG∶DH=2∶4∶3∶1,由图中提供的信息,回答下列问题(直接写出答案):(1)第二小组的频率和频数分别是多少?(2)不小于38岁但小于46岁的职工的频率是多少?(3)若46岁的职工有一人,则46岁以上的职工有几人?分析:此题主要考查小矩形的长、宽、面积含义.解:(1)设DH=x ,则CG=3x,BF=4x,AE=2x.所以, (x+3x+4x+2x)×4=1.所以,x=401.所以第二小组的频率:4×401×4=52,频数:25×50=20. (2)4×401×4+3×401×4=107=0.7. (3)4×401×50-1=4. 点评:注意每个小矩形的长与宽的含义及小矩形的面积=组距×组距频率=频率,各小矩形的面积表示相应各组的频率,频率分布直方图以面积的形式反映了数据落在各小组的频率的大小.在频率分布直方图中,各小长方形的面积总和等于1.例4 为了了解一大片经济林的生长情况,随机测量其中100株树木的底部周长,得到如下数据表(单位:cm ):(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100 cm 的树木约占多少,底部周长不小于120 cm 的树木约占多少.解:(1)从表中可以看出,这组数据的最大值为135,最小值为80,故全距为55,可将其分为11组,组距为5.从第一组[80,85)开始,将各组的频数、频率和组距频率填入下表中.(2)这组数据的频率直方图如下图所示.(3)从频率分布表可以看出,该样本中小于100的频率为0.01+0.02+0.04+0.14=0.21,不小于120的频率为0.11+0.06+0.02=0.19,故可估计该片经济树林中底部周长小于100 cm的树木约占21%,底部周长不小于120 cm的树木约占19%.知能训练1.在样本频率分布直方图中,共有11个小矩形,若中间一个小矩形的面积等于其它10个小矩形的面积的和的1/4,且样本容量为160,则中间一组的频数为()A.32B.0.2C.40D.0.252.从一条生产线上每隔30分钟取一件产品,共取了n件,测得其尺寸后,画得其频率分布直方图如图,尺寸在[15,45]内的频数为46,则尺寸在[20,25]内的产品个数为()A.5个B.10个C.15个D.20个3.为了解各年龄段观众对某电视剧的收视情况,某校一个研究性学习小组,调查了部分观众收视情况,并分成A、B、C、D、E、F六组进行整理,其频率分布直方图如图所示,则:(1)E组的频率为_________________;(2)补全频率分布直方图;(3)若该村观众人数为1 200,估计该村50岁以上的观众有_______________人.解答:1.A 2.B 3.(1)0.24 (2)略(3)432课堂小结(1)正确利用频率分布直方图、频率折线图和密度曲线三种分布的描述方法,都能得到一些有关分布的主要特点,如分布是否具有单峰性、是否具有对称性、样本点落在各分组中的频率等,这些主要特点受样本的随机性的影响比较小,更接近于总体分布的相应的特点.(2)频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式.(3)当总体中的个体取不同数值很少(并不是总体中的个数很少)时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图.作业1.课本习题2.2 2、3、4、5.2.请班上的每个同学估计一下自己每天的课外学习时间(单位:分钟),然后作出课外学习时间的频率分布表、频率分布直方图、频率分布折线图、总体密度曲线.你认为能否由这些估计出你们学校的学生课外学习时间的分布情况?可以用它来估计该地区的学生课外学习时间的分布情况吗?为什么?设计感想由于初中学过频数条形图,所以学生在刚接触画频率分布直方图时,学生很自然的想法是以纵轴表示频率.教师应肯定学生的想法,并按此想法操作,然后向学生说明这样做虽然直观和容易理解,但为了与后续学习内容中的密度曲线、正态分布曲线(理科)等衔接,而频率分布直方图的另一种画法,在以后的学习中可充分体现其优点.这样做,既保护了学生学习的积极性,也激发了学生对数学的好奇心.。
高中数学第2章统计2.2总体分布的估计2.2.1频率分布表目标导引素材苏教版必修3(2021学年)
高中数学第2章统计2.2总体分布的估计2.2.1 频率分布表目标导引素材苏教版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第2章统计2.2 总体分布的估计2.2.1 频率分布表目标导引素材苏教版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第2章统计 2.2 总体分布的估计 2.2.1 频率分布表目标导引素材苏教版必修3的全部内容。
2.2。
1频率分布表一览众山小诱学·导入材料:很多的事例让我们感到了分析体育彩票规律的重要性:通化的一位彩民通过长期地投资终于中得500万大奖使很多彩民都感叹不已,长春市的三位先生通过体彩数据具体分析后用1万元中出了500万体彩特等奖和50万体彩特别奖更是让彩民震惊,而他们的成绩多是来源于长期的关注与细致的分析讨论,所以,要想中得大奖,数据分析应该是彩民的捷径.问题:每一期体彩的信息的原始状态往往散乱无序,带有一定的随机性,那么彩民之所以能中大奖所用的“推测"的方法有科学依据吗?导入:体育彩票市场曾创造了无数的神话,相当一部分中奖者在谈及自己的中奖经历时都表示,他们能够中奖,是经过长期研究体育彩票的走势、中奖号码分布特点后(即作出频率分布表)精心选号的结果.所以说彩民之所以能中大奖“推测”的方法是科学的,“推测”的结果是比较可靠的,以此为依据而作的决策也是比较正确的。
温故·知新1.抛掷一枚硬币若干次,你能否列出它的频率分布表?这个问题我们在初中已经学会解决了。
如下表所示:2。
我们通过随机抽样的方法在总体中抽取样本就得到了一组数据,怎样从得到的这组数据的信息来研究总体的信息呢?用样本的频率分布与数字特征来估计总体的频率分布与数字特征.虽然我们每次抽样所获得的样本数据各不相同,但总体的频率分布与数字特征是不会改变的.以上就是本文的全部内容,可以编辑修改。
【配套K12】高中数学第2章统计2.2总体分布的估计2.2.1频率分布表教材梳理导学案
2.2.1 频率分布表庖丁巧解牛知识·巧学一、样本的频率分布概念当总体很大或不便获得总体的频率时,可以用样本的频率分布估计总体的频率分布.根据所抽取样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值情况),就叫做样本的频率分布.二、样本频率分布表的编制方法为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,这样的表就叫样本频率分布表. 编制频率分布表的步骤:(1)求极差(也称求全距,即一组数据的最大值与最小值的差). (2)决定组距与组数(组距的选择应力求“取整”,如果极差不利于取整即不能被组数整除,可适当增大极差,如在左右各增加适当的范围).(3)决定分点,将数据分组(分组时常对各组数值取左闭右开区间,最后一组取闭区间). (4)登记频数、计算频率列出频率分布表(频率=频数/样本容量).联想发散 组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况.分组的组数与样本容量有关,一般样本容量越大,所分组数越多.根据样本容量的大小,通常将数据分成5—12组.组数的“取舍”不依据四舍五入,而是当组距极差不是整数时,组数=[组距极差]+1. 组距为1.0,极差为4.1,则组数=组距极差=0.11.4=4.1,也就是说组数为5. 如果数据比较多,人工无法迅速处理时,在求极差和计算频数时可借助于计算机很方便地进行.频率分布表排除了抽样造成的误差,精确地反映了总体取值的频率分布规律(总体分布).三、样本频率分布与总体分布的关系1.样本中某数据的频数和样本容量的比,就是该数据的频率.所有数据的频率分布变化规律叫做样本频率分布.2.总体取值的可能性分布规律叫做总体可能性分布,简称总体分布,由于总体取值分布通常不易知道,因此往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布.3.样本频率分布是随着样本容量的增大更加接近总体分布,也就是说,样本的容量越大,这种估计就越精确.4.对于样本,只读频率,不能跟总体的可能性混淆,若样本的容量越大,则频率越接近于可能性.四、随机变量与总体分布的联系1.学习有关总体分布的知识,要注意把总体分布的概念与随机变量联系起来.比如,对于多次重复抛掷某一硬币的实验来说,每次抛掷硬币的结果,既可以看成是从很多这种试验结果组成的总体中抽取的一个个体值,还可以看成是在同一随机试验下相应的随机变量所取的一个值.2.将总体与随机变量沟通后,总体分布也就是相应的随机变量的可能性分布,这样我们就可以利用可能性的理论来研究统计问题,由此可以看到可能性论与统计学之间的有机联系.典题·热题知识点一样本的频率分布概念例1 一个容量为n的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n等于()A.750B.120C.240D.150思路解析:某一组的频率等于该组的频数与样本容量的比.由于30/n=0.25,所以n=120. 答案:B方法归纳本题考查各组频率的计算方法,以便制作出频率分布表.例2 一个容量为20的样本数据,分组后组距与频数如下:[10,20)2个,[20,30) 3个,[30,40) 4个,[40,50) 5个,[50,60) 4个,[60,70) 2个,则样本在区间(-∞,50)上的频率为()A.5%B.25%C.50%D.70%思路解析:小于50的频数共有14个,因此频率为14/20=70%.答案:D方法归纳根据总体分布的估计中的频率分布表,可以得出样本数据小于某一值的频率叫做累积频率.频率分布与累积频率分布从不同的角度反映了一组数据的分布情况,起着相互补充的作用.知识点二样本频率分布表的编制方法(1)列出样本频率分布表;(2)估计身高小于134 cm的人数占总人数的百分比.思路分析:根据样本频率分布表、频率分布直方图的一般步骤解题.(2)由样本频率分布表可知身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.方法归纳累积频率分布反映了一组数据在某一个范围上的分布情况,对考查总体分布起着补充的作用,在实际应用中是重要的一个考查项目.问题·探究交流讨论探究问题用样本估计总体时会有误差吗?如果有,怎样尽量减少误差呢?探究过程:学生甲:我觉得用样本估计总体的时候,由于样本毕竟不是总体,所以用样本来估计总体一般来说是有误差的,区别只是误差的大小而已.当样本的选取合理、具有代表性的时候误差就很小.学生乙:结合实例说明用样本估计总体时会有误差,如在全国范围内的民意测验中,如果民意测验者走进大学校园里去访问1 000名大学生,对他们进行民意调查,他们所组成的样本将不会公平地代表全国的民意,这是因为大学生选民的比例很小,而且是一个有倾向性的团体,不能代表全体选民,这样的不公平就使得样本估计总体的误差比较大,这就是样本的选取不合理造成的.学生丙:为了减少误差,在条件允许的情况下,适当地增大样本容量也是一个提高结果准确性的不错的办法.探究结论:用样本估计总体时会有误差,为了减少误差,除了计算要求准确外,最关键的是样本的选取一定要合理,让它能最大程度地代表总体.。
高中数学第2章统计2.2总体分布的估计名师导航学案苏教版必修3201710314108
2.2 总体分布的估计名师导航三点剖析一、频率分布表1.定义总体分布反映了总体在各个范围内取值的频率,由于总体很大或不便于获得,因此我们可以利用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.2.列频率分布表的步骤在初中我们所接触的频率表是通过历史上所做的抛硬币的大量重复试验得到的.在这个试验中,抛掷硬币试验的结果的全体构成一个总体,每次试验的结果是总体中的一个个体,如果我们从中抽取一个容量为72 088的样本,其中正面向上的结果数为36 124,反面向上的结果数为35 964,则我们就可以得到如下一个频率分布表:这类试验只有两种结果,比较简单,下面我们就通过实例来研究较为复杂的频率分布表的制作方法.例如:从规定尺寸为25.的一堆产品中任意抽取100件,测得它们的实际尺寸如下:25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.47 25.35 25.41 25.43 25.4425.49 25.45 25.43 25.46 25.40 25.51 25.45 25.40 25.39 25.41 25.36 25.38 25.3125.56 25.43 25.40 25.38 25.37 25.44 25.33 25.46 25.40 25.39 25.34 25.42 25.5025.37 25.35 25.32 25.45 25.40 25.27 25.43 25.54 25.39 25.45 25.43 25.40 25.4325.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46 25.3825.35 25.31 25.34 25.40 25.36 25.41 25.32 25.38 25.42 25.40 25.33 25.37 25.4125.49 25.35 25.47 25.34 25.30 25.39 25.36 25.46 25.29 25.40 25.37 25.33 25.4025.35 25.41 25.37 25.47 25.39 25.42 25.47 25.38 25.39如果把这堆产品的尺寸的全体看作一个总体,则上面数据就是从总体抽取的一个容量为100的样本.在这组数据中,最小值为25.24,最大值为25.56,它们相差0.32,可取区间[25.235,25.565].我们可将此区间分成11个区间,每个区间长度为0.03,再统计出每个区间内的频数,并计算相应的频率,将结果填入下表:这张表给出了产品尺寸处于各个区间内的个数和频率,由此可估计这一堆产品的尺寸分布情况,这就是该样本的频率分布表.在表中频数是指落在各小组内的数据的个数.频率是各组的频数与数据总数的比值由上面的制表过程可得编制频率分布表的步骤如下:(1)计算数据中最大值与最小值的差,算出了这个差就可以知道这组数据的变动范围有多大.(2)决定组数与组距.将这一批数据分组,目的是要描述数据的分布规律,要根据数据的多少来确定分组的数目.一般来说,数据越多,分的组也越多.(3)决定分点.要使分点比数据多一位小数,并且把第1组的下限略去或把第1组的起点稍减小一点.(4)列频率分布表.登记频数,计算频率,列出频率分布表.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.在编制频率分布表时,若题目已给出了组距和组数,可以直接列出频率分布表.3.频率分布的优点和缺点频率分布表的优点是:能直接反映数据在各范围内的频数和频率;其缺点是:不能直观地反映数据的频率分布, 分布表是否正确.二、频率分布直方图1.定义频率分布表虽然能体现出数据的分布规律,但它并不直观,为了直观地体现数据数的分布规律,我们需要画频率分布直方图.在初中,我学过如何绘制频数直方图,它能直观地体现数据的分布规律.同样我们可以用直方图来反映样本的频率分布规律.这种反映样本的频率分布规律的直方图称为频率分布直方图,简称频率直方图.2.绘制频率分布直方图的步骤为了形象地说明绘制频率分布直方图的步骤,我们还以具体的实例来说明频率分布直方图的画法.例如:有一个容量为50的样本数据的分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5), 4.列出样本的频率分布表,画出频率分布直方图分析:本题主要考查频率分布表的编制和频率分布直方图的绘制及频率分布表的应用.由于题中数据已分组,所以在列频率分布表时,只要直接计算出每小组数据的频率填入表中即可.解:样本的频率分布表、频率分布直方图如下:频率分布表频率分布直方图(如图6-1所示):图6-1所以,要绘制此样本的频率分布直方图,有以下几步:频率;(1)先列出频率分布表,然后作出直角坐标系,以横轴表示身高,纵轴表示组距(2)在横轴上标上12.5,15.5,…,33.5表示的点(为了方便,第一个数据点可以前移);频率, (3)在上面标出的各点中,分别以相邻两点为端点的线段为底边作矩形,其高等于组距至此,就得到了这组数据的频率分布直方图.一般地,画频率分布直方图方法如下:把横轴分为若干段,每一段对应一组的组距,然后以线段为底,作一个矩形,它的高等频率,作出一系列的矩形;每个矩形的面积恰好是该组的频率,这些矩形就构成于该组的组距了频率分布直方图.在频率分布直方图中各个小矩形的面积和等于1.3.频率分布直方图的两种类型用样本频率分布估计总体分布通常分两种情况:(1)当总体中的个体取不同数值很少时,其频率分布表由所取的样本的不同值及其相应频率表示,其几何表示就是相应的条形图.条形图中,纵轴表示的是频率,条形图的高为该组数据的频率.但应注意:“总体中的个体取不同数值很少”并不是指“总体中的个数很少.”例如:前面所接触到的抛掷硬币的试验中,尽管样本的容量达到了72088,但试验结果只有两种,即正面向上和反面向上.如果记“正面向上”的结果为0,记“反面向上”为1,则样本中数据只有两个取值.此时,该样本的频率分布表的几何表示就为相应的条形图. (2)当总体中个体取不同值较多,甚至无限时,对其频率分布研究用到初中学过的整理样本数据的知识,用频率分布直方图来表示相应的样本的频率分布.4.频率分布直方图的优点和缺点频率分布直方图虽然能直观体现数的分布规律,但要绘制频率分布直方图过程比较复杂,且它不能直接体现数据的频数分布.三、频率折线图与总体的密度曲线1.频率折线图的定义将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就可以得到一条折线,这条折线就是本组数据的频率折线图.2.频率折线图的画法频率折线图是在频率分布直方图的基础上,取直方图中各小矩形的上底边的中点连结而成的.画频率折线图时还应注意:取值区间两端点需分别向外延伸半个组距,以使折线首尾分别与横轴相连.3.频率折线图的优点与缺点频率折线图的优点是它能反映数据的变化趋势,但它不能直接体现数据的分布规律. 4.总体的密度曲线在画频率折线图时,如果将样本容量取得足够大,分组的组距取得足够小,这条折线将趋于一条曲线,这一曲线为总体的密度曲线,它能反映出总体分布规律.例如:为了估计某产品寿命的分布,对产品进行抽样检验,记录如下(单位:小时):203 397 597 402 102 303 289 312 501 316 488 355 585 355413 316 197 479 384 278 522 363 234 432 357 566 111 333467 265 326 534 318 552 323 188 352 447 452 337 123 370399 445 365 549 248 316 459 331 176 554 368 412 374 251327 489 329 246 316 475 311 260 133 314 426 366 213 495335 540 338 407 586 331 290 368 410 167 320 510 364 276305 417 307 524 573 326 146 227 317 407 369 214 504 425153 214(1)作出频率分布表;(2)画出频率分布直方图和频率折线图;(3)估计产品寿命在200~500h以内的百分率;(4)估计产品寿命在400h以上的百分率.分析:此题中样本数据取不同的值较多,属于总体分布的第二种情况.将样本中数据适当分组统计各组中数据的频数,计算其频率即可.解:(1)该组数据中最小值为102,最大值为597,差为495,可分为5组.列表如下:(2)频率分布直方图和频率折线图如下(如图6-2所示):频率分布直方图频率折线图图6-2(3)200~500 h以内的百分率为1-15%=85%.(4)产品寿命在400h以上的百分率为20%+15%=35%.四、茎叶图1.平均数、中位数和众数一般地,对于n 个数x 1,x 2,…,x n ,我们把nx x x n+++ 21叫做这n 个数的算术平均数,简称平均数.平均数常用于表示一组数据的平均水平.计算平均数时,所有数据都参加运算,它能充分利用数据所描述的信息,因此在生活中较为常用,但它易受端点值的影响.例如:某公司职工月工资表如下:经计算,该公司职工月平均工资为2 000元,但除经理和副经理之外其他员工的工资均小于2 000元,这就是因为平均数受端点值6 000和500的影响.一般地,n 个数据根据大小顺序排列后,处于中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.由中位数的定义可知,当数据的个数是奇数时最中间的一个数据是中位数;当数据的个数是偶数时,则最中间两个数据的平均数是中位数.中位数受端点值的影响小,但不能充分利用所有数据的信息.例如:在上面某公司职工月工资表中的中位数是1 300.众数则是一组数据中出现次数最多的那个数据.如在上面某公司职工月工资表中众数则是平均数、中位数和众数均能反映一组数据的平均水平,在一组数据中平均数和中位数只有一个,众数则可以有多个例如:在数据1.5,1.5,1.6,1.65,1和1.7,1.7,1.75,2.1中,平均数为1.7;中位数为1.675;众数则为1.5和1.7.2.茎叶图制作茎叶图的方法是:当所给数据为一位数时,可将0作为茎叶较长的茎,而它本身作为叶;当所给数据为两位数时,将所有两位数的十位数字作为“茎”,个位数字作为“叶”;当所给的数据为三位数时,可将百位和十位作为茎,而个位作为叶.茎相同的数据共用一个茎,茎按从小到大的顺序从上到下排列,共用茎的叶一般要按从大到小(也可以从小到大)的顺序同行排出.制作茎叶图时,一般用一个竖线将茎叶隔开,竖线的左边是茎,右边是叶.由茎叶图我们可以粗略地看出一组数据的平均数、中位数、众数的范围.茎叶图不但可以分析单组数据,也可以对两组数据进行对比.当列两组数据的茎叶图时,它们可以共同用一个茎.3.茎叶图的优点和缺点茎叶图的优点是:所有信息都可以从茎叶图中得到体现,而且茎叶图便于记录和表示;它既可以分析单组数据,也可以对两组数据进行比较.茎叶图的缺点是:茎叶图不方便表示位数在三位以上的数据.问题探究问题:为了了解一大片经济树林的生长情况,随机测量其中的100株的底部周长,得到如下数据(长度单位为cm):135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112109 124 87 131 97 102 123 104 104 128105 123 111 103 105 92 114 108 104 102129 126 97 100 115 111 106 117 104 109111 89 110 121 80 120 121 104 108 118129 99 90 99 121 123 107 111 91 10099 101 116 97 102 108 101 95 107 101102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108 该用什么样的方法来估计经济树林的生长情况?探究:用样本估计可用频率分布表、频率分布直方图和频率折线图.它们有着各自的特点:频率分布表编制比较简单且能体现出数据在各范围出现的次数和频率,但它不能直观地反映数据的频率分布;频率分布直方图虽然能直观体现数的分布规律,但要绘制频率分布直方图过程比较复杂,且它不能直接体现数据的频数分布;频率折线图的优点是它能反映数据的变化趋势,但它不能直接体现数据的分布规律.所以,本题采用何种方法来估计经济树林的生长情况,要视具体要求而定,例如:估计这片经济林中底部周长少于100cm的树木约占多少?不少于120cm的树木约占多少?我们可采用频率分布表,这是因为它能直接体现出数据在各范围内出现的次数和频率.如果要考查某一范围内数据的变化情况,则可采用频率折线图.精题精讲例1.为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下表(单位:kg):试根据上述数据列出样本的频率分布表,并对相应的总体分布做出估计.思路解析该组数据中最小值为55,最大值为76,它们的差是76-55=21,可取区间[54.5,76.5],并将此区间分为11个区间,每个区间的长度为2,再统计每个区间内的频数并计算频率,列表即可.解析:按照下列步骤获得样本的频率分布:(1)求最大值与最小值的差.在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76-55=21,所得的差告诉我们,这组数据的变动范围有多大.(2)确定组距与组数.如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数是适合的.于是组距为2,组数为11.(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5).(4)列频率分布表.频率分布表在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计体重在[64.5,66.5)kg的学生最多,约占学生总数的16%;体重小于58.5 kg的学生较少,约占8%等等.绿色通道一般地,列频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=全距/组数;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.频数累计是指本组数据及本组数据以前各组数据的和.频率分布表有两条较为明显的性质:①各组的频数和为样本中数据的个数;②各组的频率和为1.例2.下表给出了某校120名12岁男孩的身高资料(单位:cm):(1)列出样本的频率分布表; (2)画出频率分布直方图;(3)根据样本的频率分布图,估计身高小于134cm 的人数约占总人数的百分比;(4)如果该校所在的地区,12岁男孩有12万人,根据上面的统计结果,你能估计出身高在150 cm 以上的男孩大约有多少人?(5)如果样本容量再大一些,组距再小一些,请你想象一下,直方图中的小矩形会发生什么变化?思路解析由于题目中数据已分组,则可直接列频率分布表.由于频率分布图能直观地体现出样本的频率分布,则由图直接进行估计.由频率分布表可知身高在150cm 的频率为241201 ,所以,估计出身高在150cm 以上的男孩大约11 000人.如果样本容量再大一些,组距再小一些,频率分布直方图中的各个小矩形就会越来越细.当样本容量充分大时,图中的组距充分缩短,从而图中的小矩形的上底的连线就变成光滑的曲线. 答案:(1)列频率分布表如下:(2)频率分布直方图分布如下(如图6-3所示):图6-3(3)身高小于134cm的学生数约占总数的19%.(4)身高在150cm以上的男孩大约11 000人.(5)各个小矩形就会越来越细,当样本容量充分大时,图中的组距充分缩短,图中的小矩形的上底的连线就变成光滑的曲线.例3.为制定本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高作调查,现有三种调查方案:①测量少体校中180名男子篮球、排球队员的身高;②查阅有关外地180名男生身高的统计资料;③在本市的市区和郊县各任选一所完全中学、两所初级中学,在这六所学校有关的年级(1)班中,用抽签的方法分别选出10名男生,然后测量他们的身高.(1)为了达到估计本市初中这三个年级男生身高分布的目的,你认为采用上述哪一种调查方案比较合理,为什么?(2)下表中的数据是使用某种调查方法获得的:(注:每组可含最低值、不含最高值)根据表中的数据填写表中的空格.根据填写的数据绘制频数分布直方图.思路解析本题考查了抽样方法的选择和频数分布直方图的绘制,由于在统计中收集数据必须用随机抽样的方法所抽取的数据才具有代表性,则宜用方案③.又所抽的数据中已分组,则可直接计算各组数据的频数分布和直接绘制频数分布直方图.解析:(1)在统计中收集数据必须用随机抽样的方法所抽取的数据才具有代表性.①中,少体校的男子篮球、排球的运动员的身高一定高于一般的情况,因此无法用测量的结果去估计总体的结果.②中,用外地学生的身高也不能准确地反映本地学生身高的实际情况.③中的抽样方法符合随机的抽样,因此用方案③比较合理.(2)①上表中的频数从上到下依次为15,33,96,33,3.②直方图如图6-4所示.绿色通道统计中数据的获得要合理、公平、具有代表性,这是解决问题的第一关.它直接影响着统计的结果,影响正确结论的得出,也就影响着正确决策的制定.例4.从某校参加初中毕业考试的学生的成绩中,抽取了30名学生的数学成绩,分数如下: 90,85,84,86,87,98,79,85,90,93,68,95,85,71,78,61,94,88,77,100,70,97,85,68,99,88,85,92,93,97.这个样本数据的频率分布表如下:填空(1)这个样本数据的众数是_________分.(2)列频率分布表时,所取的组距为_________分.(3)在这个频率分布表中,数据落在94.5~99.5分范围内的频数为_________.(4)在这个频率分布表中,数据落在74.5~79.5分范围内的频率为_________.(5)在这个频率分布表中,频率最大的一组数据的范围是_________分.(6)估计这个学校初中毕业考试的数学成绩在80分以上(含80分)的约占_________%.思路解析(1)众数是一组数据中出现次数最多的数,它的数量可以是多个.在本题中落在84.5~89.5分范围内的数据的个数最多,而这组数据的组中值为85分,则可以用85分来代表这组数据.(2)考查频率分布表制作过程中组距的划分,由于该组数据所取的区间为[59.5,104.5],最大值与最小值的差为45,又整个区间被分为9组,则组距为5.(3)考查识表能力,由所给的频率分布表可知,在94.5~99.5分的频率数为5.(4)考查识表能力,由所给的频率分布表可知,数据落在74.5~79.5分范围内的频数为3,则由频率的计算公式可得,数据落在74.5~79.5分范围内的频率为0.100.(5)考查识表能力,由所给的频率分布表可知,表中频数的最大值为9,它的分布范围为84.5~89.5分.(6)考查识表能力,当某一范围由几组数据组成时,则在这一范围内数据出现的频率为构成这一范围各组数据出现的频率的和.答案:(1)85 (2)5 (3)5 (4)0.100 (5)84.5~89.5 (6)73.3(7)频率分布直方图和折线图如图6-5所示:图6-5绿色通道一般地,将频率分布直方图中各个矩形上底的中点顺次连结起来,就得到一条折线,我们称之为本组数据的频率分布折线图.如果将样本的容量取得足够大,分组的组距取得足够小,则这条折线将趋近于一条曲线,我们称之为总体分布的密度曲线.例5.甲、乙两篮球运动员上一个赛季的得分如下:甲:21,25,31,31,14,34,32,41,50,23,8.乙:13,34,35,34,23,24,41,50,32,37,32.试比较两人的得分水平.思路解析当所给数据为两位数时,将所有两位数的十位数字作为“茎”,个位数字作为“叶”.当列两组数据的茎叶图时,它们可以共同用一个茎.解析:画茎叶图(如图6-6所示),由图可知,乙运动员的得分大致对称,其平均数、众数、中位数都是30多分,比甲稳定.图6-6绿色通道用茎叶图刻画数据有两个优点:一是所有信息从图中可以得到;二是茎叶图便于记录和表示,但茎叶图对于表示三位数以上的数据是不够方便的.。
高中数学第2章统计2.2用样本估计总体2.2.1用样本的频率分布估计总体分布aa高一数学
12/9/2021
第三十一页,共七十页。
(2) 已 知 标 准 乒 乓 球 的 直 径 为 40.00 mm , 且 称 直 径 在 [39.99,40.01)内的乒乓球为五星乒乓球,若这批乒乓球共有 10 000 个,试估计其中五星乒乓球的数目.
12/9/2021
第三十二页,共七十页。
解:(1)由频率分布表可知 n=12÷0.20=60, a=60×0.50=30,b=60-6-12-30=12, p1=6÷60=0.10,p2=12÷60=0.20. 频率分布直方图如图:
[122,126) 5 0.04 [126,130) 8 0.07 [130,134) 10 0.08 [134,138) 22 0.18 [138,142) 33 0.28 [142,146) 20 0.17 [146,150) 11 0.09 [150,154) 6 0.05 [154,158] 5 0.04
12/9/2021
第一页,共七十页。
2.2 用样本估计总体(zǒngtǐ) 2.2.1 用样本的频率分布估计总体分布
12/9/2021
第二页,共七十页。
12/9/2021
课前自主(zìzhǔ)学习
登高(dēnggāo)揽胜 拓界展怀
第三页,共七十页。
学习目标
1.体会分布的意义和作用. 2.掌握列频率分布表,画频率分布直方图、频率分布折线 图、茎叶图的方法,体会它们各自的特点. 3.体会用样本估计总体的思想,会用样本的频率分布估计 总体分布. 4.能够利用图表解决实际问题.
检查,测得每个球的直径(单位:mm),将数据进行分组,得到
如下频率分布表:
分组
频数 频率
12/9/2021
苏教版高中数学必修三第二章-统计2.2.1、2ppt课件
【问题导思】 频率分布表能够反映出总体的部分特征,我们还学过哪 些更为直观地体现数据分布规律的方法?
【提示】 频率分布直方图与折线图.
1.(1)定义:我们用直方图反映 样本的频率分布规律 , 这样的直方图称为频率分布直方图,简称频率直方图. (2)绘制步骤 ①先制作 频率分布表 ; ②建立直角坐标系:把横轴分成若干段,每一段对应一 频率 个组的 组距 ,竖轴等于该组的 组距 ,并标上一些关键点; ③画矩形:在横轴上,以连结两相邻两点的线段为 底 , 频率 以纵轴上 为高作 矩形 ,这样得一系列矩形,就构成了 组距 频率分布直方图.
[157.5,161.5)
[161.5,165.5) [165.5~169.5]
40
48 50
15
8 2
0.30
0.16 0.04
合计
50
1.00
列频率分布表的注意事项: (1)计算全距,需要找出这组数据的最大值和最小值.当 数据很多时,可选一个数当参照; (2)将一批数据分组,目的是要描述数据的分布规律,要 根据数据多少来确定分组数目.一般来说,数据越多,分组 越多; (3)将数据分组,决定分点时,一般使分点比数据多一位 小数,并且把第一组的起点稍微减小一点; (4)列频率分布表时,可通过逐一判断各个数据落在哪个 小组内,以“正”字确定各个小组内数据的个数.
课 标 解 读
1.体会用样本的频率分布估计总体分 布的思想(重点). 2.会用频率分布表、画频率分布直 方图,频率分布折线图(重点).
频率分布表
【问题导思】 如下样本是随机抽取近年来北京地区 7 月 25 日至 8 月 24 日的最高气温.
41.9
7月25日至 8月10日 32.5 28.6 8月8日至 8月24日
高中数学 第2章 统计 2.2 总体分布的估计 第1课时 频率分布表 频率分布直方图与折线图课件 苏教版必修3
40.03 40.00 39.98 40.00 39.99 40.00 39.98 40.01 39.98 39.99 40.00 39.99 39.95 40.01 40.02 39.98 40.00 39.99 40.00 39.96
(3)成绩不低于 110 分的同学能参加决赛的频率为 0.08+0.04+0.02=0.14,所以估计该校能参加决赛的 人数大约为 600×0.14=84.
[一点通] 1.在列频率分布表时,全距、组距、组数有如下 关系:
全距
全距
பைடு நூலகம்
(1)若组距为整数,则组距=组数.
(2)若全组距距不为整数,则全组距距的整数部分+1=组数.
1.频率分布表 (1) 定 义 : 当 总 体 _很__大__ 或 不___便__于__获__得_ 时 , 可 以 用 _样__本__的__频__率__分布估计总体的频率分布.我们把反映_总__体__频__率__ 分布的表格称为频率分布表. (2)绘制的步骤:
全距 ①求全距,决定组数和组距,组距=组数. ②分组,通常对组内数值所在区间取_左__闭__右__开__区间,最 后一组取闭区间. ③登记_频__数__,计算_频__率__,列出频率分布表.
2.组距和组数的确定没有固定的标准,将数据分组时,组
数力求合适,使数据的分布规律能较清楚地呈现出来,组数太
多或太少,都会影响我们了解数据的分布情况,若样本容量不
超过 100,按照数据的多少常分为 5~12 组,一般样本容量越大, 所分组数越多.
1. 从全校参加科技知识竞赛的学生试卷 中,抽取一个样本,考察竞赛的成绩 分布.将样本分成 5 组,绘成频率分 布直方图(如图),图中从左到右各小组 的小长方形的高的比是 1∶3∶6∶4∶2,最右边一组的 频数是 6. 请结合频率分布直方图提供的信息,解答下列问题: (1)样本的容量是多少? (2)列出频率分布表.
高中数学 第2章 统计 2_2 总体分布的估计 2_2_2 频率分布直方图与折线图知识导引学案 苏教版必修31
2.2.2 频率分布直方图与折线图案例探究在上一节的案例探究中,作出样本的频率分布直方图,再根据直方图解决用水量标准问题.分析:作出它的频率分布直方图,就能够方便的找出一个合适的标准,从而解决用水量标准问题!解:画频率分布直方图.建立平面直角坐标系,以横轴表示月均用水量,纵坐标表示频率/组距,就得到了这组数据的频率分布直方图,如下图所示:探究:1.一般地,作频率分布直方图的方法为:把横轴分为若干段,每一段对应一个组的组距.然后以这些线段为边作矩形,矩形的高等于该组的频率/组距,这样得出的一系列的矩形,每个矩形的面积恰好是该组的频率,这些矩形就构成了频率分布直方图.2.容易知道,频率分布直方图是以面积的形式反映了数据在各个小组的频率的大小,并且可看出在频率分布直方图中,各小长方形的面积总和等于1.3.频率分布直方图比频率分布表更直观形象地反映了样本的分布规律.一般来说,样本容量越大,这种估计就越精确.4.如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为样本的频率分布折线图.5.频率折线图的优点是它反映了数据的变化趋势.如果将样本取得足够大,分组的组距取得足够小,则这条折线将趋于一条曲线,我们称这一曲线为总体分布的密度曲线.结论:从上面所作的频率分布直方图中,我们可以看到,月均用水量在区间[2,2.5)内的居民最多,在[1.5,2)内的次之,大部分居民的月均用水量都在[1,3)之间.且可以计算出大约有88%的居民月均用水量在3吨以下,因此,居民月均用水量标准定为3吨是市政府可以考虑的一个标准.自学导引1.什么叫做频率分布直方图?作频率分布直方图的一般方法是什么?答案:我们可以利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图,简称频率直方图.一般地,作频率分布直方图的方法为:以数据的单位为横轴单位,以频率/组距为纵轴单位.把横轴分成若干段,每一线段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的频率/组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图.2.什么叫做频率分布折线图?答案:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为样本的频率折线图.3.什么叫做总体分布的密度曲线?它反映了什么?答案:定义:样本容量取得足够大,分组的组距足够小,相应的频率折线图将趋于一条曲线,这条曲线就叫做总体分布的密度曲线;总体密度曲线反映了总体的变化趋势和总体在各个范围内取值的百分比.4.在频率分布直方图中,各小长方形的面积总和等于1.(因为各小长方形的面积 =所对应区间的频率,总面积 = 1 )5.作有关产品尺寸的样本的频率分布直方图时,用横坐标表示样本数据,用纵坐标表示频率/组距,在横坐标上以数据分组的两端点表示的线段为底,在纵坐标上以频率/组距为高作矩形.6.条形图用高度来表示各组的频率,直方图用面积来表示各组频率.7.从某校2 100名学生中随机抽取一个30名学生的样本,样本中每个学生用于课外作业的时间(单位:分钟)依次为:75,80,85,65,95,100,70,55,65,75,85,110,120,80,85,80,75,90,90,95,70,60,60,75,90,95,65,75,80,80.该学校的学生中作业时间是一个半小时以上(含一个半小时)的学生有630人,所占频率为0.3.(因为该样本中作业时间超过一个半小时的有9人,则频率=9/30=0.3;所以学生数=总体人数×0.3=2 100×0.3 =630)疑难剖析【例1】为了了解某地区高三学生的身体发育情况,当地教育机构抽查了本地区内100名年龄为17.5~18岁的男生的体重情况,结果如下(单位:kg):试根据上述数据画出样本的频率分布直方图与折线图,并对相应的总体分布作出估计.思路分析:此题容量较大,首先要对所给数据进行分析,找到最大值与最小值以确定全距,再分组作出频率分布表、频率分布直方图和折线图.(1)在上节【疑难剖析】例1列出频率分布表的基础上绘制出频率分布直方图如下:(2)作频率分布折线图将上述频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,这条折线就是所要作的折线图.(如下图所示)思维启示:由于图中各小长方形的面积等于相应各组的频率,这个矩形的面积的大小反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分步表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计,体重在(64.5,66.5)kg的学生最多,约占学生总数的16%;体重小于58.5 kg的学生较少,约占12%;等等.【例2】为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件.(1)画出表示样本频率分布的条形图;(2)根据条形图,估计此种产品为二级品或三级品所占的百分比约是多少?思路分析:由于总体中的个体取不同数值很少,只有四种:一级品、二级品、三级品和次品,可分别记为1,2,3和4.所以所取样本的不同数值及其相应的频率可用条形图表示,并根据频率分布条形图估计总体分布.(1)在【疑难剖析】例2列出频率分布表的基础上画样本频率分布的条形图为(2)此种产品为二级品或三级品所占的百分比约是0.27+0.43=0.70=70%.思维启示:频率分布表在数量表示上比较确切,而频率分布条形图比较直观,两者相互补充,使我们对数据的频率分布情况了解得更加清楚.特别应引起同学们注意的是条形图与直方图画法的区别.【例3】有一容量为50的样本,数据的分组及各组的频数如下:[10,15) 4,[15,20) 5,[20,25) 10,[25,30) 11,[30,35) 9,[35,40) 8,[40,45) 3(1)画出频率分布直方图;(2)估计总体中,个体分布在[20,35)之内的约占总体的百分之几?思路分析:本题考查样本的频率分布直方图的画法以及用样本频率分布估计总体分布.由于是连续型总体,从而可用频率分布直方图表示样本的频率分布,并估计总体分布.(1)在上一节【疑难剖析】例3列出频率分布表的基础上画频率分布直方图为(3)由频率分布表知数据落在[20,35)范围内的频率为0.20+0.22+0.18=0.60,总体中,个体分布在[20,35)之内的约占总体的60%.点评:频率分布直方图是用小矩形的面积表示该区间内取值的频率,所有小矩形的面积之和等于1.思维启示:用样本的频率分布估计总体分布,分以下两种情况:1.当总体中的个体取不同数值很少时,用频率分布表列出几个不同数值的频率,用相应的条形图的高来表示取各个值的频率;2.当总体中的个体取不同数值很多、甚至无限时,用频率分布表列出各个不同区间内取值的频率,用相应的直方图的面积来表示在各个区间内取值的频率.【例4】 200辆汽车经过某一段公路的时速的频率分布直方图如图所示,则时速在[50,60)的汽车大约有.思路分析:本题考查学生逆向思维能力,再现由频率分布直方图对总体进行估计,从频率分布直方图上找出所要求的信息.解:由于图中的纵坐标是频率除以组距,所以小矩形的面积就是对应本部分区间的频率,于是在[50,60)内的车辆大约有:(60-50)×0.03×200=60辆.思维启示:直方图中第二个小矩形的面积约等于总体中的个体落在区间[50,60)内的百分比.拓展迁移【拓展点】下面列出43位美国历届总统(从1789年的华盛顿到2001年的小布什)的就任年龄:57 61 57 57 58 57 61 54 6851 49 64 50 48 65 52 56 4654 49 51 47 55 55 54 42 5156 55 51 54 51 60 62 43 5556 61 52 69 64 46 54(1)以5为组距画出相应的频率分布直方图和折线图,并用自己的语言描述一下历届美国总统就任年龄的分布情况.(2)以4为组距画出相应的频率分布直方图和折线图,并用自己的语言描述一下历届美国总统就任年龄的分布情况.(3)两次所做的频率分布直方图及折线图相同吗?试分别估计就任年龄在55岁以下的频率,并与实际频率作比较.解析:(1)以5为组距列频率分布表如下:画频率分布直方图:(2)历届总统的就任年龄90%集中在45~65之间.(图略) (3)两次所作频率分布直方图及折线图有所不同.以5为组距的分析方案,就任年龄在55岁以下的频率为0.488 3;以4为组距的分析方案,就任年龄在55岁以下的频率为4316≈0.3721.。
2019-2020学年度最新高中数学第2章统计2.2总体分布的估计课件苏教版必修3-优质PPT课件
2.将一批数据分成四组,列出频率分布表,其中第一组的频率是 0.27, 第二组与第四组的频率之和为 0.54,那么第三组的频率是________.
【导学号:20132091】
0.19 [根据题意知,四个组的频率之和为 1,所以第三组的频率为 1 -0.27-0.54=0.19.]
4.在茎叶图中比 40 大的数据有________个.
图 2-2-2 3 [比 40 大的数有 47,48,49,共 3 个.]
5.从某校500名12岁男生中利用随机抽样法抽取120人,得到他们的身
高(单位:cm)数据如下:
区间界限 [122,126) [126,130) [130,134) [134,138) [138,142)
[自 主 预 习·探 新 知]
1.频率分布表 当总体很大或不便于获得时,可以用_样__本__的__频__率__分__布___估计总体的频率 分布,我们把反映总体频率分布的表格称为频率分布表. 2.频率分布直方图 (1)我们将_整__个__取__值__区__间__的长度称为全距,分__成__的__区__间__的长度称为组距. (2)把横轴分成若干段,每一段对应一个组的组距,然后以此线段为底作
人数 5
8
10
22 33
区间界限 [142,146) [146,150) [150,154) [154,158]
人数 20
11
6
5
(1)列出样本频率分布表;
(2)估计身高小于134 cm的人数占总人数的百分比.
[解析] 某一组的频数等于该组的频数与样本容量的比.
[解] (1)样本频率分布表如下:
高中数学第二章统计2.2.1用样本的频率分布估计总体分布第2课时频率分布折线图和茎叶图
√同学低
C.乙同学比甲同学发挥稳定,且平均成绩也比甲同学高 D解.乙析同学由比茎甲叶同图学的发性挥质稳可定知,乙但同平学均比成甲绩同比学甲发同挥学稳低定,且平均成绩比甲同学高.
12/13/2021
多维探究
题型二 茎叶图及其应用
命题角度1 茎叶图的绘制
HEXINSUYANGZHISHUJUFENXI
典例 在某市的青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分
布直方图都受到不同程度的破坏,可见部分如图所示,据此回答以下问题:
求参赛总人数和频率分布直方图中[80,90)矩形的高,并补全频率分布直方图.
12/13/2021
素养评析 (1)茎叶图由所有样本数据构成,没有损失任何样本信息,可以 在抽样的过程中随时记录,但样本容量较大时,使用茎叶图就不合适;而 频率分布表和频率分布直方图可以处理样本容量很大的数据,但损失了样 本的原始数据,而且必须在完成抽样后才能制作. (2)茎叶图和频率分布直方图都是用来整理数据的,根据整理的数据,提取 信息,进行推断,获得结论,这是重要的数学素养之数据分析.
1
12/13/2021
思考辨析 判断正误
SIKAOBIANXIPANDUANZHENGWU
1.频率分布折线图就是总体密度曲线.( × ) 2.对于两位数的茎叶图,中间的数字表示十位数,旁边的数字表示个位数.
(√ ) 3.对于三位数的茎叶图,中间的数字表示百位数,旁边的数字表示十位和 个位数.( × ) 4.茎叶图只可以分析单组数据,不能对两组数据进行比较.( × )
12/13/2021
(1)画出茎叶图; 解 茎叶图如图.
12/13/2021
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2.2 频率分布直方图与折线图
庖丁巧解牛
知识·巧学
一、关于频率分布直方图的概念 由于频率分布表数字较多,阅读困难,为了将频率分布表中的结果直观形象地表示出来,我们通常画频率分布直方图.画图时,应以横轴表示分组,纵轴表示频率与组距的比值.以每个组距为底,以各频率除以组距的商为高,分别画成矩形,这样得到的直方图就是频率分布直方图.
二、关于频率分布直方图的绘制方法
频率分布直方图是在频率分布表的基础上绘制而成的,它的前期工作就是准确列出频率分布表,然后在平面直角坐标系中画出频率分布直方图,具体步骤如下: (1)求极差,即计算最大值与最小值的差. (2)决定组距和组数.
组距与组数的确定没有固定标准,需要尝试、选择,力求有合适的组数,以能把数据的规律较清楚地呈现为准.太多或太少都不好,不利对数据规律的发现.组数应与样本的容量有关,样本容量越大组数越多.
(3)决定分点,将数据分组.分组时,通常规定分组的区间是“左闭右开”的,避免数据被重复计算.
(4)列频率分布表.一般分“分组”“频数”“频率”三列,最后一行是“合计”. 注意频数的合计应是样本容量,频率合计应是1. (5)画频率分布直方图.
建立直角坐标系,图中横轴为分组,图中的纵轴表示“频率/组距”. 各组数据以小长方形表示,其中,小长方形的宽为组距,小长方形的高=
组距
频率
,频率=
样本容量
频率
=组距×组距频率=小长方体的面积.
各小长方形的面积总和为1.
由此可以看出,直方图中的各小长方形的面积表示相应的各组的频率.这样频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小.
误区警示 直方图中小长方形的高并不表示各组数据的频率,而是频率与组距之比,小长方形的面积才是各组数据的频率.
辨析比较 频率分布表在数量表示上比较确切,但不够直观、形象,分析数据的总体态势不太方便,频率分布直方图形象、直观,与频率分布表相比较,频率直方图能直观地表明数据的分布形状,但原始数据不能在图中表示,说明直方图丢失了一些信息.从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容. 三、频率分布折线图与总体密度曲线 1.频率分布折线图
把频率分布直方图各个长方形上边的中点用连线连接起来,就得到频率分布折线图. 为了方便看图,一般习惯于把频率分布折线图画成与横轴相连,所以折线图在横轴上的左右两个端点没有实际意义. 2.总体密度曲线
如果样本容量越大,那么所分组数就越多,图中表示的频率分布就越接近总体在各小组内所取值的个数与总数比值的大小,如果样本容量不断增大,那么分组的组距就不断缩小,频率分布直方图就越来越接近总体的分布,频率分布折线图就变成了一条光滑曲线y=f(x),这条光滑曲线就叫总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内的取值规律,它能给我们提供更加精细的信息,是研究个体分布规律的重要依据.
典题·热题
知识点一有关频率分布直方图的基本概念
例1 已知图2-2-1是容量为100的样本的频率分布直方图,试根据图形中的数据填空:
图2-2-1
(1)样本数据落在[10,14]内的频率是__________;
(2)样本数据落在[6,10]内的频数是__________;
(3)样本数据落在[2,6]内的频率是__________;
(4)样本数据落在[14,18]内的频率是__________.
思路解析:在直方图里用面积表示频率.
(1)0.09×4=0.36.
(2)0.08×4=0.32,0.32×100=32.
(3)0.02×4=0.08.
(4)1-0.36-0.32-0.08=0.24.
答案:(1)0.36 (2)32 (3)0.08 (4)0.24
误区警示本题应注意两点:(1)①直方图是用面积表示频率;②在直方图中,所有矩形的面积之和等于1.(2)频率分布条形图:与直方图不同的是纵轴表示的是频率.
例2 连续抛掷一个骰子120次,得到1,2,3,4,5,6点的次数各为18,19,21,22,20,20. (1)试列出样本的频率分布表;
(2)列出频率分布条形图;
(3)估计抛掷不足4点的机率.
思路分析:由于取值可按一定次序一一列出,可以用频率分布表或频率分布条形图分析样本.
(2)频率分布条形图如图2-2-2.
图2-2-2
(3)抛掷点数不足4点的机率是0.15+0.158+0.175=0.483.
巧解提示(1)频率分布条形图是用条形高度来表示各个值的频率的图形.
(2)本例中总体的不同取值很少,可一一列举,通常称离散型总体.
知识点二绘制频率分布条形图
例3 为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁—18
试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计.
思路分析:按照样本的频率分布直方图的制作方法和步骤.
解:按照下列步骤获得样本的频率分布:
(1)求最大值与最小值的差.
在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76-55=21所得的差告诉我们,这组数据的变动范围有多大.
(2)确定组距与组数.
如果将组距定为2,那么由21÷2=10.5得组数为11,这个组数是合适的.于是组距为2,组数为11.
(3)决定分点.
根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5). (4)列频率分布表.
(5)绘制频率分布直方图.
频率分布直方图如图2-2-3所示.
图2-2-3
由于图中各小长方形的面积等于相应各组的频率,这个图形的面积的形式反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分布表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计体重在[64.5,66.5) kg的学生最多,约占学生总数的16%;体重小于58.5 kg的学生较少,约占8%等等.
方法归纳 1.一般地,列频率分布表的步骤如下:
(1)求全距,决定组数和组距,组距=全距/组数;
(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
(3)登记频数,计算频率,列出频率分布表.
2.一般地,画频率分布直方图方法如下:
把横轴分为若干段,每一段对应一组的组距,然后以线段为底,作一矩形,它的高等于该组的频率/组距,作出一系列的矩形;每个矩形的面积恰好是该组的频率,这些矩形就构成了频率分布直方图.
问题·探究
思维发散探究
问题我们在生活中经常用到频率分布表、频率分布直方图、频数分布直方图、频率折线图等等,请结合如下的数据说明它们各自有什么样的特点和联系.
探究思路:这些方法都可以表示样本的分布情况,它们各有各的优点,我们就可以结合实例分别绘制这些图表来体会它们之间的区别与联系.
探究过程:方法一:绘制频率分布表
频数指出现的次数,频率指出现的次数与样本容量的比值.这个图就是频率分布表,它能直观地体现出样本中数量指标在某一个区间内的个体出现的次数及相应的频率.用这种方法来描
方法二:频数分布直方图
图2-2-4就是频数分布直方图,事实上它是把频率分布表中的一部分(频数那一部分)画出了直方图而已,它的横轴是产品尺寸(也就是某一指标),纵轴是出现的次数即频数.这种方法将枯燥的数据形象化地表现为图形,其最大的特点就是直观,可以很容易发现数据的整体趋势.
图2-2-4
方法三:频率分布直方图
图2-2-5就是频率分布图,从作图的过程可以知道在图2-2-4中,每个小矩形的宽度为Vx i (分组的宽度),高为
i
i
x f (其中f i 为第i 个区间范围内的频率),小矩形的面积恰为相应的频率f i ,通常我们称这样的图形为频率分布直方图,图的纵坐标为频率与组距的比值,横轴为研究对象的某一指标(在本图中指的是产品尺寸).
从图2-2-5中可以得到产品的尺寸落在各个尺寸区间的频率的大小,这个频率的值就是该产品尺寸区间所对应的频率直方图的面积,图2-2-5中所有小矩形的面积之和,也就是产品尺寸落在各个尺寸区间内的频率之和,等于 1.由刚才分析可知,在样本的频率分布图中,随着样本容量的不断扩大,其分布越来越接近总体分布,当样本容量无限加大,而组距无限缩小时,频率分布直方图的上方将演变成一条光滑的曲线.
图2-2-5
它与频数分布直方图的区别在于纵坐标的意义不同,在频数分布直方图中,纵坐标表示的是频率,而在频率分布直方图中,纵坐标表示的是频率与组距的比值,这样就使得每个小矩形的面积正好等于相应组的频率,应用起来很方便. 方法四:频率折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连结各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.不难发现,折线与横轴所围成的面积也是1,因此,当样本容量比较大时,我们还可以用频率折线图来估计总体的分布情况,如图2-2-6.
图2-2-6。