数学苏教版必修3教学案:第1部分 第2章 2.2 总体分布的估计
高中数学 第2章 统计 2.2 总体分布的估计讲义 苏教版必修3-苏教版高一必修3数学教案
2.2 总体分布的估计学习目标核心素养1.通过对实例的分析,体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率分布折线图,体会它们各自的特点,感受它们在揭示表面上杂乱无序的数据所蕴涵的规律中的作用.(重点)3.会利用样本数据的四种图表估计总体分布.1.通过对问题中数据样本进行分析,培养学生数据分析的数学核心素养.2.通过对样本数据的计算来培养学生数学运算的数学核心素养.1.频率分布表当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布,我们把反映总体频率分布的表格称为频率分布表.2.频率分布直方图(1)我们将整个取值区间的长度称为全距,分成的区间的长度称为组距.(2)把横轴分成若干段,每一段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组的频率,这些矩形就构成了频率分布直方图.思考1:(1)对数据分组时,组距、组数的确定有没有固定的标准?(2)当样本容量不超过100时,分多少组合适?[提示] (1)组距与组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.在确定分组区间的端点,即分点时,应对分点进行适当调整,使分点比数据多一位小数,并确保每个数据均能落在一个区间内,而不是处于区间的端点.(2)组数与样本容量有关,一般地,样本容量越大,分的组数也越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.3.频率分布折线图如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图,简称频率折线图.4.总体分布的密度曲线如果将样本容量取的足够大,分组的组距取的足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.思考2:几种表示样本分布的方法有什么区别与联系?[提示]总体频率分布规律的,其联系如下:1.下列关于频率分布直方图的说法,正确的是( )A.直方图的高表示取某数的频率B.直方图的高表示该组上的个体在样本中出现的频数与组距的比值C.直方图的高表示该组上的个体在样本中出现的频率D.直方图的高表示该组上的个体在样本中出现的频率与组距的比值D[频率分布直方图的高表示该组上的个体在样本中出现的频率与组距的比值.]2.将一批数据分成四组,列出频率分布表,其中第一组的频率是0.27,第二组与第四组的频率之和为0.54,那么第三组的频率是________.0.19 [根据题意知,四个组的频率之和为1,所以第三组的频率为1-0.27-0.54=0.19.]3.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60]的同学有30人,若想在这n个人中抽取50个人,则在[50,60]之间应抽取的人数为________.15[根据频率分布直方图得总人数n=301-0.01+0.024+0.036×10=100,依题意知,应采取分层抽样,再根据分层抽样的特点,则在[50,60]之间应抽取的人数为50×30100=15.]频率分布表的制作及应用分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70] 频数23454 2(2)已知一个样本数据:27 23 25 27 29 31 27 30 32 3128 26 27 29 28 24 26 27 28 30以2为组距,列出频率分布表.思路点拨:(1)数据落在区间[10,40)内的频数为9,样本容量为20,所求频率P =920=0.45.故填0.45.(2)依据频率分布表的制作步骤来进行,注意确定分点时,为了避免出现某一数据所在组别不能确定的情况,可以使分点比已知数据多一位小数,并且把第一组的起点稍微减小,故本题的第一组的起点可定为22.5.(1)0.45(2)[解] ①计算最大值与最小值的差:最大值为32,最小值为23,它们的差为32-23=9.②已知组距为2,决定组数:因为92=4.5,所以组数为5.③决定分点:[22.5,24.5),[24.5,26.5),[26.5,28.5),[28.5,30.5),[30.5,32.5].④列频率分布表如下:1.频率、频数和样本容量的关系为频率=样本容量,利用此式可知二求一.2.制作频率分布表的步骤(1)求全距,决定组数与组距,组距=全距组数;(2)分组,通常对组内数值所在区间取左闭右开区间(或左开右闭区间),最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.提醒:(1)在制作频率分布表时,分组过多或过少都不好.分组过多会给制作频率分布表带来困难,分组过少虽减少了操作,但不能很好地反映总体情况.一般样本容量越大,所分组数应越多.当样本容量不超过100时,按照数据的多少,常分成5组至12组.(2)所分的组数应力求“取整”.组数k =全距组距,若k ∈Z ,则组数为k ;否则,组数为大于k 的最小整数,这时需适当增大全距,在两端同时增加适当的范围.(3)在决定分点时,应避免将样本中的数据作为分点,常将分点的数值取比样本中的数据多一位小数.1.一个容量为n 的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n 等于________.120 [某一组的频率等于该组的频数与样本容量的比.由于30n=0.25,所以n =120.]2.对某电子元件进行寿命追踪调查,情况如下:(2)估计寿命在100 h ~400 h 以内的电子元件所占的百分比. [解] (1)寿命频数频率累计频率100~200200.100.10200~300300.150.25300~400800.400.65400~500400.200.85500~600300.15 1合计200 1(2)由频率分布表可以看出,寿命在100 h~400 h的电子元件出现的频率为0.65,因此我们估计寿命在100 h~400 h的电子元件所占的百分比为65%.频率分布直方图、折线图的制作与应用1 L所行路程的情况,现从中随机抽出10辆在同一条件下进行耗油 1 L所行路程试验,得到如下样本数据(单位:km):13.7,12.7,14.4, 13.8,13.3,12.5,13.5,13.6,13.1,13.4,其分组如下:分组频数频率[12.45,12.95)[12.95,13.45)[13.45,13.95)[13.95,14.45]合计10 1.0(1)(2)根据上表,在给定坐标系中画出频率分布直方图及频率分布折线图;(3)根据上述图表,估计总体数据落在[12.95,13.95)中的可能性.思路点拨:(1)依据频率分布表的制作步骤完成上面的频率分布表.(2)依据制作频率分布直方图及频率分布折线图的方法步骤绘制频率分布直方图及频率分布折线图.(3)计算出样本数据落在[12.95,13.95)中的频率. [解] (1)频率分布表:(3)根据上述图表,可知数据落在[12.95,13.95)中的频率为0.3+0.4=0.7,故总体数据落在[12.95,13.95)中的可能性为0.7.1.制作频率分布直方图的方法步骤 (1)制作频率分布表.(2)建立直角坐标系:把横轴分成若干段,每一段对应一个组的组距,纵轴表示频率组距.(3)画矩形:在横轴上标明各组端点值,以相邻两点间的线段为底,作高等于该组的频率组距的矩形,这样得到一系列矩形,就构成了频率分布直方图.2.频率分布折线图的制作步骤 (1)取每个矩形上底边中点. (2)顺次连接各个中点.(3)取值区间两端点需分别向外延伸半个组距,并取此组距上在x 轴上的点与折线的首、尾分别相连.3.解决频率分布直方图的相关计算,需掌握下列关系式: (1)频率组距×组距=频率,即小长方形的高乘以宽即为落在相应区间数据的频率.(2)频数样本容量=频率,此关系式的变形为频数频率=样本容量.提醒:频率分布直方图中,每个矩形的高为频率组距,面积为对应组的频率.3.如图是容量为100的样本的频率分布直方图,试根据图中的数据填空:样本数据落在[6,10)内的频率为________,样本数据落在[10,14)内的频率为________.0.32 0.36 [样本数据落在[6,10)内的频率为0.08×4=0.32,样本数据落在[10,14)内的频率为0.09×4=0.36.]4.通过全国人口普查工作,得到我国人口的年龄频率分布直方图如图,那么在一个总人口数为200万的城市中,年龄在[20,60)之间的人大约有________万.116 [在频率分布直方图中,小矩形的面积表示频率,年龄在[20,60)之间的频率约为(0.018+0.011)×20=0.58,200×0.58=116(万),故年龄在[20,60)之间的人大约有116万.]1.本节课的重点是会列频率分布表,会画频率分布直方图、频率分布折线图,难点是理解用样本的频率分布估计总体分布的方法.2.本节课要重点掌握的规律方法(1)绘制频率分布直方图的步骤.(2)会用频率分布直方图的意义解决问题.1.对于样本频率分布折线图与总体分布的密度曲线的关系,下列说法正确的是( )A.频率分布折线图与总体分布的密度曲线无关B.频率分布折线图就是总体分布的密度曲线C.样本容量很大的频率分布折线图就是总体分布的密度曲线D.如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限趋于总体分布的密度曲线D[总体分布的密度曲线通常都是用样本频率分布估计出来的.如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于一条光滑曲线,这条曲线就是总体分布的密度曲线.]2.容量为100的某个样本,数据拆分为10组,并填写频率分布表,若前七组频率之和为0.79,而剩下三组的频率依次相差0.05,则剩下的三组中频率最高的一组的频率为________.0.12 [设剩下的三组中频率最高的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1,而由频率总和为1,得0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.]3.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5),2;[15.5,19.5),4;[19.5,23.5),9;[23.5,27.5),18;[27.5,31.5),11;[31.5,35.5),12;[35.5,39.5),7;[39.5,43.5],3.根据样本的频率分布,估计大于或等于31.5的数据约占_______.13 [根据各组数据可知,符合条件的数据占12+7+366=13.] 4.在一个容量为80的样本中,数据的最大值是140,最小值是56,组距是10,则应将样本数据分为多少组?[解] 当全距组距不是整数时,组数=⎣⎢⎡⎦⎥⎤全距组距+1.本题全距=140-56=84,组距为10,故应分9组.。
江苏省南通市海门中学高一数学(苏教版)教学案 必修3 第二章 第二节 总体分布的估计
总体分布的估计苏教版必修3教学案 总体分布的估计、频率分布表学生完成所需时间 20分钟 班级 姓名 第 小组一、学习目标(1)了解频数、频率的概念,了解全距、组距的概念;(2)能正确地编制频率分布表;会用样本频率分布去估计总体分布;(3)通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.二、教学重点正确地编制频率分布表.教学难点会用样本频率分布去估计总体分布.三、知识导入2.问题:怎样通过上表中的数据,分析比较两时间段内的高温(33C )状况?四、学习内容(一)频率分布表分析上面两样本的高温天数的频率用下表表示: 8日至8月24日;一般地:当总体很大或不便获取时,用样本的频率分布去估计总体频率分布;把反映总体频率分布的表格称为频率分布表(二)例题例1.从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表.并估计身高不小于170的同学的所占的百分率.一般地编制频率分布表的步骤如下:例2.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)(1)列出样本频率分布表﹔(2)估计身高小于134cm的人数占总人数的百分比.。
分析:根据样本频率分布表、频率分布直方图的一般步骤解题。
五、回顾小结总体分布的频率、频数的概念;编制频率分布表的一般步骤六、达标检测(1)课本第53页练习第2题.(2)列出情境中近年来北京地区7月25日至8月10日的气温的样本频率分布表.(3)有一个容量为45的样本数据,分组后各组的频数如下:(](](](](](]12.5,15.5,3;15.5,18.5,8;18.5,21.5,9;21.5,24.5,11;24.5,27.5,10;27.5,30.5,4..的数据约为总体的 ( A ) 由此估计,不大于275A.91% B.92% C.95% D.30%(4)一个容量为20的样本数据,数据的分组及各组的频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2则样本在区间(-∞,50)上的频率为()A.0.5 B.0.7 C.0.25 D.0.05七、学习反思教学案频率分布直方图及折线图编制人宋振苏学生完成所需时间 20分钟班级姓名第小组一.学习目标:(1)能列出频率分布表,能画出频率分布的直方图、折线图;(2)会用样本频率分布去估计总体分布.二.教学重点:绘制频率直方图、折线图.教学难点:会根据样本频率分布或频率直方图去估计总体分布.三.知识链接(1)列频率分布表的一般步骤是什么?四.学法指导:五.学习内容:1.什么是频率分布直方图?能否根据频率分布表来绘制频率直方图?频率分布直方图的作法具体步骤为:2.能否根据频数情况来绘制频数折线图?怎样画?3.有一容量为50的样本,数据的分组各组的频数如下:[10,15),4;[15,20),5;[20,25),10;[25,30),11;[30,35),9;[35,40),8;[40,45),3(1)列出样本的频率分布表;(2)画出频率分布直方图及折线图.4. 为了了解一大片经济林生长情况,随机测量其中的100株的底部周长,得到如下数据表(单位:cm)(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100cm的树木约占多少,周长不小于120cm的树木约占多少.六.学习小结七.达标检测:1.在频率分布直方图中,表示各组频率的是该组长方形的()A.底B.高C.面积 D周长2.对于样本频率分布折线图与总体密度曲线的关系,下列说法正确的是()A.频率分布折线图与总体密度曲线无关B. 频率分布折线图就是总体密度曲线C.样本容量很大的频率分布折线图就是总体密度曲线D如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线3.关于频率分布直方图中的横坐标,下列说法正确的是()A.直方图中的横坐标是一个区间B.直方图中的横坐标是一个数,是各组的端点值C.直方图中的横坐标是一个数,是各组的组中值D.以上说法都不正确4.关于频率分布直方图中的有关数据,下列说法正确的是()A.直方图的高表示该组上的个体在样本中出现的频率B.直方图的高表示取某数的频率C.直方图的高表示该组上的个体数与组距的比值D.直方图的高表示该组上个体在样本中出现的频率与组距的比值5.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的,且中间一组频数为10,则这个样本容量是 . 6.考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据如下(单位:cm):171 163 163 169 166 168 168 160 168 165 171 169 167 159151 168 170 160 168 174 165 168 174 161 167 156 157 164169 180 176 157 162 166 158 164 163 163 167 161(1)列出频率分布表;(2)画出频率分布直方图.八.学习反思教学案总体分布茎叶图编制人宋振苏学生完成所需时间 20分钟班级姓名第小组一.学习目标:(1)掌握茎叶图的意义及画法,并能在实际问题中用茎叶图用数据统计;(2)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二.教学重点:茎叶图的意义及画法教学难点:茎叶图的意义及画法三.知识链接(1)什么是中位数?什么是众数?(2)已知 10,12,15,24,25,31,31,36,36,37,39,44,49,50则它们的平均数、众数、中位数如何给出?四.学法指导:五.学习内容:1.情境:某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50.问题1:如何有条理地列出这些数据,分析该运动员的整体水平及发挥的稳定程度?问题2:初中统计部分曾学过用什么来反映总体的水平?用什么来考察稳定程度?2.茎叶图的概念:(1)画出情境中的运动员得分的茎叶图:(2)从这个图可以直观的看出该运动员:2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示;(2)茎叶图只便于表示两位(或一位)有效数字的数据,对位数多的数据不太容易操作;而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰;(3)茎叶图对重复出现的数据要重复记录,不能遗漏.3.甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平. 甲 12,15,24,25,31,31,36,36,37,39,44,49,50.乙 8,13,14,16,23,26,28,33,38,39,51六.学习小结七.达标检测:1.练习:(1) 右面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知 ( ) A .甲运动员的成绩好于乙运动员 B .乙运动员的成绩好于甲运动员C .甲、乙两名运动员的成绩没有明显的差异D .甲运动员的最低得分为0分2.为了了解各自受欢迎的程度,甲、乙两个网站分别随机选取了14天,记录下上午8:00-10:00间各自的点击量: 甲:73,24,58,72,64,38,66, 70,20,41,55,67, 8,25; 乙:12,37,21, 5,54,42,61, 45,19, 6,19,36,42,14.你能用茎叶图表示上面的数据吗?你认为甲、乙两个网站哪个更受欢迎?(2)课本第58页,练习第1、2题.八.学习反思甲 0 1 2 3 4 5 乙 824719936 2 50 32 875421 944 1教学案 平均数及其估计编制人 宋振苏学生完成所需时间 班级 姓名 第 小组 一、[学习目标]知识与技能(1)能说出为什么能用样本数据的平均值估计总体的水平;(2)会运用数学知识和方法进行统计研究,提高统计的准确性和科学性;(3)能记住从实际问题中提取数据,利用样本数据计算其平均值,并对总体水平作出估计的方法.过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的思想和逻辑推理的数学方法情感、态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识与现实世界的联系。
高中数学2.2总体分布的估计教案1(苏教版必修3)
2.2 总体分布的估计教学目标1.掌握编制频率分布表的步骤.2.读频率分布表,并能利用表中的数据来回答某些具体问题. 3.绘制频率分布直方图. 重点难点编制、读懂频率分布表,能通过对所给数据进行分析、整理,回答某些实际问题第一课时 教学过程 一、问题情境国际奥委会2003年6月29日决定,2008年北京奥运会举办的日期比原定日期推迟两周,改在8月8日至8月24日举行.原因是7月末8月初北京地区得气温高于8月中下旬. 下表是随机抽取的近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(问题:怎样通过上表中的数据,分析比较两时间段的高温(≥33℃)状况呢?[数学理论] 1.频数与频率频数是指一组数据中,某范围内的数据出现的次数;把频数除以数据的总个数,就得到频率. 2.频率分布表当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.3.频率分布条形图①各长方形长条的宽度要相同. ②相邻长条的间距要适当.③长方形长条的高度表示取各值的频率.例1从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm).试作出该样本的频率分布表.分析:这个例子与前面问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体.样本的频率分布表示形式有:二、数学理论1.频率分布表算法:S1 计算数据中最大值与最小值的差(极差),确定全距.S2 根据全距,决定组数和组距.S3 分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数.S4 登记频数,计算频率,列出频率分布表.三、数学应用S1 极差=180-151=29;取值区间[150.5,180.5];全距=30;S2 组距和组数与数据的数量有关.一般数据较多,分的组数也多;数据较少,分的组数也少.当数据个数在50以内,分5~8组;当数据个数在50~100之间,分8~12组.应当注意的是如果组内没有数据出现,就应当放宽组距,保证每个组内都有数据,且每个数据只属于确定的一组.在决定组数时,往往不是一次就能成功的,要有一个观察、尝试的过程,一般分点比已知数据多一位小数,并且第一组的起点要稍稍减小.只有合理地确定组距与组数,才能使数据分布的规律性比较明显地呈现出来;组数=10;组距=3;S3,S4:练习:1.一个容量为32的样本,已知某组样本的频率为0.125,那么该组样本的频数为()A.2 B.4 C.6 D.82.为了分析一次数学考试的情况,全班抽了50人,将分数分为5组.第一组到第三组的频数分别是10,23,1,第四组的频率是0.08,那么落在第五组的频数是____,频率是_____,全年级800人中分数落在第五组的约有_____人.(1)频率=,已知其中任意两个量就可以求出第三个量.(2)各小组的频率和等于样本容量的频率和等于1.(3)由样本的频率可以估计总体的频率,从而估计出总体的频数.3.一个容量为20的样本数据,分组后组距与频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2.则样本在区间(10,50]上的频率为()A.5%B.25%C.50%D.70%4.已知样本10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10,11,12,那么频率为0.2的范围是()A.5.5-----7.5B.7.5--------9.5C.9.5-----11.5D.11.5-------13.5二、数学理论2.频率分布直方图算法:S1 作出频率分布表,然后作直角坐标系,以横轴表示数据,纵轴表示“频率/组距”;S2 把横轴分为若干段,每一线段对应一个组的组距,S3 以此线段为底作一矩形,它的高等于该组的频率/组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.三、数学应用思考:频率分布条形图和频率分布直方图是两个相同的概念吗? 有什么区别? 两者是不同的概念:横轴:两者表示内容相同. 纵轴:两者表示的内容不相同.频率分布条形图的纵轴(长方形的高)表示频率;频率分布直方图的纵轴(长方形的高)表示频率与组距的比值.其相应组距上的频率等于该组距上长方形的面积.即长方形的面积=频率组距×组距=频率,所有长方形的面积和为1.练习 :[12.5, 15.5) 3 [15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 [24.5, 27.5) 10 [27.5, 30.5) 5 [30.5, 33.5) 4(1)列出样本的频率分布表; (2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5, 24.5)的概率是多少? 四、回顾小结1.编制频率分布表的步骤; 2.绘制频率分布直方图的方法. 五、作业 略。
苏教版高中数学必修三教案
苏教版高中数学必修三教案课时:第一课时教学目标:1. 掌握数列的概念及常见类型。
2. 能够实际应用数列解决问题。
3. 培养学生的逻辑思维和数学分析能力。
教学重点:1. 掌握数列的定义和常见类型。
2. 初步掌握数列的求和方法。
教学难点:1. 理解数列的性质和规律。
2. 能够熟练运用数列的求和方法。
教学准备:1. 教材:《高中数学必修三》2. 教具:黑板、彩色粉笔、教学课件、学生练习册3. 学生学习资料:笔记本、铅笔、尺子教学过程:一、导入(5分钟)教师简要介绍数列的概念,并展示一些实际生活中的数列例子,引起学生对数列的兴趣。
二、讲解(15分钟)1. 数列的定义和性质:教师讲解数列的定义,序号、通项公式等概念,并引导学生理解数列的性质。
2. 常见数列类型:介绍等差数列、等比数列等常见数列类型,并讲解其特点和求和方法。
三、练习(20分钟)1. 学生跟随教师做一些简单的数列练习,巩固对数列的基本概念和性质的理解。
2. 学生独立解决一些实际问题,运用数列解决实际生活中的问题。
四、总结(5分钟)教师总结本节课的重点内容,强调数列的重要性和应用价值,鼓励学生继续学习深入数列的知识。
五、作业布置(5分钟)布置一些相关的作业,要求学生按时完成,并提醒学生复习今天所学的知识点。
六、课外拓展(自由活动)鼓励学生利用课外时间进行更多的数列练习和拓展,加深对数列知识的理解和应用。
教学反思:通过本节课的教学,学生对数列的基本概念和常见类型有了初步的了解,能够初步掌握数列的求和方法。
但也发现部分学生对数列的应用还存在一定困难,需要在后续的教学中加强练习和巩固,提高学生的数学分析能力。
苏教版高中高二数学必修3《总体分布的估计》教案及教学反思
苏教版高中高二数学必修3《总体分布的估计》教案及教学反思一、教学目标1.了解总体分布的估计概念;2.掌握大样本情况下总体均值与总体比例的点估计、区间估计方法;3.理解总体标准差估计的概念和方法;4.能够应用所学知识解决实际应用问题。
二、教学重难点1.总体分布的估计概念的理解;2.总体均值和总体比例的点估计、区间估计的应用;3.总体标准差的估计方法。
三、教学内容1. 总体分布的估计概念总体分布的估计是指通过抽样得到的样本数据来推断总体数据的分布情况,包括总体均值、总体比例等。
2. 总体均值的估计在大样本情况下,总体均值 $\\mu$ 的点估计和区间估计为:•点估计:$\\bar{x}$•区间估计:$\\bar{x}\\pmz_{\\alpha/2}·\\frac{\\sigma}{\\sqrt{n}}$其中,$\\bar{x}$ 为样本均值,$z_{\\alpha/2}$ 为置信水平为 $1-\\alpha$ 的标准正态分布的分位数,$\\sigma$ 为总体标准差,n为样本容量。
3. 总体比例的估计在大样本条件下,总体比例p的点估计和区间估计为:•点估计:$\\hat{p}=\\frac{X}{n}$•区间估计:$\\hat{p}\\pmz_{\\alpha/2}·\\sqrt{\\frac{\\hat{p}(1-\\hat{p})}{n}}$其中,X为样本中符合条件的个数,n为样本容量。
4. 总体标准差的估计总体标准差 $\\sigma$ 的点估计和区间估计为:•点估计:s•区间估计:s1<s<s2其中,s为样本标准差,s1和s2分别为n−1自由度的$\\chi^2$ 分布的上分位数和下分位数对应的样本标准差。
5. 实际应用问题解决实际应用问题解决,需要结合具体情况来选择适当的估计方法和公式。
四、教学方法讲授+讨论+举例五、教学步骤1. 总体分布的估计概念教师讲授:介绍总体分布的估计概念,并通过阐述实例来加深学生的理解。
数学苏教版必修3教学案第1部分 第2章 2.3 总体特征数的估计 Word版含解析
年全国青年歌手电视大奖赛决赛中十位评委在第一轮决赛中给某选手打分是:.问题:根据初中学过的知识,能计算得分的平均数吗?提示:能.=(+++++++++)=.问题:想一想,还有其它计算平均分的方法吗?提示:有=(×+×+×)=..平均数的概念一组数据的总和除以数据的个数所得的商就是这组数据的平均数(或均值),一般记为:=..平均数的计算()定义法:个数据,,…,的平均数为:=.()平均数公式:①在个数据中,如果出现次,出现次,…,出现次(++…+=),则这个数的平均数为:=.②若取值为,,…,的频率分别为,,…,,则其平均数为=++…+.年月某军校大一新生军训期间,甲、乙两同学在相同条件下练习射击,每人打发子弹,命中环数如下:提示:甲=,乙=.问题:利用甲和乙的大小关系能否判断两同学的射击水平的高低?提示:不能.因为甲=乙.问题:观察比较上面表格中的两组数据,哪个同学的射击更稳定些?提示:甲各次的命中环数更靠近在命中的平均环数附近,故甲的射击更稳定些.问题:除观察分析外是否有更准确的方法判断上述问题?提示:有.极差、方差、标准差:()极差:一组数据的最大值与最小值的差.()方差与标准差:设一组样本数据,,…,,其平均数为,则称=(-)为这个样本的方差,其算术平方根=为样本的标准差,分别简称样本方差、样本标准差.其中,标准差的单位与原始测量单位相同,方差的单位是原始数据单位的平方.()方差及标准差的意义:刻画一组数据的稳定程度..众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质..标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.[例] 某公司的名职工的月工资(以元为单位)如下:()假设副董事长的工资从元提升到元,董事长的工资从元提升到。
数学:第2章2.2总体分布的估计课件(苏教版必修3)
典题例证技法归纳
题型探究
题型一
线图
频率分布表、频率分布直方图、折
例1
下表给出了某校500名12岁男孩的
身高(单位:cm)资料:
身高 [122,126) [126,130) [130,134) [134,138) [138,142) 20 35 40 90 140 人数 身高 [142,146) [146,150) [150,154) [154,158) 85 45 25 20 人数 (1)列出样本的频率分布表;
全距 ①求全距,决定组数和组距,组距= ; 组数 ②分组,通常对组内数值所在区间取左闭右开区 间,最后一组取闭区间; ③登记频数,计算频率,列出频率分布表. 2.频率分布直方图
(1)定义: 样本的频率分布规律 我们用直方图反映_____________________, 直方图 这样的__________称为频率分布直方图,简
做一做
1.判断下列关于频率分布直方图的说法是否正
确.(标注“√”或“×”)
①直方图的高表示取某数的频率( )
②直方图的高表示该组上的个体在样本中出 现的频数与组距的比值( )
③直方图的高表示该组上的个体在样本中出
现的频率( )
④直方图的高表示该组上的个体在样本中出 现频率与组距的比值( )
解析:频率分布直方图的高表示该组上的个
解得第二组人数为 6 人,第三组人数为 10 人, 6 10 ∴第二组的频率是 =0.12,第三组的频率是 = 50 50 0.20, (4 分) 补全频率分布直方图如图所示.
(8 分) 4 (2)成绩不低于 66 分的频率为( ×0.020+0.044+ 10 0.012+0.008)×10=0.72, (12 分) 估计可成为义务宣传员的人数为 0.72×300=216. (14 分)
高中数学总体分布的估计苏教版必修三 教案
总体分布的估计上节我们学习了几种常见的抽样方法,这些方法都保证了每个个体从总体中都能以等可能性抽取,从而保证了样本的客观公平,能更好的反映总体的实际状态.当样本从总体中抽取出来后,如何根据样本的情况对总体的分布情况作出一种推断呢?这就是本节将要学习的总体分布的估计的内容.学法建议通过本节的学习要能体会分布的意义和作用,并且在表示样本数据的过程中,学会列频率分布表,画频率直方图、频率折线图和茎叶图,体会它们各自的特点,感受它们能揭示表面上杂乱无章的数据中所蕴涵的规律的作用,从而学会用样本估计总体的思想解决一些实际问题,认识统计的作用,体会统计思维与确定性思维的差异.此外要通过初步经历从收集数据到处理数据的全过程,掌握利用已有数据对一般分布作出估计,为科学决策提供依据的方法,形成对数据处理过程进行评价的意识.理解图表的意义是本节的关键. 一、知识网络易错点提示 1.用样本估计总体,是研究统计问题的一个基本思想方法,由于总体分布通常不易知道,我们往往是用样本的频率分布去估计总体分布,因此不能认为样本的分布状态就是总体的分布状态,这里可能会有误差.一般地,样本容量越大,这种估计就越精确.2.在绘制茎叶图时,对重复出现的数据要重复记录,不能遗漏. 二、知识归纳1.频率分布表编制频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=组数全距;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; (3)登记频数,计算频率,列出频率分布表. 2.频率分布直方图和折线图Ⅰ.绘制频率分布直方图的步骤如下:(1)先制作频率分布表,然后作直角坐标系,以横轴表示数据,纵轴表示组距频率; (2)在横轴上标上数据(为方便起见,起始点的数据可适当前移);(3)在上面标出的各点中,分别以连结相邻两点的线段为底作矩形,高等于该组的组距频率,至此就可以得到频率分布直方图.这里需要注意的是每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图.在反映样本的频率分布方面,频率分布表比较确切,频率分布直方图比较直观,它们相互补充. Ⅱ.折线图如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本数据的频率折线图.下面是甲乙两个商场的营业额数据和折线图:由于用频率分布直方图去估计相应的总体分布时,如果样本容量越来越大,那么分组就越来越细,即:频率分布直方图中的各个小矩形就会越来越细.当样本容量充分大时,图中的组距充分缩短,从而阶梯折线就变成光滑的曲线,这就是总体分布曲线,它精确地反映了总体的分布规律. 3.茎叶图初中统计部分曾学过用平均数、众数和中位数反映总体的水平,用方差考察稳定程度.其实还有一种简易的方法,就是将这些数据有条理的列出来,从中观察数据的分布情况,这种方法就是画出数据的茎叶图.制作茎叶图的思路是将数组的数按位数进行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面,这样就可以清楚地看到每个主杆后面的几个数,每个数具体是多少.茎叶图中的茎是“叶”十进制的上一级单位,右边的是数距中的变化位,它是按照一定的间隔将数组中的每个变化的数一一列出来,象一条枝上抽出的叶子一样,所以人们形象地叫它茎叶图. 茎叶图既可以分析单组数据,也可以对两组数据进行比较.茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到,二是茎叶图便于记录与表示.但茎叶图表示三位数以上的数据时不够方便,一般要通过专业的软件来帮助处理. 三、图解重点频率分布表制作的基本程序潜能开发季度 甲商场营业额 乙商场营业额 第一季度 96.1万元 116万元 第二季度 90.2万元 73万元 第三季度 77万元 87.2万元 第四季度 88.1万元61.4万元数据处理频率分布表频率分布直方图频率折线图茎叶图样本数据计算极差、决定组列频率分布解题规律合理、科学地确定组距和组数,才能准确地制表及绘图,这是用样本的频率分布估计总体分布的基本功. 列出频率分布表,就可以从“频数”栏目知道数据落在各个小组的个数,也可以从每一组的频率,就可以知道数据落在各个小组的比例大小.例如身高在165.5∽168.5之间的男生比较多,从分布图上也可以看出这一点. 思维诊断频率分布表列出的是在各个不同区间内取各值的频率,相应的直方图是用图形面积的大小来表示在各个区间取值的频率.频率分布将随着样本容量的增大而更接近总体分布,当样本容量无限增大且分组距无限缩小时,频率分布直方图就会演变成一条光滑曲线——总体分布的密度曲线.正是基于样本的频率分布与相应的总体分布的关系,我们往往从总体中抽取一个样本,用样本的频率分布来估计相应的总体分布.解题规律本题的解题步骤同上题,不同的是添加了一个识表识图的问题,应该说数据的处理与图表的表示之间要形成一种对应关系. 知识拓展150.5156.5162.5174.5168.5180.5统计图是对数据的一种非常直观的描述.常见的统计图有条形图、频数分布图、频数直方图等.直方图的特点是两个统计对象对比突出,稍有差异都能显示出来,因而便于对两个统计对象进行比较.而折线图则便于分析比较统计对象的波动情况.如果要展示的是一个整体内部各部分之间的比例或者各部分在整体中所占的百分数,那么你可以选择采用圆形图或称饼图.此外还有柱形图等.这些图形的制作可以用Excel 软件来进行制作,有兴趣的读者可尝试操作一下!通过这些工作,那许多的数字就不再杂乱无章了! 解题规律解决概念题一定要在理解的基础上加以处理.本题考查了频数、频率和累积频率三者之间的关系的应用;还体现了根据累积频率分布图来估计总体信息的思想方法.在本题中涉及到一个概念,就是累积频率的概念,教材中没有出现,但这个概念并不难理解,而且累积频率折线图的图是由一系列的线段首尾相连而成,每一段都是相应的直线的一部分,因此在处理本题的第(3)x1 2 3/2 1/2问时就用到了直线方程的有关知识,这也充分体现了数形结合的思想,所以在学习时既要掌握理解当前所学知识,也要注意与前面所学知识之间的联系.此外对本题还应该对这几种表示方法进行思考,并能通过此题感受到:频率分布表数据翔实、具体,频率直方图形象直观,对比效果强烈,频率折线图能反映发展变化的趋势. 思维诊断假如是由两个不同的研究小组分别抽样,那么是否能得到相同的样本?对总体的估计是否一定相同?是否有很大的差异?能否进行说明呢?另外图形语言与文字语言以及数学语言三者之间的转化你认识得又怎么样呢?知识拓展已知某随机变量x的频率率密度曲线如图,则总体在)23,1(上的概率为________.解题规律从茎叶图可以看出所有的数据信息都可以从图中看出来,便于记录和处理.但在画图时茎要按照从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.它是另一种处理数据的方法.教材中还列举了一个对象的数据处理茎叶图.其实茎叶图不仅可以处理一个或两个对象的数据统计,还可以处理多个对象的数据统计.体验探究一、科海拾贝近代统计学 近代统计学指的是18世纪末到19世纪末的描述统计学,其发展过程与概率论的广泛研究和应用密切相关.目前在统计分析中经常使用的一些基本方法和术语都始于这一个时期,比如:最小平方法、正态分布曲线、误差计算等等.在近代统计发展的一百年中,也形成了许多学派,其中以数理统计学派和社会统计学派最为著名.数理统计学派的原创始人是比利时的A·凯特靳,其最大的贡献就是将法国的古典概率引入统计学,用纯数学的方法对社会现象进行研究;社会统计学派的首倡者是德国的K·克尼斯,他认为统计研究的对象是社会现象,研究方法为大量观察法.在近代统计学的发展过程中,这两学派的矛盾是比较大的.二、合作探究[解答]:这是一个实际问题,购买每包速冻食品价格的茎叶图可以很直观地说明,消费者购买每包速冻食品的花费主要集中在5元和4元上,最为集中的是5元,其次是4元左右.通过调查有助于生产厂家科学合理的制定商品价格、生产计划,从而追求最大的生产利润.三、智慧列车思路分析从上述数据可以看到它们的百位数字都是3,所不同的仅仅是十位和个位,而两位数据的茎叶图是可以作的,那么这时只需在茎的位置写上百位和十位,叶的位置上写上个位即可. [解答] 上述数据的茎叶图如下:33 2 33 5 33 66733 88899999 34 000000000111111 34 2222222222333333333334 444444444444555555555 34 6666666667777734 888889935 00000023636 2[评注]本题的数据有一定的特殊性.一般地茎叶图可用专业的MINITAB软件绘制.另外本图中茎“34”有四行,这主要是为了美观的需要,不然写在一行太长了,不好看.思路分析这是一个实习作业,也是一个实际生活中经常遇到的问题.除了填出通话费外,还要进行统计.[解答] (1)如下表:(2)统计表如下:(3)设这五人这天的实际平均通话费为1x元,按原收费标准算出的平均通话费为2x元,则64.0)50.0140.0230.0520.02(511=⨯+⨯+⨯+⨯=x(元),72.0)40.0820.02(512=⨯+⨯=x(元),08.012=-xx(元),即这五人这天的实际平均通话费与原通话标准下算出的平均通话费相比,减少了0.08元.[评注] 统计知识来源于生活,又服务于生活.。
苏教版高中数学必修三教学案:第2章 2.2 总体分布的估计 Word版含答案
某制造商为2013年全运会生产一批直径为40 mm 的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm ,保留两位小数)如下40.03 40.00 39.98 40.00 39.99 40.00 39.98 40.01 39.98 39.99 40.00 39.99 39.95 40.01 40.02 39.98 40.00 39.99 40.00 39.96问题1:上述20个数据中最大值与最小值分别是多少,它们相差多少? 提示:最大值为40.03,最小值为39.95,其差为0.08.问题2:将上述数据分组统计,分组情况为[39.95,39.97),[39.97,39.99),[39.99,40.01),[40.01,40.03],求各组个数.提示:各组数据的个数为2,4,10,4. 问题3:试求出各组数据所占的比例? 提示:分别为0.10,0.20,0.50,0.20.问题4:能否用一个直观图来表示问题2中各组数据的分布情况? 提示:可以.1.频率分布表(1)定义:当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.(2)绘制的步骤:①求全距,决定组数和组距,组距=全距组数.②分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间. ③登记频数,计算频率,列出频率分布表. 2.频率分布直方图(1)定义:我们用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图.(2)绘制步骤: ①先制作频率分布表.②建立直角坐标系:把横轴分成若干段,每一段对应一个组的组距,并标上一些关键点. ③画矩形:在横轴上,以连结相邻两点的线段为底,以纵轴上频率组距为高作矩形,这样得一系列矩形,就构成了频率分布直方图.3.频率分布折线图(1)定义:把频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.(2)总体分布密度曲线:频率折线图的优点是它反映了数据的变化趋势,如果将样本容量取得足够大,分组的组距取得足够小,则相应的频率折线图将趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线.1.在频率分布表中,除最后一个区间是闭区间,其他区间均为左闭右开区间,这样做的目的是为了不重不漏,避免丢失样本数据.2.在频率分布直方图中,各个小矩形的面积之和为1.3.频率分布直方图直观地显示了数据分布信息,从而为分析估计总体提供了依据. 4.频率分布折线图反映了数据的变化趋势,可用来对数据进行估计和预测.[例1] 从某校参加 2016年全国高中数学联赛预赛的600名同学中,等可能抽取若干名同学,将他们的成绩制成频率分布表,下面给出了此表中部分数据.(1)根据表中已知数据,依次写出在①、②、③处的数值; (2)补全在区间[70,140]上的频率分布直方图;(3)若成绩不低于110分的同学能参加决赛,那么可以估计该校大约有多少学生能参加决赛?[思路点拨] 根据频率分布表作出频率分布直方图. [精解详析] (1)50 0.04 0.10. (2)如图:(3)成绩不低于110分的同学能参加决赛的频率为0.08+0.04+0.02=0.14,所以估计该校能参加决赛的人数大约为600×0.14=84. [一点通] 1.在列频率分布表时,全距、组距、组数有如下关系: (1)若全距组距为整数,则全距组距=组数.(2)若全距组距不为整数,则全距组距的整数部分+1=组数.2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.1. 从全校参加科技知识竞赛的学生试卷中,抽取一个样本,考察竞赛的成绩分布.将样本分成5组,绘成频率分布直方图(如图),图中从左到右各小组的小长方形的高的比是1∶3∶6∶4∶2,最右边一组的频数是6.请结合频率分布直方图提供的信息,解答下列问题:(1)样本的容量是多少?(2)列出频率分布表.解:(1)由于各组的组距相等,所以各组的频率与各小长方形的高成正比且各组频率的和等于1,那么各组的频率分别为116,316,616,416,216.设该样本容量为n,则6n=216,所以样本容量为n=48.(2)由以上得频率分布表如下:2.有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20),17.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)求样本数据不足0的频率.解:(1)频率分布表如下:(2)频率分布直方图如图所示:(3)样本数据不足0的频率为7+11+15+40200=0.365.[例2] (12分)为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,绘制出频率分布直方图(如图所示),第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少? [思路点拨] (1)利用频率等于对应小长方形面积来确定;(2)满足条件的频率之和即为达标率.[精解详析] (1)由题中可知第二小组[100,110)对应的频率组距为0.008,而组距为10, 故频率为0.008×10=0.08,分)设样本容量为为n ,则12n=0.08,∴n =分)(2)根据频率分布直方图,次数在110以上共有四组. 估计该校全体高一学生的达标率为:1-0.04-0.08=分)[一点通] 1.频率分布直方图的性质:(1)因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1. (3)频数/相应的频率=样本容量.2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.3.观察新生婴儿的体重(单位:g),其频率分布直方图如下图所示,则新生婴儿体重在[2 700,3 000)内的频率为________.解析:由图可知当新生婴儿体重在[2 700,3 000)内时,频率组距=0.001,而组距为300,所以频率为0.001×300=0.3.答案:0.34.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的学生人数是________.解析:依题意,设第2小组的频率为2x ,则有6x =1-(0.037+0.013)×5,得2x =0.25,即第2小组的频率为0.25,因此报考飞行员的学生人数是120.25=48. 答案:485.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间对某地居民调查了10 000人,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人做进一步调查,则在[2.5,3](小时)时间段内应抽出的人数是________.解析:抽出的100人中平均每天看电视的时间在[2.5,3](小时)时间内的频率是0.5×0.5=0.25,所以这10 000人中平均每天看电视的时间在[2.5,3](小时)时间内的人数是10 000×0.25=2 500,抽样比是10010 000=1100,则在[2.5,3](小时)时间段内应抽出的人数是2 500×1100=25. 答案:251.频率分布表和频率分布直方图都是用来描述样本数据情况的,是相同数据的两种不同的表达方式.2.频率分布表在数量表示上比较确切,但不够直观、形象,用它来分析数据分布的总体趋势不太方便,而频率分布直方图能够表示大量数据,非常直观、形象地表明分布的规律,使我们能够看到在分布表中看不清楚的数据模式.但是直方图会丢失一些信息,如原始数据不能在图中表示出来.课下能力提升(十一)一、填空题1.如图是容量为100的样本的频率分布直方图,试根据图形中的数据填空.(1)样本数据在范围[6,10)内的频率为________;(2)样本数据落在范围[10,14)内的频数为________.解析:(1)样本数据在[6,10)内频率为0.08×4=0.32.(2)在[10,14)内的频数为0.09×4×100=36.答案:(1)0.32 (2)362.为了调查某厂工人生产某种产品的能力,随机抽查了20名工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如下图,则这20名工人中一天生产该产品数量在[55,75)的人数是________.解析:由题意得,这20名工人中一天生产该产品数量在[55,75)的人数是20×[(0.040+0.025)×10]=13(人).答案:133.将容量为100的样本数据,按从小到大的顺序分成8个组,如下表:则第六组的频率为________.解析:9+14+14+13+12+x+13+10=100,x=15.P=15100=0.15.答案:0.154.为提高公众对健康的自我管理能力和科学认识,某调查机构共调查了200人在一天中的睡眠时间.现将数据整理分组,如下表所示.由于操作不慎,表中A,B,C,D四处数据污损,统计员只记得A处的数据比C处的数据大4,由此可知B处的数据为________.解析:设A 处的数据为x ,则C 处的数据为x -4, 则x +x -4+8+52+20+4=200,x =60, 则B 处数据为60200=0.3.答案:0.35.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.解析:设[25,30)年龄组对应小矩形的高度为h ,则5×(0.01+h +0.07+0.06+0.02)=1,h =0.04.志愿者年龄在[25,35)的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)的人数约为0.55×800=440.答案:0.04 440 二、解答题6.某工厂对一批产品进行了抽样检测,右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106).已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是多少?解:产品净重小于100克的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n ,则36n=0.300,所以n =120,净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.750,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.750=90.7.根据空气质量指数API(为整数)的不同,可将空气质量分级如下表:(100,150],(150,200],(200,250],(250,300]进行分组,得到频率分布直方图如图.(1)求频率分布直方图中x 的值;(2)计算一年中空气质量为良和轻微污染的总天数. (提示:结果用分数表示.已知57=78 125,27=128, 31 825+2365+71 825+31 825+89 125=1239 125,365=73×5) 解:(1)由图可知50x =1-(31 825+2365+71 825+31 825+89 125)×50=1-1239 125×50,解得x =11918 250;(2)365×(11918 250×50+2365×50)=219.答:一年中空气质量为良和轻微污染的总天数为219天.8.为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示).(1)求出各组相应的频率;(2)估计数据落在[1.15,1.30]中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中还有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.解:(1)由频率分布直方图和频率=组距×(频率组距)可得下表(2)0.30+0.15+0.02=中的概率约为0.47.(3)由分层抽样中每个个体被抽到的概率相同知:设水库中鱼的总条数为N ,则120N =6100,即N =2 000,故水库中鱼的总条数约为2 000条.第2课时 茎叶图2016年CBA 新赛季,山东队某队员在该赛季各场比赛的得分情况如下: 15,21,20,19,23,26,25,20问题1:利用这些数据能否直接判断出该运动员发挥水平? 提示:可以,但会存在偏差.问题2:能否利用频率分布直方图来分析这些数据? 提示:由于样本数据较少,一般不用直方图.问题3:由于数据较少,可否有更快捷的作图方式来分析数据? 提示:有.1.茎叶图的制作方法(1)画“茎”:“茎”表示两位数的十位数字,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,再画上竖线作为分界线.(2)添“叶”:“叶”画在分界线的另一侧表示两位数的个位数字,共茎的叶一般按从小到大(或从大到小)的顺序同行列出.2.茎叶图刻画数据的优缺点(1)茎叶图刻画数据的优点:①所有的信息都可以从茎叶图中得到.②茎叶图便于记录和表示.(2)茎叶图刻画数据的缺点:当样本数据很多时,茎叶图的效果就不是很好了.1.茎叶图画茎时可以画成纵向的,也可画成横向的.2.茎叶图表示数据时也可以表示三位数据,此时茎表示前两位,叶表示最后一位.3.茎叶图主要是针对样本数据不多或数据位数较少时,便于快速记录分析;样本数据较多或数据位数较多时,不方便使用.[例1] 某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.[思路点拨] 确定茎与叶,作出茎叶图,并判断比较.[精解详析] 甲、乙两人数学成绩的茎叶图,如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,大多集中在80~100之间,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,多集中在70~90之间,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.[一点通] 绘制茎叶图关键是分清茎和叶,一般地说数据是两位数的,十位上数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要合理的选择茎和叶.1.某次运动会甲、乙两名射击运动员射击成绩如下:(单位:环)甲:9.4,8.7,7.5,8.4,10.1,10.5,10.7,7.2,7.8,10.8乙:9.1,8.7,7.1,9.8,9.7,8.5,10.1,9.2,10.1,9.1用茎叶图表示甲、乙二人成绩.解:中间数字表示成绩的整环数,旁边数字表示小数点后的数字.2.某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示.(2)进行分析,得出什么结论?解:(1)如图:(2)电脑杂志上每个句子的字数集中在10~30之间,而报纸上每个句子的字数集中在20~40之间,可看出电脑杂志上每个句子的平均字数比报纸上的少,说明它作为科普读物需要通俗易懂、简明.[例2] (12分)为缓解车堵现象,解决车堵问题,北京市交通局调查了甲、乙两个交通站的车流量,在2016年5月随机选取了14天,统计每天上午7:30~9:00间各自的车流量(单位:百辆)得到如图所示的茎叶图,根据茎叶图回答以下问题.(1)甲、乙两个交通站的车流量的中位数分别是多少? (2)甲、乙两个交通站哪个站更繁忙?说明理由. [思路点拨] 根据茎叶图中的数据分析并作出判断.[精解详析] (1)甲交通站的车流量的中位数为58+552=56.5.(4分) 乙交通站的车流量的中位数为36+372=36.5.(8分)(2)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方,从数据的分布情况来看,甲交通站更繁忙.(12分)[一点通] 对于茎叶图要首先分清楚茎叶所表示的意义及叶的排放规律,它也直观地表示了数据的集中、离散的程度以及中位数、众数等特征.3.本例中条件不变,试计算甲、乙两交通站的车流量在[10,40]之间的频率. 解:甲站的车流量在[10,40]之间的有4天, 故频率为414=27.乙站的车流量在[10,40]之间的有6天, 故频率为614=37.4.从甲、乙两个品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下: 甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352 乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356 由以上数据设计了茎叶图如图所示根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①________________________________________________________________________;②________________________________________________________________________.解析:由茎叶图可以看出甲棉花纤维的长度比较分散,乙棉花纤维的长度比较集中(大部分集中在312~337之间),还可以看出乙的平均长度应大于310,而甲的平均长度要小于310等,通过分析可以得到答案.答案:①甲棉花纤维的长度比较分散,乙棉花纤维的长度比较集中②甲棉花纤维的长度的平均值小于乙棉花纤维长度的平均值(答案不唯一)茎叶图能够展示数据的分布情况,它的茎是指中间的一列数,叶是从茎的旁边生长出来的数.用茎叶图表示数据有两个最大优点:一是原始数据没有丢失,二是便于记录和表示.课下能力提升(十二)一、填空题1.在茎叶图中比40大的数据有________个.解析:由茎叶图中知比40大的有47、48、49,共3个.答案:32.在下面的茎叶图中茎表示数据的整数部分,叶表示数据的小数部分,则比数7.5小的有________个.解析:比7.5小的有6.1,6.2,6.3,7.2,7.3,7.4,共6个.答案:63.数据123,127,131,151,157,135,129,138,147,152,134,121,142,143的茎叶图中,茎应取________.解析:在茎叶图中叶应是数据中的最后一位,从而茎就确定了.答案:12、13、14、154.在如图所示的茎叶图中落在[20,40]上的频数为________.解析:由茎叶图中给出了12个数据,其中在[20,40]上有8个.答案:85.某中学高一(1)甲、乙两同学在高一学年度的考试成绩如下:从茎叶图中可得出________同学成绩比较好.解析:由图中数据可知甲同学的成绩多在80分以上,而乙相对差一些.答案:甲二、解答题6.某中学高二(1)班甲、乙两名同学自上高中以来每次数学考试成绩情况如下(单位:分):甲的得分:81,75,91,86,89,71,65,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101;画出甲乙两人数学成绩的茎叶图,请根据茎叶图对两个人的成绩情况进行比较.解:甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图可以看出,乙同学的得分集中在98分附近,数据分布是大致对称的;甲同学的得分集中在86分附近,分数数据分布也是大致对称的,但较分散.所以乙同学发挥比较稳定,得分情况好于甲.7.50辆汽车经过某一段公路的时速记录如图所示:将其分成7组并要求:(1)列出样本的频率分布表;(2)画出频率分布直方图以及频率分布折线图;(3)根据上述结果,估计汽车时速在哪组的几率最大?解:(1)由茎叶图知,数据最大值为33,最小值为13,分为7组,组距为3,则频率分布表为:(2)频率分布直方图及频率分布折线图如图所示:(3)汽车时速在[21.5,24.5)内的几率最大,为0.22.8.茎叶图是某班在一次测验时的成绩,伪代码用来同时统计女生、男生及全班成绩的平均分.试回答下列问题:(1)在伪代码中,“k=0”的含义是什么?横线①处应填什么?(2)执行伪代码,输出S,T,A的值分别是多少?(3)请分析该班男女生的学习情况.解:(1)全班32名学生中,有15名女生,17名男生,在伪代码中,根据“S←S/15,T←T/17”可推知,“k=1”和“k=0”分别代表男生和女生;S,T,A分别代表女生、男生及全班成绩的平均分;横线①处应填“(S+T)/32”.(2)女生、男生以及全班成绩的平均分分别为S=78,T=77,A≈77.47.(3)15名女生成绩的平均分为78,17名男生成绩的平均分为77.从中可以看出女生成绩比较集中.整体水平稍高于男生;男生中的高分段比女生高,低分段比女生多.相比较男生两极分化比较严重.。
高一数学 2.2《总体分布的估计》学案(苏教版必修3)
一、学习目标:1、意义和作用;2、用频率分布表,会画频率分布直方图,会用频率分布表或分布条形图估计总体分布,并作出合理解释。
二、学习过程:在解决问题过程中,进一步体会用样本估计整体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程,体会统计思维与确定性思维的差异三、学习重难点:当总体中的个体取不同数值很少时,可用频率分布表或频率分布条形图估计总体分布:当总体中的个体取不同数值较多,甚至无限时,可用频率分布表或频率分布直方图估计总体分布。
四、学习过程:预习概念:1、分布表:2、频率分布表的步骤:3、条形图:4、频率分布直方图:5、直方图与条形图的不同点:【知识应用】:1、为检测某产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件。
⑴列出样本的频率分布表;⑵此种产品为二级品或三级品的概率?⑶能否画出样本分布的条形图?频率分布表如下:2、为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下(单位:kg)试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计 (1)求最大值与最小值的差;(2)确定组距与组数;(3列频率分布表;(4)绘制频率分布直方图.巩固练习1.在用样本频率估计总体分布的过程中,下列说法中正确的是()A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确2.一个容量为n的样本,分成若干组,已知某数的频数和频率分别为50和0.25,则n=.3.一个容量为32的样本,已知某组的样本的频率为0.25,则该组样本的频数为()A.2B.4C.6D.84.右图的容量为100的样本的频率分布直方图,试根据图中的数据填空.(1)样本数据落在[6,10]内的频数为;(2)样本数据落在范围[10,14]内的数据为 ;(3)总体在范围[2,6]的概率为 . 5.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示. 根据条形图可得这50名学生这一天平均每人的课外阅读时间为 ( ) ()A 0.6小时 ()B 0.9小时()C 1.0小时 ()D 1.5小时6.7.下表给出了某学校120名12岁男生的身高统计分组与频数(单位:cm ).(2)画出频率分布直方图;(3)根据累积频率分布,估计小于134的数据约占多少百分比.时间(小时)。
江苏省泰兴中学高二数学苏教版必修3教学案:第2章02总体分布的估计
江苏省泰兴中学高二数学讲义(58)整体散布的预计【教课目的】会用样本频次散布预计整体散布【要点难点】用样本频次散布预计整体散布;频次散布表和频次散布直方图的绘制【典例解析】例 1、为了认识某地域高三学生的身体发育状况,抽查了地域内100 名年纪为17.5 岁~18 岁的男生的体重状况 ,结果以下 (单位 : kg)56.569.56561.564.566.56464.57658.57273.556677057.565.5687175 6268.562.56659.563.564.567.57368 557266.574636055.57064.558 6470.55762.5656971.5736258 76716663.55659.563.5657074.568.56455.572.566.5687657.56071.55769.57464.55961.5676863.558 5965.562.569.57264.575.568.5646265.558.567.570.5656666.5706359.5(1)试依据上述数据作出样本的频次散布表;(2)画出频次散布直方图及频次散布折线图;(3)并对相应的整体散布作出预计,指出男生的体重在哪一范围内散布最多,哪一范围内散布最少?大概是多少?例 2、下表是某学校一个礼拜中收来的失物品数,将5天中收来的失物数用频数条形图表示.星一二三四五期件62351数累68111计16 7例 3、甲、乙两篮球运动员上赛季每场竞赛的得分以下,试比较这两名运动员的得分水平。
甲: 12, 15, 24, 25,31, 31,36, 36,37, 39, 44, 49, 50。
乙: 8, 13, 14, 16, 23, 26, 28, 33, 38, 39 , 51【学后反省】1、获取样本的频次散布的步骤:(1) 确立 _____________ ; (2) 确立 _______与 _________;(3)决定 ___________;( 4)列 __________________ 。
高中数学第2章统计2.2总体分布的估计名师导航学案苏教版必修3
2.2 总体分布的估计名师导航三点剖析一、频率分布表1.定义总体分布反映了总体在各个范围内取值的频率,由于总体很大或不便于获得,因此我们可以利用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.2.列频率分布表的步骤在初中我们所接触的频率表是通过历史上所做的抛硬币的大量重复试验得到的.在这个试验中,抛掷硬币试验的结果的全体构成一个总体,每次试验的结果是总体中的一个个体,如果我们从中抽取一个容量为72 088的样本,其中正面向上的结果数为36 124,反面向上的结果数为35 964,则我们就可以得到如下一个频率分布表:试验结果频数频率正面向上36 124 0.501 1反面向上35 964 0.498 9这类试验只有两种结果,比较简单,下面我们就通过实例来研究较为复杂的频率分布表的制作方法.例如:从规定尺寸为25.40mm的一堆产品中任意抽取100件,测得它们的实际尺寸如下:25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.47 25.35 25.41 25.43 25.4425.49 25.45 25.43 25.46 25.40 25.51 25.45 25.40 25.39 25.41 25.36 25.38 25.3125.56 25.43 25.40 25.38 25.37 25.44 25.33 25.46 25.40 25.39 25.34 25.42 25.5025.37 25.35 25.32 25.45 25.40 25.27 25.43 25.54 25.39 25.45 25.43 25.40 25.4325.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46 25.3825.35 25.31 25.34 25.40 25.36 25.41 25.32 25.38 25.42 25.40 25.33 25.37 25.4125.49 25.35 25.47 25.34 25.30 25.39 25.36 25.46 25.29 25.40 25.37 25.33 25.4025.35 25.41 25.37 25.47 25.39 25.42 25.47 25.38 25.39如果把这堆产品的尺寸的全体看作一个总体,则上面数据就是从总体抽取的一个容量为100的样本.在这组数据中,最小值为25.24,最大值为25.56,它们相差0.32,可取区间[25.235,25.565].我们可将此区间分成11个区间,每个区间长度为0.03,再统计出每个区间内的频数,并计算相应的频率,将结果填入下表:分组频数累计频数频率[25.235,25.265) 1 1 0.01[25.265,25.295) 3 2 0.01[25.295,25.325) 8 5 0.05[25.325,25.355) 20 12 0.12[25.355,25.385) 38 18 0.18[25.385,25.415) 63 25 0.25[25.415,25.445) 79 16 0.16[25.445,25.475) 92 13 0.13[25.475,25.505) 96 4 0.04[25.505,25.535) 98 2 0.02[25.535,25.565) 100 2 0.02 合计100 1.00这张表给出了产品尺寸处于各个区间内的个数和频率,由此可估计这一堆产品的尺寸分布情况,这就是该样本的频率分布表.在表中频数是指落在各小组内的数据的个数.频率是各组的频数与数据总数的比值.由上面的制表过程可得编制频率分布表的步骤如下:(1)计算数据中最大值与最小值的差,算出了这个差就可以知道这组数据的变动范围有多大.(2)决定组数与组距.将这一批数据分组,目的是要描述数据的分布规律,要根据数据的多少来确定分组的数目.一般来说,数据越多,分的组也越多.(3)决定分点.要使分点比数据多一位小数,并且把第1组的下限略去或把第1组的起点稍减小一点.(4)列频率分布表.登记频数,计算频率,列出频率分布表.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.在编制频率分布表时,若题目已给出了组距和组数,可以直接列出频率分布表.3.频率分布的优点和缺点频率分布表的优点是:能直接反映数据在各范围内的频数和频率;其缺点是:不能直观地反映数据的频率分布, 分布表是否正确.二、频率分布直方图1.定义频率分布表虽然能体现出数据的分布规律,但它并不直观,为了直观地体现数据数的分布规律,我们需要画频率分布直方图.在初中,我学过如何绘制频数直方图,它能直观地体现数据的分布规律.同样我们可以用直方图来反映样本的频率分布规律.这种反映样本的频率分布规律的直方图称为频率分布直方图,简称频率直方图.2.绘制频率分布直方图的步骤为了形象地说明绘制频率分布直方图的步骤,我们还以具体的实例来说明频率分布直方图的画法.例如:有一个容量为50的样本数据的分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5), 4.列出样本的频率分布表,画出频率分布直方图.分析:本题主要考查频率分布表的编制和频率分布直方图的绘制及频率分布表的应用.由于题中数据已分组,所以在列频率分布表时,只要直接计算出每小组数据的频率填入表中即可.解:样本的频率分布表、频率分布直方图如下:频率分布表分组频数累计频数频率频率组距[12.5,15.5) 3 3 0.06 0.02 [15.5,18.5) 11 8 0.16 0.053 [18.5,21.5) 20 9 0.18 0.06[21.5,24.5) 31 11 0.22 0.073 [24.5,27.5) 41 10 0.2 0.067 [27.5,30.5) 46 5 0.1 0.033 [30.5,33.5) 50 4 0.08 0.027 合计50 1.00 0.333频率分布直方图(如图6-1所示):图6-1所以,要绘制此样本的频率分布直方图,有以下几步:频率;(1)先列出频率分布表,然后作出直角坐标系,以横轴表示身高,纵轴表示组距(2)在横轴上标上12.5,15.5,…,33.5表示的点(为了方便,第一个数据点可以前移);频率, (3)在上面标出的各点中,分别以相邻两点为端点的线段为底边作矩形,其高等于组距至此,就得到了这组数据的频率分布直方图.一般地,画频率分布直方图方法如下:把横轴分为若干段,每一段对应一组的组距,然后以线段为底,作一个矩形,它的高等频率,作出一系列的矩形;每个矩形的面积恰好是该组的频率,这些矩形就构成于该组的组距了频率分布直方图.在频率分布直方图中各个小矩形的面积和等于1.3.频率分布直方图的两种类型用样本频率分布估计总体分布通常分两种情况:(1)当总体中的个体取不同数值很少时,其频率分布表由所取的样本的不同值及其相应频率表示,其几何表示就是相应的条形图.条形图中,纵轴表示的是频率,条形图的高为该组数据的频率.但应注意:“总体中的个体取不同数值很少”并不是指“总体中的个数很少.”例如:前面所接触到的抛掷硬币的试验中,尽管样本的容量达到了72088,但试验结果只有两种,即正面向上和反面向上.如果记“正面向上”的结果为0,记“反面向上”为1,则样本中数据只有两个取值.此时,该样本的频率分布表的几何表示就为相应的条形图. (2)当总体中个体取不同值较多,甚至无限时,对其频率分布研究用到初中学过的整理样本数据的知识,用频率分布直方图来表示相应的样本的频率分布.4.频率分布直方图的优点和缺点频率分布直方图虽然能直观体现数的分布规律,但要绘制频率分布直方图过程比较复杂,且它不能直接体现数据的频数分布.三、频率折线图与总体的密度曲线1.频率折线图的定义将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就可以得到一条折线,这条折线就是本组数据的频率折线图.2.频率折线图的画法频率折线图是在频率分布直方图的基础上,取直方图中各小矩形的上底边的中点连结而成的.画频率折线图时还应注意:取值区间两端点需分别向外延伸半个组距,以使折线首尾分别与横轴相连.3.频率折线图的优点与缺点频率折线图的优点是它能反映数据的变化趋势,但它不能直接体现数据的分布规律. 4.总体的密度曲线在画频率折线图时,如果将样本容量取得足够大,分组的组距取得足够小,这条折线将趋于一条曲线,这一曲线为总体的密度曲线,它能反映出总体分布规律.例如:为了估计某产品寿命的分布,对产品进行抽样检验,记录如下(单位:小时):203 397 597 402 102 303 289 312 501 316 488 355 585 355413 316 197 479 384 278 522 363 234 432 357 566 111 333467 265 326 534 318 552 323 188 352 447 452 337 123 370399 445 365 549 248 316 459 331 176 554 368 412 374 251327 489 329 246 316 475 311 260 133 314 426 366 213 495335 540 338 407 586 331 290 368 410 167 320 510 364 276305 417 307 524 573 326 146 227 317 407 369 214 504 425153 214(1)作出频率分布表;(2)画出频率分布直方图和频率折线图;(3)估计产品寿命在200~500h以内的百分率;(4)估计产品寿命在400h以上的百分率.分析:此题中样本数据取不同的值较多,属于总体分布的第二种情况.将样本中数据适当分组统计各组中数据的频数,计算其频率即可.解:(1)该组数据中最小值为102,最大值为597,差为495,可分为5组.列表如下: 寿命/h 频数累计频数频率频率组距100~200 10 10 0.10 0.001 200~300 25 15 0.15 0.001 5 300~400 65 40 0.40 0.004 400~500 85 20 0.20 0.002 500~600 100 15 0.15 0.001 5 合计100 1.00(2)频率分布直方图和频率折线图如下(如图6-2所示):频率分布直方图频率折线图图6-2(3)200~500 h以内的百分率为1-15%=85%.(4)产品寿命在400h以上的百分率为20%+15%=35%.四、茎叶图1.平均数、中位数和众数一般地,对于n 个数x 1,x 2,…,x n ,我们把nx x x n+++ 21叫做这n 个数的算术平均数,简称平均数.平均数常用于表示一组数据的平均水平.计算平均数时,所有数据都参加运算,它能充分利用数据所描述的信息,因此在生活中较为常用,但它易受端点值的影响.例如:某公司职工月工资表如下: 员 工 经理 副经理 A BCDEF杂工月工资6 000 4 0001 700 1 300 1 200 1 100 1 100 1 100 500经计算,该公司职工月平均工资为2 000元,但除经理和副经理之外其他员工的工资均小于2 000元,这就是因为平均数受端点值6 000和500的影响.一般地,n 个数据根据大小顺序排列后,处于中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.由中位数的定义可知,当数据的个数是奇数时最中间的一个数据是中位数;当数据的个数是偶数时,则最中间两个数据的平均数是中位数.中位数受端点值的影响小,但不能充分利用所有数据的信息.例如:在上面某公司职工月工资表中的中位数是1 300.众数则是一组数据中出现次数最多的那个数据.如在上面某公司职工月工资表中众数则是1100. 平均数、中位数和众数均能反映一组数据的平均水平,在一组数据中平均数和中位数只有一个,众数则可以有多个.例如:在数据1.5,1.5,1.6,1.65,1和1.7,1.7,1.75,2.1中,平均数为1.7;中位数为1.675;众数则为1.5和1.7. 2.茎叶图制作茎叶图的方法是:当所给数据为一位数时,可将0作为茎叶较长的茎,而它本身作为叶;当所给数据为两位数时,将所有两位数的十位数字作为“茎”,个位数字作为“叶”;当所给的数据为三位数时,可将百位和十位作为茎,而个位作为叶.茎相同的数据共用一个茎,茎按从小到大的顺序从上到下排列,共用茎的叶一般要按从大到小(也可以从小到大)的顺序同行排出.制作茎叶图时,一般用一个竖线将茎叶隔开,竖线的左边是茎,右边是叶.由茎叶图我们可以粗略地看出一组数据的平均数、中位数、众数的范围.茎叶图不但可以分析单组数据,也可以对两组数据进行对比.当列两组数据的茎叶图时,它们可以共同用一个茎.3.茎叶图的优点和缺点茎叶图的优点是:所有信息都可以从茎叶图中得到体现,而且茎叶图便于记录和表示;它既可以分析单组数据,也可以对两组数据进行比较.茎叶图的缺点是:茎叶图不方便表示位数在三位以上的数据.问题探究问题:为了了解一大片经济树林的生长情况,随机测量其中的100株的底部周长,得到如下数据(长度单位为cm):135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112109 124 87 131 97 102 123 104 104 128105 123 111 103 105 92 114 108 104 102129 126 97 100 115 111 106 117 104 109111 89 110 121 80 120 121 104 108 118129 99 90 99 121 123 107 111 91 10099 101 116 97 102 108 101 95 107 101102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108 该用什么样的方法来估计经济树林的生长情况?探究:用样本估计可用频率分布表、频率分布直方图和频率折线图.它们有着各自的特点:频率分布表编制比较简单且能体现出数据在各范围出现的次数和频率,但它不能直观地反映数据的频率分布;频率分布直方图虽然能直观体现数的分布规律,但要绘制频率分布直方图过程比较复杂,且它不能直接体现数据的频数分布;频率折线图的优点是它能反映数据的变化趋势,但它不能直接体现数据的分布规律.所以,本题采用何种方法来估计经济树林的生长情况,要视具体要求而定,例如:估计这片经济林中底部周长少于100cm的树木约占多少?不少于120cm的树木约占多少?我们可采用频率分布表,这是因为它能直接体现出数据在各范围内出现的次数和频率.如果要考查某一范围内数据的变化情况,则可采用频率折线图.精题精讲例1.为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下表(单位:kg):试根据上述数据列出样本的频率分布表,并对相应的总体分布做出估计.思路解析该组数据中最小值为55,最大值为76,它们的差是76-55=21,可取区间[54.5,76.5],并将此区间分为11个区间,每个区间的长度为2,再统计每个区间内的频数并计算频率,列表即可.解析:按照下列步骤获得样本的频率分布:(1)求最大值与最小值的差.在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76-55=21,所得的差告诉我们,这组数据的变动范围有多大.(2)确定组距与组数.如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数是适合的.于是组距为2,组数为11.(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5).(4)列频率分布表.频率分布表在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计体重在[64.5,66.5)kg的学生最多,约占学生总数的16%;体重小于58.5 kg的学生较少,约占8%等等.绿色通道一般地,列频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=全距/组数;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.频数累计是指本组数据及本组数据以前各组数据的和.频率分布表有两条较为明显的性质:①各组的频数和为样本中数据的个数;②各组的频率和为1.例2.下表给出了某校120名12岁男孩的身高资料(单位:cm):(1)列出样本的频率分布表; (2)画出频率分布直方图;(3)根据样本的频率分布图,估计身高小于134cm 的人数约占总人数的百分比;(4)如果该校所在的地区,12岁男孩有12万人,根据上面的统计结果,你能估计出身高在150 cm 以上的男孩大约有多少人?(5)如果样本容量再大一些,组距再小一些,请你想象一下,直方图中的小矩形会发生什么变化?思路解析由于题目中数据已分组,则可直接列频率分布表.由于频率分布图能直观地体现出样本的频率分布,则由图直接进行估计.由频率分布表可知身高在150cm 的频率为241201,所以,估计出身高在150cm 以上的男孩大约11 000人.如果样本容量再大一些,组距再小一些,频率分布直方图中的各个小矩形就会越来越细.当样本容量充分大时,图中的组距充分缩短,从而图中的小矩形的上底的连线就变成光滑的曲线. 答案:(1)列频率分布表如下:(2)频率分布直方图分布如下(如图6-3所示):图6-3(3)身高小于134cm的学生数约占总数的19%.(4)身高在150cm以上的男孩大约11 000人.(5)各个小矩形就会越来越细,当样本容量充分大时,图中的组距充分缩短,图中的小矩形的上底的连线就变成光滑的曲线.例3.为制定本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高作调查,现有三种调查方案:①测量少体校中180名男子篮球、排球队员的身高;②查阅有关外地180名男生身高的统计资料;③在本市的市区和郊县各任选一所完全中学、两所初级中学,在这六所学校有关的年级(1)班中,用抽签的方法分别选出10名男生,然后测量他们的身高.(1)为了达到估计本市初中这三个年级男生身高分布的目的,你认为采用上述哪一种调查方案比较合理,为什么?(2)下表中的数据是使用某种调查方法获得的:身高(cm) 七年级八年级九年级总计(频数)143~153 12 3 0153~163 18 9 6163~173 24 33 39173~183 6 15 12183~193 0 0 3(注:每组可含最低值、不含最高值)根据表中的数据填写表中的空格.根据填写的数据绘制频数分布直方图.思路解析本题考查了抽样方法的选择和频数分布直方图的绘制,由于在统计中收集数据必须用随机抽样的方法所抽取的数据才具有代表性,则宜用方案③.又所抽的数据中已分组,则可直接计算各组数据的频数分布和直接绘制频数分布直方图.解析:(1)在统计中收集数据必须用随机抽样的方法所抽取的数据才具有代表性.①中,少体校的男子篮球、排球的运动员的身高一定高于一般的情况,因此无法用测量的结果去估计总体的结果.②中,用外地学生的身高也不能准确地反映本地学生身高的实际情况.③中的抽样方法符合随机的抽样,因此用方案③比较合理.(2)①上表中的频数从上到下依次为15,33,96,33,3.②直方图如图6-4所示.绿色通道统计中数据的获得要合理、公平、具有代表性,这是解决问题的第一关.它直接影响着统计的结果,影响正确结论的得出,也就影响着正确决策的制定.例4.从某校参加初中毕业考试的学生的成绩中,抽取了30名学生的数学成绩,分数如下: 90,85,84,86,87,98,79,85,90,93,68,95,85,71,78,61,94,88,77,100,70,97,85,68,99,88,85,92,93,97.这个样本数据的频率分布表如下:分组频数累计频数频率59.5~64.5 1 0.03364.5~69.5 2 0.06769.5~74.5 2 0.06774.5~79.5 3 0.10079.5~84.5 1 0.03384.5~89.5 9 0.30089.5~94.5 6 0.20094.5~99.5 5 0.16799.5~104.5 1 0.033 合计30 1.000填空:(1)这个样本数据的众数是_________分.(2)列频率分布表时,所取的组距为_________分.(3)在这个频率分布表中,数据落在94.5~99.5分范围内的频数为_________.(4)在这个频率分布表中,数据落在74.5~79.5分范围内的频率为_________.(5)在这个频率分布表中,频率最大的一组数据的范围是_________分.(6)估计这个学校初中毕业考试的数学成绩在80分以上(含80分)的约占_________%.思路解析(1)众数是一组数据中出现次数最多的数,它的数量可以是多个.在本题中落在84.5~89.5分范围内的数据的个数最多,而这组数据的组中值为85分,则可以用85分来代表这组数据.(2)考查频率分布表制作过程中组距的划分,由于该组数据所取的区间为[59.5,104.5],最大值与最小值的差为45,又整个区间被分为9组,则组距为5.(3)考查识表能力,由所给的频率分布表可知,在94.5~99.5分的频率数为5.(4)考查识表能力,由所给的频率分布表可知,数据落在74.5~79.5分范围内的频数为3,则由频率的计算公式可得,数据落在74.5~79.5分范围内的频率为0.100.(5)考查识表能力,由所给的频率分布表可知,表中频数的最大值为9,它的分布范围为84.5~89.5分.(6)考查识表能力,当某一范围由几组数据组成时,则在这一范围内数据出现的频率为构成这一范围各组数据出现的频率的和.答案:(1)85 (2)5 (3)5 (4)0.100 (5)84.5~89.5 (6)73.3(7)频率分布直方图和折线图如图6-5所示:图6-5绿色通道一般地,将频率分布直方图中各个矩形上底的中点顺次连结起来,就得到一条折线,我们称之为本组数据的频率分布折线图.如果将样本的容量取得足够大,分组的组距取得足够小,则这条折线将趋近于一条曲线,我们称之为总体分布的密度曲线.例5.甲、乙两篮球运动员上一个赛季的得分如下:甲:21,25,31,31,14,34,32,41,50,23,8.乙:13,34,35,34,23,24,41,50,32,37,32.试比较两人的得分水平.思路解析当所给数据为两位数时,将所有两位数的十位数字作为“茎”,个位数字作为“叶”.当列两组数据的茎叶图时,它们可以共同用一个茎.解析:画茎叶图(如图6-6所示),由图可知,乙运动员的得分大致对称,其平均数、众数、中位数都是30多分,比甲稳定.图6-6绿色通道用茎叶图刻画数据有两个优点:一是所有信息从图中可以得到;二是茎叶图便于记录和表示,但茎叶图对于表示三位数以上的数据是不够方便的.。
2013高二数学2.2《总体分布的估计》第1课时教案(苏教版必修3)
2.2 总体分布的估计第3课时茎叶图【学习导航】学习要求1.体会茎叶图的制作方法,一组数据中的的每个数,何为茎,何为叶?主要的数字为茎,次要的数字为叶,因此对于两位数而言,十位数字为茎,个位数字为叶,; 2.要能够通过茎叶图,分析单组数据,以及比较两组数据的差异。
;【课堂互动】自学评价案例 某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50. 如何分析该运动员的整体水平及发挥的稳定程度. 【分析】初中统计部分曾学习过用平均数、众数和中位数反映总体的水平,用方差考察稳定程度.我们还有一种简易的方法,就是将这些数据有条理地列出来,从中观察数据的分布情况.这种方法就是画出该运动员得分的茎叶图.制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.【解】茎叶图除了课本中示例外,还有其它的形式,常见如下四种形式:(1) (2)(3) (4)从茎叶图可以粗略地看出,该运动员平均得分及中位数、众数都在20到40之间,且分布较对称,集中程度高,说明其发挥比较稳定。
【小结】1.讨论分析,上面四种茎叶图中,哪些能更有益于观察数据?茎叶图有什么优点?又有什么缺陷?如,第一种茎叶图能很方便地从小到大来还原所有的原始数据;第二种茎叶图能让数据重心更倾向茎叶分界线;第三种和第四种在两组数据的比较中有作用.2.茎叶图的优点在于保持数据无损的情况下较为直观地反映数据分布特征,对两位数(或只有末两位不同的多位数)的数据表示很方便,缺点在于多位数的表示不太方便、直观.3.茎叶图可用于展示原始数据的分布,同时还保留原始数据在图形里面,相当直观.从茎叶图中,可直接看出数据是否对称、是否有极端值以及数据的集中趋势和离中趋势.1 2 3 4 5 25 45 116679 49 0 11 2 3 4 5 52 54 976611 94 0 94.茎叶图可以分析单组数据,也能对两组数据进行比较,画出两组数据的茎叶图,可将茎放在中间共用,叶分列左、右两侧,左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的得分要重复记录,不能遗漏【精典范例】例1 甲、乙两篮球运动员上赛季每场比赛的得分如下,试比较这两位运动员的得分水平 甲:12,15,24,25,31,31,36,36,37,39,44,49,50 乙:8,13,14,16,23,26,28,33,38,39,51【解】画出两人得分的茎叶图,为便于对比分 析,可将茎放在中间共用,叶分别列左、右两侧:甲 乙0 852 1 346 54 2 368 976611 3 389 94 4 0 5 1(第二行表示甲得分为15分、12分、乙得分为13分、14分、16分。
高中数学第2章统计2.2总体分布的估计共同成长学案苏教版必修3(2021学年)
高中数学第2章统计2.2 总体分布的估计共同成长学案苏教版必修3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第2章统计 2.2总体分布的估计共同成长学案苏教版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第2章统计 2.2 总体分布的估计共同成长学案苏教版必修3的全部内容。
2.2 总体分布的估计共同成长见仁见智2001年上海市居民的支出构成情况如下表所示:食品1衣着2家庭设备用品及服务3医疗保健4交通和通讯5教育文化娱乐服务6居住7杂项商品和服务839。
4%5.9%6。
2%7。
0%10。
7%15.9%11.4%3。
5%为了直观形象地表示出上面的数据,需要画出统计图,如图6-10所示是两个同学所画的统计图:甲: 乙:图6—10观察并比较这两种统计图:(1)它们各有什么特点?你觉得哪种统计图更合适?(2)你还有其他表示2001年上海市居民支出构成情况的方法吗?你认为用哪种统计图最合适?合作共赢请你与同学、朋友一起阅读下面的材料,然后根据材料回答问题.材料:有关部门从甲、乙两个城市所有的自动售货机中分别随机抽取了16台,记录下上午8:00~11:00间各自的销售情况(单位:元)甲:188 10 43 5 30 1022 6 27 25 58 14 18 3041乙:22 31 32 4220 27 48 23 38 43 12 34 18 10 34 23(1)利用你们所学的知识,能用不同的方式分别表示上面的数据吗?(2)从哪一种统计图中能看出甲的销售额中有25元这一数据?哪一种统计图反映了收集到的全部数据信息?哪一种统计图损失了部分统计数据信息?(3)如果收集到的数据很多,例如有100个,则哪一种统计图更能直观地反映这些数据分布的大致情况?(4)还有其他表示这些数据的方法吗?以上就是本文的全部内容,可以编辑修改。
高中数学总体分布的估计 备课资料苏教版必修三
总体分布的估计备课资料思考过程统计学的一个重要思想就是用样本的信息去估计总体的相关信息.为了考察一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况.这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征.1.对数据进行整理,可以得出它的频率分布、频率分布表及直方图,可以帮助我们了解样本的频率分布,并运用频率分布去估计总体分布.2.列出频率分布表,就可以从“频数”栏目知道数据落在各个小组的个数,也可以从每一组的频率,得出频率,就可以知道数据落在各个小组的比例大小.3.用样本分布直方图去估计相应的总体分布时,如果样本容量越来越大,那么分组就越来越细,即频率分布直方图中的各个小矩形就会越来越细.当样本容量充分大时,图中的组距充分缩短,从而图中的阶梯折线就变成光滑的曲线,这就是总体分布曲线,它精确地反映了总体的分布规律.4.在实际问题中,通常我们并不知道总体的分布,因此我们往往是从总体中抽取一个样本,用样本的频率分布去估计与样本相应的总体分布.5.用茎叶图可以直观地看出样本的所有信息,能看出数据的集中趋势,但对于波动性的刻画不够细致.知识总结频率分布与相应的总体分布的关系:频率分布将随着样本容量的增大更加接近总体值,当样本容量无限增大,且分组的组距无限缩小时,频率分布直方图就会无限接近于一条光滑曲线(总体密度曲线)间的关系.基于频率分布与相应的总体分布的关系,通常我们不易知道一个总体的分布.在实践中,我们往往是从总体中抽取一个样本,用样本的频率分布去估计相应的总体分布,一般地,样本容量越大,这种估计越精确. 用样本频率分布估计总体分布通常分两种情况:(1)当总体中的个体取不同数值很少时,其频率分布表由所取的样本的不同值及其相应频率表示,其几何表示就是相应的条形图.注意:“总体中的个体取不同数值很少”并不是指“总体中的个数很少.”(2)当总体中个体取不同值较多,甚至无限时,对其频率分布研究用到初中学过的整理样本数据的知识,用频率分布直方图来表示相应的样本的频率分布.注意:上述两种情况不同之处:在于前者的频率分布列出的几个不同数据的频率,相应的条形图是用其高度来表示取各个值的频率.后者的频率分布表列出的是各个不同的区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间的频率.用茎叶图刻画数据可以从图中得到所有信息,便于记录和表示,但茎叶图对于表示三位数以上的数据是不够方便的.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
某制造商为2013年全运会生产一批直径为40 mm 的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm ,保留两位小数)如下40.03 40.00 39.98 40.00 39.99 40.00 39.98 40.01 39.98 39.99 40.00 39.99 39.95 40.01 40.02 39.98 40.00 39.99 40.00 39.96问题1:上述20个数据中最大值与最小值分别是多少,它们相差多少? 提示:最大值为40.03,最小值为39.95,其差为0.08.问题2:将上述数据分组统计,分组情况为[39.95,39.97),[39.97,39.99),[39.99,40.01),[40.01,40.03],求各组个数.提示:各组数据的个数为2,4,10,4. 问题3:试求出各组数据所占的比例? 提示:分别为0.10,0.20,0.50,0.20.问题4:能否用一个直观图来表示问题2中各组数据的分布情况? 提示:可以.1.频率分布表(1)定义:当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.(2)绘制的步骤:①求全距,决定组数和组距,组距=全距组数.②分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间. ③登记频数,计算频率,列出频率分布表. 2.频率分布直方图(1)定义:我们用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图.(2)绘制步骤: ①先制作频率分布表.②建立直角坐标系:把横轴分成若干段,每一段对应一个组的组距,并标上一些关键点. ③画矩形:在横轴上,以连结相邻两点的线段为底,以纵轴上频率组距为高作矩形,这样得一系列矩形,就构成了频率分布直方图.3.频率分布折线图(1)定义:把频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.(2)总体分布密度曲线:频率折线图的优点是它反映了数据的变化趋势,如果将样本容量取得足够大,分组的组距取得足够小,则相应的频率折线图将趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线.1.在频率分布表中,除最后一个区间是闭区间,其他区间均为左闭右开区间,这样做的目的是为了不重不漏,避免丢失样本数据.2.在频率分布直方图中,各个小矩形的面积之和为1.3.频率分布直方图直观地显示了数据分布信息,从而为分析估计总体提供了依据. 4.频率分布折线图反映了数据的变化趋势,可用来对数据进行估计和预测.[例1] 从某校参加 2016年全国高中数学联赛预赛的600名同学中,等可能抽取若干名同学,将他们的成绩制成频率分布表,下面给出了此表中部分数据.(1)根据表中已知数据,依次写出在①、②、③处的数值; (2)补全在区间[70,140]上的频率分布直方图;(3)若成绩不低于110分的同学能参加决赛,那么可以估计该校大约有多少学生能参加决赛?[思路点拨] 根据频率分布表作出频率分布直方图. [精解详析] (1)50 0.04 0.10. (2)如图:(3)成绩不低于110分的同学能参加决赛的频率为0.08+0.04+0.02=0.14,所以估计该校能参加决赛的人数大约为600×0.14=84. [一点通] 1.在列频率分布表时,全距、组距、组数有如下关系: (1)若全距组距为整数,则全距组距=组数. (2)若全距组距不为整数,则全距组距的整数部分+1=组数. 2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.1. 从全校参加科技知识竞赛的学生试卷中,抽取一个样本,考察竞赛的成绩分布.将样本分成5组,绘成频率分布直方图(如图),图中从左到右各小组的小长方形的高的比是1∶3∶6∶4∶2,最右边一组的频数是6.请结合频率分布直方图提供的信息,解答下列问题:(1)样本的容量是多少?(2)列出频率分布表.解:(1)由于各组的组距相等,所以各组的频率与各小长方形的高成正比且各组频率的和等于1,那么各组的频率分别为116,316,616,416,216.设该样本容量为n,则6n=216,所以样本容量为n=48.(2)由以上得频率分布表如下:2.有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20),17.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)求样本数据不足0的频率.解:(1)频率分布表如下:(2)频率分布直方图如图所示:(3)样本数据不足0的频率为7+11+15+40200=0.365.[例2] (12分)为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,绘制出频率分布直方图(如图所示),第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少? [思路点拨] (1)利用频率等于对应小长方形面积来确定;(2)满足条件的频率之和即为达标率.[精解详析] (1)由题中可知第二小组[100,110)对应的频率组距为0.008,而组距为10,故频率为0.008×10=0.08, (4分)设样本容量为为n ,则12n =0.08,∴n =150. (8分)(2)根据频率分布直方图,次数在110以上共有四组. 估计该校全体高一学生的达标率为: 1-0.04-0.08=0.88. (12分) [一点通] 1.频率分布直方图的性质:(1)因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1. (3)频数/相应的频率=样本容量.2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.3.观察新生婴儿的体重(单位:g),其频率分布直方图如下图所示,则新生婴儿体重在[2 700,3 000)内的频率为________.解析:由图可知当新生婴儿体重在[2 700,3 000)内时,频率组距=0.001,而组距为300,所以频率为0.001×300=0.3.答案:0.34.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的学生人数是________.解析:依题意,设第2小组的频率为2x ,则有6x =1-(0.037+0.013)×5,得2x =0.25,即第2小组的频率为0.25,因此报考飞行员的学生人数是120.25=48.答案:485.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间对某地居民调查了10 000人,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人做进一步调查,则在[2.5,3](小时)时间段内应抽出的人数是________.解析:抽出的100人中平均每天看电视的时间在[2.5,3](小时)时间内的频率是0.5×0.5=0.25,所以这10 000人中平均每天看电视的时间在[2.5,3](小时)时间内的人数是10000×0.25=2 500,抽样比是10010 000=1100,则在[2.5,3](小时)时间段内应抽出的人数是2 500×1100=25.答案:251.频率分布表和频率分布直方图都是用来描述样本数据情况的,是相同数据的两种不同的表达方式.2.频率分布表在数量表示上比较确切,但不够直观、形象,用它来分析数据分布的总体趋势不太方便,而频率分布直方图能够表示大量数据,非常直观、形象地表明分布的规律,使我们能够看到在分布表中看不清楚的数据模式.但是直方图会丢失一些信息,如原始数据不能在图中表示出来.课下能力提升(十一)一、填空题1.如图是容量为100的样本的频率分布直方图,试根据图形中的数据填空.(1)样本数据在范围[6,10)内的频率为________;(2)样本数据落在范围[10,14)内的频数为________.解析:(1)样本数据在[6,10)内频率为0.08×4=0.32.(2)在[10,14)内的频数为0.09×4×100=36.答案:(1)0.32(2)362.为了调查某厂工人生产某种产品的能力,随机抽查了20名工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如下图,则这20名工人中一天生产该产品数量在[55,75)的人数是________.解析:由题意得,这20名工人中一天生产该产品数量在[55,75)的人数是20×[(0.040+0.025)×10]=13(人).答案:133.将容量为100的样本数据,按从小到大的顺序分成8个组,如下表:则第六组的频率为________.解析:9+14+14+13+12+x+13+10=100,x=15.P=15100=0.15.答案:0.154.为提高公众对健康的自我管理能力和科学认识,某调查机构共调查了200人在一天中的睡眠时间.现将数据整理分组,如下表所示.由于操作不慎,表中A,B,C,D四处数据污损,统计员只记得A处的数据比C处的数据大4,由此可知B处的数据为________.解析:设A处的数据为x,则C处的数据为x-4,则x+x-4+8+52+20+4=200,x=60,则B处数据为60200=0.3.答案:0.35.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________. 解析:设[25,30)年龄组对应小矩形的高度为h ,则5×(0.01+h +0.07+0.06+0.02)=1,h =0.04.志愿者年龄在[25,35)的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)的人数约为0.55×800=440.答案:0.04 440 二、解答题6.某工厂对一批产品进行了抽样检测,右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106).已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是多少?解:产品净重小于100克的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n ,则36n =0.300,所以n =120,净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.750,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.750=90.7.根据空气质量指数API(为整数)的不同,可将空气质量分级如下表:(100,150],(150,200],(200,250],(250,300]进行分组,得到频率分布直方图如图.(1)求频率分布直方图中x 的值;(2)计算一年中空气质量为良和轻微污染的总天数. (提示:结果用分数表示.已知57=78 125,27=128, 31 825+2365+71 825+31 825+89 125=1239 125,365=73×5) 解:(1)由图可知50x =1-(31 825+2365+71 825+31 825+89 125)×50=1-1239 125×50,解得x =11918 250;(2)365×(11918 250×50+2365×50)=219.答:一年中空气质量为良和轻微污染的总天数为219天.8.为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示).(1)求出各组相应的频率;(2)估计数据落在[1.15,1.30]中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中还有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.解:(1)由频率分布直方图和频率=组距×(频率组距)可得下表(2)0.30+0.15+0.02=0.470.47.(3)由分层抽样中每个个体被抽到的概率相同知:设水库中鱼的总条数为N ,则120N =6100,即N =2 000,故水库中鱼的总条数约为2 000条.第2课时 茎叶图2016年CBA 新赛季,山东队某队员在该赛季各场比赛的得分情况如下:15,21,20,19,23,26,25,20问题1:利用这些数据能否直接判断出该运动员发挥水平?提示:可以,但会存在偏差.问题2:能否利用频率分布直方图来分析这些数据?提示:由于样本数据较少,一般不用直方图.问题3:由于数据较少,可否有更快捷的作图方式来分析数据?提示:有.1.茎叶图的制作方法 (1)画“茎”:“茎”表示两位数的十位数字,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,再画上竖线作为分界线. (2)添“叶”:“叶”画在分界线的另一侧表示两位数的个位数字,共茎的叶一般按从小到大(或从大到小)的顺序同行列出.2.茎叶图刻画数据的优缺点(1)茎叶图刻画数据的优点:①所有的信息都可以从茎叶图中得到. ②茎叶图便于记录和表示.(2)茎叶图刻画数据的缺点:当样本数据很多时,茎叶图的效果就不是很好了.1.茎叶图画茎时可以画成纵向的,也可画成横向的.2.茎叶图表示数据时也可以表示三位数据,此时茎表示前两位,叶表示最后一位.3.茎叶图主要是针对样本数据不多或数据位数较少时,便于快速记录分析;样本数据较多或数据位数较多时,不方便使用.[例1]某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.[思路点拨]确定茎与叶,作出茎叶图,并判断比较.[精解详析]甲、乙两人数学成绩的茎叶图,如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,大多集中在80~100之间,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,多集中在70~90之间,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.[一点通]绘制茎叶图关键是分清茎和叶,一般地说数据是两位数的,十位上数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要合理的选择茎和叶.1.某次运动会甲、乙两名射击运动员射击成绩如下:(单位:环)甲:9.4,8.7,7.5,8.4,10.1,10.5,10.7,7.2,7.8,10.8乙:9.1,8.7,7.1,9.8,9.7,8.5,10.1,9.2,10.1,9.1用茎叶图表示甲、乙二人成绩.解:中间数字表示成绩的整环数,旁边数字表示小数点后的数字.2.某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示.(2)进行分析,得出什么结论?解:(1)如图:(2)电脑杂志上每个句子的字数集中在10~30之间,而报纸上每个句子的字数集中在20~40之间,可看出电脑杂志上每个句子的平均字数比报纸上的少,说明它作为科普读物需要通俗易懂、简明.[例2](12分)为缓解车堵现象,解决车堵问题,北京市交通局调查了甲、乙两个交通站的车流量,在2016年5月随机选取了14天,统计每天上午7:30~9:00间各自的车流量(单位:百辆)得到如图所示的茎叶图,根据茎叶图回答以下问题.(1)甲、乙两个交通站的车流量的中位数分别是多少?(2)甲、乙两个交通站哪个站更繁忙?说明理由.[思路点拨] 根据茎叶图中的数据分析并作出判断.[精解详析] (1)甲交通站的车流量的中位数为58+552=56.5. (4分) 乙交通站的车流量的中位数为36+372=36.5. (8分)(2)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方,从数据的分布情况来看,甲交通站更繁忙. (12分)[一点通] 对于茎叶图要首先分清楚茎叶所表示的意义及叶的排放规律,它也直观地表示了数据的集中、离散的程度以及中位数、众数等特征.3.本例中条件不变,试计算甲、乙两交通站的车流量在[10,40]之间的频率.解:甲站的车流量在[10,40]之间的有4天,故频率为414=27. 乙站的车流量在[10,40]之间的有6天,故频率为614=37. 4.从甲、乙两个品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下: 甲品种:271 273 280 285 285 287 292294 295 301 303 303 307 308 310 314319 323 325 325 328 331 334 337 352乙品种:284 292 295 304 306 307 312313 315 315 316 318 318 320 322 322324 327 329 331 333 336 337 343 356由以上数据设计了茎叶图如图所示根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①________________________________________________________________________;②________________________________________________________________________.解析:由茎叶图可以看出甲棉花纤维的长度比较分散,乙棉花纤维的长度比较集中(大部分集中在312~337之间),还可以看出乙的平均长度应大于310,而甲的平均长度要小于310等,通过分析可以得到答案.答案:①甲棉花纤维的长度比较分散,乙棉花纤维的长度比较集中②甲棉花纤维的长度的平均值小于乙棉花纤维长度的平均值(答案不唯一)茎叶图能够展示数据的分布情况,它的茎是指中间的一列数,叶是从茎的旁边生长出来的数.用茎叶图表示数据有两个最大优点:一是原始数据没有丢失,二是便于记录和表示.课下能力提升(十二)一、填空题1.在茎叶图中比40大的数据有________个.解析:由茎叶图中知比40大的有47、48、49,共3个.答案:32.在下面的茎叶图中茎表示数据的整数部分,叶表示数据的小数部分,则比数7.5小的有________个.解析:比7.5小的有6.1,6.2,6.3,7.2,7.3,7.4,共6个.答案:63.数据123,127,131,151,157,135,129,138,147,152,134,121,142,143的茎叶图中,茎应取________.解析:在茎叶图中叶应是数据中的最后一位,从而茎就确定了.答案:12、13、14、154.在如图所示的茎叶图中落在[20,40]上的频数为________.解析:由茎叶图中给出了12个数据,其中在[20,40]上有8个.答案:85.某中学高一(1)甲、乙两同学在高一学年度的考试成绩如下:从茎叶图中可得出________同学成绩比较好.解析:由图中数据可知甲同学的成绩多在80分以上,而乙相对差一些.答案:甲二、解答题6.某中学高二(1)班甲、乙两名同学自上高中以来每次数学考试成绩情况如下(单位:分):甲的得分:81,75,91,86,89,71,65,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101;画出甲乙两人数学成绩的茎叶图,请根据茎叶图对两个人的成绩情况进行比较.解:甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图可以看出,乙同学的得分集中在98分附近,数据分布是大致对称的;甲同学的得分集中在86分附近,分数数据分布也是大致对称的,但较分散.所以乙同学发挥比较稳定,得分情况好于甲.7.50辆汽车经过某一段公路的时速记录如图所示:将其分成7组并要求:(1)列出样本的频率分布表;(2)画出频率分布直方图以及频率分布折线图;(3)根据上述结果,估计汽车时速在哪组的几率最大?解:(1)由茎叶图知,数据最大值为33,最小值为13,分为7组,组距为3,则频率分布表为:(2)频率分布直方图及频率分布折线图如图所示:(3)汽车时速在[21.5,24.5)内的几率最大,为0.22.8.茎叶图是某班在一次测验时的成绩,伪代码用来同时统计女生、男生及全班成绩的平均分.试回答下列问题:(1)在伪代码中,“k=0”的含义是什么?横线①处应填什么?(2)执行伪代码,输出S,T,A的值分别是多少?(3)请分析该班男女生的学习情况.解:(1)全班32名学生中,有15名女生,17名男生,在伪代码中,根据“S←S/15,T ←T/17”可推知,“k=1”和“k=0”分别代表男生和女生;S,T,A分别代表女生、男生及全班成绩的平均分;横线①处应填“(S+T)/32”.(2)女生、男生以及全班成绩的平均分分别为S=78,T=77,A≈77.47.(3)15名女生成绩的平均分为78,17名男生成绩的平均分为77.从中可以看出女生成绩比较集中.整体水平稍高于男生;男生中的高分段比女生高,低分段比女生多.相比较男生两极分化比较严重.。