高中数学第一章统计5.1估计总体的分布5.2估计总体的数字特征学案北师大版必修3
高中数学第一章统计估计总体的分布第一课时学案北师大版必修3
总体分布的估计(一)【目标引领】 1. 学习目标:体会分布的意义和作用,学会列频率分布表,会画频率分布条形图、直方图,会用频率分布表或分布条形图、直方图估计总体分布,并作出合理解释。
在解决问题过程中,进一步体会用样本估计整体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程,体会统计思维与确定性思维的差异。
2. 学法指导:当总体中的个体取不同数值很少时,可用频率分布表或频率分布条形图估计总体分布;当总体中的个体取不同数值较多,甚至无限时,可用频率分布表或频率分布直方图估计总体分布。
【教师在线】 1. 解析视屏:(1) 频率分布表:当总体很大或不便于获得时,可以用样本的频率分布来估计总体的频率分布。
我们把反映总体频率分布的表格为频率分布表。
(2) 编制频率分布表的步骤:① 求全距,决定组数和组距,组距=组数全距; ② 分组,区间一般左闭右开(为了遵循统计分组穷尽和互斥原则,所以统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内,即所谓“上限不在内”原则);⑶ 登记频数,计算频率,列出频率分布表。
(3) 条形图:条形图是用宽度相同的条形的高度或长度来表示数据变动的图形。
条形图可以横置也可以纵置,纵置时又称为柱形图,也就是说,当各类别放在纵轴时,称为条形图;当各类别放在横轴时,称为柱形图。
(4) 频率分布直方图:直方图是用矩形的宽度和高度来表示频率分布的图形(在平面直角坐标中,横轴表示数据分组,即各组组距,纵轴表示频率)。
(5)直方图与条形图的不同点:① 条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)是固定的;直方图是用面积表示各组频率的多少,矩形的高度表示每一组的频率除以组距,宽度则表示各组的组距,因此其高度与宽度均有意义。
② 此外,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
2.经典回放:例1 :为检测某产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件。
高中数学 第一章估计总体的数字特征导学案 北师大版必
5.2 估计总体的数字特征1.能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.2.会用样本的基本数字特征估计总体的基本数字特征;初步体会数字特征的随机性.1.样本均值和样本标准差假设通过随机抽样得到的样本为x 1,x 2,…,x n ,则样本平均数为x =__________________,样本标准差为s =________________________.2.估计总体的数字特征利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个________,但这个估计是合理的,特别是当样本容量________时,它们确实反映了总体的信息.【做一做】甲、乙两人学习成绩的茎叶图如图所示.(1)分别求出这两名同学学习成绩的平均数和标准差;(2)比较这两名同学的成绩,谈谈你的看法.方差和标准差有什么区别?剖析:方差和标准差的计算公式是:一般地,设样本为x 1,x 2,…,x n ,样本的平均数为x ,则样本方差s 2=(x 1-x )2+(x 2-x )2+…+(x n -x )2n. 样本标准差s =(x 1-x )2+(x 2-x )2+…+(x n -x )2n .由计算公式来看样本方差是样本标准差的平方,即样本标准差是样本方差的平方根,这是它们的最本质区别,它们表达的意义和作用完全相同.但是由于标准差的单位与原始数据测量单位相同,在统计中,通常用标准差来刻画数据的离散程度.题型一 利用方差分析数据【例题t/hm 2):9.4根据这组数据判断应该选择哪一种分析:从平均数和方差两个角度去考虑.反思:平均数和方差是样本的两个重要的数字特征,方差越大,表明数据越分散,相反地,方差越小,数据越集中稳定;平均数越大,表明数据的平均水平越高;平均数越小,表明数据的平均水平越低.题型二 用样本的数字特征估计总体的数字特征 【例题2】甲、乙两台机床同时加工直径为100 mm 的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):甲:99 100 98 100 100 103乙:99 100 102 99 100 100(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.分析:利用平均数与方差公式分别进行计算,并作出判断.反思:平均数描述了数据的平均水平,定量地反映了数据的集中趋势所处的水平.方差描述了一组数据围绕平均数波动的大小.1在统计中,样本的标准差可以近似地反映总体的( ).A .平均状态B .分布规律C .波动大小D .最大值和最小值2用分层抽样抽取了容量为10的样本,其平均数为5.1,方差为0.2,则总体的平均数与方差分别估计是( ).A .5.1,0.2B .0.2,0.2C .5.1,2D .都不能估计3已知一组数据按从小到大的顺序排列为-3,0,5,x,9,16,且这组数据的中位数为7,那么这组数据的众数为( ).A .0B .9C .16D .9.54已知一个样本为1,3,2,5,x ,它的平均数是3,则这个样本的标准差是________. 5试估计该校学生的日平答案:基础知识·梳理1.x 1+x 2+…+x n n 1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] 2.估计 很大【做一做】分析:首先由茎叶图读出数据,计算平均数,注意用简便方法,然后求出标准差,最后依据结果比较,可以借助于计算器.解:(1)x 甲≈87,s 甲≈12.7;x 乙≈93,s 乙≈11.2.(2)由于x 甲<x 乙,s 甲>s 乙,所以甲的学习成绩没有乙的学习成绩好,也没有乙的学习成绩稳定.典型例题·领悟【例题1】解:甲种冬小麦的平均单位面积产量x 甲=9.8+9.9+10.1+10+10.25=10, 乙种冬小麦的平均单位面积产量x 乙=9.4+10.3+10.8+9.7+9.85=10, 则甲、乙两种冬小麦平均单位面积产量相同.甲种冬小麦平均单位面积产量的方差为s 甲2=15×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02, 乙种冬小麦平均单位面积产量的方差为s 乙2=15×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244,则s 甲2=0.02<s 乙2=0.244,所以甲种小麦的平均单位面积产量比较稳定.因此选择甲种小麦进行推广.【例题2】解:(1)x 甲=99+100×3+98+1036=100, x 乙=99×2+100×3+1026=100, s 甲2=16[(99-100)2+(100-100)2×3+(98-100)2+(103-100)2]=73, s 乙2=16[(99-100)2×2+(100-100)2×3+(102-100)2]=1. (2)因为s 甲2>s 乙2,说明甲机床加工的这种零件波动比较大,因此乙机床加工的这种零件更符合要求.随堂练习·巩固 1.C 2.A3.B 由中位数定义得,5+x 2=7,∴x =9.∴众数为9,故选B. 4. 2 1+3+2+5+x 5=3,从而x =4,∴标准差为 2. 5.分析:利用这个样本来估计该校学生的日平均睡眠时间.要确定这100名学生的日平均睡眠时间,就必须计算总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.解法一:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h).故平均睡眠时间约为739100=7.39(h).解法二:求组中值与对应频率之积的和:6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h).故该校学生的日平均睡眠时间约为7.39 h.。
高中数学第一章统计5152估计总体的分布估计总体的数字特征教学案北师大版
5.1 & 5.2 估计总体的分布 估计总体的数字特征预习课本P32~39,思考并完成以下问题 (1)频率分布直方图纵轴的含义是什么?(2)频率分布直方图的制作步骤是什么?(3)如何画频率分布折线图?[新知初探]1.频率分布直方图在频率分布直方图中,每个小矩形的宽度为Δx i (分组的宽度),高为f iΔx i,小矩形的面积恰为相应的频率f i ,图中所有小矩形的面积之和等于1.2.作频率分布直方图的步骤(1)求极差.即一组数中最大值和最小值的差.(2)决定组距与组数.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.(3)将数据分组.(4)列频率分布表,各小组的频率=小组频数样本容量.(5)画频率分布直方图.[点睛] (1)一般地,样本容量越大,所分组数越多,为方便起见,组距的选择力求“取整”,当样本容量不超过120时,按照数据的多少,通常分成5~12组.(2)画频率分布直方图时,同一组数据,分组时组距要相等,每个矩形的高与频率成正比,这点应特别注意.3.频率分布折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越接近于一条光滑曲线.[小试身手]1.判断正误.(正确的打“√”,错误的打“×”)(1)频率分布直方图中每个小矩形的面积等于相应组的频数.( ) (2)频率分布直方图的面积为样本的频数.( )(3)频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比.( ) (4)从频率分布直方图中可以清楚地看出数据的内容.( ) 答案:(1)× (2)× (3)√ (4)×2.一个容量为80的样本最大值是140,最小值是51,组距为10,则可以分成( ) A .10组 B .9组 C .8组D .7组解析:选B 组数=极差/组距,本题中的极差=140-51=89,所以组数为8.9≈9. 3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,则|a -b |=( )A .hm B.mhC.h mD .h +m解析:选B频率组距=h ,故|a -b |=组距=频率h =mh. 4.一个容量为n 的样本,分成若干组,已知某组的频数和频率分别为50和0.25,则n =________.解析:由题意得50n=0.25,所以n =200.答案:200画频率分布直方图、折线图[典例] 得到如下数据(单位:cm):135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 109 124 87 131 97 102 123 104 104 128 1051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)列出频率分布表;(2)画出频率分布直方图及频率折线图;(3)估计该片经济林中底部周长小于100 cm的树占多少,底部周长不小于120 cm的树占多少.[解] (1)这组数据的最大的数为135,最小的数为80,最大的数与最小的数的差为55,可将该组数据分为11组,组距为5.频率分布表如下:底部周长分组(Δx i)/cm频数(n i)频率(f i)f i Δx i[80,85)10.010.002[85,90)20.020.004[90,95)40.040.008[95,100)140.140.028[100,105)240.240.048[105,110)150.150.030[110,115)120.120.024[115,120)90.090.018[120,125)110.110.022[125,130)60.060.012[130,135]20.020.004(2)频率分布直方图和频率折线图如下图所示.(3)从频率分布表得,样本中底部周长小于100 cm的频率为0.01+0.02+0.04+0.14=0.21,样本中底部周长不小于120 cm 的频率为0.11+0.06+0.02=0.19.所以估计该片经济林中底部周长小于100 cm 的树占21%,底部周长不小于120 cm 的树占19%.(1)分点的决定方法:若数据为整数,则减去0.5作为分点数;若数据是小数点后一位的数,则减去0.05作为分点数;依次类推.(2)画频率分布直方图中小矩形的高的方法:①小矩形的高=频率组距;②假设频数为1的小矩形的高为h ,则频数为k 的小矩形的高为kh .[活学活用]为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出的频率分布表如下:组别 频数 频率 145.5~149.5 1 0.02 149.5~153.5 4 0.08 153.5~157.5 20 0.40 157.5~161.5 15 0.30 161.5~165.5 80.16165.5~169.5m n 合计MN(1)(2)画出频率分布直方图;(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5 cm 以上的频率.解:(1)法一:N =1,n =1-(0.02+0.08+0.40+0.30+0.16)=0.04,8m =0.160.04,∴m=2,M =1+4+20+15+8+2=50.法二:M =10.02=50,m =50-(1+4+20+15+8)=2,N =1,n =m M =250=0.04.(2)作出直角坐标系,组距为4,纵轴表示f iΔx i,横轴表示身高,画出频率分布直方图如图所示.(3)由频率分布直方图可知:样本中在153.5~157.5范围内的人数最多,且身高在161.5 cm 以上的频率为0.16+0.04=0.2,由此可估计全体女生中身高在153.5~157.5范围内的人数最多,九年级学生中女生的身高在161.5 cm 以上的频率估计为0.2.频率分布直方图的应用[典例] 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少? [解] (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150.(2)由图可估计该校高一学生的达标率约为 17+15+9+32+4+17+15+9+3×100%=88%.频率分布直方图中的性质(1)图中每个小矩形的面积表示相应各组的频率,即小矩形的面积=组距×频率组距=频率.(2)在频率分布直方图中,各小矩形的面积的总和等于1.(3)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. (4)频率分布直方图中,各小矩形的面积之比等于频率之比,各小矩形的高度之比也等于频率之比.[活学活用]1.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图,估计样本数据落在区间[10,12)内的频数为( )A .18B .36C .54D .72解析:选B 样本数据落在区间[10,12)内的频率为1-(0.02×2+0.05×2+0.15×2+0.19×2)=0.18,所以样本数据落在区间[10,12)内的频数为0.18×200=36.2.为提高全省高中教师的新课程实施能力,全面推进素质教育,山东省对全省高中教师进行了全员网络远程培训.培训结束后,某市为了解参训教师的成绩情况,从本市参加培训的5 000名教师中随机抽取了100名,对他们的成绩(单位:分)进行统计分析,并画出了成绩的频率分布直方图如下.根据频率分布直方图,完成下面问题:(1)这100名教师培训成绩的中位数应在哪个小组?请说明理由;(2)如果成绩在300分以上(含300分)者为优秀学员,估计该市优秀学员的人数. 解:(1)100个数据的中位数是第50和第51两个数据的平均数,前两个小组的频率和为0.002×100×2=0.4,其频数为0.4×100=40<50,故中位数不在前两个小组;前三个小组的频率之和为(0.002+0.002+0.004)×100=0.8,频数之和为0.8×100=80>50,故中位数应在第三小组.(2)由频率分布直方图可知,优秀学员的频率为(0.001+0.001)×100=0.2,所以估计该市优秀学员的人数为5 000×0.2=1 000(人).估计总体的数字特征[典例] 为了检验产品质量,质量检验员从两台机床的产品中各抽出4件进行测量,结果如下:机床甲 10 9.8 10 10.2 机床乙10.1109.910如果你是质量检验员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求?[解] (1)先计算平均直径:x 甲=14×(10+9.8+10+10.2)=10, x 乙=14×(10.1+10+9.9+10)=10.由于x 甲=x 乙,因此仅由平均直径不能反映两台机床生产的零件的质量优劣. (2)再计算方差:s 2甲=14×[(10-10)2+(9.8-10)2+(10-10)2+(10.2-10)2]=0.02,s 2乙=14×[(10.1-10)2+(10-10)2+(9.9-10)2+(10-10)2]=0.005.s 2甲>s 2乙,这说明乙机床生产出的零件直径波动小,因此从产品质量稳定性的角度考虑,乙机床生产的零件质量更符合要求.样本的平均数和方差是两个重要的数字特征.在应用平均数和方差解决实际问题时,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由方差研究其与平均数的偏离程度.[活学活用]为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100支日光灯在必须换掉前的使用天数如下表:天数151~181~211~241~271~301~331~361~180 210 240 270 300 330 360 390 日光灯数111182025167 2(2)若定期更换,可选择多长时间统一更换合适?解:(1)各组的平均值分别为165.5,195.5,225.5,255.5,285.5,315.5,345.5,375.5,由此可估计这种日光灯的平均使用寿命为165.5×1%+195.5×11%+225.5×18%+255.5×20%+285.5×25%+315.5×16%+345.5×7%+375.5×2%=268.4(天).(2)s2=1100[1×(165.5-268.4)2+11×(195.5-268.4)2+18×(225.5-268.4)2+20×(255.5-268.4)2+25×(285.5-268.4)2+16×(315.5-268.4)2+7×(345.5-268.4)2+2×(375.5-268.4)2]=2 128.59,故标准差s= 2 128.59≈46(天).由上可知这种日光灯的平均使用寿命为268.4天,标准差约为46天,故可在222天到314天内统一更换较合适.[层级一学业水平达标]1.从一堆苹果中任取10个,称得它们的质量如下(单位:克):125 120 122 105 130 114 116 95 120 134则样本数据落在[114.5,124.5)内的频率为( )A.0.2 B.0.3C.0.4 D.0.5解析:选C 依题意,样本数据落在[114.5,124.5)内的频数为4,故对应频率为4÷10=0.4.2.下列说法中错误的是( )①用样本的频率分布估计总体频率分布时,样本容量越大,所分的组数越多,估计越精确;②一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n 的值为240;③频率分布直方图中,小矩形的高等于该组的频率;④将频率分布直方图中小矩形上面一边的一个端点顺次连接起来,就可以得到频率折线图.A.①③B.②③④C.②③④D.①②③④解析:选C 大样本往往更接近于总体,所以①正确;②中n =40÷0.125=320; ③中频率分布直方图中,小矩形的高等于该小组的频率/组距;④中应将频率分布直方图中各小矩形上端的中点顺次连接起来得到频率折线图. 3.在样本频率分布直方图中,某个小矩形的面积是其他小矩形面积之和的14,已知样本容量是80,则该组的频数为( )A .20B .16C .30D .35解析:选B 设该组的频数为x ,则其他组的频数之和为4x ,由样本容量是80,得x +4x =80,解得x =16,即该组的频数为16.4.某校为了解高一学生寒假期间的阅读情况,抽查并统计了100名同学的某一周阅读时间,绘制了频率分布直方图(如图所示),那么这100名学生中阅读时间在[4,8)小时内的人数为________.解析:根据频率分布直方图,可得阅读时间在[4,8)小时内的频率为(0.12+0.15)×2=0.54,所以这100名学生中阅读时间在[4,8)小时内的人数为100×0.54=54.答案:54[层级二 应试能力达标]1.已知样本:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11,那么频率为0.4的范围是( )A .5.5~7.5B .7.5~9.5C .9.5~11.5D .11.5~13.5解析:选C 只要列出频率分布表,依次对照就可以找出答案.频率分布表如下:分组 频数 频率 5.5~7.5 2 0.1 7.5~9.5 6 0.3 9.5~11.5 8 0.4 11.5~13.5 4 0.2 合计2012.对某种电子元件使用寿命跟踪调查得如图所示的样本频率分布直方图,由图可知一批电子元件中寿命在100~300小时的电子元件的数量与寿命在300~600小时的电子元件的数量比是( )A.12B.13C.14D.16解析:选C 因为“频率之比=数量之比”,所以所求为⎝⎛⎭⎪⎫12 000+32 000∶⎝ ⎛⎭⎪⎫1400+1250+32 000=1∶4,故选C. 3.样本容量为100的频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在[6,10)内的频数为a ,样本数据落在[2,10)内的频率为b ,则a ,b 分别是( )A .32,0.4B .8,0.1C .32,0.1D .8,0.4解析:选A 样本数据落在[6,10)内的频率为0.08×4=0.32,则a =100×0.32=32;由于样本数据落在[2,6)内的频率为0.02×4=0.08,则样本数据落在[2,10)内的频率b =0.08+0.32=0.4.4.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A.588 B.480C.450 D.120解析:选B 成绩在[40,60)的频率p1=(0.005+0.015)×10=0.2,成绩不少于60分的频率p2=1-0.2=0.8,所以成绩不少于60分的学生人数约为600×0.8=480.5.《中华人民共和国道路交通安全法》规定;车辆驾驶员血液酒精浓度在20~80 mg/100 mL(不含80)之间,属于酒后驾车;血液酒精浓度在80 mg/100 mL(含80)以上时,属醉酒驾车.据《法制晚报》报道,某年2月15日至2月28日,全国查处酒后驾车和醉酒驾车共28 800人,如图是对这28 800人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为________.解析:(0.01×10+0.005×10)×28 800=4 320.答案:4 3206.下图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.解析:最左边两个小矩形的面积之和为0.10×1+0.12×1=0.22,城市总数为11÷0.22=50,最右边小矩形的面积为0.18×1=0.18,故样本中平均气温不低于25.5 ℃的城市个数为50×0.18=9.答案:97.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.解析:因为频率分布直方图中的各个小矩形的面积之和为1,所以有10×(0.005+0.035+a +0.020+0.010)=1,解得a =0.030.由频率分布直方图可知在[120,130),[130,140),[140,150]三组内的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为100×10×0.010=10,所以从身高在[140,150]内抽取的学生人数为1860×10=3.答案:38.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高? 解:(1)依题意知第三组的频率为 42+3+4+6+4+1=15.又∵第三组频数为12, ∴本次活动的参评作品数为1215=60件. (2)由频率分布直方图,可以看出第四组上交的作品数量最多,共有60×62+3+4+6+4+1=18件.(3)第四组获奖率是1018=59.第六组上交的作品数为60×12+3+4+6+4+1=3件.∴第六组的获奖率为23,显然第六组的获奖率较高.9.为增强市民节能环保意识,某市向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:分组(单位:岁)频数 频率 [20,25) 5 0.05 [25,30) ① 0.20 [30,35) 35 ② [35,40) 30 0.30 [40,45] 10 0.10 合计1001.00(1)(2)补全频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在[30,35)的人数.解:(1)设年龄在[25,30)内的频数为x ,年龄在[30,35)的频率为y , 法一:根据题意可得x100=0.20,35100=y , 解得x =20,y =0.35.法二:由题意得5+x +35+30+10=100, 0.05+0.20+y +0.30+0.10=1, 得x =20,y =0.35.故①②位置应分别填20,0.35.(2)由频率分布表知年龄在[25,30)内的频率是0.20,组距是5,所以频率组距=0.205=0.04.补全频率分布直方图,如下图所示:根据频率分布直方图估计这500名志愿者中年龄在[30,35)的人数为500×0.35=175.。
高中数学 第一章 统计 1.5 用样本估计总体 1.5.2 估计总体的数字特征教案 北师大版必修3
1.5.2估计总体的数字特征本节教材分析一、三维目标1、知识与技能(1)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.(2)会用样本的基本数字特征估计总体的基本数字特征.(3)形成对数据处理过程进行初步评价的意识.2、过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.3、情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.二、教学重点:用样本平均数和标准差估计总体的平均数与标准差.三、教学难点:能应用相关知识解决简单的实际问题.四、教学建议教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计.教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题, 通过小资料栏目“估计二战期间德国坦克的总数”,让学生进一步体会分布的数字特征在实际中的应用.新课导入设计导入一在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征.导入二用随机抽样的方法获得样本,我们就会得到一组数据,统计思想的本质就是用样本估计总体.用样本估计总体,一般有两种方法:一是用样本的频率分布估计总体分布;二是用样本的数字特征估计总体的数字特征.第一种方法我们已经学习了啦,本节我们继续学习第二种方法.教学流程:↓1.创设情景,揭示课题上一节我们学习了用图、表组织样本数据,并且学习了如何通过图、表提供的信息,用样本的频率分布估计总体的分布. 在日常生活中,我们往往并不需要了解总体的分布形态,而是关心总体的某一数字特征,例如:居民月均用水量问题,我们关心的是数字,而不是总体的分布形态.因此我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征(板出课题).2.探究:(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?我们初中时学习众数、中位数、平均数等数字特征.我们共同回忆一下?什么是众数、中位数、平均数?众数—一一组数中出现次数最多的数.中位数——将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数——将所有数相加再除以这组数的个数,所得到得数.热身训练:求下列各组数据的众数、中位数、平均数 (1)1 ,2,3,3,3,4,6,7,7,8,8,8 (2)1 ,2,3,3,3,4,6,7,8,9,9 答案:(1) 众数是:3和8 中位数是:5 平均数是:5(2) 众数是:3 中位数是:4 平均数是:5 例如,在上一节抽样调查的100位居民的月均用水量的数据中,我们如何得知这一组样本数据的众数、中位数和平均数 ? 众 数=2.3(t )、中位数=2.0(t )、平均数=1.973(t )那么从频率分布直方图你能得到这些数据的众数,中位数,平均数吗? 3. 如何在频率直方图中估计众数、中位数、平均数呢?1) 如何从频率分布直方图中估计众数?学生交流讨论,回答从频率分布直方图可以看出:月均用水量的众数是 2.25t (最高的矩形的中点),它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少. 思考1:请大家看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?0.10.20.30.4月均用水量/t表2-1 100为居民的月均用水量(单位:t)请学生思考交流,回答这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.显然通过频率分布直方图的估计精度较低,其估计结果与数据分组有关,在不能得到样本数据,只能得到频率分布直方图的情况下,也可以估计总体的特征.归纳总结:因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间[2,2.5)的小长方形的面积最大,即这组的频率是最大的,也就是说月均用水量在区间[2,2.5)内的居民最多,即众数就是在区间[2,2.5)内. 众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标.2) 如何从频率分布直方图估计中位数?学生交流讨论,回答分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等. 由此可以估计中位数的值. 设中位数为x ,则5.05.0)2(22.015.008.004.0=⨯-++++x求出02.2=x在上图中,红色虚线代表居民月平均用水量的中位数的估计值.其左边的直方图的面积是2.20.61.81.21.01.52.02.22.52.82.4 0.8 1.7 1.0 1.0 1.6 2.1 2.3 2.6 2.5 2.4 0.5 1.5 1.2 1.4 1.7 2.1 2.4 2.7 2.6 2.3 0.9 1.6 1.3 1.3 1.8 2.3 2.3 2.8 2.5 2.0 0.7 1.8 1.4 1.3 1.9 2.4 2.4 2.93.04.3 0.8 1.9 3.5 1.4 1.8 2.3 2.4 2.9 3.2 4.1 0.6 1.7 3.6 1.3 1.7 2.2 2.3 2.8 3.3 3.8 0.5 1.5 3.7 1.2 1.6 2.1 2.3 2.7 3.2 0.4 0.3 0.4 0.2 1.2 1.5 2.2 2.2 2.6 3.4 1.6 1.9 1.8 1.6 1.0 1.5 2.0 2.0 2.5 3.1 观察频率分布直方图估计中位数频率 00.10.20.30.40.50.6月均用水量/t50个单位.右边的直方图的面积也是50个单位.由此可以估计出中位数的值为2.02. 思考2:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(样本数据的频率分布直方图把原始的一些数据给遗失了)3) 如何从频率分布直方图中估计平均数?学生交流讨论,回答平均数等于是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.以上图为例来讲解求解过程;02.202.025.404.075.306.025.314.075.225 .025.222.075.115.025.108.075.004.025.0=⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯平均数为2.02由此居民的月用水量的平均数是2.02t.大部分居民的月均用水量在中部(2.02t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考3:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?让学生讨论,并举例优点:对极端数据不敏感的方法能够有效地预防错误数据的影响.对极端值不敏感有利的例子:如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,如:考察表中2-1中的数据如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能过有效地预防错误数据的影响.用抗极端数据强的中位数表示数据的中心值更准确.缺点:(1)出现错误的数据也不知道;(2)对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作.这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业.4)对众数,中位数,平均数估计总体数字特征的认识(1)样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表示样本数据中的很少一部分信息.(2) 中位数不受少数几个极端值的影响, 容易计算,它仅利用了数据排在中间的数据的信息.(3)样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.探究:“用数据说话”这是我们经常可以听到的一句话.但是数据有时也会被利用,从而产生误导.例如一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多,尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?以员工平均工资收入水平去描述他们单位的收入情况.这是不合理的,因为这些员工当中,少数经理层次的收入与大多数一般员工收入的差别比较大,平均数受数据中的极端值的影响大,所以平均数不能反映该单位员工的收入水平.这个老板的话有误导与蒙骗行 例题例:某公司的33名职工的月工资(单位:元)如下表:(1) 求该公司职工月工资的平均数、中位数、众数.(2) 若董事长、副董事长的工资分别从5500元、5000元提升到30000元、20000元,那么公司职工新的平均数、中位数和众数又是什么?(3) 你认为哪个统计量更能反映这个公司员工的工资水平? 解析:(1)公司职工月工资的平均数为:2091336900033201500320005250030002350050005500≈=⨯+⨯+⨯++⨯++=x(元) 若把所有数据从大到小排序,则得到:中位数是1500元,众数是1500元.(2)若董事长、副董事长的工资提升后,职工月工资的平均数为:3288331085003320150032000525003000235002000030000≈=⨯+⨯+⨯++⨯++=x (元)中位数是1500元,众位是1500元.(3)在这个问题中,中位数和众数都能反映出这个公司员工的工资水平,因为公司少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平. 巩固练习假设你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元人民币,另外25个项目的投资是20~100万元。
2021学年高中数学第一章统计1.5.1估计总体的分布学案含解析北师大版必修3.doc
§5用样本估计总体5.1估计总体的分布知识点一频率分布直方图[填一填]1.极差的概念极差是一组数据的最大值与最小值的差,它反映了一组数据的差值,极差又叫全距.2.频数、频率的概念将一批数据按要求分为若干组,对落在各个小组内数据的个数进行累计,这个累计数叫作各个小组的频数,各个小组的频数除以样本容量,即得该小组的频率.3.频率分布直方图在频率分布直方图中,纵轴表示频率与组距的比值,各小长方形的面积等于落在各小组内的频率,所有长方形面积之和等于1.[答一答]1.将数据的样本进行分组的目的是什么?提示:从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接看出样本所包含的信息.如果把这些数据形成频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况.用样本估计总体,是研究统计问题的一种基本思想方法,而对于总体的分布,我们总是用样本的频率分布对它进行估计.知识点二频率分布折线图[填一填](1)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就得到一条折线,我们称之为频率折线图.(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的概率.也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确.(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.[答一答]2.绘制频率分布折线图的作用是什么?提示:频率分布折线图也是用一个单位长度表示一定的数量.但是,它是根据数量的多少在图中描出各个点,然后把各点用线段顺次连接成的折线.因此,它不但可以表示出数量的多少,而且能够以折线的起伏,清楚而直观地表示出数量增减的变化情况.几种表示频率分布的方法的优缺点1.频率分布表反映具体数据在各个不同区间的取值频率,但不够直观、形象,对分析数据分布的总体态势不太方便.2.频率分布直方图能够非常直观地表明数据分布的形状,一般是中间高、两端低、左右对称的“峰”状结构.但是从直方图本身得不到具体的数据内容,也就是说,把数据表示成直方图后,原始数据不能在图中表示出来.3.频率分布折线图的优点是它能够反映数据的变化趋势.如果样本容量不断增加,分组的组距不断缩小,那么折线图就趋近于总体分布的密度曲线.4.列频率分布直方图的步骤:(1)计算数据中最大值和最小值的差.知道了极差就知道了这组数据的变动范围有多大;(2)决定组数和组距.组距是指每个小组的两个端点之间的距离;(3)决定分点;(4)列频率分布表;(5)绘制频率分布直方图.5.列频率分布直方图的注意事项:(1)组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).(2)分点数的决定方法是:若数据为整数,则分点数据减去0.5;若数据是小数点后一位的数,则分点减去0.05,以此类推.类型一频率分布表和频率分布直方图【例1】从某中学高三年级随机抽取100名男生的身高如下:(单位:cm)根据上面的数据列出频率分布表,画出频率分布直方图,估计这所学校高三年级男生身高在(165,175]cm之间的比例.【思路探究】可以先制作频率分布表,然后制作频率分布直方图,最后由图形分析.【解】频率分布表如下所示:。
高中数学 第一章 统计 估计总体的分布教案 北师大版必修3 教案
§1.5估计总体的分布(一)一、教学目标:1、知识与技能:(1)通过实例体会分布的意义和作用。
(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
2、过程与方法:通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
3、情感态度与价值观:通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
二、重点与难点:重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
难点:能通过样本的频率分布估计总体的分布。
三、教学方法:探究归纳,思考交流四、教学设想(一)、创设情境在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50;乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板出课题)。
(二)、探究新知〖探究〗:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a 的部分按议价收费。
如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。
高中数学 第一章 统计 1.5.2 估计总体的数字特征学案(含解析)北师大版必修3-北师大版高一必修
5.2 估计总体的数字特征知识点平均数与方差、标准差[填一填]1.平均数如果有n个数x1,x2,…,x n,那么x=x1+x2+…+x nn,叫作这n个数的平均数.2.样本的方差与标准差(1)数据的离散程度可以用极差、方差或标准差来描述.样本方差描述了一组数据围绕平均数波动的大小.一般地,设样本的元素为x1,x2,…,x n,样本的平均数为x,定义s2=(x1-x)2+(x2-x)2+…+(x n-x)2n,s2表示样本方差.(2)为了得到以样本数据的单位表示的波动幅度,通常要求出样本方差的算术平方根.s=(x1-x)2+(x2-x)2+…+(x n-x)2n,s表示样本的标准差.(3)计算样本数据x1,x2,…,x n的标准差的算法步骤为:S1算出样本数据的平均数x.S2算出x i-x,其中i=1,2,…,n;S3算出x i-x的平方,其中i=1,2,…,n;S4算出样本方差;S5算出样本标准差.[答一答]平均数与标准差在估计总体时有何差异?提示:平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们对总体作出片面的判断,样本中的极端值对平均数的影响较大,所以平均数有时难以反映样本数据的实际状态.当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度,就由标准差来衡量.标准差反映了各个样本数据聚集于样本平均数周围的程度.标准差越小,表明各个样本数据在样本平均数周围越集中;反之,标准差越大,表明各个样本数据在样本平均数的两边越分散.(1)从数字特征上描述一组数据的情况平均数、众数、中位数描述其集中趋势,方差、极差和标准差描述其波动大小,也可以说方差、标准差和极差反映各个数据与其平均数的离散程度.(2)方差和标准差的运用一组数据的方差或标准差越大,说明这组数据波动越大,方差的单位是原数据的单位的平方,标准差的单位与原单位相同.类型一方差、标准差的计算【例1】某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679求以上两组数据的方差及标准差.【思路探究】 解答本题的关键是掌握方差、标准差的计算公式和求解步骤. 【解】 x甲=6+7×3+85=7, x 乙=6×2+7×2+95=7,s 2甲=15[(6-7)2+3×(7-7)2+(8-7)2]=25=0.4, s 2乙=15[2×(6-7)2+2×(7-7)2+(9-7)2]=65=1.2, 所以它们的标准差分别为:105,305. 规律方法 (1)方差的计算①基本公式s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].②简化计算公式:s 2=1n [(x 21+x 22+…+x 2n )-x 2],或写成s 2=1n (x 21+x 22+…+x 2n )-x 2,即方差等于原数据平方的平均数减去平均数的平方.(2)平均数、方差的性质①如果x 1,x 2,x 3,…,x n 的平均数是x ,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x +a .②数据x 1,x 2,…,x n 与数据x 1+a ,x 2+a ,…,x n +a 的方差相等. ③如果x 1,x 2,…,x n 的方差为s 2, 那么ax 1,ax 2,…,ax n 的方差为a 2s 2.本例中的各数据都增加1,试计算以上两组数据的平均数与方差. 解:x甲=7+8+8+9+85=8,x乙=7+8+7+8+105=8,s2甲=15[(7-8)2+(8-8)2+(8-8)2+(9-8)2+(8-8)2]=0.4.s2乙=15[(7-8)2+(8-8)2+(7-8)2+(8-8)2+(10-8)2]=1.2.类型二从茎叶图表示的数据估计总体【例2】从甲、乙两个品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),由抽测结果设计了如图所示的茎叶图.根据茎叶图,将甲、乙两个品种的棉花的纤维长度做比较,写出两个统计结论.【思路探究】分析出样本的分布,来估计总体的分布,分析出样本的数字特征,来估计总体的数字特征,从而达到比较两个总体的目的.【解】从不同的角度分析,可得如下结论:①乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度).②甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中,或甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大).③甲品种棉花的纤维长度的中位数为307 mm ,乙品种棉花的纤维长度的中位数为318 mm.④乙品种棉花的纤维长度基本上是对称的,而且大多集中在平均数附近.甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,分布较均匀.注:答案不唯一,写出两个即可.规律方法 一般来讲,总体所包含的个体数往往是很多的,总体的数字特征,尤其是平均数与标准差很难求出,通常的做法是用样本的平均数与标准差去估计总体的平均数与标准差,从而反映总体的平均水平和稳定性.这与前面用样本的频率分布来近似地代替总体分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.若该日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中优秀工人的人数为4.解析:因为样本均值为17+19+20+21+25+306=22,所以样本中优秀工人占的比例为26=13,而12×13=4,故推断该车间12名工人中有4名优秀工人.类型三平均数、方差的应用【例3】两台机床同时生产直径(单位:cm)为10的圆形截面零件,为了检验产品质量,质量检验员从两台机床的产品中各抽出4件进行测量,结果如下:机床甲109.81010.2机床乙10.1109.910如果你是质量检验员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求?【思路探究】在刻画样本数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.【解】(1)先计算平均直径:x甲=14×(10+9.8+10+10.2)=10,x乙=14×(10.1+10+9.9+10)=10.由于x甲=x乙,因此仅由平均直径不能反映两台机床生产的零件的质量优劣.(2)再计算方差:s2甲=14×[(10-10)2+(9.8-10)2+(10-10)2+(10.2-10)2]=0.02,s2乙=14×[(10.1-10)2+(10-10)2+(9.9-10)2+(10-10)2]=0.005.s2甲>s2乙,这说明乙机床生产出的零件直径波动小,因此从产品质量稳定性的角度考虑,乙机床生产的零件质量更符合要求.规律方法样本的平均数和方差是两个重要的数字特征.在应用平均数和方差解决实际问题时,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由方差研究其与平均数的偏离程度.甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2)品种第一年第二年第三年第四年第五年甲 9.8 9.9 10.1 10 10.2 乙9.410.310.89.79.8根据这组数据判断应该选择哪一种小麦进行推广. 解:甲种冬小麦的平均单位面积产量 x 甲=9.8+9.9+10.1+10+10.25=10,乙种冬小麦的平均单位面积产量x 乙=9.4+10.3+10.8+9.7+9.85=10,则甲、乙两种冬小麦平均单位面积产量相同.甲种冬小麦平均单位面积产量的方差为s 2甲=15×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02,乙种冬小麦平均单位面积产量的方差为s 2乙=15×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244,则s 2甲=0.02<s 2乙=0.244,所以甲种冬小麦的平均单位面积产量比较稳定,因此选择甲种冬小麦进行推广.——易错警示—— 因不理解相关联的两个样 本的数据特征而出错【例4】 一组数据的方差是s 2,将这组数据中的每一个数都乘以2,得到一组新数据,其方差是( )A.12s 2 B .2s 2 C .4s 2 D .s 2【错解】 B【错解分析】 因为本题中新数据的每一个数都是原数据的2倍,因而盲目地选B 得到方差也是原方差的2倍.【正解】 设一组数据x 1,x 2,…,x n , 则s 2=(x 1-x )2+(x 2-x )2+…+(x n -x )2n ,将每一个数乘以2,则x ′=2x .所以s ′2=(2x 1-2x )2+(2x 2-2x )2+…+(2x n -2x )2n=4n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]=4s 2. 故答案选C. 【答案】 C【纠错心得】 若新样本中的每一个数据是原样本中每个数据的2倍,则新样本的平均数是原样本平均数的2倍,方差为原来的4倍,标准差为原来的2倍.如果数据x 1,x 2,x 3,…,x n 的平均数为10,方差为2,则数据7x 1-2,7x 2-2,7x 3-2,…,7x n -2的平均数为68,方差为98.解析:平均数=7×10-2=68;方差=72×2=98,故答案为68,98.一、选择题1.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8;全年比赛进球个数的标准差为0.3.下列说法:①甲队的技术比乙队好;②乙队发挥比甲队稳定;③乙队几乎每场都进球;④甲队的表现时好时坏.其中正确的个数有( D )A .1个B .2个C .3个D .4个解析:四种说法都正确,甲队的平均进球数多于乙队,故第一句正确;乙队标准差较小,说明技术水平稳定;甲队平均进球数是3.2,但其标准差却是3,离散程度较大,由此可判断甲队表现不稳定;乙队平均进球数是1.8,标准差只有0.3,每场的进球数相差不多,可见乙队的确很少不进球.2.期中考试以后,班长算出了全班40人数学成绩的平均分数为M ,如果把M 当成一个同学的分数,与原来的40个分数一起算出这41个分数的平均值为N ,那么MN 为( B )A.4041 B .1 C.4140D .2 解析:由于原来40个人的成绩的平均分当成一个同学的分数,那么这41个分数的平均值仍然为M ,即M =N .故应选B.二、填空题3.某校高中年级开设了丰富多彩的校本课程,甲、乙两班各随机抽取了5名学生的学分,用茎叶图表示(如下图).s 1,s 2分别表示甲、乙两班各自5名学生学分的标准差,则s 1<s 2.(填“>”“<”或“=”)解析:由茎叶图可计算得x甲=14,x 乙=14,则s 1=15(62+32+02+12+82)=22, s 2=15(82+72+42+102+92)=62, ∴s 1<s 2.本题考查统计初步及茎叶图的信息处理问题,可以通过图中数据的对称性从直观上进行观察,也可以通过正确的计算进行比较.三、解答题4.甲、乙两人学习成绩的茎叶图如图所示.(1)分别求出这两名同学学习成绩的平均数和标准差;(2)比较这两名同学的成绩,谈谈你的看法.解:(1)x甲≈87,s甲≈12.7;x乙≈93,s乙≈11.2.(2)由于x甲<x乙,s甲>s乙,所以甲的学习成绩没有乙的学习成绩好,也没有乙的学习成绩稳定.。
高中数学第一章统计1_5_1估计总体的分布教案北师大版必修3
5.1 估计总体的分布整体设计教学分析教科书通过问题的探究,使学生学会列频率分布表、画频率分布直方图、频率分布折线图.教科书在这里主要介绍有关频率分布的列表和画图的方法,而关于频率分布的随机性和规律性方面则给教师留下了较大的发挥空间.教师可以通过初中有关随机事件的知识,也可以利用计算机多媒体技术,引导学生进一步体会由样本确定的频率分布表和频率分布直方图的随机性;通过初中有关频率与概率之间的关系,了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想.由于可以用样本频率分布直方图估计总体分布,因此可以用样本频率分布特征来估计相应的总体分布特征,这就提供了估计总体特征的另一种途径,其意义在于:在没有原始数据而仅有频率分布的情况下,此方法可以估计总体的分布特征.三维目标1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图,理解数形结合的数学思想和逻辑推理的数学方法.3.通过对样本分析和总体估计的过程,感受数学对实际生活的需要,通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.重点难点教学重点:会列频率分布表,画频率分布直方图和频率折线图.教学难点:能通过样本的频率分布估计总体的分布.课时安排1课时教学过程导入新课思路1.在NBA的2006赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49,50;乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29,33.请问从上面的数据中你能否看出甲、乙两名运动员,在2006赛季中,哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板书课题).思路2.如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温.7月25日至8月10日41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.8 32.58月8日至8月24日28.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.1 32.8 29.8 25.6 24.7 30.0 30.1 29.5 30.3 32.8怎样通过上表中的数据,分析比较两时间段内的高温(≥33 ℃)状况?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.思路3.讨论:我们要了解我校学生每月零花钱的情况, 应该怎样进行抽样?提问:学习了哪些抽样方法?一般在什么时候选取什么样的抽样方法呢?讨论:通过抽样方法收集数据的目的是什么?(从中寻找所包含的信息,用样本去估计总体)指出两种估计手段:一是用样本的频率分布估计总体的分布,二是用样本的数字特征(平均数、标准差等)估计总体的数字特征.这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.推进新课新知探究提出问题(1)我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)(2)什么是频率分布?(3)频率分布直方图的特征是什么?(4)什么是频率分布折线图?讨论结果:(1)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格来改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚地看到整个样本数据的频率分布情况. (2)频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图来反映样本的频率分布.(3)频率分布直方图的特征:①从频率分布直方图可以清楚地看出数据分布的总体趋势.②从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断.(4)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.应用示例思路1例 1 1895年,在伦敦有106块男性头盖骨被挖掘出土.经考证,头盖骨的主人死于1665—1666年之间的大瘟疫.人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:mm):146 141 139 140 145 141 142 131 142 140 144 140138 139 147 139 141 137 141 132 140 140 141 143134 146 134 142 133 149 140 140 143 143 149 136141 143 143 141 138 136 138 144 136 145 143 137142 146 140 148 140 140 139 139 144 138 146 153148 152 143 140 141 145 148 139 136 141 140 139158 135 132 148 142 145 145 121 129 143 148 138149 146 141 142 144 137 153 148 144 138 150 148138 145 145 142 143 143 148 141 145 141请你估计在1665—1666年之间,英国男性头盖骨宽度的分布情况.解:这里,如果把总体看作是1665—1666年之间的英国男性头盖骨的宽度,那么我们就是要通过上面挖掘出土得到的样本信息,来估计总体的分布情况.但从上面的数据很难直接估计出总体的分布情况,为此,我们可以先将以上数据按每个数据出现的频数和频率汇成下表: 宽度/mm 频数 频率 宽度/mm 频数 频率 121 1 0.009 142 7 0.066129 1 0.009 143 10 0.094131 1 0.009 144 5 0.047132 2 0.019 145 8 0.075133 1 0.009 146 5 0.047134 2 0.019 147 1 0.009135 1 0.009 148 8 0.075136 4 0.038 149 3 0.028137 3 0.028 150 1 0.009138 7 0.066 152 2 0.019139 7 0.066 153 1 0.009140 12 0.113 158 1 0.009141 12 0.113从表格中,我们就能估计出总体大致的分布情况了,如在1665—1666年之间,英国男性头盖骨宽度主要在140—150 mm 之间,130 mm 以下以及150 mm 以上所占的比率相对较小等.但是,这些关于分布情况的描述仍不够形象,为了得到更为直观的信息,我们可以再将表中的数据按照下面的方式分组:宽度分组(Δx i ) 频数(n i ) 频率(f i )120—125 mm 1 0.009 0.001 8125—130 mm 1 0.009 0.001 8130—135 mm 6 0.057 0.011 4135—140 mm 22 0.208 0.041 6140—145 mm 46 0.434 0.086 8145—150 mm 25 0.236 0.047 2150—155 mm 4 0.038 0.007 6155—160 mm 1 0.009 0.001 8先画频数分布直方图(图1).进一步,我们还可以将图1中纵坐标的频数换成ii x f ,便可以得到图2.图1图2点评:当样本量较大时,样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的概率.因此,我们就可以用样本的频率分布直方图来估计总体在任意区间内取值的频率,也即总体的分布情况.变式训练1.有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.(1)列出学生参加运动队的频率分布表.(2)画出频率分布条形图.解:(1)参加足球队记为1,参加篮球队记为2,参加排球队记为3,参加乒乓球队记为4,得频率分布表如下:试验结果频数频率参加足球队(记为1)30 0.30参加篮球队(记为2)27 0.27参加排球队(记为3)23 0.23参加乒乓球队(记为4)20 0.20合计100 1.00(2)由上表可知频率分布条形图如图3:图32.为了了解中学生的身体发育情况,对某中学17岁的60名女生的身高进行了测量,结果如下(单位cm):154 159 166 169 159 156 166 162 158156 166 160 164 160 157 151 157 161158 153 158 164 158 163 158 153 157162 159 154 165 166 157 151 146 151160 165 158 163 163 162 161 154 165162 159 157 159 149 164 168 159 153列出样本的频率分布表;绘出频率分布直方图.解:列频率分布表如下:宽度分组(Δx i) 个数累计频数(n i) 频率(f i) 145.5—148.5 1 0.017148.5—151.5 3 0.050151.5—154.5 6 0.100154.5—157.5 8 0.133157.5—160.5 18 0.300160.5—163.5 11 0.183163.5—166.5 10 0.167166.5—169.5 3 0.050 合计60 1.000 根据上述数据绘制频率分布直方图如图4:图4以上两种情况的不同之处在于,前者的频率分布表列出的是几个不同数值的频率,相应的条形图是用其高度表示取各个值的频率;后者的频率分布表列出的是在不同区间内取值的频率,相应的直方图是用图表面积的大小来表示在各个区间内取值的频率.我们在处理一个数理问题时可以采用样本的频率分布估计总体分布的方法,这是因为,频率分布随着样本容量的增大更加接近于总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布的直方图就演变成一条光滑的曲线——总体密度曲线.这条曲线是客观存在的,但是我们却很难将它准确地画出,我们只能用样本的频率分布去对它进行估计.基于频率分布与相应的总体分布有这种关系,再加上我们通常并不知道一个总体的分布,我们往往是从一个总体中抽取一个样本,用样本的频率去估计相应的总体分布.一般说来,样本的容量越大,这种估计就越精确.思路2例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm). 区间界限/cm 122—126 126—130 130—134 134—138 138—142区间界限/cm 142—146 146—150 150—154 154—158 人数20 11 6 5(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:宽度分组(Δx i) 频数(n i) 频率(f i) 122—126 5 0.04126—130 8 0.07130—134 10 0.08134—138 22 0.18138—142 33 0.28142—146 20 0.17146—150 11 0.09150—154 6 0.05154—158 5 0.04合计120 1(2)其频率分布直方图如图5:图5(3)由样本频率分布表可知身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.变式训练从某校高一年级的1 002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162 160 170 168 164 174 170 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166 作出该样本的频率分布表,并估计身高不小于170(cm)的同学所占的百分率. 解:频率分布表如下:宽度分组(Δx i ) 频数累计 频数(n i ) 频率(f i ) 150.5—153.5 4 4 0.04153.5—156.5 12 8 0.08156.5—159.5 20 8 0.08159.5—162.5 31 11 0.11162.5—165.5 53 22 0.22165.5—168.5 72 19 0.19168.5—171.5 86 14 0.14171.5—174.5 93 7 0.07174.5—177.5 97 4 0.04177.5—180.5 100 3 0.03合计 100 1根据频率分布表可以估计,估计身高不小于170(cm)的同学所占的百分率为(0.14×5.1685.1711705.171--+0.07+0.04+0.03)×100%=21%. 例 2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图6),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.图6分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为391517424+++++=0.08; 又因为频率=样本容量第二小组频数,所以样本容量=08.012=第二小组频率第二小组频数=150. (2)由图可估计该学校高一学生的达标率约为39151742391517++++++++×100%=88%. (3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组.知能训练1.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5], 9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的()A.91%B.92%C.95%D.30%答案:A2.一个容量为20的样本数据,数据的分组及各组的频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2.则样本在区间(-∞,50)上的频率为()A.0.5B.0.7答案:B3.一个高中研究性学习小组对本地区2000年至2002年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如图7),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭___________万盒.快餐公司个数情况图快餐公司盒饭年销售量的平均数情况图图7答案:85拓展提升为了了解一大片经济林生长情况,随机测量其中的100株的底部周长,得到如下数据表(单位:cm).135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 109 124 87 131 97 102 123 104 104 128 105 123 111 103 105 92 114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108 123 119 98 121 101 113 102 103 104 108 (1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100 cm的树木约占多少?周长不小于120 cm的树木约占多少?解:(1)这组数据的最大值为135,最小值为80, 极差为55,可将其分为11组,组距为5. 频率分布表如下:宽度分组(Δx i) 频数(n i) 频率(f i)80—85 1 0.01 0.00285—90 2 0.02 0.00490—95 4 0.04 0.00895—100 14 0.14 0.028100—105 24 0.24 0.048105—110 15 0.15 0.030110—115 12 0.12 0.024115—120 9 0.09 0.018120—125 11 0.11 0.022125—130 6 0.06 0.012130—135 2 0.02 0.004合计100 1 0.2(2)频率分布直方图如图8:图8(3)从频率分布表得,样本中小于100的频率为0.01+0.02+0.04+0.14=0.21,样本中不小于120的频率为0.11+0.06+0.02=0.19,估计该片经济林中底部周长小于100 cm的树木约占21%,周长不小于120 cm的树木约占19%.课堂小结总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.作业习题1—5 1、2.设计感想本节课是高一新课程必修三第二章《统计》中的第二节《用样本估计总体》的第一节课,尽管用样本估计总体是一种实用性很强,操作烦琐、麻烦的工作,但却是统计学中常用的方法,在生产、生活中应用非常广泛.用样本估计总体,其实就是一种“以偏概全”,“以部分代替全部”的思想.虽然有贬义的成分,但我们还是要认真去教好学好,而且,这也是平时考试和高考中的重点内容之一.本节要解决的问题就是:为何要用样本估计总体——社会生产、生活的实际需要(必要性),如比赛、竞技中预测结果,评判质量谁好谁差,水平谁高谁低经常要用到.如何去用样本估计总体——用样本的频率分布去估计总体的频率分布;怎样用样本估计总体——作出样本频率分布表或频率分布直方图,懂得用“数据”语言说话.另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育并增强学生的自信心,使学生养成良好的学习态度.。
2020年高一数学第一章统计5用样本估计总体5.1估计总体的分布5.2估计总体的数字特征课件北师大版必修3
练一练: (2)下列说法不正确的是( ) A.频率分布直方图中每个小矩形的高就是该组的频率 B.频率分布直方图中各个小矩形的面积之和等于 1 C.频率分布直方图中各个小矩形的宽一样大 D.频率分布折线图是依次连接频率分布直方图的每个小矩 形上端中点得到的
频率 解析:频率分布直方图中每个小矩形的高为组距,所以 A 错 误,B、C、D 均正确. 答案:A
(1)求这 10 人在戒烟前和戒烟后的体重的平均数; (2)求这 10 人在戒烟前和戒烟后的体重的方差; (3)通过上述数据,你能得到什么结?
【解】 (1)将数据按从小到大的顺序重新排列; 戒烟前: 52,52,55,55,60,60,64,67,69,80; 戒烟后: 52,54,55,57,58,62,67,68,70,81.
求得 x 戒烟前=61.4 kg, x 戒烟后=62.4 kg. (2)s2戒烟前=70.44,s2戒烟后=73.84.
(3)从戒烟前后两组数据的统计量知:从平均数看戒烟后这 10 人的平均体重增加了 1 kg;从方差看,戒烟后数据的波动比戒 烟前数据波动大,说明戒烟对不同的人所发生的变化程度是不同 的,通过对这两组数据的统计分析,得出结论:吸烟有害健康, 戒烟对身体健康是有益的.
1.作频率分布直方图的一般步骤是什么? (1)求极差.(2)决定组距与组数.一般样本容量越大,所分 组数越多;组距的选择力求“取整”;当样本容量不超过 120 时, 按照数据的多少,通常分成 5~12 组.(3)将数据分组.(4)列频
小组频数 率分布表,各小组的频率=样本容量.(5)画频率分布直方图.
=410[56-2 x ·40 x +40 x 2] =410(56-40 x 2) =41056-40×12 =0.9. 【答案】 0.9
高中数学第一章统计5.1估计总体的分布5.2估计总体的数字特征学案北师大版必修3(2021学年)
2017-2018版高中数学第一章统计5.1 估计总体的分布5.2估计总体的数字特征学案北师大版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017-2018版高中数学第一章统计 5.1 估计总体的分布 5.2 估计总体的数字特征学案北师大版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017-2018版高中数学第一章统计 5.1估计总体的分布 5.2 估计总体的数字特征学案北师大版必修3的全部内容。
5.1 估计总体的分布5.2 估计总体的数字特征[学习目标]1.学会列频率分布表,会画频率分布直方图。
2.会用频率分布表或频率分布直方图估计总体分布,并作出合理解释.3.在解决问题过程中,进一步体会用样本估计总体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程.知识点一频率分布表与频率分布直方图1.用样本估计总体的两种情况(1)用样本的频率分布估计总体的分布.(2)用样本的数字特征估计总体的数字特征.2.作频率分布直方图的步骤(1)求极差:即一组数据中最大值和最小值的差;(2)决定组距与组数:将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.这时应注意:①一般样本容量越大,所分组数越多;②为方便起见,组距的选择应力求“取整”;③当样本容量不超过120时,按照数据的多少,通常分成5~12组.(3)将数据分组:按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间.(4)列频率分布表:一般分四列:分组、频数累计、频数、频率,最后一行是合计.其中频数合计应是样本容量,频率合计是1.(5)画频率分布直方图:画图时,应以横轴表示分组,纵轴表示频率/组距.其相应组距上的频率等于该组上的小长方形的面积.即每个小长方形的面积=组距×错误!=频率.思考为什么要对样本数据进行分组?答不分组很难看出样本中的数字所包含的信息,分组后,计算出频率,从而估计总体的分布特征.知识点二频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.题型一频率分布直方图的绘制例1 调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下: 171 163 163 166 166168 168 160168 165171169 167 169 151168 170 168 160 174165 168 174159 167 156 157 164 169 180176 157 162 161 158 164 163 163 167 161(1)作出频率分布表;(2)画出频率分布直方图.解(1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:分组频数频率[149。
高一数学北师大版必修教案:第一章统计《估计总体的数字特征》
§1.5估计总体的数字特征(二)一、教学目标:1、知识与技能:(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识。
2、过程与方法:在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
3、情感态度与价值观:会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。
二、重点与难点重点:用样本平均数和标准差估计总体的平均数与标准差。
难点:能应用相关知识解决简单的实际问题。
三、教学方法:探究归纳,思考交流四、教学过程(一)、创设情境在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下:甲运动员:7,8,6,8,6,5,8,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。
——用样本的数字特征估计总体的数字特征(板出课题)。
(二)、探究新知<一>、众数、中位数、平均数〖探究〗:(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。
例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。
高中数学 第一章 统计 1.5.1 估计总体的分布 1.5.2 估计总体的数字特征学业分层测评 北师
2018版高中数学第一章统计1.5.1 估计总体的分布1.5.2 估计总体的数字特征学业分层测评北师大版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018版高中数学第一章统计1.5.1 估计总体的分布1.5.2 估计总体的数字特征学业分层测评北师大版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018版高中数学第一章统计1.5.1 估计总体的分布1.5.2 估计总体的数字特征学业分层测评北师大版必修3的全部内容。
1。
5。
1 估计总体的分布 1.5。
2 估计总体的数字特征(建议用时:45分钟)[学业达标]一、选择题1.下列说法不正确的是()A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的【解析】频率分布直方图的每个小矩形的高=错误!。
【答案】A2.样本容量为100的频率分布直方图如图1。
5。
6所示.根据样本的频率分布直方图估计样本数据落在[6,10)内的频数为a,样本数据落在[2,10)内的频率为b,则a,b分别是( )图1。
5.6A.32,0.4 B.8,0。
1C.32,0.1 D.8,0.4【解析】数据落在[6,10)内的频率为0.08×4=0。
32,则a=100×0.32=32.由于样本落在[2,6)内的频率为0.02×4=0。
08,则样本落在[2,10)内的频率b=0.08+0。
32=0.4。
【答案】A3.有一个容量为200的样本,其频率分布直方图如图1.5.7所示,据图估计,样本数据在[8,10)内的频数为()图1。
2021_2022学年高中数学第1章统计55.1估计总体的分布5.2估计总体的数字特征学案北师大版必
5.1 估计总体的分布 5.2 估计总体的数字特征学 习 目 标核 心 素 养1.理解并会运用样本的频率分布估计总体的分布,通过实例体会分布的意义和作用.(重点)2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图及频率折线图.(难点)3.能根据给出的频率分布直方图解决具体问题.(难点)1.通过运用样本的频率分布估计总体分布,体会分布的意义和作用,提升数学抽象素养.2.通过列频率分布表,画频率分布直方图及折线图提升数据分析素养.一、根本概念1.频率分布表和频率分布直方图 (1)频率分布表编制的方法步骤:计算极差――→决定组数与组距――→决定分点――→列出频率分布表(2)2.频率分布折线图(1)在频率分布直方图中,按照分组原那么,在左边和右边各加一个区间,从所加的左边区间的中点开场,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的概率.也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越准确.(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度那么会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.二、用样本的平均数、方差与标准差估计总体的数字特征利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这个估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息.n 个样本数据x 1,x 2,…,x n 的平均数x =1n(x 1+x 2+…+x n ),那么有n x =x 1+x 2+…+x n .设样本的元素为x 1,x 2,…,x n ,样本的平均数为x ,那么样本的方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] .样本方差的算术平方根即为样本的标准差,即s =1n [](x 1-x )2+(x 2-x )2+…+(x n-x )2. 思考:在频率分布直方图中,如何求众数、中位数、平均数? [提示] ①在频率分布直方图中,众数是最高矩形中点的横坐标; ②中位数左边和右边的直方图的面积应该相等;③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.1.当收集到的数据量很大时,比拟适宜的统计图是( ) A .茎叶图 B .频率分布直方图 C .频率折线图D .频率分布表B [当收集到的数据量很大时,一般用频率分布直方图.]2.在抽查产品的尺寸过程中,将其尺寸分成假设干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,那么|a -b |=( )A .hm B.mh C.h mD .h +m B [频率组距=h ,故|a -b |=组距=频率h =m h .]3.频率分布直方图中,小矩形的面积等于( ) A .组距 B .频率 C .组数D .频数B [根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率.] 4.某中学举办电脑知识竞赛,总分值为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进展整理后分成5组,绘制成频率分布直方图如下图.图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,那么参赛的人数是________,成绩优秀的频率是________.[设参赛的人数为n ,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4, 依题意40n=0.4,∴n =100,优秀的频率是0.10+0.05=0.15.]画频率分布直方图、折线图30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率折线图;(3)根据频率分布直方图,估计总体出现在23~28内的频率是多少. [解] (1)计算极差:30-21=9. 决定组距和组数:取组距为2. ∵92=412,∴共分5组. 决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下5组: ),[22.5,24.5),[24.5,26.5), [26.5,28.5),[28.5,30.5]. 列出频率分布表如下:分组 频数 频率频率/组距[20.5,22.5) 2 [22.5,24.5) 3 [24.5,26.5) 8 [26.5,28.5)4[28.5,30.5]3合计20(2)作出频率分布直方图如下:取各小长方形上的中点并用线段连接就构成了频率折线图,如上图.(3)由频率分布表和频率分布直方图观察得:样本值出现在23~28之间的频率为0.15+0.40+0.2=0.75,所以可以估计总体中出现在23~28之间的数的频率约为0.75.绘制频率分布直方图的具体步骤1.求极差一组数据的最大值与最小值的差称为极差.2.决定组距与组数数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过120时,按照数据的多少,常分成5~12组.为方便起见,组距的选择应力求“取整〞.3.将数据分组通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.1.为了了解中学生的身高情况,对实验中学同龄的50名男学生的身高进展了测量,结果如下(单位:cm):175168170176167181162173171177171171174173174175177166163160166166163169174165175165170158174172166172167172175161173167170172165157172173166177179181列出频率分布表,画出频率分布直方图及频率折线图.[解] 在这个样本中,最大值为181,最小值为157,它们的极差为24,可以取组距为4,根据题意列出样本的频率分布表如下表:分组频数频率3412121342合计50由上表画出频率分布直方图及频率折线图如图.频率分布直方图的应用【例2】为了了解高一学生的体能情况,某校抽取局部学生进展一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如下图,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)假设次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?[解] (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150.(2)由图可估计该校高一学生的达标率约为 17+15+9+32+4+17+15+9+3×100%=88%.频率分布直方图的性质1.因为小矩形的面积=组距×频率÷组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2.在频率分布直方图中,各小矩形的面积之和等于1. 3.频数÷相应的频率=样本容量.2.(1)某班50名学生在一次百米跑测试中,成绩全部介于13 s 与19 s 之间,将测试结果按如下方式分成六组:第一组,成绩大于或等于13 s 且小于14 s ;第二组,成绩大于或等于14 s 且小于15 s ;…;第六组,成绩大于或等于18 s 且小于或等于19 s ,如下图是按上述分组方法得到的频率分布直方图.设成绩小于17 s 的学生人数占全班总人数的百分比为x ,成绩大于或等于15 s 且小于17 s 的学生人数为y ,那么从频率分布直方图中分析出x 和y 分别为 ( )A .0.9,35B .0.9,45C .0.1,35D .0.1,45(2)某商场在端午节的促销活动中,对某日9时至14时的销售额进展统计,其频率分布直方图如下图.9时至10时的销售额为3万元,那么11时至12时的销售额为________万元.(1)A (2)12 [由频率分布直方图知x=0.34+0.36+0.18+0.02=0.9,因为y50=0.36+0.34=0.7,所以y=35.应选A.(2)由频率分布直方图知,9时至10时的销售额的频率为0.1,故销售总额为30.1=30(万元),又11时至12时的销售额的频率为0.4,故销售额为0.4×30=12万元.故填12万元.]估计总体的数字特征[探究问题]1.如何从频率分布直方图中估计中位数?提示:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.2.在条形统计图中怎样估计众数?提示:众数是最高矩形的中点的横坐标.3.怎样估计平均数?提示:平均数的估计值等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和.【例3】一组数据:125,121,123,125,127,129,125,128,130,129,126,124,125,127,126,122,124,125,126, 128.(1)填写下面的频率分布表:分组频数频率[121,123)[123,125)[125,127)[127,129)[129,131]合计(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数. [思路探究] (1)根据频数与频率的概念填写表格; (2)利用作频率分布直方图的步骤作图; (3)根据直方图中求数字特征的方法求解. [解] (1)分组 频数 频率 [121,123) 2 [123,125) 3 [125,127) 8 [127,129) 4 [129,131] 3 合计201(2)(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的准确值为125;(2)图中虚线对应的数据是125+2×58=126.25,事实上中位数为125.5.使用“组中值〞求平均数x =122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,平均数的准确值为x =125.75.1.平均数、中位数、众数、极差、方差等统计量是将多个数据“加工〞成一个数据,能更清楚地反映这组数据的某些重要特征,要理解这些统计量表达的信息.2.利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.3.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进展整理后分成五组,绘制成如下图的频率分布直方图,图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生成绩的众数、中位数;(2)高一参赛学生的平均成绩.[解] (1)由图可知众数为65,又因为第一个小矩形的面积为0.3,所以设中位数为60+x,那么0.3+x×0.04=0.5,得x=5,所以中位数为60+5=65.(2)依题意,x=55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,所以平均成绩约为67分.1.利用直方图求数字特征:(1)众数是最高的矩形的底边的中点.(2)中位数左右两边直方图的面积应相等.(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.三种图表的区别与联系:名称区别频率分布表从数量上比拟准确地反映样本的频率分布规律频率分布直方图反映样本的频率分布情况频率折线图直观地反映了数据的变化趋势这三种图表都是描述样本数据分布情况,估计总体频率分布规律的,其联系如下:1.思考辨析(1)频率分布直方图中的纵坐标指的是频率的值.( )(2)频率分布直方图中各小矩形的面积之和可以不为1. ( )(3)将数据分组时,一般要求各组的组距相等.( )(4)在用样本估计总体分布的过程中,样本容量越大,估计越准确.( ) (5)样本平均数一定大于总体平均数.( ) (6)样本标准差与总体标准差的大小关系无法确定. ( )[解析] (1)×,纵坐标指的是频率与组距的比值. (2)×,各小矩形的面积之和一定为1.(3)√,对数据进展分组时,一般要求各组的组距相等. (4)√,样本容量越大,估计越准确.(5)×,样本平均数与总体平均数的大小关系不确定. (6)√,可能大于也可能小于.[答案] (1)× (2)× (3)√ (4)√ (5)× (6)√2.某班的全体学生参加英语测试,成绩的频率分布直方图如下图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].假设低于60分的人数是15,那么该班的学生人数是( )A .45B .50C .55D .60B [成绩在[20,40)和[40,60)的频率分别是0.1,0.2,那么低于60分的频率是0.3,设该班学生总数为m ,那么15m=0.3,m =50.]3.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图如下图.由图中数据可知a =________.假设要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,那么从身高在[140,150]内的学生中选取的人数应为________.图1560.030 3 [∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1, ∴a =0.030,设身高在[120,130),[130,140),[140,150]三组的分别有x ,y ,z 人.∴x100=0.030×10,∴x=30,同理y=20,z=10.∴从[140,150]中抽取1030+20+10×18=3.]4.公交车的数量太多容易造成资源的浪费,太少又难以满足乘客的需求.为此,公交公司在某站台随机调查了80名乘客,他们的候车时间如下所示(单位:分):17142012102418171221319 285347251828115311211 10161291013191012121622 172316151611931321822 199232815212812111415 3 116218255121520161228 20122815832189(1)将数据进展适当的分组,并画出相应的频率分布直方图和频率折线图;(2)候车时间15分钟以上的比例是多少?你能为公交公司提出什么建议?[解] (1)该数据中最大值为34,最小值为1,两者之差为33,故取组距为5,分为7组.时间分组(Δx i)频数(n i)频率(f i)f i Δx i[0,5)6[5,10)9[10,15)22[15,20)22[20,25)105 [25,30)8[30,35]3频率分布直方图如下列图所示:频率折线图如下列图所示:(2)候车时间不低于15分钟的百分比为0.275+0.125+0.100+0.0375=0.5375=53.75%,公交公司可以适当增加公交车的数量.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.1 估计总体的分布5.2 估计总体的数字特征[学习目标] 1.学会列频率分布表,会画频率分布直方图.2.会用频率分布表或频率分布直方图估计总体分布,并作出合理解释.3.在解决问题过程中,进一步体会用样本估计总体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程.知识点一 频率分布表与频率分布直方图 1.用样本估计总体的两种情况 (1)用样本的频率分布估计总体的分布. (2)用样本的数字特征估计总体的数字特征. 2.作频率分布直方图的步骤(1)求极差:即一组数据中最大值和最小值的差;(2)决定组距与组数:将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.这时应注意:①一般样本容量越大,所分组数越多;②为方便起见,组距的选择应力求“取整”;③当样本容量不超过120时,按照数据的多少,通常分成5~12组. (3)将数据分组:按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间. (4)列频率分布表:一般分四列:分组、频数累计、频数、频率,最后一行是合计.其中频数合计应是样本容量,频率合计是1.(5)画频率分布直方图:画图时,应以横轴表示分组,纵轴表示频率/组距.其相应组距上的频率等于该组上的小长方形的面积.即每个小长方形的面积=组距×频率组距=频率.思考 为什么要对样本数据进行分组?答 不分组很难看出样本中的数字所包含的信息,分组后,计算出频率,从而估计总体的分布特征.知识点二 频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.题型一频率分布直方图的绘制例1 调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171 163 163 166 166 168 168 160 168 165171 169 167 169 151 168 170 168 160 174165 168 174 159 167 156 157 164 169 180176 157 162 161 158 164 163 163 167 161(1)作出频率分布表;(2)画出频率分布直方图.解(1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:(2)反思与感悟 1.组数的决定方法是:设数据总数目为n,一般地,当n≤50,则分为5~8组;当50≤n≤120时,则分为8~12组较为合适.2.分点数的决定方法是:若数据为整数,则分点数据减去0.5;若数据是小数点后一位的数,则分点减去0.05,以此类推.3.画频率分布直方图小长方形高的方法是:假设频数为1的小长方形的高为h,则频数为k 的小长方形高为kh.跟踪训练1 美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51 ,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.解(1)以4为组距,列表如下:(2)从频率分布表中可以看出60%左右的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小. 题型二 频率分布直方图的应用例2 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少? 解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的, 因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.反思与感悟 1.频率分布直方图的性质:(1)因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小. (2)在频率分布直方图中,各小矩形的面积之和等于1. (3)频数相应的频率=样本容量. 2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.跟踪训练2 如图所示是总体的一个样本频率分布直方图,且在[15,18)内频数为8. (1)求样本在[15,18)内的频率; (2)求样本容量;(3)若在[12,15)内的小矩形面积为0.06,求在[18,33)内的频数.解 由样本频率分布直方图可知组距为3.(1)由样本频率分布直方图得样本在[15,18)内的频率等于475×3=425.(2)样本在[15,18)内频数为8, 由(1)可知,样本容量为8425=8×254=50.(3)∵在[12,15)内的小矩形面积为0.06,∴样本在[12,15)内的频率为0.06,故样本在[15,33)内的频数为50×(1-0.06)=47,又在[15,18)内频数为8,故在[18,33)内的频数为47-8=39.题型三 频率分布与数字特征的综合应用例 3 已知一组数据:125 121 123 125 127 129 125 128 130 129 126 124 125 127 126 122 124 125 126 128 (1)填写下面的频率分布表:(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数. 解 (1)(2)(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的精确值为125.(2)图中虚线对应的数据是125+2×58=126.25,事实上中位数为125.5.使用“组中值”求平均数:x =122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,平均数的精确值为x =125.75. 反思与感悟 1.利用频率分布直方图估计数字特征: (1)众数是最高的矩形的底边的中点; (2)中位数左右两侧小矩形的面积相等;(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和. 2.利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.跟踪训练3 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.求:(1)高一参赛学生成绩的众数、中位数. (2)高一参赛学生的平均成绩. 解 (1)由图可知众数为65, 又∵第一个小矩形的面积为0.3, ∴设中位数为60+x ,则0.3+x ×0.04=0.5,得x =5,∴中位数为60+5=65.(2)依题意,x=55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴平均成绩约为67分.1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确答案 C解析由用样本估计总体的性质可得.2.频率分布直方图中,小矩形的面积等于( )A.组距B.频率C.组数D.频数答案 B解析根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率.3.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A.56 B.60C.120 D.140答案 D解析设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.4.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________. 答案 100 0.15解析 设参赛的人数为n ,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4, 依题意40n=0.4,∴n =100,优秀的频率是0.10+0.05=0.15.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,通常用样本的频率分布表或频率分布直方图去估计总体的分布.2.用同样的方法先后从总体中抽取两个大小相同的样本,但两次得到的样本频率分布表、样本频率分布直方图、样本的平均数和标准差仍然可能互不相同.如果抽样的方法比较合理,那么样本可以反映总体的信息,样本容量越大,越接近总体的真实情况.。