用样本估计总体---北师大版
北师大版八年级上册数学[数据的分析——知识点整理及重点题型梳理]
北师大版八年级上册数学重难点突破知识点梳理及重点题型巩固练习数据的分析——知识讲解【学习目标】1、了解加权平均数的意义和求法,会求一组数据的平均数,体会用样本平均数估计总体平均数的思想.2、了解中位数和众数的意义,掌握它们的求法.进一步理解平均数、中位数和众数所代表的不同的数据特征.3、了解极差、方差和标准差的意义及求法,体会它们在刻画数据波动时的不同特征.体会用样本方差估计总体方差的思想,掌握分析数据的思想和方法.4、从事收集、整理、描述和分析数据得出结论的统计活动,经历数据处理的基本过程,体验统计与生活的联系,感受统计在生活和生产中的作用,养成用数据说话的习惯. 【要点梳理】要点一、算术平均数和加权平均数一般地,对于n 个数123n x x x x 、、、…,我们把()1231n x x x x n⋅⋅⋅++++叫做这n 个数的算术平均数,简称平均数,记作x .计算公式为()1231n x x x x x n=⋅⋅⋅++++. 要点诠释:平均数表示一组数据的“平均水平”,反映了一组数据的集中趋势.(1)当一组数据较大时,并且这些数据都在某一常数a 附近上、下波动时,一般选用简化计算公式x x a '=+.其中x '为新数据的平均数,a 为取定的接近这组数据的平均数的较“整”的数.(2)平均数的大小与一组数据里的每个数据均有关系,其中任一数据的变动都会相应引起平均数的变动.所以平均数容易受到个别特殊值的影响.若n 个数12n x x x 、、…的权分别是12n w w w 、、…、,则112212......n nnx w x w x w w w w ++++++叫做这n 个数的加权平均数. 要点诠释:(1)相同数据i x 的个数i w 叫做权,i w 越大,表示i x 的个数越多,“权”就越重. 数据的权能够反映数据的相对“重要程度”.(2)加权平均数实际上是算术平均数的另一种表现形式,是平均数的简便运算. 要点二、中位数和众数 1.中位数一般地,n 个数据按照大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. 要点诠释:(1)一组数据的中位数是唯一的;一组数据的中位数不一定出现在这组数据中.(2)由一组数据的中位数可以知道中位数以上和以下数据各占一半. 2.众数一组数据中出现次数最多的那个数据叫做这组数据的众数. 要点诠释:(1)一组数据的众数一定出现在这组数据中;一组数据的众数可能不止一个. (2)众数是一组数据中出现次数最多的数据而不是数据出现的次数. 要点三、平均数、中位数与众数的联系与区别联系:平均数、众数、中位数都是用来描述数据集中趋势的量,其中以平均数最为重要. 区别:平均数的大小与每一个数据都有关,任何一个数的波动都会引起平均数的波动,当一组数据中有个别数据太高或太低,用平均数来描述整体趋势则不合适,用中位数或众数则较合适.中位数与数据排列位置有关,个别数据的波动对中位数没影响;众数主要研究各数据出现的频数,当一组数据中不少数据多次重复出现时,可用众数来描述. 要点四、极差、方差和标准差 1.极差一组数据中最大数据与最小数据的差,称为极差,极差=最大数据-最小数据. 要点诠释:极差是最简单的一种度量数据波动情况的量,它受极端值的影响较大.一组数据极差越小,这组数据就越稳定. 2.方差方差是各个数据与平均数差的平方的平均数.方差2s 的计算公式是:()[]222212)(...)(1x x x x x x nS n -++-+-=,其中,x 是1x ,2x ,…n x 的平均数. 要点诠释:(1)方差反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小.(2)一组数据的每一个数都加上(或减去)同一个常数,所得的一组新数据的方差不变. (3)一组数据的每一个数据都变为原来的k 倍,则所得的一组新数据的方差变为原来的2k 倍.3.标准差方差的算术平方根叫做这组数据的标准差,用符号s 表示,即:;标准差的数量单位与原数据一致.4.极差、方差和标准差的联系与区别联系:极差与方差、标准差都是表示一组数据离散程度的特征数.区别:极差表示一组数据波动范围的大小,它受极端数据的影响较大;方差反映了一组数据与其平均值的离散程度的大小.方差越大,稳定性也越小;反之,则稳定性越好.所以一般情况下只求一组数据的波动范围时用极差,在考虑到这组数据的稳定性时用方差. 要点五、用样本估计总体在考察总体的平均水平或方差时,往往都是通过抽取样本,用样本的平均水平或方差近似估计得到总体的平均水平或方差. 要点诠释:(1)如果总体数量太多,或者从总体中抽取个体的试验带有破坏性,都应该抽取样本.取样必须具有尽可能大的代表性.(2)用样本估计总体时,样本容量越大,样本对总体的估计也越精确.样本容量的确定既要考虑问题本身的需要,又要考虑实现的可能性所付出的代价.【典型例题】类型一、平均数、中位数、众数1、(2015•福州)若一组数据1,2,3,4,x的平均数与中位数相同,则实数x的值不可能是()A.0 B.2.5 C.3 D.5【答案与解析】解:(1)将这组数据从小到大的顺序排列为1,2,3,4,x,处于中间位置的数是3,∴中位数是3,平均数为(1+2+3+4+x)÷5,∴3=(1+2+3+4+x)÷5,解得x=5;符合排列顺序;(2)将这组数据从小到大的顺序排列后1,2,3,x,4,中位数是3,此时平均数是(1+2+3+4+x)÷5=3,解得x=5,不符合排列顺序;(3)将这组数据从小到大的顺序排列后1,x,2,3,4,中位数是2,平均数(1+2+3+4+x)÷5=2,解得x=0,不符合排列顺序;(4)将这组数据从小到大的顺序排列后x,1,2,3,4,中位数是2,平均数(1+2+3+4+x)÷5=2,解得x=0,符合排列顺序;(5)将这组数据从小到大的顺序排列后1,2,x,3,4,中位数,x,平均数(1+2+3+4+x)÷5=x,解得x=2.5,符合排列顺序;∴x的值为0、2.5或5.故选C.【总结升华】考查了确定一组数据的中位数,涉及到分类讨论思想,较难,要明确中位数的值与大小排列顺序有关,一些学生往往对这个概念掌握不清楚,计算方法不明确而解答不完整.注意找中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数.如果数据有奇数个,则正中间的数字即为所求;如果是偶数个,则找中间两位数的平均数举一反三:【变式】若数据3.2,3.4,3.2,x,3.9,3.7的中位数是3.5,则其众数是________,平均数是________.【答案】3.2;3.5;解:由题意3.43.5, 3.62xx+==,所以众数是3.2,平均数是3.5.2、(2016•广州)某校为了提升初中学生学习数学的兴趣,培养学生的创新精神,举办“玩转数学”比赛,现有甲、乙、丙三个小组进入决赛,评委从研究报告、小组展示、答辩三个方面为各小组打分,各项成绩均按百分制记录,甲、乙、丙三个小组各项得分如下表: 小组 研究报告 小组展示 答辩 甲 91 80 78 乙 81 74 85 丙798390计算各小组的平均成绩,并从高分到低分确定小组的排名顺序:如果按照研究报告占40%,小组展示占30%,答辩占30%,计算各小组的成绩,哪个小组的成绩最高?【思路点拨】(1)运用求平均数公式()1231n x x x x n⋅⋅⋅++++即可求出三人的平均成绩,比较得出结果;(2)将三人的成绩按比例求出测试成绩,比较得出结果. 【答案与解析】解:(1)由题意可得, 甲组的平均成绩是:(分), 乙组的平均成绩是:(分), 丙组的平均成绩是:(分),从高分到低分小组的排名顺序是:丙>甲>乙; (2)由题意可得, 甲组的平均成绩是:(分), 乙组的平均成绩是:(分), 丙组的平均成绩是:(分),由上可得,甲组的成绩最高. 答案:甲组的成绩最高【总结升华】本题考查算术平均数、加权平均数、统计表,解题的关键是明确题意,找出所求问题需要的条件. 举一反三:【变式】小王在八年级第一学期的数学成绩分别为:测验一得89分,测验二得78分,测验三得85分,期中考试得90分,期末考试得87分,如果按照平时、期中、期末的10%、30%、60%量分,那么小王该学期的总评成绩应该为多少?【答案】解:小王平时测试的平均成绩897885843x ++==(分).所以8410%9030%8760%87.610%30%60%⨯+⨯+⨯=++(分). 答:小王该学期的总评成绩应该为87.6分.3、下表是七年级(2)班30名学生期中考试数学成绩表(已破损).已知该班学生期中考试数学成绩平均分是76分. (1)求该班80分和90分的人数分别是多少?(2)设此班30名学生成绩的众数为a ,中位数为b ,求a b +的值. 【答案与解析】解:(1)设该班得80分的有x 人,得90分的有y 人.根据题意和平均数的定义,得257330,763050260570780901003,x y x y +++++=⎧⎨⨯=⨯+⨯+⨯+++⨯⎩ 整理得13,89109,x y x y +=⎧⎨+=⎩ 解得8,5.x y =⎧⎨=⎩即该班得80分的有8人,得90分的有5人.(2)因为80分出现8次且出现次数最多.所以a =80,第15、16两个数均为80分,所以b =80,则a b +=80+80=160.【总结升华】本题为统计题,考查平均数、众数与中位数的意义.解题的关键是准确理解题意,建立等量关系. 举一反三:【变式】某教师为了对学生零花钱的使用进行教育指导,对全班50名学生每人一周内的零花钱数额进行了调查统计,并绘制了统计图表如图所示的统计图.零花钱数额(元) 5 10 15 20 学生个数(个)a15205请根据图表中的信息,回答以下问题.(1)求a 的值;(2)求这50名学生每人一周内的零花钱额的众数和平均数. 【答案】解:(1) a =50-15-20-5=10.(2)众数是15.平均数为150(5×10+10×15+15×20+20×5)=12.类型二、极差、方差和标准差4、(2015•徐州)某中学开展“唱红歌”比赛活动,九年级(1)、(2)班根据初赛成绩,各选出5名选手参加复赛,两个班各选出的5名选手的复赛成绩如图所示.(1)根据图示填写下表;班级平均数(分)中位数(分)众数(分)九(1)85九(2)85 100(2)结合两班复赛成绩的平均数和中位数,分析哪个班级的复赛成绩较好;(3)计算两班复赛成绩的方差.【思路点拨】(1)观察图分别写出九(1)班和九(2)班5名选手的复赛成绩,然后根据中位数的定义和平均数的求法以及众数的定义求解即可;(2)在平均数相同的情况下,中位数高的成绩较好;(3)根据方差公式计算即可:s2=[(x1﹣)2+(x2﹣)2+…+(x n﹣)2](可简单记忆为“等于差方的平均数”)【答案与解析】解:(1)由图可知九(1)班5名选手的复赛成绩为:75、80、85、85、100,九(2)班5名选手的复赛成绩为:70、100、100、75、80,∴九(1)的平均数为(75+80+85+85+100)÷5=85,九(1)的中位数为85,九(1)的众数为85,把九(2)的成绩按从小到大的顺序排列为:70、75、80、100、100,∴九(2)班的中位数是80;班级平均数(分)中位数(分)众数(分)九(1)85 85 85九(2)85 80 100(2)九(1)班成绩好些.因为九(1)班的中位数高,所以九(1)班成绩好些.(回答合理即可给分)(3),【总结升华】本题考查了中位数、众数以及平均数的求法,同时也考查了方差公式,解题的关键是牢记定义并能熟练运用公式. 举一反三:【变式】某工厂甲、乙两名工人参加操作技能培训.现分别从他们在培训期间参加的若干次测试成绩中随机抽取8次,数据如下(单位:分)甲 95 82 88 81 93 79 84 78 乙8375808090859295(1)请你计算这两组数据的平均数、中位数;(2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为选派哪名工人参加合适?请说明理由. 【答案】解:1(9582888193798478)858x =+++++++=甲(分), 1(8375808090859295)858x =+++++++=乙(分).甲、乙两组数据的中位数分别为83分、84分. (2)由(1)知85x x ==甲乙分,所以22221[(9585)(8285)(7885)]35.58s =-+-++-=甲, 22221[(8385)(7585)(9585)]418s =-+-++-=乙.①从平均数看,甲、乙均为85分,平均水平相同; ②从中位数看,乙的中位数大于甲,乙的成绩好于甲;③从方差来看,因为x x =甲乙,22s s <乙甲,所以甲的成绩较稳定;④从数据特点看,获得85分以上(含85分)的次数,甲有3次,而乙有4次,故乙的成绩好些;⑤从数据的变化趋势看,乙后几次的成绩均高于甲,且呈上升趋势,因此乙更具潜力. 综上分析可知,甲的成绩虽然比乙稳定,但从中位数、获得好成绩的次数及发展势头等方面分析,乙具有明显优势,所以应派乙参赛更有望取得成绩. 类型三、统计思想5、我国是世界上严重缺水的国家之一.为了倡导“节约用水从我做起”,小刚在他所在班的50名同学中,随机调查了10名同学家庭中一年的月均用水量(单位:t),并将调查结果绘成了如图所示的条形统计图.(1)求这10个样本数据的平均数、众数和中位数;(2)根据样本数据,估计小刚所在班50名同学家庭中月均用水量不超过7t 的约有多少户.【思路点拨】(1)根据条形统计图,即可知道每一名同学家庭中一年的月均用水量.再根据加权平均数的计算方法、中位数和众数的概念进行求解;(2)首先计算样本中家庭月均用水量不超过7t 的用户所占的百分比,再进一步估计总体. 【答案与解析】解:(1)观察条形图,可知这组样本数据的平均数是62 6.54717.52816.810x ⨯+⨯+⨯+⨯+⨯==.∴这组样本数据的平均数为6.8.∴在这组样本数据中,6.5出现了4次,出现的次数最多. ∴这组数据的众数是6.5.∵将这组样本数据按从小到大的顺序排列,其中处于中间的两个数都是 6.5,有6.5 6.56.52+=. ∴这组数据的中位数是6.5.(2)∵10户中月均用水量不超过7t 的有7户,有7503510⨯=. ∴根据样本数据,可以估计出小刚所在班50名同学家庭中月均用水量不超过7t 的约有35户.【总结升华】本题考查的是条形统计图的运用.读懂统计图,从统计图中得到必要的信息是解决问题的关键.条形统计图能清楚地表示出每个项目的数据.掌握平均数、中位数和众数的计算方法.。
最新北师大版高中数学必修三第一章统计 估计总体的分布
§5 用样本估计总体 5.1 估计总体的分布学习 目标1.理解什么是频率分布表、频率分布直方图、频率折线图.(数学抽象)2.会列频率分布表,会画频率分布直方图和频率折线图,能根据频率分布直方图解决问题.(数据分析、直观想象)3.了解用样本估计总体的意义.(数学抽象)导思 1.频率分布直方图纵轴的含义是什么?2.频率分布直方图的制作步骤是什么?3.如何画频率折线图?1.频率分布表和频率分布直方图 (1)频率分布表编制的方法步骤:(2)频率分布表与频率分布直方图有什么不同?提示:频率分布表能使我们清楚地知道数据分布在各个小组的个数,而频率分布直方图则是从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律.2.频率折线图(1)在频率分布直方图中,按照分组原则,在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的概率.也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确.(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.频率分布表、频率分布直方图与频率折线图各有什么优缺点?提示:①频率分布表:优点:频率分布表在数量表示上比较确切;缺点:不够直观、形象,分析数据分布的总体趋势不太方便;②频率分布直方图:优点:频率分布直方图能非常直观地表明数据分布的形状,使我们能够看到在分布表中看不清楚的数据模式;缺点:从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了;③频率折线图:优点是它反映了数据的变化趋势.缺点:由图本身得不到原始的数据信息.1.辨析记忆(对的打“√”,错的打“×”)(1)频率分布直方图中的纵坐标指的是频率的值.()(2)频率分布直方图的宽度没有实际意义.()(3)频率分布直方图中各小矩形的面积之和可以不为1.()(4)在画频率折线图时,可以画成与横轴相连.()提示:(1)×.纵坐标指的是频率与组距的比值.(2) ×.频率分布直方图的宽度表示组距.(3)×.各小矩形的面积之和一定为1.(4) √.为了方便看图,一般习惯把频率折线图画成与横轴相连,所以横轴上左右两端点没有实际的意义.2.已知一个容量为40的样本,把它分成6组,第一组到第四组的频数分别为5,6,7,10,第五组的频率是0.2,那么第六组的频数是________,频率是________. 【解析】第五组的频数为0.2×40=8.所以第六组的频数为40-5-6-7-10-8=4.频率为440=0.1.答案:40.13.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)内的汽车有________.【解析】因为小长方形的面积即为对应的频率,时速在[50,60)内的频率为0.3,所以有200×0.3=60(辆).答案:60辆4.(教材例题改编)一个容量为n的样本,分成若干组,已知某组的频数和频率分别为50和0.25,则n=________.【解析】由题意得50n=0.25,所以n=200.答案:200类型一频率分布直方图的绘制(数据分析、直观想象)【典例】1.频率分布直方图中,小矩形的面积等于()A.组距B.频率C.组数D.频数2.调查某校高一年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 168 160 174 165 168 174 159 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161(1)作出频率分布表;(2)画出频率分布直方图.【思路导引】1.根据频率直方图中小矩形的几何意义,即可求解. 2.极差=180-151=29,组距为3,可分为10组.【解析】1.选B.根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率.2.(1)①求极差:从数据中可看出,最大值是180,最小值是151,故极差为180-151=29.②确定组距与组数:取3为组距,则极差组距 =293 =923 ,故可将样本数据分成10组.③第一组起点定为150.5,组距为3,这样分出10组:[150.5,153.5),[153.5,156.5),[156.5,159.5),[159.5,162.5),[162.5,165.5),[165.5,168.5),[168.5,171.5),[171.5,174.5),[174.5,177.5),[177.5,180.5]. ④列频率分布表174.5~177.510.025177.5~180.510.025(2)画频率分布直方图如图所示:绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.1.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的()A.91% B.92% C.95% D.30%【解析】选A.不大于27.5的样本数为:3+8+9+11+10=41,所以约占总体百分比为4145×100%≈91%.2.某中学同年级40名男生的体重数据如下(单位:千克):616059595958585757575756 565656565656555555555454 54545353525252525251515150504948列出样本的频率分布表,画出频率分布直方图. 【解析】①计算极差:61-48=13(千克); ②决定组距与组数,取组距为2,因为132 =612 ,所以共分7组;③决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下7组:47.5~49.5,49.5~51.5,51.5~53.5,53.5~55.5,55.5~57.5,57.5~59.5,59.5~61.5.④列出频率分布表如下:分组(Δx i ) 频数(n i ) 频率(f i ) 47.5~49.5 2 0.05 49.5~51.5 5 0.125 51.5~53.5 7 0.175 53.5~55.5 8 0.20 55.5~57.5 11 0.275 57.5~59.5 5 0.125 59.5~61.5 2 0.05 合计401.00⑤作出频率分布直方图如下:3.某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:107~109,3株;109~111,9株;111~113,13株;113~115,16株;115~117,26株;117~119,20株;119~121,7株;121~123,4株;123~125,2株.(1)列出频率分布表;(2)画出频率分布直方图;(3)据上述图表,估计数据在109~121范围内的可能性是百分之几.【解析】(1)频率分布表如下:分组频数频率累积频率107~10930.030.03109~11190.090.12111~113130.130.25113~115160.160.41115~117260.260.67117~119200.200.87119~12170.070.94121~12340.040.98123~12520.02 1.00合计100 1.00(2)频率分布直方图如下:(3)由上述图表可知数据落在109~121范围内的频率为:0.94-0.03=0.91,即数据落在109~121范围内的可能性是91%.类型二频率折线图的画法及应用【典例】从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):40~50,2;50~60,3;60~70,10;70~80,15;80~90,12;90~100,8.(1)列出样本的频率分布表;(2)画出频率分布直方图及频率折线图; (3)估计成绩在60~90分的学生比例.【思路导引】画频率分布直方图和折线图⇒制作好频率分布表⇒纵坐标表示频率与组距的比值.【解析】(1)样本的频率分布表如下:成绩分组(Δx i ) 频数(n i ) 频率(f i ) f i Δx i 40~50 2 0.04 0.004 50~60 3 0.06 0.006 60~70 10 0.2 0.02 70~80 15 0.3 0.03 80~90 12 0.24 0.024 90~10080.160.016(2)频率分布直方图及频率折线图如图所示:(3)成绩在60~90的频率为1-0.04-0.06-0.16=0.74, 所以可估计成绩在60~90分的学生比例为74%.本例条件不变,估计成绩在50~80分的学生的比例.【解析】成绩在50~60分的学生的频数为3,在60~70的学生的频数为10,在70~80分的学生的频数为15,所以成绩在50~80分的学生的频数为28,占总体的2850 =1425 .频率折线图的作法及应用(1)作法:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)应用:频率折线图也是用一个单位长度表示一定的数量,但是,它是根据数量的多少在图中描出各个点,然后把各个点用线段顺次连接成的折线,因此,它不但可以表现出数量的多少,而且能够以折线的起伏,清楚而直观地表示出数量的增减变化的情况.提醒:画图时,横轴和纵轴的单位可不一致.有一个容量为100的某校毕业生起始月薪的样本,数据的分组及各组的频数如下:起始月薪(百元)[13,14)[14,15)[15,16)[16,17) 频数7112623起始月薪(百元)[17,18)[18,19)[19,20)[20,21]频数1584 6(1)列出样本的频率分布表;(2)画出频率分布直方图和频率折线图;(3)根据频率分布估计该校毕业生起始月薪低于2 000元的频率.【解析】(1)样本的频率分布表为起始月薪(百元)频数频率[13,14)70.07[14,15)110.11[15,16)260.26[16,17)230.23[17,18)150.15[18,19)80.08[19,20)40.04[20,21]60.06总计100 1.00(2)频率分布直方图和频率折线图如图.(3)起始月薪低于2 000元的频率为0.07+0.11+…+0.04=0.94,故起始月薪低于2 000元的频率的估计值是0.94.【补偿训练】某学校随机抽取部分新生调查其上学路上所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学路上所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80), [80,100].(1)求直方图中x的值;(2)如果上学路上所需时间不少于40分钟的学生可申请在学校住宿,请估计学校1 000名新生中有多少名学生可以申请住宿.【解析】(1)由(x+0.012 5+0.006 5+0.003×2)×20=1,解得x=0.025.(2)上学所需时间不少于40分钟的学生的频率为:(0.006 5+0.003×2)×20=0.25,估计学校1 000名新生中有1 000×0.25=250名学生可以申请住宿.答:估计学校1 000名新生中有250名学生可以申请住宿.类型三用样本分布估计总体分布【典例】1.(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少;(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.【思路导引】1.利用频率分布直方图,计算出低于60分的人数的频率p,利用频数除以相应的频率p 得总人数.2.利用110次以上(含110次)的矩形面积除以所有的矩形面积之和,即可估计高一学生的达标率.【解析】1.选C. 低于4.5万元的比率估计为0.02×1+0.04×1=0.06=6%,故A 正确;不低于10.5万元的比率估计为(0.04+0.02×3)×1=0.1=10%,故B 正确;平均值为:(3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+12×0.02+13×0.02+14×0.02)×1=7.68万元,故C 不正确;4.5万元到8.5万元的比率为:0.1×1+0.14×1+0.2×1+0.2×1=0.64=64%,故D 正确.2.(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此,第二小组的频率为:42+4+17+15+9+3=0.08. 又因为第二小组频率=第二小组频数样本容量, 所以样本容量=第二小组频数第二小组频率=120.08 =150. (2)由图可估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%. (3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.用样本估计总体的常用方法(1)用频率分布表估计总体分布.根据样本数据可以制作频率分布表,利用频率分布表中的数据,如各小组的频数、频率,可以对总体中的有关量进行估计.(2)用频率分布直方图估计总体分布.根据样本数据绘制出的频率分布直方图具有直观的特点,可以直接判断出样本中数据的分布特点和变化趋势与规律,并由此对总体进行估计.(3)用频率折线图估计总体分布.由样本频率分布直方图可以绘制出频率折线图,且样本容量越大,分组的组距不断缩小,那么折线图就越接近于总体分布,从而由频率折线图对总体估计就越精确.某幼儿园根据部分同年龄段女童的身高数据绘制了频率分布直方图,其中身高的变化范围是[96,106](单位:厘米),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].(1)求出x 的值;(2)已知样本中身高小于100厘米的人数是36,求出样本容量N 的数值;(3)根据频率分布直方图提供的数据,求出样本中身高大于或等于98厘米并且小于104厘米的学生数.【解析】(1)由题意可知:(0.050+0.100+0.150+0.125+x )×2=1,解得:x =0.075.(2)设样本中身高小于100厘米的频率为p 1,所以,p 1=(0.050+0.100)×2=0.30,而p 1=36N ,所以N =36p 1=360.30 =120. (3)样本中身高大于或等于98厘米并且小于104厘米的频率为p 2=(0.100+0.150+0.125)×2=0.75,所以身高大于或等于98厘米并且小于104厘米的学生数n =p 2N =120×0.75=90.。
高中数学第一章统计5用样本估计总体ppt课件北师大版必修3
果如下:
对某电个数 100~200 20 200~300 30 300~400 80 400~500 40 500~600 30
(1)列出频率分布表; (2)作出频率分布直方图; (3)作出频率折线图.
解:(1)频率分布表如下: 分组 频数 频率
100~200 20 0.10 200~300 30 0.15 300~400 80 0.40 400~500 40 0.20 500~600 30 0.15
第一章 统 计
§5 用样本估计总体 5.1 估计总体的分布 5.2 估计总体的数字特征
课前基础梳理
自主学习 梳理知识
|学 习 目 标| 1.会作频率分布直方图、频率折线图,会用样本的频率分 布估计总体的分布. 2.会用样本的数字特征估计总体的数字特征.
1.用样本估计总体的两种情况 (1)用样本的__频__率__分__布__估计总体的分布. (2)用样本的_数__字__特__征___估计总体的数字特征. 2.频率分布直方图 在频率分布直方图中,纵轴表示__频__率__/_组__距___,数据落在各 小组内的频率用_面__积___来表示,各小长方形的面积的总和等于 _1__.
(2)已知样本中分数小于 40 的学生有 5 人,试估计总体中分 数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于 70,且样本中分数 不小于 70 的男女生人数相等.试估计总体中男生和女生人数的 比例.
【解】 (1)根据频率分布直方图可知,样本中分数不小于 70 的频率为(0.02+0.04)×10=0.6,
(1)列出样本的频率分布表; (2)画出频率分布直方图和频率分布折线图; (3)根据频率分布直方图,估计总体出现在 23~28 内的频率 是多少?
05-第四节 用样本估计总体的数字特征-课时1 样本的数字特征高中数学必修一北师大版
等待时间
[0,5)
[5,10)
[10,15)
[15,20)
[20,25]
频数
4
8
5
2
1
9.5
则估计该医院急救中心病人的平均等待时间为____,病人等待时间的方差
28.5
为_____.
【解析】 记20位病人的平均等待时间为,等待时间的方差为 2 ,则
若在这组数据中插入一个自然数使得这组新数据满足中位数是7且平均数
4(答案不唯一)
大于7,则的值可以是_________________(写出符合条件的一个值即可).
【解析】 要使得中位数是7,必须插在7的前面,即 ≤ 7,平均数为
2+3+6++7+8+10+11+13
9
> 7,解得 > 3,又是自然数,所以 = 4,5,6,7.
[70,75), [75,80),[80,85), [85,90),[90,95),[95,100],则下列说法正确
的是( ACD )
A.估计该样本的众数是87.5
B.估计该样本的平均数是80
C.估计该样本的中位数是86
D.若测试成绩达到85分方可参加评奖,
则有资格参加评奖的大一新生约为
2 200人
【解析】 由题意,将这组数据按照从小到大的顺序排列,得1,2,2,,5,10,易
2+
2+
2
得这组数据的众数为2,中位数为 .又2 =
× ,所以
2
2
3
1
据的平均数为 × 1 + 2 + 2 + 4 + 5 + 10 = 4.
高中数学第6章统计3用样本估计总体分布3-1从频数到频率3-2频率分布直方图北师大版必修第一册
健身减肥前
体重区间
[80,90)
[90,100)
[100,110)
[110,120]
频率
0
30%
50%
20%
健身减肥后
体重区间
[80,90)
[90,100)
[100,110)
[110,120]
频率
10%
40%
50%
0
对比健身前后,关于这20名肥胖者,下面结论正确的是( AB )
纵轴(小长方形的高)表示频率与组距的比值.
名师点睛
频率分布直方图的特征
总体分布情况可以通过样本频率分布情况来估计,样本频率分布是总体分
布的一种近似表示,频率分布表和频率分布直方图有以下特征:(1)从频率
分布直方图可以清楚地看出数据分布的总体趋势.(2)从频率分布直方图得
不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹
4
分别是5,6,7,10,第五组的频率是0.2,那么第六组的频数是
,频率
是 0.1
.
解析 因为频率=
频数
,所以频数=频率×样本容量,因为第五组的频率是
样本容量
0.2,所以频数是 0.2×40=8,第六组的频数是 40-(5+6+7+10+8)=4,所以第六组
4
的频率是 =0.1.
40
规律方法 频数与频率的求解策略
密度.
3.[人教B版教材例题]我国是世界上严重缺水的国家之一,某市为了制定合
理的节水方案,对家庭用水情况进行了调查,通过抽样,获得了某年100个家
庭的月均用水量(单位:t),将数据按照[0,1),[1,2),[2,3),[3,4),[4,5]分成5组,制
北师大版高中数学 必修第一册 6.4用样本估计总体数字特征
.+.+.+.+.
2
乙 =
=10(t/hm
).
方差:甲 = ×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]
=0.02;
乙
=
2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244.
积产量(单位:t/hm2)如下:
品种
甲
乙
第一年
9.8
9.4
第二年
9.9
10.3
第三年
10.1
10.8
第四年
10
9.7
根据这组数据判断应该选择哪一种小麦进行推广?
分析:从平均数和方差两个角度去考虑.
第五年
10.2
9.8
解:平均数:
.+.+.++.
2);
甲 =
=10(t/hm
提示:(1)∵
=7,
( +)+( +)+( +)+( +)+( +)
∴
+ + + +
=
+1
=7+1=8.
即 x1+1,x2+1,x3+1,x4+1,x5+1 这 5 个数的平均数为 8.
+
(2)中位数为
=33.5,众数为
31.
2.填空:(1)平均数、中位数、众数.
高中数学课时素养评价四十二用样本估计总体分布含解析北师大版1
课时素养评价四十二用样本估计总体分布(15分钟30分)1.一个频数分布表(样本容量为30)不小心被损坏了一部分,若样本中数据在[20,60)上的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为()A。
15B。
16C。
17D。
19【解析】选A.由题意得,样本在[40,50),[50,60)内的数据个数共为30×0.8—4—5=15。
2。
样本容量为100的频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在[6,10)内的频数为a,样本数据落在[2,10)内的频率为b,则a,b分别是()A。
32,0.4B。
8,0。
1C。
32,0。
1D。
8,0.4【解析】选A。
样本数据落在[6,10)内的频率为0。
08×4=0.32,则a=100×0.32=32;由于样本数据落在[2,6)内的频率为0.02×4=0.08,则样本数据落在[2,10)内的频率b=0。
08+0。
32=0.4。
【补偿训练】某工厂对一批元件进行抽样检测.经检测,抽出的元件的长度(单位:mm)全部介于93至105之间.将抽出的元件的长度以2为组距分成6组:[93,95),[95,97),[97,99),[99,101),[101,103),[103,105],得到如图所示的频率分布直方图。
若长度在[97,103)内的元件为合格品,根据频率分布直方图,估计这批元件的合格率是()A.80%B。
90%C。
20%D。
85.5%【解析】选A.由频率分布直方图可知元件长度在[97,103)内的频率为1-(0.027 5+0.027 5+0.045 0)×2=0。
8,故这批元件的合格率为80%.3.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其他7个小长方形的面积和的,且样本容量为200,则第8组的频数为.【解析】设最后一个小长方形的面积为x,则其他7个小长方形的面积为4x,从而x+4x=1,所以x=0。
高中数学第六章统计3用样本估计总体分布频率分布直方图课后习题北师大版必修第一册
§3 用样本估计总体分布3.1 从频数到频率 3.2 频率分布直方图A 级必备知识基础练1.一个频数分布表(样本容量为30)不小心被损坏了一部分,若样本中数据在区间[20,60)上的频率为0.8,则估计样本在区间[40,50),[50,60)内的数据个数共为( )A.15B.16C.17D.192.(多选题)为弘扬中华民族传统文化,某中学学生会对本校高一年级1 000名学生课余时间参加传统文化活动的情况,随机抽取50名学生进行调查,将数据分组整理后,列表如下参加场数01234567参加人数占调查人数的百分比8%10%20%26%18%12%4%2%估计该校高一学生参加传统文化活动情况不正确的是( )A.参加活动次数是3场的学生约为360人B.参加活动次数是2场或4场的学生约为480人C.参加活动次数不高于2场的学生约为280人D.参加活动次数不低于4场的学生约为360人3.去年,相关部门对某城市“五朵金花”之一的某景区在“十一”黄金周中每天的游客人数作了统计,其频率分布如下表所示:时间10月1日10月2日10月3日10月4日10月5日10月6日10月7日频率0.050.080.090.130.300.150.20已知10月1日这天该景区的营业额约为8万元,假定这七天每天游客人均消费相同,则这个黄金周该景区游客人数最多的那一天的营业额约为 万元.4.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示).由图中数据可知a= .若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为.5.为了解某校高一1 000名学生的物理成绩,随机抽查了部分学生的期中考试成绩,将数据整理后绘制成如图所示的频率分布直方图.(1)估计该校高一学生物理成绩不低于80分的人数;(2)若在本次考试规定物理成绩在m分以上(包括m分)的为优秀,该校学生物理成绩的优秀率大约为18%,求m的值.B级关键能力提升练6.为了丰富教职工业余生活,某校计划在假期组织全体老师外出旅游,并给出了两个方案(方案一和方案二),每位老师均选择且只选择一种方案,其中有50%的男老师选择方案一,有75%的女老师选择方案二,且选择方案一的老师中女老师占40%,那么该校全体老师中女老师的比例为( )A.1 2B.47C.58D.347.(多选题)某市教体局对全市高三年级的学生身高进行抽样调查,随机抽取了100名学生,他们的身高都处在A,B,C,D,E五个层次内,根据抽样结果得到统计图表如图,则下面叙述正确的是( )女生身高情况直方图男生身高情况扇形图A.样本中女生人数多于男生人数B.样本中B层人数最多C.样本中E层男生人数为6人D.样本中D层男生人数多于女生人数8.某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80), [80,100].(1)图中的x= ;(2)若上学所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有 名学生可以申请住宿.9.某样本频率分布直方图如图所示,且在区间[15,18)内频数为8.求:(1)求样本容量;(2)若在区间[12,15)内的小矩形面积为0.06,求在区间[12,15)内的频数和样本在区间[18,33)内的频率.C级学科素养创新练10.为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50 kW·h至350 kW·h之间,进行适当分组后,画出频率分布直方图如图所示.(1)求a的值;(2)求被调查用户中,用电量大于250 kW·h的户数;(3)为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW·h)的建议.3.1 从频数到频率3.2 频率分布直方图=0.5.故样本在区间[40,50),1.A 由题易得在区间[40,50),[50,60)内的频率为0.8-4+530[50,60)内的数据个数共为30×0.5=15.故选A.2.ABC 参加活动场数为3场的学生约有1000×26%=260(人),A错误;参加活动场数为2场或4场的学生约有1000×(20%+18%)=380(人),B错误;参加活动场数不高于2场的学生约有1000×(8%+10%+20%)=380(人),C错误;参加活动场数不低于4场的学生约有1000×(18% +12%+4%+2%)=360(人),D正确.故选ABC.3.48 根据表格可知,10月1日这天的频率为0.05,营业额为8万;频率最高的为10月5日,频率为0.30.设这个黄金周10月5日的营业额约为x万元,由8 0.05=x0.30,得x=48,则游客人数最多的那一天的营业额约为48万元.4.0.030 3 因为频率分布直方图中各小长方形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由图可知身高在[120,150]内的学生人数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,所以从身高在[140,150]内的学生中选取的人数为1860×10=3.5.解(1)由频率分布直方图得,该校高一学生物理成绩不低于80分的频率为(0.03+0.024)×10=0.54,∴该校高一学生物理成绩不低于80分的人数为1000×0.54=540.(2)∵0.24>0.18,∴90<m<100,∴0.24-0.180.24=m-9010,解得m=92.5.6.B 设该校男老师的人数为x,女老师的人数为y,则可得如下表格:性别方案一方案二男老师0.5x0.5x女老师0.25y0.75y由题意,0.25y0.5x+0.25y =0.4,可得yx=43,所以yx+y =4 7.故选B.7.ABC 样本中女生人数为9+24+15+9+3=60,男生人数为100-60=40,A正确;样本中A层人数为9+40×10%=13,B层人数为24+40×30%=36,C层人数为15+40×25%=25,D层人数为9+40×20%=17,E层人数为3+40×15%=9,故B正确;样本中E层男生人数为40×15%=6,C正确;样本中D层男生人数为40×20%=8,女生人数为9,D错误.故选ABC.8.(1)0.0125 (2)72 (1)由频率分布直方图知20x=1-20×(0.025+0.0065+0.003+0.003),解得x=0.0125.(2)上学时间不少于1小时的学生的频率为0.003×2×20=0.12,因此估计有0.12×600=72(人)可以申请住宿.9.解(1)由频率分布直方图可知区间[15,18)对应y轴的数字为475,且组距为3,所以区间[15,18)对应频率为475×3=425,又已知在区间[15,18)内频数为8,所以样本容量为n=8425=50.(2)因为[12,15)内的小矩形面积为0.06,所以在区间[12,15)内频率为0.06,且样本容量为50,所以在区间[12,15)内的频数为50×0.06=3,又因为在区间[15,18)内的频数为8,所以在区间[18,33)内的频数为50-3-8=39.所以在区间[18,33)内的频率为3950=0.78.10.解(1)因为(0.0024+0.0036+a+0.0044+0.0024+0.0012)×50=1,所以a=0.0060.(2)根据频率分布直方图可知,“用电量大于250kW·h”的频率为(0.0024+0.0012)×50=0.18,所以用电量大于250kW·h的户数为100×0.18=18.(3)因为前三组的频率之和为(0.0024+0.0036+0.0060)×50=0.6<0.8,前四组的频率之和为(0.0024+0.0036+0.0060+0.0044)×50=0.82>0.8,所以频率为0.8时对应的数据在第四组,所以第一档用电标准为200+0.8-0.60.22×50≈245.5(kW·h).故第一档用电标准为245.5kW·h.。
用样本估计总体分布 课件-高一上学期数学北师大版(2019)必修第一册
思考探究:频率分布直方图的应用
• 思考探究:频率分布直方图的应用
例:暑假期间某班为了增强学生的社会实践能力,把该 班学生分成四个小组
到一果园帮果农测量果树的产 量,某小组来到一片种植苹果的山地,他们随
机选 取 20 株作为样本测量每一株的果实产量(单位 : kg ),获得的数据按照
我们把这样的图称为频率分布直方图.
频率
频率
,即小长方形的高
;
1 纵轴表示
组距
组距
频率
频率;
2 小长方形的面积 组距
组距
3 各个小长方形的面积总和等于 1 .
• 二、频率分布直方图
基于上面的分析,思考:怎样根据样本数据画出频率分布直方图呢?
以教材例3为例,一起探究频率分布直方图的画法
3,分组,
由于8个组的总长度40mm>极差,可取第一组的左端点小于数据最小值,最后一组的
右端点大于数据最大值,分成 [120,125),[125,130), ,[155,160].
• 二、频率分布直方图
频率分布直方图的绘制
4.列表,统计出各组信息,如下表,
• 二、频率分布直方图
频率分布直方图的绘制
• 思考探究:频率分布直方图的应用
例:在某中学举行的物理知识竞赛中,将三个 年级参赛学生的成绩进行整理后分成 5 组,
绘制出 如图所示的频率分布直方图,图中从左到右依次为 第一、第二、第三、第四、
第五小组。已知第三小 组的频数是 15 .
(1 ) 求成绩在 50, 70 内的频率;
2 求这三个年级参赛学生的总人数;
思考探究:频率分布直方图的应用
9.3随机抽样与用样本估计总体(北师大版)
在样本中有 50%的个体小于 或等于中位数,也有 50%的 个体大于或等于中位数,因 此,在频率分布直方图中,
中位数左边和右边的直方图
的面积应该相等.
平均数是频率分布直方图的“重心”.我们知
平 均
平均数在频 率分布表中 等于组中值
道,n 个样本数据 x1,x2,…,xn 的平均数 x = 1n(x1+x2+…+xn),则有 n x =x1+x2+…+xn,
出 现 fk 次(f1+ f2+ …+ fk= n), 则 这 n 个 数 的平均 数 为 : x =
x1fHale Waihona Puke +x2f2+…+xkfkn
(2)计算标准差的算法 ①算出样本数据的平均数;
②算出每个样本数据与样本平均数的差 xi- x (i=1,2,…,n); ③算出(xi- x )2(i=1,2,…,n);
(3)频率分布直方图及特点 ①频率分布直方图 以横轴表示样本分组,纵轴表示频率与组距的比值,以每个组 距为底,以各频率除以组距的商为高,分别画成矩形,这样就得到 了频率分布直方图. ②频率分布直方图的特点 从频率分布直方图可以清楚地看出数据分布的总体态势,但是 从直方图本身得不出原始的数据内容.所以,把数据表示成直方图 后,原有的具体数据信息就被抹掉了.
据的单位相同,不要漏写单位.
(6)样本平均数、标准差对总体平均数、标准差的估计 现实中的总体所包含的个体数往往是很多的,总体的平均数与标 准差是不知道(或不可求)的.如何求得总体的平均数与标准差呢?通 常的做法是用样本的平均数与标准差去估计总体的平均数与标准 差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只 要样本的代表性好,这样做就是合理的,也是可以接受的. 如要考查一批灯泡的质量,我们可从中随机抽取一部分作为样 本,要分析一批钢筋的强度,可以随机抽取一定数目的钢筋作为样本, 只要样本的代表性强就可以用来对总体作出客观的判断. 但需要注意的是,同一个总体,抽取的样本可以是不同的.如一 个总体包含 6 个个体,现在要从中抽取 3 个作为样本,所有可能的样 本会有 20 种不同的结果,若总体与样本容量较大,可能性就更多, 而只要其中的个体是不完全相同的,这些相应的样本频率分布与平均 数、标准差都会有差异.这就会影响到我们对总体情况的估计.
【优化方案】2012高考数学总复习 第11章§11.2用样本估计总体精品课件 理 北师大版
2.已知一个样本中的数据为 1,2,3,4,5,则该 . , 样本的标准差为( ) 样本的标准差为 B. 2 A. 1 . C. 3 D. 2 .
答案: 答案:B
3. (2011年济源调研 某雷达测速区规定 : . 年济源调研)某雷达测速区规定 年济源调研 某雷达测速区规定: 凡车速大于或等于70 km/h的汽车视为“超 的汽车视为“ 凡车速大于或等于 的汽车视为 并将受到处罚, 速”,并将受到处罚,如图是某路段的一个 检测点对200辆汽车的车速进行检测所得结 辆汽车的车速进行检测所得结 检测点对 果的频率分布直方图, 果的频率分布直方图,则从图中可以看出被 处罚的汽车大约有( 处罚的汽车大约有 )
例1 (2010年高考湖北卷 为了了解一个小水库 年高考湖北卷)为了了解一个小水库 年高考湖北卷
中养殖的鱼的有关情况, 中养殖的鱼的有关情况 , 从这个水库中多个不 同位置捕捞出100条鱼 , 称得每条鱼的质量 单 条鱼, 同位置捕捞出 条鱼 称得每条鱼的质量(单 位:kg),并将所得数据分组,画出频率分布直 ,并将所得数据分组, 方图(如图所示 如图所示). 方图 如图所示 .
3.用样本估计总体 . (1)我们对总体作出的估计一般分成两种.一种是用 我们对总体作出的估计一般分成两种. 我们对总体作出的估计一般分成两种 样本的频率分布估计_______________. 样本的频率分布估计 总体的分布 . 另一种是用 样本的数字特征估计____________________. 样本的数字特征估计 总体的数字特征 .
1 n 平均数:样本数据的算术平均数. 平均数:样本数据的算术平均数.即 x = ____
(x1+x2+…+xn) _____________________在频率分布直方图中,中 在频率分布直方图中, 在频率分布直方图中 位数左边和右边的直方图的面积应该________. 位数左边和右边的直方图的面积应该 相等 . (2)样本方差、标准差 样本方差、 样本方差 标准差 s= =
北师大版高中高二数学必修3《用样本估计总体》评课稿
北师大版高中高二数学必修3《用样本估计总体》评课稿一、引言《用样本估计总体》是北师大版高中高二数学必修3教材中的一章,主要介绍了如何通过从总体中抽取样本来估计总体的参数。
本课是高中数学中的重点内容之一,对学生培养数据分析和推理能力具有重要意义。
本文将对该章进行评课,从教材的编写、教学目标、教学内容、教学方法、教学效果等方面进行细致分析。
二、教材编写2.1 教材结构《用样本估计总体》是北师大版高中高二数学必修3教材的第八章,总共分为三个知识点:样本及其用途、样本均值的分布及其性质、总体均值的估计。
2.2 知识点设计教材将样本估计总体的相关概念和方法分门别类地进行介绍,层层递进,层次清晰。
每个知识点都以一个简洁明了的定义开始,然后结合具体例题进行阐述。
教材不仅介绍了样本的基本概念,还对样本均值的分布及其性质进行了详细的探究,最后给出了总体均值的估计方法。
三、教学目标3.1 知识目标通过学习《用样本估计总体》,学生应该掌握以下知识点:•了解样本的基本概念,理解样本和总体之间的关系;•掌握样本均值的计算方法,并了解其分布情况及性质;•学会使用样本均值来估计总体均值的方法。
3.2 能力目标通过学习《用样本估计总体》,学生应该培养以下能力:•能够正确得出样本均值的分布情况;•能够根据样本均值来合理估计总体均值;•能够利用样本数据进行统计推断。
四、教学内容4.1 样本及其用途在本部分中,教材首先对样本进行了定义,并介绍了样本的抽取方法。
接着,教材详细阐述了样本在统计学中的作用和用途,解释了样本的代表性和可靠性。
学生通过学习,能够理解样本在统计推断中的重要性,并了解到样本大小对估计结果的影响。
4.2 样本均值的分布及其性质教材接着介绍了样本均值的计算方法,并引入了中心极限定理,从而得出了样本均值的分布情况。
通过理论推导和实例分析,教材使学生更加理解了样本均值分布的特点和性质。
同时,教材还介绍了样本均值与总体均值之间的关系,为后续总体均值估计的内容做了铺垫。
北师大版必修3高中数学1.5、6用样本估计总体统计活动结婚年龄的变化课件
如下图所示,则新生婴儿体重(单位:g)在 [2700,3000)内的频率为( )
A.0.001 C.0.2
B.0.1
D.0.3 [答案] D [解析] 频率分布直方图中,各小矩形的面积 等于相应各组的频率.由频率分布直方图可 知,在区间[2700,3000)内取值的频率为 (3000-2700)×0.001=0.3.
已 知 一 个 样 本 : 30,29,26,24,25,27,26,22,24,25, 26,28,25,21,23,25,27,29,25,28. (1)列出样本的频率分布表; (2)画出频率分布直方图.
[思路分析]
由题目可获取以下主要信息: ①样本数据给出,容量为20; ②样本数据中,最大值是30,最小值是21, 解答本题可根据极差,选择适当的组距进行 分组,然后列表、画图即可.
fi 1 ________ ,所有小矩形的面积之和等于________ .
(3)在频率分布直方图中,按照分组的原则, 中点 再在左边和右边各加一个区间,从所加的左 边区间的________开始,用线段依次连接各 个矩形的顶端中点,直至右边所加区间的中 频率折线图 点,就得到一条折线,我们称之为 ________________. 概率 (4)当样本容量不断增大时,样本中落在每个 区间内的样本数的频率会越来越稳定于总体 在相应区间内取值的______.也就是说,一 般地,样本容量越大,用样本的频率分布去 减小 估计总体的分布就越准确. 光滑曲线 (5)随着样本容量的增大,所划分的区间数也
3.一个容量为80的样本最大值是140,最小
值是51,组距为10,则可以分成( A.10组 B.9组 C.8组 D.7组 [答案] B
[解析] 极差 140-51 = 10 =8.9,∴分为 9 组. 组距
北师大版数学必修三课件:第1章估计总体的分布
解决频率分布直方图的相关计算, 需掌握下列关系式: (1) 即小矩形的面积为数据落在相应区间的频率,注意纵坐标不是频率,而是频率 频率 组距=频率, 与组距的比; 组距 (2)各个小矩形面积的总和等于1; (3) 此关式可变形为
频数 =频率, 样本容量
频数 =样本容量, 样本容量 频率=频数. 频率
制作频率分布表的一般步骤:
(1) 计算极差, 确定组距和组数.在确定组距和组数时,要根据极极差的 大小, 数据的多少, 选择恰当的组距, 使表格不至于太长或太短; (2)分组, 通常对组内数值所在区间取左闭右开区间, 最后一组为闭区间 ; (3)计算频数、频率,列出频率分布表. 说明:组距与样本容量有关,一般样本容量越大,所分组数越多.当样本容 量不超过120时,按照数据的都少,常分成5~12组.在实际操作中,一般 要求各组的组距相等. 为方便起见,组距的选取力求“取整”. 组数=极差/组距. 如果极差不利于分组(如不能被组数整除),可适当增大样本所对应的 区间,如在左、右两端各增加适当范围.
0.07
0.05 0.03
频率/组距
体重(kg)
54.5 58.5 62.5 66.5 70.5 74.5
根据上图可得这100名学生中体重在[56.5,64.5]的学生人数 是( A. 20
C
) B. 30 C. 40 D. 50
2、观察新生婴儿的体重,其频率分布直方图如图所示,则 新生婴儿体重(2700,3000)的频率为: y 0.3 .
但是,在实际问题中,总体的信息往往不能全部得到,因此我们需要进行 抽样调查,从总体中抽取一部分作为样本,并用样本的各种信息来估计总 体的情况,包括它的分布和基本数字特征.一般的,总体分布是指总体中个 体所占比例.
从频数到频率6.3.2频率分布直方图 导学案(含答案)(2024)高一上学期北师大版必修 第一册
§3用样本估计总体分布3.1从频数到频率3.2频率分布直方图【学习目标】1.了解频数与频率的关系.2.掌握频率分布直方图的画法.3.会用频率分布直方图或频率折线图估计总体分布.4.会利用频率分布直方图或频率折线图解决实际问题.◆知识点一频数与频率1.频数:在统计学中,将样本按照一定的方法分成若干组,每个组内含有这个样本的个体的叫作频数.2.频率:某个组的频数与总数的比值叫作这个组的频率,即频数=频率.总数【诊断分析】判断正误.(请在括号中打“√”或“×”)(1)总数不变的情况下,某个组的频数越大,则该组的频率也越大.()(2)每个组的频数之比与频率之比是一样的.()◆知识点二频率分布直方图1.概念图中每个小矩形的底边长是该组的,每个小矩形的高是该组的频率与组距=的比,从而每个小矩形的面积等于该组的,即每个小矩形的面积=组距×频率组距频率.我们把这样的图叫作频率分布直方图.频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.2.绘制频率分布直方图的步骤(1)计算极差极差即一组数据中的差.(2)确定组距与组数①组距与组数的确定没有固定的标准,常常需要一个尝试与选择的过程.②组距和样本容量有关,一般样本容量越大,分的组也越多,当样本容量不超过120时,按照数据的多少,常分为5组~12组.③极差、组距、组数之间有如下关系:设k=,若k∈Z,则组数为k;若k∉Z,则组数为大于k的最小整数.(3)将数据分组按组距将数据分组,分组时,各组一般均为左闭右开区间,最后一组全是闭区间.(4)列频率分布表(5)画频率分布直方图画图时,应以横轴表示分组,纵轴表示各组频率与组距的比值,其相应组距上的频率应该等于.◆知识点三频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的开始,用线段依次连接各个矩形的,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.【诊断分析】样本容量越大,频率折线图就会越来越接近于一条光滑曲线吗?◆探究点一频数与频率例1 (1)某班学生在一次数学考试中各分数段以及人数为:[0,80),2人;[80,90),6人;[90,100),4人;[100,110),10人;[110,120),12人;[120,130),5人;[130,140),4人;[140,150],2人.那么分数在[100,130)内的频数以及频率分别为()A.27,0.56B.20,0.56C.27,0.6D.13,0.29(2)某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机抽取了24名笔试者的成绩,统计结果如下表所示:分数段 [60,65) [65,70) [70,75) [75,80) [80,85) [85,90] 人数234951据此估计允许参加面试的分数线是 ( )A .90B .85C .80D .75(3)一个容量为n 的样本,将其观测数据分成若干组,已知甲组的频数和频率分别为36和14,则n= ,频率为16的乙组的频数x= .[素养小结]要解决频数与频率的问题,首先要明确几个关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率=频数样本容量.◆ 探究点二 画频率分布直方图和频率折线图例2 已知一组样本数据:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.按[20.5,22.5),[22.5,24.5),[24.5,26.5),[26.5,28.5),[28.5,30.5]分成5组. (1)列出样本的频率分布表;(2)画出频率分布直方图和频率折线图;(3)根据频率分布直方图,估计总体中的数据出现在[23,28]内的频率.[素养小结]绘制频率分布直方图的关键点(1)在画频率分布直方图时,横轴表示随机变量的取值,纵轴表示频率组距,这样每一组的频率都可以用该组的组距为底,频率组距为高的小矩形的面积来表示,其中,矩形的高=频率组距=1组距×样本容量×频数;(2)同一组数据,如果组距不同,得到的频率分布直方图也会不同.◆ 探究点三 频率分布直方图的应用[提问] 在频率分布直方图中,各小矩形的高度之比、面积之比都等于对应频率之比吗?例3为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试.将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为体能达标,则估计该校全体高一年级学生的体能达标率是多少?(3)样本中体能不达标的学生人数是多少?变式(多选题)[2023·江西铜鼓中学高一月考] 供电部门对某社区1000户居民12月份人均用电情况进行统计后,按人均用电量(单位:kW·h)分为[0,10),[10,20),[20,30),[30,40),[40,50]五组,整理得到如图所示的频率分布直方图,则有关这1000户居民,下列说法正确的是()A.12月份人均用电量在[10,20)内的户数最多,有400户B.12月份人均用电量在[20,30)内的有300户C.12月份人均用电量不低于20 kW·h的有500户D.在这1000户居民中任选1户做进一步调查,选到的居民的人均用电量在[30,40)内的概率为120[素养小结]频率分布直方图的性质:(1)因为小矩形的面积=组距×频率=频率,所以各小矩形的面积表示相应各组的频率,这样,频组距率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1.=样本容量.(3)频数相应的频率拓展为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量(单位:kW·h),发现他们的月均用电量都在[50,350]内,按[50,100),[100,150),[150,200),[200,250),[250,300),[300,350]分组后,画出频率分布直方图如图所示.(1)求a的值;(2)求在被调查的用户中,月均用电量不少于250 kW·h的户数;(3)为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW·h)的建议,并简要说明理由.(结果保留一位小数)§3用样本估计总体分布3.1从频数到频率3.2频率分布直方图【课前预习】知识点一1.数目诊断分析(1)√(2)√[解析] (1)因为频数=频率,总数不变,所以某个组的频数越大,该组的频率也越大.总数(2)因为频数总数=频率,总数不变,所以每个组的频数之比与频率之比相同.知识点二1.组距 频率2.(1)最大值和最小值 (2)③极差组距(5)该组上的矩形的面积知识点三中点 顶端中点 诊断分析解:随着样本容量越来越大,所划分的区间个数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线. 【课中探究】探究点一例1 (1)C (2)C (3)144 24 [解析] (1)由题可得总人数为2+6+4+10+12+5+4+2=45,分数在[100,130)内的人数为10+12+5=27,所以所求频数为27,频率为2745=0.6.故选C .(2)由题意得,参加面试的人数占总人数的比例为100400=0.25.结合表中的数据可得,成绩在[80,90]内人数的频率为5+124=0.25,所以估计允许参加面试的分数线为80.故选C . (3)由题意得14=36n ,所以n=36×4=144,同理16=x144,解得x=24.探究点二例2 解:(1)频率分布表如下:分组 频数 频率 频率组距 [20.5,22.5) 2 0.1 0.05 [22.5,24.5) 3 0.15 0.075 [24.5,26.5) 8 0.4 0.2 [26.5,28.5) 4 0.2 0.1 [28.5,30.5]30.150.075(2)由(1)中的频率分布表可得频率分布直方图和频率折线图,如图所示.(3)由频率分布表和频率分布直方图得,样本数据出现在[23,28]内的频率为0.15+0.4+0.2=0.75,所以可以估计总体中的数据出现在[23,28]内的频率为0.75.探究点三提问解:等于.例3解:(1)由题意可知,第二小组的频率为42+4+17+15+9+3=0.08,又第二小组的频数为12,所以样本容量为120.08=150.(2)由频率分布直方图可估计该校高一年级学生的体能达标率为17+15+9+32+4+17+15+9+3×100%=88%.(3)由(1)(2)知体能达标率为88%,样本容量为150,所以体能不达标的学生频率为1-0.88=0.12, 所以样本中体能不达标的学生人数为150×0.12=18.变式ABC[解析] 根据频率分布直方图知,12月份人均用电量在[10,20)内的户数最多,有1000×0.04×10=400(户),A正确;12月份人均用电量在[20,30)内的户数为1000×0.03×10=300,B正确;12月份人均用电量不低于20 kW·h的频率是(0.03+0.01+0.01)×10=0.5,有1000×0.5=500(户),C正确;人均用电量在[30,40)内的有0.01×10×1000=100(户),所以在1000户居民中任选1户,选到的居民的人均用电量在[30,40)内的概率为1001000=110,D错误.故选ABC.拓展解:(1)因为(0.002 4+0.003 6+a+0.004 4+0.002 4+0.001 2)×50=1,所以a=0.006.(2)根据频率分布直方图可知月用电量不少于250 kW·h的频率为(0.002 4+0.001 2)×50=0.18,所以月用电量不少于250 kW·h的户数为100×0.18=18.(3)设月用电量在[50,t)内的频率为0.8,即第一档用电标准为t kW·h.因为前三组的频率之和为(0.002 4+0.003 6+0.006)×50=0.6<0.8,前四组的频率之和为(0.002 4+0.003 6+0.006+0.004 4)×50=0.82>0.8,所以t∈[200,250),所以t=200+0.8-0.60.0044≈245.5(kW·h).。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
频率分布直方图
频率
组距
0.10
0.0868
0.08 0.06 0.04 0.02
0
0.0018
120
0.0416
0.0472
0.0114 0.0018
125 130 135
140 145
0.0076 0.0018
150 155 160
X轴:组距
Y轴:
频率 组距
宽度/㎜
频率折线图
△fxi i
0.10 0.08 0.06 0.04
fi △xi
0.10
0.0868
0.08
0.06
X轴:组距
0.0472
0.0416
0.04 0.02
Y轴:
频率 组距
0.0114
0.0076
0 0.0018 0.0018
0.0018
各小长方形的面积= *组距=频率 120 125 130 135 140 145 150 155
频率 组距
160 宽度/㎜
②样本频率分布图:样本频率分布条形图、 样本频率分布直方图
③样本频率分布折线图
估计总体的分布
例 1895年,在英国伦敦有106块男性头盖骨被挖掘出土。经考证, 头盖骨的主人死于1665~1666年之间的大瘟疫。人类学家分别 测量了这些头盖骨的宽度,数据如下所示(单位:mm):
146 141 139 140 145 141 142 131 142 140 144 140 138 139 147 139 141 137 141 132 140 140 141 143 134 146 134 142 133 149 140 140 143 143 149 136 141 143 143 141 138 136 138 144 136 145 143 137 142 146 140 148 140 140 139 139 144 138 146 153 148 152 143 140 141 145 148 139 136 141 140 139 158 135 132 148 142 145 145 121 129 143 148 138 149 146 141 142 144 137 153 148 144 138 150 148 138 145 145 142 143 143 148 141 145 141
1、用样本去估计总体,是研究统计 问题的一个基本思想
2、前面我们学过的抽样方法有:简单 随机抽样、系统抽样、分层抽样。要 注意这几种抽样方法的联系与区别。
3、 初中时我们学习过样本的频率分 布,包括频数、频率的概念,频数分 布表和频数分布直方图的制作。
频率分布
频率=
频数 样本容量
频率分布的表示形式有: ①样本频率分布表;
各小长方形的面积之和=1
抽象概括
在上面的例子中,虽然我们是用 样本数据的频率分布来估计总体的分布, 与真正的总体分布是有差别的,但是当 样本量不断增大时,样本中落在每个区 间内的样本数的频率会越来越稳定于总 体在相应区间内取值的概率.也就是说, 一般地,样本容量越大,用样本的频率 分布去估计总体的分布就越精确.
0.0868
0.0416
0.0472
02 0
0.0114 0.0018 0.0018
0.0076 0.0018
115 120 125 130 135 140 145 150 155 160 165
宽度/ mm
观察上图,你能知道:
•
• (1)头盖骨的宽度位于哪个区间的数据最多?140~145
• (2)头盖骨的宽度在140~145 mm的频率约是多
请你估计在1665~1666年之间,英国男性头盖骨宽度的分 布情 况.
频数分布表与频率分布表
从表格中,我们就能估计出总体大致的 分布情况了,如在1665~1666年之间,英国 男性头盖骨宽度主要在136~149 mm之间, 135 mm以下以及150 mm以上所占的比率相 对较小等.
但是,这些关于分布情况的描述仍不够 形象,为了得到更为直观的信息,我们可 以再将表中的数据按照下面的方式分组:
78 .4 .2
所以将数据分成8组较合适.
3. 将数据分组( 给出组的界限)
[120, 125), [125, 130), [130, 135),……[155, 160) 共8组.
4. 列出频率分布表.(填写频率/组距一栏)
5. 画出频率分布直方图
8
频数频率分组表
注意:当数据在120个以内时,通常按照数 据的多少分成5~12组,在实际操作中,一般要 求各组的组距相等.
频数
50
46
40
△fxi i
0.10
0.08
0.0868
30 20
22
25
0.06 0.04
0.0416
0.0472
10 0
6 11
41
0.02
0.0114
0 0.0018 0.0018
0.0076 0.0018
120 125 130 135 140 145 150 155 160 宽度/㎜
120 125 130 135 140 145 150 155 160 宽度/㎜
1.5.1 用样本估计总体
问题提出
从前面的分析可以知道,当研究一个对象 时,如果能得到他们的全部数据(可以看作是 总体),我们就可以直接从中分析总体的各种 信息.如人口普查得到的数据较为全面,从中可 以很好地反映对象的重要信息.但是,在实际问 题中,总体的信息往往不能全部得到,因此我 们需要进行抽样调查,从总体中抽取一部分作 为样本,并用样本的各种信息来估计总体的情 况,包括它的分布和基本数字特征.
少? 0.434
• (3)头盖骨的宽度在135~140 mm的频率约是多
少? 0.208
• (4)头盖骨的宽度小于140 mm的频率约是多少?0.283
• (5)头盖骨的宽度在137~142 mm的频率约是多
少?
0.208×3/5+0.434×2/5=0.2984
频率分布直方图
图形的意义:频率分布直方图中各小长方形的面积 表示什么?各小长方形的面积之和为多少?
课内练习
一位植物学家想要研究某类植物生长1年之后的 高度,他随机抽取了60株此类植物,测得它们生 长1年之后的高度如下所示(单位:㎝): 73 84 91 68 72 83 75 58 87 41 48 61 65 72 92 68 73 43 57 78 80 59 84 42 67 69 64 73 51 65 63 82 90 54 63 76 61 68 66 78 55 81 94 79 45 67 70 98 76 72 72 91 86 75 76 50 69 69 56 74 (1)完成下表:
步骤:
画频率分布直方图
1. 求极差: ( 最大值与最小值的差)
最大值= 158 最小值= 121 所以,极差158-121= 37
2. 决定组距与组数:
当样本容量不超过120时, 按照数据的多少, 常分成5~12组.
为方便组距的选择应力求“取整”. 本题如果组距为5mm.
则
组数=
极差 组距
4 37.1 05.5