【最新】2018-2019学年度高中数学北师大版必修3教学案:第一章 估计总体的分布估计总体的数字特征
高中数学第一章统计估计总体的分布第一课时学案北师大版必修3
总体分布的估计(一)【目标引领】 1. 学习目标:体会分布的意义和作用,学会列频率分布表,会画频率分布条形图、直方图,会用频率分布表或分布条形图、直方图估计总体分布,并作出合理解释。
在解决问题过程中,进一步体会用样本估计整体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程,体会统计思维与确定性思维的差异。
2. 学法指导:当总体中的个体取不同数值很少时,可用频率分布表或频率分布条形图估计总体分布;当总体中的个体取不同数值较多,甚至无限时,可用频率分布表或频率分布直方图估计总体分布。
【教师在线】 1. 解析视屏:(1) 频率分布表:当总体很大或不便于获得时,可以用样本的频率分布来估计总体的频率分布。
我们把反映总体频率分布的表格为频率分布表。
(2) 编制频率分布表的步骤:① 求全距,决定组数和组距,组距=组数全距; ② 分组,区间一般左闭右开(为了遵循统计分组穷尽和互斥原则,所以统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内,即所谓“上限不在内”原则);⑶ 登记频数,计算频率,列出频率分布表。
(3) 条形图:条形图是用宽度相同的条形的高度或长度来表示数据变动的图形。
条形图可以横置也可以纵置,纵置时又称为柱形图,也就是说,当各类别放在纵轴时,称为条形图;当各类别放在横轴时,称为柱形图。
(4) 频率分布直方图:直方图是用矩形的宽度和高度来表示频率分布的图形(在平面直角坐标中,横轴表示数据分组,即各组组距,纵轴表示频率)。
(5)直方图与条形图的不同点:① 条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)是固定的;直方图是用面积表示各组频率的多少,矩形的高度表示每一组的频率除以组距,宽度则表示各组的组距,因此其高度与宽度均有意义。
② 此外,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
2.经典回放:例1 :为检测某产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件。
2018版高中数学北师大版必修三学案:第一章 统计 5-1 估计总体的分布-5-2 估计总体的数字特征 精品
5.1 估计总体的分布 5.2 估计总体的数字特征[学习目标] 1.学会列频率分布表,会画频率分布直方图.2.会用频率分布表或频率分布直方图估计总体分布,并作出合理解释.3.在解决问题过程中,进一步体会用样本估计总体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程.知识点一 频率分布表与频率分布直方图 1.用样本估计总体的两种情况 (1)用样本的频率分布估计总体的分布. (2)用样本的数字特征估计总体的数字特征. 2.作频率分布直方图的步骤(1)求极差:即一组数据中最大值和最小值的差;(2)决定组距与组数:将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.这时应注意:①一般样本容量越大,所分组数越多;②为方便起见,组距的选择应力求“取整”;③当样本容量不超过120时,按照数据的多少,通常分成5~12组. (3)将数据分组:按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间. (4)列频率分布表:一般分四列:分组、频数累计、频数、频率,最后一行是合计.其中频数合计应是样本容量,频率合计是1.(5)画频率分布直方图:画图时,应以横轴表示分组,纵轴表示频率/组距.其相应组距上的频率等于该组上的小长方形的面积.即每个小长方形的面积=组距×频率组距=频率.思考 为什么要对样本数据进行分组?答不分组很难看出样本中的数字所包含的信息,分组后,计算出频率,从而估计总体的分布特征.知识点二频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.题型一频率分布直方图的绘制例1调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171163163166166168168160168165 171169167169151168170168160174 165168174159167156157164169180 176157162161158164163163167161(1)作出频率分布表;(2)画出频率分布直方图.解(1)最低身高151 cm,最高身高180 cm,它们的差是180-151=29,即极差为29;确定组距为4,组数为8,列表如下:(2)反思与感悟 1.组数的决定方法是:设数据总数目为n,一般地,当n≤50,则分为5~8组;当50≤n≤120时,则分为8~12组较为合适.2.分点数的决定方法是:若数据为整数,则分点数据减去0.5;若数据是小数点后一位的数,则分点减去0.05,以此类推.3.画频率分布直方图小长方形高的方法是:假设频数为1的小长方形的高为h,则频数为k 的小长方形高为kh.跟踪训练1美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51, 60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.解(1)以4为组距,列表如下:(2)从频率分布表中可以看出60%左右的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小. 题型二 频率分布直方图的应用例2 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少? 解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的, 因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.反思与感悟 1.频率分布直方图的性质:(1)因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小. (2)在频率分布直方图中,各小矩形的面积之和等于1. (3)频数相应的频率=样本容量. 2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.跟踪训练2 如图所示是总体的一个样本频率分布直方图,且在[15,18)内频数为8. (1)求样本在[15,18)内的频率; (2)求样本容量;(3)若在[12,15)内的小矩形面积为0.06,求在[18,33)内的频数.解 由样本频率分布直方图可知组距为3.(1)由样本频率分布直方图得样本在[15,18)内的频率等于475×3=425.(2)样本在[15,18)内频数为8,由(1)可知,样本容量为8425=8×254=50.(3)∵在[12,15)内的小矩形面积为0.06,∴样本在[12,15)内的频率为0.06,故样本在[15,33)内的频数为50×(1-0.06)=47,又在[15,18)内频数为8,故在[18,33)内的频数为47-8=39. 题型三 频率分布与数字特征的综合应用例3 已知一组数据:125 121 123 125 127 129 125 128 130 129 126 124 125 127 126 122 124 125 126 128 (1)填写下面的频率分布表:(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数. 解 (1)(2)(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的精确值为125.(2)图中虚线对应的数据是125+2×58=126.25,事实上中位数为125.5.使用“组中值”求平均数:x =122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,平均数的精确值为x =125.75.反思与感悟 1.利用频率分布直方图估计数字特征: (1)众数是最高的矩形的底边的中点; (2)中位数左右两侧小矩形的面积相等;(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.跟踪训练3 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.求:(1)高一参赛学生成绩的众数、中位数. (2)高一参赛学生的平均成绩. 解 (1)由图可知众数为65, 又∵第一个小矩形的面积为0.3,∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5,∴中位数为60+5=65.(2)依题意,x=55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴平均成绩约为67分.1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是()A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确答案 C解析由用样本估计总体的性质可得.2.频率分布直方图中,小矩形的面积等于()A.组距B.频率C.组数D.频数答案 B解析根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率.3.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60C.120 D.140答案 D解析 设所求人数为N ,则N =2.5×(0.16+0.08+0.04)×200=140,故选D.4.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________. 答案 100 0.15解析 设参赛的人数为n ,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4, 依题意40n=0.4,∴n =100,优秀的频率是0.10+0.05=0.15.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,通常用样本的频率分布表或频率分布直方图去估计总体的分布.2.用同样的方法先后从总体中抽取两个大小相同的样本,但两次得到的样本频率分布表、样本频率分布直方图、样本的平均数和标准差仍然可能互不相同.如果抽样的方法比较合理,那么样本可以反映总体的信息,样本容量越大,越接近总体的真实情况.。
高中数学北师大版必修3 1.5 教学设计 《估计总体的分布》(数学北师大必修3)
《估计总体的分布》本节课在高中统计部分承上启下,地位非常重要。
一方面,通过学习抽样方法,学生已经会收集样本数据,但样本数据依旧杂乱无章,无法提取有效信息,如何处理样本数据成为燃眉之急;另一方面,本节课的学习也为后面研究总体密度曲线、用样本的数字特征估计总体的数字特征等知识奠定了基础。
【知识与能力目标】(1)通过实例体会分布的意义和作用;(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图、茎叶图;(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计。
【过程与方法目标】 通过对生活实例的探究,感知应用统计学知识解决问题的方法,理解数形结合的数学思想。
【情感与态度目标】通过实例对样本分析和总体的估计,感受用数学方法解决生活中的问题的过程,认识到数学对实际生活的指导价值。
【教学重点】:◆ 教材分析◆ 教学目标◆ 教学重难点◆会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
【教学难点】:能通过样本的频率分布估计总佒的分布。
◆课前准备◆多媒体课件◆教学过程一、回顾旧知问题:我们学习了那些统计图?这些统计图的特点是什么?各适合描述什么样的数据?从前面的分析可以知道,当研究一个对象时,如果能得到它们的全部数据(可以看做是总体),我们就可以直接从中分析总体的各种信息。
但是在实际问题中,总体的信息往往不能全部得到,因此我们需要抽样调查,从总体中抽取一部分作为样本,并用样本的各种信息来估计总体的情况,包括它的分布和基本数字特征。
这节课我们一起来学习用样本来估计总体的分布。
二、频率分布直方图及其作用1895年,在英国伦敦有106块男性头盖骨被挖掘出土。
经考证,头盖骨的主人死于1665—1666年之间的大瘟疫。
人类学家分别测量了这些头盖骨的宽度,数据如下所示:(单位mm)146 141 139 140 145 141 142 131 142 140 144 140 138 139 147 139 141 137 141 132 140 140 141 143 134 146 134 142 133 149 140 140 143 143 149 136 141 143 143 141 138 136 138 144 136 145 143 137 142 146 140 148 140 140 139 139 144 138 146 153 148 152 143 140 141 145 148 139 136 141 140 139 158 135 132 148 142 145 145 121 129 143 148 138 149 146 141 142 144 137 153 148 144 138 150 148 138 145 145 142 143 143 148 141 145 141请大家思考:用什么统计图可以直观表示上述数据的分布状况?你能根据上述数据估计在。
数学北师大版必修3教案:第一章统计 含解析
本章复习整体设计教学分析本节是对第一章知识和方法的归纳和总结,从总体上把握本章,使学生的基本知识系统化和网络化,基本方法条理化,本章内容是相互独立的,随机抽样是基础,在此基础上学习了用样本估计总体和变量间的相关关系,要注意它们的联系.本章介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测.当总体容量大或检测具有一定的破坏性时,可以从总体中抽取适当的样本,通过对样本的分析、研究,得到对总体的估计,这就是统计分析的基本过程.而用样本估计总体就是统计思想的本质.要准确估计总体,必须合理地选择样本,我们学习的是最常用的三种抽样方法.获取样本数据后,将其用频率分布表、频率分布直方图、频率折线图或茎叶图表示后,蕴涵于数据之中的规律得到直观的揭示.运用样本的平均数可以对总体水平作出估计,用样本的极差、方差(标准差)可以估计总体的稳定程度.对两个变量的样本数据进行相关性分析,可发现存在于现实世界中的回归现象.用最小二乘法研究回归现象,得到的线性回归方程可用于预测和估计,为决策提供依据.总之,统计的基本思想是从样本数据中发现统计规律,实现对总体的估计.三维目标1.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;2.能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.重点难点教学重点:会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学难点:能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.课时安排1课时教学过程导入新课为了系统地掌握本章知识,我们复习本章内容,教师直接点出课题.推进新课新知探究提出问题1.随机抽样的内容包括几部分?2.用样本估计总体包括几部分?3.变量间的相关关系包括几部分?活动:学生思考或交流,回顾所学,教师指导学生复习的思路和方法,及时总结提炼.讨论结果:1.随机抽样的内容包括三部分:(1)简单随机抽样抽签法:一般地,用抽签法从个体个数为N的总体中抽取一个容量为k的样本的步骤为:将总体中的所有个体编号(号码可以从1到N);将1到N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作).将号签放在同一箱中,并搅拌均匀;从箱中每次抽出1个号签,并记录其编号,连续抽取k次;从总体中将与抽到的签的编号相一致的个体取出.抽样具有公平性原则:等概率、随机性;抽签法适用于总体中个数N不大的情形.随机数表法:将总体中的N个个体编号时可以从0开始,例如当N=100时,编号可以是00,01,02, …,99.这样,总体中的所有个体均可用两位数字号码表示,便于使用随机数表.当随机地选定开始的数后,读数的方向可以向右,也可以向左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:对总体中的个体进行编号(每个号码位数一致);在随机数表中任选一个数作为开始;从选定的数开始按一定的方向读下去,得到数码.若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满为止;根据选定的号码抽取样本.(2)系统抽样系统抽样的步骤为:采用随机的方式将总体中的个体编号;将整个的编号按一定的间隔(设为k )分段,当N n (N 为总体中的个体数,n 为样本容量)是整数时,k = N n ;当N n 不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N ′能被n 整除,这时k = N ′n,并将剩下的总体重新编号;在第一段中用简单随机抽样确定起始的个体编号1 ;将编号为1,1+k ,1+2k ,…,1+(n -1)k 的个体抽出.(3)分层抽样例:某电视台在互联网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为应怎样进行抽样?分析:因为总体中人数较多,所以不宜采用简单随机抽样.又由于持不同态度的人数差异较大,故也不宜用系统抽样方法,而以分层抽样为妥.解:可用分层抽样方法,其总体容量为12 000.“很喜爱”占2 43512 000=4872 400,应取60×4872 400≈12人; “喜爱”占4 56712 000,应取60×4 56712 000≈23人; “一般”占3 92612 000,应取60×3 92512 000≈20人; “不喜爱”占1 07212 000,应取60×1 07212 000≈5人. 因此,采用分层抽样的方法在“很喜爱”“喜爱”“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样,其中所分成的各个部分称为“层”.分层抽样的步骤是:将总体按一定标准分层;计算各层的个体数与总体的个体数的比;按各层个体数占总体的个体数的比确定各层应抽取的样本容量;在每一层进行抽样(可用简单随机抽样或系统抽样).适用于总体中个体有明显的层次差异,层次分明的特点;总体中个体数 N 较大时,系统抽样、分层抽样二者选其一.2.用样本估计总体包括:(1)用样本的频率分布估计总体分布.频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图反映样本的频率分布.其一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.频率分布直方图的特征:通过频率分布直方图可以清楚地看出数据分布的总体趋势;通过频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.茎叶图.画茎叶图的步骤如下:①将每个数据分为茎(高位)和叶(低位)两部分;②将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;③将各个数据的叶按大小次序写在其茎右(左)侧.用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两组记录那么直观、清晰.(2)用样本的数字特征估计总体的数字特征.①众数、中位数、平均数以及利用频率分布直方图来估计众数、中位数、平均数. 利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字(最高矩形的中点). 估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.②标准差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.所谓“平均距离”,其含义可作如下理解:假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数,x i 到x 的距离是|x i -x |(i =1,2,…,n ).于是,样本数据x 1,x 2,…,x n 到x 的“平均距离”是s =|x 1-x |+|x 2-x |+…+|x n -x |n. 由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差s =1n[x 1-x 2+x 2-x 2+…+x n -x 2]. ③方差从数学的角度考虑,人们有时用标准差的平方s 2(即方差)来代替标准差,作为测量样本数据分散程度的工具:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.3.变量间的相关关系包括:(1)变量之间的相关关系相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫作相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.(2)两个变量的线性相关①散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫作散点图.②正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)③线性相关关系:像能用直线方程y =a +bx 近似表示的相关关系叫作线性相关关系.④线性回归方程:1122n n =a +bx 为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.上述式子展开后,是一个关于a ,b 的二次多项式,应用配方法,可求出使Q 为最小值时的a ,b 的值,即⎩⎪⎨⎪⎧ b =x 1y 1+x 2y 2+…+x n y n -n x y x 21+x 22+…+x 2n -n x 2,a =y -b x .其中,x =x 1+x 2+…+x n n ,y =y 1+y 2+…+y n n. 应用示例思路11 为了了解高一(1)班50名学生的视力状况,从中抽取10名学生进行检查.如何抽取呢?解法一:通常使用抽签法,方法是:将50名学生从1到50进行编号,再制作1到50的50个号签,把50个号签集中在一起并充分搅匀,最后随机地从中抽10个号签.对编号与抽中的号签的号码相一致的学生进行视力检查.解法二:下面我们用随机数表法求解上面的问题.对50个同学进行编号,编号分别为01,02,03,…,50;在随机数表中随机地确定一个数作为开始,如从下表第3行第29列的数7开始.16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28 从数7开始向右读下去,每次读两位,凡不在01到50中的数跳过去不读,遇到已经读过的数也跳过去,便可依次得到12,07,44,39,38,33,21,34,29,42,这10个号码,就是所要抽取的10个样本个体的号码.变式训练某学校有行政人员、教学人员和教辅人员共200人,其中教学人员与教辅人员的比为10∶1,行政人员有24人.①现采取分层抽样抽取容量为50的样本,那么行政人员中应抽取的人数为( ).A .3B .4C .6D .8②教学人员和教辅人员中应抽取的人数分别为________和________.答案:①C ②40 4例2 下列问题中,采用怎样的抽样方法较为合理?(1)从10台冰箱中抽取3台进行质量检查.(2)某电影院有32排座位,每排有40个座位,座位号为1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,需留下32名听众进行座谈.(3)某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.解:(1)总体容量比较小,用抽签法或随机数表法都很方便.(2)总体容量比较大,用抽签法或随机数表法比较麻烦,由于人员没有明显差异,且刚好32排,每排人数相同,可用系统抽样法.(3)由于学校各类人员对这一问题的看法可能差异较大,故应采用分层抽样法.变式训练要从已编号(1~60)的60枚最新研制的某种导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( ).A.5,10,15,20,25,30 B.3,13,23,33,43,53C.1,2,3,4,5,6 D.2,8,14,20,26,32答案:B例3 某单位在岗职工共624人,为了调查职工用于上班途中的时间,决定抽取10%的职工进行调查.如何采用系统抽样方法完成这一抽样?解:第一步:将624名职工用随机方式进行编号;第二步:从总体中剔除4人(剔除方法可用随机数表法),将剩下的620名职工重新编号(分别为000,001,002,…,619),并分成62段;第三步:在第一段000,001,002,…,009这十个编号中用简单随机抽样确定起始号码i0;第四步:将编号为i0,i0+10,i0+20, …,i0+610的个体抽出,组成样本.变式训练现有以下两项调查:①某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检查其装订质量状况;②某市有大型、中型与小型的商店共1 500家,三者数量之比为1∶5∶9.为了调查全市商店每日零售额情况,抽取其中15家进行调查.完成①②这两项调查宜采用的抽样方法依次是( ).A.简单随机抽样法,分层抽样法B.分层抽样法,简单随机抽样法C.分层抽样法,系统抽样法D.系统抽样法,分层抽样法答案:D思路2例1 为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如图1),已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4.第一小组的频数是5.图1(1)求第四小组的频率和参加这次测试的学生人数.(2)在这次测试中,学生跳绳次数的中位数落在第几小组内?(3)若参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩的优秀率是多少?解:(1)由于各小组频率的和是1,因此第四小组的频率为1-0.1-0.3-0.4=0.2;由于第一小组的频数是5,频率为0.1,因此总人数为5÷0.1=50.(2)由于第三小组的频率最大,因此学生跳绳次数的中位数落在第三小组内.(3)由第三小组的频率和第四小组的频率和为0.6,可知该校此年级跳绳成绩的优秀率是0.6.例2 下面是关于世界20个地区受教育的人口的百分比与人均收入的散点图.图2(1)图中两个变量有什么样的相关关系?(2)若利用散点图中的数据建立的回归方程为y =3.193x +88.193,且受教育的人口的百分比相差10%,其人均收入相差多少?解:(1)散点图中的样本点基本集中在一个条型区域中,因此两个变量呈线性相关关系.(2)回归方程的自变量系数为3.193,因此当受教育的人口的百分比相差10%时,其人均收入相差3.193×10=31.93.变式训练1.数据70,71,72,73的标准差是( ).A .2B .54C . 2D .52答案:D2.已知k 1,k 2,…,k 8的方差为3,则2(k 1-3),2(k 2-3),…,2(k 8-3)的方差为________. 答案:123.已知回归方程y =0.5x -0.81,则x =25时,y 的估计值为________.答案:11.69知能训练答案:乙品种 甲品种2.在一次文艺比赛中,12名专业人员和12名观众代表各组成一个评判小组,给参赛选手打分,下面是两个评判组对同一名选手的打分:小组A :42,45,48,46,52,47,49,55,42,51,47,45;小组B :55,36,70,66,75,49,46,68,42,62,58,47.通过计算说明小组A ,B 哪个更像是由专业人士组成的评判小组?答案:小组A .解:作出的茎叶图如图3.图3从这个茎叶图中可以看出乙班的数学成绩更好一些.拓展提升1.假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从下面随机数表第2行第18列的数开始向右读,请你依次写出最先检测的5袋牛奶的编号.84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 62 58 7973 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 06 13 42 99 66 02 79 54…解:从第2行第18列的数7开始向右读,每次读三位,凡是小于或等于799的数就为1个,即719,050,717,512,358是最先检测的5袋牛奶的编号.2.想象一下一个人从出生到死亡,在每个生日都测量其身高,并作出这些数据的散点图.这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分(2)求出这些数据的回归方程.(3)对于这个例子,你如何解释回归系数的含义?(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从3~16岁身高的年均增长数.(5)解释一下回归系数与每年平均增长的身高之间的联系.解:(1)作出的数据的散点图如图4.图4(2)用y表示身高,x表示年龄,则数据的回归方程为y=6.317x+71.984.(3)在该例中,回归系数6.317表示孩子在一年中增加的高度.(4)每年身高的增长数略.3~16岁的身高年均增长约为6.323 cm.(5)回归系数与每年平均增长的身高之间近似相等.课堂小结本节介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测.作业复习题一任选3题.设计感想本节复习了最常用的三种抽样方法.获取样本数据后,将其用频率分布表、频率分布直方图、频率折线图或茎叶图表示后,蕴涵于数据之中的规律得到直观的揭示.运用样本的平均数可以对总体水平作出估计,用样本的极差、方差(标准差)可以估计总体的稳定程度.对两个变量的样本数据进行相关性分析,可发现存在于现实世界中的回归现象.用最小二乘法研究回归现象,得到的线性回归方程可用于预测和估计,为决策提供依据.本节对第一章知识和方法进行了归纳和总结,使学生的基本知识系统化和网络化,基本方法条理化,有利于学生更好地用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.备课资料备选习题1.为了了解所加工的一批零件的长度,抽测了200个零件的长度,在这个问题中,200个零件的长度是 ( ).A.总体B.个体C.总体的一个样本D.样本容量答案:C2.用简单随机抽样方法从含有6个个体的总体中,抽取一个容量为2的样本,某一个体a“第一次被抽到的概率”“第二次被抽到的概率”“在整个抽样过程中被抽到的概率”分别是( ).A.16,16,16B.16,15,16C.16,16,13D.16,13,13答案:C3.在一个个体数目为1 003的总体中,要利用系统抽样抽取一个容量为50的样本,那么总体中每个个体被抽到的概率是( ).A.120B.150C.25D.501 003答案:D4.为了了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔k为( ).A.40 B.30 C.20 D.12答案:B5.一批热水器共有98台,其中甲厂生产的有56台,乙厂生产的有42台,用分层抽样法从中抽出一个容量为14的样本,那么甲、乙两厂各抽得的热水器的台数是( ).A.甲厂9台,乙厂5台B.甲厂8台,乙厂6台C.甲厂10台,乙厂4台D.甲厂7台,乙厂7台答案:B6.下列叙述中正确的是( ).A.通过频率分布表可以看出样本数据对于平均数的波动大小B.频数是指落在各个小组内的数据C.每小组的频数与样本容量之比是这个小组的频率D.组数是样本平均数除以组距答案:C7.某工厂生产产品,用传送带将产品送至下一个工序,质检人员每隔10分钟在传送带某一位置取一件检验,则这种抽样的方法为( ).A.简单随机抽样B.系统抽样C.分层抽样D.非上述情况答案:B8.频率分布直方图中,小长方形的面积等于( ).A.组距B.频率C.组数D.频数答案:B9.一组数据的方差为3,将这组数据中的每一个数据都扩大到原来的3倍,则所得到的这组新数据的方差是( ).A.1 B.27 C.9 D.3答案:B10.有两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2.那么样本甲和样本乙的波动大小情况是( ).A.甲、乙波动大小一样B.甲的波动比乙的波动大C.乙的波动比甲的波动大D.甲、乙的波动大小无法比较答案:C11.采用简单随机抽样从含10个个体的总体中抽取一个容量为4的样本,则个体a前两次未被抽到,第三次被抽到的概率为________.答案:11012.观察新生婴儿的体重,其频率分布直方图如图5:图5则新生婴儿体重在(2 700,3 000)的频率为________.答案:0.313.已知样本99,100,101,x ,y 的平均数是100,方差是2,则xy =________. 答案:9 99614.某中学高一年级有x 个学生,高二年级有900个学生,高三年级有y 个学生,现从这些学生中采用分层抽样抽取一个容量为370人的样本,若高一年级抽取120人,高三年级抽取100人,则全校高中部共有多少学生?解:由题意得x 120=y 100=900370-120-100,解得 x =720,y =600. 故该学校高中部共有学生2 220人.15.下图是某单位职工年龄(取正整数)的频数分布图,根据图形提供的信息,回答下列问题(直接写出答案).图6注:每组可含最低值,不含最高值.(1)该单位职工共有多少人?(2)不小于38岁但小于44岁的职工人数占职工总人数的百分比是多少?(3)如果42岁的职工有4人,那么年龄在42岁以上的职工有几人?解:(1)该单位有职工50人.(2)38~44岁之间的职工人数占职工总人数的60%.(3)年龄在42岁以上的职工有15人.解:x 甲=15(60+80+70+90+70)=74,x 乙=15(80+60+70+80+75)=73, s 2甲=15(142+62+42+162+42)=104,s 2乙=15(72+132+32+72+22)=56. ∵x 甲>x 乙,s 2甲>s 2乙,∴ 甲的平均成绩较好,乙的各门功课发展较平衡.17.下面是一个病人从4月7日起的体温记录折线图,观察图形回答下列问题:图7(1)护士每隔几小时给病人量一次体温?(2)这个病人的体温最高是多少摄氏度?最低是多少摄氏度?(3)这个病人在4月8日12时的体温是多少摄氏度?(4)这个病人的体温在哪段时间里下降得最快?在哪段时间里比较稳定?(5)图7中的横虚线表示什么?(6)从体温看,这个病人的病情是在恶化还是在好转?解:(1)6小时;(2)最高温度是39.5 ℃,最低温度是36.8 ℃;(3)4月8日12时的体温是37.5 ℃;(4)在4月7日6点到12点的体温下降得最快,4月9日12点到18点体温比较稳定;(5)虚线表示标准体温;(6)好转.18.从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图8所示.观察图形,回答下列问题:图8(1)79.5~89.5这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格).解:(1)频率为0.025×10=0.25,频数为60×0.25=15;(2)0.015×10+0.025×10+0.03×10+0.005×10=0.75.(设计者:方诚心)。
2018-2019学年高一数学北师大版必修三教学案:第一章§4 数据的数字特征
[核心必知]1.众数、中位数、平均数 (1)众数的定义:一组数据中重复出现次数最多的数称为这组数的众数,一组数据的众数可以是一个,也可以是多个.(2)中位数的定义及求法:把一组数据按从小到大的顺序排列,把处于最中间位置的那个数(或中间两数的平均数)称为这组数据的中位数.(3)平均数: ①平均数的定义:如果有n 个数x 1、x 2、…、x n ,那么x =x 1+x 2+…+x nn,叫作这n 个数的平均数.②平均数的分类:总体平均数:总体中所有个体的平均数叫总体平均数. 样本平均数:样本中所有个体的平均数叫样本平均数. 2.标准差、方差 (1)标准差的求法:标准差是样本数据到平均数的一种平均距离,一般用s 表示.s =1nx 1-x2+x 2-x2+…+x n -x2].(2)方差的求法:标准差的平方s 2叫作方差.s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].其中,x n 是样本数据,n 是样本容量,x 是样本均值. (3)方差的简化计算公式:s 2=1n[(x 21+x 22+…+x 2n )-n x 2]=1n(x21+x22+…+x2n)-x2.3.极差一组数据的最大值与最小值的差称为这组数据的极差.4.数字特征的意义平均数、中位数和众数刻画了一组数据的集中趋势,极差、方差刻画了一组数据的离散程度.[问题思考]1.一组数据的众数一定存在吗?若存在,众数是唯一的吗?提示:不一定.若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数;不是,可以是一个,也可以是多个.2.如何确定一组数据的中位数?提示:(1)当数据个数为奇数时,中位数是按从小到大顺序排列的中间位置的那个数.(2)当数据个数为偶数时,中位数为排列在最中间的两个数的平均值.讲一讲1.据报道,某公司的33名职工的月工资(单位:元)如下:(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平,结合此问题谈一谈你的看法.[尝试解答] (1)平均数是x=1 500+4 000+3 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+591=2 091(元).中位数是1 500元,众数是1 500元.(2)新的平均数是x′=1500+28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+1 788=3 288(元).中位数是1 500元,众数是1 500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.1.众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.2.众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.3.中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.当一组数据中的个别数据变动较大时,可用中位数描述它的某种集中趋势.练一练1.某公司销售部有销售人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:(1)求这15位销售人员该月销售量的平均数、中位数及众数;(2)假设销售部负责人把月销售额定为320件,你认为是否合理,为什么?如不合理,请你制定一个较为合理的销售定额.解:(1)平均数为115(1 800×1+510×1+250×3+210×5+150×3+120×2)=320(件),中位数为210件,众数为210件.(2)不合理,因为15人中有13人的销售量未达到320件,也就是说,虽然320是这一组数据的平均数,但它却不能反映全体销售人员的销售水平.销售额定为210件更合理些,这是由于210既是中位数,又是众数,是大部分人都能达到的定额.讲一讲2.甲、乙两机床同时加工直径为100 cm的零件,为了检验质量,各从中抽取6件进行测量,分别记录数据为:甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定. [尝试解答] (1)x 甲=16(99+100+98+100+100+103)=100,x 乙=16(99+100+102+99+100+100)=100,s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)两台机床所加工零件的直径的平均数相同,又s 2甲>s 2乙,所以乙机床加工零件的质量更稳定.在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性就越差;方差越小,数据越集中,质量越稳定.练一练2.对划艇运动员甲、乙两人在相同的条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲:27 38 30 37 35 31 乙:33 29 38 34 28 36根据以上数据,试估计两人最大速度的平均数和标准差,并判断他们谁更优秀. 解:x 甲=16×(27+38+30+37+35+31)=1986=33,s 2甲=16×[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]=946, s 甲=946≈3.96, x 乙=16×(33+29+38+34+28+36)=1986=33, s 2乙=16×[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]=766,s 乙=766≈3.56. 由上知,甲、乙两人最大速度的平均数均为33 m/s ,甲的标准差为3.96 m/s ,乙的标准差为3.56 m/s ,说明甲、乙两人的最大速度的平均值相同,但乙的成绩比甲的成绩更稳定,故乙比甲更优秀.讲一讲3.在一次科技知识竞赛中,两组学生的成绩如下表:已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.[尝试解答] (1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.(2)x 甲=12+5+10+13+14+6(50×2+60×5+70×10+80×13+90×14+100×6)=150×4 000=80(分), x 乙=14+4+16+2+12+12(50×4+60×4+70×16+80×2+90×12+100×12)=150×4 000=80(分).s 2甲=12+5+10+13+14+6[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,s 2乙=14+4+16+2+12+12[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.∵s 2甲<s 2乙,∴甲组成绩较乙组成绩稳定,故甲组好些.(3)甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人.从这一角度看,甲组的成绩较好.(4)从成绩统计表看,甲组成绩大于等于90分的有20人,乙组成绩大于等于90分的有24人,∴乙组成绩集中在高分段的人数多.同时,乙组得满分的人数比甲组得满分的人数多6人.从这一角度看,乙组的成绩较好.要正确处理此类问题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本讲的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.练一练3.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:(1)请填写下表:(2)从下列三个不同角度对这次测试结果进行分析:①从平均数和中位数相结合看,谁的成绩好些?②从平均数和命中9环及9环以上的次数相结合看,谁的成绩好些?③从折线图中两人射击命中环数的走势看,谁更有潜力?解:(1)由图可知,甲打靶的成绩为:2,4,6,8,7,7,8,9,9,10;乙打靶的成绩为:9,5,7,8,7,6,8,6,7,7.甲的平均数是7,中位数是7.5,命中9环及9环以上的次数是3;乙的平均数是7,中位数是7,命中9环及9环以上的次数是1.(2)由(1)知,甲、乙的平均数相同.①甲、乙的平均数相同,甲的中位数比乙的中位数大,所以甲成绩较好.②甲、乙的平均数相同,甲命中9环及9环以上的次数比乙多,所以甲成绩较好.③从折线图中看,在后半部分,甲呈上升趋势,而乙呈下降趋势,故甲更有潜力.【解题高手】【多解题】一个球队所有队员的身高如下(单位:cm):178, 179, 181, 182, 176, 183, 176, 180, 183, 175, 181, 185, 180, 184,问这个球队的队员平均身高是多少?(精确到1 cm) [解] 法一:利用平均数的公式计算.x -=114×(178+179+181+…+180+184)=114×2 523≈180.法二:建立新数据,再利用平均数简化公式计算. 取a =180,将上面各数据同时减去180,得到一组数据: -2,-1,1,2,-4,3,-4,0,3,-5,1,5,0,4. x -′=114×(-2-1+1+2-4+3-4+0+3-5+1+5+0+4)=114×3=314≈0.2,∴x -=x -′+a =0.2+180≈180. 法三:利用加权平均数公式计算. x -=114×(185×1+184×1+183×2+182×1+181×2+180×2+179×1+178×1+176×2+175×1)=114×2 523≈180.法四:建立新数据(方法同法二),再利用加权平均数公式计算. x -′=114×[5×1+4×1+3×2+2×1+1×2+0×2+(-1)×1+(-2)×1+(-4)×2+(-5)×1]=114×3≈0.2. ∴x -=x -′+a =0.2+180≈180.1.已知一组数据为20,30,40,50,50,60,70,80,其中平均数,中位数和众数大小关系是( )A .平均数>中位数>众数B .平均数<中位数<众数C .中位数<众数<平均数D .众数=中位数=平均数解析:选D 可得出这组数据的平均数、中位数和众数均为50.2.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本方差为( )A.65 B.65C. 2 D .2 解析:选D ∵样本的平均数为1,即15×(a +0+1+2+3)=1,∴a =-1,∴样本方差s 2=15×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.3.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92 解析:选A 将这组数据从小到大排列,得87,89,90,91,92,93,94,96. 故平均数x =87+89+90+91+92+93+94+968=91.5,中位数为91+922=91.5.4.(湖南高考)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)解析:该运动员五场比赛中的得分为8,9,10,13,15,平均得分x =8+9+10+13+155=11,方差s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.答案:6.85.甲、乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下:则两人射击成绩的稳定程度是________. 解析:∵x -甲=8,x -乙=8,s 2甲=1.2,s 2乙=1.6,∴s 2甲<s 2乙.∴甲稳定性强. 答案:甲比乙稳定6.某农科所为寻找高产稳定的油菜品种,选了三个不同的油菜品种进行试验,每一品种在五块试验田试种.每块试验田的面积为0.7公顷,产量情况如下表:解:x 1=21.0 kg ,x 2=21.0 kg ,x 3=20.48 kg ;s 21=0.572,s 22=2.572,s 23=3.5976,∴x 1=x 2>x 3,s 21<s 22<s 23. ∴第一个品种既高产又稳定.一、选择题1.在某项体育比赛中,七位裁判为一选手打出的分数为:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .92,2B .92,2.8C .93,2D .93,2.8解析:选B 去掉最高分95和最低分89后,剩余数据的平均数为x =90+90+93+94+935=92,方差为s 2=15×[(92-90)2+(92-90)2+(93-92)2+(94-92)2+(93-92)2]=15×(4+4+1+4+1)=2.8.2.已知一组数据为-3,5,7,x,11,且这组数据的众数为5,那么数据的中位数是( ) A .7 B .5 C .6 D .11解析:选B 这组数据的众数为5,则5出现的次数最多,∴x =5,那么这组数据按从小到大排列为-3,5,5,7,11,则中位数为5.3.如图所示,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x A 和x B ,样本标准差分别为s A 和s B ,则( )A.x A >x B ,s A >s BB.x A <x B ,s A >s BC.x A >x B ,s A <s BD.x A <x B ,s A <s B 解析:选B A 中的数据都不大于B 中的数据,所以x A <x B ,但A 中的数据比B 中的数据波动幅度大,所以s A >s B .4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均数为x ,则( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x解析:选D 易知中位数的值m e =5+62=5.5,众数m 0=5,平均数x =130×(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)≈6,所以m 0<m e <x .5.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( )A .57.2 3.6B .57.2 56.4C .62.8 63.6D .62.8 3.6 解析:选D 设该组数据为x 1,x 2,…,x n ,则1n(x 1+x 2+…+x n )=2.8,1n[(x 1-2.8)2+(x 2-2.8)2+…+(x n -2.8)2]=3.6,所以,所得新数据的平均数为1n [(x 1+60)+(x 2+60)+…+(x n +60)]=1n(x 1+x 2+…+x n )+60=2.8+60=62.8.所得新数据的方差为1n[(x 1+60-62.8)2+(x 2+60-62.8)2+…+(x n +60-62.8)2]=1n[(x 1-2.8)2+(x 2-2.8)2+…+(x n -2.8)2]=3.6. 二、填空题6.一个样本按从小到大的顺序排列为10,12,13,x,17,19,21,24,其中位数为16,则x =________.解析:由中位数的定义知x +172=16,∴x =15.答案:157.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如表所示:则以上两组数据的方差中较小的一个为s 2=________. 解析:计算可得两组数据的平均数均为7, 甲班的方差s 2甲=-2+02+02+-2+025=25; 乙班的方差s 2乙=-2+02+-2+02+-25=65. 则两组数据的方差中较小的一个为s 2甲=25.答案:258.(湖北高考)某学员在一次射击测试中射靶10次,命中环数如下:7, 8,7,9,5,4,9,10,7,4则(1)平均命中环数为________;(2)命中环数的标准差为________.解析:(1)由公式知,平均数为110(7+8+7+9+5+4+9+10+7+4)=7;(2)由公式知,s 2=110(0+1+0+4+4+9+4+9+0+9)=4⇒s =2.答案:(1)7 (2)2 三、解答题9.为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如下表:(1)求这50户居民每天丢弃旧塑料袋的平均数、众数和中位数;(2)求这50户居民每天丢弃旧塑料袋的标准差.解:(1)平均数x=150×(2×6+3×16+4×15+5×13)=18550=3.7.众数是3,中位数是4.(2)这50户居民每天丢弃旧塑料袋的方差为s2=150×[6×(2-3.7)2+16×(3-3.7)2+15×(4-3.7)2+13×(5-3.7)2]=150×48.5=0.97,所以标准差s≈0.985.10.某校甲班、乙班各有49名学生,两班在一次数学测验中的成绩(满分100分)统计如下表:(1)请你对下面的一段话给予简要分析:甲了85分,在班里算是上游了!”(2)请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议.解:(1)由中位数可知,85分排在第25名之后,从名次上讲,85分不算是上游.但也不能单以班的小刚回家对妈妈说:“昨天的数学测验,全班平均79分,得70分的人最多,我得名次来判断学习成绩的好坏,小刚得了85分,说明他对这阶段的学习内容掌握较好.(2)甲班学生成绩的中位数为87分,说明高于或等于87分的学生占一半以上,而平均分为79分,标准差很大,说明低分也多,两极分化严重,建议对学习有困难的同学多给一些帮助;乙班学生成绩的中位数和平均分均为79分,标准差小,说明学生成绩之间差别较小,成绩很差的学生少,但成绩优异的学生也很少,建议采取措施提高优秀率.。
最新北师大版高中数学必修三全册精品教案
北师大版高中数学必修3第一章《统计》全部教案第一课时§1.1随机选取数字一、教学目标1、知识与技能:(1)使学生认识统计活动所要研究的问题,如何分析数据资料;(2)明确为什么要随机选取数字,随机选取数字的困难性,精心设计调查方案的重要性.2、情感、态度与价值观:让学生体会学习统计,参与统计活动的使用价值,提高学生参与意识以及理论与实际相结合的能力.二、教学重点、难点与关键1、重点、难点:随机选取数字把握的困难性及其原因;2、关键:通过对具体是;事例的分析来说明对随机选取数字的困难性.三、教学方法:讨论探究法四、教学过程(一)创设情景,引入新课在日常生活中常遇到如下一些问题(1)学校国庆节期间要举行一次大型的文艺汇演,限于演出场所的原因,每个班只有3张票,如何进行分配呢?(2)某工厂要检验一批产品质量,决定从这批产品中任意抽取10个进行检验,以判断产品的质量如何?(3)为了评选本年度先进学生代表,学校对候选人进行量化,让全体学生去评选你是如何看待和参与呢?你认为人为因素的干扰大吗?真正作到公平、公正难度大吗?上面一些生活中的事例看似简单,但要真正作到“随机”,“任意”都困难很大,为什么呢,本节课将通过具体事例认真地研究这个问题.(二)统计活动及其对选取数据的分析例:北京市某中学通过对343名学生做了下面一项统计活动,调查的过程如下(1)调查者事先做好问卷;(2)给每个被调查者发放问卷,并进行回收;(3)对所有的调查数据进行汇总.数据 1 2 3 4 5 6 7 8 9 10统计结果:正正正正▔正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正ˉ 正正正人数 21 24 29 25 45 45 54 35 46 19根据上面的数据回答下面问题:(1)计算出选择各个数的百分比(用四舍五入方法保留到百分数的整数位).(2)用下面的统计图表示上面的数据时,你觉得哪种统计图最合适?说明理由.(3)请你分析这些数据的集中趋势与离散程度.(4)从上面的数据能否看出,选哪些数的人少些,由此你能得到什么结论?解:(1)计算出选择各个数的百分比(要求学生用计数器算出后汇总)数字 1 2 3 4 5 6 7 8 9 10人数/人 21 24 29 25 45 45 54 35 46 19百分比/% 6 7 8 7 13 13 16 10 14 6(2)数据汇总后呈现往往用统计图.统计图有三种形式:条形统计图,折线统计图,扇形统计图,它们各有特点(让学生交流后汇总)本题所所关心的问题是选择各个数的人占总人数的百分比情况,因此选择扇形统计图比较合适,它能够比较清楚地表示百分比的情况.(3)分析数据的集中趋势,离散程度往往以平均数,众数,方差,中位数等方面进行分析(请大家回顾一下平均数,众数,方差,中位数有关概念,并用计数器计算)平均数 .众数为.方差为(4)从扇形统计图上可以看出,选1,2,3,4,10的人比较少,选其它数字的人较多.而随机选取这些数的理想状态,应当是选择到每个数的人数基本相当,且方差很小.由此,我们可以看出,由于个人偏好,人很难达到随机地选择数.(三)如何做到随机性从上面的分析可以看出,对随机性把握困难较大,主要原因是在选择处理时往往受到各种各样的主观因素的干扰,如何避免出现干扰,做到随机性就成为统计活动中必须注意解决的问题. (1)对统计方案进行仔细地设计,避免一些外界因素干扰,要确定调查对象,调查方案与策略,精心设计调查问卷.做好统计的前期工作,收集数据方法.(2)对采集到的数据要进行分析(汇总与呈现)做出统计判断.(四)、课堂小结1、统计活动中,要做到随机性,困难很大.主要原因是主观因素的干扰.2、要做到随机性必须仔细地设计调查方案及做好统计的前期工作.3、采集到的数据要进行汇总、呈现与分析.往往用条形统计图,折线统计图,扇形统计图呈现;分析数据往往用平均数,众数,方差,中位数分析,方差越小,统计准确性越高.(五)、练习:P6练习题(六)、作业: P7 2五、教后反思:第二课时§1.2从普查到抽样一、教学目标:1.了解普查的意义.2.结合具体的实际问题情境,理解随机抽样的必要性和重要性.二、重难点:结合具体的实际问题情境,理解随机抽样的必要性和重要性.三、教学方法:阅读材料、思考与交流四、教学过程(一)、普查1、【问题提出】 P7通过我国第五次人口普查的有关数据,让学生体会到统计对政府决策的重要作用――统计数据可以提供大量的信息,为国家的宏观决策提供有关的支持.教科书通过对人口普查的有关新闻报道,让学生体会人口普查的规模是何等的宏大与艰辛.教科书提出了三个有代表性的问题.第一个问题主要是针对人口普查的作用,人口普查可以了解一个国家人口全面情况,比如,人口总数、男女性别比、受教育状况、增长趋势等.人口普查是对国家的政府决策实行情况的一个检验,比如,国家计划生育政策,经济发展战略,国家“普及九年义务教育”政策,人民群众的生活水平等.第二个问题是针对普查本身存在的问题提出的,以加深学生对于普查的理解.学生可能有一个误解,普查就是100%的准确,其实不然,即使是最周全的调查方案,在实际执行时都会产生一个误差.教科书通过这个问题,目的是让学生理解在人口普查中出现漏登是正常情况,调查方案的设计是尽可能让这个误差降低到最小.同时,也要让学生理解人口普查的工作,即使出现漏登现象,人口普查的数据对国家的宏观决策依然具有重要的作用.第三个问题是针对人口普查工作的艰辛而提出的,让学生体会人口普查数据得来不易,要尊重人口普查人员的劳动,对人口普查工作要大力支持.2、【阅读材料】 P4“阅读材料”是课堂阅读,目的是让学生了解普查工作的特点和重要性,以及我国目前主要的一些普查工作.进而,总结出普查的主要不足之处,这是从一个方面说明了抽样调查的必要性.普查是指一个国家或一个地区专门组织的一次性大规模的全面调查,目的是为了详细地了解某项重要的国情、国力.普查主要有两个特点:(1)所取得的资料更加全面、系统;(2)主要调查在特定时段的社会经济现象总体的数量.普查是一项非常艰巨的工作,它要对所有的对象进行调查.当普查的对象很少时,普查无疑是一项非常好的调查方式.(二)、抽样调查【例1和其后的“思考交流”】 P8~9紧接着,教科书通过例1和“思考交流”的两个问题,让学生了解普查有时候难以实现.这主要有两个方面的原因,其一,被调查对象的量大;其二,普查对被调查对象本身具有一定的破坏性.这从另一个方面说明了抽样调查的必要性.然后,教科书通过抽象概括总结出抽样调查的两个主要优点.【例2和其后的“思考交流”】 P9~10主要是讨论在抽样调查时,什么样的样本才具有代表性.在抽样时,如果抽样不当,那么调查的结果可能会出现与实际情况不符,甚至是错误的结果,导致对决策的误导.在抽样调查时,一定要保证随机性原则,尽可能地避免人为因素的干扰;并且要保证每个个体以一定的概率被抽取到;同时,还要注意到要尽可能地控制抽样调查中的误差.由于检验对象的量很大,或检验对检验对象具有破坏性时,通常情况下,所以采用普查的方法有时是行不通的.通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此调查对象的某项指标做出推断,这就是抽样调查.其中,调查对象的全体称为总体,被抽取的一部分称为样本.抽样调查的优点:抽样调查与普查相比,有很多优点,最突出的有两点:(1)迅速、及时;(2)节约人力、物力和财力.例1为了考察某地10 000名高一学生的体重情况,从中抽出了200名学生做调查.这里统计的总体、个体、样本、总体容量、样本容量各指什么?为什么我们一般要从总体中抽取一个样本,通过样本来研究总体?解:统计的总体是指该地10 000名学生的体重;个体是指这10 000名学生中每一名学生的体重;样本指这10 000名学生中抽出的200名学生的体重;总体容量为10 000;样本容量为200.若对每一个个体逐一进行“调查”,有时费时、费力,有时根本无法实现,一个行之有效的办法就是在每一个个体被抽取的机会均等的前提下从总体中抽取部分个体,进行抽样调查.例2为了制定某市高一、高二、高三三个年级学生校服的生产计划,有关部门准备对180名初中男生的身高作调查,现有三种调查方案:A.测量少年体校中180名男子篮球、排球队员的身高;B.查阅有关外地180名男生身高的统计资料;C.在本市的市区和郊县各任选一所完全中学,两所初级中学,在这六所学校有关年级的小班中,用抽签的方法分别选出10名男生,然后测量他们的身高.为了达到估计本市初中这三个年级男生身高分布的目的,你认为采用上述哪一种调查方案比较合理,为什么?解:选C方案.理由:方案C采取了随机抽样的方法,随机样本比较具有代表性、普遍性,可以被用来估计总体.例3中央电视台希望在春节联欢晚会播出后一周内获得当年春节联欢晚会的收视率.下面三名同学为电视台设计的调查方案.甲同学:我把这张《春节联欢晚会收视率调查表》放在互联网上,只要上网登录该网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快统计收视率了.乙同学:我给我们居民小区的每一份住户发一个是否在除夕那天晚上看过中央电视台春节联欢晚会的调查表,只要一两天就可以统计出收视率.丙同学:我在电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们是否收看了中央电视台春节联欢晚会,我不出家门就可以统计出中央电视台春节联欢晚会的收视率.请问:上述三名同学设计的调查方案能够获得比较准确的收视率吗?为什么?解:综上所述,这三种调查方案都有一定的片面性,不能得到比较准确的收视率.(三)、课堂小结:1、普查是一项非常艰巨的工作,它要对所有的对象进行调查.当普查的对象很少时,普查无疑是一项非常好的调查方式.普查主要有两个特点:(1)所取得的资料更加全面、系统;(2)主要调查在特定时段的社会经济现象总体的数量.2、通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此调查对象的某项指标做出推断,这就是抽样调查.其中,调查对象的全体称为总体,被抽取的一部分称为样本.抽样调查的优点:抽样调查与普查相比,有很多优点,最突出的有两点:(1)迅速、及时;(2)节约人力、物力和财力.(四)、作业:P10练习题;P10【习题1―2】五、教后反思:第三课时§1.3抽样方法(一)——简单随机抽样一、教学目标:1、知识与技能:正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤;2、过程与方法:(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本.3、情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性.二、重点与难点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本.三、教学方法:观察、思考、交流、讨论、概括.四、教学过程(一)创设情景,揭示课题假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本.(为什么?)那么,应当怎样获取样本呢?(二)、探究新知1、简单随机抽样的概念:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本.【小结】简单随机抽样必须具备下列特点:(1)简单随机抽样要求被抽取的样本的总体个数N是有限的.(2)简单随机样本数n小于等于样本总体的个数N.(3)简单随机样本是从总体中逐个抽取的.(4)简单随机抽样是一种不放回的抽样.(5)简单随机抽样的每个个体入样的可能性均为n/N.思考?下列抽样的方式是否属于简单随机抽样?为什么?(1)从无限多个个体中抽取50个个体作为样本.(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子.2、、抽签法和随机数法(1)、抽签法的定义:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n 的样本.【小结】抽签法的一般步骤:(1)将总体的个体编号.(2)连续抽签获取样本号码.思考?你认为抽签法有什么优点和缺点:当总体中的个体数很多时,用抽签法方便吗?(2)、随机数法的定义:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法,这里仅介绍随机数表法.怎样利用随机数表产生样本呢?下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行.第一步,先将800袋牛奶编号,可以编为000,001, (799)第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 7884 42 17 53 31 57 24 55 06 88 77 04 74 47 6763 01 63 78 59 16 95 55 67 19 98 10 50 71 7533 21 12 34 29 78 64 56 07 82 52 42 07 44 3857 60 86 32 44 09 47 27 96 54 49 17 46 09 6287 35 20 96 43 84 26 34 91 6421 76 33 50 25 83 92 12 06 7612 86 73 58 07 44 39 52 38 7915 51 00 13 42 99 66 02 79 5490 52 84 77 27 08 02 73 43 28第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本.【小结】随机数表法的步骤:(1)将总体的个体编号.(2)在随机数表中选择开始数字.(3)读数获取样本号码.(三)、例题精析例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?[分析] 简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样.例2:某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?[分析] 简单随机抽样一般采用两种方法:抽签法和随机数表法.解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径.解法2:(随机数表法)将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本.(四)、课堂练习P13练习题(五)、课堂小结 1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型.3、简单随机抽样每个个体入样的可能性都相等,均为n/N,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的可能性这三种情况区分开业,避免在解题中出现错误.(六)、作业布置:1、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是A.总体是240 B、个体是每一个学生C、样本是40名学生D、样本容量是402、为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是()A、总体B、个体是每一个学生C、总体的一个样本D、样本容量3、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是 .4、从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是 .五、教后反思:第四课时§1.3抽样方法(二)——系统抽样一、教学目标1、知识与技能:(1)正确理解系统抽样的概念;(2)掌握系统抽样的一般步骤;(3)正确理解系统抽样与简单随机抽样的关系;2、过程与方法:通过对实际问题的探究,归纳应用数学知识解决实际问题的方法,理解分类讨论的数学方法,3、情感态度与价值观:通过数学活动,感受数学对实际生活的需要,体会现实世界和数学知识的联系.二、重点与难点:正确理解系统抽样的概念,能够灵活应用系统抽样的方法解决统计问题.三、教学方法:观察、思考、交流、讨论、概括.四、教学过程(一)、创设情境某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?(二)、探究新知1、系统抽样的定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.【小结】由系统抽样的定义可知系统抽样有以下特证:(1)当总体容量N 较大时,采用系统抽样.(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k =[n N].(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.思考?(1)你能举几个系统抽样的例子吗?(2)下列抽样中不是系统抽样的是 ( )A 、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样B 工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C 、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止D 、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈 点拨:(2)c 不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样.2、系统抽样的一般步骤:(1)采用随机抽样的方法将总体中的N 个个编号.(2)将整体按编号进行分段,确定分段间隔k(k ∈N,L ≤k).(3)在第一段用简单随机抽样确定起始个体的编号L (L ∈N,L ≤k ).(4)按照一定的规则抽取样本,通常是将起始编号L 加上间隔k 得到第2个个体编号L+K ,再加上K 得到第3个个体编号L+2K ,这样继续下去,直到获取整个样本.【小结】从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.(三)、例题精析例1、某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.[分析]按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号.解:按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k ≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293.例2、从忆编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是A .5,10,15,20,25B 、3,13,23,33,43C .1,2,3,4,5D 、2,4,6,16,32[分析]用系统抽样的方法抽取至的导弹编号应该k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k 是1到10中用简单随机抽样方法得到的数,因此只有选项B 满足要求,故选B. (四)、课堂练习P49 练习1. 2. 3(五)、课堂小结:1、在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为:(1)采用随机的方法将总体中个体编号;(2)将整体编号进行分段,确定分段间隔k(k ∈N);(3)在第一段内采用简单随机抽样的方法确定起始个体编号L ;(4)按照事先预定的规则抽取样本.2、在确定分段间隔k 时应注意:分段间隔k 为整数,当n N不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k. (六)、作业:1、从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为 ( )A .99B 、99,5C .100D 、100,52、从学号为0~50的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是 ( )A .1,2,3,4,5B 、5,16,27,38,49C .2, 4, 6, 8, 10D 、4,13,22,31,403、采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体人样的可能性为 ( )A .8 B.8,3 C .8.5 D.94、某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是 抽样方法.。
2018版高中数学北师大版必修三学案:第一章 统计 4-1 平均数、中位数、众数、极差、方差-4-2 标准差 精品
4.1 平均数、中位数、众数、极差、方差4.2 标准差[学习目标] 1.掌握各种基本数字特征的概念、意义以及它们各自的特点.2.要重视数据的计算,体会统计思想.知识点一 众数、中位数、平均数 1.众数、中位数、平均数定义(1)众数:一组数据中重复出现次数最多的数.(2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数称为这组数据的中位数.(3)平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n (x 1+x 2+…+x n )称为这n 个数的平均数.2.三种数字特征与频率分布直方图的关系1.标准差(1)平均距离与标准差标准差是样本数据到平均数的一种平均距离,一般用s 表示.假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i =1,2,…,n ),则用如下公式来计算标准差: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)计算标准差的步骤 ①求样本数据的平均数x ;②求每个样本数据与样本平均数的差x i -x (i =1,2,…,n ); ③求(x i -x )2(i =1,2,…,n );④求s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2];⑤求s =s 2,即为标准差. 2.方差标准差的平方s 2叫作方差.s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中,x i (i =1,2,…,n )是样本数据,n 是样本容量,x 是样本平均数.题型一 众数、中位数、平均数的简单运用 例1 某公司的33名职工的月工资(以元为单位)如下表:(1)(2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是多少?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法. 解 (1)平均数是:x =1 500+4 000+3 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+591=2 091(元),中位数是1 500元,众数是1 500元. (2)新的平均数是x ′=1 500+28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+1 788=3 288(元),新的中位数是:1 500元,新的众数是1 500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.反思与感悟 1.众数、中位数及平均数都是描述一组数据集中趋势的量,当一组数据中个别数据较大时,可用中位数描述其集中趋势,当一组数据中有不少数据重复出现时,其众数往往更能反映问题.2.在求平均数时,可采用新数据法,即当所给数据在某一常数a 的左右摆动时,用简化公式:x =x ′+a .跟踪训练1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:解 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表格里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是 1.70;这组数据的平均数是x =117(1.50×2+1.60×3+…+1.90×1)=28.7517≈1.69(m).答 17名运动员成绩的众数、中位数、平均数依次为1.75 m ,1.70 m,1.69 m. 题型二 平均数和方差的运用例2 甲、乙两机床同时加工直径为100 cm 的零件,为检验质量,各从中抽取6件测量,数据为甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定. 解 (1)x 甲=16(99+100+98+100+100+103)=100,x 乙=16(99+100+102+99+100+100)=100.s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1. (2)两台机床所加工零件的直径的平均值相同,又s 2甲>s 2乙,所以乙机床加工零件的质量更稳定.反思与感悟 1.极差、方差与标准差的区别与联系: 数据的离散程度可以通过极差、方差或标准差来描述.(1)极差是数据的最大值与最小值的差,它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.(2)方差则反映了一组数据围绕平均数波动的大小,为了得到以样本数据的单位表示的波动幅度通常用标准差,即样本方差的算术平方根,是样本数据到平均数的一种平均距离. 2.在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,质量越稳定.跟踪训练2 某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg): 甲:102 101 99 98 103 98 99 乙:110 115 90 85 75 115 110 (1)这种抽样方法是哪一种方法?(2)试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间产品比较稳定. 解 (1)采用的抽样方法是:系统抽样.(2)x 甲=17(102+101+99+98+103+98+99)=100;x 乙=17(110+115+90+85+75+115+110)=100;x 2甲=17[(102-100)2+(101-100)2+(99-100)2+(98-100)2+(103-100)2+(98-100)2+(99-100)2]=17(4+1+1+4+9+4+1)≈3.43; s 2乙=17[(110-100)2+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2+(110-100)2]=17(100+225+100+225+625+225+100) ≈228.57.所以s 2甲<s 2乙,故甲车间产品较稳定.题型三 数据的数字特征的综合应用例3在一次科技知识竞赛中,两组学生的成绩如下表:次竞赛中的成绩谁优谁劣,并说明理由.解(1)甲组成绩的众数为90,乙组成绩的众数为70,从成绩的众数比较看,甲组成绩好些.(2)x甲=12+5+10+13+14+6(50×2+60×5+70×10+80×13+90×14+100×6)=150×4 000=80,x乙=14+4+16+2+12+12(50×4+60×4+70×16+80×2+90×12+100×12)=150×4 000=80.s2甲=12+5+10+13+14+6[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,s2乙=14+4+16+2+12+12[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.∵s2甲<s2乙,∴甲组成绩较乙组成绩稳定,故甲组好些.(3)甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人.从这一角度看,甲组的成绩较好.(4)从成绩统计表看,甲组成绩大于等于90分的有20人,乙组成绩大于等于90分的有24人,所以乙组成绩集中在高分段的人数多.同时,乙组得满分的人数比甲组得满分的人数多6人.从这一角度看,乙组的成绩较好.反思与感悟要正确处理此类问题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.跟踪训练3甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.4625.3225.4525.3925.3625.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39 乙25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 25.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?(结果保留小数点后3位) 解 用计算器计算可得 x 甲≈25.405,x 乙≈25.406; s 甲≈0.037,s 乙≈0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40mm),差异很小;从样本标准差看,由于s 甲<s 乙,因此甲生产的零件内径尺寸比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些.分类讨论思想例4 某班有四个学习小组,各小组人数分别为10,10,x,8,已知这组数据的中位数与平均数相等,求这组数据的中位数.分析 由于x 未知,因此中位数不确定,需讨论.解 该组数据的平均数为14(10+10+x +8)=14(28+x ),中位数是这4个数按从小到大的顺序排列后处在最中间两个数的平均数.(1)当x ≤8时,原数据从小到大排序为x,8,10,10,中位数是9,由14(28+x )=9,得x =8,符合题意,此时中位数是9;(2)当8<x ≤10时,原数据从小到大排序为8,x,10,10,中位数是12(x +10),由14(28+x )=12(10+x ),得x =8,与8<x ≤10矛盾,舍去;(3)当x >10时,原数据从小到大排序为8,10,10,x ,中位数是10,由14(28+x )=10,得x =12,符合题意,此时中位数是10.综上所述,这组数据的中位数是9或10.解后反思 当题目中含有参数,且参数的不同取值影响求解结果时,需对参数的取值分类讨论.1.下列选项中,能反映一组数据的离散程度的是( ) A .平均数 B .中位数 C .方差 D .众数答案 C解析 由方差的定义,知方差反映了一组数据的离散程度.2.一组样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x 等于( ) A .21 B .22 C .20 D .23 答案 A解析 根据题意知,中位数22=x +232,则x =21.3.一次选拔运动员的测试中,测得7名选手中的身高(单位:cm)分布的茎叶图如图所示.记录的平均身高为177 cm ,有一名候选人的身高记录不清楚,其末位数记为x ,则x 等于( )A .5B .6C .7D .8答案 D解析 由题意知,10+11+0+3+x +8+9=7×7,解得x =8.4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________. 答案 0.1解析 x -=4.7+4.8+5.1+5.4+5.55=5.1,则方差s 2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.5.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4 则:(1)平均命中环数为________; (2)命中环数的标准差为________. 答案 (1)7 (2)2解析 (1)x =7+8+7+9+5+4+9+10+7+410=7.(2)∵s 2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s =2.1.一组数据中的众数可能不止一个,中位数是唯一的,求中位数时,必须先排序. 2.利用直方图求数字特征: (1)众数是最高的矩形的底边的中点. (2)中位数左右两边直方图的面积应相等.(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.3.标准差的平方s 2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.。
高中数学 第一章 统计 估计总体的分布教案 北师大版必修3 教案
§1.5估计总体的分布(一)一、教学目标:1、知识与技能:(1)通过实例体会分布的意义和作用。
(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
2、过程与方法:通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
3、情感态度与价值观:通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
二、重点与难点:重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
难点:能通过样本的频率分布估计总体的分布。
三、教学方法:探究归纳,思考交流四、教学设想(一)、创设情境在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50;乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板出课题)。
(二)、探究新知〖探究〗:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a 的部分按议价收费。
如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。
高中数学 第一章 统计 用样本估计总体学案 北师大版必修3
课题:书法---写字基本知识课型:新授课教学目标:1、初步掌握书写的姿势,了解钢笔书写的特点。
2、了解我国书法发展的历史。
3、掌握基本笔画的书写特点。
重点:基本笔画的书写。
难点:运笔的技法。
教学过程:一、了解书法的发展史及字体的分类:1、介绍我国书法的发展的历史。
2、介绍基本书体:颜、柳、赵、欧体,分类出示范本,边欣赏边讲解。
二、讲解书写的基本知识和要求:1、书写姿势:做到“三个一”:一拳、一尺、一寸(师及时指正)2、了解钢笔的性能:笔头富有弹性;选择出水顺畅的钢笔;及时地清洗钢笔;选择易溶解的钢笔墨水,一般要固定使用,不能参合使用。
换用墨水时,要清洗干净;不能将钢笔摔到地上,以免笔头折断。
三、基本笔画书写1、基本笔画包括:横、撇、竖、捺、点等。
2、教师边书写边讲解。
3、学生练习,教师指导。
(姿势正确)4、运笔的技法:起笔按,后稍提笔,在运笔的过程中要求做到平稳、流畅,末尾处回锋收笔或轻轻提笔,一个笔画的书写要求一气呵成。
在运笔中靠指力的轻重达到笔画粗细变化的效果,以求字的美观、大气。
5、学生练习,教师指导。
(发现问题及时指正)四、作业:完成一张基本笔画的练习。
板书设计:写字基本知识、一拳、一尺、一寸我的思考:通过导入让学生了解我国悠久的历史文化,激发学生学习兴趣。
这是书写的起步,让学生了解书写工具及保养的基本常识。
基本笔画书写是整个字书写的基础,必须认真书写。
课后反思:学生书写的姿势还有待进一步提高,要加强训练,基本笔画也要加强训练。
课题:书写练习1课型:新授课教学目标:1、教会学生正确书写“杏花春雨江南”6个字。
2、使学生理解“杏花春雨江南”的意思,并用钢笔写出符合要求的的字。
重点:正确书写6个字。
难点:注意字的结构和笔画的书写。
教学过程:一、小结课堂内容,评价上次作业。
二、讲解新课:1、检查学生书写姿势和执笔动作(要求做到“三个一”)。
2、书写方法是:写一个字看一眼黑板。
(老师读,学生读,加深理解。
[推荐学习]2018北师大版高中数学必修三学案:第一章 5 用样本估计总体
学习目标 1.学会列频率分布表,会画频率分布直方图.2.会用频率分布表或分布直方图估计总体分布,并作出合理解释.3.在解决问题过程中,进一步体会用样本估计总体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程.知识点一总体的分布思考如果把我国初生婴儿的性别作为总体,那么它的分布是指什么?梳理一般地,总体分布是指总体中个体所占的比例.知识点二用频率分布表或频率分布直方图估计总体分布思考1要做频率分布表,需要对原始数据做哪些工作?思考2如何决定组数与组距?思考3同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?梳理1.频率分布直方图,数据落在各小组内的频率用频率分布直方图的________在频率分布直方图中,纵轴表示f iΔx i来表示,各小长方形的面积的总和等于____.2.频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的________开始,用线段依次连接各个矩形的____________,直至右边所加区间的________,就可以得到一条折线,我们称之为频率折线图.3.随着样本容量不断增大,样本中落在每个区间内的样本数的________会越来越稳定于总体在相应区间内取值的________.随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小.相应的频率折线图就会越来越接近于一条光滑曲线.知识点三总体的数字特征思考如果想知道某一历史时期黄河流域男性平均身高,有可能获得总体数据吗?怎么办?梳理一般地,1.现实中的总体所包含的个体数往往很难获得,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.2.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.类型一用频率分布表及频率分布直方图估计总体分布例1下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm).(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.反思与感悟频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.跟踪训练1为了了解中学生身体发育情况,对某中学17岁的60名女生的身高(单位:cm)进行了测量,结果如下:154159166169159156166162158159156166160164160157151157161162158153158164158163158153157168162159154165166157155146151158160165158163163162161154165161162159157159149164168159153160列出样本的频率分布表;绘出频率分布直方图和频率折线图.类型二估计总体数字特征例2为了解A,B两种轮胎的性能,某汽车制造厂分别从这两种轮胎中随机抽取了8个进行测试,下面列出了每种轮胎行驶的最远里程数(单位:1 000 km)轮胎A96,112,97,108,100,103,86,98轮胎B108,101,94,105,96,93,97,106(1)分别计算A,B两种轮胎行驶的最远里程的平均数、中位数;(2)分别计算A,B两种轮胎行驶的最远里程的极差、标准差;(3)根据以上数据你认为哪种型号的轮胎性能更加稳定?反思与感悟平均数、中位数、众数、极差、方差等统计量是将多个数据“加工”成一个数据,能更清楚地反映这组数据的某些重要特征,要理解这些统计量表达的信息.跟踪训练2为迎接5月31日世界无烟日的到来,小华对10名戒烟成功者戒烟前和戒烟5个星期后的体重(单位:kg)作了认真统计,并记录如下表所示:(1)求这10人在戒烟前和戒烟后的体重的平均数;(2)求这10人在戒烟前和戒烟后的体重的方差;(3)通过上述数据,你能得到什么结论?1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是()A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确2.下列说法不正确的是()A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是从所加的左边区间的中点开始,用线段依次连接频率分布直方图的每个小矩形上端中点,直至右边所加区间的中点得到的3.某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg的人数是()A.10 B.2 C.5 D.154.一个容量为20的样本数据,分组后组距与频数如下表:则样本在[10,50)上的频率为()A.0.5 B.0.24C.0.6 D.0.75.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为__________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.2.用同样的方法先后从总体中抽取两个大小相同的样本,但两次得到的样本频率分布表、样本频率分布直方图、样本的平均数和标准差仍然可能互不相同,是样本的随机性造成的,是不可避免的.只要抽样的方法比较合理,就能反映总体的信息,当样本量很大时,就比较接近总体的真实情况.答案精析问题导学 知识点一思考 是指男女性别的比例. 知识点二思考1 分组,频数累计,计算频数和频率. 思考2 若极差组距为整数,则极差组距=组数.若极差组距不为整数,则⎣⎢⎡⎦⎥⎤极差组距+1=组数.注意:[x ]表示不大于x 的最大整数.思考3 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响. 梳理1.面积 1 2.中点 顶端中点 中点 3.频率 概率 知识点三思考 时代变迁,已经不可能获得所有数据,但可以根据出土的同时期样本数据计算平均身高来估计. 题型探究例1 解 (1)样本频率分布表如下:(2)频率分布直方图如下:(3)由样本频率分布表可知身高小于134 cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm 的人数占总人数的19%.跟踪训练1 解 第一步,求极差:上述60个数据中最大为169,最小为146.故极差为169-146=23(cm).第二步,确定组距和组数,可取组距为3 cm , 则组数为233=723,可将全部数据分为8组.第三步,确定区间界限:[145.5,148.5),[148.5,151.5),[151.5,154.5),[154.5,157.5),[157.5,160.5),[160.5,163.5),[163.5,166.5),[166.5,169.5). 第四步,列频率分布表:第五步,根据上述数据绘制频率分布直方图:第六步,在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线即为频率折线图.例2 解 (1)A 轮胎行驶的最远里程的平均数为 96+112+97+108+100+103+86+988=100,中位数为100+982=99;B 轮胎行驶的最远里程的平均数为108+101+94+105+96+93+97+1068=100,中位数为101+972=99.(2)A 轮胎行驶的最远里程的极差为112-86=26,标准差为s =(-4)2+122+(-3)2+82+0+32+(-14)2+(-2)28=2212≈7.43;B 轮胎行驶的最远里程的极差为108-93=15,标准差为s =82+12+(-6)2+52+(-4)2+(-7)2+(-3)2+628=1182≈5.43.(3)由于A 和B 的最远行驶里程的平均数相同,而B 轮胎行驶的最远里程的极差和标准差较小,所以B 轮胎性能更加稳定.跟踪训练2 解 (1)将数据按从小到大的顺序重新排列; 戒烟前:52,52,55,55,60,60,64,67,69,80; 戒烟后:52,54,55,57,58,62,67,68,70,81.求得x戒烟前=61.4(kg),x戒烟后=62.4(kg).(2)s2戒烟前=110[(67-61.4)2+(80-61.4)2+…+(60-61.4)2]=70.44,s2戒烟后=110[(70-62.4)2+(81-62.4)2+…+(58-62.4)2]=73.84.(3)从戒烟前后两组数据的统计量知:从平均数看,戒烟后这10人的平均体重增加了1 kg;从方差看,戒烟后数据的波动比戒烟前数据的波动大,说明戒烟对不同的人所发生的变化程度是不同的,通过对这两组数据的统计分析,得出结论:吸烟有害健康,戒烟对身体健康是有益的.当堂训练1.C 2.A 3.A 4.D5.(1)0.004 4(2)70解析(1)(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,∴x=0.004 4.(2)(0.003 6+0.004 4+0.006 0)×50×100=70.。
高中数学北师大版必修三1.5.1【教学设计】《估计总体的分布》
《估计总体的分布》
教材通过探究引导学生思考实际问题,引出总体分布的估计问题,该实例贯穿本节始终,通过对该问题的探究,使学生学会列频率分布表、画频率分布直方图和频率分布折线图。
教师通过初中有关频率与概率之间的关系,了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想。
【知识与能力目标】
通过实例体会分布的意义和作用;在表示样本数据的过程中,学会列频率分布表,画频率分布直方图和频率折线图,并且能体会它们各自的特点,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。
【过程与方法目标】
通过对生活中的实例的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
【情感态度价值观目标】
感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
【教学重点】
会列批频率分布表,画频率分布直方图和频率折线图。
【教学难点】
能通过样本的频率分布估计总体的分布。
电子课件调整、相应的教具带好、熟悉学生名单、电子白板要调试好。
一、导入部分
为了了解某地区高二学生的身体发育情况,抽查了地区100名年龄为16.5岁至17岁的男生的体重情况,结果如下(单位:kg):请你估计该地区年龄为16.5岁至17岁的男生体重的分布情况。
解:这里如果把总体看作是该地区年龄为16.5岁至17岁的男生体重。
那么我们就要通过上面的样本信息,来估计总体的分布情况。
但从抽样的数据很难直接估计出总体的分布情况。
为此,我们可以先将抽样的数据按每个数据出现的频数和频率汇成下表:。
高中数学必修3第一章教案
1.1.1算法的概念一、三维目标:1、知识与技能:(1)了解算法的含义,体会算法的思想。
(2)能够用自然语言叙述算法。
(3)掌握正确的算法应满足的要求。
(4)会写出解线性方程(组)的算法。
(5)会写出一个求有限整数序列中的最大值的算法。
(6)会应用Scilab求解方程组。
2、过程与方法:通过求解二元一次方程组,体会解方程的一般性步骤,从而得到一个解二元一次方程组的步骤,这些步骤就是算法,不同的问题有不同的算法。
由于思考问题的角度不同,同一个问题也可能有多个算法,能模仿求解二元一次方程组的步骤,写出一个求有限整数序列中的最大值的算法。
3、情感态度与价值观:通过本节的学习,使我们对计算机的算法语言有一个基本的了解,明确算法的要求,认识到计算机是人类征服自然的一各有力工具,进一步提高探索、认识世界的能力。
二、重点与难点:重点:算法的含义、解二元一次方程组和判断一个数为质数的算法设计。
难点:把自然语言转化为算法语言。
三、学法与教学用具:学法:1、写出的算法,必须能解决一类问题(如:判断一个整数n(n>1)是否为质数;求任意一个方程的近似解;……),并且能够重复使用。
2、要使算法尽量简单、步骤尽量少。
3、要保证算法正确,且计算机能够执行,如:让计算机计算1×2×3×4×5是可以做到的,但让计算机去执行“倒一杯水”“替我理发”等则是做不到的。
教学用具:电脑,计算器,图形计算器四、教学设想:1、创设情境:算法作为一个名词,在中学教科书中并没有出现过,我们在基础教育阶段还没有接触算法概念。
但是我们却从小学就开始接触算法,熟悉许多问题的算法。
如,做四则运算要先乘除后加减,从里往外脱括弧,竖式笔算等都是算法,至于乘法口诀、珠算口诀更是算法的具体体现。
我们知道解一元二次方程的算法,求解一元一次不等式、一元二次不等式的算法,解线性方程组的算法,求两个数的最大公因数的算法等。
2018-2019学年高一数学北师大版必修三教学案:第一章§8 最小二乘估计
[核心必知]1.回归直线如果两个变量散点图中点的分布从整体上看大致在一条直线附近,那么称这两个变量之间具有线性相关关系,这条直线叫作回归直线.2.最小二乘法求线性回归方程y =bx +a 时,使得样本数据的点到它的距离的平方和最小的方法叫作最小二乘法.其中a ,b 的值由以下公式给出:⎩⎪⎨⎪⎧b =∑ni =1x i y i -n x - y -∑ni =1x 2i -n x 2,a =y --b x -.a ,b 是线性回归方程的系数.[问题思考]1.任给一组数据,我们都可以由最小二乘法得出线性回归方程吗?提示:用最小二乘法求回归直线的方程的前提是先判断所给数据具有线性相关关系(可利用散点图判断).否则求出的线性回归方程是无意义的.2.线性回归方程是否经过一定点? 提示:线性回归方程恒过定点(x -,y -).讲一讲1.下表是某旅游区游客数量与平均气温的对比表:[尝试解答] x -=706=353,y -=2306=1153,x 21+x 22+…+x 26=1+16+100+169+324+676=1 286,x 1y 1+x 2y 2+…+x 6y 6=-20+96+340+13×38+18×50+26×64=3 474.b =x 1y 1+x 2y 2+…+x 6y 6-6x -y -x 21+x 22+…+x 26-6x -2=3 474-6×353×11531 286-3532≈1.68,a =y --b x -≈18.73,即所求的线性回归方程为y =1.68x +18.73.求线性回归方程的步骤(1)画出散点图,判断其具有相关关系; (2)计算x -,y -,∑ni =1x 2i =x 21+x 22+…+x 2n , ∑n i =1x i y i =x 1y 1+x 2y 2+…+x n y n .(3)代入公式b =∑ni =1x i y i -n x -y -∑n i =1x 2i -n x -2,a =y --b x -;(4)写出线性回归方程y =bx +a . 练一练1.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:已知记忆力x 和判断力y 是线性相关的,求线性回归方程. 解:x -=6+8+10+124=9,y -=2+3+5+64=4,a =y --b x -=4-0.7×9=-2.3.则所求的线性回归方程为y =0.7x -2.3.讲一讲2.某种产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:(1)画出散点图; (2)求线性回归方程;(3)预测当广告费支出为7百万元时的销售额. [尝试解答] (1)(2)从散点图可以发现,y 与x 具有线性相关关系,利用计算器求得: x -=5,y -=50,∑5i =1x 2i =145,∑5i =1x i y i =1 380, 设回归方程为y =bx +a ,则b =∑5i =1x i y i -5x - y -∑5i =1x 2i -5x - 2=1 380-5×5×50145-5×52=6.5, a =y --b x -=50-6.5×5=17.5,故所求线性回归方程为y =6.5x +17.5.(3)当x =7时,y =6.5×7+17.5=63.所以,当广告费支出为7百万元时,销售额约为6 300万元.用线性回归方程估计总体的一般步骤:(1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式求出a 、b 并写出线性回归方程; (3)根据线性回归方程对总体进行估计. 练一练2.假设关于某设备的使用年限x 和所支出的维修费用y (单位:万元)有如下的统计资料:若由资料知y (1)回归方程y =bx +a 的系数a ,b ;(2)使用年限为10年时,试估计维修费用是多少. 解:(1)列表如下:b =∑5i =1x i y i =-5x - y -∑5i =1x 2i -5 x -2=112.3-5×4×590-5×42=1.23, a =y --b x -=5-1.23×4=0.08.(2)回归方程是y =1.23x +0.08,当x =10时,y =1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元. 【解题高手】【易错题】有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童数量,如下表:(1)(2)通过计算可得两个变量的线性回归方程为y =23.25x +102.25,假如一个城市的人均GDP 为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?[错解] (1)根据表中数据画散点图,如图所示,从图可以看出,虽然后5个点大致分布在一条直线的附近,但第一个点离这条直线太远,所以这两个变量不具有线性相关关系.(2)将x =12代入y =23.25x +102.25,得y =23.25×12+102.25=381.25>380,所以上述断言是正确的.[错因] 在第(1)问中,是否具有线性相关关系,要看大部分点、主流点是否分布在一条直线附近,个别点是不影响“大局”的,所以可断定这两个变量具有线性相关关系.在第(2)问中,381.25只是一个估计值,由它不能断言这个城市患白血病的儿童一定超过380人.如果这个城市的污染很严重,有可能人数远远超过380,若这个城市的环境保护的很好,则人数就有可能远远低于380.[正解] (1)根据表中数据画散点图,如错解图所示,从图可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系.(2)将x =12代入y =23.25x +102.25,得y =23.25×12+102.25=381.25>380,即便如此,但因381.25只是一个估计值,会受其他情况的影响,所以不能断言这个城市患白血病的儿童一定超过380人.1.已知x 与y 之间的一组数据:则y 与x 的线性回归方程y A .(2,2) B .(1.5,0) C .(1,2) D .(1.5,4) 解析:选D x =1+2+34=1.5,y =1+3+5+74=4.2.工人工资y (元)随劳动生产率x (千元)变化的回归直线方程为y =80x +50,则下列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资约提高80元C .劳动生产率提高1 000元时,工资约提高130元D .当月工资210元时,劳动生产率为2 000元解析:选B 回归直线的斜率为80,所以x 每增加1个单位,y 约增加80,即劳动生产率提高1 000元时,工资提高约80元.3.(福建高考改编)已知x 与y 之间的几组数据如下表:据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A .b >b ′,a >a ′ B.b >b ′,a <a ′ C .b <b ′,a >a ′ D.b <b ′,a <a ′解析:选C 由两组数据(1,0)和(2,2)可求得直线方程为y =2x -2,b ′=2,a ′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得b =6i =1x i y i -6x -·y -6i =1x 2i -6x -2=58-6×72×13691-6×⎝ ⎛⎭⎪⎫722=57,a =y --b x -=136-57×72=-13,所以b <b ′,a >a ′. 4.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如下:则x -=________,y -=________,=________,=________,回归方程为________.解析:根据公式代入即可求得,也可以利用计算器求得x -=6.5,y -=8,=327,=396,回归方程为y =1.14x +0.59.答案:6.5 8 327 396 y =1.14x +0.595.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:℃时,用电量的度数约为________.解析:x =18+13+10-14=10,y =24+34+38+644=40,则a =y -b x =40+2×10=60,则y =-2x +60,则当x =-4时,y =-2×(-4)+60=68.答案:686.下表提供了某厂节能降耗技术改造后,生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:(1)请画出上表中数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =bx +a ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解:(1)散点图如图所示.(2)由对照数据,计算得:∑4i =1x 2i =86,x -=3+4+5+64=4.5,y -=2.5+3+4+4.54=3.5. 又已知∑4i =1x i y i =66.5, ∴b =∑4i =1x i y i -4x - y -∑4i =1x 2i -4x -2=66.5-4×4.5×3.586-4×4.52=0.7, a =y --b x -=3.5-0.7×4.5=0.35.∴所求的线性回归方程为y =0.7x +0.35. (3)90-(0.7×100+0.35)=19.65(吨标准煤),故预测生产100吨甲产品的生产能耗比技改前降低约19.65吨标准煤.一、选择题1.设有一个回归方程y =2-1.5x ,当x 增加1个单位时( ) A .y 平均增加1.5个单位 B .y 平均减少1.5个单位 C .y 平均增加2个单位 D .y 平均减少2个单位解析:选B y ′=2-1.5(x +1)=2-1.5x -1.5=y -1.5,即x 增加1个单位,y 平均减少1.5个单位.2.对有线性相关关系的两个变量建立的线性回归方程y =a +bx 中,回归系数b ( ) A .可以小于0 B .只能大于0 C .只能等于0 D .只能小于0 解析:选A ∵b =x 1y 1+x 2y 2+…+x n y n -n x -y-x 21+x 22+…+x 2n -n x-2,∴b 的取值是任意的. 3.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到线性回归方程y =bx +a ,那么下面说法不.正确的是( ) A .直线y =bx +a 必经过点(x ,y )B .直线y =bx +a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点C .直线y =bx +a 的斜率为D .直线y =bx +a 与各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的接近程度[y i -(bx i +a )]2是该坐标平面上所有直线与这些点的最接近的直线解析:选B 直线y =bx +a 一定过点(x ,y ),但不一定要过样本点.4.(湖南高考)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:选D 当x =170时,y ^=0.85×170-85.71=58.79,体重的估计值为58.79 kg ,故D 不正确.5.(山东高考)某产品的广告费用x 与销售额y 的统计数据如下表:6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元解析:选B 容易计算得x -=3.5,y -=42,故a =y --b x -=42-9.4×3.5=9.1,所以当广告费用为6万元时销售额为9.4×6+9.1=65.5(万元).二、填空题6.(辽宁高考改编)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元).调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y =0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由回归直线方程的意义知,x 每增加1万元,y 平均增加0.254万元. 答案:0.2547.对一质点的运动过程观测了4次,得到如表所示的数据,则刻画y 与x 的关系的线性回归方程为________.解析:x -=2.5,y -=3.75,∑4i =1x i y i =46,∑4i =1x 2i =30, b =46-4×2.5×3.7530-4×2.52=1.7,a =y --b x -=-0.5, 所以所求的线性回归方程为:y =1.7x -0.5. 答案:y =1.7x -0.58.(广东高考)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.解析:小李这5天的平均投篮命中率为(0.4+0.5+0.6+0.6+0.4)÷5=0.5. 又x -=3,y -=0.5, 由表中数据,得b =0.01,a =y --b x -=0.47,故回归直线方程为y =0.01x +0.47. 令x =6,则有y =0.01×6+0.47=0.53.答案:0.5 0.53 三、解答题9.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量(单位:千克)影响的试验,得到如下一组数据:(1)作出这些数据的散点图;(2)由(1)分析两变量关系得出什么结论? (3)求出回归直线方程. 解:(1)如图所示.(2)由(1)可看出,各点散布在从左下角到右上角的区域内,为正相关,也可以说在适量限制范围内水稻产量随施肥量的增大而增大,但不是直线递增.(3)用科学计算器可求得x -=30,y -=399.3,∑7i =1x 2i =7 000,∑7i =1x i y i =87 175.于是b =∑7i =1x i y i -7x - y -∑7i =1x 2i -7x -2=87 175-7×30×399.37 000-7×302≈4.75.a =y --b x -=399.3-4.75×30≈257.因此所求回归直线方程为y =4.75x +257. 10.(福建高考改编)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,12y=16(y1+y2+y3+y4+y5+y6)=80.所以a=y-b x=80+(-20)×8.5=250,从而回归直线方程为y=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000=-20(x-334)2+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.。
2018版高中数学北师大版必修三学案第一章+疑难规律方法:第一章+统计+整理版
1例析简单随机抽样简单随机抽样是一种最简单、最基本的抽样方法.适用于总体中的个体数较少且抽取的样本容量较小时.抽样中选取个体的方法有两种:放回和不放回.简单随机抽样中用的是不放回抽取.下面让我们一同来看如下的例题:例1 判断下面的抽样方法是不是简单随机抽样?(1)从不确定个体数的总体中抽取20个个体作为样本.(2)从30瓶果汁中一次性随机抽取3瓶进行质量检查.(3)某班有40名同学,指定个子最高的5名同学参加学校组织的篮球赛.(4)从装有编号为1~36的大小、形状都相同的号签的盒子中逐个不放回地抽出6个号签.分析简单随机抽样的定义,抓住以下特点来理解:①它要求被抽取的样本所在总体的容量确定且有限;②它是从总体中逐个地进行抽取;③它是一种不放回抽样;④每个个体被抽到的可能性是相同的,是等可能抽样.解(1)不是简单随机抽样.因为总体的个体数是不确定的,从而不能保证每个个体等可能入样.(2)不是简单随机抽样.因为简单随机抽样的定义要求的是逐个抽取.(3)不是简单随机抽样.因为该例是指定个子最高的5名同学参加比赛,每个个体被抽到的可能性是不同的,不是等可能抽样.(4)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回地、等可能地进行抽样.点评要判断所给的抽样方法是不是简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的上述四个特点.例2 若将例1(2)中的字眼“一次性”改为“逐个”,则该例便为简单随机抽样.即从30瓶果汁中逐个随机抽取3瓶进行质量检查.请选用合适的抽样方法,写出抽样过程.分析简单随机抽样分为两种:抽签法和随机数法.当总体容量和样本容量都较小时,可采用抽签法进行抽样.解(1)将30瓶果汁进行编号,号码为1,2,3, (30)(2)将1~30这30个编号写到大小、形状都相同的号签上;(3)将写好的号签放入一个不透明的容器中,并搅拌均匀;(4)从容器中每次抽取一个号签,连续不放回地抽取3次,并记录下上面的编号;(5)所得号码对应的3瓶果汁就是要抽取的样本.点评抽签法(也叫抓阄法)是简单随机抽样的一种方法,一个抽样试验是否能用抽签法,关键看两点:一是制作号签是否方便;二是号签是否容易被“搅拌均匀”.本题中,总体中个体数(30)较少,制作号签比较方便,并且容易被“搅拌均匀”,所以可以采用抽签法.将例2中的总体容量增大,我们该如何解决呢?比如例3.例3 现在要考察某公司生产的2.5 L的果汁质量是否达标,欲从400瓶果汁中抽取6瓶进行质量检查.请选用合适的方法抽样,并写出抽样过程.分析当总体容量较大,而样本容量较小时,因制签麻烦,故不宜用抽签法,可采用随机数法.解选用随机数法.步骤如下:第一步,先将400瓶果汁编号,可以编为001,002, (400)第二步,在随机数表中任选一个数作为开始,比如第6行第1个数,取出072作为抽取的6瓶果汁中的第一个代号(见课本后的附表随机数表);第三步,继续向右读,每次读取三位,凡不在001~400中的数或重复的数跳过去不读,取到末尾时转到下一行从左到右继续读数,如此下去直到得出在001到400之间的6个三位数,分别为072,170,133,199,291,105;第四步,找出与072,170,133,199,291,105对应的果汁作为样本.点评当总体中的个体较多,制作号签比较复杂,并且把号签搅拌均匀比较困难时,可以选择使用随机数法,本题将个体编号的位数统一为3位.使用随机数法应注意以下两点:(1)随机数法要求对个体编号且每个个体的号码位数必须相同.如对100个个体编号时应从00编到99(或者从001编到100),而不能用1,2,…,100.可见在总体中的个体进行编号时要视总体中个体的数目而定,但必须保证所编号码的位数一致,不允许出现不同位数的号码.(2)选定开始读的数后,读数的方向可左、可右、可上、可下,即任意方向均可.读数的方向不同可能导致不同的结果,但这一点不影响样本的公平性和合理性.2系统抽样题型全析在三种随机抽样中,系统抽样是较为重要的一种.当总体中的个体数较多时,可将总体分成均匀的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样方法叫做系统抽样,又称等距抽样.在抽样调查中,由于系统抽样简便易行,所以应用普遍.下面举例说明系统抽样的常见题型.一、系统抽样的选取问题例1 某商场想通过检查部分发票及销售记录来快速估计每月的销售金额,采用如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序将65号,115号,165号,…发票上的销售金额组成一个调查样本.这种抽取样本的方法是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样分析 上述抽样方法是将发票平均分成若干组,每组50张,从第一组抽出了15号,以后各组抽15+50n (n ∈N +)号,符合系统抽样的特点.答案 C点评 将总体分成均匀的几部分,按照预先定出的规则在各部分中抽取是系统抽样的常用步骤.二、间隔问题例2 为了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k 为________.分析 要抽取n 个个体入样,需将N 个编号均分成n 组.(1)若N n 为整数,则抽样间隔为N n;(2)若N n 不是整数,则先剔除多余个体,再均分成n 组,此时抽样间隔为[N n]. 解析 根据样本容量为30,将1 200名学生分为30段,每段人数即间隔k =1 20030=40. 答案 40点评 将总体号码平均分组时,应先考虑总体容量N 是否能被样本容量n 整除.三、抽取的个数问题例3 为了了解参加一次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是( )A .2B .4C .5D .6分析 因为1 252=50×25+2,所以应随机剔除2个个体.答案 A点评 (1)用系统抽样法抽取多少个个体就需将总体均分成多少组;(2)当总体中的个体数不能被样本容量整除时,需要剔除个体.需要注意的是,即使是被剔除的个体,被抽到的机会和其他个体也是一样的.四、综合问题例4一个总体中的1 000个个体编号为0,1,2,…,999,并依次将其分为10个小组,组号为0,1,2,…,9.要用系统抽样法抽取一个容量为10的样本,规定如果在第0组随机抽取的号码为x,那么依次错位地得到后面各组的号码(即在第k组中抽取的号码的后两位数为x+33k 的后两位数).(1)当x=24时,写出所抽取样本的10个号码;(2)若所抽取的10个号码中某个数的后两位数是87,求x的取值范围.分析按系统抽样的规则计算求解.解(1)所分组为0~99,100~199,…,900~999共10组,从每组中抽一个,第0组取24,则第1组取100+(24+33×1)=157,依次错位地从每组中取出,所取的号码为24,157,290,323,456,589,622,755,888,921.(2)①若抽取的样本为两位数,当k=0,取得号码为87时,x=87;②若抽取的样本为三位数,则87为x+33k(k=1,2,…,9)的后两位数.如当k=5时,x+33×5=□87,可以求出x=22,这样令k取不同的值可以求得x的值分别为:21,22,23,54,55,56,87,88,89,90.综上:x∈{21,22,23,54,55,56,87,88,89,90}.点评本题是系统抽样法的逆向综合问题,体现了知识间的联系和数学思想的运用.3辨析分层抽样的解题方法若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本.这种抽样方法就是分层抽样.分层抽样尽量利用事先掌握的信息,并充分考虑了保持样本结构和总体结构的一致性,这对提高样本的代表性是很重要的.一、应用分层抽样应遵循以下要求:(1)将相似的个体归入一类,即为一层,分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,层面之间的样本差异要大,且互不重叠.即遵循不重复、不遗漏的原则.(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等.即所有层应采用同一抽样比等可能抽样.(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.二、一般地,分层抽样的操作步骤:第一步,计算样本容量与总体的个体数之比.第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.第四步,将各层抽取的个体合在一起,就得到所取样本.样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数应当调节样本容量,剔除个体.三、分层抽样的优点使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法.下面举例解析分层抽样的方法.例1某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.解析由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.40岁以下年龄段的职工数为200×0.5=100,则应抽取的人数为40200×100=20.答案3720点评简单随机抽样是基础,系统抽样与分层抽样是补充和发展,三者相辅相成,对立统一.保证每个个体等可能入样是简单随机抽样、系统抽样、分层抽样共同的特征,为了保证这一点,分层时用同一抽样比是必不可少的.例2某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36解析设老年职工人数为x,则2x+x+160=430,所以x=90,因此,该单位老年职工共有90人,样本中老年职工人数为90×32160=18,所以用分层抽样的比例应抽取该样本中的老年职工人数为18.答案 B点评分层抽样要正确计算各层在总体中所占的比例,每层采用简单随机抽样法.分层抽样利用了调查者对调查对象事先掌握的各种信息,考虑了保持样本结构与总体结构的一致性,从而使样本更具代表性,在实际调查中被广泛应用.4浅析3种抽样方法的合理选取一、简单随机宜少量例1 据报道,2009年7月22日的“日全食”较为理想的观测地点有上海、重庆、苏州、杭州、合肥、武汉、宜昌、成都、乐山、嘉兴这10个城市.某天文小组从这10个城市中随机抽取4个城市进行观测,宜采用的抽样方法是______________,每个城市被选中的可能性是______________.解析由于总体中个体数目较少,所以宜采用简单随机抽样的方法进行抽样.每个城市被选中的可能性均相等,均为410=0.4.答案简单随机抽样0.4点评本题中个体总数较少,使用简单随机抽样中的抽签法即可.可以直接把10个城市名分别写在10个大小相同的纸条上,将纸条放在一个盒子里摇匀,逐个随机抽出4个即可.在整个抽样过程中可以保证每个个体被抽到的可能性相等,也可以进一步计算出相应的值.二、差别明显选分层例2 网络上有一种“QQ农场”游戏,这种游戏通过虚拟软件模拟种植与收获的过程.为了解某小区不同年龄层次的居民对此游戏的态度(小区中居民的年龄具有一定的差别),现从中抽取100人进行调查,结果如下表:请问随机抽取这100人较合理的抽样方法是________,调查结果得出后,若想从这100人中再选取20人进行座谈,较合理的抽样方法是____________.若这个小区共有2 000人,则每个人被抽到参加座谈的可能性为______.解析因为小区居民的年龄存在明显差异,故抽取这100人宜采用分层抽样.根据调查结果,有三种明显不同的态度,因此,选取20人参加座谈,也宜采用分层抽样.在整个抽样过程中,每个人被抽到的可能性是相同的,均为202 000=0.01.答案分层抽样分层抽样0.01点评分层抽样的过程是先把有差别的个体进行分层,在每一层中可以采用简单随机抽样或系统抽样的方法,这样也能保证每个个体被抽到的可能性相同.三、大量抽取选系统例3 2017年春节来临之际,某超市进行促销活动,为购买商品顾客分发了编号为0000~9999的奖券,超市计划从中抽取100张作为中奖号码,较合理的抽样方法是__________,每张奖券中奖的可能性为________.解析由于奖券数量较大,有10 000张奖券,所以宜采用系统抽样方法进行抽取.在抽样过程中,每张奖券被抽到的可能性是相等的,均为10010 000=0.01.答案系统抽样0.01点评当总体中个体数目较多时,首先把个体编号,进行平均分组(若不能整除,则随机剔除多余的个体),然后采用简单随机抽样的方法从第一组中抽取一个个体,即可知道应抽取的其他编号的个体.5频率分布图中的统计问题分类解析频率分布直方图将数理统计的数据直观化、形象化.关于统计一般可分为三步,第一步抽样,第二步根据抽样所得结果,画成图形,第三步根据图形,分析结论.在第二步中可画成两种图形,一个是频率分布直方图,另一个是频率分布条形图,两者有很大的不同,前者是以面积表示频率,频率分布条形图是以高度表示频率.下面就频率分布图中的统计问题分类解析.一、求样本中限制条件下的个体所占频率例1观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)的频率为()A.0.001B.0.1C.0.2 D.0.3解析由直方图的意义可知,在区间[2 700,3 000)内取值的频率为(3 000-2 700)×0.001=0.3. 答案 D点评频率为相应直方图的面积,即频率=纵坐标×横坐标差的绝对值.二、求样本中限制条件下的个体的频数例2某市高三数学抽样考试中,对90分以上的成绩进行统计,其频率分布条形图如图所示.若130~140分数段的人数为90,则90~100分数段的人数为________.解析 由于90分以上的考试人数是样本总体,则图中5个分数段的频率之和等于1,设130~140分数段的频率为p ,则0.45+0.25+0.15+0.10+p =1,即0.95+p =1,则p =0.05.设该样本总体共有n 个学生的分数,且设90~100分数段的人数为x ,则由频率概念得⎩⎪⎨⎪⎧ 0.05×n =90,0.45×n =x ,解得⎩⎪⎨⎪⎧n =1 800,x =810,故90~100分数段的人数为810. 答案 810点评 本题是频率分布条形图.由于各分数段的人数与频率成正比,则可由x 90=0.450.05,求出x ;题设条形图的纵坐标是“频率”这是有别于常规的,在审题时不能混淆.例3 一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.解析 由直方图可得[2 500,3 000)(元)月收入段共有10 000×0.000 5×500=2 500(人),按分层抽样应抽出2 500×10010 000=25(人). 答案 25点评 先求频数,频数=频率×样本容量,再按比例进行抽样.三、求频率分布直方图中的参数问题例4 为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图如图.由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a ,b 的值分别为( )A .0.27,78B .0.27,83C .2.7,78D .2.7,83解析 注意到纵轴表示频率组距,由图像可知,前4组的公比为3,最大频率a =0.1×33×0.1=0.27,设后六组公差为d ,则0.01+0.03+0.09+0.27×6+5×62·d =1,解得d =-0.05,即后四组频率的公差为-0.05,所以,视力在4.6到5.0之间的学生数为(0.27+0.22+0.17+0.12)×100=78,故选A.答案 A点评 解答本题关键是要利用直方图中残缺不全的数据,分析它们之间存在的内在关系.6 学习变量的相关关系的注意点一、相关关系不一定是因果关系函数关系是一种因果关系,但相关关系不一定是因果关系,它仅是一种伴随关系. 例1 下列各组关系中,不属于相关关系的是( )A .降雪量与交通事故的发生之间的关系B .正方体的体积与棱长之间的关系C .日照时间与小麦的亩产量之间的关系D .人的身高与体重之间的关系解析 选B ,正方体的体积与棱长之间的关系是一种确定的函数关系.答案 B点评 本题易错选D.在人的身高与体重之间确实具有相关性,但人有胖瘦,所以,人的身高与体重之间没有因果关系,但有相关关系.二、注意区分回归方程中a 、b 的意义线性回归方程为y =bx +a ,其中b 是回归系数,而一次函数的习惯写法为y =ax +b ,不要把它们混淆了.另外,对于线性回归方程y =bx +a 有a =y -b x ,即y =b x +a .例2 一蚊香销售公司进行了一次市场调查,并统计了某品牌电热蚊香片的销售单价x (元/盒)与平均日销量y (盒),得到如下的数据资料:若由相关资料知,y 与x 呈线性相关关系.试求y 与x 的线性回归方程.解 由表中数据知x =16.8,y =29.8, ∑i =15x i y i =2 099,∑i =15x 2i =1 558,∴b =2 099-5×16.8×29.81 558-5×16.82≈-2.75, a =y -b x =29.8+2.75×16.8=76.所以所求的线性回归方程为y =-2.75x +76.点评 在写回归方程时,容易误写为y =76x -2.75,其原因是求出a 、b 后,把回归方程公式y =bx +a 中的a 、b 位置搞错了.三、注意建立回归方程的前提条件 当数据之间具有线性相关关系时才可以求回归方程.若数据之间不具有线性相关关系,即使用最小二乘法求出了回归方程,其回归方程也是没有实际意义的,不能用来作为估计的根据.所以求回归方程前一定要判断两个变量是否线性相关.例3 下表给出了x ,y 之间的一组数据:变量x ,y 之间是否具有相关关系?若有,求出线性回归方程.解 画出变量x ,y 的相关数据对应的散点图如图所示:由散点图可以看出,各点并不在一条直线附近,所以变量x ,y 之间不具有线性相关关系,不能用回归直线进行拟合,即使用样本数据求得回归方程也是没有意义的.点评 此题易产生如下错解,求得b =0,a =1.5,所以线性回归方程为y =1.5.产生错解的原因是没有考察变量x ,y 之间是否具有相关关系.。
高中数学北师大版必修3教学案第一章 §5 5.1 - 5.2 估计总体的分布 估计总体的数字特征 Word版含解析
.估计总体的分布估计总体的数字特征预习课本~,思考并完成以下问题()频率分布直方图纵轴的含义是什么?()频率分布直方图的制作步骤是什么?()如何画频率分布折线图?.频率分布直方图在频率分布直方图中,每个小矩形的宽度为Δ(分组的宽高为,度)小矩形的面积恰为相应的图中所有小矩形的面积之和等于.,,频率.作频率分布直方图的步骤()求极差.即一组数中最大值和最小值的差.()决定组距与组数.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.()将数据分组.()列频率分布表,各小组的频率=.()画频率分布直方图.[点睛]()一般地,样本容量越大,所分组数越多,为方便起见,组距的选择力求“取整”,当样本容量不超过时,按照数据的多少,通常分成~组.()画频率分布直方图时,同一组数据,分组时组距要相等,每个矩形的高与频率成正比,这点应特别注意..频率分布折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边,用线段依次连接各个矩形的区间的顶端中点中点开始,,就可直至右边所加区间的中点以得到一条折线,我们称之为频率折线图.,所划分的区间数也可以随之随着样本量的增大,增多而每个区间的长度则会相应随之减小相应的频率折线图就会越接近于一条光滑曲线.,.判断正误.(正确的打“√”,错误的打“×”)()频率分布直方图中每个小矩形的面积等于相应组的频数.( )()频率分布直方图的面积为样本的频数.( ) ()频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比.( )()从频率分布直方图中可以清楚地看出数据的内容.( )答案:()×()×()√()×.一个容量为的样本最大值是,最小值是,组距为,则可以分成( ).组.组.组.组解析:选组数=极差组距,本题中的极差=-=,所以组数为≈..在抽查产品的尺寸过程中,将其尺寸分成若干组,[,)是其中的一组,抽查出的个体在该组上的频率为,该组上的直方图的高为,则-=( )..+解析:选=,故-=组距==..一个容量为的样本,分成若干组,已知某组的频数和频率分别为和,则=.解析:由题意得=,所以=.答案:[] 为了了解某片经济林的生长情况,随机测量其中的棵树的底部周长,得到如下数据(单位:):()列出频率分布表;。
【高中教育】高中数学 第一章 统计 用样本估计总体学案 北师大版必修3.doc
用样本估计总体一、新情景引入:在西方国家还有这种观点:游泳比乘坐客车危险小的多,通过调查发现,实际上游泳死亡要比车祸要大的多,因为每个家庭的后院都有自己的游泳池。
孩子逆水死亡是经常的事情;在西方国家,每当飞机发生空难,乘客对飞机的安全系数产生怀疑时,常听到航空公司的有关人士辩解说:“乘坐飞机还是比乘坐火车安全的。
”理由是:飞机飞行10万公理死亡1人,而火车行驶5万公理就有1人死亡,你认为这个结论正确吗,能否给出合理的解释呢?二、要点精析1、用样本估计总体时,常用的统计图表有频率分布表、频率分布直方图、频率分布折线图和茎叶图。
2、列样本数据的频率分布表、频率分布直方图的步骤:(1)计算极差。
极差是样本数据的最大值与最小值的差。
(2)决定组距与组数。
组距选取据情况而定,越小越能反映总体分布。
(3)决定分点。
使分点与样本数据不重合,一般使分点比样本数据多一位小数,并且第一小组的起点比最小数据稍微减小一点,要保证每一个样本数据不重不漏。
(4)列频率分布表,累计频率等于1.(5)绘制频率分布直方图。
直方图中横轴表示样本数据,纵轴表示频率与组距的比值。
各小长方形的面积等于相应各组的频率,故所有长方形面积之和等于1.3、频率分布折线图,把频率分布直方图各个长方形上边的中点用线段连接起来得到频率分布折线图。
设样本容量不断增大,分组的组距不断缩小,则样本分布实际上越来越接近于总体分布,可用一条光滑的曲线来描绘,叫在总体密度曲线,它精确地反映了一个总体在各个区域那取值的规律。
4、茎叶图。
从频率分布直方图可清楚的看出数据分布的总体态势,但从其本身得不出原始的数据内容;茎叶图没有原始信息的损失,且方便记录和表示,但只适合两位数字的数据。
5、在实际生活中,我们往往更关注总体的某些数字特征,如平均数和标准差。
用样本平均数估计总体平均数,用样本标准差估计总体标准差。
6、记n 个样本数据n x x x ,,21的平均数为x ,方差为2s ,标准差为s ,则:(1)样本平均数nx x x x n ,,21=; (2)样本方差n x x x x x x s n 222212)()()(-++-+-= ; (3)样本标准差nx x x x x x s n 22221)()()(-++-+-= 注意:要熟练掌握用函数型计算器求样本平均数和标准差。
高中数学 第一章 统计 15 用样本估计总体教案3 北师大版必修3 教案
1.5 用样本估计总体教学目标 1、知识与技能会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程形成初步评价的意识。
2、过程与方法会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题。
3、情感态度价值观实,体会数学知识与现实世界的联系。
教学重点:利用样本估计总体的数字特征。
教学难点: 样本标准差的计算。
课题引入上节课,我们介绍了利用样本的频率分布可以估计总体的分布。
当然,我们也可以利用样本的数据特征估计总体的数字特征。
(二)探求新知有甲、乙两种钢筋,现从中各抽取一个样本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125。
请你运用所学的统计学的知识,说明哪种钢筋的质量较好?画出数据的条形统计图可以发现,甲样本的抗拉强度比较集中,乙样本的抗拉强度相对分散,说明乙样本没有甲样本的抗拉强度稳定。
从而,我们认为乙钢筋没有甲钢筋的抗拉强度稳定。
如果两组数据的集中程度差异不大时,从统计图中就不易得出结论。
那么,我们可以计算样本的方差(标准差)来估计总体的方差。
(三)知识应用例1、在1996年美国亚特兰大奥运会上,中国香港风帆选手李丽珊,以惊人的耐力和斗志,勇夺金牌,为香港体育史揭开了“突破零”的一页。
在风帆比赛中,成绩以低分为优胜。
比赛共11场,并以最佳的9场成绩计算最终的名次。
前7场比赛结束后,排名前5位的选手积分如表所示: 根据上面的比赛结果,我们如何比较各选手之间的成绩及稳定情况呢?如果此时让你预测谁将获得最后的胜利,你会怎么看?解析:我们可以分别计算5位选手前7场比赛积分的平均数和标准差,分别作为度量各选手比赛的成绩及稳定情况的依据,结果如下表所示: 从表中看出:李丽珊的平均积分及积分标准差都比其他选手的小,也就是说,在前7场的比赛过程中,她的成绩最为优异,而且表现也最为稳定。
尽管此时还有4场没有进行,但这里我们可以假定每位运动员在各自的11场比赛中发挥的水平大致相同,因而可以把前7场比赛的成绩看作是总体的一个样本,并由此估计每位运动员最后的比赛成绩。
2019-2020年高中数学北师大版必修3第一章《统计》(最小二乘估计第二课时)word教案
2019-2020年高中数学北师大版必修3第一章《统计》(最小二乘估计第二课时)word教案一、教学目标:经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二、教学重难点:重点:了解最小二乘法的思想并利用此思想借助电子表格求出回归方程。
教学内容的难点:对最小二乘法的数学思想和回归方程的理解教学实施过程中的难点:根据给出的线性回归方程的系数公式建立线性回归方程。
三、教学方法:动手操作,合作交流。
四、教学过程:(一)、利用最小二乘法推导回归系数公式。
回顾上节课:师:我们现在来求距离和。
怎么求?生:利用点到直线的距离公式师生共同:只要求出使距离和最小的、b即可。
但是,我们知道点到直线的距离公式计算复杂。
怎么办呢?以样本数据点A为例,可以看出:按照一对一的关系,直角边AC越小,斜边AB越小,当AC无限小时,AB跟AC可近似看作相等。
求麻烦,不妨求生:它表示自变量x取值一定时,纵坐标的偏差。
假设我们已经得到两个具有线性相关关系的变量的一组数据:……。
当自变量取(=1,2,……,n )时,可以得到(=1,2,……,n ),它与实际收集到的之间的偏差是(=1,2,……,n )这样用n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。
总的偏差为,偏差有正有负,易抵消,所以采用绝对值,由于带绝对值计算不方便所以换成平方,222221122331ˆ()()()()()ni i n n i Q y yy bx a y bx a y bx a y bx a ==-=--+--+--+⋅⋅⋅+--∑现在的问题就归结为:当,b 取什么值时Q 最小。
将上式展开、再合并,就可以得到可以求出Q 取最小值时1122211()()()nnii ii i i nn iii i xx y y xy nx yb xx xnxa y bx====---==--=-∑∑∑∑(其中,)推导过程用到偏差的平方,由于平方又叫二乘方,所以这种使“偏差的和”最小的方法叫“最小二乘法”。
高中数学 第一章 统计 15 用样本估计总体教案1 北师大版必修3 教案
1.5《估计总体的数字特征》【教材分析】1. 本节课是《数学》必修3的第一章统计中§5.2第二课时,教科书通过现实生活的例子,使学生认识到:只用样本的分布估计总体的分布是不够的,还需要用描述样本数据离散程度的特征量作为必要的、有益的补充,也就是只有把二者结合起来,才能通过对样本数据的研究来比较全面地认识和估计总体,进而使我们能从整体上更好地把握总体的规律、对总体作出合理的推断与决策,初步体会、领悟“用数据说话”的统计思想方法,这种技能已经成为一个未来公民的必备常识.2. 根据新课标的理念,我们应该是“用教材,而不是“教”教材”,应该是创造性地开发教材,教材只是一个载体,需要我们教师去挖掘、去创造,教学过程是一个再创造的过程,是对课程的不断发展、不断丰富的过程,教师应当根据学情的需要对教材进行调适和重组. 鉴于此,我在处理这堂课时,没有按照教材中的内容照本宣科,而是进行了整合与拓展,参考有关资料,补充了相关知识,使学生开阔了眼界,从课后学生的反应来看,效果较好. 【学情分析】本节课是在学生学习了频率分布分布表、频率分布直方图、频率分布折线图、用样本的分布估计总体分布的基础上,来学习用样本的数字特征估计总体的数字特征;在已知样本数据的情况下,会用样本的数字特征估计总体的数字特征;及在已知频率分布直方图的前提下,利用频率分布直方图估计总体的众数、中位数、平均数,这是一种近似估计,它主要是由于在绘制好直方图后就已经不再显示原始数据的缘故;同时学会将二者结合起来,通过对样本频率分布直方图、样本数据的研究来比较全面地认识和估计总体,进而使我们能从整体上更好地把握总体的规律、对总体作出合理的推断与决策,进一步体会、领悟“用数据说话”的统计思想方法,让学生经历探究过程,进一步提高科学探究的能力,促进科学素养的形成与发展.本节课的样本的数字特征学生在初中和第四节中就有所接触,只是当时学的叫做数据的数字特征,这时只要将这一组数据看成是从总体中随机抽取的一个样本就可以了,所以只是个别内容有所加深和拓展,学生较易接受,符合学生的认知水平.【三维目标】知识与技能1.会计算数据的平均数和标准差,正确理解样本数据标准差的意义和作用;能利用频率分布直方图估计总体的数字特征;2.能根据实际问题的需要合理地选择样本,从样本数据中提取基本的数字特征(如平均数、标准差等),并作出合理的解释;3.会用样本的基本数字特征估计总体的基本数字特征,树立对数据处理过程进行初步评价的意识.过程与方法1.会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用;2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.情感、态度与价值观通过对数据的收集、整理、分析、判断等操作过程的体验,培养学生的数字处理能力、“实事求是”的科学态度和严谨的治学作风.【重点难点】重点:1.平均数的计算,标准差的意义与计算方法2.根据实际问题的需求,从样本数据中提取基本的数字特征并作出合理解释,以此来估计总体的数字特征;体会样本数字特征具有随机性;难点:1.用样本平均数和标准差估计总体的平均数和标准差;2.根据实际问题的需求,从样本数据、频率分布直方图中提取基本的数字特征并作出合理解释,并能运用相关知识解决简单的实际问题.【教学方法】探究发现法、读书指导法、启发式讲练结合法【课前准备】学生准备好计算器;完成《导学案》;教师制作好课件,画图工具.【教学过程】一、自主复习有关内容⑴用样本估计总体的两种情况:①用样本估计总体的分布;②用样本估计总体的数字特征.⑵复习§4数据的数字特征有关概念1. 平均数:2. 中位数:3. 众数:4. 极差:5. 方差:6. 标准差:二、预习检测课前检查《导学案》完成情况.重点检查:第2,4题.三、导入新课1.复习回顾对一个未知总体,我们 常用样本的频率分布估计总 体的分布,其中表示样本数 据的频率分布的基本方法有哪些?频率分布表,频率分布直方图,频率分布折线图,茎叶图2.问题引入在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡也报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机抽取若干个个体作为样本,算出样本的数字特征,用样本的数字特征估计总体的数字特征---板书课题:§2.5估计总体的数字特征 四、新课讲解1.基本概念前面我们已经学习了如何用样本的频率分布估计总体的分布.同样,假设通过随机抽样得到的样本为n x x x ,,,21 ,我们把()n n x x x nn x x x x +++=+++= 21211∑==n i i x n 11和 ()()()[]2222121x x x x x x ns s n -++-+-== ()∑=-=ni i x x n 121分别称为样本平均数和样本标准差,用它们来分别估计总体的平均数和标准差.2.合作探究,新知应用七、小结用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数,平均数对数据有“取齐”作用,代表一组数据的平均水平;用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.第5节小结用样本估计总体体所包含的个体往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数与标准差呢?通常的做法是:用样本的平均数与标准差去估计总体的平均数与标准差.这与前面第一节中用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用样本估计总体
5.1 & 5.2 估计总体的分布 估计总体的数字特征
预习课本P32~39,思考并完成以下问题
(1)频率分布直方图纵轴的含义是什么?
(2)频率分布直方图的制作步骤是什么?
(3)如何画频率分布折线图?
[新知初探]
1.频率分布直方图
在频率分布直方图中,每个小矩形的宽度为Δx i (分组的宽度),高为
f i Δx i ,小矩形的面积恰为相应的频率f i ,图中所有小矩形的面积之和等于1.
2.作频率分布直方图的步骤
(1)求极差.即一组数中最大值和最小值的差.
(2)决定组距与组数.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
(3)将数据分组.
(4)列频率分布表,各小组的频率=小组频数样本容量
. (5)画频率分布直方图.
[点睛] (1)一般地,样本容量越大,所分组数越多,为方便起见,组距的选择力求“取整”,当样本容量不超过120时,按照数据的多少,通常分成5~12组.
(2)画频率分布直方图时,同一组数据,分组时组距要相等,每个矩形的高与频率成正比,这点应特别注意.
3.频率分布折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区。