人教版高中数学必修三 第二章 统计数据的数字特征用样本估计总体
人教A版高中数学必修3第二章2.2.2 用样本的数字特征估计总体的数字特征
2.2.2 用样本的数字特征估计总体的数字特征第1课时众数、中位数、平均数学情分析:本节课的学习者是高一学生,他们在初中已经学习过统计的初步知识,他们的观察、猜想能力较强。
但演绎推理、归纳、运用数学意识的思想比较薄弱,思维的广阔性、紧密性、灵活性比较欠缺,自主探究和合作学习能力需要在课堂教学中进一步加强和引导。
一、三维目标:1、知识与技能(1)能利用频率分布直方图估计总体的众数、中位数、平均数;(2)能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;。
(3)形成对数据处理过程进行初步评价的意识。
2、过程与方法初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.3、情感态度与价值观在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.二、重点与难点重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.难点:能应用相关知识解决简单的实际问题。
三、教学过程导入新课在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征. (板书课题)新知探究提出问题(1)什么是众数、中位数、平均数?(1)如何绘制频率分布直方图?(3)如何从频率分布直方图中估计众数、中位数、平均数?活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导.讨论结果:(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.(2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.(3)教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25 t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.请大家翻回到课本看看原来抽样的数据,有没有 2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)课本显示,大部分居民的月均用水量在中部(2.02 t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)对极端值不敏感有利的例子:考察课本中表21中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据.对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况.同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02 t.显示了居民月均用水量的平均数,它是频率分布直方图的“重心”.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相差太多了.利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.应用示例例1 下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间.分析:要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.解法一:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h),故平均睡眠时间约为7.39 h.解法二:求组中值与对应频率之积的和6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h). 答:估计该校学生的日平均睡眠时间约为7.39 h.例2 某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.分析:上述百分比就是各组的频率.解:估计该单位职工的平均年收入为12 500×10%+17500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26 125(元).答:估计该单位人均年收入约为26 125元.知能训练从甲、乙两个公司各随机抽取50名员工月工资:甲公司:800 800 800 800 800 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 0001 2001 2001 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 5001 500 1 500 1 500 1 500 1 500 1 5002 000 2 000 2 0002 000 2 000 2 500 2 500 2 500乙公司:700 700 700 700 700 700 700 700 700700 700 700 700 700 700 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 6 000 8 000 10 000试计算这两个公司50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资. 答案:甲公司:员工月工资平均数1 240,众数1 200,中位数1 200;乙公司:员工月工资平均数1 330,众数1 000,中位数1 000;从总体上看乙公司员工月工资比甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数.拓展提升“用数据说话”, 这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确理解在日常生活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义.在这里应该注意以下几点:1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.课堂小结1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;2.平均数对数据有“取齐”的作用,代表一组数据的平均水平;3.形成对数据处理过程进行初步评价的意识.作业习题2.2A组3.设计感想本堂课在初中学习的众数、中位数、平均数的基础上,学习了利用频率分布直方图估计众数、中位数、平均数,这是一种近似估计,但都能说明总体的分布特征,各有优缺点,讲解时紧扣课本内容,讲清讲透,使学生活学活用,会画频率分布直方图,会利用频率分布直方图估计众数、中位数、平均数,对总体作出正确的估计.。
高中数学人教A版必修三第二章2.2.2用样本的数字特征估计总体的数字特征课件
2、求下列各组数据的中位数
(1)1 ,2,3,3,3,4,6,8,8,8,9,9 中位数是:5 (2)1 ,2,3,3,3,4,8,8,8,9,9 中位数是:4
2.已知样本数据 x1,x2,…,xn 的均值 x =5,则样本数据
学徒 100 1 100
合计
23 6900
如何在频率散布直方图中估计平均数
频率/组距
0.08
0.16 0.30 0.50
0.44 0.40 0.50 0.28 0.30
0.12 0.20 0.08 0.04 0.10
频率/组距 0.5 1 1.5 2 2.5
平均数的估计值等于频率 散布直方图中每个小矩形的面 积乘以小矩形底边中点的横坐 标之和.
1.求出a、p、n; 2.补全频率散布直方图;
2.2.2用样本的数字特征估计 总体的数字特征
众数、中位数、平均数
用样本的数字特征估计总体的数字特征
1.众数、中位数、平均数的概念 (1)众数:一组数据中_出__现__次__数__最__多__的数.
按顺序排好
(2)中位数:一组数据按大小顺序排列后,处于_中__间__位置 的数.如果个数是偶数,则取_中__间__两个数据的平均数.
0.08 0.04
0.5 1 1.5 2 2.5
0.06 0.04
月均用水量/t
0.02
3 3.5 4 4.5
2.02
[典例] 某中学举行电脑知识竞赛,现将高一参赛学生的成 绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知 图中从左到右的第一、二、三、四、五小组的频率分别是 0.30,0.40,0.15,0.10,0.05.
人教B版高中数学必修三《第二章 统计 2.2 用样本估计总体 2.2.2 用样本的数字特征估计总体的数字特征》_3
课题:2.2.2 用样本的数字特征估计总体的数字特征(一)教学设计一、教材解析(一)教材地位与作用本节课选自人教B版必修3,第二章第二节第二讲,是一节探究课,是在第一讲中已经学习了用频率分布表、频率分布直方图、折线图、茎叶图的基础上从形的角度通过抽样估计整体,并结合初中学习的数字特征众数、中位数、平均数来研究数据进而估计整体,用频率分布直方图研究整体特征非常直接呈现出数据的分布及集中趋势,但原始数据丢失;怎样将频率分布直方图和数字特征很好的结合起来是我们本节课主要突破的问题。
教学重点:从频率分布直方图中估计总体的数字特征教学难点:从频率分布直方图中估计总体的中位数、平均数本节课在重难点的突破上采用类比的思想,引导学生用频率的思想重新定义众数、中位数、平均数,再类比到频率分布直方图,使学生能够更好地理解教材上所给出的运算方法。
(二)教学目标(1)会借助频率分布直方图从“形”的角度估计总体的数字特征,并作出合理的解释,体会数形结合的数学思想.(2)在解决统计问题的过程中,通过自主探索与合作交流,经历数字特征的生成过程,会用样本的数字特征估计总体的数字特征,体会用样本估计总体的思想.二、设计思路(一)教学设计构成本学案是按照罗定邦中学“1+1主体建构”的课堂模式要求,三案并举,包括:自主学习案、合作探究案、课后作业案。
自主学习案是学生课前预习,自主完成并检测,合作探究案是提前预习+课堂小组讨论、讲解点评,课后练习案是课后巩固提升,自主完成。
(二)教学媒体利用本节课我们要运用多媒体课件、平板电脑、定邦云平台,在自主自测和例题反馈当堂检测部分将运用定邦教育云平台上传答案并统计学生的做题情况,及时反馈、分析、有针对想的讲解。
让学生在生动具体的情境中感悟知识的发生和发展过程,优化学生的认识结构.三、教学过程设计(一)教学流程设计(二)教学过程设计一、 情境引入 我们第9周刚进行了期中考试,在理科班617位同学的数学成绩中随机抽取100位同学的数学成绩对全级数学成绩分析,100名同学的数学成绩如下。
人教版高中数学必修三 第二章 统计数据的数字特征用样本估计总体
数据的数字特征用样本估计总体一.课前热身二.知识结构图三.新知识全解(基本知识的详解及解决方法)知识点1.用样本的数字特征估计总体的数字特征:初中学过样本的众数(样本观测值中出现次数最多的数)样本中位数和平均值的数字特征,它们只能作为个体相应特征的估计。
这些数字特征刻划一组数据集中趋势的统计量。
刻划数据离散程度的统计量,如极差与方差刻划数据离散程度的度量,其理想形式应满足以下三条原则:(1)应充分利用所得到的数据,以便提供更确切的信息;(2)仅用一个数值来刻画数据的离散程度;(3)对于不同的数据集,当离散程度大时,该数据值亦大。
极差显然不满足上面的第一条原则,它只是利用了数据中最大和最小的两个值,而且对极值过于敏感,但由于只设计两个数据,便于得到,所以极差在实际中也经常应用。
方差虽然满足上面的三条原则,然而它有局限性:方差的单位是原始观测数据相同的单位,解决这个局限性的一种方法是取方差的正的平方根:nx x x x x x s s n 222212)()()(-+-+-==称为标准差,标准差的单位与原始测量单位相同。
在统计中,我们通常用标准差来刻画数据的离散程度。
例1(2002新课程)甲乙两种冬小麦实验品种连续5年的平均单位面积产量如下(单位:t/2km )其中产量比较稳定的冬小麦品种是( )分析:方差、标准差分别反映数据的稳定程度,集中与离散的程度。
解:102.10101.109.98.951=++++⨯=)(甲x ; ;)(乙108.97.98.103.104.951=++++⨯=x即甲乙两种冬小麦的平均产量的均值都等于10,其方差分别为02.004.0001.001.004.0512=++++⨯=)(甲s 244.004.009.064.009.036.0512=++++⨯=)(乙s即22乙甲s s <,表示甲种小麦的产量比较稳定。
变式练习1 某学校的日睡眠时间的抽样频率分布见下表:试估计该校学生的平均睡眠时间。
最新人教版高中数学必修3第二章《用样本的数字特征估计总体》
2.2.2 用样本的数字特征估计总体的数字特征1.掌握众数、中位数、平均数、标准差、方差的定义和特征.2.会求众数、中位数、平均数、标准差、方差,并能用之解决有关问题.1.众数(1)定义:一组数据中出现次数______的数称为这组数据的众数.(2)特征:一组数据中的众数可能________个,也可能没有,反映了该组数据的__________.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.【做一做1】 数据组8,-1,0,4,17,4,3的众数是__________.2.中位数(1)定义:一组数据按从小到大的顺序排成一列,处于______位置的数称为这组数据的中位数.(2)特征:一组数据中的中位数是______的,反映了该组数据的__________.在频率分布直方图中,中位数左边和右边的直方图的面积______.中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.【做一做2】 数据组-5,7,9,6,-1,0的中位数是__________. 3.平均数(1)定义:一组数据的和与这组数据的个数的商.数据x 1,x 2,…,x n 的平均数为x =____________.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的________.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的______,但平均数受数据中________的影响较大,使平均数在估计总体时可靠性降低.【做一做3】 10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,则其平均数是__________.4.标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s 表示,通常用以下公式来计算s =______________________________. 可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕________波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较____;标准差较小,数据的离散程度较____.【做一做4】 一组数据的单位是m ,平均数是x ,标准差为s ,则( ) A .x 与s 的单位都是km B .x 与s 的单位都是cm C .x 与s 的单位都是mD .x 与s 的单位不同5.方差(1)定义:标准差的平方,即 s 2=________________________.(2)特征:与________的作用相同,描述一组数据围绕平均数波动程度的大小. (3)取值范围:________.数据组x 1,x 2,…,x n 的平均数为x ,方差为s 2,标准差为s ,则数据组ax 1+b ,ax 2+b ,…,ax n +b (a ,b 为常数)的平均数为a x +b ,方差为a 2s 2,标准差为as .【做一做5】 下列刻画一组数据离散程度的是( ) A .平均数 B .方差 C .中位数 D .众数 6.用样本估计总体现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用______的平均数、众数、中位数、标准差、方差来估计.这与上一节用______的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数;用样本标准差估计总体标准差.样本容量越大,估计就越精确.【做一做6-1】 下列判断正确的是( ) A .样本平均数一定小于总体平均数 B .样本平均数一定大于总体平均数 C .样本平均数一定等于总体平均数D .样本容量越大,样本平均数越接近总体平均数【做一做6-2】 电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该日生产电池的平均寿命估计为( )A .27B .28C .29D .30答案:1.(1)最多 (2)不止一 集中趋势 【做一做1】 42.(1)中间 (2)唯一 集中趋势 相等【做一做2】 3 将该组数据按从小到大排列为-5,-1,0,6,7,9,则中位数是0+62=3.3.(1)x 1+x 2+…+x nn(2)平均水平 信息 极端值【做一做3】 14.7 平均数是110(15+17+14+10+15+17+17+16+14+12)=14.7.4.(1)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] (2)平均数 大 小 【做一做4】 C x 与s 的单位都与数据组中的数据单位相同,是m. 5.(1)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](2)标准差 (3)[0,+∞)【做一做5】 B 方差刻画一组数据离散程度的大小. 6.样本 样本 【做一做6-1】 D【做一做6-2】 B 这10个数据的平均数是110(30+35+25+25+30+34+26+25+29+21)=28,则该日生产的电池的平均寿命估计为28小时.1.理解众数、中位数、平均数剖析:(1)众数体现了样本数据的最大集中点,容易计算,但它只能表达样本数据中很少一部分信息,显然对其他数据信息的忽略使其无法客观地反映总体特征.(2)中位数不受少数几个极端值的影响,容易计算,但它对极端值的不敏感有时也会成为缺点.(3)由于平均数与每一个样本的数据有关,“越离群”的数据,对平均数的影响也越大,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.如在体育、文艺等各种比赛的评分中,使用的是平均数,计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止由于个别裁判的人为因素而给出过高或过低的分数,对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.(4)在一组数据中,它们的众数、中位数、平均数可能相同,也可能不同,而实际问题中,计算平均数时应该注意按实际要求进行计算.(5)实际问题中求得的平均数、众数和中位数应带上单位. 2.众数、中位数、平均数与频率分布直方图的关系剖析:(1)在样本数据的频率分布直方图中,众数的估计值就是最高矩形的中点的横坐标.(2)在频率分布直方图中,中位数左右两侧的直方图的面积相等,但是因为样本数据的频率分布直方图只是直观地表明分布的特征,因而从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数的值不一致.(3)平均数显然是频率分布直方图的“重心”.我们知道,n 个样本数据x 1,x 2,…,x n 的平均数x =1n (x 1+x 2+x 3+…+x n ),则就有n x =x 1+x 2+x 3+…+x n ,所以x 对数据有“取齐”的作用,代表了一组数据的数值平均水平.在频率分布直方图中,平均数是直方图的平衡点,假设横轴表示一块放置直方图的跷跷板,则支点取在平均数处时跷跷板达到平衡.3.理解方差与标准差剖析:(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围是[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性. (3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.题型一 计算方差(标准差)【例题1】 从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的标准差为________.反思:求一组数据的方差和标准差的步骤如下: ①先求平均数x .②代入公式得方差和标准差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 题型二 众数、中位数、平均数的应用【例题2】 某工厂人员及月工资构成如下:(1)指出这个问题中的众数、中位数、平均数.(2)这个问题中,平均数能客观地反映该工厂的月工资水平吗?为什么? 分析:由平均数的定义→计算平均数→已知数据从小到大排列→得中位数、众数→结论反思:(1)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.题型三 方差的应用【例题3】 甲、乙两台包装机同时包装质量为200克的糖果,从中各抽出10袋,测得其实际质量分别如下(单位:克):甲:203 204 202 196 199 201 205 197 202 199 乙:201 200 208 206 210 209 200 193 194 194 (1)分别计算两个样本的平均数与方差.(2)从计算结果看,哪台包装机包装的10袋糖果的平均质量更接近于200克?哪台包装机包装的10袋糖果的质量比较稳定?反思:研究两个样本的波动情况或比较它们的稳定性、可靠性、平整性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准.若平均数相等,则再比较两个样本方差的大小来作出判断.在计算过程中,要仔细观察所给样本数据的特征,选择恰当的公式来计算平均数和方差,这样可避免计算的烦琐,降低错误率.题型四 易错辨析【例题4】 小明是班里的优秀学生,他的历次数学成绩是96,98,95,93分,但最近的一次考试成绩只有45分,原因是他带病参加了考试.期末评价时,怎样给小明评价?错解:这五次数学考试的平均分是96+98+95+93+455=85.4,则按平均分给小明一个“良好”.错因分析:这种评价是不合理的,尽管平均分是反映一组数据平均水平的重要特征,但任何一个数据的改变都会引起它的变化,而中位数则不受某些极端值的影响.本题中的5个成绩从小到大排列为:45,93,95,96,98,中位数是95,较为合理地反映了小明的数学水平,因而应该用中位数来衡量小明的数学成绩.答案:【例题1】2105这100人的总成绩为5×20+4×10+3×30+2×30+1×10=300,平均成绩为300100=3,则该100人成绩的标准差为1100[(5-3)2×20+(4-3)2×10+(3-3)2×30+(2-3)2×30+(1-3)2×10] =2105. 【例题2】 解:(1)由表格可知,众数为2 000元.把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.平均数为(22 000+15 000+11 000+20 000+1 000)÷23=69 000÷23=3 000(元).(2)虽然平均数为3 000元/月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.【例题3】 解:(1)x 甲=110(3+4+2-4-1+1+5-3+2-1)+200=200.8.x 乙=110(1+0+8+6+10+9+0-7-6-6)+200=201.5.s 2甲=7.96,s 2乙=38.05.(2)∵200<x 甲<x 乙,∴甲台包装机包装的10袋糖果的平均质量更接近于200克.∵s 2甲<s 2乙,∴甲台包装机包装的10袋糖果的质量比较稳定.【例题4】 正解:小明5次考试成绩,从小到大排列为45,93,95,96,98,中位数是95,应评定为“优秀”.1.如图,是某篮球运动员在一个赛季的30场比赛中得分的茎叶图,则得分的中位数与众数分别为()A.3与3 B.23与3 C.3与23 D.23与232.(2011·北京海淀二模,理5)某赛季甲、乙两名篮球运动员各13场比赛的得分情况用茎叶图表示如下:根据上图,对这两名运动员的成绩进行比较,下列四个结论中,不正确的是() A.甲运动员得分的极差大于乙运动员得分的极差B.甲运动员得分的中位数大于乙运动员得分的中位数C.甲运动员的得分平均值大于乙运动员的得分平均值D.甲运动员的成绩比乙运动员的成绩稳定3.抛硬币20次,抛得正面朝上12次,反面朝上8次.如果抛到正面朝上得3分,抛到反面朝上得1分,则平均得分是__________,得分的方差是__________.4.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则x2+y2=__________.5.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根赛.答案:1.D中位数是指一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数),从茎叶图中可知中位数为23;众数是指一组数据中出现次数最多的数,从茎叶图中可知23出现了3次,次数最多,因此众数也是23,所以选D.2.D甲运动员比赛得分的最高分为47,最低分为18,极差为29,乙运动员比赛得分的最高分为33,最低分为17,极差为16,所以A项正确;甲运动员比赛得分的中位数为30,乙运动员比赛得分的中位数为26,所以B项正确;甲运动员的得分平均值x甲=113(18+18+19+20+21+26+30+32+33+35+40+41+47)=34313,乙运动员的得分平均值x乙=113(17+17+19+19+22+25+26+27+29+29+30+32+33)=32513,甲运动员的得分平均值大于乙运动员的得分平均值,所以C项正确;由茎叶图知甲得分较为分散,乙得分较为集中,故甲的成绩没有乙的成绩稳定.3.2.20.96总得分为12×3+8×1=44,则平均分是4420=2.2,方差s2=120[(3-2.2)2×12+(1-2.2)2×8]=0.96.4.208由平均数为10,得(x+y+10+11+9)×15=10,则x+y=20;又由于方差为2,则[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]×15=2,整理得x2+y2-20(x+y)=-192,则x2+y2=20(x+y)-192=20×20-192=208. 5.解:设甲乙两人成绩的平均数分别为x甲,x乙,则x甲=130+1(380751)6-+++++=133,x乙=130+1(318426)6-++-+=133,2 s 甲=2222221[(6)5(3)42(2)]6-++-+++-=473,2 s 乙=2222221[0(4)51(5)3]6+-+++-+=383.因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.。
人教B版高中数学必修三《第二章 统计 2.2 用样本估计总体 2.2.2 用样本的数字特征估计总体的数字特征》_7
(3)
例5:已知一组数据x1,x2,…,x5的平均数为
如图所示的是表示甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得
.甲、乙两名中学生在一年里各学科成绩的平均分相等,方差不相等,正确评价它们学
.成绩虽然一样,方差较大的,说明潜力大,学习态度扎实
.表面上看这两个学生平均成绩一样,但方差小的学习成绩稳定
.说明他们学习水平不一样,方差较小的同学,学习成绩不稳定,成绩忽高忽低
)
名学生右眼视力的检查结果如下表所示:
0.50.60.70.8 1.0
4468该班学生右眼视力的众数和中位数分别是()。
人教版高中数学必修三第二章第2节 2.2.2用样本的数字特征估计总体的数字特征 课件
• 问题4:书本73页的探究如何理解?
• 问题5: 总结在利用众数、中位数、平均数估计总体的 数字特征时各自的优缺点。
三种数字特征的优缺点
典例解析
[例] 某中学举行电脑知识竞赛,现将高一参赛学生的成 绩进行整理后分成五组绘制成如图所示的频率分布直方图,
80.024
0.02
0.01
0.01
20 . 0 0
08 . 0 0
4 0 90 1001 11 21301401 5 次数
课堂小结
1、如何从样本数据中求众数、平均数、中位 数的方法
2、如何从频率分布直方图中估计众数、中位 数、平均数? • 众数:最高矩形的中点的横坐标。 • 中位数:两边小长方形面积相等 • 平均数:频率分布直方图中每个小矩形的
面积乘以小矩形底边中点的横坐标之和。
1.成为世界上经济增长速度最快的国 家,创 造了世 界经济 增长史 上的新 奇迹。 1.否定商 品经济 的存在 ,否定 市场及 价值规 律对经 济的调 节作用 。 35、生命是以时间为单位的,浪费别 人的时 间等于 谋财害 命;浪费 自己的 时间, 等于慢 性自杀 。—— 鲁迅 36、社会上崇敬名人,于是以为名人的 话就是 名言, 却忘记 了他之 所以得 名是那 一种学 问或事 业--鲁迅 38、推销员接近顾客的方式,往往决 定自己 在他们 心目中 的地位 是“接 单者” 还是“ 建议者 ”。 39、事先写出自己所要提出的每点意 见,以 合乎逻 辑的顺 序表达 出来: 言简意 骇,抓 住重点 。 2、人生的成功,不在于拿到一幅好 牌,而 是怎样 将坏牌 打好。 3、人生的路每一个人都要走一趟, 同样是 一条路 每一个 人走起 来却有 着不同 的感受 ,是好 是坏那 就要靠 几分的 机缘与 自己的 抉择。 38、推销员接近顾客的方式,往往决 定自己 在他们 心目中 的地位 是“接 单者” 还是“ 建议者 ”。
人教版高中数学必修3第二章统计-《2.2.2用样本的数字特征估计总体数字特征》教案(5)
2.2.2用样本的数字特征估计总体的数字特征(众数,中位数,平均数)学习目标一.能力目标:(1). 能利用频率颁布直方图估计总体的众数,中位数,平均数.(2). 能用样本的众数,中位数,平均数估计总体的众数,中位数,平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法。
(3)初步体会、领悟“用数据说话”的统计思想方法。
二.情感目标:通过对有关数据的搜集、整理、分析、判断培养学生“实事求是”的科学态度和严谨的工作作风。
三.学习重点、难点(1).根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征。
(2).体会样本数字特征具有随机性。
四.基本流程五. 教学情景设计例1: 从甲乙两个公司各随机抽取50名员工月工资:甲公司:800 800 800 800 800 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1500 1500 1500 1500 1500 1500 1500 2000 2000 2000 2000 2000 2500 2500 2500乙公司:700 700 700 700 700 700 700 700 700 700 700 700 700 700 700 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 10001000 1000 1000 1000 1000 1000 1000 1000 10001000 1000 6000 8000 10000试计算这两个公司50名员工月工资平均数,众数,中位数,并估计这两个企业员工平均工资。
人教B版高中数学必修三《第二章 统计 2.2 用样本估计总体 2.2.2 用样本的数字特征估计总体的数字特征》_2
2.2.2用样本的数字特征估计总体的数字特征一、教材分析(一)教材地位与作用本节课选自人教A版必修三,第二章第二节第二讲,是一节典型的概念课,是在已经学习了抽样方法、用图、表来组织样本数据,用样本的频率分布估计总体分布的基础上,进一步挖掘样本,从形的角度,利用样本的频率分布直方图来估计总体的数字特征,从而使我们能从整体上更好地把握总体的规律,并体会用样本估计总体的思想,以及统计思维与确定性思维的差异.本课所学内容有良好的实际应用价值,它能为我们对相关问题作出统计推断和决策提供数理依据.因此学好本节课能帮助学生逐步建立用样本估计总体的统计思想,提高学生数据处理、解决实际问题的能力。
(二)教学目标1、理解众数、中位数、平均数在样本数据中所代表的含义;2、会运用频率分布直方图估计众数、中位数、平均数;从“形”的角度估计总体的数字特征,并作出合理的解释,体会数形结合的数学思想.3、理解在利用众数、中位数、平均数估计总体的数字特征时各自的优缺点;能通过对生活实例的分析认识数字特征的作用和局限性,会应用数字特征解决简单的实际问题并作出合理的决策. 感受统计在实际问题中的应用价值,体会数学知识与现实生活的联系.4、掌握用样本的众数、中位数、平均数估计总体数字特征的方法,形成数学思想方法. 在解决统计问题的过程中,通过自主探索与合作交流,经历数字特征的生成过程,会用样本的数字特征估计总体的数字特征,体会用样本估计总体的思想. 体验数形结合的思想方法,化归转化的思想方法在数学学习中的应用。
(三)教学重、难点教学重点:众数、中位数、平均数在样本数据中所代表的含义,利用频率分布直方图估计样本数字特征,并利用它们估计总体数字特征,形成初步评价意识。
教学难点:如何从样本的频率分布直方图中提取数字特征,并以此估计总体的基本数字特征。
二、学情分析1.学生已有的认知基础通过小学、初中和高中前期的学习,学生已有“统计初步知识”的数学现实,能从样本中直接提取样本的数字特征,能够用频率分布直方图来呈现数据的分布形态,现实生活中很多数量化的实际问题也为学生的认知提供了经验基础。
最新人教版高中数学必修3第二章《用样本的数字特征估计总体的数字特征》
数学人教B 必修3第二章2.2.2 用样本的数字特征估计总体的数字特征1.通过随机抽样,会用样本平均数估计总体平均数,会用样本标准差估计总体标准差. 2.掌握几个数据的标准差及方差的计算方法,理解数据标准差的意义和作用.1.众数、中位数、平均数(1)在一组数据中,出现____最多的数据叫做这组数据的众数. 即:众数是在样本数据中,频率分布______所对应的样本数据.(2)将一组数据按大小依次排列,把处在____位置的一个数据(或____两个数据的平均数)叫做这组数据的中位数.(3)如果有n 个数x 1,x 2,x 3,…,x n ,那么x =____________________,叫做这n 个数的平均数.中所有个体的平均数叫做总体平均数. 中所有个体的平均数叫做样本平均数.【做一做1】10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设平均数为a ,中位数为b ,众数为c ,则有( ).A .a <b <cB .a >b >cC .a <c <bD .c >a >b 2.样本方差、样本标准差数据的离散程度可以用____、____或______来描述.我们知道,样本方差描述了一组数据围绕______波动的大小.一般地,设样本的元素为x 1,x 2,…,x n ,样本的平均数为x ,定义s 2=(x 1-x )2+(x 2-x )2+…+(x n -x )2n,s =(x 1-x )2+(x 2-x )2+…+(x n -x )2n .其中s 2表示________,s 表示__________.因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.【做一做2-1】样本101,98,102,100,99的标准差为( ). A . 2 B .0 C .1 D .2【做一做2-2】若k 1,k 2,…,k 6的方差为3,则2(k 1-3),2(k 2-3),…,2(k 6-3)的方差为__________.1.平均数、中位数、众数的区别与联系剖析:平均数在度量一组数据的集中化趋势的统计量中是应用最广泛的.计算平均数时全部数据都参加运算,因此,用它来反映一组数据的集中化趋势的代表性比较好.但是它也有缺点,主要的问题是平均数是根据一组数据中的全部数据来计算的,会受到数据中那些没有代表性的极端值的影响.因此,有时在计算平均数时,先剔除个别缺乏代表性的特殊值,所得到的结果可能会更具有代表性.中位数主要受一组数据中的中间位置上的数值的影响,用中位数来反映一组数据中各数据大小的一般水平并不很精确.但中位数计算简单,与平均数相比,中位数不受数据中两端异常的特殊值的影响.从这个意义出发,它可以作为数据平均指标的代表值.众数并没有通常意义上的“平均”的含义.但众数在数据中出现的次数最多,说明该数值在数据中最具有代表性.众数不会受到数据中极端值的影响,但并不是每一组数据都是具有众数的.对于分组数据而言,众数常常依赖于分组的情况,分组数改变时,众数可能就有较大的变化,稳定性较差.同时众数也可能是不唯一的.2.方差、极差和标准差的特点剖析:方差、极差和标准差是从不同角度描述一组数据的离散趋势的.它们各自的特点及应用如下:虽然极差没有充分利用数据,不能提供更确切的信息,但由于只涉及两个数据,计算非常简便,所以极差在实际现场检查时经常利用,但极差没有考虑各中间值.方差充分利用了所得到的数据,提供了更确切的信息.在统计中,方差能够较好地区别出不同组数据的分散情况或程度,但方差的单位是原始观测数据的单位的平方.而标准差能够和方差一样区分数据的分散情况,且其单位与原始观测数据的单位相同.(1)当标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.(2)数据组x1,x2,…,x n的平均数为x,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,ax n+b(a,b为常数)的平均数为a x+b,方差为a2s2,标准差为as.题型一用众数、中位数、平均数估计总体(1)指出这个问题中的众数、中位数、平均数.(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?分析:本题着眼于众数、中位数、平均数各自的特点,以及适用对象.反思:平均数受数据中的极端值的影响较大,降低了对总体估计的可靠性,这时平均数反而不如众数、中位数更客观.题型二用方差或标准差估计总体【例2】某化肥厂甲、乙两个车间包装化肥,在自动包装传送带上每隔30分钟抽取一袋称其重量,分别记录抽查数据如下(单位:kg):甲:102 101 99 98 103 98 99 乙:110 115 90 85 75 115 110估计甲、乙两车间所包装化肥每袋的重量,并说明哪个车间的技术好.分析:根据公式计算得平均数和方差,分析甲、乙两车间每袋重量的集中趋势和离散程度.反思:对于常用的平均数、方差、标准差的公式要能够熟练记忆,不能记错公式,造成计算上的失误,使得统计的结果失去真实的意义.另外,应用求得的标准差的结论时,要特别注意标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.题型三 样本数字特征的应用【例3】画出下列四组数据的频率分布条形图,并说明它们的异同点. (1)5,5,5,5,5,5,5,5,5; (2)4,4,4,5,5,5,6,6,6; (3)3,3,4,4,5,6,6,7,7; (4)2,2,2,2,5,8,8,8,8.分析:比较四组数据的异同可从它们的平均数、标准差这些数字特征入手,分析它们的集中趋势或离散程度.反思:频率分布条形图可以将我们所要求的平均数、众数、中位数、标准差等数据一一用图形直观显示出来,帮助我们获取有用的信息,特别是在对两组数据间进行比较时,应用非常方便.题型四 易错辨析【例4】若10个正整数的平方和是208,平均数是4,则这组数据的方差为多少?将这组数据同时减去3,则新数据的平均数为多少?方差为多少?错解:s 2=110(x 21+x 22+…+x 210-10x )=16.8,这组数据都减去3后,平均数为4-3=1,方差为16.8-9=7.8.错因分析:对平均数、方差的公式不清楚,致使计算结果不正确.1能反映一组数据的离散程度的是( ). A .频数 B .平均数 C .标准差 D .极差2已知某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图如下,则( ).A .甲的中位数为21,乙的众数为26B .甲的众数为21,乙的中位数为25C .甲的中位数为21,乙的众数为31D .甲的众数为21,乙的中位数为313甲、乙两名同学在五次考试中数学成绩统计用茎叶图表示如下,则下列说法正确的是( ).A .甲的平均成绩比乙的平均成绩高B .甲的平均成绩比乙的平均成绩低C .甲成绩的方差比乙成绩的方差大D .甲成绩的方差比乙成绩的方差小4已知一个样本数据是1,3,2,5,x ,它的平均数是3,则这个样本的标准差是__________. 5一组数据的每一个数据都减去80,得一组新数据.若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是______、______.答案: 基础知识·梳理1.(1)次数 最大值 (2)中间 中间 (3)1n(x 1+x 2+…+x n ) 总体 样本 【做一做1】 A 众数c =17,中位数b =15,平均数a =110×(10+12+14×2+15×2+16+17×3)=14.7,所以a <b <c .2.极差 方差 标准差 平均数 样本方差 样本标准差【做一做2-1】 A 样本平均数x =15×(101+98+102+100+99)=100,方差s 2=15×[(101-100)2+(98-100)2+(102-100)2+(100-100)2+(99-100)2]=2,∴s = 2.【做一做2-2】 12 设k 1,k 2,…,k 6的平均数为k , 则16[(k 1-k )2+(k 2-k )2+…+(k 6-k )2]=3, 而2(k 1-3),2(k 2-3),…,2(k 6-3)的平均数为2(k -3),则所求方差为16[4(k 1-k )2+4(k 2-k )2+…+4(k 6-k )2]=4×3=12.典型例题·领悟【例1】 解:(1)由表格可知:众数为200,中位数为220,平均数为(2 200+250×6+220×5+200×10+100)÷23=300(元/周).(2)虽然平均数为300元/周,但从表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该厂的工资水平.【例2】 解:x 甲=17×(102+101+99+98+103+98+99)=100.x 乙=17×(110+115+90+85+75+115+110)=100.s 2甲=17×(4+1+1+4+9+4+1)=247, s 2乙=17×(102+152+102+152+252+152+102)=1 6007>s 2甲, ∵x 甲=x 乙=100,∴两车间所包装化肥每袋重量平均数都是100 kg.∵s 2甲<s 2乙,∴s 甲<s 乙,∴甲车间包装化肥的技术好.【例3】 解:四组数据的频率分布条形图如图所示.四组数据的平均数都是5,标准差分别是0.00,0.82,1.49,2.83.虽然它们有相同的平均数,但是它们的标准差不同,说明数据的离散程度是不一样的.【例4】 正解:由方差公式s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],展开整理可得s 2=1n[(x 21+x 22+…+x 2n )-n (x )2], 这里由题设n =10,x 21+x 22+…+x 210=208,x =4,所以s 2=110(208-10×42)=4.8.一组数据同时减去a 后,平均数为x -a ,方差不变,所以都减去3后,平均数为1,方差为4.8. 随堂练习·巩固1.C 本题考查数据的基本特征量以及它们的含义,因为标准差反映数据的波动大小及离散程度,所以应选C.2.C3.C 由图可知甲的五次成绩分别为99,98,105,118,115,则可得甲的五次成绩的平均数为107,方差为66.8;乙的五次成绩分别为95,106,108,112,114,则可得乙的平均成绩为107,方差为44.4.2 由15(1+3+2+5+x )=3,解得x =4,因为s 2=15[(1-3)2+(3-3)2+(2-3)2+(5-3)2+(4-3)2]=2,所以标准差s = 2.5.81.2 4.4 设这组数据为x 1,x 2,…,x n ,都减去80后,新数据为x 1′,x 2′,…,x n ′,则x 1′+x 2′+…+x n ′n =1.2.所以x 1+x 2+…+x n n =x 1′+x 2′+…+x n ′+80nn=1.2+80=81.2,又方差是刻画数据离散程度的量,故各数据减(或加)上同一个数后,方差的大小不变.。
人教B版高中数学必修三《第二章 统计 2.2 用样本估计总体 2.2.2 用样本的数字特征估计总体的数字特征》_4
《2.2.2 用样本的数字特征估计总体的数字特征》教学设计一、学情分析我校是面上中学,学生入学分数比较低,他们基础较差,在初中掌握的数学知识不够牢固,应用能力比较薄弱,针对这种情况,本节课分为两个课时,第一个课时先复习初中旧知识的方式引入新课,放慢教学速度,先教众数、中位数、平均数,方差和标准差只能是第二个课时才学习,我们的学生解决实际应用题这一方面最为薄弱,我们以多训练计算为主,同时也把如何理解众数、中位数、平均数的实际应用进行讲解。
现在的高中生对计算机的应用比较熟悉,为了鼓励和激发学生的学习积极性,我利用上一节课中处理类似大数据的例题,让学生亲自动手演练如何用Excel处理一百个数据的众数、中位数、平均数,学生在课前做了认真的准备,方法非常好用而且全面,取得了很不错的效果。
二、教材分析本节课是人教A和B版中必修三第二章第二节的内容,本节课在必修三中是一点很重要的知识点,现在高考中,越来越重视图表的题型,本节课刚好是针对在频率分布直方图中求众数、中位数、平均数,是高中阶段比较基础而且重要的一节课,如何让学生掌握好这节课是需要认真的准备的,我根据高考的频率分布直方图中的常考题型特点,设计了这节课的内容,还配套了比较基础的课后练习。
三、教学目标1.通过复习初中数学的众数、中位数、平均数公式,理解并记住在频率分布直方图中求众数、中位数、平均数的公式;2.能熟练地掌握用计算机的Excel处理大数据,从样本的原始数据中求出众数、中位数、平均数的各种方法;能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断;3.初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生积极参与自主学习和动手的能力,培养学生能够提升数据处理的能力,进一步发展数学运算能力,养成通过数据思考问题的习惯,形成一丝不苟、严谨求实的科学精神。
人教版高中数学必修三第二章第2节 2.2.2用样本的数字特征估计总体的数字特征 课件(共27张PPT)
问题
有两位射击运动员在一次射击测试中 各射靶十次,每次命中的环数如下: 甲 7 8 7 9 5 4 9 10 7 4 乙9578768 6 77
x甲 7
x乙 7
问题1解答 解:可计算知S甲=2,S乙≈1.095,由S甲>S乙可以知 道甲的成绩离散程度大,乙的成绩离散程度小。由
此可以估计乙比甲的射击成绩稳定。
二 、 众数、中位数、平均数 与频率分布直方图的关系
3、平均数是频率分布直方图的“重 心”.是直方图的平衡点.频率直方图中每 个小长方形的面积乘以小矩形底边中点的 横坐标之和。
三、 三种数字特征的优缺点
1、众数体现了样本数据的最大集中 点,但它对其它数据信息的忽视使得无 法客观地反映总体特征.
2、中位数是样本数据所占频率 的等分线,它不受少数几个极端值的 影响,这在某些情况下是优点,但它 对极端值的不敏感有时也会成为缺点。
2、标准差算法及其公式为:
1)算出样本数据的平均数 。 2)算出每个样本数据与样本数据平均数的差: 3)算出(2)中 的平方。 4)算出(3)中n个平方数的平均数,即为样本方差。 5)算出(4)中平均数的算术平方根,即为样本标准差。
s
1 n
[(
x1
x)2
( x2
x)2
( xn
x)2
]
3.关于标准差的说明: 1)标准差较大,数据的离散程度较大;标准差较 小,数据的离散程度较小。
规律:标准差越大, 则a越大,数据的 离散程度越大;反 之,数据的离散程 度越小。
3.关于标准差的说明:
1)标准差较大,数据的离散程度较大;标准差较 小,数据的离散程度较小。
2)从标准差的定义和计算公式都可以得出S≥0。
人教版高中数学必修三第二章第2节 2.2.2用样本的数字特征估计总体的数字特征 课件(共13张PPT)
课堂小结
1.利用频率分布直方图估计众数、中位数、 平均数,进而估计总体的数字特征
2.众数、中位数、平均数的特点
课下作业 课本P74 练习
播下一个行动,收获一种习惯;播下一种习惯,收获一种性格;播下一种性格,收获一种命运。思想会变成语言,语言会变成行动,行动会变成习惯,习惯会变成性格。性 制,会变成生活的必需品,不良的习惯随时改变人生走向。人往往难以改变习惯,因为造习惯的就是自己,结果人又成为习惯的奴隶!人生重要的不是你从哪里来,而是你 时侯,一定要抬头看看你去的方向。方向不对,努力白费!你来自何处并不重要,重要的是你要去往何方,人生最重要的不是所站的位置,而是所去的方向。人只要不失去 这个世界唯一不变的真理就是变化,任何优势都是暂时的。当你在占有这个优势时,必须争取主动,再占据下一个优势,这需要前瞻的决断力,需要的是智慧!世上本无移 是:山不过来,我就过去。人生最聪明的态度就是:改变可以改变的一切,适应不能改变的一切!亿万财富不是存在银行里,而是产生在人的思想里。你没找到路,不等于 什么,你必须知道现在应该先放弃什么!命运把人抛入最低谷时,往往是人生转折的最佳期。谁能积累能量,谁就能获得回报;谁若自怨自艾,必会坐失良机人人都有两个 一个是心门,成功的地方。能赶走门中的小人,就会唤醒心中的巨人!要想事情改变,首先自己改变,只有自己改变,才可改变世界。人最大的敌人不是别人,而是自己, 1、烦恼的时候,想一想到底为什么烦恼,你会发现其实都不是很大的事,计较了,就烦恼。我们要知道,所有发生的一切都是该发生的,都是因缘。顺利的就感恩,不顺 渡寒潭,雁过而潭不留影;风吹疏竹,风过而竹不留声。”修行者的心境,就是“过而不留”。忍得住孤独;耐得住寂寞;挺得住痛苦;顶得住压力;挡得住诱惑;经得起 子;担得起责任;1提得起精神。闲时多读书,博览凝才气;众前慎言行,低调养清气;交友重情义,慷慨有人气;困中善负重,忍辱蓄志气;处事宜平易,不争添和气; 泊且致远,修身立正气;居低少卑怯,坦然见骨气;卓而能合群,品高养浩气淡然于心,自在于世间。云淡得悠闲,水淡育万物。世间之事,纷纷扰扰,对错得失,难求完 反而深陷于计较的泥潭,不能自拔。若凡事但求无愧于心,得失荣辱不介怀,自然落得清闲自在。人活一世,心态比什么都重要。财富名利毕竟如云烟,心情快乐才是人生 在路上,在脚踏实地的道路上;我们的期待在哪里?在路上,在勤劳勇敢的心路上;我们的快乐在哪里?在路上,在健康阳光的大道上;我们的朋友在哪里?在心里,在真 钟,对自己负责;善于发现看问题的角度;不满足于现状,别自我设限;勇于承认错误;不断反省自己,向周围的成功者学习;不轻言放弃。做事要有恒心;珍惜你所拥有 学会赞美;不找任何借口。与贤人相近,则可重用;与小人为伍,则要当心;只满足私欲,贪图享乐者,则不可用;处显赫之位,任人唯贤,秉公办事者,是有为之人;身 则可重任;贫困潦倒时,不取不义之财者,品行高洁;见钱眼开者,则不可用。人最大的魅力,是有一颗阳光的心态。韶华易逝,容颜易老,浮华终是云烟。拥抱一颗阳光 随缘。心无所求,便不受万象牵绊;心无牵绊,坐也从容,行也从容,故生优雅。一个优雅的人,养眼又养心,才是魅力十足的人。容貌乃天成,浮华在身外,心里满是阳 飞,心随流水宁。心无牵挂起,开阔空净明。幸福并不复杂,饿时,饭是幸福,够饱即可;渴时,水是幸福,够饮即可;裸时,衣是幸福,够穿即可;穷时,钱是幸福,够 畅即可;困时,眠是幸福,够时即可。爱时,牵挂是幸福,离时,回忆是幸福。人生,由我不由天,幸福,由心不由境。心是一个人的翅膀,心有多大,世界就有多大。很 的环境,也不是他人的言行,而是我们自己。人心如江河,窄处水花四溅,宽时水波不兴。世间太大,一颗心承载不起。生活的最高境界,一是痛而不言,二是笑而不语。 人生的幸福在于祥和,生命的祥和在于宁静,宁静的心境在于少欲。无意于得,就无所谓失去,无所谓失去,得失皆安谧。闹市间虽见繁华,却有名利争抢;田园间无争, 和升平,最终不过梦一场。心静,则万象皆静。知足者常在静中邂逅幸福。顺利人生,善于处理关系;普通人生,只会使用关系;不顺人生,只会弄僵关系。为人要心底坦 脑清醒,不为假象所惑。智者,以别人惨痛的教训警示自己;愚者,用自己沉重的代价唤醒别人。对人多一份宽容,多一份爱心;对事多一份认真,多一份责任;对己多一 长,志不可满,乐不可极,警醒自己。静能生慧。让心静下来,你才能看淡一切。静中,你才会反观自己,知道哪些行为还需要修正,哪些地方还需要精进,在静中让生命 觉悟。让心静下来,你才能学会放下。你放下了,你的心也就静了。心不静,是你没有放下。静,通一切境界。人与人的差距,表面上看是财富的差距,实际上是福报的差 实际上是人品的差距;表面上看是气质的差距,实际上是涵养的差距;表面上看是容貌的差距,实际上是心地的差距;表面上看是人与人都差不多,内心境界却大不相同, 很重要的一件事。因为当一个人具有感恩的心,心会常常欢喜,总是觉得很满足,一个不感恩不满足的人,总是会觉得欠缺、饥渴。一个常感恩的人,会觉得自己很幸运, 这样一想、一感恩,就变得很快乐。这种感恩的心,对自己其实是有很大利益。压力最大的时候,效率可能最高;最忙碌的时候,学的东西可能最多;最惬意的时候,往往 太阳就要光临。成长不是靠时间,而是靠勤奋;时间不是靠虚度,而是靠利用;感情不是靠缘分,而是靠珍惜;金钱不是靠积攒,而是靠投资;事业不是靠满足,而是靠踏 件事。因为当一个人具有感恩的心,心会常常欢喜,总是觉得很满足,一个不感恩不满足的人,总是会觉得欠缺、饥渴。一个常感恩的人,会觉得自己很幸运,有时候其实 一感恩,就变得很快乐。这种感恩的心,对自己其实是有很大利益。压力最大的时候,效率可能最高;最忙碌的时候,学的东西可能最多;最惬意的时候,往往是失败的开 光临。成长不是靠时间,而是靠勤奋;时间不是靠虚度,而是靠利用;感情不是靠缘分,而是靠珍惜;金钱不是靠积攒,而是靠投资;事业不是靠满足,而是靠踏实。以平 在危险面前,平常心就是勇敢;在利诱面前,平常心就是纯洁;在复杂的环境面前,平常心就是保持清醒智慧。平常心不是消极遁世,而是一种境界,一种积极的人生。不 一个有价值的人而努力。命运不是机遇,而是选择;命运不靠等待,全靠争取。成熟就是学会在逆境中保持坚强,在顺境时保持清醒。时间告诉你什么叫衰老,回忆告诉你 要外来的赞许时,心灵才会真的自由。你没那么多观众,别那么累。温和对人对事。不要随意发脾气,谁都不欠你的。现在很痛苦,等过阵子回头看看,会发现其实那都不 交。人有绝交,才有至交学会宽容伤害自己的人,因为他们很可怜,各人都有自己的难处,大家都不容易。学会放弃,拽的越紧,痛苦的是自己。低调,取舍间,必有得失 错误面前没人爱听那些借口。慎言,独立,学会妥协的同时,也要坚持自己最基本的原则。付出并不一定有结果。坚持可能会导致失去更多过去的事情可以不忘记,但一定 作一个最好的打算和最坏的打算。做一个简单的人,踏实而务实。不沉溺幻想。不庸人自扰。不说谎话,因为总有被拆穿的一天。别人光鲜的背后或者有着太多不为人知的 学习。不管学习什么,语言,厨艺,各种技能。注意自己的修养,你就是孩子的第一位老师。孝顺父母。不只是嘴上说说,即使多打几个电话也是很好的。爱父母,因为他 爱的最无私的人。
高中数学必修三 第二章 统计 第3节 用样本的数字特征估计总体的数字特征
例 2:甲、乙两机床同时加工直径为 100 cm 的零件,为检验质量,各从中抽取
6 件测量,数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 [1精0解0详析] (1)-x 甲=16(99+100+98+100+100+103)=100,
(1)分别计 (2)根据计
所求平均数为:
1 x 乙=10×(11+17+19+21+22+24+24+30+30+32)=23.
[答案] 24 23
练习:某中学号召学生在今年春节期间至少参加一次社会公益活动(以下简称活 动),该校合唱团共有 100 名学生,他们参加活动的次数统计如图所示.求合唱 团学生参加活动的人均次数.
解析:5 个数据的平均数-x =10+6+58+5+6=7,所以 s2=51×[(10-7)2+(6 -7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.答案:3.2
例 3:某人 5 次上班途中所花的时间(单位:分钟)分别为 x,y,10,11,9.已知这
组数据的平均数为 10,方差为 2,则|x-y|的值为( )
加上 60,得到一组新数据,则所得新数据的平均数和方差分别是( )
A.57.2 3.6 C.62.8 63.6
B.57.2 56.4
1
D解.析6:2设.8该组数3.据6为 x1,x2,…,xn,则n(x1+x2+…+xn)=2.8,
方差的性质:
1 n[(x1-2.
8)2+(x2-2.8)2+…
+(xn-2.8)2]=3.6
问题 3:观察上述两组数据,你认为哪个人的射击水平更稳定?
提示:从数字分布来看,甲命中的环数较分散,乙命中的环数较集中.故
人教B版高中数学必修三《第二章 统计 2.2 用样本估计总体 2.2.2 用样本的数字特征估计总体的数字特征》_9
独立思考,回答问题:
学生4:先抽取样本
学生5:0.82
学生6:用样本的平均质量估计总体的平均质量
学生7:回答问题2.4
学生8:回答问题2.5
设计意图通过具体的实例,利用计算机模拟,让同学们经历抽样,画频率分布直方图,计算样本的平均数,从而估计总体平均数这样一个全过程,在此过程中学习数据分析的方法,理解数据分析的思路,运用所学知识和方法解决实际问题。并结合具体问题,理解统计推断结果的或然性,正确运用统计结果解释实际问题。
2.学习者分析
同学们在初中已经学习过数据分析,所以大部分同学对平均数和方差的计算没有太大问题,但是对于平均数和方差描述了数据的什么特征,有些同学不太清楚,所以在本节课回顾旧知环节,我会带领同学做重点回顾,顺带引出标准差的概念。另外,同学们在本章的第一节学习了抽样方法,并在上一节课学习了用样本的频率分布估计总计的分布,所以在本节课我会选择一个案例,利用计算机模拟,让同学们经历抽样,画频率分布直方图,计算样本的数字特征,从而估计总体特征这样一个全过程,从而教给学生统计方法,并让学生体会统计思想。
n个不同的数的频率分别是 ,那么
问题1.2:这组数的平均数反映了这组数据的什么特征?
问题1.3:请同学们计算这组数据的方差。
随后给出标准差的公式
问题1.4:这组数的方差反映了这组数据的什么特征?
学的活动1
独立思考,回答问题:
学生1:
学生2:反映了这组数据的平均水平
学生3:反映了这组数据的离散程度
设计意图:通过一组数据回顾平均数和方差的计算公式,并在此基础上引入新的知识—用频率计算平均数,以及标准差的计算公式,在此过程中同学们经历了由特殊到一般的逻辑推理过程,另外该平均数的计算公式为后面用频率分布直方图估计平均数做准备。
人教版高中数学 A版 必修三 第二章 《2.2.2用样本的数字特征估计总体的数字特征》
知识点三 平均数 定义 如果有 n 个数
x1,x2,x3,…,xn,那么
x
=
1n(x1+x2+…+xn)
叫做
这 n 个数的平均数.
特点 (1)一组数据有且仅有一个平均数.(2)平均数是频率分布直方图的
“重心”,是直方图的平衡点,因此,每个小矩形的面积与小矩形底边中
点的横坐标的乘积之和为平均数.(3)由于平均数与每一个样本的数据有关,
度.
3.现实中的总体所包含的个体数往往是很多的,虽然总体的平均数与标准
差客观存在,但是我们无从知道.所以通常的做法随是机用样本的平均数和标准
差去估计总体的平均数与标准差.虽然样本具有
性,不代同表的性样本测
得的数据不一样,与总体的数字特征也可能不同,但只要样本的
答案
返回
题型探究
重点难点 个个击破
类型一 感受数据的离散程度
3.利用直方图求数字特征:①众数是最高的矩形的底边的中点.②中位数 左右两边直方图的面积应相等.③平均数等于每个小矩形的面积乘以小矩 形底边中点的横坐标之和.
返回
第二章 § 2.2 用样本估计总体
2.2.2 用样本的数字特征估计总体的数字 特征(二)
学习目标
1.理解样本数据方差、标准差的意义,会计算方差、标准差; 2.会用样本的基本数字特征(平均数、标准差)估计总体的基本数字特征; 3.体会用样本估计总体的思想.
知识点二 用样本的基本数字特征估计总体的基本数字特征
1.样本的基本数字特征包括众数 、中位数 平、均数 标、准差
.
2.平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们
作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些
人教版高中数学必修三第二章第2节用样本的数字特征估计总体的数字特征 课件
(位2数12)0、0指平1出5均0这0数个11问00题中20周00工1资00的众69数00、中
分析:众数为200,中位数为220,
平09:1均8 数为300。
12
(2)这个问题中,工资的平均数能客观 地反映该厂的工资水平吗?为什么?
因平均数为300,由表格中所列出的数据 可见,只有经理在平均数以上,其余的人 都在平均数以下,故用平均数不能客观真 实地反映该工厂的工资水平。
在频率分布直方图中,就是最高矩形的
中点的横坐标
频率 组距
取最高矩形下端 中点的横坐标
2.25作为众数.
0.5 0.4 0.3 0.2 0.1
O09:180.5 1 1.5 2 2.5 3 3.5 4 4.5
月平均用水量(t) 6
2 中位数 中位数左边和右边的直方图面积相等
思考:在城市居民月均用水量样本数 据的频率分布直方图中,从左至右各 频率 个小矩形的面积分别是0.04,0.08, 组距 0.15,0.22,0.25,0.14,0.06, 0.04,0.02.由此估计总体的中位数是 什么t=?2.02
s
1 n
(
x1
x)2ຫໍສະໝຸດ (x2
x)2
(
xn
x)2
.
方差:
s2
1 n
( x1
x)2
( x2
x)2
( xn
x)2
09:18
18
方差
s2
1 n [(x1
x)2
(x2
x)2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据的数字特征用样本估计总体一.课前热身二.知识结构图三.新知识全解(基本知识的详解及解决方法)知识点1.用样本的数字特征估计总体的数字特征:初中学过样本的众数(样本观测值中出现次数最多的数)样本中位数和平均值的数字特征,它们只能作为个体相应特征的估计。
这些数字特征刻划一组数据集中趋势的统计量。
刻划数据离散程度的统计量,如极差与方差刻划数据离散程度的度量,其理想形式应满足以下三条原则:(1)应充分利用所得到的数据,以便提供更确切的信息;(2)仅用一个数值来刻画数据的离散程度;(3)对于不同的数据集,当离散程度大时,该数据值亦大。
极差显然不满足上面的第一条原则,它只是利用了数据中最大和最小的两个值,而且对极值过于敏感,但由于只设计两个数据,便于得到,所以极差在实际中也经常应用。
方差虽然满足上面的三条原则,然而它有局限性:方差的单位是原始观测数据相同的单位,解决这个局限性的一种方法是取方差的正的平方根:nx x x x x x s s n 222212)()()(-+-+-==称为标准差,标准差的单位与原始测量单位相同。
在统计中,我们通常用标准差来刻画数据的离散程度。
例1(2002新课程)甲乙两种冬小麦实验品种连续5年的平均单位面积产量如下(单位:t/2km )其中产量比较稳定的冬小麦品种是( )分析:方差、标准差分别反映数据的稳定程度,集中与离散的程度。
解:102.10101.109.98.951=++++⨯=)(甲x ; ;)(乙108.97.98.103.104.951=++++⨯=x即甲乙两种冬小麦的平均产量的均值都等于10,其方差分别为02.004.0001.001.004.0512=++++⨯=)(甲s 244.004.009.064.009.036.0512=++++⨯=)(乙s即22乙甲s s <,表示甲种小麦的产量比较稳定。
变式练习1 某学校的日睡眠时间的抽样频率分布见下表:试估计该校学生的平均睡眠时间。
变式练习2 甲乙两台机床同时生产一种零件10天中,两台机床每天的次品数分别是: 甲:0 1 0 2 2 0 3 1 2 4 乙:2 3 1 1 0 2 1 1 0 1分别计算这两组数据的平均值与标准差,从计算结果看,哪台机床的性能较好? 变式练习3 下列数据是30个不同的国家中每100000名男性患某种疾病的死亡率: 27.0 23.9 41.6 33.1 40.6 18.8 13.7 28.9 13.2 14.5 27.0 34.8 28.9 3.2 50.1 5.6 8.7 15.2 7.1 5.2 16.5 13.8 19.2 11.2 15.7 10.0 5.6 1.5 33.8 9.2 请由这些数据计算平均数、中位数和标准差,并对它们的含义进行解释。
知识点2 、用样本的频率分布估计总体分布频率分布表和频率分布图,从各个小组数据在样本容量所占比例大小的角度,来表示数据分布的规律。
它可以使我们看到正个样本数据的频率分布情况,步骤如下: (1)求极差 (2)决定组距和组数 (3)将数据分组 (4)频率分布表 (5)画频率分布直方图频率分布折线图:连接频率分布直方图中各小长方形上端点的中点,就得到频率分布折线图。
一般的,当总体中的个数较多,抽样时样本容量就不能太小,随着样本容量的增加,作图时所分的组数也增加,相应的频率折线图会越来越接近一条光滑的曲线。
例1 公交车的数量太多容易造成资源的浪费,太少难以满足乘客的需求,为此,公交公司在某站台随机调查了80名乘客,他们的侯车时间如下所示(单位:min )17 14 20 12 10 24 18 17 1 22 13 19 28 5 34 7 25 18 28 1 15 31 12 11 10 16 12 9 10 13 19 10 12 12 16 22 17 23 16 15 16 11 9 3 13 2 18 22 19 9 23 28 15 21 28 12 11 14 15 3 11 6 2 18 25 5 12 15 20 16 12 28 20 12 28 15 8 32 18 9 (1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图: (2)这80名乘客候车时间的平均数是多少?标准差呢? (3)你能为公交公司提出什么建议?分析:样本数据较多,我们可以利用计算器计算平均数和标准差。
解:(1)①由数据最大值、最小值得到:最大值为34,最小值1,极差=34-1=33;②确定组距为5(min ),6.6533==组距极差,分成7组;③第一组起点0;④由各组累计频数的算法,得到各组的频数。
频率分布见下表:频率分布直方图如图所示:频率折线图略(2)这80名乘客的乘车时间的平均值是15.5min;标准差是7.5;(3)公交公司可适当的增加公交车的数量。
变式练习4、(2007年淄博一模)下图是容量为100的样本的频率分布直方图,试根据图中的数据,回答下列问题:(1)样本数据在[)6,2内的频率为();(2)样本数据在[)10,6内的频率为();易错剖析:在画频率分布直方图时应注意纵坐标为组距频率,而不是频率,每个小矩形的宽度为i x ∆(分组的宽度),高为iix f ∆,小矩形的面积恰好为相应的频率i f ,图中所有小矩形的面积之和,也就是落在各个宽度的区间内的频率之和等于1。
例3、对于某电子元件进行寿命追踪调查,情况如下:(1)列出频率分布表; (2)画出频率分布直方图;(3)估计元件寿命,在100~400以内的百分比为多少? (4)估计电子元件寿命在400以上的百分比为多少? 分析:利用样本频率分布估计总体频率分布。
解:(1)频率分布表为: 频率分布直方图,如图所示:(3)由频率分布表或由频率分布直方图,可知寿命在100h~400h内的百分比约为65%;(4)由频率分布表或由频率分布直方图可知寿命在400h以上的电子元件的百分比约35%;点拨:利用样本在某一范围内的频率,也可以近似地估计总体在这一范围内的频率。
变式练习5:在一批棉花中抽测了60根棉花的纤维长度,结果如下(单位:mm)82 202 352 321 25 293 293 86 28 206323 355 357 33 325 113 233 294 50 296115 236 357 326 52 301 140 328 238 35858 255 143 360 340 302 370 343 260 30359 146 60 263 170 305 380 346 61 305175 348 264 383 62 306 195 350 265 385作出这个样本的频率分布直方图,棉花的纤维长度是棉花质量的重要指标,你能从图中分析出这批棉花的质量状况吗?四、问题探究(重点、难点、疑点以及解决方法)样本的数字特征包括众数中位数、平均数标准差、方差,它们各有优缺点,我们要考虑所选样本代表性,就要从数字特征入手,但众多的数字特征哪一个能更好的用来评价我们所选取的样本哪?这便成为了我们首先要考虑的问题。
每个样本的数字特征它从不同的方面来刻画样本中数据,所以我们要来研究一下它们的共性与差异。
探究1:数字特征的优缺点①众数体现了样本数据的最大中点,但它忽视了其它的数据信息,无法客观反映总体特征;②中位数是样本数据所有点频率的等分线,它不受少数极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点;③由于平均数与样本的每一个数据有关,所以任何一个数据的改变都会引起平均数的变化,这是众数,中位数都不具备的性质,也正是这个原因,与众数、中位数比较起来,平均数可以放映出更多关于样本数据全体的信息。
但平均数据中的极端值的影响较大,使平均数在估计总体时可靠性降低;④标准差、方差描述一组数据围绕平均数波动的大小,但方差与原始数据的单位不同且平方后夸大了偏差程度,在实际问题中一般都用标准差。
例4、在一次人才招聘会上,有一家公司的招聘员告诉你“我们公司的收入水平很很高”,去年在50名员工中,最高年收入达到了100万,他们的年收入的平均数是3.5万”如果你希望获得年薪2.5万⑴你是否能够判断自己可以成为此公司的一名高收入者?⑵如果招聘员继续告诉你“员工收入的变化范围是从0.5万到100万”这个信息是否足以作出自己是否受聘的决定?为什么?⑶如果招聘员继续给你提供了如下信息:“员工收入的中间50%(即最少的25%和最多的25%后所剩的)变化范围是1万到3万”你又该如何使用这条信息来作出是否受聘的决定?⑷你能估计出收入的中位数是多少吗?为什么均值比估计出的中位数高很多?分析:理解数字特征的作用。
解:⑴不能,因为平均收入和最高收入相差太多,说明高收入的职工只占极少数,现在已经知道至少有一个人的收入为X 50=100万元。
那么其他员工的收入之和为Y =3.5×50-100=75万元 ,每人平均只有1.53万元。
如果再有几个收入特别高者,那么初进公司的员工的收入将会很低。
⑵不能,要看中位数是多少。
⑶能,可以确定又75%的员工工资在1万元以上,其中25%的员工工资在3万元以上。
⑷收入的中位数大约是2万元,因为有年收入100万元这个极端值的影响,使得年平均收入比中位数高许多。
例5、(2007年普通高等学校招生全国统一考试(海南)第11题).甲、乙、丙三名射箭运动123s s s ,,分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( )A.312s s s >> B.213s s s >> C.123s s s >> D.231s s s >>解:5.8205105958571=⨯+⨯+⨯+⨯=x ,118.1])5.810(5)5.89(5)5.88(5)5.87(5[20122221=-⨯+-⨯+-⨯+-⨯⨯=s 5.8206104948672=⨯+⨯+⨯+⨯=x,204.1])5.810(6)5.89(4)5.88(4)5.87(6[20122222=-⨯+-⨯+-⨯+-⨯⨯=s 5.8204106968473=⨯+⨯+⨯+⨯=x,025.1])5.810(4)5.89(6)5.88(6)5.87(4[20122223=-⨯+-⨯+-⨯+-⨯⨯=s 答案:B变式练习5:在去年的足球甲A 联赛上,一队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;二队每场比赛平均失球数是2.1,全年比赛失球个数的标准差为0.4。
你认为下列说法中哪一种是正确的,为什么? ⑴平均说来一队比二队防守技术好; ⑵二队比一队技术水平更稳定;⑶一队有时表现很差,有时表现又非常好; ⑷二队很少不失球。