人教A版 必修三 第二单元 统计 用样本估计总体学案(无答案)
2021人教A版 必修三 统计 用样本估计总体学案
用样本估计总体一、目标与策略明确学习目标及主要的学习方法是提高学习效率的首要条件,要做到心中有数!学习目标:● 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.● 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.● 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.● 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.● 会用样本的基本数字特征估计总体的基本数字特征.重点难点:● 重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.用样本平均数和标准差估计总体的平均数与标准差.● 难点:能通过样本的频率分布估计总体的分布.能应用相关知识解决简单的实际问题. 学习策略:● 本课题主要包括两大内容:用样本频率分布估计总体分布、用样本数字特征估计总体数字特征.通过对实际数据的分析,评估现实中的实际问题是数学学科的灵魂,而频率分布直方图、总体密度曲线、茎叶图正是有着这方面的作用,所以在学习过程中要注意理论和实际的结合。
二、学习与应用(一)简单随机抽样的概念:“凡事预则立,不预则废”。
科学地预习才能使我们上课听讲更有目的性和针对性。
我们要在预习的基础上,认真听讲,做到眼睛看、耳朵听、心里想、手上记。
知识回顾——复习学习新知识之前,看看你的知识贮备过关了吗?一般地,从元素个数为N 的总体中地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体被抽到的是的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本.(二)系统抽样的概念:当总体中的个体比较多时,将总体分成的若干部分,然后按照预先制定的规则,从每一部分中抽取一个,得到所需要的样本,这样的抽样方法称为系统抽样,也称作抽样.(三)分层抽样的概念: 当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个的几部分,每一部分叫做,在各层中按层在总体中所占进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.知识点一:频率分布的概念频率分布是指一个样本数据在各个小范围内所占的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:(1)计算一组数据中最值与最值的差,即求(2)决定与(3)将数据分组(4)列分布表(5)画频率分布直方图 要点诠释: 频率分布直方图的特征: (1)从频率分布直方图可以清楚的看出数据分布知识要点——预习和课堂学习认真阅读、理解教材,尝试把下列知识要点内容补充完整,带着自己预习的疑惑认真听课学习。
高中数学《总体分布的估计》教案1(1) 新人教A版必修3
总体分布的估计(1)用样本的数字特征估计总体的数字特征教学目标:知识与技能(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。
(4)形成对数据处理过程进行初步评价的意识。
过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。
情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。
重点与难点重点:用样本平均数和标准差估计总体的平均数与标准差。
难点:能应用相关知识解决简单的实际问题。
教学设想【创设情境】在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。
——用样本的数字特征估计总体的数字特征(板出课题)。
【探究新知】<一>、众数、中位数、平均数〖探究〗:P62(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。
例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见课本第62页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。
人教A版高中数学必修3第二章 统计2.2 用样本估计总体教案
2.2.1用样本的频率分布估计总体分布一、教学目标分析1.知识与技能目标(1)通过实例体会分布的意义和作用。
(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图。
(3)通过实例体会频率分布直方图的特征,能准确地做出总体估计。
2、过程与方法目标:通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。
3、情感态度与价值观目标:通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。
二、教学的重点和难点重点:会列频率分布表,画频率分布直方图。
难点:能通过样本的频率分布估计总体的分布。
三、教法与学法分析1、教法:遵循观察、探究、发现、总结式的教学模式。
重点以引导学生为主,让他们能积极、主动的进行探索,获取知识。
由于内容较繁琐,所以要借助多媒体辅助教学。
2、学法:根据本节知识的特点,由于学生已具备一定的基础知识,可采取研究性学习的学习方法。
四、教学过程(一)情境引入1.随机抽样有哪几种基本的抽样方法?简单随机抽样、系统抽样、分层抽样.2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习的内容.3.高二某班有50名学生,在数学必修②结业考试后随机抽取10名,其考试成绩如下:82,75,61,93,62,55,70,68,85,78.如果要求我们根据上述抽样数据,估计该班对数学模块②的总体学习水平,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估计总体分布.(二)新课讲解知识探究(一):频率分布表【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.20.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.21.7 1.3 3.6 1.7 0.6 4.1 3.22.9 2.4 2.3 1.8 1.43.5 1.9 0.84.3 3.02.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.60.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.61.0 1.0 1.7 0.82.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?0.2~4.3思考2:样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?(4.3-0.2)÷0.5=8.2思考3:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].思考4:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?分组频数累计频数频率[0,0.5) 4 0.04[0.5,1)8 0.08[1,1.5)正正正15 0.15[1.5,2)正正正正22 0.22[2,2.5)正正正正正25 0.25[2.5,3)正正14 0.14[3,3.5)正一 6 0.06[3.5,4) 4 0.04[4,4.5] 2 0.02合计100 1.00思考5:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?用样本的频率分布估计总体分布.思考6:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?88%的居民月用水量在3t以下,可建议取a=3思考7:在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的.思考8:对样本数据进行分组,其组数是由哪些因素确定的?思考9:对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.按统计原理,若样本的容量为n,分组数一般在(1+3.3lg n)附近选取.当样本容量不超过100时,按照数据的多少,常分成5~12组.若以0.1或1.5为组距对上述100个样本数据分组合适吗?思考10:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?第一步,求极差.(极差=样本数据中最大值与最小值的差)第二步,决定组距与组数.(设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1)第三步,确定分点,将数据分组.第四步,统计频数,计算频率,制成表格.(频数=样本数据落在各小组内的个数,频率=频数÷样本容量)知识探究(二):频率分布直方图思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高度在数量上有何特点?思考2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?各小长方形的面积=频率各小长方形的面积之和=1思考3:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民月均用水量集中在一个中间值附近,只有少数居民月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?第一步,画平面直角坐标系.第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.思考5:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以1为组距画频率分布直方图吗?(三)例题讲解例1、 某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计年龄在32~52岁的知识分子所占的比例约是多少.(1)极差为67-28=39,取组距为5,分为8组.样本频率分布表:分 组 频数 频率[27,32) 3 0.06[32,37) 3 0.06[37,42) 9 0.18[42,47) 16 0.32[47,52) 7 0.14[52,57) 5 0.10[57,62) 4 0.08[62,67) 3 0.06合 计 50 1.00(2)样本频率分布直方图:频率(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32例 2、为了了解小学生的体能情况,抽取了某小 学同年级部分学生进行跳绳测试,将所得的数据 整理后画出频率分布直方图(如图),已知图中从 左到右的前三个小组的频率分别是0.1,0.3,0.4。
必修三2.2.用样本估计总体(教案)
必修三2.2.用样本估计总体(教案)必修三2.2.用样本估计总体(教案)导语:本文为必修三2.2.用样本估计总体(教案)的教学指南,旨在引导学生了解和应用样本估计总体的方法。
通过学习本课,学生将能够理解抽样和样本的基本概念,并能够运用点估计和区间估计的方法进行总体参数的估计。
为了达到良好的教学效果,本教案采用了多样的教学方法,例如引导讨论、示例演示和小组合作等。
一、教学目标:1. 理解样本与总体的概念和关系;2. 掌握点估计的方法;3. 了解区间估计的原理和应用;4. 能够进行样本估计总体的实际问题分析。
二、教学过程:1. 导入(5分钟)引导学生思考以下问题:什么是样本?什么是总体?样本和总体之间有什么关系?为什么需要用样本来估计总体?2. 点估计的方法(15分钟)a. 讲解点估计的基本原理,即通过样本数据来估计总体参数的值。
b. 示例演示:设计一个问题,如某班级数学考试成绩的平均分。
用班级中的五位同学的成绩作为样本,通过计算样本的平均分来估计全班的平均分。
c. 引导学生讨论点估计的优点和缺点。
3. 区间估计的方法(15分钟)a. 讲解区间估计的概念和原理,即通过样本数据构造一个置信区间来估计总体参数的范围。
b. 示例演示:使用同样的例子,构造一个置信水平为95%的置信区间,来估计全班的平均分。
c. 引导学生讨论区间估计的优点和缺点。
4. 实际问题分析(25分钟)a. 设计一个实际问题,例如某个城市的人均收入。
要求学生提出估计该城市人均收入的方法和步骤,并结合点估计和区间估计的方法进行分析。
b. 小组合作:分组讨论,每个小组根据实际问题设计一个解决方案,并准备向全班汇报。
c. 汇报与讨论:每个小组轮流汇报他们的解决方案,并进行讨论。
5. 总结与延伸(10分钟)a. 概括本课内容,强调样本估计总体的方法和应用。
b. 提出延伸问题,鼓励学生进一步探索样本估计总体的其他应用领域。
三、教学反思:本节课通过引导讨论、示例演示和小组合作等多种教学方法,促使学生自主思考和应用样本估计总体的方法。
必修三2.2.用样本估计总体(教案)
2.2 用样本估计总体教案 A第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1. 通过实例体会分布的意义和作用.2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.二、探究新知探究1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,第 1 页为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值及最小值的差,即求极差;2.决定组距及组数;3.将数据分组;4.列频率分布表;5.画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.探究2:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(把学生分成两大组进行,分别作出两种组距的图,然后组织同学们对所作图的不同看法进行交流……)接下来请同学们思考下面这个问题:思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见教材P67)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)(二)频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.思考:1.对于任何一个总体,它的密度曲线是不是一定存在?为什么?2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把第 3 页这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.三、例题精析例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.cm )例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:40.0824171593=+++++, 又因为频率=.第二小组频数样本容量所以,12150.0.08===第二小组频数样本容量第二小组频率 (2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、课堂小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、评价设计1.P81习题2.2 A组1、2.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征(板出课题).二、探究新知(一)众数、中位数、平均数探究(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供第 5 页关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t (最高的矩形的中点)(图见教材第72页)它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.(图略见教材73页图2.2-6)思考:2.02这个中位数的估计值,及样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)图2.2-6显示,大部分居民的月均用水量在中部(2.02t 左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)(二)标准差、方差1.标准差平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176cm ,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛? 我们知道,77x x ==乙甲,.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?(观察P74图2.2-7)直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据.考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.样本数据1,2,,n x x x 的标准差的算法:第 7 页(1) 算出样本数据的平均数x .(2) 算出每个样本数据及样本数据平均数的差:(1,2,)i x x i n -= (3) 算出(2)中(1,2,)i x x i n -=的平方.(4) 算出(3)中n 个平方数的平均数,即为样本方差.(5) 算出(4)中平均数的算术平方根,即为样本标准差.其计算公式为:显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.提问:标准差的取值范围是什么?标准差为0的样本数据有什么特点?从标准差的定义和计算公式都可以得出:s ≥0.当0s =时,意味着所有的样本数据都等于样本平均数.2.方差从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.三、例题精析例1 画出下列四组样本数据的直方图,说明他们的异同点.(1)5,5,5,5,5,5,5,5,5(2)4,4,4,5,5,5,6,6,6(3)3,3,4,4,5,6,6,7,7(4)2,2,2,2,5,8,8,8,8分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:(图见教材P76)四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83.他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的.例2 甲乙两人同时生产内径为25.40mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm ):甲 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.3825.42 25.39 25.43 25.39 25.40 25.44 25.40 25.4225.45 25.35 25.41 25.39乙 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.3625.34 25.49 25.33 25.43 25.43 25.32 25.47 25.3125.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数及标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值.解:四、课堂小结1. 用样本的数字特征估计总体的数字特征分两类:(1)用样本平均数估计总体平均数.(2)用样本标准差估计总体标准差.样本容量越大,估计就越精确.2. 平均数对数据有“取齐”的作用,代表一组数据的平均水平.3. 标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.五、评价设计P81 习题 2.2 A组 3、4.教案 B第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1.通过实例体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.教学难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境,导入新课我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.二、新课探知(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1. 计算一组数据中最大值及最小值的差,即求极差;2. 决定组距及组数;第 9 页cm ) 3. 将数据分组;4. 列频率分布表;5. 画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)一画出频率分布直方图;(3)估计身高小于134C m的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图:(3134cm 的男孩出现的,所以我们估计身高小 (1趋势. (2把数据抹掉了.曲线 1.频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(见教材P69)(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.例2某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.用茎叶图表示,你能通过该图说明哪个运动员的发挥更稳定吗?解:“茎”指的是中间的一列数,表示得分的十位数;“叶”指的是从茎的旁边生长出来的数,分别表示两人得分的个位数.画这组数据的茎叶图的步骤如下第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,茎是中间的一列数,按从小到大的顺序排列;第三步,将各个数据的叶按大小次序写在茎右(左)侧.甲乙8 04 6 3 1 2 53 6 8 2 5 43 8 9 3 1 6 1 6 7 94 4 91 5 0从图中可以看出,乙运动员的得分基本上是对称的,页的分布是“单峰”的,有的叶集中在茎2,3,4上,中位数为36;甲运动员的得分除一个特殊得分(51分)外,也大致对称,叶的分布也是“单峰”的,有的叶主要集中在茎1,2,3上,中位数是26.由此可以看出,乙运动员的成绩更好. 另外i,从叶在茎上的分布情况看,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定.练习:在NBA的2010赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33学生画出茎叶图(略)三、巩固练习为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(见下页图示),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第 11 页(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.08 24171593=+++++,又因为频率=第二小组频数样本容量,所以,121500.08===第二小组频数样本容量第二小组频率.(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、布置作业P71练习1、2、3.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境导入新课在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征.二、新课探究(一)众数、中位数、平均数初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见教材第72页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,第 13 页。
高中数学必修3《用样本的数字特征估计总体的数字特征(二)》导学案
数学(高二上)导学案必修三第二章第二节课题:用样本估计总体二、合作探究归纳展示任务1 标准差问题平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:7879549107 4乙:9578768677如果你是教练,你应当如何对这次射击作出评价?思考1甲、乙两人本次射击的平均成绩分别为多少环?答经计算得:x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.思考2观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?答直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中.思考3对于甲乙的射击成绩除了画出频率分布条形图比较外,还有没有其它方法来说明两组数据的分散程度?答还经常用甲乙的极差与平均数一起比较说明数据的分散程度.甲的环数极差=10-4=6,乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.思考4 如何用数字去刻画这种分散程度呢?答 考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示 . 思考5 所谓“平均距离”,其含义如何理解?答 假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i =1,2,…,n ).于是,样本数据是x 1,x 2,…,x n 到x 的“平均距离”是S =|x 1-x |+|x 2-x |+…+|x n -x |n .由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 思考6 标准差的取值范围如何?若s =0表示怎样的意义?答 从标准差的定义可以看出,标准差s ≥0,当s =0时,意味着所有的样本数据等于样本平均数. 任务2 方差思考1 方差的概念是怎样定义的?答 人们有时用标准差的平方s 2—方差来代替标准差,作为测量样本数据分散程度的工具,方差:s 2=1n ·[(x 1-x )2+(x 2-x )2+…+(x n -x )2].思考2 对于一个容量为2的样本:x 1,x 2(x 1<x 2),它们的平均数和标准差如果分别用x 和a 表示,那么x 和a 分别等于什么? 答 x =12(x 1+x 2),a =12(x 2-x 1).思考3 在数轴上,x 和a 有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?答 x 和a 的几何意义如下图所示.说明了标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.思考4 现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?答 通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.例1求出问题中的甲乙两运动员射击成绩的标准差,并说明他们的成绩谁比较稳定?解x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.根据标准差的公式,s甲=110[(7-7)2+(8-7)2+…+(4-7)2]=2;同理可得s乙≈1.095.所以s甲>s乙.因此说明甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.跟踪训练1如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.答案 6.8任务3标准差及方差的应用例2画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.解四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.跟踪训练2从甲、乙两种玉米中各抽10株,分别测得它们的株高如下:甲:25、41、40、37、22、14、19、39、21、42;乙:27、16、44、27、44、16、40、40、16、40;(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=30,x乙=110(27+16+44+27+44+16+40+40+16+40)=31,x甲<x乙.即乙种玉米的苗长得高.(2)由方差公式得:s2甲=110[(25-30)2+(41-30)2+…+(42-30)2]=104.2,同理s2乙=128.8,∴s2甲<s2乙.即甲种玉米的苗长得齐.答乙种玉米苗长得高,甲种玉米苗长得齐.例3甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.4625.3225.4525.3925.3625.3425.4225.4525.3825.4225.3925.4325.3925.4025.44的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.四、作业布置 1、基础知识:1.下列说法正确的是( )A .在两组数据中,平均值较大的一组方差较大B .平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C .方差的求法是求出各个数据与平均值的差的平方后再求和D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 答案 B2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( )A.1169B.367C .36D.677答案 B3.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是x =2,方差是13,那么另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数和方差分别为( )A .2,13B .2,1C .4,13D .4,3答案 D4.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________; (2)命中环数的标准差为________.。
高中数学第二章统计221用样本的频率分布估计总体分布练习含解析新人教A版必修
2.2.1 用样本的频率分布估计总体分布A级基础巩固一、选择题1.没有信息的损失,所有的原始数据都可以从图中得到的统计图是( )A.总体密度曲线B.茎叶图C.频率分布折线图D.频率分布直方图答案:B2.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )B.C.D.解析:数据总个数n=10,又落在区间[22,30)内的数据个数为4,故所求的频率为410=0.4.答案:B3.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚.下图是某路段的一个检测点对300辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为( )A.30辆B.40辆C.60辆D.80辆解析:车速大于或等于70 km/h的汽车数为×10×300=60(辆).答案:C4.一个社会调查机构就某地区居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图),为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(单位:元)月收入段应抽出的人数为( )A.5 B.25 C.50 D.2 500解析:组距=500,在[2 500,3 000)的频率=0.000 5×500=,样本数为100,则在[2 500,3 000)内应抽100×=25(人).答案:B5.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,仅知道后5组的频数和为62.设视力在到之间的学生数为a,最大频率为,则a的值为( )A.27 B.48 C.54 D.64解析:由已知,视力在到之间的学生数为100×=32,又视力在到之间的频率为1-+0.5)×-62100=,所以视力在到之间的学生数为100×=22,所以视力在到之间的学生数a =32+22=54.答案:C二、填空题6.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:分组/分频数频率[80,90)①②[90,100)[100,110)[110,120)36[120,130)[130,140)12③[140,150]合计④根据上面的频率分布表,可以①处的数值为________,②处的数值为________. 解析:由位于[110,120)的频数为36,频率=36n=,得样本容量n =120,所以[130,140)的频率=12120=,②处的数值=1------=; ①处的数值为×120=3. 答案:37.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[140,150]内的学生中抽取的人数应为________.解析:所有小矩形的面积和等于10×++0.020+a +0.035)=1,解得a =;100名同学中,身高在[120,130)内的学生数是10××100=30,身高在[130,140)内的学生数是10××100=20,身高在[140,150]内的学生数是10××100=10,则三组内的总学生数是30+20+10=60,抽样比是1860=310,所以身高在[140,150]内的学生中选取的人数应为10×310=3.答案: 38.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如下:据此可估计该校上学期200名教师中,使用多媒体进行教学次数在[15,25)内的人数为________.答案:60三、解答题9.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00-10:00间各自的点击量,得到如图所示的茎叶图.(1)甲网站点击量在[10,40]间的频率是多少? (2)甲、乙两个网站哪个更受欢迎?请说明理由.解:(1)甲网站点击量在[10,40]内的有17,20,38,32,共有4天,则频率为414=27. (2)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? 解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由题意估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.B 级 能力提升1.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图所示是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18解析:志愿者的总人数为20(+)×1=50,所以第三组的人数为50×=18,有疗效的人数为18-6=12.答案:C2.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,则运动员人数为4.答案:43.从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分): [40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[70,80)分的学生所占总体的百分比.解:(1)频率分布表如下:成绩分组频数频率[40,50)2[50,60)3[60,70)10[70,80)15[80,90)12[90,100]8合计50(2)由题意知组距为10,取小矩形的高根据表格画出如下的频率分布直方图:(3)由频率分布直方图,可估计成绩在[70,80)分的学生所占总体的百分比是×10==30%.。
高中数学人教A版必修三习题第二章-用样本的数字特征估计总体的数字特征含答案
;x =
5
乙
5
=30,
2.所以-x 甲<-x 乙,s 甲>s 乙.
答案:B 二、填空题 6.甲、乙两位同学某学科连续五次的考试成绩用茎叶图表示如图所示,则平均分数较 高的是________,成绩较为稳定的是________.
解析:-x
甲=70,-x 乙
=68,s甲2
=1 5
×(22+12+12+22)=2,s乙2
11
= =6. 11
答案:A
2.甲、乙两同学在高考前各做了 5 次立定跳远测试,测得甲的成绩如下(单位:米):
2.20, 2.30, 2.30, 2.40, 2.30, 若 甲 、 乙 两 人 的 平 均 成 绩 相 同 , 乙 的 成 绩 的 方 差 是
0.005,那么甲、乙两人成绩较稳定的是________. 解析:求得甲的平均成绩为 2.30米,甲的成绩的方差是 0.004.由已知得甲、乙平均成
而 2(k1-3),2(k2-3),…,2(k6-3)的平均数为 2(k -3),则所求方差为
16[4(k1--k )2+4(k2--k )2+…+4(k6-
- k )2]=4×3=12.
答案:12
8.若有一个企业,70%的员工年收入 1 万元,25%的员工年收入 3 万元,5%的员工年收
入 11万元,则该企业员工的年收入的平均数是________万元,中位数是________万元,众
乙品种的样本平均数也为 10,样本方差为
[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2)+(9.8-10)2]÷5=0.24.
因为 0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.
人教A版高中数学必修3第二章 统计2.2 用样本估计总体导学案(1)
江西省吉安市井冈山大学附中高中数学《样本估计总体的数字特征》导学案(一)新人教版必修3(一)问题提出1、为什么要用样本估计总体?2、怎样用样本估计总体?3、什么是频率分布?什么是总体分布?4、频率分布直方图的特征是什么?5、你能不能画出给定数据的频率分布折线图?讨论结果:1、2问题的回答见课本32页第一段。
3、频率分布是指一个样本数据在各个小范围所占比例的大小;一般用频率分布直方图来反映样本的频率分布。
总体分布是指总体中个体所占比例。
4、频率分布直方图的特征:(1)从频率分布直方图可以清楚地看出数据分布的总体趋势,(2)从频率分布直方图得不出原始数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了,(3)同样一组数据,如果组距不同,横轴,纵轴的单位不同,得到的图形和形状也会不同,不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。
5、连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
(二)讲案1895年,在伦敦有106块男性头盖骨被挖掘出土。
经考证,头盖骨的主人死于1665---1666年之间的大瘟疫。
人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:mm)146 141 139 140 145 141 142 131 142 140 144 140 138 139 141 137 141 132 140 140 141 143 134 146 134 142 133 149 140 140 143 149 136 141 143 143 141 138 136 138 144 136 145 143 137 142 146 140 148 140 140 139 139 144 138 146 153 148 152 143 140 141 145 148 139 136 141 140 139 158 135 132 148 142 144 137 153 148 144 138 150 148 138 145 145 142 143 143 148 141 145 141 (见课本)请大家思考:用什么统计图可以直观表示上述数据的分布状况?你能根据上述数据估计在1665----1666年之间英国男性头盖骨宽度的分布情况吗?思考:1)分析数据的基本方法是什么?(作图或用紧凑的表格来改变数据的排列方式)2)频率分布直方图绘制的步骤?3)频率分布折线图的绘制?4)频率分布直方图的纵坐标是什么?小长方形的面积表示什么?小长方形的面积之和是多少?5)当数据的样本量发生变化的时候,会对频数分布直方图有什么样的影响?用什么方法能减少样本容量对数据分布的影响?6)当样本容量不断增大时频率分布折线图会发生什么趋势变化?(三)练案1.已知样本:10,8,6,13,8,10,12,11,7,8,9,11,9,12,9,10,11,11,12,那么频率为0.2的范围是( )A.5.5-7.5 B 、7.5-9.5 C 、9.5-11.5 D 、11.5-13.52.一个容量为20的样本数据,分组后组距与频数如下:(]20,10,2; (]30,20,3;(]40,30,4;(]50,40,5;(]60,50,4;(]70,60,2,则样本在区间(]50,50-上的频率为( )A . 5%B .25%C .50%D .70%3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,则b a -=______.4.有100名学生,每人只能参加一个运动队,其中参加足球的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人。
高中数学必修三第二章《统计》学案2.3.变量间的相关关系(学生专用)(A版)
高中数学必修三第二章《统计》学案2.3.变量间的相关关系(学生专用)(A版)普通高中数学必修3(A版)学案 2.3. 变量间的相关关系2.3.1变量之间的相关关系授课时间:年月日【学习目标】通过收集现实问题中两个有关联变量的数据认识变量间的相关关系。
【重点难点】1. 通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系。
2. 变量之间相关关系的理解。
【学习过程】一、学习引导在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?二、合作交流(教师可做点拨)相关关系的概念:两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。
当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。
相关关系是一种非确定性关系。
(分析:两个变量→自变量取值一定→因变量带有随机性→相关关系)三、随堂练习思考1:考察下列问题中两个变量之间的关系:(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄.这些问题中两个变量之间的关系是函数关系吗?思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?你能举出类似的描述生活中两个变量之间的这种关系的成语吗?思考3:商品销售收入与广告支出经费之间的关系。
(还与商品质量,居民收入,生活环境等有关)四、能力提升1. 上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?2. 对于一个变量,可以控制其数量大小的变量称为可控变量,否则称为随机变量,那么相关关系中的两个变量有哪种类型?3. 相关关系与函数关系的异同点?【小结反思】1. 变量具有不确定性,需要通过收集大量的数据(通过调查或试验)在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系做出正确的判断。
人教A版高中数学必修3《二章统计2.2用样本估计总体阅读与思考生产过程中的质量控制图》优质课教案_4
阅读与思考:生产过程中的质量控制图》教学设计阅读与思考:生产过程中的质量控制图——正态分布[ 教材分析]本节课选自人教A 版必修3第二章“统计”第2.2节“用样本估计总体”课后的“阅读与思考”部分。
在第2.1节通过抽样收集数据之后,第2.2节给出了两种用样本估计总体的方式,一种是用样本的频率分布估计总体的分布,另一种是用样本的数字特征(如平均数、标准差等)估计总体的数字特征。
本节课是在这基础上,结合前面所学的总体密度曲线、平均数和标准差的概念,通过生产过程中的产品质量控制图引出正态分布,利用具体的生活应用介绍正态分布密度曲线的特点以及期望、标准差对整个正态分布的影响。
正态分布无论是在理论上还是应用上都是极其重要的一个分布,将正态分布的这些特点应用到质量控制中,可使学生进一步加强对标准差的认识。
由于正态分布的随机变量是连续型随机变量,这也让学生对随机变量由离散型到连续型有一个初步的认识。
从教材编排上来看,“阅读与思考”内容是对频率分布直方图、标准差认识的深化,是统计知识体系的一种承接和完善,也是后续选修2-3 中第2.4“正态分布”一课的铺垫。
[学情分析]学生在之前章节的学习中,已经掌握如何通过抽样来收集数据,能够画出所收集数据的频率分布直方图、折线图,会根据图表初步分析数据的分布规律,会计算平均数与标准差,这为本节课的探究学习打下了坚实的基础。
但学生仍存在一些知识短板和理解缺口。
其一,本节课学习的正态分布的随机变量是连续型随机变量的分布问题,学生一直以来接触的都是离散型随机变量,这在概念接受与理解上会有一定困难,可以通过信息技术辅助理解;其二,由于学生在此之前还未学习过定积分、随机事件的概率以及二项分布,只在初中接触过简单的概率定义,因而对本节课正态分布的本质理解会显得生涩;其三,正态分布的密度曲线函数较为复杂,学生对抽象且陌生的公式会存在惧怕心理,需要通过一些函数模型及实际应用帮助学生体会其参数的作用。
学案用样本估计总体与变量间的相关关系
【解析】 (1)样本频率分布表如下:
分组 [100.200) [200.300) [300,400) [400,500) [500,600)
合计
频数 20 30 80 40 30 20
频率 0.01 0.15 0.40 0.20 0.15 1.00
(2)频率分布直方图如图
(3)由频率分布表能够看出,寿命在[100,400)内旳电子 元件出现旳频率为0.65,所以我们估计电子元件寿命在 [100,400)内旳概率为0.65.
(4)由频率分布表可知,寿命在400 h以上旳电子元件出现 旳频率为0.20+0.15=0.35,故我们估计电子元件寿命在 400 h以上旳概率为0.35.
考点2 频率分布直方图旳应用
为了解学生身高情况,某校以10%旳百分比对全校700 名学生按性别进行分层抽样调查,测得身高情况旳统计 图如图:
(1)估计该校男生旳人数; (2)估计该校学生身高在170~185 cm之间旳概率; (3)从样本中身高在180~190 cm之间旳男生中任选2人, 求至少有1人身高在185~190 cm之间旳概率.
1
月旳天135数;旳处于15优;或良有旳26天天数处为于2良8旳,占水当平月,占天当数月旳天14数5 .阐明 该市空气质量基本良好. ②轻微污染有2天,占当月天数旳 1 ;污染指数在80以上
15
旳接近轻微污染旳天数15,加上处于轻微污染旳天数17, 占当月天数旳 17 ,超出50%;阐明该市空气质量有待进
1n n i=1
xi
1n
,y= n i=1 yi
.
经过求Q= (y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2 旳最小值而得出回归直线旳措施,即求回归直线,使得样 本 数 据旳点到它旳距离旳平方和最小,这一措施叫做最小 二乘法.
人教新课标A版高中数学必修3第二章统计2.2用样本估计总体2.2.2用样本的数字特征估计总体同步测试
人教新课标A版高中数学必修3 第二章统计 2.2用样本估计总体 2.2.2用样本的数字特征估计总体同步测试B卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)3. (2分)若样本+2,+2,,+2的平均数为10,方差为3,则样本2+3,2+3,… ,2+3,的平均数、方差、标准差是()A . 19,12,B . 23,12,C . 23,18,D . 19,18,4. (2分)数据a1,a2,a3,...an的方差为,则数据2a1,2a2,2a3,...2an的方差为()A .B .C .D .6. (2分) (2019高三上·广州月考) 某同学用“随机模拟方法”计算曲线与直线所围成的曲边三角形的面积时,用计算机分别产生了10个在区间[1,e]上的均匀随机数xi和10个在区间[0,1]上的均匀随机数,其数据如下表的前两行.x 2.50 1.01 1.90 1.22 2.52 2.17 1.89 1.96 1.36 2.22y0.840.250.980.150.010.600.590.880.840.10lnx0.900.010.640.200.920.770.640.670.310.80由此可得这个曲边三角形面积的一个近似值为()A .B .C .D .7. (2分)某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A . 这种抽样方法是一种分层抽样B . 这种抽样方法是一种系统抽样C . 这五名男生成绩的方差大于这五名女生成绩的方差D . 该班男生成绩的平均数小于该班女生成绩的平均数10. (2分)用样本的频率分布来估计总体情况时,下列选项中正确的是()A . 估计准确与否值与所分组数有关B . 样本容量越大,估计结果越准确C . 估计准确与否值域总体容量有关D . 估计准确与否与样本容量无关11. (2分)如果两组数x1 , x2 ,…,xn和y1 , y2 ,…,yn的平均数分别为和,标准差分别为s1和s2 ,那么合为一组数x1 , x2 ,…,xn , y1 , y2 ,…,yn后的平均数和标准差分别是()A . + ,B . + ,C . ,D . ,12. (2分)(2017·青岛模拟) 一个公司有8名员工,其中6名员工的月工资分别为5200,5300,5500,6100,6500,6600,另两名员工数据不清楚,那么8位员工月工资的中位数不可能是()A . 5800B . 6000C . 6200D . 640015. (2分)数学测验中,某小组14名学生分别与全班的平均分85分的差是:2,3,-3,-5,12,12,8,2,-1,4,-10,-2,5,5,这个小组的平均分是()A . 97.2B . 87.29C . 92.32D . 82.86二、填空题 (共5题;共6分)16. (1分)已知样本2,3,x,6,8的平均数是5,则此样本的方差为________.17. (1分)已知一组数据x1 , x2 , x3 , x4 , x5的平均数是2,方差是,那么另一组数据3x1﹣2,3x2﹣2,3x3﹣2,3x4﹣2,3x5﹣2的平均数和方差分别是________.19. (1分) (2016高一下·湖南期中) 为了了解学生遵守《中华人民共和国交通安全法》的情况,调查部门在某学校进行了如下的随机调查:向被调查者提出两个问题:(1)你的学号是奇数吗?(2)在过路口的时候你是否闯过红灯?要求被调查者背对调查人抛掷一枚硬币,如果出现正面,就回答第(1)个问题;否则就回答第(2)个问题.被调查者不必告诉调查人员自己回答的是哪一个问题,只需要回答“是”或“不是”,因为只有被调查本人知道回答了哪个问题,所以都如实做了回答.如果被调查的600人(学号从1到600)中有180人回答了“是”,由此可以估计在这600人中闯过红灯的人数是________.20. (2分) (2020·随县模拟) 2020年年初,新冠肺炎疫情袭击全国.口罩成为重要的抗疫物资,为了确保口罩供应,某工厂口罩生产线高速运转,工人加班加点生产.设该工厂连续5天生产的口罩数依次为,,,,(单位:十万只),若这组数据,,,,的方差为1.44,且,,,,的平均数为4,则该工厂这5天平均每天生产口罩________十万只.三、解答题 (共5题;共25分)25. (5分) (2017高二下·瓦房店期末) 为了研究家用轿车在高速公路上的车速情况,交通部门对100名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况为:在55名男性驾驶员中,平均车速超过100km/h的有40人,不超过100km/h的有15人.在45名女性驾驶员中,平均车速超过100km/h的有20人,不超过100km/h的有25人.(1)完成下面的列联表,并判断是否有99.5%的把握认为平均车速超过100km/h的人与性别有关.平均车速超过100km/h人数平均车速不超过100km/h人数合计男性驾驶员人数女性驾驶员人数合计(2)以上述数据样本来估计总体,现从高速公路上行驶的大量家用轿车中随机抽取3辆,记这3辆车中驾驶员为男性且车速超过100km/h的车辆数为,若每次抽取的结果是相互独立的,求的分布列和数学期望.参考公式与数据:,其中0.1500.1000.0500.0250.0100.0050.0012.072 2.7063.841 5.024 6.6357.87910.828参考答案一、单选题 (共15题;共30分)3-1、4-1、6-1、7-1、10-1、11-1、12-1、15-1、二、填空题 (共5题;共6分)16-1、17-1、19-1、20-1、三、解答题 (共5题;共25分)25-1、25-2、。
高中数学必修3(人教A版)第二章统计2.1知识点总结含同步练习及答案
⑤确定样本:从总体中找出与号签上的号码对应的个体,组成样本.
随机数表法是随机数表由数字 0 ,1 ,2,3,⋯,9 这 10 个数字组成,并且每个数字在表中 各个位置上出现的机会都是一样的,通过随机数表,根据实际需要和方便使用的原则,将几个数
组成一组,然后通过随机数表抽取样本.随机数表的优点是简单易行,它很好的解决了当总体中
样.因为 50 名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单 随机抽样中“等可能抽样”的要求.(3)是简单随机抽样.因为总体中的个体数是有限的,并且
是从总体中逐个进行抽取的,是不放回、等可能的抽取.
2013年第27届世界大学生运动会在俄罗斯举行,为了支持这次运动会,某大学从报名的 20 名大 三学生中选取 6 人组成志愿小组,请用抽签法设计抽样方案. 解:(1)将 20 名志愿者编号,编号为 1,2,3,4,⋯,20; (2)将 20 个号码分别写在 20 张形状相同的卡片上,制成号签; (3)将 20 张卡片放入一个不透明的盒子里,搅拌均匀; (4)从盒子中逐个不放回地抽取 6 个号签,并记录上面的号码;
A.2
B.3
C.6
D.7
解:C
间隔相等,所以 126 − 8 × 15 = 6.
4.分层抽样
描述: 将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在 总体中所占比例进行简单随机抽样或系统抽样,这种抽样的方法叫做分层抽样.当总体由明显差 别的几部分组成时,为了使抽取样本更好地反映总体的情况,常采用分层抽样.
③简单随机抽样是一种不放回抽样.
④简单随机抽样是一种等可能的抽样,每个个体被抽取到的可能性均为
n N
.
常用的简单随机抽样方法有抽签法和随机数表法.
高中数学 第二章 统计 2.1.3 分层抽样导学案(无答案)新人教A版必修3 学案
§分层抽样【自主学习】先学习课本P60-P62然后开始做导学案,记住知识梳理部分的内容; 一、学习目标:1.理解分层抽样的概念;2. 会用分层抽样从总体中抽取样本. 二、知识梳理:1.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层。
2.分层抽样的步骤可概括为:(1)分层:将总体按某种特征分成若干部分;(2)确定比例:计算各层的个体数与总体的个体数的比; (3按抽样比确定每层抽取个体的个数(抽样比=样本容量总体容量);(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本.:在抽样中,如果每次抽出个体后 不放回 总体,称这样的抽样为不放回抽样;如果每次抽出个体后 放回 总体,称这样的抽样为放回抽样.(注意)随机抽样、系统抽样、分层抽样都是不放回抽样 三、自我检测:1.简单随机抽样、系统抽样、分层抽样之间的共同点是( )B.将总体分成几部分,按事先规定的要求在各部分抽取D.将总体分成几层,分层进行抽取2.(1)教育局督学组到学校检查工作,需在学号为0001~1000的高三年级的学生中抽20人参加学校管理的综合座谈会;(2)该校高三年级有1000名学生参加2014年新年晚会,要产生20名“幸运之星”; (3)该校高三年级1000名学生一模考试的数学成绩有240人在120分以上(包括120分),600人在120分以下,90分以上(包括90分),其余在90分以下,现欲从中抽取20人研讨进一步改进数学教与学的座谈会.用如下三种抽样方法选取样本:①简单随机抽样;②系统抽样;③分层抽样.则以上三件事,最合理的抽样方法序号依次为__________3.甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生()A.30人,30人,30人 B.30人,45人,15人C.20人,30人,10人 D.30人,50人,10人4.一批产品中,有一级品100个,二级品60个,三级品40个,请用抽样的方法中的,从这批产品中抽取一个容量为20的样本,各抽取多少?答案:1.C 2.②①③ 4.分层抽样,从一级品抽取10个,二级品6个,三级品4个.必修三:§分层抽样【课堂检测】1.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A.简单随机抽样法B.抽签法C.随机数法D.分层抽样法2.有一批产品,其中一等品10件,二等品25件,次品5件.用分层抽样从这批产品中抽出8件进行质量分析,则抽取二等品的件数应该为__________.3.某校有教师200人,男学生1200人,女学生1000人,现用分层抽样的方法从所有师生中抽取一个容量为n的样本,已知从女学生中抽取人数为80,则n=4.某学院的A,B,C三个专业共有1 200名学生.为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取________名学生.【拓展探究】探究一:一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁以上的有95人,为了了解与身体状况有关的某项指标,要从所有职工中抽取100名职工作为样本,若职工年龄与这项指标有关,应该怎样抽取?探究二:某校共有学生2 000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则求应在三年级抽取的学生的人数是多少【当堂训练】1.某校师生共2400人,现用分层抽样方法从所有师生中抽取一个容量为160的样本,已知从教师中抽取的人数为10,则该校教师人数是( )2.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件。
高中数学人教版A版必修三课时作业习题及答案:第二章2-2 用样本估计总体
第二章统计2.2 用样本估计总体2.2.1用样本的频率分布估计总体分布课时目标 1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图,频率分布折线图,茎叶图.3.能够利用图形解决实际问题.1,用样本估计总体的两种情况(1)用样本的____________估计总体的分布.(2)用样本的____________估计总体的数字特征.2,数据分析的基本方法(1)借助于图形分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中____________,二是利用图形________信息.(2)借助于表格分析数据的另一方法是用紧凑的________改变数据的排列方式,此法是通过改变数据的____________,为我们提供解释数据的新方式.3,频率分布直方图在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用________________来表示,各小长方形的面积的总和等于____.4,频率分布折线图和总体密度曲线(1)频率分布折线图连接频率分布直方图中各小长方形__________,就得到了频率分布折线图.(2)总体密度曲线随着样本容量的增加,作图时所分的____增加,组距减小,相应的频率分布折线图就会越来越接近于一条________,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.5,茎叶图(1)适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.(2)优点:它不但可以____________,而且可以__________,给数据的记录和表示都带来方便.(3)缺点:当样本数据______时,枝叶就会很长,茎叶图就显得不太方便.一、选择题1,下列说法不正确的是()A,频率分布直方图中每个小矩形的高就是该组的频率B,频率分布直方图中各个小矩形的面积之和等于1C,频率分布直方图中各个小矩形的宽一样大D,频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的2,一个容量为100的样本,其数据的分组与各组的频数如下:组别(0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] 频数12 13 24 15 16 13 7 则样本数据落在(10,40]上的频率为()A,0.13 B.0.39 C.0.52 D.0.643,100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有()A.30辆B.40辆C,60辆D.80辆4,如图是总体密度曲线,下列说法正确的是()A,组距越大,频率分布折线图越接近于它B,样本容量越小,频率分布折线图越接近于它C,阴影部分的面积代表总体在(a,b)内取值的百分比D,阴影部分的平均高度代表总体在(a,b)内取值的百分比5,一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()A,20% B.69%C,31% D.27%6,某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A,90 B.75 C.60 D.45题号 1 2 3 4 5 6答案二、填空题7,将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 8,在如图所示的茎叶图中,甲,乙两组数据的中位数分别是________.9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题10,抽查100袋洗衣粉,测得它们的重量如下(单位:g):494498493505496492485483508 511495494483485511493505488 501491493509509512484509510 495497498504498483510503497 502511497500493509510493491 497515503515518510514509499 493499509492505489494501509 498502500508491509509499495 493509496509505499486491492 496499508485498496495496505 499505496501510496487511501496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升11,在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?12,某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.答案: 2.2.1 用样本的频率分布估计总体分布 知识梳理1,(1)频率分布 (2)数字特征 2.(1)提取信息 传递 (2)表格 构成形式 3.频率/组距 小长方形的面积 1 4.(1)上端的中点 (2)组数 光滑曲线5,(2)保留所有信息 随时记录 (3)较多作业设计1,A 2,C [样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52100=0.52.] 3,B [时速在[60,70)的汽车的频率为:0,04×(70-60)=0.4,又因汽车的总辆数为100, 所以时速在[60,70)的汽车大约有0.4×100=40(辆).]4,C5,C [由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为1135≈0.31.]6,A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36, ∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.] 7,60解析 ∵n·2+3+42+3+4+6+4+1=27, ∴n =60.8,45,46解析 由茎叶图及中位数的概念可知x 甲中=45,x 乙中=46. 9.m h解析频率组距=h ,故|a -b|=组距=频率h =m h . 10,解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),…,[514.5,518.5). 列出频率分布表:分组 个数累计 频数 频率 累积频率 [482.5,486.5) 正 8 0.08 0.08 [486.5,490.5) 3 0.03 0.11[490.5,494.5) 正正正 17 0.17 0.28 [494.5,498.5) 正正正正- 21 0.21 0.49 [498.5,502.5) 正正 14 0.14 0.63 [502.5,506.5) 正 9 0.09 0.72[506.5,510.5) 正正正 19 0.19 0.91 [510.5,514.5) 正- 6 0.06 0.97[514.5,518.5] 3 0.03 1.00合计 100 1.00(2)频率分布直方图与频率分布折线图如图.(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44.设重量不足500 g 的频率为b ,根据频率分布表,b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55. 11,解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.12,解 (1)(2)(3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.2.2.2用样本的数字特征估计总体的数字特征课时目标 1.会求样本的众数,中位数,平均数,标准差,方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.1,众数,中位数,平均数(1)众数的定义:一组数据中重复出现次数________的数称为这组数的众数.(2)中位数的定义及求法把一组数据按从小到大的顺序排列,把处于最______位置的那个数称为这组数据的中位数.①当数据个数为奇数时,中位数是按从小到大顺序排列的__________那个数.②当数据个数为偶数时,中位数为排列的最中间的两个数的________.(3)平均数①平均数的定义:如果有n个数x1,x2,…,x n,那么x=____________,叫做这n个数的平均数.②平均数的分类:总体平均数:________所有个体的平均数叫总体平均数.样本平均数:________所有个体的平均数叫样本平均数.2,标准差,方差(1)标准差的求法:标准差是样本数据到平均数的一种平均距离,一般用s表示.s=________________________________________________________________________.(2)方差的求法:标准差的平方s2叫做方差.s2=________________________________________________________________________.一、选择题1,下列说法正确的是()A,在两组数据中,平均值较大的一组方差较大B,平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C,方差的求法是求出各个数据与平均值的差的平方后再求和D,在记录两个人射击环数的两组数据中,方差大的表示射击水平高2,已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有()A,a>b>c B.a>c>bC,c>a>b D.c>b>a3,甲,乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲,乙两同学在这次篮球比赛活动中,发挥得更稳定的是()A,甲B.乙C,甲,乙相同D.不能确定4,一组数据的方差为s2,将这组数据中的每个数据都扩大3倍,所得到的一组数据的方差是()A.13s2B.s2C,3s2D.9s25,如图是2010年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为()A,84,4.84 B.84,1.6C,85,1.6 D.85,0.46,如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B则()A.x A>x B,s A>s BB.x A<x B,s A>s BC.x A>x B,s A<s BD.x A<x B,s A<s B题号 1 2 3 4 5 6答案二、填空题7,已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.8,甲,乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲10 8 9 9 9乙10 10 7 9 9如果甲,乙两人只能有1人入选,则入选的应为________.9,若a1,a2,…,a20,这20个数据的平均数为x,方差为0.20,则数据a1,a2,…,a20,x这21个数据的方差为________.三、解答题10,甲,乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:(1)请填写表:平均数方差中位数命中9环及9环以上的次数甲乙(2)请从下列四个不同的角度对这次测试结果进行分析:①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和中位数相结合看(分析谁的成绩好些);③从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);④从折线图上两人射击命中环数的走势看(分析谁更有潜力).能力提升11,下面是一家快餐店所有工作人员(共7人)一周的工资表:总经理大厨二厨采购员杂工服务员会计3 000元450元350元400元320元320元410元(1)计算所有人员一周的平均工资;(2)计算出的平均工资能反映一般工作人员一周的收入水平吗?(3)去掉总经理的工资后,再计算剩余人员的平均工资,这能代表一般工作人员一周的收入水平吗?12,1,平均数、众数、中位数都是描述数据的集中趋势的,其中平均数是最重要的量.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使得无法客观地反映总体特征;中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也成为缺点,因为这些极端值有时是不能忽视的.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.2,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.3,极差、方差、标准差是描述数据的离散程度的,即各数据与其平均数的离散程度.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.答案:2,2.2用样本的数字特征估计总体的数字特征知识梳理1,(1)最多 (2)中间 ①中间位置的 ②平均数 (3)①x 1+x 2+…+x n n ②总体中 样本中2,(1)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] (2)1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2] 作业设计1,B [A 中平均值和方差是数据的两个特征,不存在这种关系;C 中求和后还需取平均数;D 中方差越大,射击越不平稳,水平越低.]2,D [由题意a =110(16+18+15+11+16+18+18+17+15+13)=15710=15.7,中位数为16,众数为18,即b =16,c =18,∴c>b>a.]3,B [方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.∵5.09>3.72,故选B .]4,D [s 20=1n [9x 21+9x 22+…+9x 2n -n(3x )2]=9·1n(x 21+x 22+…+x 2n -n x 2)=9·s 2(s 20为新数据的方差).]5,C [由题意x =15(84+84+86+84+87)=85.s 2=15[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=15(1+1+1+1+4)=85=1.6.]6,B [样本A 数据均小于或等于10,样本B 数据均大于或等于10,故x A <x B , 又样本B 波动范围较小,故s A >s B .] 7,91解析 由题意得8,甲解析 x 甲=9,2S 甲=0.4,x 乙=9,2S 乙=1.2,故甲的成绩较稳定,选甲.9,0.19 解析 这21个数的平均数仍为20,从而方差为121×[20×0.2+(20-20)2]≈0.19. 10,解 由折线图,知甲射击10次中靶环数分别为:9,5,7,8,7,6,8,6,7,7.将它们由小到大重排为:5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数分别为: 2,4,6,8,7,7,8,9,9,10.也将它们由小到大重排为:2,4,6,7,7,8,8,9,9,10.(1)x 甲=110×(5+6×2+7×4+8×2+9)=7010=7(环), x 乙=110×(2+4+6+7×2+8×2+9×2+10)=7010=7(环),s 2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,s 2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2] =110×(25+9+1+0+2+8+9)=5.4. 根据以上的分析与计算填表如下:平均数 方差 中位数 命中9环及9环以上的次数甲 7 1.2 7 1乙 7 5.4 7.5 3 (2)①∵平均数相同,2S 甲<2S 乙,∴甲成绩比乙稳定. ②∵平均数相同,甲的中位数<乙的中位数,∴乙的成绩比甲好些.③∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.④甲成绩在平均数上下波动;而乙处于上升势头,从第四次以后就没有比甲少的情况发生,乙较有潜力.11,解 (1)平均工资即为该组数据的平均数 x =17×(3 000+450+350+400+320+320+410)=17×5 250=750(元).(2)由于总经理的工资明显偏高,所以该值为极端值,因此由(1)所得的平均工资不能反映一般工作人员一周的收入水平.(3)除去总经理的工资后,其他工作人员的平均工资为:x ′=16×(450+350+400+320+320+410)=16×2 250=375(元).这个平均工资能代表一般工作人员一周的收入水平.12,解 设第一组20名学生的成绩为x i (i =1,2,…,20),第二组20名学生的成绩为y i (i =1,2,…,20), 依题意有:x =120(x 1+x 2+…+x 20)=90,y =120(y 1+y 2+…+y 20)=80,故全班平均成绩为:140(x 1+x 2+…+x 20+y 1+y 2+…+y 20)=140(90×20+80×20)=85;又设第一组学生成绩的标准差为s 1,第二组学生成绩的标准差为s 2,则s 21=120(x 21+x 22+…+x 220-20x 2),s 22=120(y 21+y 22+…+y 220-20y 2) (此处,x =90,y =80),又设全班40名学生的标准差为s ,平均成绩为z (z =85),故有s 2=140(x 21+x 22+…+x 220+y 21+y 22+…+y 220-40z 2) =140(20s 21+20x 2+20s 22+20y 2-40z 2) =12(62+42+902+802-2×852)=51. s =51.所以全班同学的平均成绩为85分,标准差为51.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)用茎叶图表示数据有两个优点:一是在统计图上没有原始
的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随
时
,随时
,方便记录与表示.
(2)茎叶图只便于表示
位有效数字的数据,而且茎叶图只方便记录 组
的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.
知识点四:众数、中位数与平均数
(一)众数
一组数据中出现次数最
的数据叫做众数.如果变量是分类的,用众数是很
有必要的.例如班委会要作出一项决定,考察全班同学对它赞成与否就可以用众数. (二)中位数
将一组数据从
到
依次排列,把中间数据(或中间两数据的
数)叫做中位数.中位数把样本数据分成了相同 (二)平均数
的两部分.
样本数据的算术平均数,即 x =
知识点二:频率分布折线图、总体密度曲线
(1)频率分布折线图的定义:
连接频率分布直方图中各小长方形上端的 (2)总体密度曲线的定义:
,就得到频率分布折线图.
在样本频率分布直方图中,样本容量
,所分组数
,相应的频率
折线图会越来越
于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
要点诠释: 总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提
知识点一:频率分布的概念
频率分布是指一个样本数据在各个小范围内所占
的大小.一般用频率分
布直方图反映样本的频率分布.其一般步骤为:
(1)计算一组数据中最 值与最 值的差,即求
(2)决定
与
(3)将数据分组
(4)列
分布表
(5)画频率分布直方图 要点诠释:
频率分布直方图的特征: (1)从频率分布直方图可以清楚的看出数据分布的总体趋势. (2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的 具体数据信息就被抹掉了.
2 / 11
知识像烛光,能照亮一个人,也能照亮无数的人。--培根
供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律.
知识点三:茎叶图
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边 的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物 茎上长出来的叶子,因此通常把这样的图叫做茎叶图. 要点诠释:
类型一:频率分布表、频率分布直方图
例 1.有同一型号的汽车 100 辆,为了解这种汽车每耗油 1L 所行路程的情况,现从中
知识像烛光,能照亮一个人,也能照亮无数的人。--培根
用样本估计总体
一、目标与策略
明确学习目标及主要的学习方法是提高学习效率的首要条件,要做到心中有数!
学习目标:
⚫ 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图. ⚫ 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确
是
的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本.
(二)系统抽样的概念:
当总体中的个体比较多时,将总体分成
的若干部分,然后按照预先制定的规则,从每一部分中抽取一
1 / 11
知识像烛光,能照亮一个人,也能照亮无数的人。--培根
个
,得到所需要的样本,这样的抽样方法称为系统抽样,也称作
(三)分层抽样的概念:
抽样.
当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成
若干个
的几部分,每一部分叫做
,在各层中按层在总体中所占
进行简单随机抽样或系统抽样,
这种抽样方法叫做分层抽样.
知识要点——预习和课堂学习
认真阅读、理解教材,尝试把下列知识要点内容补充完整,带着自己预习的疑惑认真听 课学习。若有其它补充可填在右栏空白处。
.
要点诠释: 由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数
又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准 确性.
知识点五:标准差与方差
(一)标准差
样本数据 x1, x2, , xn 的标准差的算法:
(1)算出样本数据的
.
(2)算出每个样本数据与样本数据
s2= 要点诠释:
在刻画样本数据的
程度上,方差和标准差是一样的,但在解决实际问题
时,一般多采用标准差.
数据的离散值程度可以用极差、方差或标准差来描述.极差反映了一组数据变化
的
;样本方差描述了一组数据围绕
波动的
;样本方
差的算术根表示样本的标准差,它也描述了数据对平均数的
程度.
经典例题-自主学习
认真分析、解答下列例题,尝试总结提升各类型题目的规律和技巧,然后完成举一反 三。若有其它补充可填在右栏空白处。
二、学习与应用
“凡事预则立,不预则废”。科学地预习才能使我们上课听讲更有目的性和针对
性。我们要在预习的基础上,认真听讲,做到眼睛看、耳朵听、心里想、手上记。 知识回顾——复习
学习新知识之前,看看你的知识贮备过关了吗?
(一)简单随机抽样的概念:
一般地,从元素个数为 N 的总体中
地抽取容量为 n 的样本,如果每一次抽取时总体中的各个个= 1, 2, ,n)
(3)算出(2)中 xi − x (i = 1, 2, ,n) 的
.
3 / 11
知识像烛光,能照亮一个人,也能照亮无数的人。--培根
(4)算出(3)中 n 个平方数的
,即为
.
(5)算出(4)中平均数的
,即为
.
其计算公式为:
s= (二)方差
从数学的角度考虑,人们有时用标准差的平方 s2 (即方差)来代替标准差,作为 测量样本数据分散程度的工具:
地做出总体估计. ⚫ 正确理解样本数据标准差的意义和作用,学会计算数据的标准差. ⚫ 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的
解释. ⚫ 会用样本的基本数字特征估计总体的基本数字特征.
重点难点:
⚫ 重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.用样本平均数和标准差估计总体的平均数与标 准差.
⚫ 难点:能通过样本的频率分布估计总体的分布.能应用相关知识解决简单的实际问题.
学习策略:
⚫ 本课题主要包括两大内容:用样本频率分布估计总体分布、用样本数字特征估计总体数字特征.通过对实际数据的 分析,评估现实中的实际问题是数学学科的灵魂,而频率分布直方图、总体密度曲线、茎叶图正是有着这方面的作 用,所以在学习过程中要注意理论和实际的结合。