数学知识点人教A版高中数学必修三2.2.2《用样本的数字特征估计总体的数字特征》(2)教案-总结

合集下载

人教A版高中数学必修3第二章2.2.2 用样本的数字特征估计总体的数字特征

人教A版高中数学必修3第二章2.2.2 用样本的数字特征估计总体的数字特征

2.2.2 用样本的数字特征估计总体的数字特征第1课时众数、中位数、平均数学情分析:本节课的学习者是高一学生,他们在初中已经学习过统计的初步知识,他们的观察、猜想能力较强。

但演绎推理、归纳、运用数学意识的思想比较薄弱,思维的广阔性、紧密性、灵活性比较欠缺,自主探究和合作学习能力需要在课堂教学中进一步加强和引导。

一、三维目标:1、知识与技能(1)能利用频率分布直方图估计总体的众数、中位数、平均数;(2)能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;。

(3)形成对数据处理过程进行初步评价的意识。

2、过程与方法初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.3、情感态度与价值观在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.二、重点与难点重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.难点:能应用相关知识解决简单的实际问题。

三、教学过程导入新课在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征. (板书课题)新知探究提出问题(1)什么是众数、中位数、平均数?(1)如何绘制频率分布直方图?(3)如何从频率分布直方图中估计众数、中位数、平均数?活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导.讨论结果:(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.(2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图.(3)教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25 t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.请大家翻回到课本看看原来抽样的数据,有没有 2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)课本显示,大部分居民的月均用水量在中部(2.02 t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)对极端值不敏感有利的例子:考察课本中表21中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据.对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况.同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02 t.显示了居民月均用水量的平均数,它是频率分布直方图的“重心”.由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相差太多了.利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等.估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.应用示例例1 下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间.分析:要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个范围,可以用各组区间的组中值近似地表示.解法一:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h),故平均睡眠时间约为7.39 h.解法二:求组中值与对应频率之积的和6.25×0.05+6.75×0.17+7.25×0.33+7.75×0.37+8.25×0.06+8.75×0.02=7.39(h). 答:估计该校学生的日平均睡眠时间约为7.39 h.例2 某单位年收入在10 000到15 000、15 000到20 000、20 000到25 000、25 000到30 000、30 000到35 000、35 000到40 000及40 000到50 000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.分析:上述百分比就是各组的频率.解:估计该单位职工的平均年收入为12 500×10%+17500×15%+22 500×20%+27 500×25%+32 500×15%+37 500×10%+45 000×5%=26 125(元).答:估计该单位人均年收入约为26 125元.知能训练从甲、乙两个公司各随机抽取50名员工月工资:甲公司:800 800 800 800 800 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 0001 2001 2001 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 5001 500 1 500 1 500 1 500 1 500 1 5002 000 2 000 2 0002 000 2 000 2 500 2 500 2 500乙公司:700 700 700 700 700 700 700 700 700700 700 700 700 700 700 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 6 000 8 000 10 000试计算这两个公司50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资. 答案:甲公司:员工月工资平均数1 240,众数1 200,中位数1 200;乙公司:员工月工资平均数1 330,众数1 000,中位数1 000;从总体上看乙公司员工月工资比甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数.拓展提升“用数据说话”, 这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确理解在日常生活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义.在这里应该注意以下几点:1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置.2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度.3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策.5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用.课堂小结1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本数字特征估计总体的基本数字特征;2.平均数对数据有“取齐”的作用,代表一组数据的平均水平;3.形成对数据处理过程进行初步评价的意识.作业习题2.2A组3.设计感想本堂课在初中学习的众数、中位数、平均数的基础上,学习了利用频率分布直方图估计众数、中位数、平均数,这是一种近似估计,但都能说明总体的分布特征,各有优缺点,讲解时紧扣课本内容,讲清讲透,使学生活学活用,会画频率分布直方图,会利用频率分布直方图估计众数、中位数、平均数,对总体作出正确的估计.。

高中数学人教A版必修三第二章2.2.2用样本的数字特征估计总体的数字特征课件

高中数学人教A版必修三第二章2.2.2用样本的数字特征估计总体的数字特征课件
(1)1 ,2,3,3,3,5,5,8,8,8,9,9 众数是:3和8 (2)1 ,2,3,3,3,5,5,8,8,9,9 众数是:3
2、求下列各组数据的中位数
(1)1 ,2,3,3,3,4,6,8,8,8,9,9 中位数是:5 (2)1 ,2,3,3,3,4,8,8,8,9,9 中位数是:4
2.已知样本数据 x1,x2,…,xn 的均值 x =5,则样本数据
学徒 100 1 100
合计
23 6900
如何在频率散布直方图中估计平均数
频率/组距
0.08
0.16 0.30 0.50
0.44 0.40 0.50 0.28 0.30
0.12 0.20 0.08 0.04 0.10
频率/组距 0.5 1 1.5 2 2.5
平均数的估计值等于频率 散布直方图中每个小矩形的面 积乘以小矩形底边中点的横坐 标之和.
1.求出a、p、n; 2.补全频率散布直方图;
2.2.2用样本的数字特征估计 总体的数字特征
众数、中位数、平均数
用样本的数字特征估计总体的数字特征
1.众数、中位数、平均数的概念 (1)众数:一组数据中_出__现__次__数__最__多__的数.
按顺序排好
(2)中位数:一组数据按大小顺序排列后,处于_中__间__位置 的数.如果个数是偶数,则取_中__间__两个数据的平均数.
0.08 0.04
0.5 1 1.5 2 2.5
0.06 0.04
月均用水量/t
0.02
3 3.5 4 4.5
2.02
[典例] 某中学举行电脑知识竞赛,现将高一参赛学生的成 绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知 图中从左到右的第一、二、三、四、五小组的频率分别是 0.30,0.40,0.15,0.10,0.05.

高中数学 2.2.2用样本的数字特征估计总体的数字特征课件 新人教A版必修3

高中数学 2.2.2用样本的数字特征估计总体的数字特征课件 新人教A版必修3

频率 (乙)
0.4 0.3 0.2 0.1
O 4 5 6 7 8 9 10 环数
甲的成绩比较分散,极差较大,乙的 成绩相对集中,比较稳定.
1、标准差
思考: 反映样本数据的分散程度的大小,
最常用的统计量是标准差, 一般用s表示. 假设 样本数据x1, x2, …, xn的平均数为, 则标准差的 计算公式是:
(1)平均来说甲队比乙队防守技术好; (2)乙队比甲队技术水平更稳定; (3)甲队有时表现很差,有时表现又非常 好; (4)乙队很少不失球。
关于统计的有关性质及规律
(1)若x1, x2,...,xn的平均数为x,那么mx1 a, mx2 a,...,mxn a的平均数是_____;
(2)数据x1, x2,...,xn与数据x1 a, x2 a,..., xn a的方差_____;
有两位射击运动员在一次设计测试中 各射靶10次,每次命中的环数如下:
甲 7 8 7 9 5 4 9 10 7 4 乙9578768 6 77
如果你是教练,你应当如何对这次射 击情况作出评价?如果这是一次选拔性考 核,你应当如何作出选择?
思考:甲、乙两人射击的平均成绩相等, 观察两人成绩的频率分布条形图,你能说明 其水平差异在那里吗?
(3)若x1, x2,...,xn的方差为s2, 那么ax1,ax2, ...,axn的方差为_____.
s≥0,标准差为0的样本数据都相等.
【例1】画出下列四组样本数据的条形图, 说明它们的异同点.
(1)5,5,5,5,5,5,5,5,5 (2)4,4,4,5,5,5,6,6,6 (3)3,3,4,4,5,6,6,7,7 (4)2,2,2,2,5,8,8,8,8
2. 标准差的一个应用

人教A版高中数学必修三2.2.2用样本的数字特征估计总体的数字特征课件

人教A版高中数学必修三2.2.2用样本的数字特征估计总体的数字特征课件

1.标准差
s
1 n
[(x1
x)2
(
x2
x)2
(xn x)2 ]
标准差较大,数据的离散程度较大;标 准差较小,数据的离散程度较小。
2.方差
从数学的角度考虑,人们有时用标准差的平方 (即方差)来代替标准差,作为测量样本数据 分散程度的工具:
s2
1 n
[(
x1
x)2
( x2
x)2
(xn x)2 ]
2.平均数对数据有“取齐”的作用,代表一组数 据的平均水平.
小试牛刀
甲乙两机床同时加工直径为100厘米的零件, 为检验质量从中抽取6件,测量的数据为: 甲: 99,100,98,100,100,103 乙:99,100,102,99,100,100
分别计算两组数据的平均数。
2.2.2 用样本的数字特征 估计总体的数字特征
众数:最高矩形的中点的横坐标 中位数:中位数左边和右边的直方图的
面积相等,由此估计中位数的值 平均数:等于频率分布直方图中每个小
矩形的面积乘以小矩形底边中点的横坐 标之和
例1为了了解某班学生每周做家务劳动的
时间,某综合实践小组对该班50名学生 进行了调查,有关数据如下:
每周做家 0 务的时间
第2课时
创设情境
在一次射击选拔比赛中,甲、乙两名运动员各 射击10次,命中环数如下﹕
甲运动员﹕7,8,6,8,6,5,8,10,7,4; 乙运动员﹕9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥的
更稳定些吗?如果你是教练,选哪位选手去参 加正式比赛?
探究新知
从生产的零件内径的尺寸看,谁生产的质量较 高?
课堂小结

人教A版高中数学必修3课件2.2.2用样本的数字特征估计总体的数字特征课件

人教A版高中数学必修3课件2.2.2用样本的数字特征估计总体的数字特征课件

例题探究
例1 样本(x1,x2,…,xn)的平均数为 x ,样本(y1,y2,…,ym)的平均数为 y ( x ≠ y ), 1 若样本(x1,x2,…,xn,y1,y2,…,ym)的平均数 z =α x +(1-α ) y ,其中 0<α < , 2 则 n,m 的大小关系为 (
A
)
A、n<m B、n>m C、n=m D、不能确定 解析 利用两个样本平均数表示总体平均数,从而确定系数 α
思考4
从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数
是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?
答:因为样本数据频率分布直方图只是直观
地表明分布的形状,从直方图本身得不出原始的 数据内容,也就是说频率分布直方图损失了一些 样本数据,得到的是一个估计值,且所得估计值 与数据分组有关,所以估计的值有一定的偏差。
中位数是 1 500 元,众数是 1 500 元。
Байду номын сангаас
(3)在这个问题中,中位数和众数都能反映出这个公司员工的工资水平,因为公司少数 人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以 平均数不能反映这个公司员工的工资水平。
反思与感悟:样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中 众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量 信息。平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对 平均数的影响也越大。
思考3 如何在样本数据的频率分布直方图中估计出平均数的值? 答:平均数是频率分布直方图的“重心”,是直方图的平衡点,因此,每个小矩形 的面积与小矩形底边中点的横坐标的乘积之和为平均数。

人教版高中数学必修三2.2.2用样本的数字特征估计总体的数字特征

人教版高中数学必修三2.2.2用样本的数字特征估计总体的数字特征

3 平均数 平均数的估计值等于每个小矩形的面积 乘以小矩形底边中点的横坐标之和
0.25频×率 0.04+0.75×0.08+1.25×0.15+1.75×0.22 +2.2组5距×0.25+2.75×0.14+3.25× 0.06+3.75×0.04+4.25×0.02=2.02(t).
0.25,0.75,1.25,1.75,2.25
高为
cm.
2024/11/3
14
2024/11/3
15
例 有两位射击运动员在一次射击测试中各射靶10次,
每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价?
如果看两人本次射击的平均成绩,由于
x甲 7, x乙 7
两人射击 的平均成绩是一样的.那么两个人的水平
就没有什么差异吗?
2024/11/3
16
甲的环数极差=10- 4=6
乙的环数极差=9-5=4.
它们在一定程度上表明了样本数据的分散程度,与平均数一起, 可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏 锐,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个 最低分”的统计策略.
因平均数为300,由表格中所列出的数据 可见,只有经理在平均数以上,其余的人 都在平均数以下,故用平均数不能客观真 实地反应该工厂的工资水平。
2024/11/3
13
想一想:
• 从某小学随机抽取100名同学,将
他们的身高(单位:cm)数据绘制成
频率散布直方图(如图).由图中数

【精准解析】2021人教A版数学必修3:2.2.2 用样本的数字特征估计总体的数字特征

【精准解析】2021人教A版数学必修3:2.2.2 用样本的数字特征估计总体的数字特征

答案 D 6.设样本数据 x1,x2,…,x10 的平均数和方差分别为 2 和 5,若 yi=xi+a(a 为非零实数,i=1,2,…,10),则 y1,y2,…,y10 的平均数和方差分别为( ) A.2,5 B.2+a,5 C.2+a,5+a D.2,5+a
解析由题意知
-2-
2.2.2 用样本的数字特征估计总体的数字特征 课后篇巩固提升
基础巩固
1.已知一组数据为 20,30,40,50,50,60,70,80,其中平均数、中位数和众数的大小关系是( )
A.平均数>中位数>众数 C.中位数<众数<平均数
B.平均数<中位数<众数 D.平均数=中位数=众数
解析∵平均数为18×(20+30+40+50+50+60+70+80)=50,中位数为12×(50+50)=50,众数为 50,∴它
答案 B
3.已知某组数据的方差 s2=16[(x1-3)2+(x2-3)2+(x3-3)2+…+(x6-3)2],则 x1+x2+x3+…+x6=(
)
A.3
B.6
C.18
D.36
解析由方差公式可知,6 个数据的平均数是 3,∴x1+x2+x3+…+x6=6×3=18.
答案 C
4.甲、乙两人在一次射击比赛中各射靶 5 次,两人成绩的条形统计图如图所示,则( )
-1-
A.12.5,12.5
B.13.5,13
C.13.5,12.5
D.13,13

人教版高中数学 A版 必修三 第二章 《2.2.2用样本的数字特征估计总体的数字特征》

人教版高中数学 A版 必修三 第二章 《2.2.2用样本的数字特征估计总体的数字特征》

知识点三 平均数 定义 如果有 n 个数
x1,x2,x3,…,xn,那么
x

1n(x1+x2+…+xn)
叫做
这 n 个数的平均数.
特点 (1)一组数据有且仅有一个平均数.(2)平均数是频率分布直方图的
“重心”,是直方图的平衡点,因此,每个小矩形的面积与小矩形底边中
点的横坐标的乘积之和为平均数.(3)由于平均数与每一个样本的数据有关,
度.
3.现实中的总体所包含的个体数往往是很多的,虽然总体的平均数与标准
差客观存在,但是我们无从知道.所以通常的做法随是机用样本的平均数和标准
差去估计总体的平均数与标准差.虽然样本具有
性,不代同表的性样本测
得的数据不一样,与总体的数字特征也可能不同,但只要样本的
答案
返回
题型探究
重点难点 个个击破
类型一 感受数据的离散程度
3.利用直方图求数字特征:①众数是最高的矩形的底边的中点.②中位数 左右两边直方图的面积应相等.③平均数等于每个小矩形的面积乘以小矩 形底边中点的横坐标之和.
返回
第二章 § 2.2 用样本估计总体
2.2.2 用样本的数字特征估计总体的数字 特征(二)
学习目标
1.理解样本数据方差、标准差的意义,会计算方差、标准差; 2.会用样本的基本数字特征(平均数、标准差)估计总体的基本数字特征; 3.体会用样本估计总体的思想.
知识点二 用样本的基本数字特征估计总体的基本数字特征
1.样本的基本数字特征包括众数 、中位数 平、均数 标、准差
.
2.平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们
作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些

人教A版高中数学必修3第二章2.2.2 用样本的数字特征估计总体的数字特征

人教A版高中数学必修3第二章2.2.2 用样本的数字特征估计总体的数字特征

§2.2.2用样本的数字特征估计总体的数字特征第1课时众数、中位数、平均数【学习目标】1、理解众数、中位数、平均数在样本数据中所代表的含义;2、会运用频率分布直方图估计众数、中位数、平均数;3、理解在利用众数、中位数、平均数估计总体的数字特征时各自的优缺点;【学习重点】如何从样本频率分布直方图中估计众数、中位数、平均数【学习难点】从样本频率分布直方图中估计中位数【学习过程】同学们好,通过前面的学习,我们知道从两方面用样本来估计总体,频率分布和数字特征。

但在日常生活中我们往往并不需要了解总体的分布形态,而是关心总体的某一数字特征,例如:居民月均用水量问题,我们关心的是数字,而不是总体的分布形态。

因此,我们要通过样本的数据对总体的数字特征进行研究。

这节课我们从三个的数字特征-- 众数、中位数、平均数来估计总体的情况。

一、复习回顾初中,我们学习了众数、中位数、平均数,现在回忆下他们的概念思考1:在初中我们学过众数、中位数和平均数的概念,这些数据都是反映样本信息的数字特征,对一组样本数据如何求众数、中位数和平均数?答:众数:在一组数据中,出现次数最多的数据叫做这组数据的众数中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数:一组数据的算术平均数,即x=思考2:众数、中位数和平均数的特点是什么? 答:众数:可以有一个或多个;121()n x x x n++⋯+中位数:(1)排序后找中位数;(2)中位数只有一个;(3)中位数不一定是这组数据中的数平均数:一组数据有且仅有一个平均数脱口而出:1.求下列各组数据的众数(1)1,2,3,3,3,5,5,8,8,8,9,9(2)1,2,3,3,3,5,5,8,8,9,9(3)1,2,3,4,52、求下列各组数据的中位数(1)1,2,3,3,3,4,6,8,8,8,9,9(2)1,2,3,3,3,4,8,8,8,9,93、求下列各组数据的平均数(1)1,9,3,7,6,4,2,8,(2)1,1,3,7,6,4,2,8,(3)101,102,98,105,99这是从样本数据中根据众数、中位数、平均数的定义求的,那么从频率分布直方图中如何估计众数、中位数和平均数呢?现在请同学们以小组为单位再规范下自己的答案。

2019年人教版A数学必修三第1章 2.2 2.2.2 用样本的数字特征估计总体的数字特征

2019年人教版A数学必修三第1章 2.2 2.2.2 用样本的数字特征估计总体的数字特征

2.2.2 用样本的数字特征估计总体的数字特征学习目标:1.会求样本的众数、中位数、平均数、标准差、方差.(重点)2.理解用样本的数字特征来估计总体数字特征的方法.(重点)3.会应用相关知识解决实际统计问题.(难点)[自主预习·探新知]1.众数、中位数、平均数的概念(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.三种数字特征的比较(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s 表示,s (2)方差:标准差的平方s 2叫做方差.s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].其中,x n 是样本数据,n 是样本容量,x 是样本平均数. [思考] 在统计中,计算方差的目的是什么?提示:方差与标准差描述了一组数据围绕平均数波动的大小,其值越大,数据离散程度越大,当其值为0时,说明样本各数据相等,没有离散性.[基础自测]1.判断下列结论的正误(正确的打“√”,错误的打“×”) (1)在一组样本数据中,众数一定是唯一的. ( ) (2)中位数是样本数据中最中间的那个数. ( ) (3)方差的值越小,数据的离散程度越小. ( )[答案] (1)× (2)× (3)√2.数据101,98,102,100,99的标准差为( )【导学号:49672198】A.2 B .0 C .1D .2A [x =15(101+98+102+100+99)=100. ∴s =15[(101-100)2+(98-100)2+(102-100)2+(100-100)2+(99-100)2] = 2.3.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A.a>b>c B.b>c>aC.c>a>b D.c>b>aD[将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则中位数b=15,众数c=17.平均数a=110(10+12+14×2+15×2+16+17×3)=14.7.显然a<b<c.]4.某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是________分.【导学号:49672199】85[由题意知,该校数学建模兴趣班的平均成绩是40×90+50×8140+50=85(分).][合作探究·攻重难](2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是多少?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.[解](1)平均数是:x=1 500+4 000+3 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+591=2 091(元),中位数是1 500元,众数是1 500元.(2)新的平均数是x′=1 500+28 500+18 500+2 000×2+1 500+1 000×5+500×3+0×2033≈1 500+1 788=3 288(元),新的中位数是1 500元,新的众数是1 500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.1.某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):【导学号:49672200】甲群:13,13,14,15,15,15,15,16,17,17;乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?[解](1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征. (2)乙群市民年龄的平均数为54+3+4+4+5+6+6+6+6+5610=15(岁),中位数为6岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.方差与标准差取6件测量数据为:甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定.【导学号:49672201】[思路探究] (1)直接利用求x 与s 2的公式求解. (2)先比较x 的大小,再分析s 2的大小并下结论. [解] (1)x 甲=16[99+100+98+100+100+103]=100, x 乙=16[99+100+102+99+100+100]=100,s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)由(1)知x甲=x乙,比较它们的方差,∵s2甲>s2乙,故乙机床加工零件的质量更稳定.2.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数x及其方差s2如下表所示,则选送决赛的最佳人选应是()C.丙D.丁B[∵x乙=x丙>x甲=x丁,且s2甲=s2乙<s2丙<s2丁,故应选择乙进入决赛.]1.观察频率分布直方图,能获得样本数据的原始信息吗?提示:把样本数据做成频率分布直方图后就失去了原始数据.2.给出样本数据的频率分布直方图,可以求出数据的众数,中位数和平均数吗?提示:可以近似求出.统计局就某地居民的月收入(元)情况调查了10 000人,并根据所得数据画出了样本频率分布直方图(如图2-2-18),每个分组包括左端点,不包括右端点,如第一组表示月收入在[500,1 000)内.图2-2-18(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样的方法抽出100人作进一步分析,则月收入在[2 000,2 500)内的应抽取多少人?(2)根据频率分布直方图估计样本数据的中位数;(3)根据频率分布直方图估计样本数据的平均数.[思路探究]结合频率分布直方图求解.[解](1)因为(0.000 2+0.000 4+0.000 3+0.000 1)×500=0.5,所以a=0.51 000=0.000 5,月收入在[2 000,2 500)内的频率为0.25,所以100人中月收入在[2 000,2 500)内的人数为0.25×100=25.(2)因为0.000 2×500=0.1,0.000 4×500=0.2. 0.000 5×500=0.25.0.1+0.2+0.25=0.55>0.5,所以样本数据的中位数是1 500+0.5-(0.1+0.2)0.000 5=1 900(元).(3)样本平均数为(750×0.000 2+1 250×0.000 4+1 750×0.000 5+2 250×0.000 5+2 750×0.000 3+3 250×0.000 1)×500=1 900(元).母题探究:1.(变条件)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图2-2-19所示.图2-2-19(1)求这次测试数学成绩的中位数.(2)求这次测试数学成绩的平均分.[解](1)由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.(2)由图知这次数学成绩的平均分为:40+502×0.005×10+50+602×0.015×10+60+702×0.02×10+70+802×0.03×10+80+902×0.025×10+90+1002×0.005×10=72.2.(变结论)本例条件不变.(1)若再从这10 000人中用分层抽样的方法抽出若干人,分析居民收入与幸福指数的关系,已知月收入在[2 000,2 500)内的抽取了40人.则月收入在[3 000,3 500]内的该抽多少人?(2)根据频率分布直方图估计样本数据的众数.[解](1)因为(0.000 2+0.000 4+0.000 3+0.000 1)×500=0.5.所以a=0.51 000=0.000 5.故月收入在[2 000,2 500)内的频率为0.000 5×500=0.25.∴新抽样本容量为400.25=160(人).∴月收入在[3 000,3 500]内的该抽:160×(0.000 1×500)=8(人).(2)由图知众数为2 000元.1.运动员参加体操比赛,当评委亮分后,往往是先去掉一个最高分和一个最低分,再计算剩下分数的平均值,这是为了()【导学号:49672202】A.减少计算量B.避免故障C.剔除异常值D.活跃赛场气氛C [在体操比赛的评分中使用的是平均分.记分过程中采用“去掉一个最高分和一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数,对选手的得分造成较大的影响,从而可以降低误差,使得比赛尽量公平.]2.下列说法中,不正确的是( ) A .数据2,4,6,8的中位数是4,6 B .数据1,2,2,3,4,4的众数是2,4C .一组数据的平均数、众数、中位数有可能是同一个数据D .8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是8×5+7×311A [数据2、4、6、8的中位数为4+62=5,A 错,B 、C 、D 都是正确的.] 3.一组样本数据a,3,5,7的平均数是b ,且a ,b 是方程x 2-5x +4=0的两根,则这个样本的方差是( )【导学号:49672203】A .3B .4C .5D .6C [x 2-5x +4=0的两根为1,4,当a =1时,a,3,5,7的平均数是4;当a =4时,a,3,5,7的平均数不是1,所以a =1,b =4,s 2=5.]4.一个样本的方差s 2=110[(x 1-15)2+(x 2-15)2+…+(x 10-15)2],则这个样本的平均数与样本容量分别是________.15,10 [由方差的计算公式知x =15,n =10.故这个样本的平均数为15,样本容量为10.]5.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:【导学号:49672204】参加数学竞赛.[解]设甲、乙二人成绩的平均数分别为x甲、x乙,方差分别为s2甲、s2乙.则x甲=130+16(-3+8+0+7+5+1)=133,x乙=130+16(3-1+8+4-2+6)=133,s 2甲=16[(-6)2+52+(-3)2+42+22+(-2)2]=473,s 2乙=16[02+(-4)2+52+12+(-5)2+32]=383.因此,甲、乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应选乙参加竞赛较合适.。

2015高中数学 2.2.2用样本的数字特征估计总体的数字特征讲解 新人教A版必修3

2015高中数学 2.2.2用样本的数字特征估计总体的数字特征讲解 新人教A版必修3

2. 2.2 用样本的数字特征估计总体的数字特征(讲)一、众数、中位数、平均数众数—一组数中出现次数最多的数;在频率分布直方图中,我们取最高的那个小长方形横坐标的中点。

中位数——当一组数有奇数个时等于中间的数,当有偶数个时等于中间两数的平均数;在频率分布直方图中,是使图形左右两边面积相等的线所在的横坐标。

平均数——将所有数相加再除以这组数的个数;在频率分布直方图中,等于每个小长方形的面积乘以其底边中点的横坐标的和。

思考探究:分别利用原始数据和频率分布直方图求出众数、中位数、平均数,观察所得的数据,你发现了什么 问题?为什么会这样呢?你能说说这几个数据在描述样本信息时有什么特点吗?由此你有什么样的体会?答:(1)从频率分布直方图得到的众数和中位数与从数据中得到的不一样,因为频率分布直方图损失了一部分样本信息,所以不如原始数据准确。

(2)众数和中位数不受极端值的影响,平均数反应样本总体的信息,容易受极端值的影响。

练一练:假如你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元人民币,另外25个项目的投资是20~100万元。

中位数是25万元,平均数是100万元,众数是20万元。

你会选择哪一种数字特征 来表示国家对每一个项目投资的平均金额?解析:平均数。

二、标准差、方差在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛? 我们知道,77x x ==乙甲, 。

两个人射击的平均成绩是一样的。

那么,是否两个人就没有水平差距呢?(观察74P 图2.2-7)直观上看,还是有差异的。

很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

湖南省蓝山二中高一数学《2.2.2 用样本的数字特征估计总体的数字
特征(2)》教案 新人教A 版必修3
教学目标:
知识与技能
(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差;
(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均
数、标准差),并做出合理的解释;
(3)会用样本的基本数字特征估计总体的基本数字特征;
(4)形成对数据处理过程进行初步评价的意识.
过程与方法
在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和
逻辑推理的数学方法.
重点与难点:
重点:用样本平均数和标准差估计总体的平均数与标准差.
难点:能应用相关知识解决简单的实际问题.
教学过程:
一.知识回顾
问题1:.如何根据样本频率分布直方图,分别估计总体的众数、中位数和平均数?
(1)众数:最高矩形下端中点的横坐标.
(2)中位数:直方图面积平分线与横轴交点的横坐标.
(3)平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和.
二.知识讲解
1.标准差
平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断。

某地区的统计显示,该地区的中学生的平均身高为176㎝,给我们的印象是该地区的中学生生长发育好,身高较高。

但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质。

因此,只有平均数难以概括样本数据的实际状态。

问题2:在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕
甲运动员﹕7,8,6,8,6,5,8,10,7,4;
乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参
加正式比赛? 我们知道,77x x ==乙甲, 。

问题3:两个人射击的平均成绩是一样的。

那么,是否两个人就没有水平差距呢?
直观上看,还是有差异的。

很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。

考察样本数据的分散程度的大小,最常用的统计量是标准差。

标准差是样本数据到平均数的一
种平均距离,一般用s 表示。

样本数据1,2,,n x x x 的标准差的算法:
(1) 、算出样本数据的平均数x 。

(2) 、算出每个样本数据与样本数据平均数的差:(1,2,
)i x x i n -= (3) 、算出(2)中(1,2,)i x x i n -=的平方。

(4) 、算出(3)中n 个平方数的平均数,即为样本方差。

(5) 、算出(4)中平均数的算术平方根,,即为样本标准差。

其计算公式为:
显然,标
准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。

问题4:标准差的取值范围是什么?标准差为0的样本数据有什么特点?
从标准差的定义和计算公式都可以得出:0s
≥。

当0s =时,意味着所有的样本数据都等于样
本平均数。

2.方差 从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:
在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。

解:(图略,可查阅课本P68)
三.例题分析
例1 画出下列四组样本数据的条形图,说明他们的异同点.
(1) 5,5,5,5,5,5,5,5,5;
(2) 4,4,4,5,5,5,6,6,6; (3) 3,3,4,4,5,6,6,7,7;
(4) 2,2,2,2,5,8,8,8,8.
分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。

四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83。

他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。

例2 甲、乙两人同时生产内径为25.40mm 的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各随机抽取20件,量得其内径尺寸如下(单位:mm):
甲 :
25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39
乙:
25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48
从生产零件内径的尺寸看,谁生产的零件质量较高?
(1)
(2)
1.00.80.60.40.2(3)
1.00.80.60.40.2
(4)s =2222121[()()()]n s x x x x x x n =-+-++-
分析: 比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本
数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值。

解:401.25≈甲x 406.25≈乙x 037.0≈甲s 068.0≈乙s 甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高.
说明:1.生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差.
2.问题中25.40mm 是内径的标准值,而不是总体的平均数.
四.课堂练习
1.(宁夏理11文12).甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩
123s s s ,,分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( B )
A.3
12s s s >> B.213s s s >> C.123s s s >>
D.231s s s >> 五.课堂小结
1.对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.
如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.
2.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性. 用样本的数字特征估计总体的数字特征,是一
种统计思想,没有惟一答案.
六.课后作业
《习案》与《学案》。

相关文档
最新文档