样本估计总体
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用样本的数字特征估计总体的数字特征(1)
教学目标:
1、知识与技能
(1)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.
(3)会用样本的基本数字特征估计总体的基本数字特征.
(4)形成对数据处理过程进行初步评价的意识.
2、过程与方法
在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法
3、情感与价值观
会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.
教学重点、难点:
重点:从样本数据中提取基本的数字特征(如平均数、标准差).
难点:能应用相关知识解决简单的实际问题.
教学过程:
(一)创设情景、导入课题
1、对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?
频率分布表、频率分布直方图、总体密度曲线、茎叶图
2、它们各自的优缺点,适用范围是什么?
3、探究:⑴怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?
⑵你能否用一个数值来描写样本数据的离散程度?
(二)师生互动、探究新知
在初中我们学过众数、中位数和平均数的概念,这些数据都能够为我们提供关于样本数据的特征信息.
怎样从频率分布直方图中求众数、中位数和平均数?(见课本P72图)
1.众数:取最高矩形下端中点的横坐标
2.25t作为众数的估计值.
众数:在一组数据中,出现次数最多的数据叫做这一组数据的众数。
它说明,该市的月均用水量为2.25t的居民数比月均用水量为其它值的居民数多,但没告诉我们多多少.
2.在城市居民月均用水量样本数据的频率分布直方图中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,中位数左右两边的直方图面积应该相等.由此估计总体的中位数是什么?
0.5-0.04-0.08-0.15-0.22=0.01,0.5×0.01÷0.25=0.02,中位数是2.02.
中位数:如果将一组数据从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数是这组数据的中位数。
3.平均数是频率分布直方图的“重心”,在城市居民月均用水量样本数据的频率分布直方图中,各个小矩形的重心在哪里?从直方图估计总体在各组数据内的平均数分别为多少?
0.25,0.75,1.25,1.75,2.25,2.75,3.25,3.75,4.25.
将频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和,就是样本数据的估值平均数. 由此估计总体的平均数是什么?
0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×
0.06+3.75×0.04+4.25×0.02=2.02(t).
平均数是2.02.
思考1 平均数与中位数相等,是必然还是巧合?
思考2 2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?
频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关.
思考3 同样从居民月均用水量样本数据可知,该样本的众数是2.3,平均数是1.973,这与我们从样本频率分布直方图得出的结论也有偏差,你能解释一下原因吗?
在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征,但结论可能会有所偏差.
由图(见课本P72)显示,大部分居民的月均用水量在中部(2.02t左右),但也有少数居民的月均用水量特别高.显然,对这部分居民的用水作出限制是非常合理的.
讨论:众数、中位数、平均数各自的优缺点.
众数很容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.
一组数据的中位数一般不受少数几个极端值的影响,并且样本数据收集有个别差错不影响中位数,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点.
任何一个样本数据的改变都会引起平均数的改变,所以平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(三)讲练结合,巩固提高
1、探究:“用数据说话”,是我们经常可以听到的一句话.但是,数据有时候也会被利用.例如,一个企业中,绝大多数是一线的工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万.
你认为“我们单位的收入水平比别的单位高”这句话应当如何解释?
这句话具有模糊性甚至欺骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数.
平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值.
样本数据的极端值不影响中位数和众数;大学毕业生凭工资中位数或众数找单位可能收入较低.
2、课堂练习1:(课本P79练习1)农场种植的甲乙两种水稻,在面积相等的两块稻田中连续六年的年平均产量如下(单位:500g):
哪种水稻的产量比较稳定?