用样本的频率分布估计总体分布PPT

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

月均用水量/t
15
频率
组距
0.5 0.4 0.3 0.2 0.1
宽度:组距
高度:
频率 组距
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
上图称为频率分布直方图,其中横轴表示月均用 水量,纵轴表示频率/组距. 频率分布直方图中各 小长方形的宽度和高度在数量上有何特点?
16
思考2:频率分布直方图中各小长方形的面
2.2用样本估计总体
1
问题提出
1.随机抽样有哪几种基本的抽样方法? 简单随机抽样、系统抽样、分层抽样.
2.随机抽样是收集数据的方法,如何通 过样本数据所包含的信息,估计总体的 基本特征,即用样本估计总体,是我们 需要进一步学习的内容.
2
通过图、表、计算来分析样本数据,找出数 据中的规律,就可以对总体作出相应的估计.
频数分布的表示形式有: ①样本频数分布表 ②样本频数分布条形图 ③样本频数分布直方图
4
2.2.1用样本的频率分布 估计总体分布(1)
5
知识探究(一):频率分布表
【问题】 我国是世界上严重缺水的国家之一,
城市缺水问题较为突出,某市政府为了节约生活 用水,计划在本市试行居民生活用水定额管理, 即确定一个居民月用水量标准a,用水量不超过a 的部分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的月均用 水量如下表(单位:t):
共分为9组,各组数据的取值范围可以如何设定?
[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].
思考4:如何统计上述100个数据在各组中的频
数?如何计算样本数据在各组中的频率?你能将 这些数据用表格反映出来吗?
9
分 组 频数累计 频数 频率
[0,0.5)
4 0.04
[0.5,1) 正
积表示什么?各小长方形的面积之和为多少?
频率
组距
0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
各小长方形的面积=对应频率
思考7:在实际中,取a=3t一定能保证85%以上
的居民用水不超标吗?哪些环节可能会导致结论 出现偏差?
分组时,组距的大小可能会导致结论出现偏差, 实践中,对统计结论是需要进行评价的.
12
思考8:对样本数据进行分组,其组数是由哪
些因素确定的?
对样本数据进行分组,组距的确定没有固定的 标准,组数太多或太少,都会影响我们了解数 据的分布情况.数据分组的组数与样本容量有关, 一般样本容量越大,所分组数越多.按统计原理, 若样本的容量为n,分组数一般在(1+3.3lgn) 附近选取.当样本容量不超过100时,按照数据 的多少,常分成5~12组.
思考9:若以0.1或1.5为组距对上述100个样本数据
分组合适吗?
13
思考10:一般地,பைடு நூலகம்出一组样本数据的频率分布
表可以分哪几个步骤进行?
第一步,求极差. (极差=样本数据中最大值与最小值的差)
第二步,决定组距与组数. (设k=极差÷组距,若k为整数,则组数=k, 否则,组数=【k】+1)
第三步,确定分点,将数据分组.
第四步,统计频数,计算频率,制成表格. (频
数=样本数据落在各小组内的个数, 频率=频
数÷样本容量)
14
知识探究(二):频率分布直方图
思考1:为了直观反映样本数据在各组中的
分布情况,我们将上述频率分布表中的有关 信息用下面的图形表示:
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
可以推测该市全体居民月均用水量分布的大致情 况,给市政府确定居民月用水量标准提供参考依 据,这里体现了一种什么统计思想?
用样本的频率分布估计总体分布.
11
思考6:如果市政府希望85%左右的居民每月的
用水量不超过标准,根据上述频率分布表,你对 制定居民月用水量标准(即a的取值)有何建议?
88%的居民月用水量在3t以下,可建议取a=3.
用样本去估计总体,是研究统计问题的一 个基本思想.
这种估计一般分成两种: ①是用样本的频率分布估计总体的分布. ②是用样本的数字特征(如平均数、标准差 等)估计总体的数字特征.
初中时我们学习过样本的频数分布,包括频数、频 率的概念,频数分布表和频数分布直方图的制作.
3
频数分布
样本中所有数据(或数据组)的频数和样 本容量的比,叫做该数据的频率. 所有数据(或数据组)的频数的分布变化 规律叫做样本的频数分布.
8 0.08
[1,1.5) 正 正 正 15 0.15
[1.5,2) 正 正 正 正 22 0.22
[2,2.5) 正 正 正 正 正 25 0.25
[2.5,3) 正 正
14 0.14
[3,3.5) 正 一
6 0.06
[3.5,4)
4 0.04
[4,4.5]
2 0.02
合计
100 1.00
10
思考5:上表称为样本数据的频率分布表,由此
6
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
7
思考1:上述100个数据中的最大值和最小值分
别是什么?由此说明样本数据的变化范围是什么?
0.2~4.3
思考2:样本数据中的最大值和最小值的差称
为极差.如果将上述100个数据按组距为0.5进行 分组,那么这些数据共分为多少组?
(4.3-0.2)÷0.5=8.2
8
思考3:以组距为0.5进行分组,上述100个数据
相关文档
最新文档