221用样本的频率分布估计总体分布PPT课件

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
可以通过表、图、计算方法来分析。
2.2.1 用样本的频率分布估计总体分布
我国是世界上严重缺水的国家之一,城 市缺水问题较为突出,某市政府为了节约生 活用水,计划在本市试行居民生活用水定额 管理,即确定一个居民月用水量标准a,用 水量不超过a的部分按平价收费,超出a的部 分按议价收费。
如果希望大部分居民的日常生活不受影响, 那么标准a定为多少比较合理呢 ?
实际问题
为了制定一个较为合理的标准a,必须先了解 全市居民日常用水量的分布情况,比如月均用水 量在哪个范围的居民最多,他们占全市居民的百 分比情况等。因此采用抽样调查的方式,通过分 析样本数据来估计全市居民用水量的分布情况。
假设我们通过抽样,得到100位居民月用水 量,如下:
100位居民的月均用水量(单位:t)
100位居民月均用水量的频率分布表
分组 [0-0.5) [0.5-1) [1-1.5) [1.5-2) [2-2.5) [2.5-3) [3-3.5) [3.5-4) [4-4.5)
频数 4 8 15 22 25 15 5 4 2
频率
0.04
0.08 0.15 0.22 0.25 0.15
0.05 0.04 0.02 1
因为用水最小值为0.2t,最大值为4.3t 所以:4.3-0.2=4.1 说明样本数据的变化范围是4.1t。
(2)决定组距与组数
数据分组的组数与样本容量有关,一般样本 容量越大,所分组数越多。当样本容量不超过 100时,按照数据的多少,常分成5—12组。
为了方便起见,组距的选择应力求“取整”。 在本问题中,如果取组距为0.5(t),那么
在起始部分 时采用简单 随机抽样
总体中 个体较 多
各层抽样 总体由
将总体分成几层, 时采用简 差异明
分层进行抽取 单随机抽 显的几
样或系统 部分组
抽样

新课导入
前面研究学习了三种抽样收集数据,数据收 集后,必须从中寻找包含的信息,以使我们能追 求样本的估计总体,但是由于数据多而杂,所以 需要通过一定的方法去分析。
间?
直 0.1 0.08
0.1 0.08

0.04
图.
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
Fra Baidu bibliotek
(1)居民月均用水量的分布是“山峰”状的,而 且是“单峰”的;
简单随机抽样、系统抽样、分层抽样的比较
类别 共同点
各自特点
联系
适用 范围
简单 随机 抽样
系统 抽样
分层 抽样
(1)抽样 过程中每 个个体被 抽到的可 能性相等
(2)每次 抽出个体 后不再将 它放回, 即不放回 抽样
从总体中逐 个抽取
总体中 个体较 少
将总体平均分成 几部分,按预先 制定的规则在各 部分抽取
组数=极差/组距=4.1/0.5=8.2 因此可将数据分成9组,这个组数是较合适 的,于是去组距为0.5.组数为9。
(3)将数据分组 以组距为0.5将数据分组时,可以分成以下9组: [0,0.5),[0.5,1),…,[4,4.5)。
(4)列频率分布表
按照组距为0.5将数据分组,分成以下9组: [0,0.5),[0.5,1),…,[4,4.5). 图如下:
方法
画频率分布直方图的一般步骤为:
(1)计算一组数据中最大值与最小值的差, 即求极差;
(2)决定组距与组数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图。
思考:对一组给定的样本数据,频率分 布直方图的外观形状与哪些因素有关? 在居民月均用水量样本中,你能以1为组 距画频率分布直方图吗?
观察
? 上面的数字能告诉我们什么呢
很容易发现的是一个居民月均用水量的最小 值是0.2t,最大值是4.3t。其他值在0.2—4.3t之间。 除此之外,很难从随意记录下来的数据中直接看 出规律。
为此,我们需要对统计数据进行整理和分析。
将上述抽样的100户居民月用水量,画出频率 分布直方图。
解:(1)求极差
(2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
特征
频率分布直方图的特征: 从频率分布直方图可以清楚的看出数据分布的
总体趋势。 从频率分布直方图得不出原始的数据内容,把
数据表示成直方图后,原有的具体数据信息就 被抹掉了。
与分组数(或组距)及坐标系的单位长 度有关. 频率
0.4 组距 0.3 0.2 0.1
O
123
4 5 月均用水量/t
随堂练习
1.下表给出了某校500名12岁男孩中用随机抽样 得出的120人的身高(单位cm)
区间界限 [122,126) [126,130) [130,134) [134,138) [138,142) [142,146)
组距=0.5
频率/组距
0.08 0.16 0.3
0.44 0.5 0.3
0.1 0.08
0.04 2.00
第 频率/组距 (组距=0.5) 五 步: 0.6
画 0.5请大家阅读第
0.5
出 频
0.46哪8页些,优直点方和图缺有 0.44
率 0.3 点? 0.3
0.3

布 0.2
0.16
小月长均方用形水的量面最 多积的积总在=和哪?=个? 区
相关文档
最新文档