用样本频率分布估计总体分布

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
思考:对一组给定的样本数据,频率分 布直方图的外观形状与哪些因素有关? 在居民月均用水量样本中,你能以1为组 距画频率分布直方图吗?
与分组数(或组距)及坐标系的单位长 度有关. 频率
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
(1)居民月均用水量的分布是“山峰”状的,而 且是“单峰”的;
问题2:为了较为合理的确定标准a,需要做 哪些工作?
通过抽样调查,获得100位居民2007年的月 均用水量如下表(单位:t):
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
0.4 组距 0.3 0.2 0.1
O
Leabharlann Baidu
123
4 5 月均用水量/t
小结
画频率分布直方图的步骤
1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1
2、决定组距与组数(将数据分组) 组距:指每个小组的两个端点的距离,组距
组数:将数据分组,当数据在100个以内时,
3、
频率/组距 0.08 0.16 0.30 0.44 0.50 0.28 0.12 0.08 0.04 2
探究(二):画频率分布直方图
第一步:画直角坐标系: x轴为数据单位,y轴为频率/ 组距
第二步:在x轴上均匀标出各组分点, 在y轴上标出单位长度
第三步:以组距为宽,各组的频率/组距为高 频率 分别画出各组对应的长方形
分组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5]
合计
频数 4 8 15 22 25 14 6 4 2 100
频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1.00
组距=每个小组两个
端点的差.
组数=极差÷组距 (取整数)
探究一 频率分布表
思考3:各组数据的取值范 围如何设定? [0,0.5),[0.5,1), [1,1.5),…,[4,4.5].
思考4:如何统计各 族中的频数、频率?
第三步:确定端 点,将数据分组
各组均为左开右闭 区间,最后一个闭 区间
第四步:列频率 分布表
频率:频率
频数 样本容量
极差:最大数-最小数
频率分布表:
知识探究(一):频率分布表
某市政府为了节约生活用水,计划在
本市试行居民生活用水定额管理,即确 定一个居民月用水量标准a,用水量不 超过a的部分按平价收费,超出a的部分 按议价收费.
问题1:如果希望大部分居民的日常生活
不受影响,那么标准a定为多少比较合理?
组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
频率 组距 0.5 0.4 0.3 0.2 0.1
宽度:组距
高度:
频率 组距
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
问题1:频率分布直方图中各小长方 形的宽度和高度在数量上有何特点?
探究一 频率分布表
思考1:上述100个数据的 最小值和最大值分别是多 少?
极差:4.3-0.2=4.1
思考2:分成多少组 合适? 5~12组
如果将上述100个数据按组 距为0.5进行分组,那么这 些数据共分为多少组?
(4.1÷0.5=8.2
将8.2取整,组数=9, 组距=0.5
第一步:求极差
第二步:确定组距, 组数
2.2.1 用样本的频率分 布估计总体分布
我们用简单随机抽样、系统抽样、分层 抽样的方法收集样本数据后,就可以通过样 本研究总体。
用样本估计总体的两种情况: ①用样本的频率分布估计总体分布 ②用样本的数字特征(平均数、标准差等)
估计总体的数字特征
复习回顾
频数:不分组时,数据中某个数据出现的次数
分组时,一个组内的数据的个数
问题3:这些数字告诉了我们什么信息?
我们可以看出,样本数据中的最大值4.3和最 小值,其他数据在0.2~4.3之间
分析数据的基本方法:
用图画出来 用表格重新排列
1、借助于图:
频率分布直方图、频率分布折线图、 茎叶图
两个目的①从数据中提取信息 ②利用图形传递信息
2、借助于表格:
频率分布表 两个目的 ①改变数据的排列方式 ②提供解释数据的新方式
按数据多少常分5-12组。 将数据分组(8.2取整,分为9组)
问题2:频率分布直方图中各小长方形的
面积表示什么?各小长方形的面积之和
为多少? 频率 组距 0.5 0.4 0.3 0.2 0.1
宽度:组距
高度:
频率 组距
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
各小长方形的面积=各小组的频率
各小长方形的面积之和=1
3 分析例题:频率分布直方图非常直观 地表明了样本数据的分布情况,使我们 能够看到频率分布表中看不太清楚的数 据模式,但原始数据不能在图中表示出 来.你能根据上述频率分布直方图指出居 民月均用水量的一些数据特点吗?
相关文档
最新文档