(原创)2.2.1用样本的频率分布估计总体分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.决定组距和组数
(设k=极差÷组距,若k为整数,则组数=k,
若k不是整数,组数=k+1)
例如,若取组距为0.5,则 组数 = 极差 = 4.1 = 8.2 组距 0.5
故可将数据分成9组。
3.将数据分组
以组距0.5将数据分组如下: [0,0.5), [0.5,1),……,[4,4.5 ].
4.列频率分布表:(频数=样本数据落在各小组内的个数, 频率=频数÷样本容量)
2.决定组距与组数
取组距为0.4cm,那么组数= 极差÷组距=1.90÷0.4=4.75 因此可以将数据分成5组,即 组距为0.4,组数为5
3.将数据分组
[362.51,362.91), [362.91,363.31), [363.31,363.71), [363.71,364.11), [364.11,364.51]
这种估计一般分成两种: ①是用样本的频率分布估计总体的分布. ②是用样本的数字特征(如平均数、标准差 等)估计总体的数字特征.
初中时我们学习过样本的频率分布,包括频数、频 率的概念,频率分布表和频率分布直方图的制作.
2.2.1用样本的频率分布 估计总体分布
探究:我国是世界上严重缺水的国家之一,城市缺水问题
4.列频率分布表
分组
频数
[362.51,362.91)
8
[362.91,363.31)
17
[363.31,363.71)
33
[363.71,364.11)
16
[364.11,364.51)
6
合计
80
5.画频率分布直方图
频率 0.10 0.2125 0.4125 0.20 0.075 1.00
小结:
某市100名居民的月均用水量(单位:t)
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
频率/组距
频率/组距
频率分布直方图
0.6 0.5 0.4 0.3 0.2 0.1
0 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5 用水量范围
横轴表示:月均用水量,纵轴表示:频率/组距 小长方形的面积=组距*(频率/组距)=频率 各小长方形的面积总和等于1
1.求极差
2.决定组距与组数
步骤
频率分布直方图
3.将数据分组
应用
4.列频率分布表 5.画频率分布直方图
茎叶图
甲乙两名篮球运动员每场比赛得分的原始记录如下:
甲得分:13,51,23,8,26,38,16,33,14,28,39
频率/组距
频频率率分分布布折直线方图 图
0.6 0.5 0.4 0.3 0.2 0.1
0 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5 用水量范围
连接频率分布直方图中各个小长方形上端的中点,频率分布折线图
随着样本容量的增加,作图时所分的组数也会增加,相应的频率折 线图会越来越接近于一条光滑的曲线,统计学中称这条光滑的曲线 为总体密度曲线.
较为突出.某市政府为了节约生活用水,计划在本市试行 居民生活用水定额管理,即确定一个居民月用水量标准a, 用水量不超过a的部分按平价收费,超出a的部分按议价 收费.如果希望大部分居民的日常生活不受影响,那么标 准a定为多少比较合理呢?你认为,为了较为合理的确定 出这个标准,需要做那些工作?
2000年全国主要城 市中缺水情况排在 前10位的城市
总体密度曲线
阴影部分的面积表 示总体在区间(a,b) 内取值的曲线,它 反映了总体在各个范围内取值的百分比.
练习: P71 第1题
课本 P71 练习1 1.求极差(即一组数据中最大值
与最小值的差)
364.41-362.51=1.90说明样 本数据的变化范围大小是 1.90cm)
每个组距为底,以频率除以组距的商为高,分别画出矩形,这 样得到的直方图就是频率分布直方图。
频率分布直方图
0.6 0.5 0.4 0.3 0.2 0.1
0 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5 用水量范围
思考:小矩形的面积与哪些量有关?如何表示?
分组
频数
频率
[0,0.5)
4
0.04
[0.5,1)
8
0.08
[1,1.5)
15
0.15
[1.5,2)
22
0.22
[2,2.5)
25
0.25
[2.5,3)
14
0.14
[3,3.5)
6
0.06
[3.5,4)
4
0.04
[4,4.5]
2
0.02
合计
100
1.00
5.画频率分布直方图 用横轴表示月均用水量,纵轴表示频率与组距的比值,以
将一批数据按要求分为若干组,各组内的数据的个数, 叫做该组数据的频数,各个小组数据在样本容量中所占的 比例的大小,叫做该组数据的频率。
为了解数据分布的规律,可利用频率分布表和频率分布图来分析, 具体做法如下:
1.求极差(即一组数据中最大值和最小值的差) 例如, 4.3-0.2=4.1, 这说明这些数据的变化范围大小是4.1t。
2.2用样本估计总体
复习回顾
1、什么是简单随机抽样?什么样的总体 适宜简单随机抽样?
2、什么是系统抽样?什么样的总体适宜 系统抽样?
3、什么是分层抽样?什么样的总体适宜 分层抽样?
通过图、表、计算来分析样本数据,找出数据 中的规律,就可以对总体作出相应的估计.
用样本去估计总体,是研究统计问题的一 个基本思想.
相关文档
最新文档