频率分布直方图
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
100位居民的月均用水量 (单位 :t )
2.0 2.2 2.3 2.3 2.4 2.4 2.0 1.5 1.0 1.6 1.8 1.9 1.6 2.2 1.5 1.2 0.2 0.4 0.3 0.4 2.1 1.6 1.2 3.7 1.5 0.5 3.8 2.2 1.7 1.3 3.6 1.7 0.6 4.1 2.3 1.8 1.4 3.5 1.9 0.8 4.3 2.4 1.9 1.3 1.4 1.8 0.7 2.0
2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
从上面这些数字,我们很容易发现的居民的月均用水量的最小值 是 0.2 t,最大值是4.3 t.其他在 0.2至4.3之间。很难再发现其他信息。我们 很难从随意记录的数据中直接看出规律。为此,我们需要对统计数据 进行整理与分析。
o
90
100
110
120
130
140
150
次数
频率分布直方图如下:
频率
组距
月均用水量最 多的在哪个区 间?
0.50 0.40 0.30 0.20 0.10
0.5
1 1.5 2 2.5 3
3.5 4
月均用水量 /t 4.5
思考:频率分布直方图有什么作用?
用频率分布估计总体分布,以面积的 形式反映数据落在各小组内的频率大 小
※ 典型例题 某化肥厂甲、乙两个车间包装肥料,在 自动包装传送带上每隔30分钟抽取一包产品, 称其重量,分别记录抽查数据如下:
甲: 102,101,99,98,103,98,99 乙:110,115,90,85,75,115,110 (1)这种抽样方法是哪一种? (2)画出适当的茎叶图表示以上两种数据; (3)根据你所画的茎叶图,简要说明说明哪个车间产品较稳定?
总体密度曲线反映了总体在各个范围内取值的
百分比,精确地反映了总体的分布规律。是研究总
体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布
规律,即越精确地反映了总体在各个范围内取值
百分比。
怎样将数据用茎叶图表示?课本图2.2-4中,茎是指哪些数?叶是指哪些数? 从这个茎叶图,你能够大致判断哪组数据更集中吗?
A. 0.27,78 B. 0.27,83 C. 2.7,78 D. 2.7,83
0.3 0.1
频率/组距
4.3
4.5
4.7
4.9
5.1
视力
2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
从上面这些数字,我们很容易发现的居民的月均用水量的最小值 是 0.2 t,最大值是4.3 t.其他在 0.2至4.3之间。很难再发现其他信息。我们 很难从随意记录的数据中直接看出规律。为此,我们需要对统计数据 进行整理与分析。
3、观察新生婴儿的体重,其频率分布直方图
如图所示,则新生婴儿体重(2700,3000)的频
率为: y 0.3 ;
0.001
2400 2700 3000 3300 3600 3900
X
体重
5.为了解某校高三学生的视力情况,随机地抽 查了该校 100 名高三学生的视力情况, 得到频率 分布直方图,如右,由于不慎将部分数据丢失, 但知道前 4 组的频数成等比数列, 6 组的频数 后 成等差数列,设最大频率为 a,视力在 4.6 到 5.0 之间的学生数为 b,则 a,b 的值分别为( A )
【问题】 某赛季甲、乙两名篮球运动员每场 比赛的得分情况如下: 甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39; 乙运动员得分:49,24,12,31,50,31,44, 36,15,37,25,36,39.
甲 乙
8 4 6 3 3 6 8 3 8 9 1
0 1 2 3 4 5
※ 典型例题 下表给出了某校500名12岁男孩中用随机抽样得 出的120人的身高(单位cm)
区间界限 [122,126) [126,130) [130,134) [134,138) [138,142) [142,146) 人数 5 8 10 22 33 20 区间界限 [146,150) [150,154) [154,158) 人数 11 6 5
频率分布直方图如下:
频率
组距
小长方形的面 积=? 0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
0.5
1 1.5 2 2.5 3
3.5 4
频率 组距
频率分布直方图如下:
0.50
0.40
小长方形的面 积总和=?
0.30
0.20 0.10 月均用水量 /t 0.5 1 1.5 2 2.5 3 3.5 4 4.5 注:小长方形的面积=组距×频率/组距=频率 各长方形的面积总和等于1。
某学生在一次考试中各科成绩的茎叶图如图所示:
茎 7
8
叶 0
4 4 9 5 9
_____科, 成绩分别是_____________________________________
一般地, 画出一组样本数据的茎叶图的步骤如 何?
第一步,将每个数据分为“茎”(高位)和“叶” (低位)两部分;
根据这些数据 你能得出用水 量其他信息吗?
表2-1
3.1 3.4 3.2 3.3 3.2 3.0 2.5 2.6 2.5 2.8 2.5 2.6 2.7 2.8 2.9 2.9 2.8 2.7 2.6 2.5
100位居民的月均用水量 (单位 :t )
2.0 2.2 2.3 2.3 2.4 2.4 2.0 1.5 1.0 1.6 1.8 1.9 1.6 2.2 1.5 1.2 0.2 0.4 0.3 0.4 2.1 1.6 1.2 3.7 1.5 0.5 3.8 2.2 1.7 1.3 3.6 1.7 0.6 4.1 2.3 1.8 1.4 3.5 1.9 0.8 4.3 2.4 1.9 1.3 1.4 1.8 0.7 2.0
第二步, 将最小的茎和最大的茎之间的数按大 小次序排成一列,写在左(右)侧;
第三步, 将各个数据的叶按大小次序写在茎右 (左)侧.
若数据为小数时,整数部分作为茎,小数部分作为叶
用茎叶图表示数据时,茎是指 中间 的一列数,叶就 是从茎的旁边 生长出来 的数在样本数据较少时,用 茎叶图表示数据的效果较好,它不但可以 随时记录 , 而且 无原始信息丢失 ,这对数据的 记录 和 表示 都能带来方便。
2.为了了解某地区高三学生的身体发育情况,抽 查了该地区100名年龄为17.5岁-18岁的男生体重 (kg) ,得到频率分布直方图如下:
0.07 0.05 0.03 体重(kg)
54.5 58.5 62.5 66.5 70.5 74.5
频率/组距
根据上图可得这100名学生中体重在[56.5,64.5] 的学生人数是( C ) A. 20 B. 30 C. 40 D. 50
甲
乙
用茎叶图表示数据的分布情况是一种好方法, 你认为茎叶图有哪些优点?
(1)保留了原始数据,没有损失样本信息; (2)数据可以随时记录、添加或修改.
【问题】 某赛季甲、乙两名篮球运动员每场 比赛的得分情况如下: 甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39; 乙运动员得分:49,24,12,31,50,31,44, 36,15,37,25,36,39.
2 5 1 4 0
5 4 6 1 6 7 9 9
1、一个容量为20的样本数据.分组后.组距与频 数如下:(0,20] 2;(20,30] 3, (30,40] 4; (40,50] 5; (50,60] 4; (60,70] 2。则样 本在(-∞,50]上的频率为: 7/10 ,
(2002,江西)
频率分布直方图如下:
频率
组距
连接频率分布直方图 中各小长方形上端的 中点,得到频率分布折 线图
0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
0.5
1 1.5 2 2.5 3
3.5 4
利用样本频分布对总体分布进行相应估计
(1)上例的样本容量为100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增
2. 2 总体 分 布的估 计
用样本估计总体
• 用样本估计总体(两种): 一种是:用样本的频率分布估计总体的 分布。 另一种是:用样本的数字特征(平均数 标准差等)估计总体的数字特征。
2.2.1 用样本的频率分布估计总 体分布
探究: 我国是世界上严重缺水的 国家之一,城市 缺水问题较为突出。某市政府为了节约用 水,计划在 本市试行居民生活用水定额管 理,即确定一个居民月用水量标准a,用水 量不超过a的按平价收费,超过 a的按议价 收费。如果希望大部分居民的 日常生活不 受影响,那么标准a定为多少比较合理? 你认为,为了较为合理地确定出这个标准, 需要做什么工作?
至10000呢?
(2)样本容量越大,这种估计越精确。
总体密度曲线
当样本容量无限增大,分组的组距无限缩小,那么 频率分布折线图就会无限接近一条光滑曲线——总体密 度曲线. 总体密度曲线
频率 组距
月均用 水量/t
a
b
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
总体密度曲线
频率分布直方图如下:
频率
组距
直方图有那些 优点和缺点?
0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
0.5
1 1.5 2 2.5 3
3.5 4
• 频率分布直方图:它是在频率分布表的基 础上画出的,不仅能很容易地表示大量数 据,而且能非常直观地表明分布的形状, 使我们能够看到在分布表中看不清的数据 模式,但它不能保留所有原始数据的信 息.
组距
0.5
4、列出频率分布表.(学生填写频率/组距一栏) 5、画出频率分布直方图。
4.列频率分布表
100位居民月均用水量的频率分布表
表2-1
3.1 3.4 3.2 3.3 3.2 3.0 2.5 2.6 2.5 2.8 2.5 2.6 2.7 2.8 2.9 2.9 2.8 2.7 2.6 2.5
画频率分布直方图的步骤
1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1 2、决定组距与组数(将数据分组) 组距:指每个小组的两个端点的距离,组距0.5 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 组数= 极差 4.1 8.2 3、 将数据分组(8.2取整,分为9组)
(1)列出样本频率分布表; (2)画出频率分布直方图;
(3)试从你所画的频率分布直方图计算
[134,138)
这一组的频率。
频率/组距
0.036 0.032 0.028 0.024 0.020 0.016 0.012 0.008 0.004
〖例2〗:为了了解高一学生的体能 情况,某校抽取部分学生进行一分钟 跳绳次数次测试,将所得数据整理 后,画出频率分布直方图(如图), 图中从左到右各小长方形面积之比 为2:4:17:15:9:3,第二小组 频数为12. (1)第二小组的频率是多少?样本容 量是多少? (2)若次数在110以上(含110次)为 达标,试估计该学校全体高一学生 的达标率是多少?
试一试: 1、频率的计算公式是怎样的?若某个小组 的频率是0.3,样本容量是50,则该小组的 频数的多少? 2、频率分布直方图中的各个小长方形的面积表示 频率 相应各组的____________;个小长方形 1 的面积之和为__________,即个小组的频率 1 之和为________。 组距×频率/组距=频率 小长方形面积=