用样本的频率分布估计总体分布1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5
0.5
1 1.5 2 2.5 3
3.5 4
频率分布直方图如下:
频率
组距
月均用水量最 多的在那个区 间?
0.50 0.40 0.30 0.20 0.10
0.5
1 1.5 2 2.5 3
3.5 4
月均用水量 /t 4.5
6
频率分布直方图如下:
频率
组距
0.50 0.40 0.30 0.20 0.10
15
茎叶图
情境:某赛季甲、乙两名篮球运动员每场比赛得
分的原始记录如下:
(1)甲运动员得分:
13,51,23,8,26,38,16,33,14,28,39
(2)乙运动员得分:
49,24,12,31,50,31,44,36,15,37,25,36,39
• 问题:如何有条理地列出这些数据,分析该运
动员的整体水平及发挥的稳定程度?
组距 0.5
4、列出频率分布表.(学生填写频率/组距一栏) 5、画出频率分布直方图。
3
频率分布直方图如下:
频率
组距
小长方形的面 积=? 0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
4
0.5
1 1.5 2 2.5 3
3.5 4
频率分布直方图如下:
频率
组距
小长方形的面 积总和=? 0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
请大家阅读第 69页,直方图有 那些优点和缺 点?
0.5
1 1.5 2 2.5 3
3.5 4
月均用水量 /t 4.5
7
练习
1.有一个容量为50的样本数据的分组的频数如下: [12.5, 15.5) 3
[15.5, 18.5) [18.5, 21.5) 8 9 [24.5, 27.5) [27.5, 30.5) [30.5, 33.5) 10 5 4
(3)当样本容量无限增大,组距无限缩小, 那么频率分布直方图就会无限接近于一条光滑 曲线——总体密度曲线。
12
2.2 总体分布的估计
当样本容量无限增大,分组的组距无限缩小,那么频率分 布直方图就会无限接近一条光滑曲线——总体密度曲线.
频率 组距
总体在区间(a , b)内取值的概率
S
a b
月均用水量 (mm)
16
茎叶图
甲 乙
8
0 1
4 6 3
3 6 8
2 5
5 4
2
3
3 8 9
1 6 1 6 7 9
4 9
4 1
5
0
17
1.茎叶图的概念:
一般地:当数据是一位和两位有效数字时,用中 间的数字表示十位数,即第一个有效数字,两边的数 字表示个位数,即第二个有效数字,它的中间部分像 植物的茎,两边部分像植物茎上长出来的叶子,因此 通常把这样的图叫做茎叶图。茎按从小到大的顺序从 上向下列出,共茎的叶一般按从大到小(或从小到大) 的顺序同行列出。
0.010 12.5 15.5
10
频率分布直方图如下:
频率
组距
连接频率分布直方图 中各小长方形上端的 中点,得到频率分布折 线图
0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
11
0.5
1 1.5 2 2.5 3
3.5 4
利用样本频分布对总体分布进行相应估计
(1)上例的样本容量为100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增 至10000呢? (2)样本容量越大,这种估计越精确。
1
根据这些数据 你能得出用水 量其他信息吗?
2
画频率分布直方图的步骤
1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1 2、决定组距与组数(将数据分组) 组距:指每个小组的两个端点的距离,组距 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 组数= 极差 4.1 8.2 3、 将数据分组(8.2取整,分为9组)
18
2.茎叶图的特征:
1)用茎叶图表示数据有两个优点:一是从统计图 上没有原始数据信息的损失,所有数据信息都可以 从茎叶图中得到;二是茎叶图中的数据可以随时记 录,随时添加,方便记录与表示; (2)茎叶图只便于表示两位(或一位)有效数字 的数据,对位数多的数据不太容易操作;而且茎叶 图只方便记录两组的数据,两个以上的数据虽然能 够记录,但是没有表示两个记录那么直观,清晰; (3)茎叶图对重复出现的数据要重复记录,不能 遗漏.
0.06 0.16 0.18 0.22 0.20 0.10 0.08
0.020 0.053 0.060 0.073 0.067 0.033 0.027
注意:
第几组频数 (2)纵坐标为: (1)第几组频率 样本容量
频率 组距
9wk.baidu.com
频率分布直方图如下:
频率
组距
0.070 0.060 0.050 0.040 0.030 0.020
19
茎叶图的制作方法
制作茎叶图的方法是:将所有两位数的十位数字 作为“茎”,个位数字作为“叶”,茎相同者共 用一个茎,茎按从小到大的顺序从上向下列出, 共茎的叶一般按从大到小(或从小到大)的顺序 同行列出.
注意:在制作茎叶图时,重复出现的数据要重复 记录,不能遗漏,特别是“叶”部分;同一数据 出现几次,就要在图中体现几次.
20
用茎叶图表示数据有两个突出的优点: 一.是所有的信息都可以从这个茎叶图 上得到; 二.是茎叶图便于记录和表示.
用茎叶图表示数据有一个突出的缺点:
13
总体密度曲线
频率 组距
月均用 水量/t
a
b
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
14
总体密度曲线
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。是研究总 体分布的工具. 用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。
[21.5, 24.5) 11 (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的 百分比是多少?
8
解:组距为3
分组 频数
3
频率
频率/ 组距
[12.5, 15.5)
[15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 [24.5, 27.5) 10 [27.5, 30.5) [30.5, 33.5) 5 4
0.5
1 1.5 2 2.5 3
3.5 4
频率分布直方图如下:
频率
组距
月均用水量最 多的在那个区 间?
0.50 0.40 0.30 0.20 0.10
0.5
1 1.5 2 2.5 3
3.5 4
月均用水量 /t 4.5
6
频率分布直方图如下:
频率
组距
0.50 0.40 0.30 0.20 0.10
15
茎叶图
情境:某赛季甲、乙两名篮球运动员每场比赛得
分的原始记录如下:
(1)甲运动员得分:
13,51,23,8,26,38,16,33,14,28,39
(2)乙运动员得分:
49,24,12,31,50,31,44,36,15,37,25,36,39
• 问题:如何有条理地列出这些数据,分析该运
动员的整体水平及发挥的稳定程度?
组距 0.5
4、列出频率分布表.(学生填写频率/组距一栏) 5、画出频率分布直方图。
3
频率分布直方图如下:
频率
组距
小长方形的面 积=? 0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
4
0.5
1 1.5 2 2.5 3
3.5 4
频率分布直方图如下:
频率
组距
小长方形的面 积总和=? 0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
请大家阅读第 69页,直方图有 那些优点和缺 点?
0.5
1 1.5 2 2.5 3
3.5 4
月均用水量 /t 4.5
7
练习
1.有一个容量为50的样本数据的分组的频数如下: [12.5, 15.5) 3
[15.5, 18.5) [18.5, 21.5) 8 9 [24.5, 27.5) [27.5, 30.5) [30.5, 33.5) 10 5 4
(3)当样本容量无限增大,组距无限缩小, 那么频率分布直方图就会无限接近于一条光滑 曲线——总体密度曲线。
12
2.2 总体分布的估计
当样本容量无限增大,分组的组距无限缩小,那么频率分 布直方图就会无限接近一条光滑曲线——总体密度曲线.
频率 组距
总体在区间(a , b)内取值的概率
S
a b
月均用水量 (mm)
16
茎叶图
甲 乙
8
0 1
4 6 3
3 6 8
2 5
5 4
2
3
3 8 9
1 6 1 6 7 9
4 9
4 1
5
0
17
1.茎叶图的概念:
一般地:当数据是一位和两位有效数字时,用中 间的数字表示十位数,即第一个有效数字,两边的数 字表示个位数,即第二个有效数字,它的中间部分像 植物的茎,两边部分像植物茎上长出来的叶子,因此 通常把这样的图叫做茎叶图。茎按从小到大的顺序从 上向下列出,共茎的叶一般按从大到小(或从小到大) 的顺序同行列出。
0.010 12.5 15.5
10
频率分布直方图如下:
频率
组距
连接频率分布直方图 中各小长方形上端的 中点,得到频率分布折 线图
0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
11
0.5
1 1.5 2 2.5 3
3.5 4
利用样本频分布对总体分布进行相应估计
(1)上例的样本容量为100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增 至10000呢? (2)样本容量越大,这种估计越精确。
1
根据这些数据 你能得出用水 量其他信息吗?
2
画频率分布直方图的步骤
1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1 2、决定组距与组数(将数据分组) 组距:指每个小组的两个端点的距离,组距 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 组数= 极差 4.1 8.2 3、 将数据分组(8.2取整,分为9组)
18
2.茎叶图的特征:
1)用茎叶图表示数据有两个优点:一是从统计图 上没有原始数据信息的损失,所有数据信息都可以 从茎叶图中得到;二是茎叶图中的数据可以随时记 录,随时添加,方便记录与表示; (2)茎叶图只便于表示两位(或一位)有效数字 的数据,对位数多的数据不太容易操作;而且茎叶 图只方便记录两组的数据,两个以上的数据虽然能 够记录,但是没有表示两个记录那么直观,清晰; (3)茎叶图对重复出现的数据要重复记录,不能 遗漏.
0.06 0.16 0.18 0.22 0.20 0.10 0.08
0.020 0.053 0.060 0.073 0.067 0.033 0.027
注意:
第几组频数 (2)纵坐标为: (1)第几组频率 样本容量
频率 组距
9wk.baidu.com
频率分布直方图如下:
频率
组距
0.070 0.060 0.050 0.040 0.030 0.020
19
茎叶图的制作方法
制作茎叶图的方法是:将所有两位数的十位数字 作为“茎”,个位数字作为“叶”,茎相同者共 用一个茎,茎按从小到大的顺序从上向下列出, 共茎的叶一般按从大到小(或从小到大)的顺序 同行列出.
注意:在制作茎叶图时,重复出现的数据要重复 记录,不能遗漏,特别是“叶”部分;同一数据 出现几次,就要在图中体现几次.
20
用茎叶图表示数据有两个突出的优点: 一.是所有的信息都可以从这个茎叶图 上得到; 二.是茎叶图便于记录和表示.
用茎叶图表示数据有一个突出的缺点:
13
总体密度曲线
频率 组距
月均用 水量/t
a
b
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
14
总体密度曲线
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。是研究总 体分布的工具. 用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。
[21.5, 24.5) 11 (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的 百分比是多少?
8
解:组距为3
分组 频数
3
频率
频率/ 组距
[12.5, 15.5)
[15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 [24.5, 27.5) 10 [27.5, 30.5) [30.5, 33.5) 5 4