2.2.1用样本频率分布估计总体分布)wdh
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体密度曲线反映了总体在各个范围内取值的
百分比,精确地反映了总体的分布规律。是研究总
体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布
规律,即越精确地反映了总体在各个范围内取值
百分比。
茎叶图
某赛季甲、乙两名篮球运动员每场比赛得分的
1
5
0
注:中间的数字表示得分的十位数字。 旁边的数字分别表示两个人得分的 个位数。
乙的成绩要比甲的成绩好
茎叶图
当样本数据较少时,用茎叶 图表示数据的效果较好,它不但 可以保留所有的信息,而且 可以 随时记录,给数据的记录和表示 都方便。
练习:
1.右面是甲、 50 乙两名运动员 32 某赛季一些场 875421 次得分的茎叶 944 图,据图可知 ( A)
甲
乙
5
6 5 1 9 8 6 1 5 4 1
6
7 8 9 9 3 3 5 6 8 9 6 8 8 7
乙的成绩要比甲的成绩好
5.(2013重庆,6,5分)下图是某公司10个销售
店某月销售某产品数量(单位:台)的茎叶图, 则数据落在区间[22,30)内的频率为( B )
1 8 9
2
3
1
0
2
0
2
3
7
9
甲 乙
0 1 2 3 4 5
8 247 199 36 2
1
A.甲运动员的成绩好于乙运动员 B.乙运动员的成绩好于甲运动员 C.甲、乙两名运动员的成绩没有明显的差异 D.甲运动员的最低得分为0分
2.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图: ( 1 ) 甲乙两名队员的最高得分各是多少? 他们的中位数和众数各是多少?
0.34+0.3+0.18+0.06=0.88 即:若次数在110以上,该学校全体
90 100 110 120 130 140 150 次数
o
高一学生的达标率是88 0 / 0
牛刀小试:某学校组织学生参加英语测试, 成绩的频率分布直方图如图, • 数据的分组一次为 • 若低于60分的人数是15人,则该班的学生 人数是 (B ) • (A)45 (B)50 • (C) 55 (D)60
即.第二小组的频率是0.08,样本容量是150个
12 0.08 N
50 x 1
N 150个
2)第3组频率: 0.02 17=0.34 第4组频率: 0.02 15=0.3 第5组频率: 0.02 9=0.18 第6组频率: 0.02 3=0.06 则次数在110以上的频率为:
茎叶图表示这组数据,并说明这一车间的生产情况.
134 112 117 126 128 124 122 116 113 107 116 132 127 128 126 121 120 118 108 110 133 130 124 116 117 123 122 120 112 112
频数 2 11 13 4 茎 10 11 12 13 叶 7, 8 2, 7, 6, 3, 6, 8, 6, 7, 2, 2,0 6, 8, 4, 2, 7, 8, 6, 1, 0, 4, 3, 2, 0 4, 2, 3, 0
中的个体取值较多时,将样本数据恰当分组, 用各组的频率分布描述总体的分布,方法是用 频率分布表或频率分布直方图。
至10000呢?
(2)样本容量越大,这种估计越精确。
总体密度曲线
当样本容量无限增大,分组的组距无限缩小,那么 频率分布折线图就会无限接近一条光滑曲线——总体密 度曲线. 总体密度曲线
频率 组距
月均用 水量/t
Байду номын сангаас
a
b
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
总体密度曲线
2 图形的意义
频率 组距 0.5 0.4 0.3 0.2 0.1
O
宽度:组距
高度:
频率 组距
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
上图称为频率分布直方图,其中横轴 表示月均用水量,纵轴表示频率/组距 . 频率分布直方图中各小长方形的宽 度和高度在数量上有何特点?
频率/组距
理论迁移
例 某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在32~52岁的知识分子所占的比例 约是多少.
(27,32]
(32,37]
(37,42] (42,47] (47,52] (52,57] (57,62] (62,67]
(1)极差为67-28=39,取组距为5,分为8组 . 样本频率分布表:
分 组 [27,32) [32,37) [37,42) [42,47) [47,52) [52,57) [57,62) [62,67) 合 计 频数 3 3 9 16 7 5 4 3 50 频率 0.06 0.06 0.18 0.32 0.14 0.10 0.08 0.06 1.00
2.频率分布直方图
频率/组距
样本频率分布直方图接近 于一条光滑曲线——总体 密度曲线,反映了总体分 布。
产品尺寸(mm)
小结
1.总体分布指的是总体取值的频率分布规律,
由于总体分布不易知道,因此我们往往用样本
的频率分布去估计总体的分布。
2.总体的分布分两种情况:当总体中的个体取
值很少时,用茎叶图估计总体的分布;当总体
o
90
100
110
120
130
140
150
次数
频率/组距
0.036 0.032 0.028 0.024 0.020 0.016 0.012 0.008 0.004
解:1)设第一个小矩形面积为2x,样本容量为N 则有: 2 x 4 x 17 x 15 x 9 x 3x 1
x 0.02 则第二小组的频率是0.02 4=0.08
0.036 0.032 0.028 0.024 0.020 0.016 0.012 0.008 0.004
〖例2〗:为了了解高一学生的体能 情况,某校抽取部分学生进行一分钟 跳绳次数次测试,将所得数据整理 后,画出频率分布直方图(如图), 图中从左到右各小长方形面积之比 为2:4:17:15:9:3,第二小组 频数为12. •第二小组的频率是多少?样本容量 是多少? •若次数在110以上(含110次)为达 标,试估计该学校全体高一学生的 达标率是多少?
产品 频数 0.5 5 一级品 0.4 ( 1 )样本的频率分布表为: 8 二级品 (2)样本频率分布 0.3 三级品 13 的条形图为: 0.2 0.1 4 次品
0.6
解: 解:
0.7
频率
频率 0.17 0.27 0.43 0.13 产品
一级品 二级品 三级品 次品
(3)此种产品为二级品或三级品的频率约为 0.27+0.43=0.7.
A.0.2
B.0.4
C.0.5
D.0.6
6.(2013四川,7,5分)某学校随机抽取20个班, 调查各班中有上网购物经历的人数,所得数据 的茎叶图如图所示.以组距为5将数据分组成 [0,5),[5,10),…,[30,35),[35,40]时,所作的频率分 布直方图是( A )
小 结
图形 优点 缺点
思考: 频率分布条形图和频率分布直方图是两个 相同的概念吗? 有什么区别?
频率分布的条形图和频率分布直方图的区别
两者是不同的概念; 横轴:两者表示内容相同 纵轴:两者表示的内容不相同 频率分布条形图的纵轴(长方形的高)表示频率 频率分布直方图的纵轴(长方形的高)表示 频率与组距的比值, 其相应组距上的频率等于该组距上长方形的面积。
频率分布直方图如下:
频率
组距
连接频率分布直方图 中各小长方形上端的 中点,得到频率分布折 线图
0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
0.5
1 1.5 2 2.5 3
3.5 4
利用样本频分布对总体分布进行相应估计
(1)上例的样本容量为 100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增
频率分布
直方图
1)易表示大量数据
丢失一些
2)直观地表明分布地 情况 1)无信息损失 茎页图
信息 只能处理样本
2)随时记录方便记录和表示 容量较小数据
课堂小结
表示样本分布的方法:
(1)频率分布表
(2)频率分布图(包括直方图和条形图) (3)频率分布折线图 (4)茎叶图
表示样本的分布的方法: 3.频率分布折线图 1.频率分布表 样本频率分布中, 分组 个数累计 频数 频率 当样本容量无限增 大,组距无限缩小
甲 乙
50 32 87542 1 944 1
0 1 2 3 4 5
8 247 199 36 2
( 2 ) 哪名运动员的成绩好 一些?
( 1 ) 甲运动员的最高得分为51分 ,中位数为36,众数为44.
乙运动员的最高分为52分,中位数为25,众数为29. ( 2 ) 甲运动员的成绩好于乙运动员 .
3.下表一组数据是某车间30名工人加工零件的个数, 设计一个
该车间的工人加工零件数大多都在110到130 之间,且分布较对称,集中程度高,说明日 生产情况较稳定,工人的技术水平较接近。
4.某中学高一(2)班甲,乙两名同 学自高中以来每场数学考试成绩情 况如下: 甲的得分:95,81,75,91,86, 89,71,65,76,88,94 乙的得分:83,86,93,99,88, 96,98,98,79,85,97 画出两人数学成绩茎叶图,请根据 茎叶图对两人的成绩进行比较。
28,29,29,34,36,37,37, 37,38,39,39,40,41,42, 42,42,43,43,43,44,44, 44,44,45,45,45,46,46, 46,47,47,48,48,49,50, 50,51,52,52,53,54,54, 57,58,59,59,62,63,65, 67,
样本中所有数据(或数据组)的频数和 样本容量的比,叫做该数据的频率。 所有数据(或数据组)的频数的分布 变化规律叫做样本的频率分布。
频率分布的表示形式有:
①样本频率分布表 ②样本频率分布图 样本频率分布条形图 样本频率分布直方图 ③样本频率分布折线图
例 1. 为检测某种产品的质量,抽取了一个容量为 30的样本, 检测结果为一级品5件,二级品8件,三级品13件,次品4件. (1) 列出样本的频率分布表; (2) 画出表示样本频率分布的条形图; (3)根据上述结果,估计此种产品为二级品或三级品的频率 约是多少.
2.2.1 用样本的频率分 布估计总体分布
1、用样本去估计总体,是研究统计问题的一个基本思想
2、前面我们学过的抽样方法有:简单随机抽样、系统抽样、 分层抽样。要注意这几种抽样方法的联系与区别。
3、 初中时我们学习过样本的频率分布,包括频数、 频率的概念,频数分布表和频数分布直方图的制作。
1.频率分布
原始记录如下:
(1)甲运动员得分:
13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39
(2)乙运动员得分: 49,24,12,31,50,
31,44,36,15,37,25,36,39
甲
乙
8
4 6 3 3 6 8 3 8 9
0
1 2 3 4 2 5 1 4 5 4 6 1 6 7 9 9
百分比,精确地反映了总体的分布规律。是研究总
体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布
规律,即越精确地反映了总体在各个范围内取值
百分比。
茎叶图
某赛季甲、乙两名篮球运动员每场比赛得分的
1
5
0
注:中间的数字表示得分的十位数字。 旁边的数字分别表示两个人得分的 个位数。
乙的成绩要比甲的成绩好
茎叶图
当样本数据较少时,用茎叶 图表示数据的效果较好,它不但 可以保留所有的信息,而且 可以 随时记录,给数据的记录和表示 都方便。
练习:
1.右面是甲、 50 乙两名运动员 32 某赛季一些场 875421 次得分的茎叶 944 图,据图可知 ( A)
甲
乙
5
6 5 1 9 8 6 1 5 4 1
6
7 8 9 9 3 3 5 6 8 9 6 8 8 7
乙的成绩要比甲的成绩好
5.(2013重庆,6,5分)下图是某公司10个销售
店某月销售某产品数量(单位:台)的茎叶图, 则数据落在区间[22,30)内的频率为( B )
1 8 9
2
3
1
0
2
0
2
3
7
9
甲 乙
0 1 2 3 4 5
8 247 199 36 2
1
A.甲运动员的成绩好于乙运动员 B.乙运动员的成绩好于甲运动员 C.甲、乙两名运动员的成绩没有明显的差异 D.甲运动员的最低得分为0分
2.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图: ( 1 ) 甲乙两名队员的最高得分各是多少? 他们的中位数和众数各是多少?
0.34+0.3+0.18+0.06=0.88 即:若次数在110以上,该学校全体
90 100 110 120 130 140 150 次数
o
高一学生的达标率是88 0 / 0
牛刀小试:某学校组织学生参加英语测试, 成绩的频率分布直方图如图, • 数据的分组一次为 • 若低于60分的人数是15人,则该班的学生 人数是 (B ) • (A)45 (B)50 • (C) 55 (D)60
即.第二小组的频率是0.08,样本容量是150个
12 0.08 N
50 x 1
N 150个
2)第3组频率: 0.02 17=0.34 第4组频率: 0.02 15=0.3 第5组频率: 0.02 9=0.18 第6组频率: 0.02 3=0.06 则次数在110以上的频率为:
茎叶图表示这组数据,并说明这一车间的生产情况.
134 112 117 126 128 124 122 116 113 107 116 132 127 128 126 121 120 118 108 110 133 130 124 116 117 123 122 120 112 112
频数 2 11 13 4 茎 10 11 12 13 叶 7, 8 2, 7, 6, 3, 6, 8, 6, 7, 2, 2,0 6, 8, 4, 2, 7, 8, 6, 1, 0, 4, 3, 2, 0 4, 2, 3, 0
中的个体取值较多时,将样本数据恰当分组, 用各组的频率分布描述总体的分布,方法是用 频率分布表或频率分布直方图。
至10000呢?
(2)样本容量越大,这种估计越精确。
总体密度曲线
当样本容量无限增大,分组的组距无限缩小,那么 频率分布折线图就会无限接近一条光滑曲线——总体密 度曲线. 总体密度曲线
频率 组距
月均用 水量/t
Байду номын сангаас
a
b
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
总体密度曲线
2 图形的意义
频率 组距 0.5 0.4 0.3 0.2 0.1
O
宽度:组距
高度:
频率 组距
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
上图称为频率分布直方图,其中横轴 表示月均用水量,纵轴表示频率/组距 . 频率分布直方图中各小长方形的宽 度和高度在数量上有何特点?
频率/组距
理论迁移
例 某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在32~52岁的知识分子所占的比例 约是多少.
(27,32]
(32,37]
(37,42] (42,47] (47,52] (52,57] (57,62] (62,67]
(1)极差为67-28=39,取组距为5,分为8组 . 样本频率分布表:
分 组 [27,32) [32,37) [37,42) [42,47) [47,52) [52,57) [57,62) [62,67) 合 计 频数 3 3 9 16 7 5 4 3 50 频率 0.06 0.06 0.18 0.32 0.14 0.10 0.08 0.06 1.00
2.频率分布直方图
频率/组距
样本频率分布直方图接近 于一条光滑曲线——总体 密度曲线,反映了总体分 布。
产品尺寸(mm)
小结
1.总体分布指的是总体取值的频率分布规律,
由于总体分布不易知道,因此我们往往用样本
的频率分布去估计总体的分布。
2.总体的分布分两种情况:当总体中的个体取
值很少时,用茎叶图估计总体的分布;当总体
o
90
100
110
120
130
140
150
次数
频率/组距
0.036 0.032 0.028 0.024 0.020 0.016 0.012 0.008 0.004
解:1)设第一个小矩形面积为2x,样本容量为N 则有: 2 x 4 x 17 x 15 x 9 x 3x 1
x 0.02 则第二小组的频率是0.02 4=0.08
0.036 0.032 0.028 0.024 0.020 0.016 0.012 0.008 0.004
〖例2〗:为了了解高一学生的体能 情况,某校抽取部分学生进行一分钟 跳绳次数次测试,将所得数据整理 后,画出频率分布直方图(如图), 图中从左到右各小长方形面积之比 为2:4:17:15:9:3,第二小组 频数为12. •第二小组的频率是多少?样本容量 是多少? •若次数在110以上(含110次)为达 标,试估计该学校全体高一学生的 达标率是多少?
产品 频数 0.5 5 一级品 0.4 ( 1 )样本的频率分布表为: 8 二级品 (2)样本频率分布 0.3 三级品 13 的条形图为: 0.2 0.1 4 次品
0.6
解: 解:
0.7
频率
频率 0.17 0.27 0.43 0.13 产品
一级品 二级品 三级品 次品
(3)此种产品为二级品或三级品的频率约为 0.27+0.43=0.7.
A.0.2
B.0.4
C.0.5
D.0.6
6.(2013四川,7,5分)某学校随机抽取20个班, 调查各班中有上网购物经历的人数,所得数据 的茎叶图如图所示.以组距为5将数据分组成 [0,5),[5,10),…,[30,35),[35,40]时,所作的频率分 布直方图是( A )
小 结
图形 优点 缺点
思考: 频率分布条形图和频率分布直方图是两个 相同的概念吗? 有什么区别?
频率分布的条形图和频率分布直方图的区别
两者是不同的概念; 横轴:两者表示内容相同 纵轴:两者表示的内容不相同 频率分布条形图的纵轴(长方形的高)表示频率 频率分布直方图的纵轴(长方形的高)表示 频率与组距的比值, 其相应组距上的频率等于该组距上长方形的面积。
频率分布直方图如下:
频率
组距
连接频率分布直方图 中各小长方形上端的 中点,得到频率分布折 线图
0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
0.5
1 1.5 2 2.5 3
3.5 4
利用样本频分布对总体分布进行相应估计
(1)上例的样本容量为 100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增
频率分布
直方图
1)易表示大量数据
丢失一些
2)直观地表明分布地 情况 1)无信息损失 茎页图
信息 只能处理样本
2)随时记录方便记录和表示 容量较小数据
课堂小结
表示样本分布的方法:
(1)频率分布表
(2)频率分布图(包括直方图和条形图) (3)频率分布折线图 (4)茎叶图
表示样本的分布的方法: 3.频率分布折线图 1.频率分布表 样本频率分布中, 分组 个数累计 频数 频率 当样本容量无限增 大,组距无限缩小
甲 乙
50 32 87542 1 944 1
0 1 2 3 4 5
8 247 199 36 2
( 2 ) 哪名运动员的成绩好 一些?
( 1 ) 甲运动员的最高得分为51分 ,中位数为36,众数为44.
乙运动员的最高分为52分,中位数为25,众数为29. ( 2 ) 甲运动员的成绩好于乙运动员 .
3.下表一组数据是某车间30名工人加工零件的个数, 设计一个
该车间的工人加工零件数大多都在110到130 之间,且分布较对称,集中程度高,说明日 生产情况较稳定,工人的技术水平较接近。
4.某中学高一(2)班甲,乙两名同 学自高中以来每场数学考试成绩情 况如下: 甲的得分:95,81,75,91,86, 89,71,65,76,88,94 乙的得分:83,86,93,99,88, 96,98,98,79,85,97 画出两人数学成绩茎叶图,请根据 茎叶图对两人的成绩进行比较。
28,29,29,34,36,37,37, 37,38,39,39,40,41,42, 42,42,43,43,43,44,44, 44,44,45,45,45,46,46, 46,47,47,48,48,49,50, 50,51,52,52,53,54,54, 57,58,59,59,62,63,65, 67,
样本中所有数据(或数据组)的频数和 样本容量的比,叫做该数据的频率。 所有数据(或数据组)的频数的分布 变化规律叫做样本的频率分布。
频率分布的表示形式有:
①样本频率分布表 ②样本频率分布图 样本频率分布条形图 样本频率分布直方图 ③样本频率分布折线图
例 1. 为检测某种产品的质量,抽取了一个容量为 30的样本, 检测结果为一级品5件,二级品8件,三级品13件,次品4件. (1) 列出样本的频率分布表; (2) 画出表示样本频率分布的条形图; (3)根据上述结果,估计此种产品为二级品或三级品的频率 约是多少.
2.2.1 用样本的频率分 布估计总体分布
1、用样本去估计总体,是研究统计问题的一个基本思想
2、前面我们学过的抽样方法有:简单随机抽样、系统抽样、 分层抽样。要注意这几种抽样方法的联系与区别。
3、 初中时我们学习过样本的频率分布,包括频数、 频率的概念,频数分布表和频数分布直方图的制作。
1.频率分布
原始记录如下:
(1)甲运动员得分:
13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39
(2)乙运动员得分: 49,24,12,31,50,
31,44,36,15,37,25,36,39
甲
乙
8
4 6 3 3 6 8 3 8 9
0
1 2 3 4 2 5 1 4 5 4 6 1 6 7 9 9