2.2.1(1)用样本的频率分布估计总体分布
人教高中数学必修三2.2.1用样本的频率分布估计总体分布课件
频率散布直方图以面积的情势反应了数据落在 各个小组的频率的大小.
作业
1、课时训练 P73 2、探究咱班学生的身高
散布情况 3、探究频率散布折线图和
总密度曲线
频率 组距 0.5 0.4 0.3 0.2 0.1
宽度:组距
高度:
频率 组距
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
画频率散布直方图
频率/组距
注意:
① 这里的纵坐标不是频率, 而是频率/组距;
0.50 0.40
0.50 ② 某个区间上的频率用
0.44
这个区间矩形的面积表示;
2.2.1用样本的频率散布 估计总体散布
学习目标
1、理解并学会画频率散布表; 2、掌握频率散布直方图的画法,
并能理解在频率散布直方图 中用面积表示频率。
一、复习回顾
1.我们已经学习了哪些抽样的方法?
简单随机抽样
系统抽样
分层抽样
随机抽样是收集数据的方法,如何通过 样本数据所包含的信息,估计总体的基 本特征,即用样本估计总体,是我们需 要进一步学习的内容.
二、样本估计总体的方法
一般分成两种: ①用样本的频率散布估计总体的散布. ②用样本的数字特征(如平均数、标准差 等)估计总体的数字特征.
• 我国是世界上严重缺水的国家之一。
如何划在本市试
行居民生活用水定额管理,即确定一个居民月用 水量标准a , 用水量不超过a的部分按平价收费,超 过a的部分按议价收费。
思考:由上表,大家可以得到什么信息?
三、样本分析
一般通过表、图、计算来分析 数据,帮助我们找出样本数据中的 规律,使数据所包含的信息转化成 直观的容易理解的情势。
课件5:2.2.1 用样本的频率分布估计总体分布
(1)数形结合思想是中学数学很重要的思想方法,是高考的重点 考查内容之一,是根据数据的结构特征,构造出与之相应的几 何图形,并利用图形的特性和规律,解决问题. (2)画茎叶图时,用中间的数表示数据的十位和百位数,两边的 数分别表示两组数据的个位数.要先确定中间的数取数据的哪 几位,填写数据时边读边填.比较数据时从数据分布的对称性、 稳定性等几方面来比较.
9
0.225
14
0.35
3
0.075
[173.5,177.5)
3
0.075
[177.5,181.5]
1
0.025
合计
40
1
(2)频率分布直方图如图所示.
本例中,画出相应的频率分布折线图. 解:连接频率分布直方图中各小长方形上端的中点,就得到频 率分布折线图如下:
(1)在列频率分布表时,极差、组距、组数有如下关系 ①若极 组差 距为整数,则极 组差 距=组数; ②若极 组差 距不为整数,则极 组差 距的整数部分+1=组数.
合计
频数 3 9 13 16 26 20 7 4 2 100
频率 0.03 0.09 0.13 0.16 0.26 0.20 0.07 0.04 0.02 1.00
(2)频率分布直方图及频率分布折线图,如图.
(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为 1- (0.03 + 0.09) - (0.07 + 0.04 + 0.02) = 0.75 = 75% , 即 数 据 落 在 [10.95,11.35)范围内的可能性是 75%. (4)数据小于 11.20 的可能性即数据小于 11.20 的频率,设为 x, 则(x-0.41)÷(11.20-11.15)=(0.67-0.41)÷(11.25-11.15), 所以 x-0.41=0.13,即 x=0.54, 从而估计数据小于 11.20 的可能性是 54%.
2.2.1用样本的频率分布估计总体分布课件人教新课标
4. 茎叶图的概念 茎是指 中间的一列数 ,叶就是从茎的旁边生长出 来的数.茎叶图可用来分析单组数据,也可以对两组数 据进行比较.茎叶图不仅能够保留原始数据,而且能够 展示数据的散布情况.
【常考题型】
列频率散布表、画频率散布直方图 [例 1] 考察某校高二年级男生的身高,随机抽取 40 名 高二男生,实测身高数据(单位:cm)如下: 171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 160 168 174 165 168 174 159 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161 (1)作出频率分布表; (2)画出频率分布直方图和频率分布折线图.
(2)频率分布直方图和频率分布折线图如图所示:
(3)样本数据不足 0 的频率为: 0.035+0.055+0.075+0.2=0.365.
频率散布直方图的应用
[例 2] (1)某班 50 名学生在一次百米跑 测试中,成绩全部介于 13 s 与 19 s 之间,将 测试结果按如下方式分成六组:第一组,成 绩大于等于 13 s 且小于 14 s;第二组,成绩 大于等于 14 s 且小于 15 s;…;第六组,成 绩大于等于 18 s 且小于等于 19 s,如图所示是按上述分组方法 得到的频率分布直方图.设成绩小于 17 s 的学生人数占全班 总人数的百分比为 x,成绩大于等于 15 s 且小于 17 s 的学生人 数为 y,则从频率分布直方图(如图所示)中分析出 x 和 y 分别 为( )
3.如图是一个班的语文成绩的茎叶图(单位:分),则优秀率(90 分以上)是________,最低分是________.
2.2.1 用样本的频率分布估计总体分布(1)
0.020 0.053 0.060 0.073 0.067 0.033 0.027
频率分布直方图如下:
频率 组距 0.070 0.060 0.050
0.040
0.030 0.020 0.010
12.5 15.5
练习
1. 已知一组数据如下: 25 21 23 25 27 29 25 28 30 29 26 24 25 27 26 22 24 25 26 28 填写下面的频率分布表,绘出频率分布直方图. 组别 频数累计 频数 频率
率,你能用公式表示出样本容量、频数 和频率之间的关系吗?各组的频数和等 于几?各组的频率和呢?
(1) f i
ti n
(2)t1 t 2 ... t n n
(3) f 1 f 2 ... f n 1
小结
画频率分布直方图的步骤
1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1 2、决定组距与组数(将数据分组) 组距:指每个小组的两个端点的距离,组距 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 组数= 极差 4.1 8.2 3、 将数据分组(8.2取整,分为9组)
例2 有一个容量为50的样本数据的分组的频数
如下: [12.5, 15.5) 3
[15.5, 18.5) [18.5, 21.5) 8 9
[24.5, 27.5) [27.5, 30.5)
10 5
[30.5, 33.5)
4
[21.5, 24.5) 11
(1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少?
2.2.1用样本的频率分布估计总体分布
分 组 [0,0.5) [0,0.5) [0.5, [0.5,1) [1,1.5) [1,1.5) [1.5, [1.5,2) [2,2.5) [2,2.5) [2.5, [2.5,3) [3,3.5) [3,3.5) [3.5, [3.5,4) [4, [4,4.5] 合计
频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100
1.9 0.3 0.5 0.6 0.8 0.7 0.9 0.5 0.8 0.6
1.6 0.4 3.8 4.1 4.3 2.0 2.3 2.4 2.4 2.2
思考1 上述100个数据中的最大值和最 思考1:上述100个数据中的最大值和最 100 小值分别是什么? 小值分别是什么?由此说明样本数据的 变化范围是什么? 变化范围是什么? 0.2~ 0.2~4.3 思考2:样本数据中的最大值和最小值 思考2 的差称为极差 如果将上述100 极差. 100个数据 的差称为极差.如果将上述100个数据 组距为0.5进行分组 进行分组, 按组距为0.5进行分组,那么这些数据 共分为多少组? 共分为多少组? 4.3-0.2) (4.3-0.2)÷0.5=8.2
上图称为频率分布直方图, 上图称为频率分布直方图,其中横轴 频率分布直方图 表示月均用水量,纵轴表示频率/组距. 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高 度在数量上有何特点? 度在数量上有何特点?
思考2 思考2:频率分布直方图中各小长方形的 面积表示什么? 面积表示什么?各小长方形的面积之和 为多少? 为多少?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5
2.2.1用样本的频率分布估计总体分布
2018/3/9
5、观察新生婴儿的体重,其频率分布直方图
如图所示,则新生婴儿体重(2700,3000)的频
率为: 0.3 y ;
0.001
2400 2700 3000 3300 3600 3900
2018/3/9
X
体重
6.为了了解某地区高三学生的身体发育情况,抽 查了该地区100名年龄为17.5岁-18岁的男生体重 (kg) ,得到频率分布直方图如下:
7.5~9.5 9.5~11.5
11.5~13.5 合计来自6 84 20
0.3 0.4
0.2 1.0
4、一个容量为20的样本数据.分组后.各组与频 数如下:(0,20] 2;(20,30] 3, (30,40] 4; (40,50] 5; (50,60] 4; (60,70] 2 。则样 7/10 , 本在(0,50]上的频率为:
频率分布表、频率分布直方图和折线图 的主要作用是表示样本数据的分布情况,此 外,我们还可以用茎叶图来表示样本数据的 分布情况.
2018/3/9
一般地, 画出一组样本数据的茎叶图的步骤如 何?
第一步,将每个数据分为“茎”(高位)和“叶” (低位)两部分;
第二步, 将最小的茎和最大的茎之间的数按大 小次序排成一列,写在左(右)侧;
频率/组距
0.07
0.05
0.03
体重(kg)
54.5 58.5 62.5 66.5 70.5 74.5
根据上图可得这100名学生中体重在[56.5,64.5] 的学生人数是( C ) A. 20 B. 30 C. 40 D. 50
2018/3/9
7.一个容量为100的样本,数据的分组和各组的相 关信息如下表,试完成表中每一行的两个空格.
用样本估计总体2.2.1用样本的频率分布估计总体分布说课讲解
[24.5, 27.5) 10 [27.5, 30.5) 5 [30.5, 33.5) 4
[21.5, 24.5) 11
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计,数据落在[15.5, 24.5)的 百分比是多少?
2.决定组距与组数:组数= 极差 = 组距
4.1 0.5
=
8.2
3.将数据分组
[0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
100位居民月平均用水量的频率分布表
5.画频率分布直方图
频率/组距
0.50 0.40 0.30 0.20 0.10
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
说明:(1)确定分点时,使分点比数据多一位小数,并且把第1小组的起点 稍微再小一点.
频率分布直方图如下:
频率
连接频率分布直方图
组距
中各小长方形上端的
中点,得到频率分布折
线图
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
总体密度曲线
频率 组距
用样本估计总体
2.2.1用样本的频率分布估计总体分布
统计的基本思想方法:
用样本估计总体,即通常不直接去研究总体, 而是通过从总体中抽取一个样本,根据样本的 情况去估计总体的相应情况.
具体步骤
一是如何从总体中抽取样本?
二是如何根据对样本的整理、计算、分析, 对总体的情况作出推断.(1、用样本频率分布 估计总体分布,2、用样本的某种数字特征 (例如平均数、方差等)去估计总体的相应数 字特征。)
课件6:2.2.1 用样本的频率分布估计总体的分布
[思路探索] 根据画频率分布直方图的步骤先画频率分布直方图,再 画折线图.
解 (1)频率分布表如下:
分组
频数 频率
[10.75,10.85)
3Байду номын сангаас
0.03
[10.85,10.95)
9
0.09
[10.95,11.05) [11.05,11.15) [11.15,11.25) [11.25,11.35) [11.35,11.45) [11.45,11.55) [11.55,11.65]
题型二 频率的分布直方图的应用 例2.(1)为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出 了自己的零花钱,他们捐款数(单位:元)如下:19,20,25,30,24, 23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主 任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图 时先计算最大值与最小值的差是________.若取组距为2,则应分成 ________组;若第一组的起点定为18.5,则在[26.5,28.5)内的频数为 ________. (2)将容量为100的某个样本数据拆分为10组,若前七组的频率之和为0.79, 而剩下的三组中频率依次相差0.05,则剩下的三组中频率最大的一组的 频率为________.
(4)数据小于11.20的可能性即数据小于11.20的频率,设为x, 则(x-0.41)÷(11.20-11.15) =(0.67-0.41)÷(11.25-11.15), 所以x-0.41=0.13,即x=0.54, 从而估计数据小于11.20的可能性是54%.
变式3.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年 就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就 任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥 巴马,共44任)给出了历届美国总统就任时的年龄: 57,61,57,57,58,57,61,54,68,51,49,64,50,48, 65,52,56,46,54,49,51,47,55,55,54,42,51,56, 55,51,54,51,60,62,43,55,56,61,52,69,64,46, 54,48 (1)将数据进行适当的分组,并画出相应的频率分布直方图和频率 分布折线图. (2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
课件4:2.2.1 用样本的频率分布估计总体的分布
3.茎叶图中数据的茎和叶的划分,可根据样本数据的特 点灵活决定.
Thank you!
(1)列出频率分布表:
寿命 100~200 200~300 300~400 400~500 500~600 合计
频数 20
30 80 40 30 200
频率 0.10 0.15 0.40 0.20 0.15
1
(2)画出频率分布直方图: 频率/组距
累积频率 0.10 0.25 0.65 0.85 1
[15.5,18.5) 3
[18.5,21.5) 9
[21.5,24.5) 11
[24.5,27.5) 10
[27.5,30.5) 5
[30.5,33.5] 4
频率 0.06 0.16 0.18 0.22 0.20 0.10 0.08
频率/ 组距 0.020 0.053 0.060 0.073 0.067 0.033 0.027
对于样本数据:31,25,20,8,15,10,43,27,31, 35,如何用茎叶图表示?
茎叶
08 1 05 2 057 3 115 43
实例3 某篮球运动员在某赛季各场比赛中的得分情况如下: 12,15,24,25,31,31,36,36,37,39,44,49,50
茎叶图:
1
2
茎:表示
3
十位数字
2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体的分布
1.用样本估计总体是研究统计问题的一基本思想. 2.前面学过的抽样方法有: 简单随机抽样、系统抽样、分 层抽样. 要注意这几种抽样方法的联系与区别. 3.初中时我们学习过样本的频率分布,包括频数、频率的 概念,频数分布表和频数分布直方图的制作.
2.2.1 用样本的频率分布估计总体分布 课件(人教A版必修3) (1)
)
【做一做 2-2】 在画频率分布直方图时, 某组的频数为 10, 样本容量为 50, 总体容量为 600, 则该组的频率是( A.
1 5
) C.
1 10
B.
1 6 10 1
D.不确定
解析: 该组的频率是50 = 5. 答案: A
3.频率分布折线图和总体密度曲线 ( 1) 类似于频数分布折线图, 连接频率分布直方图中各个小长方形上端的中 点, 就得到频率分布折线图. 一般地, 当总体中的个体数较多时, 抽样时样本容量就不能太小.例如, 如果 要抽样调查一个省乃至全国的居民的月均用水量, 那么样本容量就应比调查一 个城市的时候大.可以想像, 随着样本容量的增加, 作图时所分的组数增加, 组距 减小, 相应的频率折线图会越来越接近于一条光滑曲线, 统计中称这条光滑曲线 为总体密度曲线.
频率分布折线图反映了数据的变化趋势.总体密度曲线反映了总体在各个范围 内取值的百分比, 它能给我们提供更加精细的信息.
( 2) 估计方法: 实际上, 尽管有些总体密度曲线是客观存在的, 但是在实际应 用中我们并不知道它的具体表达形式, 需要用样本来估计.由于样本是随机的, 不同的样本得到的频率分布折线图不同; 即使对于同一个样本, 不同的分组情况 得到的频率分布折线图也不同.频率分布折线图是随样本容量和分组情况的变 化而变化的, 因此不能用样本的频率分布折线图得到准确的总体密度曲线.
2.2
用样本估计总体
2.2.1
用样本的频率分布估计总体分布
1.了解分析数据的方法,知道估计总体频率分布的方法. 2.了解频率分布折线图和总体密度曲线,会画频率分布直方图和茎叶图. 3.理解频率分布直方图和茎叶图及其应用.
1.分析数据的方法 ( 1) 借助于图形. 用图将各个数据画出来, 作图可以达到两个目的, 一是从数据中提取信息; 二是利用图形传递信息. ( 2) 借助于表格. 用紧凑的表格改变数据的构成方式, 为我们提供解释数据的新方式.
2.2.1用样本的频率分布估计总体分布(1)
只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性. 频率分布直方图非常直观地表明了样本数据的分布情况, 使我们能够看到频率分布表中看不太清楚的数据模式,但 原始数据不能在图中表示出来.
准a,用水量不超过a的部分按平价收费,超出a的部分按
议价收费. 那么a定为多少比较合理呢?你认为,为了较为合理地确 定出这个标准,需要做哪些工作?
100位居民的月均用水量(单位:t)
3.1 2.6 2.3 2.2 1.8 1.3 1.3 1.5 0.8 2.2 2.5 2.2 2.1 1.7 1.4 1.4 1.6 0.5 2.4 2.0 2.2 1.6 1.3 3.5 1.8 0.9 2.4 2.8 2.0 1.5 1.2 3.6 1.9 0.7 2.3 2.5 2.5 1.5 1.2 3.7 1.7 0.8 2.0 2.6 2.6 2.2 1.0 0.2 1.5 0.6 4.3 2.5 2.7 2.3 2.0 1.6 0.4 0.5 4.1 3.0 2.8 2.4 2.1 1.5 1.8 0.3 3.8 3.2 2.9 2.3 2.1 1.6 1.0 1.9 0.4 3.3 2.9 2.4 2.3 1.7 1.0 1.2 1.6 3.2 2.8 2.4 2.4 1.8 1.4 1.0 1.8 3.4 2.7 2.3 2.3 1.9 1.3 1.2 1.7 0.6
(5)频率分布直方图 第一步:画平面直角坐标系. 第二步:在横轴上均匀标出各组分点,在纵轴上标出单 位长度. 第三步:以组距为宽,各组的频率与组距的商为高,分 别画出各组对应的小长方形.
频率 组距 0.5 0.4 0.3 0.2 0.1
(人教b版)数学必修三练习:2.2.1(第1课时)用样本的频率分布估计总体的分布1(含答案)
第二章 2.2 2.2.1 第1课时一、选择题1.从某批零件中抽出若干个,然后再从中抽出40个进行合格检查,发现合格产品有36个,则该批产品的合格率为( )A .36%B .72%C .90%D .25%[答案] C[解析] 用样本的合格率近似代替总体的合格率为3640×100%=90%.2.在用样本估计总体分布的过程中,下列说法正确的是( ) A .总体容量越大,估计越精确 B .总体容量越小,估计越精确 C .样本容量越大,估计越精确 D .样本容量越小,估计越精确 [答案] C[解析] 用样本估计总体分布时,样本容量越大,估计越精确.3.(2013·重庆文,6)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )1 8 92 1 2 2 7 9 30 0 3A.0.2 B .0.4 C .0.5 D .0.6[答案] B[解析] 由题意知,这10个数据落在区间[22,30)内的有22,22,27,29,共4个,∴其频率为410=0.4,故选B4.(2013·辽宁理,5)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A.45 B.50C.55 D.60[答案] B[解析] 根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,∴该班的学生人数是150.3=50.5.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其他7个小长形的面积和的14,且样本容量为200,则第8组的频数为( )A.40 B.0.2C.50 D.0.25[答案] A[解析] 设最后一个小长方形的面积为x,则其他7个小长方形的面积为4x,从而x+4x=1,所以x=0.2.故第8组的频率为200×0.2=40.6.一个容量为20的样本数据分组后,组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2.则样本在(-∞,50]上的频率为( ) A.90% B.70%C.50% D.25%[答案] B[解析] 样本在(-∞,50]上的频数为2+3+4+5=14,故在(-∞,50]上的频率为14÷20=70%,故选B.二、填空题7.(2013·湖北理,11)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示________.(1)直方图中x的值为________.(2)在这些用户中,用电量落在区间[100,250]内的户数为________.[答案] (1)0.004 4 (2)70[解析] 本题考查频率分布直方图和用样本估计总体.∵50×(0.002 4+0.003 6+0.006+x+0.002 4+0.0012)=1,∴x=0.0044.用户在区间[100,250]内的频率为50×(0.003 6+0.006+0.004 4)=0.7,∴户数为100×0.7=70(户).点评:频率分布直方图中各个小矩形的面积之和为1.8.(2014·江苏,6)为了解一处经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.[答案] 24[解析] 由题意在抽测的60株树木中,底部周长小于100cm的株数为(0.015+0.025)×10×60=24.三、解答题9.为了了解商场某日旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得的数据整理后,画出频率分布直方图(如图所示).已知从左至右前3个小组的频率之比为123,第4小组与第5小组的频率分别为0.175和0.075,第二小组的频数为10,求抽取顾客多少人?[解析] 前三组频率和为1-0.075-0.175=0.75.又前三组频率之比为123,所以第二组频率为 26×0.75=0.25.又知第二组频数为10,则100.25=40(人),故所抽取顾客为40人.一、选择题1.某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重(单位: g)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100 g 的个数是36,则样本中净重大于或等于98 g 并且小于104 g 的产品个数是( )A .90B .75C .60D .45[答案] A[解析] 本小题主要考查了频率分布直方图,考查了读图用图的能力.产品净重小于100 g 的频率P =(0.050+0.10)×2=0.3,设样本容量为n ,由已知36n=0.3,∴n =120.而净重大于或等于98 g 而小于104 g 的产品的频率P ′=(0.100+0.150+0.125)×2=0.75.∴个数为0.75×120=90.故选A.2.(2014·山东理,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6 B.8 C.12 D.18 [答案] C[解析] 第一、二两组的频率为0.24+0.16=0.4,∴志愿者的总人数为200.4=50(人).第三组的人数为:50×0.36=18(人),有疗效的人数为18-6=12(人).二、填空题3.一个社会调查机构就某地居民的月收入调查10 000人,并根据所得数据画了样本的频率分布直方图(如图所示).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.[答案] 25[解析] 从10 000人中用分层抽样的方法抽出100人,∴抽取比例为100 1.由图可知,0.000 5×500×10 000=2 500,∴月收入在[2 500,3 000)内的人数为2 500人,∴从中应抽出2 500×1100=25(人).4.从某自动包装机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g) 492 496 494 495 498497 501 502 504 496497 503 506 508 507492 496 500 501 499根据频率分布估计总体分布的原理,该自动包装机包装的袋盐食盐质量在497.5g~501.5g之间的概率约为____________.[答案] 0.25[解析] 袋装食盐质量在497.5~501.5g之间的共有5袋,所以其概率为520=0.25.三、解答题5.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午800~1000间各自的点击量,得如图所示的茎叶图.根据统计图:(1)甲、乙两个网站点击量s的极差分别是多少?(2)甲网站点击量在[10,40]间的频率是多少?(3)甲、乙两个网站哪个更受欢迎?并说明理由.[解析] (1)甲网站的极差为:73-8=65;乙网站的极差为:71-5=66.(2)甲网站点击量在[10,40]间的频率为414=27=0.285 71.(3)甲网站的点击量集中在茎叶图的下方(较大),而乙网站的点击量集中在茎叶图的上方(较小).从数据的分布情况来看,甲网站更受欢迎.6.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高:(单位:cm)区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)[146,150)[150,154)[154,158)人数58102233201165(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.[解析] (1)样本频率分布表如下:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201(2)(3)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.希望对大家有所帮助,多谢您的浏览!。
2.2.1用样本的频率分布估计总体分布(1)
1.画频率分布直方图的基本步骤:
1.求极差
4.3 - 0.2 = 4.1
一组数据中最大值与最小值的差
2.决定组距与组数
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
组距:指每个小组的两个端点的距离,
3.将组数数据= 分组极组距差(=左40闭..15右=开8).2 [0,0.5 ),[0.5,1 ),…,[4,4.5]
=频率
∴在频率直方图中,各小矩形的面积的总和等于1.
频率分布条形图和频率分布直方图是两个 相同的概念吗? 有什么区别?
频率分布的条形图和频率分布直方图的区别
两者是不同的概念; 横轴:两者表示内容相同 纵轴:两者表示的内容不相同 频率分布条形图的纵轴(长方形的高)表示频率 频率分布直方图的纵轴(长方形的高)表示频率与 组距的比值。
[40,50),2;[50,60),3;[60,70),10; [70,80),15;[80,90),12;[90,100],8;
(1)列出样本的频率分布表;
(2)画出频率分布直方图.
解析:(1)样本的频率分布表如下
成绩分组 [40,50) [50,60) [60,70) [70,80) [80,90) [90,100] 合计
例 3.世界卫生组织指出青少年的身体健康状况是一个应该引 起大家足够重视的问题,某校为了解学生的体能情况,抽取了一 个年级的部分学生进行一分钟跳绳测试.将所得数据整理后,画 出了频率分布直方图,如图所示.已知图中从左到右前三个小组 的频率分别为 0.1,0.3,0.4,第一小组的频数为 5.
(1)求第四小组的频率; (2)求参加这次测试的学生人数是多少? (3)若在 75 次以上(含 75 次)为达标,试估计该年级学生跳绳 测试的达标率是多少?
人教a版必修三:《2.2.1用样本的频率分布估计总体分布(1)》ppt课件(38页)
填要点、记疑点
主目录
探要点、究所然
当堂测、查疑缺
探要点、究所然
2.2.1(一)
探究点二:频率分布直方图
跟踪训练 2 下表给出了某校 500 名 12 岁男孩中用随机抽样得出的 120 人的身高(单位:cm).
区间界限 人数 区间界限 人数
[122,126) [126,130) [130,134) [134,138) [138,142) 5 8 10 22 33
明目标、知重点
填要点、记疑点
主目录
探要点、究所然
当堂测、查疑缺
探要点、究所然
2.2.1(一)
探究点一:频率分布表
分组 [150.5,153.5) [153.5,156.5) [156.5,159.5) [159.5,162.5) [162.5,165.5) [165.5,168.5) [168.5,171.5) [171.5,174.5)
主目录
频率 0.025 0.075 0.15 0.225 0.35 0.075 0.075 0.025 1
探要点、究所然 当堂测、查疑缺
探要点、究所然
2.2.1(一)
探究点二:频率分布直方图
(2)频率分布直方图如图所示.
明目标、知重点
填要点、记疑点
主目录
探要点、究所然
当堂测、查疑缺
探要点、究所然
明目标、知重点 填要点、记疑点
频数 5 8 10 22 33 20 11 6 5 120
主目录
频率 0.04 0.07 0.08 0.18 0.28 0.17 0.09 0.05 0.04 1
探要点、究所然 当堂测、查疑缺
探要点、究所然
2.2.1(一)
原创1:2.2.1用样本的频率分布估计总体分布
典例精析
类型之一:列频率分布表、画频率分布直方图、频率分布折线图
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分 布折线图.
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
典例精析
类型之一:列频率分布表、画频率分布直方图、频率分布折线图
典例精析
类型之一:列频率分布表、画频率分布直方图、频率分布折线图
典例精析
类型之二:茎叶图的制作及应用
3.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17 ,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11, 24,27,17. 在某报纸的一篇文章中,每个句子的字数如下: 27,39,33,24,28,19,32,41,33,27,36,23,36,41,27,13,22,23,18,46,32, 22. (1)将这两组数据用茎叶图表示. (2)将这两组数据进行比较分析,得到什么结论?
以这100名学生中体重在[56.5,64.5)的学生人数是100×0.4=40.
课堂练习
4. 甲、乙两个小组各10名学生的英语口语测试成绩如下(单位:分): 甲组:76 90 84 86 81 87 86 82 85 83 乙组:82 84 85 89 79 80 91 89 79 74 用茎叶图表示两个小组的成绩,并判断哪个小组的成绩更整齐一些.
主题导学
主题4:茎叶图的制作步骤
主题导学
主题4:茎叶图的制作步骤
1.茎叶图对重复的数据如何处理? 提示:重复记录,不能遗漏. 2.茎叶图可以表示三位数数据吗?如何表示? 提示:可以,这时茎表示前两位数,叶表示最后一位数.
典例精析
类型之一:列频率分布表、画频率分布直方图、频率分布折线图
2.2.1用样本的频率分布估计总体分布(1)
复习回顾:
1、什么是简单随机抽样?什么样的总体 适宜简单随机抽样?
2、什么是系统抽样?什么样的总体适宜 系统抽样?
3、什么是分层抽样?什么样的总体适宜 分层抽样?
统计原则
由总体合理抽取样本
由样本科学推断 、估计总体
这种估计一般分成两种: ①是用样本的频率分布估计总体的分布. ②是用样本的数字特征(如平均数、标准差 等)估计总体的数字特征.
分成5~12组.
为方便组距的选择应力求“取整”.
本题如果组距为0.5(t). 则 组数= 极差 4.1 8.2 所以将数据分成9组较合适. 第三步: 将数据分组:( 给出组的界限)
组距 0.5
[0, 0.5), [0.5, 1), [1, 1.5),……[4, 4.5) 共9组.
第四步: 列频率分布表. 分组 频数累计
(3)根据国家标准,污染指数在0~50之间时,空气质量为
优;在51~100之间时,为良;在101~150之间时,为轻 微污染;在151~200之间时,为轻度污染.请你依据所给
数据和上述标准,对该市的空气质量给出一个简短评价.
【练习2】 为了了解高一年级学生的体能情况,某校抽取部分 学生进行一分钟跳绳次数测试,将所得数据整理后,画出 频率分布直方图(如图所示),图中从左到右各小长方形的 面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
解 (1)最低身高151 cm,最高身高180 cm,它们的差是 180-151=29,即极差为29;确定组距为4,组数为8,列 频率分布表如下:
分组 [149.5,153.5) [153.5,157.5) [157.5,161.5) [161.5,165.5) [165.5,169.5) [169.5,173.5) [173.5,177.5) [177.5,181.5] 合计 频数 1 3 6 9 14 3 3 1 40 频率 0.025 0.075 0.15 0.225 0.35 0.075 0.075 0.025 1
教学设计1:2.2.1 用样本的频率分布估计总体的分布
2.2.1 用样本的频率分布估计总体的分布三维目标1.知识与技能(1)通过实例体会分布的意义和作用.(2)在表示样本数据的过程中学会列频率分布表画频率分布直方图,通过实例体会频率分布直方图的特征.2.过程与方法(1)会根据具体的样本特征选择合适的方式来表示样本分布.(2)能通过对数据的分析为合理决策提供依据,体会统计在现实生活中的作用.(3)能通过对现实生活中的问题的探究感知应用数学知识解决问题的方法及统计的思想、方法.3.情感、态度与价值观(1)通过对数据分析,为合理决策提供依据,初步感受统计结果的随机性与规律性,体会统计思想与确定性思维的差异.(2)通过样本频率分布直方图,对总体估计的过程进一步体会统计思想,感受数学对实际生活的应用及对实际问题解决的指导作用,体会数学知识与现实生活的联系.重点难点通过以上分析,确定本节课教学的重点是:会列频率分布表,画频率分布直方图.教学难点是:能通过样本的频率分布估计总体的分布.教学时要抓知识选择的切入点,从学生原有的认知水平和所需的知识特点入手,引导学生结合初中学习过的频率知识,不断地观察、比较、分析,采用分组讨论的方式,学生独立画出频率分布直方图,明确其特征,学会对总体进行估计,同时引导学生进行解题方法的总结从而化解难点.引导学生回答所提问题,学生通过小组讨论,教师指导以及对例题的研究与分析,学会列频率分布表,画频率分布直方图从而强化了重点.教学建议通过对现实生活中实际例子的讲解,以及前面知识的回顾,教会学生观察——猜想——发现——概括(归纳)的学习方法,让学生进一步了解“转化”的数学思想方法,在教学中培养学生的逻辑思维能力和空间想象能力,并在教学中逐步提高学生论证问题的能力.根据本节内容较抽象,学生不易理解的特点,本节教学采用启发式教学,辅以观察法、发现法、讲练结合法.采用这种方法的原因是高一学生的领会思想的能力比较差,通过对现实生活中实际例子的讲解,以及前面知识的回顾,使其理解并掌握本节知识.本节课让学生通过熟知的一组数据的代表-众数,中位数,平均数下,并辅以计算器、多媒体手段,通过一定手脑结合的训练,让学生感受在只能得到频率分布直方图的情况下也可以估计总体数字特征.在课堂结构上,根据学生的认知水平,采取“仔细观察—分析研究—小组讨论—总结归纳” 的方法,使知识的获得与知识的发生过程环环相扣,层层深入,从而顺利完成教学目标.教学流程课标解读1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.(重点) 3.能够利用图形解决实际问题.(难点)知识1频率分布直方图【问题导思】美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51, 54,51,60,62,43,55,56,61,52,69,64,46,54,481.上述44个数据中最大值与最小值的差是多少?【提示】69-42=27.2.若将上述数据分成下列几组,[41.5,45,5),[45.5,49.5),[49.5,53.5),[53.5,57.5),[57.5,61.5)[61.5,65.5),[65.5,69.5).各组中数据个数是多少?【提示】各组数据的个数依次为2,7,8,16,5,4,2.3.在直角坐标系中,能否将各组统计的数据直观地表示出来?【提示】可以.画频率分布直方图的步骤知识2频率分布折线图和总体密度曲线1.频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到了频率分布折线图.2.总体密度曲线随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.知识3茎叶图茎叶图中的茎是指中间的一列数,叶就是从茎的旁边生长出来的数.类型1频率分布表和频率分布直方图例1下表给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).区间界限[122,126)[126,130)[130,134)[134,138)[138,142)人数58102233区间界限[142,146)[146,150)[150,154)[154,158)人数201165(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.解(1)样本频率分布表如下:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158]50.04合计1201(2)其频率分布直方图如下:(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.规律方法1.在列频率分布表时,极差、组距、组数有如下关系:(1)若极差组距为整数,则极差组距=组数;(2)若极差组距不为整数,则极差组距的整数部分+1=组数.2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.变式训练有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.(1)列出学生参加运动队的频率分布表;(2)画出频率分布条形图.解(1)计算最大值与最小值的差:61-48=13.(2)决定组距与组数,取组距为2.∵132=612,∴共分7组.(3)决定分点,分成如下7组:[47.5~49.5),[49.5~51.5),[51.5~53.5),[53.5~55.5),[55.5~57.5),[57.5~59.5),[59.5~61.5].(也可以分为[48,50),[50,52),[52,54),[54,56),[56,58),[58,60),[60,62]7组)(4)列出频率分布表:分组频数频率[47.5~49.5)20.05[49.5~51.5)50.125[51.5~53.5)70.175[53.5~55.5)80.2[55.5~57.5)110.275[57.5~59.5)50.125[59.5~61.5]20.05合计40 1.00(5)作出频率分布直方图如图.(6)取各小长方形上端的中点并用线段连接就构成了频率分布折线图.类型2茎叶图的绘制及应用例2某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,86,91,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,88,110,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.解甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况大致是对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.变式训练某良种培育基地正在培养一种小麦新品种A,将其与原有一个优良品种B进行对照实验,两种小麦各种植了25亩,所得亩产量数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,4 45,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,4 15,416,422,430(1)画出两组数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量用其稳定性进行比较,写出统计结论.解(1)茎叶图如图所示.A B9 7358 7363537 1 4838 3 5 69 239 1 2 4 4 5 7 75 0400 1 1 36 75 4 2410 2 5 67 3 3 14224 0 04305 5 3444 145(2)用茎叶图处理现有的数据不但可以看出数据的分布情况,而且可以看出每组中的具体数据.(3)通过观察茎叶图,可以发现品种A的平均亩产量约为411.1千克,品种B的平均亩产量为397.8千克.由此可知品种A的平均亩产量比品种B的平均亩产量高,但品种A的亩产量不够稳定,而品种B的亩产量比较集中在平均亩产量附近.类型3频率分布直方图、折线图的综合应用例3为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55)4;[11.55,11.65],2.(1)列出频率分布表;(2)画出频率分布直方图以及频率分布折线图;(3)据上述图表,估计数据落在[10.95,11.35)范围内的可能性是百分之几?(4)数据小于11.20的可能性是百分之几?【思路探究】根据画频率分布直方图的步骤先画频率分布直方图,再画折线图,然后结合直方图的特征解决(3)(4).解(1)频率分布表如下:分组频数频率[10.75,10.85)30.03[10.85,10.95)90.09[10.95,11.05)130.13[11.05,11.15)160.16[11.15,11.25)260.26[11.25,11.35)200.20[11.35,11.45)70.07[11.45,11.55)40.04[11.55,11.65]20.02合计100 1.00(2)频率分布直方图及频率分布折线图,如图(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为1-(0.03+0.09)-(0.07+0.04+0.02)=0.75=75%,即数据落在[10.95,11.35)范围内的可能性是75%.(4)数据小于11.20的可能性即数据小于11.20的频率,设为x , 则(x -0.41)÷(11.20-11.15) =(0.67-0.41)÷(11.25-11.15), 所以x -0.41=0.13,即x =0.54, 从而估计数据小于11.20的可能性是54%. 规律方法频率分布直方图的性质:1.因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2.在频率分布直方图中,各小矩形的面积之和等于1. 3.频数/相应的频率=样本容量.4.在频率分布直方图中,各矩形的面积之比等于频率之比,各矩形的高度之比也等于频率之比. 变式训练为了解某校高一年级学生的体能情况,抽取部分学生进行一分钟跳绳测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110)为达标,则该校全体高一年级学生的达标率是多少? 解 (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由频率分布直方图可估计,该校高一年级学生的达标率为17+15+9+32+4+17+15+9+3×100%=88%.课堂小结1.列频率分布直方图的步骤:(1)计算数据中最大值和最小值的差.知道了极差就知道了这组数据的变动范围有多大;(2)决定组数和组距.组距是指每个小组的两个端点之间的距离;(3)决定分点;(4)列频率分布表;(5)绘制频率分布直方图.2.列频率分布直方图的注意事项:(1)组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).(2)分点数的决定方法是:若数据为整数,则分点数据减去0.5;若数据是小数点后一位的数,则分点减去0.05,以此类推.当堂双基达标1.从一群学生中抽取一个一定容量的样本,对他们的学习成绩进行分析.已知不超过80分的为10人,其累积频率为0.5,则样本容量是()A.20人B.40人C.80人D.60人【解析】样本容量=100.5=20人.【答案】A2.一个容量为20的样本数据,分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2.则样本在区间[20,60)上的频率是()A.0.5 B.0.6 C.0.7 D.0.8【解析】频率=3+4+5+42+3+4+5+4+2=1620=45=0.8.【答案】D3.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)的汽车大约有______辆.【解析】在[50,60)的频率为0.03×10=0.3,∴汽车大约有200×0.3=60(辆).【答案】604.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:分组频数频率[50.5,60.5)40.08[60.5,70.5)0.16[70.5,80.5)10[80.5,90.5)160.32[90.5,100.5]合计50(1)填充频率分布表的空格(将答案直接填在表格内);(2)补全频率分布直方图.解(1)分组频数频率[50.5,60.5)40.08[60.5,70.5)80.16[70.5,80.5)100.20[80.5,90.5)160.32[90.5,100.5]120.24合计50 1.00 (2)频率分布直方图如图所示:。
2.2.1用样本的频率分布估计总体分布.
(1)样本的频率分布表为:
产品 一级品 二级品 三级品 次品
频数 5 8 13 4
频率 0.17 0.27 0.43 0.13
(2)此产品为二级品或三级品的概率约为0.27+0.43=0.7.
【典例剖析】
新知
3、已知样本10, 8, 6, 10, 8,13,11,10,12,7,8,9,12,9, 11,12,9,10,11,11, 那么频率为0.2的是 ( D )
8 4 6 3 3 6 8 3 8 9
1 0 1 2 3 4 5 2 5 1 4 0
乙
5 4 6 1 6 7 9 9
优点 (1)易表示大量数据 频率分布 (2)直观地表明分布 直方图 情况 (1)无信息损失 茎叶图 (2)随时记录,方便 记录和表示
图形
缺点 丢失一些信息
只能处理 样本容量较小
【典例剖析】
就得到频率分布折线图. 频率 组距
0.5 0.4 0.3 0.2 0.1 O
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
Байду номын сангаас
【探究新知】
例题
3、总体密度曲线: 随着样本容量的增 加,作图时所分的组数 增加,组距减小,相应 的频率折线图会越来越 接近一条光滑曲线—— 总体密度曲线.
【探究新知】
1、画频率分布直方图的步骤:
(1)求极差;
(2)决定组距与组数(组距 = 极差/组数)
(3)将数据分组;
(4)列频率分布表;
(5)作频率分布直方图(纵轴表示频率/组距).
频率分布直方图以面积的形式反映了数据落在各个 小组的频率的大小,各小长方形的面积和为1.
【探究新知】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的 百分比是多少?
频率/ 组距
0.020 0.053 0.060 0.073 0.067 0.033 0.027
0.070 0.060 0.050 0.040 0.030 0.020 0.010
组距
数据落在[15.5,
的百分比是56%
12.5 15.5 18.5 21.5 24.5 27.5 30.5 33.5
24.5)
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
利用样本频率分布对总体分布进行相应估 计
(1)上例的样本容量为100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增 至10000呢?
(2)样本容量越大,这种估计越精确。
(3)当样本容量无限增大,组距无限缩小, 那么频率分布折线图就会无限接近于一条光滑
解 (1)频率分布直方图是以面积的形式反映了数据落在各小组内 的频率大小的,因此第二小组的频率为2+4+17+4 15+9+3=0.08.
第二小组的频数 又因为第二小组的频率= 样本容量 , 所以样本容量=第第二二小小组组的的频频数率=01.028=150. (2) 由 直 方 图 可 估 计 该 校 高 一 年 级 学 生 的 达 标 率 为 2+147++117+5+195++39+3×100%=88%.
创新设计 P42
【变式3】(2012·盐城高一检测)为了了解高一年级学生的体能
情况,某校抽取部分学生进行一分钟跳绳次数测试,将所
得数据整理后,画出频率分布直方图(如图所示),图中从
左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第
二小组的频数为12.
创新设计 P42
(1)第二小组的频率是多少?样本容量是多少? (2)若次数在110以上(含110次)为达标,则该校全体高一年 级学生的达标率是多少?
100 1.00
5. 画频率分布直方图:
频率/组距
0.50
注意 纵坐标是 频率/组距
0.40
0.30
0.20
0.10
用水量
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
请所小计有矩算小每形矩个形的小的面矩面积形积=的的组面和距积是×,多它频少代?表率什=1 么频?率为什么? 组距
频率/组距
寿命(h) ( 4 ) 电 子 元 件 寿 命 在
0 100 200300400 500 600
400h以上的频率为0.35
小结
步骤 频率分布直方图
1.求极差 2.决定组距与组数 3.将数据分组 4.列频率分布表 5.画频率分布直方图
检测
1. 右图是容量为100的
频率
样本的频率分布直方图, 0.09 组距 试根据图中的数据填空: 0.08
①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
②为了较合理地确定这个标准,你认为需要做 哪些工作?
通过抽样,我们获得了100位居民某年的月平均用水量 (单位:t) ,如下表:
这些数字告诉我们什么信息?
1.求极差(即一组数据中最大值与最小值的差)
4.3 - 0.2 = 4.1
曲线,统计中称这条光滑曲线为总体密度曲 线。
总体密度曲线
频率 组距
月均用 水量/t
ab
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
总体密度曲线
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。是研究总 体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布折线图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。
7
0.0875
7/(80×0.19)
5
0.0625
4
0.05
80 1.00
5/(80×0.19) 4/(80×0.19)
5. 画频率分布直方图:
频率/组距
注意 纵坐标是 频率/组距
4/(80× 0.19)
尺寸/cm
O 362.7 362.51
362.89 363.08 363.27 363.46 363.65 363.84 364.02 364.22 364.41
频率分布折线图如下:
频率
连接频率分布直方图
组距
中各小长方形上端的
中点,得到频率分布折
线图
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
频率分布直方图如下:
频率
连接频率分布直方图
组距
中各小长方形上端的
中点,得到频率分布折
线图
0.50
0.40
(1)样本数据落在范围
[6,10)内的频率为0__.3_2_;
0.03
(2)样本数据落在范围 0.02
[10,14)内的频数为_3_6__;
O
样本 数据
2 6 10 14 18
(3)总体在范围[2,6)内的
概率约为__0_._0_8__;
2.一个容量为35的样本,分组后,组距与频数如下: [5,10)5,[10,15)12,[15,20)7,[20,25)5,[25,30)4,
(1Байду номын сангаас分)
(4)数据小于11.20的可能性即数据小于11.20的频率,设为x,
则(x-0.41)÷(11.20-11.15)
=(0.67-0.41)÷(11.25-11.15),
所以x-0.41=0.13,即x=0.54,
从而估计数据小于11.20的可能性是54%.
(12分)
【题后反思】 (1)用样本的频率分布估计总体的分布,是 列频率分布表和画频率分布直方图的主要目的,频率分布 表比较准确地反映样本的频率分布,而频率分布直方图则 能直观地反映样本的频率分布. (2)频率分布直方图反映了样本在各个范围内取值的可能 性,由抽样的代表性利用样本在某一范围内的频率,可近 似地估计总体在这一范围内的可能性.
组”,“频数累计”
(可省),“频数”,
“频率”, “频率/组
距””五列,最后一行
是频合率计=
频数 样本容量
注意频数的合计应 是样本容量,频率 合计应是1
频率/组距
4 0.04 0.08
8 0.08 0.16 15 0.15 0.30 22 0.22 0.44 25 0.25 0.50 14 0.14 0.28 6 0.06 0.12 4 0.04 0.08 2 0.02 0.04
P71 第1题
P71 第1题
1.求极差(即一组数据中最大值与最小值的差)
364.41 – 362.51 = 1.9
2.决定组距与组数
组数=
极差 =
组距
1.9 0.19
=
10
组距=0.19
3.将数据分组(左闭右开)
[362.51,362.7 ),[362.7,362.89 ),…, [364.22,364.41]
现在随机抽取其中的
200辆汽车进行车速分 0.04
析,则估计在这一时段
内通过该站的汽车中速 0.02
度不小于90km/h的约
有( C)
0.01
O
车速
60 70 80 90 100 110
A100辆
B200辆
C300辆
D400辆
5.有一个容量为50的样本数据的分组的频数如下: [12.5, 15.5) 3
2.决定组距与组数
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
组距:指每个小组的两个端点的距离,
组数=
极差 =
组距
4.1 0.5
=
8.2
组距:0.5 组数:9
3.将数据分组(左闭右开)
[0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
频率分布表一般分“分
优点:从频率分布直方图可以清楚地看出数据分布的总体趋势
缺点:从频率分布直方图得不出原始的数据内容,把数据表示成直 方图后,原有的具体数据就被抹掉了
0.04 0.12
0.27 0.49
0.74 0.88
0.94 0.98
1.00
频率/组距
0.50 0.40 0.30
0.20 0.10
用水量
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 /t
解:组距为3
分组
频数
[12.5, 15.5) 3 [15.5, 18.5) 8
[18.5, 21.5) 9 [21.5, 24.5) 11
[24.5, 27.5) 10
[27.5, 30.5) 5 [30.5, 33.5] 4
合计
频率
50
频率
0.06 0.16 0.18 0.22 0.20 0.10 0.08 1
如果当地政府希望85%以上的居民每月的用水量不超出 标准,根据频率分布表和频率分布直方图,你能对制定 月用水量提出建议吗?
88%的居民月用水量在3t以下,可建议取a=3.
思考:在实际中,取a=3t一定能保证85%以上 的居民用水不超标吗?哪些环节可能会导致 结论出现偏差?