2.2.1用样本频率分布估计总体分布学生版
2.2.1用样本的频率分布估计总体分布01学案
学习课题:2.2.1用样本的频率分布估计总体分布(1)※学习目标1.通过实例体会分布的意义和作用;2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图;3. 通过实例体会频率分布直方图的各自特征,从而会用上述方法分析样本的分布,准确地做出总体估计。
※课前准备(阅读课本P65-P67)※探索新知探究1:考察课本表2-1这组数据的最大值、最小值分别是什么?极差是什么?样本数据的范围是多少?探究2:怎样决定一个样本的组距与组数?请你把表2-1进行适当的分组。
探究3:根据你决定的组距与组数,将表2-1数据分组。
探究4:统计各小组的个数,即频数,然后计算各个小组的频率,并列出频率分布表。
探究5:选取适当的单位长度,画频率分布直方图。
试一试:1、频率的计算公式是怎样的?若某个小组的频率是0.3,样本容量是50,则该小组的频数的多少?2、频率分布直方图中的各个小长方形的面积表示相应各组的____________;个小长方形的面积之和为__________,即个小组的频率之和为________。
3、你能从频率分布直方图获取哪些信息?※典型例题下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)(1)列出样本频率分布表;(2)画出频率分布直方图;(3)试从你所画的频率分布直方图计算[134,138)这一组的频率。
※学习小结1、画频率分布直方图的的步骤是怎样的?2、根据样本数据的频率分布,可以推测总体的频率分布。
※ 当堂检测(ABC 班完成)1、若一个样本的最大值是93,最小值是54,则该样本的极差是( )A .39B .49C .-39D .-492、若一个样本的极差为12.4,组距为2,则该组数据分成的组数是( )A .5B .6C .7D .83、将一组数据分成6组,若第1,2,3,5,6组的频率分别为0.1,0.15,0.2,0.2,0.15,0.05,则第4组的频率是( )A .0.1B .0.15C .0.2D .0.05 4、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在(]2700,3000的频率为 ;如果所观察的新生儿共有2000人,则体重在(]2700,3000的人数是______5、为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数的测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)二小组的频率是多少?样本容量是多少? (2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?※ 延伸拓展(AB 班完成)为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出则______,______,______,______m n M N ====。
高中数学人教新课标B版必修3--《2.2.1用样本的频率分布估计总体的分布》课件4
1
解1:总睡眠时间约为 6.25×5+6.75×17 +7.25×33+7.75×37+8.25×6+8.75×2 =739(h)
故平均睡眠时间约为7.39h 解2:求各组中值与对应频率之积的和, 6.25×0.05+6.75×0.17+7.25×0.33+7.75× 37+8.25×0.06+8.75×0.02 =7.39(h)
解:估计该单位职工的平均年收入为 12500×10%+17500×15%+22500×20%+ 27500×25%+32500×15%+37500×10%+ 45000×5%=26125(元) 答:估计该单位人均年收入约为26125元.
练习题: 1.若M个数的平均数是x,N个数的平均数
Mx Ny
(2)中位数不受少数几个极端数据的影 响,容易计算,它仅利用了数据中排在中 间的数据的信息。当样本数据质量比较差, 即存在一些错误数据时,应该用抗极端数 据强的中位数表示数据的中心值。
(3)平均数受样本中的每一个数据的影 响,“越离群”的数据,对平均数的影响 也越大,与众数和中位数相比,平均数代 表了数据更多的信息,当样本数据质量比 较差时,使用平均数描述数据的中心位置 可能与实际情况产生较大的误差。
2.2.2 用样本的数字特征估计 总体的数字特征(一)
一、众数、中位数、平均数
(1)众数:在样本数据中,频率散布最 大值所对应的样本数据或出现次数最多的 那个数据。
(2)中位数:样本数据中,累计频率为 0.5时所对应的样本数据或将数据按大小 排列,位于最中间的数据(如果数据的个 数为偶数,就取当中两个数据的平均数作 为中位数)。
2.2.1用样本的频率分布估计总体分布(1)
[21.5, 24.5) 11
(1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在 [15.5, 24.5)的百分比是多少?
注意
第几组频数 (1)第几组频率= 样本容量
频率 (2)纵坐标为: 组距
(3)理解面积表示频率
作业:P81
A2
40.5
50.560.5 70.580.5 90.5 100.5
画频率分布直方图的步骤
1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围100-48=52 2、决定组距与组数(将数据分组) 组距:指每个小组的两个端点的“距离”。 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 极差 52 组数= 5.2 取整,分为6组,合适 组距 10 极差 52 组数= 13 取整,分为13组, 组距 4 不太合适 3、将数据分组 4、列出频率分布表.(分组、频数、频率、频率/ 组距) 5、画出频率分布直方图。
学生分数频率分布表 分组 频数累计 频数 频率
[40.5 ,50.5)
[50.5 , 60.5 ) [60.5 , 70.5 ) [70.5 , 80.5) [80.5 , 90.5)
2
2 7 16 8
0.05
0.05 0.175 0.40 0.20
[90.5 , 100.5)
合计
5
40
0.125
每组头 数 40 80 160 80 32 8
每组总质 量 1920 4240 9280 5040 2176 584 23240
课件5:2.2.1 用样本的频率分布估计总体分布
(1)数形结合思想是中学数学很重要的思想方法,是高考的重点 考查内容之一,是根据数据的结构特征,构造出与之相应的几 何图形,并利用图形的特性和规律,解决问题. (2)画茎叶图时,用中间的数表示数据的十位和百位数,两边的 数分别表示两组数据的个位数.要先确定中间的数取数据的哪 几位,填写数据时边读边填.比较数据时从数据分布的对称性、 稳定性等几方面来比较.
9
0.225
14
0.35
3
0.075
[173.5,177.5)
3
0.075
[177.5,181.5]
1
0.025
合计
40
1
(2)频率分布直方图如图所示.
本例中,画出相应的频率分布折线图. 解:连接频率分布直方图中各小长方形上端的中点,就得到频 率分布折线图如下:
(1)在列频率分布表时,极差、组距、组数有如下关系 ①若极 组差 距为整数,则极 组差 距=组数; ②若极 组差 距不为整数,则极 组差 距的整数部分+1=组数.
合计
频数 3 9 13 16 26 20 7 4 2 100
频率 0.03 0.09 0.13 0.16 0.26 0.20 0.07 0.04 0.02 1.00
(2)频率分布直方图及频率分布折线图,如图.
(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为 1- (0.03 + 0.09) - (0.07 + 0.04 + 0.02) = 0.75 = 75% , 即 数 据 落 在 [10.95,11.35)范围内的可能性是 75%. (4)数据小于 11.20 的可能性即数据小于 11.20 的频率,设为 x, 则(x-0.41)÷(11.20-11.15)=(0.67-0.41)÷(11.25-11.15), 所以 x-0.41=0.13,即 x=0.54, 从而估计数据小于 11.20 的可能性是 54%.
用样本的频率分布估计总体的分布》教学设计
必修3《2.2.1 用样本的频率分布估计总体的分布》教学设计北京师范大学附属实验中学曹付生一、教学内容分析1.教学主要内容:本节课选自人教B版必修三,第二章第二小节,《用样本的频率分布估计总体的分布》,需要2课时完成,本节课是第一课时。
主要是画出样本的频率分布直方图,并能通过频率分布直方图对总体进行简单的估计。
2.教材编写特点本节是本章教材的第二小节,前面研究了随机抽样的方法及数据收集。
本节课主要研究对收集样本如何进行处理,突出对数据描述、处理的方法,特别是频率分布直方图画法,后面接着研究总体密度曲线、用样本的数字特征估计总体的数字特征以及正态曲线等,可以说本节课内容承上启下,地位非常重要。
从教材编写的角度来看,也正是要体现这一特点。
教材编写,通过对样本分析和总体估计的过程,突出了统计的实用性,从实际出发,收集数据,进行分析整理,再回到实际问题,感受数学对实际生活的需要,体现了统计的思想及其在实际问题中的应用价值,真正体会数学知识与现实生活的联系。
3.教材内容的数学核心思想教材内容的数学核心思想是用样本的频率分布直方图估计总体的统计思想方法。
4.我的思考:本节课重在教会学生绘制频率分布直方图,引导学生通过频率分布直方图分析总体的分布,体会统计的思想、方法。
在通读了教材的基础上,与人教A版的相应内容作了比较,再结合学生的情况,最终选择A版内容,更利于完成教学目标。
(1)人教A版教材中的例子与学生关系紧密,提出的问题更切合学生实际。
背景的熟悉使学生易于课堂参与。
(2)教材中问题的设计利于学生统计思想的建立等。
统计思想方法是数学的一个重要的思想方法,中学学习统计,除了掌握必要的统计知识之处,关键是让学生建立统计在现实生活中具有重要的作用,具有统计意识,同时体会到统计结果随机性、科学性,能作为总体的分布的合理性,是生活中某些问题决策必不可少的依据。
统计教学的核心目标正是让学生体会统计思维的特点和作用。
因此在设计中,从实际问题出发,再回到实际问题的决策,前后呼应,使学生真正体会数据处理的全过程、统计应用于现实生活的全过程,突出统计的思想、方法。
2.2.1用样本的频率分布估计总体分布3
小华: 62,78,86, 94, 95, 98, 98.
小明: 62, 62, 67,82,98, 99, 100.
他们都认为自己的成绩比另两位同学好,你看呢?
小华
小明
60 70 80 90 100
正
F
频数 2 6 10 10 14 16 13 11 8 7 5 3
100
频率 0.02 0.06 0.10 0.10 0.14 0.16 0.13 0.11 0.08 0.07 0.05 0.03 1.00
频率/组距
频率分布直方图
体重(kg) 54 56 58 60 62 64 66 68 70 72 74 76 78
154 157 162 166 159 153 154 167 173 168 解: (1)求极差(最大值与最小值的差):
在上述数据中,最大值是175,最小值是151,它们的差是 175 — 151 = 24 (2)确定组距和组数 如果取组距为4,由24÷4=6,组数为6 (3)将数据分组:[151,155),[155,159),[159,163), [163,167),[167,171),[171,175].
2.2.1用样本的频率分布估计总体分布
分 组 [0,0.5) [0,0.5) [0.5, [0.5,1) [1,1.5) [1,1.5) [1.5, [1.5,2) [2,2.5) [2,2.5) [2.5, [2.5,3) [3,3.5) [3,3.5) [3.5, [3.5,4) [4, [4,4.5] 合计
频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100
1.9 0.3 0.5 0.6 0.8 0.7 0.9 0.5 0.8 0.6
1.6 0.4 3.8 4.1 4.3 2.0 2.3 2.4 2.4 2.2
思考1 上述100个数据中的最大值和最 思考1:上述100个数据中的最大值和最 100 小值分别是什么? 小值分别是什么?由此说明样本数据的 变化范围是什么? 变化范围是什么? 0.2~ 0.2~4.3 思考2:样本数据中的最大值和最小值 思考2 的差称为极差 如果将上述100 极差. 100个数据 的差称为极差.如果将上述100个数据 组距为0.5进行分组 进行分组, 按组距为0.5进行分组,那么这些数据 共分为多少组? 共分为多少组? 4.3-0.2) (4.3-0.2)÷0.5=8.2
上图称为频率分布直方图, 上图称为频率分布直方图,其中横轴 频率分布直方图 表示月均用水量,纵轴表示频率/组距. 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高 度在数量上有何特点? 度在数量上有何特点?
思考2 思考2:频率分布直方图中各小长方形的 面积表示什么? 面积表示什么?各小长方形的面积之和 为多少? 为多少?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5
2.2.1用样本的频率分布估计总体的分布课件(刘爱娟,2014.2.26)
• • • • • • • • • •
25.39 25.41 25.40 25.37 25.35 25.40 25.36 25.41 25.47 25.40
25.36 25.43 25.39 25.44 25.32 25.43 25.42 25.32 25.34 25.35
25.34 25.44 25.41 25.33 25.45 25.44 25.39 25.38 25.30 25.41
1.将每个数据分为茎(高位)和叶(低位) 两部分,在此例中,茎为十位上的数字, 叶为个位上的数字. 2.将最小茎和最大茎之间的数按大小次序 排成一列,写在中间. 3.将各个数据的叶按大小次序写在其茎的 左(右)侧.
用茎叶图表示数据的优点
一是从统计图上没有原始信息的损失,所 有的数据信息都可以从茎叶图中得到; 二是茎叶图可以在比赛是随时记录,方便 记录与表示。但茎叶图只便于表示两位有 效数字的数据,虽然可以表示两个人以上 的比赛结果(或两个以上的记录),但没 有表示两个记录那么直观、清晰
二、频率分布折线图
把频率分布直方图各个长方形上边的中点用线段 连接起来,就得到分布折线图。
三、总体密度曲线
• 频率分布直方图表明了所抽取的100件产品中, 尺寸落在各个小组内的频率大小.样本容量越大, 所分组数越多,各组的频率就越接近于总体在相 应各组取值的概率.设想样本容量无限增大,分
组的组距无限缩小,则频率分布直方图就会无限 接近于一条光滑曲线——总体密度曲线.它反映 了总体在各个范围内取值的规率.总体密度曲线
3、甲乙两个小组各10名学生的英语口语测试成绩如下(单位:分)
甲组 76 乙组 82 90 84 84 85 86 89 81 79 87 80 86 91 82 89 85 79 83 74
2.2.1用样本的频率分布估计总体分布
总体密度曲线
反映了总体在各个范围内取值的百分比,精确地 反映了总体的分布规律。是研究总体分布的工具. 用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。
定额管理,即确定一个居民月用水量标准a, 用水量不超过a的部分按平价收费,超出a的 部分按议价收费.那么①标准a定为多少比较合 理呢? ②为了较合理地确定这个标准,你认 为需要做哪些工作?
通过抽样,我们获得了100位居民某年的月平均 用 水量(单位: t) ,如下表:
思考:由上表,大家可以得到什么信息?
2019/4/10
二、画频率分布直方图的步骤
1.求极差(即一组数据中最大值与最小值的差)
4.3 - 0.2 = 4.1
极差 4.1 2.决定组距与组数: = 组距= = 0.5 8 组数
当数据在100个以内时,常分8-12组.
3.将数据分组
[0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
月均用水量 /t 4.5
归纳: 作频率分布直方图的方法为:
把横轴分成若干段,每一段对应一个组 的组距,以此线段为底作矩形,高等于 该组的频率/组距, 这样得到一系列矩形, 每一个矩形的面积恰好是该组上的频率, 这些矩形构成了频率分布直方图.
三、频率分布直方图再认识 1、小长方形
频率
的面积总和=?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
2019/4/10
当总体中的个体数很多时(如抽样调查全国城市 居民月均用水量) ,随着样本容量的增加,作图时 所分的组数增多,组距减少,你能想象出相应的 频率分布折线图会发生什么变化吗?
用样本估计总体2.2.1用样本的频率分布估计总体分布
频率 组距
0.1
0.2
0.3
0.4
0.5
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
平均数是频率分布直方图的“重心”. 用频率分布直方图估计平均数方法是
01
平均数≈图中每一个小矩形的面积×小矩形底边中点的横坐标之和
8 4 6 3 6 8 3 8 9 1
叶就是从茎的旁边生长出来的数,表示得分的个位数。
茎是指中间的一列数,表示得分的十位数
茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。 从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。 在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。
人数
2
3
2
3
4
1
1
1
平均数: 一组数据的算术平均数,即 x= 练习: 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示: 分别求这些运动员成绩的众数,中位数与平均数 平均数: 一组数据的算术平均数,即 x=
1
解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75. 上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;
0.5 1 1.5 2 2.5 3 3.5 4 4.5
5.画频率分布直方图
思考 : 如果当地政府希望使 85% 以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗? 注意 小正方形的面积=组距×频率/组距=频率 各小正方形的面积之和等于1. 每一小组频率实际上反映样本数据落在各个小组的比例大小。
2.2.1用样本的频率分布估计总体分布(1)
只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性. 频率分布直方图非常直观地表明了样本数据的分布情况, 使我们能够看到频率分布表中看不太清楚的数据模式,但 原始数据不能在图中表示出来.
准a,用水量不超过a的部分按平价收费,超出a的部分按
议价收费. 那么a定为多少比较合理呢?你认为,为了较为合理地确 定出这个标准,需要做哪些工作?
100位居民的月均用水量(单位:t)
3.1 2.6 2.3 2.2 1.8 1.3 1.3 1.5 0.8 2.2 2.5 2.2 2.1 1.7 1.4 1.4 1.6 0.5 2.4 2.0 2.2 1.6 1.3 3.5 1.8 0.9 2.4 2.8 2.0 1.5 1.2 3.6 1.9 0.7 2.3 2.5 2.5 1.5 1.2 3.7 1.7 0.8 2.0 2.6 2.6 2.2 1.0 0.2 1.5 0.6 4.3 2.5 2.7 2.3 2.0 1.6 0.4 0.5 4.1 3.0 2.8 2.4 2.1 1.5 1.8 0.3 3.8 3.2 2.9 2.3 2.1 1.6 1.0 1.9 0.4 3.3 2.9 2.4 2.3 1.7 1.0 1.2 1.6 3.2 2.8 2.4 2.4 1.8 1.4 1.0 1.8 3.4 2.7 2.3 2.3 1.9 1.3 1.2 1.7 0.6
(5)频率分布直方图 第一步:画平面直角坐标系. 第二步:在横轴上均匀标出各组分点,在纵轴上标出单 位长度. 第三步:以组距为宽,各组的频率与组距的商为高,分 别画出各组对应的小长方形.
频率 组距 0.5 0.4 0.3 0.2 0.1
(人教b版)数学必修三练习:2.2.1(第1课时)用样本的频率分布估计总体的分布1(含答案)
第二章 2.2 2.2.1 第1课时一、选择题1.从某批零件中抽出若干个,然后再从中抽出40个进行合格检查,发现合格产品有36个,则该批产品的合格率为( )A .36%B .72%C .90%D .25%[答案] C[解析] 用样本的合格率近似代替总体的合格率为3640×100%=90%.2.在用样本估计总体分布的过程中,下列说法正确的是( ) A .总体容量越大,估计越精确 B .总体容量越小,估计越精确 C .样本容量越大,估计越精确 D .样本容量越小,估计越精确 [答案] C[解析] 用样本估计总体分布时,样本容量越大,估计越精确.3.(2013·重庆文,6)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )1 8 92 1 2 2 7 9 30 0 3A.0.2 B .0.4 C .0.5 D .0.6[答案] B[解析] 由题意知,这10个数据落在区间[22,30)内的有22,22,27,29,共4个,∴其频率为410=0.4,故选B4.(2013·辽宁理,5)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A.45 B.50C.55 D.60[答案] B[解析] 根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,∴该班的学生人数是150.3=50.5.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其他7个小长形的面积和的14,且样本容量为200,则第8组的频数为( )A.40 B.0.2C.50 D.0.25[答案] A[解析] 设最后一个小长方形的面积为x,则其他7个小长方形的面积为4x,从而x+4x=1,所以x=0.2.故第8组的频率为200×0.2=40.6.一个容量为20的样本数据分组后,组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2.则样本在(-∞,50]上的频率为( ) A.90% B.70%C.50% D.25%[答案] B[解析] 样本在(-∞,50]上的频数为2+3+4+5=14,故在(-∞,50]上的频率为14÷20=70%,故选B.二、填空题7.(2013·湖北理,11)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示________.(1)直方图中x的值为________.(2)在这些用户中,用电量落在区间[100,250]内的户数为________.[答案] (1)0.004 4 (2)70[解析] 本题考查频率分布直方图和用样本估计总体.∵50×(0.002 4+0.003 6+0.006+x+0.002 4+0.0012)=1,∴x=0.0044.用户在区间[100,250]内的频率为50×(0.003 6+0.006+0.004 4)=0.7,∴户数为100×0.7=70(户).点评:频率分布直方图中各个小矩形的面积之和为1.8.(2014·江苏,6)为了解一处经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.[答案] 24[解析] 由题意在抽测的60株树木中,底部周长小于100cm的株数为(0.015+0.025)×10×60=24.三、解答题9.为了了解商场某日旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得的数据整理后,画出频率分布直方图(如图所示).已知从左至右前3个小组的频率之比为123,第4小组与第5小组的频率分别为0.175和0.075,第二小组的频数为10,求抽取顾客多少人?[解析] 前三组频率和为1-0.075-0.175=0.75.又前三组频率之比为123,所以第二组频率为 26×0.75=0.25.又知第二组频数为10,则100.25=40(人),故所抽取顾客为40人.一、选择题1.某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重(单位: g)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100 g 的个数是36,则样本中净重大于或等于98 g 并且小于104 g 的产品个数是( )A .90B .75C .60D .45[答案] A[解析] 本小题主要考查了频率分布直方图,考查了读图用图的能力.产品净重小于100 g 的频率P =(0.050+0.10)×2=0.3,设样本容量为n ,由已知36n=0.3,∴n =120.而净重大于或等于98 g 而小于104 g 的产品的频率P ′=(0.100+0.150+0.125)×2=0.75.∴个数为0.75×120=90.故选A.2.(2014·山东理,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6 B.8 C.12 D.18 [答案] C[解析] 第一、二两组的频率为0.24+0.16=0.4,∴志愿者的总人数为200.4=50(人).第三组的人数为:50×0.36=18(人),有疗效的人数为18-6=12(人).二、填空题3.一个社会调查机构就某地居民的月收入调查10 000人,并根据所得数据画了样本的频率分布直方图(如图所示).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.[答案] 25[解析] 从10 000人中用分层抽样的方法抽出100人,∴抽取比例为100 1.由图可知,0.000 5×500×10 000=2 500,∴月收入在[2 500,3 000)内的人数为2 500人,∴从中应抽出2 500×1100=25(人).4.从某自动包装机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g) 492 496 494 495 498497 501 502 504 496497 503 506 508 507492 496 500 501 499根据频率分布估计总体分布的原理,该自动包装机包装的袋盐食盐质量在497.5g~501.5g之间的概率约为____________.[答案] 0.25[解析] 袋装食盐质量在497.5~501.5g之间的共有5袋,所以其概率为520=0.25.三、解答题5.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午800~1000间各自的点击量,得如图所示的茎叶图.根据统计图:(1)甲、乙两个网站点击量s的极差分别是多少?(2)甲网站点击量在[10,40]间的频率是多少?(3)甲、乙两个网站哪个更受欢迎?并说明理由.[解析] (1)甲网站的极差为:73-8=65;乙网站的极差为:71-5=66.(2)甲网站点击量在[10,40]间的频率为414=27=0.285 71.(3)甲网站的点击量集中在茎叶图的下方(较大),而乙网站的点击量集中在茎叶图的上方(较小).从数据的分布情况来看,甲网站更受欢迎.6.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高:(单位:cm)区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)[146,150)[150,154)[154,158)人数58102233201165(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.[解析] (1)样本频率分布表如下:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201(2)(3)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.希望对大家有所帮助,多谢您的浏览!。
2.2.1用样本的频率分布估计总体分布(1)
1.画频率分布直方图的基本步骤:
1.求极差
4.3 - 0.2 = 4.1
一组数据中最大值与最小值的差
2.决定组距与组数
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
组距:指每个小组的两个端点的距离,
3.将组数数据= 分组极组距差(=左40闭..15右=开8).2 [0,0.5 ),[0.5,1 ),…,[4,4.5]
=频率
∴在频率直方图中,各小矩形的面积的总和等于1.
频率分布条形图和频率分布直方图是两个 相同的概念吗? 有什么区别?
频率分布的条形图和频率分布直方图的区别
两者是不同的概念; 横轴:两者表示内容相同 纵轴:两者表示的内容不相同 频率分布条形图的纵轴(长方形的高)表示频率 频率分布直方图的纵轴(长方形的高)表示频率与 组距的比值。
[40,50),2;[50,60),3;[60,70),10; [70,80),15;[80,90),12;[90,100],8;
(1)列出样本的频率分布表;
(2)画出频率分布直方图.
解析:(1)样本的频率分布表如下
成绩分组 [40,50) [50,60) [60,70) [70,80) [80,90) [90,100] 合计
例 3.世界卫生组织指出青少年的身体健康状况是一个应该引 起大家足够重视的问题,某校为了解学生的体能情况,抽取了一 个年级的部分学生进行一分钟跳绳测试.将所得数据整理后,画 出了频率分布直方图,如图所示.已知图中从左到右前三个小组 的频率分别为 0.1,0.3,0.4,第一小组的频数为 5.
(1)求第四小组的频率; (2)求参加这次测试的学生人数是多少? (3)若在 75 次以上(含 75 次)为达标,试估计该年级学生跳绳 测试的达标率是多少?
2.2.1用样本的频率分布估计总体分布
新课导入前面研究学习了三种抽样收集数据,数据收集后,必须从中寻找包含的信息,以使我们能追求样本的估计总体,但是由于数据多而杂,所以需要通过一定的方法去分析.可以通过表、图、计算方法来分析.1. 通过实例体会分布的意义和作用;2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;3. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.知识与技能教学目标过程与方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.情感态度与价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.重点会列频率分布表,画频率分布直方图、频率折线图和茎叶图.能通过样本的频率分布估计总体的分布. 难点教学重难点我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?实际问题为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设我们通过抽样,得到100为居民月用水量,如下:100位居民的月均用水量(单位:t)3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.64.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2观察?上面的数字能告诉我们什么呢很容易发现的是一个居民月均用水量的最小值是0.2t,最大值是4.3t.其他值在0.2—4.3t之间.除此之外,很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理和分析.知识要点频率分布直方图频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.方法画频率分布直方图的一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.(1)求极差 因为用水最小值为0.2t ,最大值为4.3t 所以:4.3-0.2=4.1 说明样本数据的变化范围是4.1t.将上述抽样的100户居民月用水量,画出频率分布直方图.解:(2)决定组距与组数数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5—12组.为了方便起见,组距的选择应力求“取整”.在本问题中,如果取组距为0.5(t),那么组数=极差/组距=4.1/0.5=8.2因此可将数据分成9组,这个组数是较合适的,于是去组距为0.5.组数为9.(3)将数据分组以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5).(4)列频率分布表按照组距为0.5将数据分组,分成以下9组:[0,0.5),[0.5,1),…,[4,4.5). 图如下:100位居民月均用水量的频率分布表分组频数频率[0,0.5)40.04[0.5,1)80.08[1,1.5)150.15[1.5,2)220.22 [2,2.5)250.25 [2.5,3)140.14 [3,3.5)60.06 [3.5,4)40.04 [4,4.5)20.02合计1001频数等于样本数,频率恒为1(5)画频率分布直方图 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/to 0.100.200.300.400.50频率/组距特征频率分布直方图的特征:从频率分布直方图可以清楚的看出数据分布的总体趋势.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.知识要点频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.总体密度曲线的定义在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.茎叶图数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.特征茎叶图的特征:1. 用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.2. 茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.课堂小结1.频率分布直方图的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.2.频率分布折线图的概念连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.高考链接1(2009四川)设矩形的长为a ,宽为b ,其比满足 51b :a 0.6182-=≈这种矩形给人以美感,称为黄金矩形,黄金矩形常应用用于工艺品设计中,下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样品来估计两个批次的总体平均数,与标准值0.618比较,正确结论是()AA.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值跟接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定解析:本题考查平均数的求法,用样本估计总体,经计算甲、乙批次的总体平均数0.6170.613甲乙,x x ==知甲批次的总体平均数与标准值0.618更接近.2(2009湖北)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[6,10]内的频数为_______,数据落在[2,10)内的概率约为_____. 64 0.4解析:本题考查频率分布直方图,样本数据落在[6,10)内的频数为0.08×(10-6)×200=64.样本数据落在[2,10)内的概率约为(0.02+0.08)×4=0.4.区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)人数5810223320区间界限[146,150)[150,154)[154,158)人数11651.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位c m)(1)列出样本频率分布表﹔ (2)一画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.随堂练习分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201解:(1)样本频率分布表如下:前面的过程省略!122 126 130 134 138 142 146 150 158 154 身高(cm )o 0.010.020.030.040.050.060.07频率/组距(2)其频率分布直方图如下:0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为:2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.90 100 110 120 130 140 150 次数o 0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036解:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1. (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.0824171593=+++++121500.08===第二小组频数样本容量第二小组频率又因为频率=频数/ 样本容量所以 (2)由图可估计该学校高一学生的达标率约为 171593100%88%24171593+++⨯=+++++(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.。
人教b版数学必修三:2.2.1《用样本的频率分布估计、总体的分布》导学案
§2.2用样本估计总体2.2.1用样本的频率分布估计总体的分布自主学习学习目标1.通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体的分布,初步体会样本频率分布的随机性.自学导引1.极差的概念极差是一组数据的________________的差,它反映了一组数据____________,极差又叫________.2.频数、频率的概念将一批数据按要求分为若干组,对落在各个小组内数据的________进行累计,这个累计数叫做各个小组的______,各个小组的______除以________,即得该小组的______.3.频率分布直方图在频率分布直方图中,纵轴表示________________,各小长方形的面积等于________________,所有长方形面积之和等于________.4.频率分布折线图连接频率分布直方图中各个小长方形的____________,就得到频率分布折线图.5.总体密度曲线如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近总体在各个小组内所取值的________________的大小;当样本容量不断增大,分组的组距不断缩小时,频率分布直方图实际上越来越接近于____________,它可以用一条____________来描绘,这条光滑曲线就叫做________________.6.茎叶图用茎叶图表示数据的两个优点在于:一是从茎叶图上没有____________的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时____________,方便记录与表示.对点讲练知识点一画频率分布直方图、频率分布折线图例1某中学同年级40名男生的体重数据如下(单位:千克):61605959595858575757575656565656565655555555545454545353525252525251515150504948列出样本的频率分布表,画出频率分布直方图,画出频率分布折线图.变式迁移1有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20),17.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)求样本数据不足0的频率.知识点二用样本的频率分布估计总体分布寿命(2)画出频率分布直方图及折线图;(3)估计电子元件寿命在400 h以上的概率.变式迁移2为了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)问参加这次测试的学生人数是多少?(3)问在这次测试中,学生跳绳次数的中位数落在第几小组内?例3某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲的得分12,15,24,25,31,31,36,36,37,39,44,49,50;乙的得分8,13,14,16,23,26,28,33,38,39,51.(1)画出甲、乙两名运动员得分数据的茎叶图;(2)根据茎叶图分析甲、乙两运动员的水平.变式迁移3在某电脑杂志的一篇文章中,每个句子所含的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17;在某报纸的一篇文章中,每个句子所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?几种表示频率分布的方法的优点与不足(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.(3)频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体密度曲线.(4)用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.课时作业一、选择题1.关于频率分布直方图中的有关数据,下列说法正确的是()A.小矩形的高表示取某数的频率B.小矩形的高表示该组上的个体在样本中出现的频率C.小矩形的高表示该组上的个体数与组距的比值D.小矩形的高表示该组上个体在样本中出现的频率与组距的比值2.关于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是()A.频率分布直方图与总体密度曲线无关B.频率分布直方图就是总体密度曲线C.样本容量很大的频率分布直方图就是总体密度曲线D.如果样本容量无限增大,分组的组距无限减小,那么相应的频率分布折线图会越来越接近一条光滑曲线,则这条光滑曲线为总体密度曲线3.已知10个数据如下:63,65,67,69,66,64,66,64,65,68.如果对这些数据绘制频率分布表,那么其中在64.5~66.5这组的频率是()A.0.4 B.0.5 C.5 D.4A.0.5 B.0.24 C.0.6 D.0.7二、填空题5.在求频率分布时,把数据分为5组,若已知其中的前四组频率分别为0.1,0.3,0.3,0.1,则第五组的频率是______,这五组的频数之比为________.6.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的13,且中间一组的频数为10,则这个样本容量是________.三、解答题7.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为6月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?8.有关部门从甲,乙两个城市所有的自动售货机中分别随机抽取了16台,记录下一上午各自的销售情况如下:(单位:元)甲18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41乙22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23(1)请画出这两组数据的茎叶图.(2)将这两组数据进行比较分析,你能得到什么结论?§2.2用样本估计总体2.2.1用样本的频率分布估计总体的分布自学导引1.最大值与最小值变化的幅度全距2.个数频数频数样本容量频率3.频率与组距的比值相应各组的频率 14.上边的中点5.个数与总数比值总体的分布光滑曲线y=f(x)总体密度曲线6.原始信息随时记录对点讲练例1解(1)计算:61-48=13;(2)决定组距与组数,取组距为2,∵132=612,∴共分7组;(3)决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下7组:47.5~49.5,49.5~51.5,51.5~53.5,53.5~55.5,55.5~57.5,57.5~59.5,59.5~61.5.(4)51.5~53.5 7 0.175 53.5~55.5 8 0.20 55.5~57.5 11 0.275 57.5~59.5 5 0.125 59.5~61.5 2 0.05 合计4040 1.00(5)(6)取各小长方形上边的中点并用线段连接就构成了频率分布折线图. 变式迁移1 解 (1)分组 频数 频率[-20,-15)7 0.035 [-15,-10)11 0.055 [-10,-5)15 0.075 [-5,0)40 0.200 [0,5) 49 0.245 [5,10) 41 0.205 [10,15) 20 0.100 [15,20) 17 0.085合计200 (2)(3)样本数据不足0的频率为7+11+15+40200=0.365.例2 解 (1)寿命(h ) 频数 频率100~20020 0.10 200~30030 0.15 300~40080 0.40 400~50040 0.20 500~60030 0.15 合计200 1.00 (2)(3)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的频率为0.35.变式迁移2 解 (1)第四小组的频率为1-(0.1+0.3+0.4)=0.2. (2)n =第一小组的频数÷第一小组的频率=5÷0.1=50.(3)由0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,得第一、第二、第三、第四小组的频数分别为5,15,20,10.所以学生跳绳次数的中位数落在第三小组内. 例3 解 (1)作出茎叶图如下图:(2)由上面的茎叶图可以看出,甲运动员的得分情况是大致对称的,中位数是36分;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26分.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.变式迁移3 解 (1)茎叶图如图所示:(2)电脑杂志上每个句子的字数集中在10~30之间,报纸上每个句子的字数集中在20~40之间,说明电脑杂志上每个句子的平均字数要比报纸上每个句子的平均字数要少.课时作业 1.D 2.D3.A [∵在这组中的数只有4个,∴频率=410=0.4.]4.D5.0.2 1∶3∶3∶1∶2 6.40解析 可知中间长方形的面积是所有长方形面积的14,即频率为14,∴样本容量为1014=40.7.解 (1)依题意知第三组的频率为42+3+4+6+4+1=15,又∵第三组的频数为12,∴本次活动的参评作品数为1215=60(件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×62+3+4+6+4+1=18(件)(3)第四组的获奖率是1018=59,第六组上交的作品数量为60×12+3+4+6+4+1=3(件)∴第六组的获奖率为23=69,显然第六组的获奖率较高. 8.解 (1)茎叶图如图所示.(2)由图可以看出乙城市的销售额分布较对称,集中程度较高,故乙城市一上午的销售情况比较稳定且销售额较高.。
教学设计1:2.2.1 用样本的频率分布估计总体的分布
2.2.1 用样本的频率分布估计总体的分布三维目标1.知识与技能(1)通过实例体会分布的意义和作用.(2)在表示样本数据的过程中学会列频率分布表画频率分布直方图,通过实例体会频率分布直方图的特征.2.过程与方法(1)会根据具体的样本特征选择合适的方式来表示样本分布.(2)能通过对数据的分析为合理决策提供依据,体会统计在现实生活中的作用.(3)能通过对现实生活中的问题的探究感知应用数学知识解决问题的方法及统计的思想、方法.3.情感、态度与价值观(1)通过对数据分析,为合理决策提供依据,初步感受统计结果的随机性与规律性,体会统计思想与确定性思维的差异.(2)通过样本频率分布直方图,对总体估计的过程进一步体会统计思想,感受数学对实际生活的应用及对实际问题解决的指导作用,体会数学知识与现实生活的联系.重点难点通过以上分析,确定本节课教学的重点是:会列频率分布表,画频率分布直方图.教学难点是:能通过样本的频率分布估计总体的分布.教学时要抓知识选择的切入点,从学生原有的认知水平和所需的知识特点入手,引导学生结合初中学习过的频率知识,不断地观察、比较、分析,采用分组讨论的方式,学生独立画出频率分布直方图,明确其特征,学会对总体进行估计,同时引导学生进行解题方法的总结从而化解难点.引导学生回答所提问题,学生通过小组讨论,教师指导以及对例题的研究与分析,学会列频率分布表,画频率分布直方图从而强化了重点.教学建议通过对现实生活中实际例子的讲解,以及前面知识的回顾,教会学生观察——猜想——发现——概括(归纳)的学习方法,让学生进一步了解“转化”的数学思想方法,在教学中培养学生的逻辑思维能力和空间想象能力,并在教学中逐步提高学生论证问题的能力.根据本节内容较抽象,学生不易理解的特点,本节教学采用启发式教学,辅以观察法、发现法、讲练结合法.采用这种方法的原因是高一学生的领会思想的能力比较差,通过对现实生活中实际例子的讲解,以及前面知识的回顾,使其理解并掌握本节知识.本节课让学生通过熟知的一组数据的代表-众数,中位数,平均数下,并辅以计算器、多媒体手段,通过一定手脑结合的训练,让学生感受在只能得到频率分布直方图的情况下也可以估计总体数字特征.在课堂结构上,根据学生的认知水平,采取“仔细观察—分析研究—小组讨论—总结归纳” 的方法,使知识的获得与知识的发生过程环环相扣,层层深入,从而顺利完成教学目标.教学流程课标解读1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.(重点) 3.能够利用图形解决实际问题.(难点)知识1频率分布直方图【问题导思】美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51, 54,51,60,62,43,55,56,61,52,69,64,46,54,481.上述44个数据中最大值与最小值的差是多少?【提示】69-42=27.2.若将上述数据分成下列几组,[41.5,45,5),[45.5,49.5),[49.5,53.5),[53.5,57.5),[57.5,61.5)[61.5,65.5),[65.5,69.5).各组中数据个数是多少?【提示】各组数据的个数依次为2,7,8,16,5,4,2.3.在直角坐标系中,能否将各组统计的数据直观地表示出来?【提示】可以.画频率分布直方图的步骤知识2频率分布折线图和总体密度曲线1.频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到了频率分布折线图.2.总体密度曲线随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.知识3茎叶图茎叶图中的茎是指中间的一列数,叶就是从茎的旁边生长出来的数.类型1频率分布表和频率分布直方图例1下表给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).区间界限[122,126)[126,130)[130,134)[134,138)[138,142)人数58102233区间界限[142,146)[146,150)[150,154)[154,158)人数201165(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.解(1)样本频率分布表如下:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158]50.04合计1201(2)其频率分布直方图如下:(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.规律方法1.在列频率分布表时,极差、组距、组数有如下关系:(1)若极差组距为整数,则极差组距=组数;(2)若极差组距不为整数,则极差组距的整数部分+1=组数.2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.变式训练有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.(1)列出学生参加运动队的频率分布表;(2)画出频率分布条形图.解(1)计算最大值与最小值的差:61-48=13.(2)决定组距与组数,取组距为2.∵132=612,∴共分7组.(3)决定分点,分成如下7组:[47.5~49.5),[49.5~51.5),[51.5~53.5),[53.5~55.5),[55.5~57.5),[57.5~59.5),[59.5~61.5].(也可以分为[48,50),[50,52),[52,54),[54,56),[56,58),[58,60),[60,62]7组)(4)列出频率分布表:分组频数频率[47.5~49.5)20.05[49.5~51.5)50.125[51.5~53.5)70.175[53.5~55.5)80.2[55.5~57.5)110.275[57.5~59.5)50.125[59.5~61.5]20.05合计40 1.00(5)作出频率分布直方图如图.(6)取各小长方形上端的中点并用线段连接就构成了频率分布折线图.类型2茎叶图的绘制及应用例2某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,86,91,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,88,110,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.解甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况大致是对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此乙同学发挥比较稳定,总体得分情况比甲同学好.变式训练某良种培育基地正在培养一种小麦新品种A,将其与原有一个优良品种B进行对照实验,两种小麦各种植了25亩,所得亩产量数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,4 45,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,4 15,416,422,430(1)画出两组数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量用其稳定性进行比较,写出统计结论.解(1)茎叶图如图所示.A B9 7358 7363537 1 4838 3 5 69 239 1 2 4 4 5 7 75 0400 1 1 36 75 4 2410 2 5 67 3 3 14224 0 04305 5 3444 145(2)用茎叶图处理现有的数据不但可以看出数据的分布情况,而且可以看出每组中的具体数据.(3)通过观察茎叶图,可以发现品种A的平均亩产量约为411.1千克,品种B的平均亩产量为397.8千克.由此可知品种A的平均亩产量比品种B的平均亩产量高,但品种A的亩产量不够稳定,而品种B的亩产量比较集中在平均亩产量附近.类型3频率分布直方图、折线图的综合应用例3为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55)4;[11.55,11.65],2.(1)列出频率分布表;(2)画出频率分布直方图以及频率分布折线图;(3)据上述图表,估计数据落在[10.95,11.35)范围内的可能性是百分之几?(4)数据小于11.20的可能性是百分之几?【思路探究】根据画频率分布直方图的步骤先画频率分布直方图,再画折线图,然后结合直方图的特征解决(3)(4).解(1)频率分布表如下:分组频数频率[10.75,10.85)30.03[10.85,10.95)90.09[10.95,11.05)130.13[11.05,11.15)160.16[11.15,11.25)260.26[11.25,11.35)200.20[11.35,11.45)70.07[11.45,11.55)40.04[11.55,11.65]20.02合计100 1.00(2)频率分布直方图及频率分布折线图,如图(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为1-(0.03+0.09)-(0.07+0.04+0.02)=0.75=75%,即数据落在[10.95,11.35)范围内的可能性是75%.(4)数据小于11.20的可能性即数据小于11.20的频率,设为x , 则(x -0.41)÷(11.20-11.15) =(0.67-0.41)÷(11.25-11.15), 所以x -0.41=0.13,即x =0.54, 从而估计数据小于11.20的可能性是54%. 规律方法频率分布直方图的性质:1.因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2.在频率分布直方图中,各小矩形的面积之和等于1. 3.频数/相应的频率=样本容量.4.在频率分布直方图中,各矩形的面积之比等于频率之比,各矩形的高度之比也等于频率之比. 变式训练为了解某校高一年级学生的体能情况,抽取部分学生进行一分钟跳绳测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110)为达标,则该校全体高一年级学生的达标率是多少? 解 (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由频率分布直方图可估计,该校高一年级学生的达标率为17+15+9+32+4+17+15+9+3×100%=88%.课堂小结1.列频率分布直方图的步骤:(1)计算数据中最大值和最小值的差.知道了极差就知道了这组数据的变动范围有多大;(2)决定组数和组距.组距是指每个小组的两个端点之间的距离;(3)决定分点;(4)列频率分布表;(5)绘制频率分布直方图.2.列频率分布直方图的注意事项:(1)组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).(2)分点数的决定方法是:若数据为整数,则分点数据减去0.5;若数据是小数点后一位的数,则分点减去0.05,以此类推.当堂双基达标1.从一群学生中抽取一个一定容量的样本,对他们的学习成绩进行分析.已知不超过80分的为10人,其累积频率为0.5,则样本容量是()A.20人B.40人C.80人D.60人【解析】样本容量=100.5=20人.【答案】A2.一个容量为20的样本数据,分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2.则样本在区间[20,60)上的频率是()A.0.5 B.0.6 C.0.7 D.0.8【解析】频率=3+4+5+42+3+4+5+4+2=1620=45=0.8.【答案】D3.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)的汽车大约有______辆.【解析】在[50,60)的频率为0.03×10=0.3,∴汽车大约有200×0.3=60(辆).【答案】604.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:分组频数频率[50.5,60.5)40.08[60.5,70.5)0.16[70.5,80.5)10[80.5,90.5)160.32[90.5,100.5]合计50(1)填充频率分布表的空格(将答案直接填在表格内);(2)补全频率分布直方图.解(1)分组频数频率[50.5,60.5)40.08[60.5,70.5)80.16[70.5,80.5)100.20[80.5,90.5)160.32[90.5,100.5]120.24合计50 1.00 (2)频率分布直方图如图所示:。
2.2.1用样本的频率分布估计总体
频率/组距
0.4 0.3 0.2 0.1 0 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5
用水量范围
连接频率分布直方图中各个小长方形上端的中点,频率分布折线图
随着样本容量的增加,作图时所分的组数也会增加,相应的频 率折线图会越来越接近于一条光滑的曲线,统计学中称这条光滑的 曲线为总体密度曲线
(3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少?
解:(1)组距为3,列频率分布表
分组 频数 频率 频率/ 组距
[12.5, [15.5, [18.5, [21.5, [24.5, [27.5, [30.5,
15.5) 3 18.5) 8 21.5) 9 24.5) 11 27.5) 10 30.5) 5 33.5) 4
甲 8 4 6 3 3 6 8 3 8 9 1 0 1
乙
2 5 5 4 1 1 6 6 7 9 4 9 0
2
3 4 5
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图上没 有原始数据信息的损失,所有数据信息都可以从茎叶图 中得到;二是茎叶图中的数据可以随时记录,随时添加, 方便记录与表示; (2)茎叶图只便于表示两位(或一位)有效数字的数据, 对位数多的数据不太容易操作;而且茎叶图只方便记录 两组的数据,两个以上的数据虽然能够记录,但是没有 表示两个记录那么直观,清晰; (3)茎叶图对重复出现的数据要重复记录,不能遗漏.
[0,0.5 ),[0.5,1 ),…,[4,4.5]
分组时,通常对组内数值所在区间取左 闭右开区间,最后一组取闭区间,当然也 可以采用其他分组方法。
4.列频率分布表
2.2.1用样本的频率分布估计总体分布
1
板出课题 1 分钟
让学生展开讨论 2 分钟
填空 2 分钟
以课本 P66 制定 居民用水标准问 题为例, 题为例,经过以 上几个步骤画出 频率分布直方 图。 学生动手作 ( 图)10 分钟 让学生仔细观察 表和图, 表和图,得出结 论 2 分钟
心灵寄语 :后悔过去,不如奋斗将来。——马克思 (1) 从频率分布直方图可以清楚的看出数据分布的总体趋势。 ) 从频率分布直方图可以清楚的看出数据分布的总体趋势。 不出原始的数据内容, (2) 从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有 ) 从频率分布直方图得不出原始的数据内容 把数据表示成直方图后, 的具体数据信息就被抹掉了。 的具体数据信息就被抹掉了。 探究〗 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。 :同样一组数据 〖探究〗 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。 : 不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断, 不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以 0.1 和 1 为组距 重新作图,然后谈谈你对图的印象? 重新作图,然后谈谈你对图的印象? 思考〗 :如果当地政府希望使 以上的居民每月的用水量不超出标准, 〖思考〗 如果当地政府希望使 85%以上的居民每月的用水量不超出标准,根据频率分布表 2-2 : 以上的居民每月的用水量不超出标准 和频率分布直方图 2.2-1,你能对制定月用水量标准提出建议吗? ,你能对制定月用水量标准提出建议吗? 频率分布折线图、 〈二〉频率分布折线图、总体密度曲线 1.频率分布折线图的定义: .频率分布折线图的定义: 连接频率分布直方图中各小长方形上端的中点 就得到频率分布折线图。 中各小长方形上端的中点, 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。 2.总体密度曲线的定义: .总体密度曲线的定义: 在样本频率分布直方图中, 相应的频率折线图会越来越接近于一条光滑曲线, 在样本频率分布直方图中, 相应的频率折线图会越来越接近于一条光滑曲线, 统计中 称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比, 称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比, 它能给我们提供更加精细的信息。 它能给我们提供更加精细的信息。 思考〗 〖思考〗 : 对于任何一个总体,它的密度曲线是不是一定存在?为什么? 1.对于任何一个总体,它的密度曲线是不是一定存在?为什么? 对于任何一个总体,它的密度曲线是否可以被非常准确地画出来? 2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么 实际上,尽管有些总体密度曲线是饿、客观存在的, 实际上,尽管有些总体密度曲线是饿、客观存在的,但一般很难想函数图象那样准确 地画出来,我们只能用样本的频率分布对它进行估计 一般来说,样本容量越大, 进行估计, 地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估 计就越精确. 计就越精确. 〈三〉茎叶图 茎叶图的概念: 1.茎叶图的概念: 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字, 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数 字表示个位数,即第二个有效数字,它的中间部分像植物的茎, 字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出 来的叶子,因此通常把这样的图叫做茎叶图。 来的叶子,因此通常把这样的图叫做茎叶图。 2.茎叶图的特征: .茎叶图的特征: 用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失, (1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据 信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加, 信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记 录与表示。 录与表示。 茎叶图只便于表示两位有效数字的数据, 且茎叶图只方便记录两组的数据, (2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个 以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。 以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。 三、典型例题 例题精析】 【例题精析】 人的身高(单位cm cm) 例 1 下表给出了某校 500 名 12 岁男孩中用随机抽样得出的 120 人的身高(单位cm) 观察表和图, 观察表和图,得 出结论 2 分钟
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
①列出样本的频率分布表(含累积频率)
②根据频率分布表估计高度小于 134cm 的树苗占总树苗的 百分比. ③若树苗的高度在 130cm~154cm 为最标准.那么,标准率 是多少? ④求这种新品种树苗的平均高度 M 的取值范围
-2-
启航书院
高中数学必修三
2.2.1 用样本的频率分布估计总体分布
뾼뗣뛾ꎺ욵싊럖늼횱랽춼폫폫욵싊럖늼헛쿟춼
2.绘制频率分布表的基本步骤: 第一步,求极差.(一组数据中最大值与最小值的差) 第二步,确定组距与组数。组距是指每个小组的两个端点之间的距离。极差、组距、组数有如下关系: ①若
极差 极差 为整数,则 =组数 组距 组距
②若
极差 极差 不为整数,则【 】+1=组数。 组距 组距
第三步,分组,通常对组内数值所在的区间取左闭右开区间,最后一组取闭区间。 第四步,统计各组数据的频数,计算频率,填入表格中,完成频率分布表。 例 2:一个容量为 80 的样本中数据的最大值为 140,最小 值为 51.组距为 10, 则应将样本数据分为的组数为____组. 例 3: 某市 100 位居民某年的月均用水量如下表 (单位:t) : 变式 2:一个容量为 80 的样本中数据的最大值为 140,最 小值为 50.组距为 10, 则应将样本数据分为的组数为__组. ⑶对样本数据进行分组,其组数是由哪些因素确定的?
(1)求样本在[15,18)内的频率; (2)求样本容量; (3)若在[12,15)内的小矩形面积为 0.06,求在[18,33)内 的频数.
①直方图中 x 的值为______. ②在这些用户中,用电量落在区间[100,250)内的户数为
______.
变式 6:⑴某校从高一年级学生中随机抽取部分学生,将 他们的模块测试成绩分为 6 组:[40,50), [50,60),[60,70), [70,80), [80,90), [90,100]加以统计,得到如图所示的 频率分布直方图,已知高一年级共有学生 600 名,据此估 计,该模块测试成绩不少于 60 分的学生人数为( )
★频率分布直方图的性质 ⑴图中每个小长方形的面积表示相应各组的频率。 ⑵即小长方形的面积=组距× 频率 频率 。
组距 频数 ⑶ 样本容量 . 相应的频率
⑷频率分布直方图中,各矩形的面积之比等于频率之比,各矩形的高度之比也等于频率之比. 例 6:如图所示是总体的一个样本频率分布直方图,且在 ⑵从某小区抽取 100 户居民进行月用电量调查,发现其用 [15,18)内频数为 8. 电量都在 50 到 350 度之间,频率分布直方图如下所示.
⑴列出频率分布表。 ⑵画出频率分布直方图以及频率分布折线图。 ⑶根据上述图表, 估计数据落在[10.95,11.35)范围内的可 能性是多大?
-3-
启航书院
高中数学必修三
2.2.1 用样本的频率分布估计总体分布
变式 5:对某电子元件进行寿命追踪调查,情况如下:
(1)列出频率分布表; (2)画出频率分布直方图和折线图; (3)估计件寿命在 100~400h 以内的在总体中占的比例; (4)估计电子元件寿命在 400h 以上的在总体中占的比例.
变式 4: ⑴某市 2010 年 4 月 1 日~4 月 30 日对空气污染指 数的监测数据如下(主要污染物为可吸人颗粒物): 61,76,70,56,81,91,92,91,75,81,88,67 , 101, 103,95, 91,77,86,81,83,82,82,64,79,86,85,75,71,49,45. 列出频率分布表。
⑴上述 106 个数据中的最大值和最小值分别是什么?极差 为多少?
⑵如果将上述 106 个数据按组距为 5mm 进行分组,那么这 些数据共分为多少组?
⑶对样本数据进行分组,其组数是由哪些因素确定的?
例 4:为了检测某种产品的质量,抽取了一个容量为 100 的样本,数据的分组如下:
列出频率分布表。
⑵一个容量为 10 的样本的最大值 140, 最小值是 51, 组距 为 10,则可分成 组。 ⑶一个容量为 n 的样本,分成若干组,已知某组的频数和 频率分别是 50 和 0.25,则 n= . ⑷设样本容量为 40,把数据分成四组,若第一小组的频率 为 0.1, 则第二小组的频率为 0.4; 第四小组的频率为 0.2, 则第三小组的频数是 。 ⑸某人培育了一种新品种的树苗 500 株.现从中随机抽样 得到样本容量为 120 的样本.对这些样本树苗检侧后得到 高度的资料(单位:助)如下表.
⑶某学校组织学生参加英语测试,成绩的频率分布直方图 如图,数据的分组依次为[20,40),[40,60),[60,80), [80,100).若低于 60 分的人数是 15 人, 则该班的学生人数 是( )
-4-
启航书院
高中数学必修三
2.2.1 用样本的频率分布估计总体分布
Байду номын сангаас
⑷在抽查产品的尺寸过程中,将尺寸分成若干组,[a,b] 是其中的一组.抽查出的个体在该组上的频率为 m, 该组上 的直方图的高度为 h 则∣a-b∣等于______.
变式 7:⑴某中学高二(2)班甲、乙两名同学自高中以来每 场数学考试成绩情况如下: 甲:95,81,75,89,71,65,76,88,94,110,107; 乙:83,86,93,99,88,103,98,114,98,79,101.
-5-
启航书院
高中数学必修三
2.2.1 用样本的频率分布估计总体分布
频率 ; 组距
第三步,依据频率分布表以及确定的矩形的大小绘制频率分布直方图. 3.횪쪶웊컶 (1)根据频率分布直方图中矩形的宽与高,可知每个矩形的面积即为该组数据的频率.这样,频率分布直方图就以面积的 形式反映了数据落在各个小组的频率的大小. (2)由频率的和为 1 可知,所有矩形面积的和等于 1. 4.频率分布折线图 顺次连接频率分布直方图中各个矩形的上端的中点,就得到频率分布折线图.为了方便看图,一般习惯把频率分布折线 图画成与横轴相连,所以横轴的左右端点没有实际的意义. 通过折线的起伏,能清楚、直观地表示出数量增减变化的情况. 5.总体密度曲线 如果样本容量越大,所分组数越多,样本的频率分布越接近总体的频率分布.如果分组的组距不断缩小,则频率分布 直方图所对应的频率分布折线图会越来越接近一条光滑曲线,统计中称这条光滑曲线为总体密度曲线,如图.
⑷组内数值所在的区间取左闭右开区间,最后一组取闭区 间,对组内数据进行分组。
⑸计算各组的频率,完成下面的频率分布表。
⑴上述 100 个数据中的最大值和最小值分别是什么?极差 为多少?
⑵如果将上述 100 个数据按组距为 0.5 进行分组,那么这 些数据共分为多少组?
-1-
启航书院
高中数学必修三
2.2.1 用样本的频率分布估计总体分布
⑶某市对上下班交通情况作抽样调查,作出上下班时间各 抽取的 12 辆机动车行驶时速(单位:km/h)的茎叶图如图, 则上下班时间行驶时速的中位数分别为____、_____.
⑷某校开展“爱我海西、爱我家乡”摄影比赛,9 位评委 为参赛作品 A 给出的分数如图.记分员在去掉一个最高分 和一个最低分后,算得平均分为 91.复核员在复核时,发 现有一个数字(茎叶图中的 x )无法看清,若记分员计算无 误,则数字 x 应该是_____.
⑸200 辆汽车通过某一段公路时的时速频率分布直方图如 图所示,则时速在[50,70)内的汽车大约有______辆.
뾼뗣죽ꎺ뺥튶춼
1.茎叶图的概念 统计中还有一种表示数据的图,称为茎叶图,茎是指中间的一列数,叶是从茎旁边生长出来的数,常用来记录两位数 的数据. 2.茎叶图的制作步骤: 第一步,将数据分为“茎” “叶”两个部分.若数据是两位数,一般将两位数的十位数字作为茎,个位数字作为叶. 第二步,将所有的茎按大小顺序(一般是由小到大的顺序),自上而下排成一列,茎相同的共用一个茎,即剔除重复的 数字,再画上一条竖线作为分界线,区分茎和叶. 第三步,将各个数据的“叶”按一定顺序在分界线的另一侧对应茎处同行列出. 例如,将数据 9,12,13,24,25,30,31,40 用茎叶图表示如图. 3.茎叶图的特征: (1)用茎叶图表示数据有两个优点: 一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到; 二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. (2)茎叶图只便于表示两位数的数据,对位数多的数据不太容易操作;而且茎叶图只方便记录两组的数据,两组以上的 数据虽然能够记录.但是没有记录两组数据那么直观、清晰. (3)对重复出现的数据要重复记录,不能遗漏. 例 7:甲、乙两个学习小组在一次测验中的得分情况如 ⑵某学校随机抽取 20 个班, 调查各班中有网上购物经历的 下:(单位:分) 人数, 所得数据的茎叶图如图所示.以组距为 5 将数据分组 甲:53,56,64,69,71,72, 72, 73,74,75,75,76, 成[0,5),[5,10), …,[30,35),[35,40]时,所作的频率 78,81,83,90; 分布直方图是( ) 乙:48,54,57,58,64,65,66,66,69,69,70,71,72, 75,80,91. 制作茎叶图试比较这两组学生的学习成绩.
启航书院
高中数学必修三
2.2.1 用样本的频率分布估计总体分布
2.2.1 폃퇹놾뗄욵싊럖늼맀볆ퟜ쳥럖늼
뾼뗣튻ꎺ욵싊럖늼뇭
1.频数与频率 将一批数据按要求分成若干组,各组内数据的个数,叫做该组的频数。每组频数除以全体数据的个数的商叫做该数 的频率,表示该组数据在样本中所占比例的大小。 例 1:一个班有 50 名同学,一次考试的成绩如下。 ⑵已知一个容量是 40 的样本, 把它分成六组, 第一组到第 四组的频数分别是 5,6,7,10,第五组的频率是 0.2,那么 第六组的频数是_______,频率是_______. ①分数在[60,70)上的频数是_______,频率为_______. ②及格的频数是_______,频率为_______. ③不及格频数_________,频率为_______. 变式 1:⑴一个容量为 20 的样本数据,将其分组如下表: ⑶从某一总体中抽取一个个体数为 200 的样本,得到分组 与频数如下: [10,15),6;[15,20),8;[20,25),13;[25,30),35;[30,35), 46;[35,40),34;[40,45),28;[45,50),15;[50,55), 10; [55, 60],5.则样本在[35, 80)上的频率是( 其样本在区间(-∞,50)上的频率为_______. A. 0.69 B. 0.46 C.1 D.不存在 )