2.2.1用样本的频率估计总体
2.2.1用样本的频率估计总体的分布
它能够精确地反映了总体在各个范围内取值的百分 比,它能给我们提供更加精细的信息.
总体密度曲线
频率 组距
月均用 水量/t
a
b
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
总体密度曲线
总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。是研究 总体分布的工具. 用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布折线图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。
2.2.1用样本的频率分布 估计总体分布(1)
我国是世界上严重缺水的国家之一, 城市缺水问题较为突出。
2000年全国主要城市中缺 水情况排在前10位的城市
探究:某市政府为了节约生活用水,计划在本 市试行居民生活用水定额管理,即确定一个 居民月用水量标准a , 用水量不超过a 的部分 按平价收费,超过a 的部分按议价收费。 ①如果希望大部分居民的日常生活不受影响, 那么标准a 定为多少比较合理呢? ②为了较合理地确定这个标准,你认为需要做 哪些工作?
(2009 福建卷)一个容量 100 的样本,其数据的分组与各组的频数如下表 组别 频数
(0,10]
(20, 20] (20,30) (30, 40)
(40,50]
(50,60]
(60,70]
12
13
24
15
16
13
7
则样本数据落在 (10, 40) 上的频率为 A. 0.13 B. 0.39 C. 0.52 D. 0.64
频率
组距
小长方形的 面积总和=?
0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
高一数学人教A版必修3课件:2.2.1-2用样本的频率分布估计整体分布
知识迁移
例1 在某小学500名学生中随机抽样得到 100人的身高如下表(单位cm) :
身高区间
[122,126) [126,130) [130,134) [134,138) [138,142)
人
数
2
8
9
[150,154)
18
[154,158)
28
身高区间
[142,146) [146,150)
人
数
15
思考5:当总体中的个体数比较少或样 本数据不密集时,是否存在总体密度曲 线?为什么?
不存在,因为组距不能任意缩小. 思考6:对于一个总体,如果存在总体密 度曲线,这条曲线是否惟一?能否通过 样本数据准确地画出总体密度曲线?
探究(二):茎叶图
频率分布表、频率分布直方图和折 线图的主要作用是表示样本数据的分布 情况,此外,我们还可以用茎叶图来表 示样本数据的分布情况.
小结作业
1.用样本的频率分布估计总体分布,当总体 中的个体数取值很少时,可用茎叶图估计总 体分布;当总体中的个体数取值较多时,可 将样本数据适当分组,用频率分布表或频率 分布直方图估计总体分布. 2.总体密度曲线可看成是函数的图象,对一 些特殊的密度曲线,其函数解析式是可求的. 3.茎叶图中数据的茎和叶的划分,可根据 样本数据的特点灵活决定.
10
6
4
(1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计该校学生身高小于134cm的人数约 为多少?
(1)频率分布表:
分 组 频数 频率
[122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158)
人教A版高中数学必修三课件:2.2.1 用样本的频率分布估计总体分布2 (2)
• (2)频率分布直方图如图所示.
• 累积频率分布图如图所示.
• (3) 由累积频率分布图可以看出,寿命在 100h~400h的电子元件出现的频率为0.65. • (4)由频率分布表可知,寿命在400h以上的 电子元件出现的频率为0.20+0.15=0.35, 故我们估计电子元件寿命在 400h以上的频 率为 0.35.
• 2.2 用样本估计总体 • 2.2.1 用样本的频率分布 • 估计总体分布
• [例1] 已知一个样本: 25,21,23,25,27,29,25,28,30,29,26,24,25,27,2 6,22,24,25,26,28,以2为组距,列出频率分 布表,绘制频率分布直方图,并由样本值 估计总体出现在22~28之间的频率.
• [解析] 频率分布表: 分组 20.5~22.5 22.5~24.5 24.5~26.5 频数累计 频数 2 3 8 频率 0.1 0.15 0.4
26.5~28.5
28.5~30.5 合计
4
3 20
0.2
0.15 1.00
• 频率分布直方图:
• 由样本频率分布表可知,样本值出现在 22~28之间的频率为0.15+0.40+0.2=0.75, 所以可以估计总体中出现在22~28之间的 数的频率约为0.75.
• [解析] (1)样本的频率分布表为:
起始月薪(百 频数 频率 元) [13,14) 7 0.07 [14,15) 11 0.11
[15,16) [16,17) [17,18) [18,19) [19,20) [20,21) 合计
26 23 15 8 4 6 100
0.26 0.23 0.15 0.08 0.04 0.06 1.00
• [解析] 由茎叶图可知,该班学生父亲的年 龄分布主要集中在40~60岁之间,平均年 龄大约在48岁左右;而母亲的年龄分布大 致对称,平均年龄大约在44岁左右,父亲 的平均年龄比母亲的平均年龄要大.
2.2.1用样本的频率分布估计总体分布
分 组 [0,0.5) [0,0.5) [0.5, [0.5,1) [1,1.5) [1,1.5) [1.5, [1.5,2) [2,2.5) [2,2.5) [2.5, [2.5,3) [3,3.5) [3,3.5) [3.5, [3.5,4) [4, [4,4.5] 合计
频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100
1.9 0.3 0.5 0.6 0.8 0.7 0.9 0.5 0.8 0.6
1.6 0.4 3.8 4.1 4.3 2.0 2.3 2.4 2.4 2.2
思考1 上述100个数据中的最大值和最 思考1:上述100个数据中的最大值和最 100 小值分别是什么? 小值分别是什么?由此说明样本数据的 变化范围是什么? 变化范围是什么? 0.2~ 0.2~4.3 思考2:样本数据中的最大值和最小值 思考2 的差称为极差 如果将上述100 极差. 100个数据 的差称为极差.如果将上述100个数据 组距为0.5进行分组 进行分组, 按组距为0.5进行分组,那么这些数据 共分为多少组? 共分为多少组? 4.3-0.2) (4.3-0.2)÷0.5=8.2
上图称为频率分布直方图, 上图称为频率分布直方图,其中横轴 频率分布直方图 表示月均用水量,纵轴表示频率/组距. 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高 度在数量上有何特点? 度在数量上有何特点?
思考2 思考2:频率分布直方图中各小长方形的 面积表示什么? 面积表示什么?各小长方形的面积之和 为多少? 为多少?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5
2.2.1用样本的频率分布估计总体的分布课件(刘爱娟,2014.2.26)
• • • • • • • • • •
25.39 25.41 25.40 25.37 25.35 25.40 25.36 25.41 25.47 25.40
25.36 25.43 25.39 25.44 25.32 25.43 25.42 25.32 25.34 25.35
25.34 25.44 25.41 25.33 25.45 25.44 25.39 25.38 25.30 25.41
1.将每个数据分为茎(高位)和叶(低位) 两部分,在此例中,茎为十位上的数字, 叶为个位上的数字. 2.将最小茎和最大茎之间的数按大小次序 排成一列,写在中间. 3.将各个数据的叶按大小次序写在其茎的 左(右)侧.
用茎叶图表示数据的优点
一是从统计图上没有原始信息的损失,所 有的数据信息都可以从茎叶图中得到; 二是茎叶图可以在比赛是随时记录,方便 记录与表示。但茎叶图只便于表示两位有 效数字的数据,虽然可以表示两个人以上 的比赛结果(或两个以上的记录),但没 有表示两个记录那么直观、清晰
二、频率分布折线图
把频率分布直方图各个长方形上边的中点用线段 连接起来,就得到分布折线图。
三、总体密度曲线
• 频率分布直方图表明了所抽取的100件产品中, 尺寸落在各个小组内的频率大小.样本容量越大, 所分组数越多,各组的频率就越接近于总体在相 应各组取值的概率.设想样本容量无限增大,分
组的组距无限缩小,则频率分布直方图就会无限 接近于一条光滑曲线——总体密度曲线.它反映 了总体在各个范围内取值的规率.总体密度曲线
3、甲乙两个小组各10名学生的英语口语测试成绩如下(单位:分)
甲组 76 乙组 82 90 84 84 85 86 89 81 79 87 80 86 91 82 89 85 79 83 74
人教A版必修3《2.2.1用样本的频率分布估计总体分布》优化训练ppt课件
(1)列出样本频率分布表; (2)画出频率分布直方图. 解:(1)在样本数据中,最大值是 518,最小值是 483,极 差为 35.
35 3 若取组距为 4,则 4 =84,要分为 9 组,组数合适,故取
组距为 4,分 9 组,分点比数据多一位小数,故把第一组起点
稍微小一点,故分组如下:
[482.5,486.5],[486.5,490.5],„,[514.5,518.5].
(2)频率分布直方图,如图 D13.
图 D13
【变式与拓展】
2.为了让学生了解环保知识,增强环保意识,某中学举行
了一次“环保知识竞赛”,共有 900 名学生参加了这次竞赛.为 了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为 整数,满分为 100 分)进行统计.请你根据尚未完成并有局部污损 的频率分布表和频率分布直方图(如图 2-2-3),解答下列问题: (1)填充频率分布表的空格(将答案直接填在表格内);
列表如下: 分组 [482.5,486.5) [486.5,490.5) [490.5,494.5) [494.5,498.5) [498.5,502.5) [502.5,506.5) [506.5,510.5) [510.5,514.5) [514.5,518.5] 合计 频数累计 正 正正正 正正正正 正正 正正 正正正 正 频数 8 3 17 20 14 10 19 6 3 100 频率 0.08 0.03 0.17 0.20 0.14 0.10 0.19 0.06 0.03 1.00
当数据由整数部分和小数部分组成时,可以把整数部分作为
________ ,小数部分作为________. 茎 叶
练习 2:为了了解某校教师使用多媒体进行教学的情况,
2.2.1用样本的频率分布估计总体分布
总体密度曲线
反映了总体在各个范围内取值的百分比,精确地 反映了总体的分布规律。是研究总体分布的工具. 用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。
定额管理,即确定一个居民月用水量标准a, 用水量不超过a的部分按平价收费,超出a的 部分按议价收费.那么①标准a定为多少比较合 理呢? ②为了较合理地确定这个标准,你认 为需要做哪些工作?
通过抽样,我们获得了100位居民某年的月平均 用 水量(单位: t) ,如下表:
思考:由上表,大家可以得到什么信息?
2019/4/10
二、画频率分布直方图的步骤
1.求极差(即一组数据中最大值与最小值的差)
4.3 - 0.2 = 4.1
极差 4.1 2.决定组距与组数: = 组距= = 0.5 8 组数
当数据在100个以内时,常分8-12组.
3.将数据分组
[0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
月均用水量 /t 4.5
归纳: 作频率分布直方图的方法为:
把横轴分成若干段,每一段对应一个组 的组距,以此线段为底作矩形,高等于 该组的频率/组距, 这样得到一系列矩形, 每一个矩形的面积恰好是该组上的频率, 这些矩形构成了频率分布直方图.
三、频率分布直方图再认识 1、小长方形
频率
的面积总和=?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
2019/4/10
当总体中的个体数很多时(如抽样调查全国城市 居民月均用水量) ,随着样本容量的增加,作图时 所分的组数增多,组距减少,你能想象出相应的 频率分布折线图会发生什么变化吗?
用样本估计总体2.2.1用样本的频率分布估计总体分布
频率 组距
0.1
0.2
0.3
0.4
0.5
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
平均数是频率分布直方图的“重心”. 用频率分布直方图估计平均数方法是
01
平均数≈图中每一个小矩形的面积×小矩形底边中点的横坐标之和
8 4 6 3 6 8 3 8 9 1
叶就是从茎的旁边生长出来的数,表示得分的个位数。
茎是指中间的一列数,表示得分的十位数
茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。 从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。 在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。
人数
2
3
2
3
4
1
1
1
平均数: 一组数据的算术平均数,即 x= 练习: 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示: 分别求这些运动员成绩的众数,中位数与平均数 平均数: 一组数据的算术平均数,即 x=
1
解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75. 上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;
0.5 1 1.5 2 2.5 3 3.5 4 4.5
5.画频率分布直方图
思考 : 如果当地政府希望使 85% 以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗? 注意 小正方形的面积=组距×频率/组距=频率 各小正方形的面积之和等于1. 每一小组频率实际上反映样本数据落在各个小组的比例大小。
必修三2.2样本估计总体
2.2.1《用样本的频率分布估计总体分布(一)》导学案【学习目标】1. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;2、通过实例体会频率分布直方图与频率折线图和茎叶图的各自特征,能恰当选择上述方法分析样本的分布,准确做出对总体的估计;【课前导学与探究】情境导入:在NBA某赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50 乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定? 如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布。
1.讨论:通过抽样方法收集数据的目的是什么?2.通常我们对总体作出的估计一般分成两种,一种是用 , 另一种是 。
3.频率分布是指一个样本数据在样本容量中所占比例的大小,一般可以用 反映样本的频率分布。
其一般步骤为:(1) 求极差,即计算 ;(2) 决定 ;○1组距与组数的确定没有确切的标准,将数据分组时组数应力求合适,以使数据的发布规律能较清楚地呈现出来. ○2组数与样本容量有关,一般样本容量越大,分的组数也越多,当样本容量不超过100时,常分5~12组. ○3组距的选择.组距= ,组距的选择力求取整,如果极差不利于分组(不能被组数整除)可适当增大极差,如在左右两端各增加适当的范围(尽量使两端增加的量相同); (3) 将数据 ;(4) 列 ;一般为四列:分组、频数累计、频数、频率,最后一行是合计,其中频数合计应是 ,频率合计是(5) 画频率分布直方图,画图时,应以横轴表示分组,纵轴表示 ,其相应组距上的频率等于 ,即每个=⨯=频率小长方形的面积组距组距 ,且各小长方形的面积的总和等于 。
4.频率分布折线图连接频率分布直方图中 的中点,就得到频率分布折线图.5.总体密度曲线:在做频率折线图时随着所分的组数增加,组距减小,相应的 图会越来越接近于一条 ,称之为 .【精讲点拨】例1、 在某小学500名学生中随机抽样得到100人的身高如下表(单位cm) : (1)列出样本频率分布表; (2)画出频率分布直方图;(3)估计该校学生身高小于134cm 的人数约为多少?【巩固练习】1.关于频率直方图的下列有关说法正确的是( )A .直方图的高表示取某数的频率B .直方图的高表示该组上的个体在样本中出现的频率C .直方图的高表示取某组上的个体在样本中出现的频数与组距的比值D .直方图的高表示取该组上的个体在样本中出现的频率与组距的比值 2( )A .0.80B .0.65C .0.40D .0.253.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1) 第二小组的频率是多少?样本容量是多少? (2) 若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3) 在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。
2.2.1 用样本的频率分布估计总体分布 课件(人教A版必修3) (1)
)
【做一做 2-2】 在画频率分布直方图时, 某组的频数为 10, 样本容量为 50, 总体容量为 600, 则该组的频率是( A.
1 5
) C.
1 10
B.
1 6 10 1
D.不确定
解析: 该组的频率是50 = 5. 答案: A
3.频率分布折线图和总体密度曲线 ( 1) 类似于频数分布折线图, 连接频率分布直方图中各个小长方形上端的中 点, 就得到频率分布折线图. 一般地, 当总体中的个体数较多时, 抽样时样本容量就不能太小.例如, 如果 要抽样调查一个省乃至全国的居民的月均用水量, 那么样本容量就应比调查一 个城市的时候大.可以想像, 随着样本容量的增加, 作图时所分的组数增加, 组距 减小, 相应的频率折线图会越来越接近于一条光滑曲线, 统计中称这条光滑曲线 为总体密度曲线.
频率分布折线图反映了数据的变化趋势.总体密度曲线反映了总体在各个范围 内取值的百分比, 它能给我们提供更加精细的信息.
( 2) 估计方法: 实际上, 尽管有些总体密度曲线是客观存在的, 但是在实际应 用中我们并不知道它的具体表达形式, 需要用样本来估计.由于样本是随机的, 不同的样本得到的频率分布折线图不同; 即使对于同一个样本, 不同的分组情况 得到的频率分布折线图也不同.频率分布折线图是随样本容量和分组情况的变 化而变化的, 因此不能用样本的频率分布折线图得到准确的总体密度曲线.
2.2
用样本估计总体
2.2.1
用样本的频率分布估计总体分布
1.了解分析数据的方法,知道估计总体频率分布的方法. 2.了解频率分布折线图和总体密度曲线,会画频率分布直方图和茎叶图. 3.理解频率分布直方图和茎叶图及其应用.
1.分析数据的方法 ( 1) 借助于图形. 用图将各个数据画出来, 作图可以达到两个目的, 一是从数据中提取信息; 二是利用图形传递信息. ( 2) 借助于表格. 用紧凑的表格改变数据的构成方式, 为我们提供解释数据的新方式.
2020版数学人教B版必修3学案:第二章 2.2.1 用样本的频率分布估计总体的分布(一) Word版含解析
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体的分布(一)学习目标 1.体会分布的意义和作用.2.学会用频率分布表,画频率分布直方图表示样本数据.3.能通过频率分布表或频率分布直方图对数据做出总体统计.知识点一 用样本估计总体 思考 还记得我们抽样的初衷吗?答案 用样本去估计总体,为决策提供依据. 梳理 用样本的频率分布估计总体的分布. 知识点二 频率分布表与频率分布直方图思考1 要做频率分布表,需要对原始数据做哪些工作? 答案 分组,频数累计,计算频数和频率. 思考2 如何决定组数与组距? 答案 若极差组距为整数,则极差组距=组数.若极差组距不为整数,则⎣⎢⎡⎦⎥⎤极差组距+1=组数. 注意:[x]表示不大于x 的最大整数.思考3 同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?答案 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.梳理 一般地,频数指某组中包含的个体数,各组频数和=样本容量;频率=频数样本容量,各组频率和等于1.在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用小长方形的面积来表示,各小长方形的面积的总和等于1.1.频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.( √ )2.频率分布直方图中小长方形的面积表示该组的个体数.( × ) 3.频率分布直方图中所有小长方形面积之和为1.( √ )题型一 频率分布的理解例1 关于频率分布直方图,下列说法正确的是( ) A .直方图中小长方形的高表示取某数的频率B .直方图中小长方形的高表示该组上的个体在样本中出现的频率C .直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值D .直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值 答案 D解析 注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.反思与感悟 由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失. 跟踪训练1 一个容量为20的样本数据,将其分组如下表:则样本在区间(-∞,50)上的频率为( ) A .0.5 B .0.25 C .0.6 D .0.7 答案 D解析 样本在区间(-∞,50)上的频率为2+3+4+520=1420=0.7.题型二 频率分布直方图的绘制例2 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 根据上面的数据,回答下列问题:(1) 这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?解(1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:频率分布直方图如图所示.(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称的状态,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.反思与感悟组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.跟踪训练2一个农技站为了考察某种麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表、绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm 之间的麦穗所占的百分比. 解 (1)计算极差:7.4-4.0=3.4; (2)决定组距与组数:若取组距为0.3,因为3.40.3≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12;(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55; (4)列频率分布表:(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm 之间的麦穗约占41%. 题型三 频率分布表及频率分布直方图的应用例3 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a ,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).解 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.反思与感悟 在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.跟踪训练3 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少? 解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的, 因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.1.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )A .20B .30C .40D .50 答案 B解析 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.2.已知样本数据:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的是() A.[5.5,7.5) B.[7.5,9.5)C.[9.5,11.5) D.[11.5,13.5]答案 D解析列出频率分布表,依次对照就可以找到答案,频率分布表如下:从表中可以看出频率为0.2的是[11.5,13.5],故选D.3.如图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的优秀(120分及以上为优秀)率为________.答案30%解析优秀率为10×(0.022 5+0.005+0.002 5)=0.3=30%.4.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是________.答案21解析根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.∵样本中数据在[20,60)内的频率为0.6,样本容量为50,∴4+5+x+y50=0.6,解得x+y=21.即样本在[40,50),[50,60)内的数据个数之和为21.5.暑假期间某班为了增强学生的社会实践能力,把该班学生分成四个小组到一果园帮果农测量果树的产量,某小组来到一片种植苹果的山地,他们随机选取20株作为样本测量每一株的果实产量(单位:kg),获得的数据按照区间[40,45),[45,50),[50,55),[55,60]进行分组,得到如下频率分布表:已知样本中产量在区间[45,50)内的株数是产量在区间[50,60]内的株数的43倍.(1)分别求出a ,b ,c 的值; (2)作出频率分布直方图. 解 (1)易得c =1.0.由题意得⎩⎪⎨⎪⎧a =43(0.1+b ),0.3+a +0.1+b =1.0,∴a =0.4,b =0.2.(2)根据频率分布表画出频率分布直方图,如图所示.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布. 2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.一、选择题1.观察新生婴儿的体重(单位:g),其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000)内的频率为( )A .0.001B .0.01C .0.003D .0.3答案 D解析 频率=频率组距×组距,组距=3 000-2 700=300,频率组距=0.001, ∴频率=0.001×300=0.3.2.容量为100的样本数据,按从小到大的顺序分为8组,如下表:第三组的频数和频率分别是( ) A .14和0.14 B .0.14和14 C.114和0.14 D.13和114答案 A解析 x =100-(10+13+14+15+13+12+9)=100-86=14,第三组的频率为14100=0.14.3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18 答案 C解析 志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36×1=18, 有疗效的人数为18-6=12.4.某校为了解高三学生的身体情况,抽取了100名女生的体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重在[40,45) kg 的人数是( )A .10B .2C .5D .15 答案 A解析 由图可知频率=频率组距×组距,频率=0.02×5=0.1,∴女生体重在[40,45) kg 的人数为0.1×100=10.5.为了了解某幼儿园儿童的身高情况,抽查该园120名儿童的身高绘制成如图所示的频率分布直方图,则抽查的120名儿童身高大于或等于98 cm 且小于104 cm 的有( )A .90名B .75名C .65名D .40名 答案 A解析 由图可知身高大于或等于98 cm 且小于104 cm 的儿童的频率为(0.1+0.15+0.125)×2=0.75,抽查的120名儿童有120×0.75=90(名)儿童的身高大于或等于98 cm 且小于104 cm. 6.将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 的值为( ) A .20 B .27 C .6 D .60答案 D解析 ∵n ·2+3+42+3+4+6+4+1=27,∴n =60.7.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120 答案 B解析 ∵少于60分的学生人数为600×(0.05+0.15)=120, ∴不少于60分的学生人数为600-120=480.8.对某种电子元件使用寿命进行跟踪调查,所得样本频率分布直方图如图.由图可知,这一批电子元件中寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量的比是( )A .1∶2B .1∶3C .1∶4D .1∶6 答案 C解析 由题意,寿命在100~300 h 的电子元件的频率为100×⎝⎛⎭⎫12 000+32 000=0.2,寿命在300~600 h 的电子元件的频率为100×⎝⎛⎭⎫1400+1250+3 2 000=0.8,则寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量比大约是0.2∶0.8=1∶4. 二、填空题9.将一个容量为n 的样本分成若干组,已知甲组的频数和频率分别为36和14,则容量n =________,频率为16的乙组的频数是________.答案 144 24解析 14=36n ,所以n =36×4=144,同理16=x144,x =24.10.某大学对1 000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图(如图所示),现规定不低于70分为合格,则合格人数是________.答案 600解析 由频率分布直方图知合格的频率为(0.035+0.015+0.01)×10=0.6, 故合格人数为1 000×0.6=600.11.下列命题正确的是________.(填序号)①频率分布直方图中每个小矩形的面积等于相应组的频数; ②频率分布直方图中各小矩形面积之和等于1;③频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比. 答案 ②③解析 在频率分布直方图中,横轴表示样本数据,纵轴表示频率组距.由于小矩形的面积=组距×频率组距=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1.综上可知②③正确.12.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案 9解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.13.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.则频率分布直方图中x 的值为 __________.答案 0.004 4解析 ∵(0.002 4+0.003 6+0.006 0+x +0.002 4+0.001 2)×50=1,∴x =0.004 4. 三、解答题14.为加强中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了了解成绩情况,从中抽取50名学生的成绩(得分均为整数,满分为100分)进行统计,请你根据尚未完成的频率分布表解答问题:(1)求a ,b ,c ,d ,e 的值; (2)作出频率分布直方图.解 (1)根据题意,得分在[60.5,70.5)内的频数是a =50×0.26=13,在[90.5,100.5]内的频数是b =50-13-15-18=4,在[70.5,80.5)内的频率是c =1550=0.30,在[90.5,100.5]内的频率是d =450=0.08,频率和e =1. (2)根据频率分布表作出频率分布直方图,如图所示.四、探究与拓展15.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:根据上面的频率分布表,可知①处的数值为________,②处的数值为__________. 答案 3 0.025解析 由位于[110,120)的频数为 36,频率=36n =0.300,得样本容量n =120,所以[130,140)的频率=12120=0.1,②处的数值=1-0.050-0.200-0.300-0.275-0.1-0.050=0.025;①处的数值为0.025×120=3.。
(人教b版)数学必修三练习:2.2.1(第1课时)用样本的频率分布估计总体的分布1(含答案)
第二章 2.2 2.2.1 第1课时一、选择题1.从某批零件中抽出若干个,然后再从中抽出40个进行合格检查,发现合格产品有36个,则该批产品的合格率为( )A .36%B .72%C .90%D .25%[答案] C[解析] 用样本的合格率近似代替总体的合格率为3640×100%=90%.2.在用样本估计总体分布的过程中,下列说法正确的是( ) A .总体容量越大,估计越精确 B .总体容量越小,估计越精确 C .样本容量越大,估计越精确 D .样本容量越小,估计越精确 [答案] C[解析] 用样本估计总体分布时,样本容量越大,估计越精确.3.(2013·重庆文,6)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )1 8 92 1 2 2 7 9 30 0 3A.0.2 B .0.4 C .0.5 D .0.6[答案] B[解析] 由题意知,这10个数据落在区间[22,30)内的有22,22,27,29,共4个,∴其频率为410=0.4,故选B4.(2013·辽宁理,5)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A.45 B.50C.55 D.60[答案] B[解析] 根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,∴该班的学生人数是150.3=50.5.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其他7个小长形的面积和的14,且样本容量为200,则第8组的频数为( )A.40 B.0.2C.50 D.0.25[答案] A[解析] 设最后一个小长方形的面积为x,则其他7个小长方形的面积为4x,从而x+4x=1,所以x=0.2.故第8组的频率为200×0.2=40.6.一个容量为20的样本数据分组后,组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2.则样本在(-∞,50]上的频率为( ) A.90% B.70%C.50% D.25%[答案] B[解析] 样本在(-∞,50]上的频数为2+3+4+5=14,故在(-∞,50]上的频率为14÷20=70%,故选B.二、填空题7.(2013·湖北理,11)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示________.(1)直方图中x的值为________.(2)在这些用户中,用电量落在区间[100,250]内的户数为________.[答案] (1)0.004 4 (2)70[解析] 本题考查频率分布直方图和用样本估计总体.∵50×(0.002 4+0.003 6+0.006+x+0.002 4+0.0012)=1,∴x=0.0044.用户在区间[100,250]内的频率为50×(0.003 6+0.006+0.004 4)=0.7,∴户数为100×0.7=70(户).点评:频率分布直方图中各个小矩形的面积之和为1.8.(2014·江苏,6)为了解一处经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.[答案] 24[解析] 由题意在抽测的60株树木中,底部周长小于100cm的株数为(0.015+0.025)×10×60=24.三、解答题9.为了了解商场某日旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得的数据整理后,画出频率分布直方图(如图所示).已知从左至右前3个小组的频率之比为123,第4小组与第5小组的频率分别为0.175和0.075,第二小组的频数为10,求抽取顾客多少人?[解析] 前三组频率和为1-0.075-0.175=0.75.又前三组频率之比为123,所以第二组频率为 26×0.75=0.25.又知第二组频数为10,则100.25=40(人),故所抽取顾客为40人.一、选择题1.某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重(单位: g)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100 g 的个数是36,则样本中净重大于或等于98 g 并且小于104 g 的产品个数是( )A .90B .75C .60D .45[答案] A[解析] 本小题主要考查了频率分布直方图,考查了读图用图的能力.产品净重小于100 g 的频率P =(0.050+0.10)×2=0.3,设样本容量为n ,由已知36n=0.3,∴n =120.而净重大于或等于98 g 而小于104 g 的产品的频率P ′=(0.100+0.150+0.125)×2=0.75.∴个数为0.75×120=90.故选A.2.(2014·山东理,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6 B.8 C.12 D.18 [答案] C[解析] 第一、二两组的频率为0.24+0.16=0.4,∴志愿者的总人数为200.4=50(人).第三组的人数为:50×0.36=18(人),有疗效的人数为18-6=12(人).二、填空题3.一个社会调查机构就某地居民的月收入调查10 000人,并根据所得数据画了样本的频率分布直方图(如图所示).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.[答案] 25[解析] 从10 000人中用分层抽样的方法抽出100人,∴抽取比例为100 1.由图可知,0.000 5×500×10 000=2 500,∴月收入在[2 500,3 000)内的人数为2 500人,∴从中应抽出2 500×1100=25(人).4.从某自动包装机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g) 492 496 494 495 498497 501 502 504 496497 503 506 508 507492 496 500 501 499根据频率分布估计总体分布的原理,该自动包装机包装的袋盐食盐质量在497.5g~501.5g之间的概率约为____________.[答案] 0.25[解析] 袋装食盐质量在497.5~501.5g之间的共有5袋,所以其概率为520=0.25.三、解答题5.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午800~1000间各自的点击量,得如图所示的茎叶图.根据统计图:(1)甲、乙两个网站点击量s的极差分别是多少?(2)甲网站点击量在[10,40]间的频率是多少?(3)甲、乙两个网站哪个更受欢迎?并说明理由.[解析] (1)甲网站的极差为:73-8=65;乙网站的极差为:71-5=66.(2)甲网站点击量在[10,40]间的频率为414=27=0.285 71.(3)甲网站的点击量集中在茎叶图的下方(较大),而乙网站的点击量集中在茎叶图的上方(较小).从数据的分布情况来看,甲网站更受欢迎.6.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高:(单位:cm)区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)[146,150)[150,154)[154,158)人数58102233201165(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.[解析] (1)样本频率分布表如下:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201(2)(3)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.希望对大家有所帮助,多谢您的浏览!。
(人教a版)必修三同步课件:2.2.1用样本的频率分布估计总体分布
(-∞,- 为____________ . 1)
8,10,则其中位数位 __. 7
(-1,+∞)
6
2.已知一组数分别为:2,3,5,7,8,10,11,则其中位数为__;数据2,3,5,7,
[预习导引]
1.用样本估计总体的两种情况
频率分布 (1)用样本的_________ 估计总体分布.
数字特征 (2)用样本的_________ 估计总体数字特征.
0.045 5
0.159 1 0.181 8 0.363 6 0.113 6 0.090 9 0.045 5 1.00
合计
(2)从频率分布表中可以看出60%左右的美国总统就任时的年 龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所 占的比例相对较小.
要点二
例2
茎叶图及其应用
某中学甲、乙两名同学最近几次的数学考试成绩情况如下: 甲的得分:95,81,75,89,71,65,76,88,94,110,107; 乙的得分:83,86,93,99,88,103,98,114,98,79,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
组距
4.茎叶图
中间 (1)定义:顾名思义,茎是指_____的一列数,叶就是从茎的 _____生长出来的数,中间
旁边 的数字表示十位数,旁边的数字表示个位数.
(2)茎叶图的优点与不足
①优点:一是原始数据信息在图中能够保留,所有数据信息都可以从茎叶图中得到;二
是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. ②不足:当样本数据较多时,茎叶图就显得不太方便.
2.作频率分布直方图的步骤
最大值 (1)求极差:即一组数据中_______和_______ 的差;
2.2.1用样本的频率分布估计总体分布
新课导入前面研究学习了三种抽样收集数据,数据收集后,必须从中寻找包含的信息,以使我们能追求样本的估计总体,但是由于数据多而杂,所以需要通过一定的方法去分析.可以通过表、图、计算方法来分析.1. 通过实例体会分布的意义和作用;2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;3. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.知识与技能教学目标过程与方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.情感态度与价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.重点会列频率分布表,画频率分布直方图、频率折线图和茎叶图.能通过样本的频率分布估计总体的分布. 难点教学重难点我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?实际问题为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设我们通过抽样,得到100为居民月用水量,如下:100位居民的月均用水量(单位:t)3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.64.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2观察?上面的数字能告诉我们什么呢很容易发现的是一个居民月均用水量的最小值是0.2t,最大值是4.3t.其他值在0.2—4.3t之间.除此之外,很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理和分析.知识要点频率分布直方图频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.方法画频率分布直方图的一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.(1)求极差 因为用水最小值为0.2t ,最大值为4.3t 所以:4.3-0.2=4.1 说明样本数据的变化范围是4.1t.将上述抽样的100户居民月用水量,画出频率分布直方图.解:(2)决定组距与组数数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5—12组.为了方便起见,组距的选择应力求“取整”.在本问题中,如果取组距为0.5(t),那么组数=极差/组距=4.1/0.5=8.2因此可将数据分成9组,这个组数是较合适的,于是去组距为0.5.组数为9.(3)将数据分组以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5).(4)列频率分布表按照组距为0.5将数据分组,分成以下9组:[0,0.5),[0.5,1),…,[4,4.5). 图如下:100位居民月均用水量的频率分布表分组频数频率[0,0.5)40.04[0.5,1)80.08[1,1.5)150.15[1.5,2)220.22 [2,2.5)250.25 [2.5,3)140.14 [3,3.5)60.06 [3.5,4)40.04 [4,4.5)20.02合计1001频数等于样本数,频率恒为1(5)画频率分布直方图 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/to 0.100.200.300.400.50频率/组距特征频率分布直方图的特征:从频率分布直方图可以清楚的看出数据分布的总体趋势.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.知识要点频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.总体密度曲线的定义在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.茎叶图数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.特征茎叶图的特征:1. 用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.2. 茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.课堂小结1.频率分布直方图的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.2.频率分布折线图的概念连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.高考链接1(2009四川)设矩形的长为a ,宽为b ,其比满足 51b :a 0.6182-=≈这种矩形给人以美感,称为黄金矩形,黄金矩形常应用用于工艺品设计中,下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样品来估计两个批次的总体平均数,与标准值0.618比较,正确结论是()AA.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值跟接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定解析:本题考查平均数的求法,用样本估计总体,经计算甲、乙批次的总体平均数0.6170.613甲乙,x x ==知甲批次的总体平均数与标准值0.618更接近.2(2009湖北)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[6,10]内的频数为_______,数据落在[2,10)内的概率约为_____. 64 0.4解析:本题考查频率分布直方图,样本数据落在[6,10)内的频数为0.08×(10-6)×200=64.样本数据落在[2,10)内的概率约为(0.02+0.08)×4=0.4.区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)人数5810223320区间界限[146,150)[150,154)[154,158)人数11651.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位c m)(1)列出样本频率分布表﹔ (2)一画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.随堂练习分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201解:(1)样本频率分布表如下:前面的过程省略!122 126 130 134 138 142 146 150 158 154 身高(cm )o 0.010.020.030.040.050.060.07频率/组距(2)其频率分布直方图如下:0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为:2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.90 100 110 120 130 140 150 次数o 0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036解:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1. (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.0824171593=+++++121500.08===第二小组频数样本容量第二小组频率又因为频率=频数/ 样本容量所以 (2)由图可估计该学校高一学生的达标率约为 171593100%88%24171593+++⨯=+++++(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.。
新课标人教A版数学必修3全部课件:2.2.1用样本的频率分布估计总体分布
多大。 50.5~60.5 0.3
(1)计算 最大值与最 小值之差 (2)决定 组距与组数
2 80~90,90~100。 最大值 最小值
0.05
60.5~70.5 7 0.175 组数由 确定。 0.2 如本题:组距 16 因为有些数据本身就是分点,因 70.5~80.5 0.40
40.
5
5
例 题
某校对初二年级60名15岁女学生的身高做 了测量,结果如下(单位:cm): 142 154 159 175 159 156 149 162 166 158 159 156 166 160 164 155 157 146 147 161 158 158 153 158 154 158 163 154 153 153 162 162 151 154 165 164 152 151 146 151 158 160 165 158 163 163 162 161 154 165 162 162 159 157 159 149 164 149 159 153 列出频率分布表,绘出频率分布直方图。
分数段
40.5~50.5 50.5~60.5
人数
2 2
与全班人数的比
0.05 0.05
频率 0.4 0.3 0.2 0.1 0
5 5 5 5 5 5 40. 50. 60. 70. 80. 90. 100 . 5
60.5~70.5
70.5~80.5 80.5~90.5
7
16 8
0.175
0.40 0.20
5 5 5 5 5 5
组距 10 40.5~50.5,50.5~60.5,60.5~70.5,
(3)决定 分点 (4)列频 率分布表
(5)绘制 频率分布直
人教b版数学必修三:2.2.1《用样本的频率分布估计、总体的分布》导学案
§2.2用样本估计总体2.2.1用样本的频率分布估计总体的分布自主学习学习目标1.通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体的分布,初步体会样本频率分布的随机性.自学导引1.极差的概念极差是一组数据的________________的差,它反映了一组数据____________,极差又叫________.2.频数、频率的概念将一批数据按要求分为若干组,对落在各个小组内数据的________进行累计,这个累计数叫做各个小组的______,各个小组的______除以________,即得该小组的______.3.频率分布直方图在频率分布直方图中,纵轴表示________________,各小长方形的面积等于________________,所有长方形面积之和等于________.4.频率分布折线图连接频率分布直方图中各个小长方形的____________,就得到频率分布折线图.5.总体密度曲线如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近总体在各个小组内所取值的________________的大小;当样本容量不断增大,分组的组距不断缩小时,频率分布直方图实际上越来越接近于____________,它可以用一条____________来描绘,这条光滑曲线就叫做________________.6.茎叶图用茎叶图表示数据的两个优点在于:一是从茎叶图上没有____________的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时____________,方便记录与表示.对点讲练知识点一画频率分布直方图、频率分布折线图例1某中学同年级40名男生的体重数据如下(单位:千克):61605959595858575757575656565656565655555555545454545353525252525251515150504948列出样本的频率分布表,画出频率分布直方图,画出频率分布折线图.变式迁移1有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20),17.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)求样本数据不足0的频率.知识点二用样本的频率分布估计总体分布寿命(2)画出频率分布直方图及折线图;(3)估计电子元件寿命在400 h以上的概率.变式迁移2为了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)问参加这次测试的学生人数是多少?(3)问在这次测试中,学生跳绳次数的中位数落在第几小组内?例3某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲的得分12,15,24,25,31,31,36,36,37,39,44,49,50;乙的得分8,13,14,16,23,26,28,33,38,39,51.(1)画出甲、乙两名运动员得分数据的茎叶图;(2)根据茎叶图分析甲、乙两运动员的水平.变式迁移3在某电脑杂志的一篇文章中,每个句子所含的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17;在某报纸的一篇文章中,每个句子所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?几种表示频率分布的方法的优点与不足(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.(3)频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体密度曲线.(4)用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.课时作业一、选择题1.关于频率分布直方图中的有关数据,下列说法正确的是()A.小矩形的高表示取某数的频率B.小矩形的高表示该组上的个体在样本中出现的频率C.小矩形的高表示该组上的个体数与组距的比值D.小矩形的高表示该组上个体在样本中出现的频率与组距的比值2.关于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是()A.频率分布直方图与总体密度曲线无关B.频率分布直方图就是总体密度曲线C.样本容量很大的频率分布直方图就是总体密度曲线D.如果样本容量无限增大,分组的组距无限减小,那么相应的频率分布折线图会越来越接近一条光滑曲线,则这条光滑曲线为总体密度曲线3.已知10个数据如下:63,65,67,69,66,64,66,64,65,68.如果对这些数据绘制频率分布表,那么其中在64.5~66.5这组的频率是()A.0.4 B.0.5 C.5 D.4A.0.5 B.0.24 C.0.6 D.0.7二、填空题5.在求频率分布时,把数据分为5组,若已知其中的前四组频率分别为0.1,0.3,0.3,0.1,则第五组的频率是______,这五组的频数之比为________.6.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的13,且中间一组的频数为10,则这个样本容量是________.三、解答题7.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为6月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?8.有关部门从甲,乙两个城市所有的自动售货机中分别随机抽取了16台,记录下一上午各自的销售情况如下:(单位:元)甲18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41乙22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23(1)请画出这两组数据的茎叶图.(2)将这两组数据进行比较分析,你能得到什么结论?§2.2用样本估计总体2.2.1用样本的频率分布估计总体的分布自学导引1.最大值与最小值变化的幅度全距2.个数频数频数样本容量频率3.频率与组距的比值相应各组的频率 14.上边的中点5.个数与总数比值总体的分布光滑曲线y=f(x)总体密度曲线6.原始信息随时记录对点讲练例1解(1)计算:61-48=13;(2)决定组距与组数,取组距为2,∵132=612,∴共分7组;(3)决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下7组:47.5~49.5,49.5~51.5,51.5~53.5,53.5~55.5,55.5~57.5,57.5~59.5,59.5~61.5.(4)51.5~53.5 7 0.175 53.5~55.5 8 0.20 55.5~57.5 11 0.275 57.5~59.5 5 0.125 59.5~61.5 2 0.05 合计4040 1.00(5)(6)取各小长方形上边的中点并用线段连接就构成了频率分布折线图. 变式迁移1 解 (1)分组 频数 频率[-20,-15)7 0.035 [-15,-10)11 0.055 [-10,-5)15 0.075 [-5,0)40 0.200 [0,5) 49 0.245 [5,10) 41 0.205 [10,15) 20 0.100 [15,20) 17 0.085合计200 (2)(3)样本数据不足0的频率为7+11+15+40200=0.365.例2 解 (1)寿命(h ) 频数 频率100~20020 0.10 200~30030 0.15 300~40080 0.40 400~50040 0.20 500~60030 0.15 合计200 1.00 (2)(3)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的频率为0.35.变式迁移2 解 (1)第四小组的频率为1-(0.1+0.3+0.4)=0.2. (2)n =第一小组的频数÷第一小组的频率=5÷0.1=50.(3)由0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,得第一、第二、第三、第四小组的频数分别为5,15,20,10.所以学生跳绳次数的中位数落在第三小组内. 例3 解 (1)作出茎叶图如下图:(2)由上面的茎叶图可以看出,甲运动员的得分情况是大致对称的,中位数是36分;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26分.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.变式迁移3 解 (1)茎叶图如图所示:(2)电脑杂志上每个句子的字数集中在10~30之间,报纸上每个句子的字数集中在20~40之间,说明电脑杂志上每个句子的平均字数要比报纸上每个句子的平均字数要少.课时作业 1.D 2.D3.A [∵在这组中的数只有4个,∴频率=410=0.4.]4.D5.0.2 1∶3∶3∶1∶2 6.40解析 可知中间长方形的面积是所有长方形面积的14,即频率为14,∴样本容量为1014=40.7.解 (1)依题意知第三组的频率为42+3+4+6+4+1=15,又∵第三组的频数为12,∴本次活动的参评作品数为1215=60(件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×62+3+4+6+4+1=18(件)(3)第四组的获奖率是1018=59,第六组上交的作品数量为60×12+3+4+6+4+1=3(件)∴第六组的获奖率为23=69,显然第六组的获奖率较高. 8.解 (1)茎叶图如图所示.(2)由图可以看出乙城市的销售额分布较对称,集中程度较高,故乙城市一上午的销售情况比较稳定且销售额较高.。
2.2.1用样本的频率分布估计总体
频率/组距
0.4 0.3 0.2 0.1 0 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5
用水量范围
连接频率分布直方图中各个小长方形上端的中点,频率分布折线图
随着样本容量的增加,作图时所分的组数也会增加,相应的频 率折线图会越来越接近于一条光滑的曲线,统计学中称这条光滑的 曲线为总体密度曲线
(3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少?
解:(1)组距为3,列频率分布表
分组 频数 频率 频率/ 组距
[12.5, [15.5, [18.5, [21.5, [24.5, [27.5, [30.5,
15.5) 3 18.5) 8 21.5) 9 24.5) 11 27.5) 10 30.5) 5 33.5) 4
甲 8 4 6 3 3 6 8 3 8 9 1 0 1
乙
2 5 5 4 1 1 6 6 7 9 4 9 0
2
3 4 5
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图上没 有原始数据信息的损失,所有数据信息都可以从茎叶图 中得到;二是茎叶图中的数据可以随时记录,随时添加, 方便记录与表示; (2)茎叶图只便于表示两位(或一位)有效数字的数据, 对位数多的数据不太容易操作;而且茎叶图只方便记录 两组的数据,两个以上的数据虽然能够记录,但是没有 表示两个记录那么直观,清晰; (3)茎叶图对重复出现的数据要重复记录,不能遗漏.
[0,0.5 ),[0.5,1 ),…,[4,4.5]
分组时,通常对组内数值所在区间取左 闭右开区间,最后一组取闭区间,当然也 可以采用其他分组方法。
4.列频率分布表
2.2.1用样本的频率分布估计总体分布
1
板出课题 1 分钟
让学生展开讨论 2 分钟
填空 2 分钟
以课本 P66 制定 居民用水标准问 题为例, 题为例,经过以 上几个步骤画出 频率分布直方 图。 学生动手作 ( 图)10 分钟 让学生仔细观察 表和图, 表和图,得出结 论 2 分钟
心灵寄语 :后悔过去,不如奋斗将来。——马克思 (1) 从频率分布直方图可以清楚的看出数据分布的总体趋势。 ) 从频率分布直方图可以清楚的看出数据分布的总体趋势。 不出原始的数据内容, (2) 从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有 ) 从频率分布直方图得不出原始的数据内容 把数据表示成直方图后, 的具体数据信息就被抹掉了。 的具体数据信息就被抹掉了。 探究〗 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。 :同样一组数据 〖探究〗 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。 : 不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断, 不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以 0.1 和 1 为组距 重新作图,然后谈谈你对图的印象? 重新作图,然后谈谈你对图的印象? 思考〗 :如果当地政府希望使 以上的居民每月的用水量不超出标准, 〖思考〗 如果当地政府希望使 85%以上的居民每月的用水量不超出标准,根据频率分布表 2-2 : 以上的居民每月的用水量不超出标准 和频率分布直方图 2.2-1,你能对制定月用水量标准提出建议吗? ,你能对制定月用水量标准提出建议吗? 频率分布折线图、 〈二〉频率分布折线图、总体密度曲线 1.频率分布折线图的定义: .频率分布折线图的定义: 连接频率分布直方图中各小长方形上端的中点 就得到频率分布折线图。 中各小长方形上端的中点, 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。 2.总体密度曲线的定义: .总体密度曲线的定义: 在样本频率分布直方图中, 相应的频率折线图会越来越接近于一条光滑曲线, 在样本频率分布直方图中, 相应的频率折线图会越来越接近于一条光滑曲线, 统计中 称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比, 称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比, 它能给我们提供更加精细的信息。 它能给我们提供更加精细的信息。 思考〗 〖思考〗 : 对于任何一个总体,它的密度曲线是不是一定存在?为什么? 1.对于任何一个总体,它的密度曲线是不是一定存在?为什么? 对于任何一个总体,它的密度曲线是否可以被非常准确地画出来? 2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么 实际上,尽管有些总体密度曲线是饿、客观存在的, 实际上,尽管有些总体密度曲线是饿、客观存在的,但一般很难想函数图象那样准确 地画出来,我们只能用样本的频率分布对它进行估计 一般来说,样本容量越大, 进行估计, 地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估 计就越精确. 计就越精确. 〈三〉茎叶图 茎叶图的概念: 1.茎叶图的概念: 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字, 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数 字表示个位数,即第二个有效数字,它的中间部分像植物的茎, 字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出 来的叶子,因此通常把这样的图叫做茎叶图。 来的叶子,因此通常把这样的图叫做茎叶图。 2.茎叶图的特征: .茎叶图的特征: 用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失, (1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据 信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加, 信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记 录与表示。 录与表示。 茎叶图只便于表示两位有效数字的数据, 且茎叶图只方便记录两组的数据, (2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个 以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。 以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。 三、典型例题 例题精析】 【例题精析】 人的身高(单位cm cm) 例 1 下表给出了某校 500 名 12 岁男孩中用随机抽样得出的 120 人的身高(单位cm) 观察表和图, 观察表和图,得 出结论 2 分钟
用样本频率估计总体频率
2.2.1用样本频率估计总体频率陈巴尔引入:我们本章学习的内容是统计学,我们运用统计学解决一个具体问题,要分几个步骤?第一是数据的收集,然后是数据的分析。
我们之前的课程差不多学习了如何收集数据,今天我们要开始学习如何分析我们得到的数据,来解决一个实际问题。
(看问题,图片)面对如此一个现状,我们该如何节约用水?政府部门提了这么一个设想:(看问题)问题的提出:该如何确定a呢?能不能太高?——失去节约用水的意义。
(由学生回答)能不能太低?——阻碍居民的正常生活。
(由学生回答)因此,我们期望大部分的居民用水量应该低于a,而小部分的居民用水量高于a,如此即不阻碍居民正常生活,又能达到节水的成效。
既然要求大部分居民的用水量在a以下,小部分在a以上,我们就需要了解本市居民的用水量情形,更准确地说,我们要明白用水量在哪些范畴内较多,哪些范畴内较少,或者说大部分集中在哪些范畴内。
即了解居民用水的整体“分布”。
这类似于我们考完试,分析班级的成绩分布。
那我们能够通过什么方法来了解用水情形?——抽样(若学生提出普查则加以说明)数据的处理:我们通过合理的抽样方法,获得了100位居民某年的月平均用水量。
(得到用水量表格)刚才我们说过要了解用水的整体分布吧,确实是在哪些范畴内较多,哪些范畴内较少?假如就给你一个表格,这么多数据一放,你能看清吗?(由学生回答,发觉只能大致看出最大值,最小值,以及1点几和2点几的用水量都“比较多”,但具体就不清晰了。
)看不清,就要对表格的数据进行整理与分析,你们初中有没有学过拿到这么一大堆数据能够如何处理,分析?(学生回答频数分布表)回忆初中熟悉的——频数分布表。
初中的频数分布表是如何制作的?数据的处理过程:(由学生回答,让一名学生起来回答,假如不记得了,能够让他参考书本中的过程在一一说出。
)过程:(将6个处理数据的步骤完整得留在黑板上。
)步骤1、找出最大最小值(过大或过小的区间都没有意义)步骤2、确定组距与组数(1)起始区间是不是一定要从0.2开始?(留给学生一定的摸索时刻,能够提问学生回答!)——能够从0开始,一是为了方便,二是实际意义。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.画频率分布直方图
频率/组距 0.50 0.40 0.30 0.20 0.10 0
思考:从左往右 看,前2个长方 形的面积表示什 么意义?
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
总结画频率分布直方图的操作步骤
1.求极差,即数据中最大值与最小值的差 2.决定组距与组数 :组数=极差/组距 3.将数据分组, 通常对组内数值所在区间,取左闭右 开区间 , 最后一组取闭区间 4.登记频数,计算频率和频率/组距 , 列出频率分布表 5.画出频率分布直方图(纵轴表示频率/组距)
频率/组距 0.50 0.40 0.30 0.20 0.10 0
问题5 你能从 图中分析出样本 的哪些信息?
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
问题7 请同学们尝试以另外的组距重新作图. 问题6 你认为频率分布直方图的优缺点是 什么?
同样一组数据,如果组距不同,得到的图 的形状也会不同。不同的形状给人以不同的印 象,这种印象有时会影响我们对总体的判断。
频数累计(划记) 正 正正正 正正正正丅 正正正正正 正正
频数 4 8 15 22 25 14
[3, 3.5) [3.5, 4) [4, 4.5] 合计
正 丅
6 4 2 100
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
分组 [0, 0.5) [0.5, 1) [1, 1.5) [1.5, 2) [2, 2.5) [2.5, 3) [3, 3.5) [3.5, 4) [4, 4.5] 合计
一般地, 画出一组样本数据的茎叶图的步骤如 何?
第一步,将每个数据分为“茎”(高位)和“叶” (低位)两部分;
一般地, 画出一组样本数据的茎叶图的步骤如 何?
第一步,将每个数据分为“茎”(高位)和“叶” (低位)两部分;
第二步, 将最小的茎和最大的茎之间的数按大 小次序排成一列,写在左(右)侧;
用茎叶图表示数据的分布情况是一种好方法, 你认为茎叶图有哪些优点? (1)保留了原始数据,没有损失样本信息; (2)数据可以随时记录、添加或修改.
比较茎叶图和频率分布表,茎叶图中“茎”和 “叶” 的数目分别与频率分布表中哪些数目相 当? 对任意一组样本数据,是否都适合用茎叶图 表示?为什么?
用茎叶图表示数据的分布情况是一种好方法, 你认为茎叶图有哪些优点? (1)保留了原始数据,没有损失样本信息; (2)数据可以随时记录、添加或修改.
对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0, 4.3,2.7,3.1,3.5,用茎叶图如何表示?
对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0, 4.3,2.7,3.1,3.5,用茎叶图如何表示?
茎 0 1 2 3 4
叶 8 0 5 0 5 7 1 1 5 3
一般地, 画出一组样本数据的茎叶图的步骤如 何?
一般地, 画出一组样本数据的茎叶图的步骤如 何?
第一步,将每个数据分为“茎”(高位)和“叶” (低位)两部分;
第二步, 将最小的茎和最大的茎之间的数按大 小次序排成一列,写在左(右)侧;
第三步, 将各个数据的叶按大小次序写在茎右 (左)侧.
用茎叶图表示数据的分布情况是一种好方法, 你认为茎叶图有哪些优点?
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
频率 组距
总体密度曲线
O
a
b 月均用水量/t
在上述背景下,相应的频率分布折线图越来越接 近于一条光滑曲线,统计中称这条光滑曲线为总 体密度曲线.那么图中阴影部分的面积有何实际意 义?
频率 组距
总体密度曲线
总体在区间 (a,b)内取 值的百分比.
8 4 6 3 3 6 8 3 8 9
分析:从图上看,乙运动员的得分基本上是对称 的,“叶”的分布是“单峰的”,中位数是36; 甲运动员的得分(除了一个特殊得分51外),也 大致对称,“叶”的分布也是“单峰的”,中位 数是26,由此可以看出,乙运动员的成绩更好。 另外,从叶在茎上的分布情况看,乙运动员的得 分更集中于峰值附近,说明乙运动员的发挥更稳 定。
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
当总体中的个体数很多时(如抽样调查全国城市 居民月均用水量) ,随着样本容量的增加,作图时 所分的组数增多,组距减少,你能想象出相应的 频率分布折线图会发生什么变化吗?
频率 组距 0.5 0.4 0.3 0.2 0.1
用茎叶图表示数据的分布情况是一种好方法, 你认为茎叶图有哪些优点?
(1)保留了原始数据,没有损失样本信息; (2)数据可以随时记录、添加或修改.
用茎叶图表示数据的分布情况是一种好方法, 你认为茎叶图有哪些优点? (1)保留了原始数据,没有损失样本信息; (2)数据可以随时记录、添加或修改.
比较茎叶图和频率分布表,茎叶图中“茎”和 “叶” 的数目分别与频率分布表中哪些数目相 当?
步骤:
4.3 - 0.2 = 4.1 极差 4.1 组数= 2.决定组距与组数: = = 8.2 组距 0.5 1.求极差: 3.将数据分组 [0,0.5 ),[0.5,1 ),…,[4,4.5]
4.画频数分布表
分组 [0, 0.5) [0.5, 1) [1, 1.5)
频数累计(划记) 正 正正正 正正正正丅 正正正正正 正正
分组 [0, 0.5) [0.5, 1) [1, 1.5) [1.5, 2) [2, 2.5) [2.5, 3) [3, 3.5) [3.5, 4) [4, 4.5] 合计
频率 0.04 0.08 0.15 0.22 0.25 0.14
频率/组距 0.50 0.40 0.30 0.20 0.10 0
前面学了频率分布图和频率分布直方图 来解决问题,我们再学习第二种用频率估计 总体的方法:频率分布折线图和总体密度曲 线。
在城市居民月均用水量样本数据的频率分布直方 图中, ,依次连接各小长方形上端的中点,就得到 一条折线, 这条折线称为频率分布折线图. 你认为 频率分布折线图能大致反映样本数据的频率分布 吗?
比较茎叶图和频率分布表,茎叶图中“茎”和 “叶” 的数目分别与频率分布表中哪些数目相 当? 对任意一组样本数据,是否都适合用茎叶图 表示?为什么? 不适合样本容量很大或茎、 叶不分明的样 本数据.
用样本的频率分布估计总体分布的三种方法
一 频率分布图和频率分布直方图
二 频率分布折线图和总体密度曲线
三 莖叶图(stem-and-leaf display)
0.06 0.04 0.02 1
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
问题8 如果当地政府希望使85% 以上 的居民每月的用水量不超出标准,根据频 率分布表和频率分布直方图,你能对制定 月用水量标准提出建议吗?
问题9 你认为3吨这个标准一定能够 保证85%以上的居民用水不超标吗? 如果不一定,那么哪些环节可能导致 结论的差别?
问题1
①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?
②为了较合理地确定这个标准,你认为需要做 哪些工作?
通过抽样,我们获得了100位居民某年的月平均用 水量(单位:t) ,如下表:
问题3 由上表,大家可以得到什么信息? 问题2 初中学过什么处理多项数据的方法?
我们曾在初中学过频数分布表和频数分 布直方图,请同学们动手操作。
甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39; 乙运动员得分:49,24,12,31,50,31,44, 36,15,37,25,36,39.
甲 乙
0 2 5 1 5 4 2 1 6 1 6 7 9 3 4 9 4 0 1 5 你能理解这个图是如何记录这些数据的吗? 你能通过该图说明哪个运动员的发挥更稳定 吗?
想一想:当总体的个数比较少或样本数据不 密集时,是否存在整体密度曲线,为什么? 不存在,因为组距不能任意缩小。
方法三:茎叶法
我们结合下面的例子来说明茎叶图的方 法,以及从茎叶图中提取样本数据信息的方 法。
某赛季甲、乙两名篮球运动员每场比赛的得 分情况如下: 甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39; 乙运动员得分:49,24,12,31,50,31,44, 36,15,37,25,36,39.
4.列频率分布表
100位居民月平均用水量的 频率分布表
分组 [0, 0.5) [0.5, 1) [1, 1.5) [1.5, 2) [2, 2.5) [2.5, 3) [3, 3.5) [3.5, 4) [4, 4.5] 合计 丅 正 正正正 正正正正丅 正正正正正 正正 正 频数累计(划记) 频数 4 8 15 22 25 14 6 4 2 100 频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1 频率/组距 0.08 0.16 0.3 0.44 0.50 0.28 0.12 0.08 0.04
2.2 用样本估计总体
----用样本的频率分布估计 总体分布
复习
一、简单随机抽样的概念 简单随机抽样的两种方法: 抽签法 随机数表法 二、系统抽样和分层抽样
那么,接下来的工作怎么做呢?
我们收集后,必须从中寻找所包含的信 息,使我们可以从样本估计总体。因为抽 出的数据很多且杂乱,我们无法直接从原 始数据理解它们的含义,所以我们通过图、 表、计算来分析数据,帮助我们找到数据 中的规律。
用样本估计总体
用样本估计总体(两种): 一种是:用样本的频率分布估计总体的 分布。 另一种是:用样本的数字特征(平均数 标准差等)估计总体的数字特征。