9.2用样本估计总体课件(人教版)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.1 3.6 4.9 5.5 6.4 7.8 10.1 13.3 16.8 25.6
2.2 2.3 3.6 3.7 4.9 4.9 5.5 5.5
6.4 6.8 7.8 7.9 10.2 10.2 13.6 13.6 17.0 17.9 24.5 28
我们选择用频率分布表和频率分布直方图来整理和表示数据
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
例如,取区间为 [1.2 ,.2) ,[4.2 , 7.2) , , [25.2 , 28.2]
4.列频率分布表 计算各小组的频率,作出频率分布表
例如第一小组的频率是 第一组频数
f1 样本容量 23 0.23
100
[5.2, 6.2)内最为集中. 从总体上看,随着月均用水量的增加,居民用户数的频率呈现下降趋势,但存在个别区间频
率变大或者缺失的现象
从上述分析可见,当频率分布直方图的组数少、组距大时,容易从中看出数据整体的分布 特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息; 当频率分布直方图的组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多, 有时图形会变得非常不规则,不容易从中看出总体数据的分布特点
例1.已知某市2015年全年空气质量等级如表所示
2016年5月和6月的空气质量指数如下: 5月:240 80 56 53 92 126 45 87 56 60
191 62 55 58 56 53 89 90 125 124
103 81 89 44 34 53 79 81 62 116
88 6月:63 92 110 122 102 116 81 163 158 76
7.1 28 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
把100个样本数据按从小到大排序
1.3
1.3
1.8 2.0
2.0
2.3
2.4
2.6 2.6
3.0
3.8
4.0
4.1 4.3
4.4
5.1
5.1
5.1 5. 2 5.3
5.5
5.6
5.7 5.7
5.9
6.8
7.0
7.1 7.1
月均用水量的增加,居民用户数的频率在降低,而且月均用水量在区间[1.2,10.2) 内的居民用户数的频率,远大于在另两个区间[10.2,19.2) 和[19.2, 28.2] 内的频率, 这说明大部分居民用户的月均用水量都少于10.2t
/t
/t
图 2 中直方图的组数多、组距小,从图中可以看出,数据主要集中在低值区,尤其在区间
有了样本观测数据的频率分布,我 们可以用它估计总体的取值规律.
据100户居民用户的月均用水量的频率 分布,可以推测该市全体居民用户月 均用水量也会有类似的分布,即大部 分居民用户月均用水量集中在较低值 区域。
/t
这使我们确定用水量标准时,可以定一个合适的值,以达到既不影响大多数居民用 户的水费支出,又能节水的目的。 需要注意的是,由于样本的随机性,这种估计可能会存在一定误差,但这一误差一般 不会影响我们对总体分布情况的大致了解。
7.1
8.1
8.6
8.8 9.0
9.5
10.5 10.8 11.1 11.2 12.0 13.8 13.8 14.0 14.9 15.7 18.3 19.4 20.5 21.6 22.2
2.0 3.2 4.6 5.4 6.0 7.5 9.9 12.0 16.0 22.4
2.0 3.2 4.7 5.4 6.0 7.7 10 12.4 16.7 24.3
按以下步骤制作频率分布表、画频率分布直方图 1.求极差 极差为一组数据中最大值与最小值的差 样本观测数据的最小值是1.3t 最大值是28.0t 极差为 28.0 1.3 26.7 这说明样本观测数据的变化范围是26.7t
2.决定组距与组数
取组距为 3
极差 组距
26.7 3
8.9
组数为 9
3.将数据分组 10.第一组的左端点略小于数据中的最小值 20.最后一组的右端点大于数据中的最大值 30.第一个区间前闭后开 40.最后一个区间为闭区间
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1
4.3 13.3 6.8 1.3 7.0 4.9 1.8
/ min
解:(1)通话时长在区间[15, 20) 内的次数为 0.035 60 9 通话时长在区间[20,30)内的次数为 0.021060 12
(2)区间[20, 30)上每单位区间长度内的通话次数少于 [15, 20)上每单位区间长度内的通话次数
或者通话时长出现在区间[20, 30)上比 出现在区间[15, 20)上更稀疏
练习 1.从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在50~350kW h
之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示
(1)直方图中x 的值为(
)
(2)在被调查的用户中,用电量落
在区间[100, 250)内的户数为(
)
/kw h
解:(1) (0.0024 0.0036 0.0060 x 0.0024 0.0012) 50 1 x 0.0044 (2) (0.0036 0.0060 0.0044) 50100 70
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
33 102 65 53 38 55 52 76 99 127
选择合适的统计图描述数据,并回答下列问定題:
120 80 108 33 35 73 82 90 146 95
(1)分析该市2016 年6 月的空气质量情况。
(2)比较该市2016 年5 月和6 月的空气质量,哪个月的空气质量较好?
(3)比较该市2016 年6 月与该市2015 年全年的空气质量,2016 年6 月的空气质量是否好
通过图可以看出,虽然2016 年6 月的空气质 量为“优”的频率略低于2015 年,
但“良”的频率明显高于2015 年,而且2016 年 6 月中度以上的污染天气频率明显小于2015 年,
所以,从整体上看,2016 年6 月的空气质量要好于 2015年全年的空气质量
练习 某市2016年6月30天的空气质量指数如下:
于去年?
解:(1)根据该市2016年6月的空气质量指数和空气质量等级分级标准, 可以画出该市这个月的不同空气质量等级的频数与频率分布表
从表中可以看出,“优”“良”的天数达19 天,占了整月的63.33% , 没有出现“重度污染”和“严重污染”
我们可以用条形图和扇形图对数据作出直观的描述
从条形图中可以看出,在前三个等级的占绝大多数,空气质量等级 为“良”的天数最多,后三个等级的天数很少
5.画频率分布直方图
10.横轴表示月均用水量
20
.纵轴表示
频率 组距
30
频率 实际上就是频率分布 组距
直方图中各小长方形的高
40
小长方形的面积
组距
频率 组距
频率
50 各小长方形的面积表示相应各组的频率
60 各小长方形的面积的总和等于 1
观察 你能从图表中发现居民用户 月均用水量的哪些分布规律?
/t
问题2 如果该市政府希望使80% 的居民用户生活用水费支出不受影响,根据下面 给出的100 户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用 水量标准的建议吗? 100户居民用户的月均用水量数据( 单位:t )
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.胡晓统计了他爸爸9月的手机通话明细清
单,发现他爸爸该月共通话60 次。胡晓按
每次通话时间长短进行分组(每组为左闭
右开的区间),画出了频率分布直方图
(1)通话时长在区间[15, 20) , [20,30)内的次
数分别为多少?
(2)区间[20, 30)上的小长方形高度低于[15,
20)上的小长方形的高度,说明什么?
35 54 80 86 72 85 58 125 111 53 10 66 46 36 18 25 23 40 60 89 88 54 79 14 16 40 59 67 111 62
解:这组数据的最大值为125, 最小值为10, 极差为115. 根据空气质量分级标准,把空气质量指数
按照区间[0, 50], 50,100 , 100,150 进行分
从频率分布表可以清楚地看出,样本 观测数据落在各个小组的比例大小
例如,月均用水量在区间[4.2,7.2) 内
的居民用户最多,
在区间[1.2, 4.2)内的次之,
月均用水量超过16.2 的各区间内
数据所占比例较小
/t
从频率分布直方图看出,居民用户月均用水量的样本观测数据的分布是不对称的,
图形的左边高、右边低,右边有一个较长的“ 尾巴”。 这表明大部分居民用户的月均用水量集中在一个较低值区域,尤其在区间[1.2, 7.2) 最为集中, 少数居民用户的均用水量偏多,而且随着月均用水量的增加,居民用户数呈现降低趋势
组,得到频率分布直方图
从频率分布直方图中可以看出, 空气质量为良的频率最大
你觉得这个月的空气质量如何?请设计 适当的频率分布直方图展示这组数据, 并结合空气质量分级标准分析数据。
轻度污染的频率最小 没有中度污染、重度污染和严重污染的天气
总体来说,该市2016年6月的空气质量较好
二、总体百分数的估计
探究 分别以3和27为组数,对数据进行等距分组,画出100户居民用户月均用水量的频率
分布直方图。观察图形,你发现不同的组数对于直方图呈现数据分布规律有什么影响?
/t
/t
从图中可以看出,同一组数据,组数不同,得到的直方图形状也不尽相同
图1中直方图的组数少、组距大,从图中容易看出,数据分布的整体规律是随着
标准a ,用水量不超过a 的部分按平价收费,超出a 的部分按议价收费。如果希望确定一个
比较合理的标准,以使大部分居民用户的水费支出不受影响,你认为需要做哪些工作?
假设通过简单随机抽样,获得了100 户居民用户的月均用水量数据( 单位:t )
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
为了便于比较,我们选用复合条形图, 将两组数据同时反映到一个条形图上。 通过条形图中柱的高低,可以更直观 地进行两个月的空气质量的比较 由表格和条形图可以发现,5 月空气质量 为“优”和“良”的总天数比6 月多, 所以,从整体上看,5 月的空气质量略好 于6 月,但5 月有重度污染,而6 月没有
(3)把2016年6月和2015年全年的空气质 量进行比较,由于一个月和一年的天 数差别很大,所以直接通过频数比较 没有意义,应该转化成频率分布进行 比较。 可以通过二者的空气质量指数的频率 分布直方图或空气质量等级的频率分 布条形图进行比较
从扇形图中可以看出,空气质量为“ 良”的天数占了总天数的一半,大约有三分之二 为“ 优”“良”,大多数是“良”和“ 轻度污染”.因此,整体上6 月的空气质量不错
我们还可以用折线图展示空气质量指数随时间的变化情况 如图,容易发现 ,6月份的空气质量指数在100 附近波动
(2)根据该市2016年5月的空气质量指数和空气质量分级标准,可以画出该市这个月 的不同空气质量等级的频数和频率分布表
用样本估计总体
一、用样本估计总体
收集数据是为了寻找数据中蕴含的信息。在随机抽样获得观测数据的基础上,选择适当的 统计图表描述和表示数据, 获得样本的规律,以此估计总体的规律,解决相应的实际问题 问题1 我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了减少水
资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量
相关文档
最新文档