9.2.2总体百分位数的估计PPT课件(人教版)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人 : 邢
如果不一定,那么哪些环节可能会导致结论的差别?
启 强
19
学习新知
定义:一般地,一组数据的第p百分位数是这样一个值, 它使得这组数据中至少有p%的数据小于或等于这个 值,且至少有(100-p)%的数据大于或等于这个值.
可以通过下面的步骤计算一组n个数据的第p百分位数: 第1步,按从小到大排列原始数据. 第2步,计算i=n×p%. 第3步,若i不是整数,而大于i的比邻整数为j,则第p百 分位数为第j项数据; 若i是整数,则第p百分位数为第项与第(i+1)项数据的平 均数.
①在市中心某个居民区以家庭为单位随机抽取; ②在全市医务工作者中以家庭为单位随机抽取; ③在全市常住人口中以家庭为单位随机抽取.
讲
课
人
:
邢
启 强
11
典型例题
(2)本次抽样调査发现,接受调査的家庭都有过期药品,
现将有关数据呈现如图:
①m=__2_0_____,
n=___6_____;
②补全条形统计图;
1 000 ②C 类户数为:1 000-(80+510+200+60+50)=100, 条形统计图补充如下:
③根据调査数据,即可知道该市市民
家庭处理过期药品最常见的方式是 B 类.
④180×10% =18(万户).
若该市有 180 万户家庭,估计大约
有 讲
课
18
万户家庭
处理过期药品的方式是送回收站.
我们还可以用折线图展
示空气质量指数随时间
的变化情况,如图.容
易发现,6月的空气质
讲
量指数在100附近波动.
课
人
:
邢
启 强
7
用条形图和扇形图对数据作出直观的描述
从条形图中可以看出,在 前三个等级的占绝大多数, 空气质量等级为“良”的 天数最多,后三个等级的 天数很少
讲 课 人 : 邢 启 强
从扇形图中可以看出,空气 质量为“良”的天数占了总 天数的一半,大约有三分之 二为“优”“良”,大多数 是“良”和“轻度污染”因 此,整体上6月的空气质量 不错.
把得到的100个样本数据按从小到大排序,得到第80个和81 个数据分别为13.6和13.8.可以发现,区间(13.6,13.8)内的任意一 个数,都能把样本数据分成符合要求的两部分.一般地,我们取这 两个数的平均数()13.6+13.8)/2=13.7,并称此数为这组数据的第80 百分位数(percentile), 或80%分位数.
对于折线图、扇形图、条形图一定要注意每种图示的作
用和含义,其次要看清所标记数据和单位,最后要抓住各
讲 课 人
种图示中所体现的信息“密码”.
:
邢
启 强
14
典型例题
调查机构对某高科技行业进行调查统计,得到该
行业从业者学历散布扇形图、从事该行业岗位
散布条形图,如图所示.
给出下列三种说法:
①该高科技行业从业
6月 63 92 110 122 102 116 81 163 158 76 33 102 65 53 38 55 52 76
99 127 120 80 108 33 35 73 82 90 146 95
选择合适的统计图描述数据,并回答下列问题:
(1)分析该市202X年6月的空气质量情况
讲 .(2)比较该市202X年5月和6月的空气质量,哪个月的空气质量较好?
பைடு நூலகம்
讲
课
人
:
邢
启 强
16
解:该城市3月1日至10日的最低气温(单位:℃)情况 如下表:
日期
最低气温 (℃)
1 2 3 4 5 6 7 8 9 10 -3 -2 0 -1 1 2 0 -1 2 2
其中最低气温为-3 ℃的有1天,占10%,最低气温为-2 ℃的有1天,占10%, 最低气温为-1 ℃的有2天,占20%,最低气温为0 ℃的有2天,占20%,最低 气温为1 ℃的有1天,占10%,最低气温为2 ℃的有3天,占30%.
频率
(1)因为小矩形的面积=组距× 组距=频率,所以各小矩 形的面积表示相应各组的频率. 这样,频率散布直方图就以面积的情势反应了数据落在 各个小组内的频率大小. (2)在频率散布直方图中,各小矩形的面积之和等于1.
频数 (3) 相应的频率=样本容量.
(4)在频率散布直方图中,各矩形的面积之比等于频率之 比,各矩形的高度之比也等于频率之比.
讲
课
人
:
邢
启 强
20
学习新知 概念拓展
中位数,相当于是第50百分位数.
常用的分位数还有第25百分位数,第75百分位数.
这三个分位数把一组由小到大排列后的数 据分成四等份,因此称为四分位数. 其中第25百分位数也称为第一四分位数或 下四分位数等,
第75百分位数也称为第三四分位数或上四 分位数等,
第1百分位数第5百分位数,第95百分位数 和第99百分位数在统计中也经常被使用.
人员中学历为博士
的占一半以上;
②该高科技行业中从
事技术岗位的人数超过总人数的30%;
③该高科技行业中从事运营岗位的人员主要是
本科生.其中正确的个数为(
讲
C
)
A.0个 课
人 : 邢
B.1个
C.2个
D.3个
启 强
15
典型例题
如图是根据某市3月1日至3月10日的最低气温(单位:℃)的情况 绘制的折线统计图,试根据折线统计图反应的信息,绘制该市3 月1日到10日最低气温(单位:℃)的扇形统计图和条形统计图.
8
(2)根据该市202X年5月的空气质量指数和空气质量分级标准,可以画出 该市这个月的不同空气质量等级的频数和频率散布表
5月 6月
讲 课 人 : 邢 启 强
为了便于比较,我们选用复合 条形图,将两组数据同时反应 到一个条形图上.通过条形图中 柱的高低,可以更直观地进行 两个月的空气质量的比较
从整体上看,5月的空气 质量略好于6月,但5月 有重度污染,而6月没有
问题: 如果该市政府希望使80%的居民用户生活用水 费支出不受影响,根据9.2.1节中100户居民用户的月 均用水量数据,你能给市政府提出确定居民用户月均 用水量标准的建议吗?
讲
课
人
:
邢
启 强
18
学习新知
根据市政府的要求确定居民用户月均用水量标准,就是要寻找一个 数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%.
课 人 :
(3)比较该市202X年6月与该市2015年全年的空气质量,202X年6月的空气质量是否
邢 启
好于去年?
强
6
解:(1)根据该市202X年6月的空气质量指数和空气质量等级分级 标准,可以画出该市这个月的不同空气质量等级的频数与频率散 布表
频数与频率散布表可以直接得到各类数据的频数和频率. 从表中可以看出,“优”“良”的天数达19天,占了整月的63.33%,没有出现 “重度污染”和“严重污染”
讲
课
人
:
邢
启 强
2
复习引入
(2)意义:各个小长方形的面积表示相应各组的 频率,
频率散布直方图以面积 的情势反应数据落在各个小
组的频率的大小,各小长方形的面积的总和等于 1 .
(3)总体取值规律的估计:我们可以用样本观测数据
的 频率散布估计总体的取值规律.
(4)频率散布直方图的特征:当频率散布直方图的组
人
:
邢
启 强
13
典型例题
例3某中学初中部共有120名教师,高中部共有150名教
师,其性别比例如图所示,则该校女教师的人数为( B )
A.128 B.144 C.174 D.167
分析根据女教师的百分比, 分别计算初中部和高中部 女教师的人数即可.
解析:初中部女教师有120×70%=84(人), 高中部女教师有150×(1-60%)=150×40%=60(人), 则女教师共有84+60=144(人).
讲
课
人
:
邢
启 强
4
学习新知
3.除了频率散布的直方图还有没有类似的统计数据处理方法?
在初中学习过条形图、扇形图、折线图、频数散布直方图等.
统计图表
主要应用(表示数据上的特点)
扇形图
直观描述各类数据占总数的比例
条形图和直方图 直观描述不同类别或分组数据的频数和频率
折线图
描述数据随时间的变化趋势
不同的统计图在表示数据上有不同的特点,不同的统计图适用的数据类型也不同. 例如,条形图适用于描述离散型的数据,直方图适用描述连续型数据等. 在解决问 题的过程中,要根据实际问题的特点,选择恰当的统计图对数据进行可视化描述, 以使我们能通过图形直观地发现样本数据的散布情况,进而估计总体的散布规律
③根据调査数据,你认为
该市市民家庭处理过期药
品最常见的方式是什么?
④家庭过期药品的正确处
理方式是送回收点,若该
市有180万户家庭,请估
计大约有多少户家庭处理
讲 课
过期药品的方式是送回收站.
人
:
邢
启 强
12
[解析](2)①抽样调査的家庭总户数为:80÷8% =1 000(户), m% =1200000×100% =20% ,m=20, n% = 60 ×100% =6% ,n=6.
根据样本数据的第80百分位数,我们可以估计总体数据的第 80百分位数为13.7左右.由于样本的取值规律与总体的取值规律之 间会存在偏差,而在决策问题中,只要临界值近似为第80百分位 数即可,因此为了实际中操作的方便,可以建议市政府把月均用 水量标准定为14t,或者把年用水量标准定为168t.
讲 课
你认为14t这个标准一定能够保证80%的居民用水不超标吗?
9.2 用样本估计总体
9.2.2总体百分位数的估计
复习引入 画频率分布直方图的一般步骤为:
(1)绘制步骤: ①求极差 ,即一组数据中的最大值与最小值的差. ②决定组距与组数.组距与组数的确定没有固定的标准, 一般数据的个数越多,所分组数越 .当多样本容量 不超过100时,常分成5~12组.为方便起见,一般 取 组等距长 ,并且组距应力求“ ”取整. ③将数据分组 . ④列频率散布表.计算各小组的频率,第i组的频率 是 第样i本组容频量数. ⑤画频率散布直方图.其中横轴表示分组,纵轴表 示形的频 组高率 距 度. 频组,率距它实反际应上了就各是组频样率本散观布测直数方据图的中疏各密小程长度方
讲 课
能得出“202X年的空气质量比为2015年明显改良了”的结论吗?为什么?
人
:
邢
启 强
10
典型例题
[例2] 家庭过期药品属于“国家危险废物”,处 理不当将污染环境,危害健康.某市药监部门 为了解市民家庭处理过期药品的方式,决定对 全市家庭作一次简单随机抽样调査.
(_1_)_下③__列_选__取.样(只本需的填方上法正最确合答理案的的一序种号是)
数少、组距大时,容易从中看出数据整体的散布特
点,但由于无法看出每组内的数据散布情况,损失
了较多的 原始数据信息 ;当频率散布直方图的组数多、
组距小时,保留了较多的原始数据信息,但由于小
长方形较多,有时图形会变得非常 不规,则不容易
从中看出总体数据的散布特点.
讲
课
人
:
邢
启 强
3
复习引入
频率散布直方图的性质
9
(3)把202X年6月和2015年全年的空气质量进行比较,由于 一个月和一年的天数差别很大,所以直接通过频数比较没 有意义,应该转化成频率散布进行比较.可以通过二者的空 气质量指数的频率散布直方图或空气质量等级的频率散布 条形图进行比较
通过图可以看出,虽然 202X年6月的空气质量为 “优”的频率略低于2015 年,但“良”的频率明显 高于2015年,而且202X年 6月中度以上的污染天气频 率明显小于2015年,所以 从整体上看,202X年6月 的空气质量要好于2015年 全年的空气质量.
30
308.2%
严重污染(AQI>300)
14
143.8%
合计
365
100%
202X年5月和6月的空气质量指数如下:
5月 240 80 56 53 92 126 45 87 56 60 191 62 55 58 56 53 89 90 125
124 103 81 89 44 34 53 79 81 62 116
讲
课
人
:
邢
启 强
5
典型例题
例1已知某市2015年全年空气质量等级如表所示.
空气质量等级(空气质量指数(AQI))
频数
频率
优(AQI≤50)
83
22.8%
良(50<AQI≤100)
121
33.2 %
轻度污染(100<AQI≤150)
68
18.6%
中度污染(150<AQI≤200)
49
13.4%
重度污染(200<AQI≤300)
讲
课
人
: 邢
扇形统计图
启
强
条形统计图
17
9.2.2总体百分位数的估计
前面我们用频率散布表、频率散布直方图描述了居民用户 月均用水量的样本数据,通过对图表的视察与分析,得出了一 些样本数据的频率散布规律,并由此估计了该市全体居民用户 月均用水量的散布情况,得出了“大部分居民用户的月均用水 量集中在一个较低值区域”等推断,接下来的问题是,如何利 用这些信息,为政府决策服务呢?下面我们对此进行讨论.