9.2.2 总体百分位数的估计
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
说明:由于女生的样本量比较小,所以这里对总体的估计可 能会存在比较大的误差.
[微判断] 1. 若 一 组 样 本 数 据 各 不 相 等 , 则 其 75% 分 位 数 大 于 25% 分 位
数.( √ ) 2.若一组样本数据的10%分位数是23,则在这组数据中有10%的
数据大于23.( √ ) 3.若一组样本数据的24%分位数是24,则在这组数据中至少有
思考:怎样确定居民用户的月均用水量标准?
寻找一个数a使全市居民用户的月均用水量中不超过a的占 80%,大于a的占20%.
思考:你认为如何找到数a?
把100个样本数据按从小到大排序,得到第80个和第81个数 据分别是13.6和13.8.可以发现,区间(13.6,13.8)内的任意一 个数,都能把样本数据分成符合要求的两部分.一般地,取这两
规律方法 由频率分布直方图求百分位数的方法 (1)要注意频率分布直方图中小矩形的面积,就是数据落在该 组的频率. (2)一般采用方程的思想,设出第p百分位数,根据其意义列出 方程并求解即可.
训练3 一组样本数据的频率分布直方图如图所示,试估计此样 本数据的第50百分位数为________.
解析 样本数据低于10的比例为(0.08+0.02)×4=0.40, 样本数据低于14的比例为0.40+0.09×4=0.76,所以此样本 数据的第50百分位数在[10,14)内,估计此样本数据的第50
思考:中位数与第p百分位数有关系吗? 第50百分位数就是中位数,中位数是百分位数的特例, 百分位数是中位数的推广 统计中常用的百分位数还有四分位数
25%,50%,75%这三个分位数把一组由小到大排列后的 数据分成四等份,因此称为四分位数,其中第25百分位数也 称为第一四分位数或下四分位数,第75百分位数也称为第三 四分位数或上四分位数.还有第1百分位数,第5百分位数,第 95百分位数和第99百分位数.
解 (1)当0≤x≤200时,y=0.5x; 当200<x≤400时, y=0.5×200+0.8×(x-200)=0.8x-60; 当x>400时, y=0.5×200+0.8×200+1.0×(x-400)=x-140.
0.5x, 0 x 200, 所以y与x之间的函数解析式为 y 0.8x 60, 200 x 400,
0.05 0.03 0.04
0.02 1.00
解:月均用水量在13.2t以下的居民用户所占的比例为
23%+32%+13%+9%=77%. 在16.2t以下的居民用户所占的比例为
77%+9%=86%.
因此,80%分位数一定位于 13.2,16.2 内.由
13.2 3 0.80 - 0.77 14.2, 0.86 - 0.77
校”,这里的“90%”是百分位数吗? 提示 不是.是指能够考取本科院校的同学占同学总数的百分比. 2.“这次数学测试成绩的第70百分位数是85分”这句话是什么 意思?
提示 有70%的同学数学测试成绩小于或等于85分.
【训练1】 如图所示是某市3月1日至3月10日的最低气温(单位: ℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80 百分位数是( )
解:把27名女生的样本数据按从小到大排序,可得
148.0 149.0 154.0 154.0 155.0 155.0 157.0 158.0 158.0 159.0 161.0 161.0 162.5 163.0 163.0 164.0 164.0 164.0 171.0 172.0 172.0
155.5 162.0 165.0
根据频率分布表或频率分布直方图估计月均用水量的样 本数据的80%和95%分位数.
频率/组距
0.12
0.107
0.1
0.077
0.08
0.06 0.04
0.043 0.030 0.030
0.02
0
0.017 0.013
0.010
0.007
月平均用水量/t 1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
A.-2
B.0
C.1
D.2
解析 由折线图可知,这10天的最低气温按照从小到大的排列 为:-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个 数据,所以10×80%=8,是整数,则这10天最低气温的第80百
分位数是 2 2 2 . 2
答案 D
【训练2】 某市为了鼓励居民节约用电,实行“阶梯式”电价, 将该市每户居民的月用电量划分为三档,月用电量不超过200 千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过 400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分 按1.0元/千瓦时收费.
个数的平均数 13.6 13.8 13.7,称此数为这组数据的第80百分 2
位数,或 80%分位数.
思考:在实际决策中,市政府把月均用水标准定为多少合适? 14t.用样本数据的第80百分位数估计总体数据的第80 百分位 数为13.7左右.因为样本的取值规律与总体的取值规律之间会存 在偏差,所以,只要临界值近似为第80百分位数即可.也可以取 12×14=168(t).
x 140, x 400 .
(2)由(1)可知,当y=260时,x=400,即用电量低于400千瓦时 的占80%, 结合频率分布直方图可知
0.001100 2100b 0.003100 0.8, 100a 0.0005100 0.2.
解得a=0.001 5,b=0.002 0.
(3)设75%分位数为m, 因为用电量低于300千瓦时的所占比例为 (0.001+0.002+0.003)×100=60%, 用电量低于400千瓦时的占80%, 所以75%分位数m在[300,400)内, 所以0.6+(m-300)×0.002=0.75, 解得m=375(千瓦时),即用电量的75%分位数为375千瓦时.
可以估计月均用水量的样本数据的80%分位数约为14.2.
类似地,由 22.2 3 0.95- 0.94 22.95, 0.98- 0.94
可以估计月均用水量的样本数据的95%分位数约为22.95.
例2 根据树人中学高一年级的386名女学生中按分层抽样的 方法抽取了样本量为27的样本,如下
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.0 158.0 155.5 157.0 163.0 172.0 估计树人中学高一年级女生的第25,50,75百分位数.
9.2.2 总体百分位数的估计
引入:前面我们用频率分布表、频率分布直方图描述了居民 用户月均用水量的样本数据,通过对图表的观察分析,得出了 “大部分居民用户的月均用水量集中在一个较低值的区域”等推断. 若该市政府希望80%的居民用户生活用水费支出不受影响,根据 样本中100户居民用户的月均用水量数据,你能给市政府提出居 民用户月均用水量标准应该如何制定的建议?
百分位数为10 0.1 4 100.
0.36
9
答案 100 9
第p百分位数的定义如何叙述? 第p百分位数的定义 一般地,一组数据的第p百分位数是这样一个值,它使得这 组数据中至少有__p__%___的数据小于或等于这个值,且至少有 (100-p)%的数据大于或等于这个值. 总结求第p百分位数的步骤:
计算一组n个数据的第p百分位数的步骤 第1步,按__从__小__到__大___排列原始数据. 第2步,计算i=n×p%. 第3步,若i不是整数,而大于i的比邻整数为j,则第p百分 位数为第j项数据;若i是整数,则第p百分位数为第i项与 第(i+1)项数据的___平__均__数___.
157.0 162.5 170.0
由25%×27=6.75,50%×27=13.5,75%×27=20.25,可知样 本数据的第25,50,75百分位数为第7,14,21项的数据,分别为 155.5,161,164.据此可以估计树人中学高一年级女生的第 25,50,75百分位数分别约为155.5,161,164.
2.下列关于一组数据的第50百分位数的说法正确的是( A ) A.第50百分位数就是中位数 B.总体数据中的任意一个数小于它的可能性一定是50% C.它一定是这组数据中的一个数据 D.它适用于总体是离散型的数据 解析 由百分位数的意义可知选项B,C,D错误.
[微思考] 1.班级人数为50的班主任老师说“90%的同学能够考取本科院
列频率分布表
分组
频数累计
1.2,4.2 正正正正
4.2,7.2 正正正正正正
7.2,10.2 10.2Leabharlann 13.213.2,16.2
16.2,19.2
正正 正 正 正
19.2,22.2
22.2,25.2
25.2,28.2
合计
频数 23 32 13
9 9 5 3
4 2
100
频率 0.23 0.32 0.13 0.09 0.09
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位: 千瓦时)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份 100户居民每户的用电量,统计分析后得到如图所示的频率分 布直方图.若这100户居民中,今年1月份用电费用低于260元的 占80%,求a,b的值;
(3)根据(2)中求得的数据计算用电量的75%分位数.
例1 由于城市居民比较多,因此采用抽样调查的方式,通 过分析样本数据来估计全市居民用水量的分布情况.下面是通过 抽样得到的100位居民的月均用水量数据(单位:t)
9.0 13 .6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0 2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4 3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0 22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9 5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7 5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3 5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8 7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
76%的数据大于或等于24.( √ )
[微训练] 1.下列一组数据的第25百分位数是( A )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0
C.4.4
D.2.5
解析 把该组数据按照由小到大排列,可得:
2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6, 由i=10×25%=2.5,不是整数,则第3个数据3.2,是第25百分 位数.
[微判断] 1. 若 一 组 样 本 数 据 各 不 相 等 , 则 其 75% 分 位 数 大 于 25% 分 位
数.( √ ) 2.若一组样本数据的10%分位数是23,则在这组数据中有10%的
数据大于23.( √ ) 3.若一组样本数据的24%分位数是24,则在这组数据中至少有
思考:怎样确定居民用户的月均用水量标准?
寻找一个数a使全市居民用户的月均用水量中不超过a的占 80%,大于a的占20%.
思考:你认为如何找到数a?
把100个样本数据按从小到大排序,得到第80个和第81个数 据分别是13.6和13.8.可以发现,区间(13.6,13.8)内的任意一 个数,都能把样本数据分成符合要求的两部分.一般地,取这两
规律方法 由频率分布直方图求百分位数的方法 (1)要注意频率分布直方图中小矩形的面积,就是数据落在该 组的频率. (2)一般采用方程的思想,设出第p百分位数,根据其意义列出 方程并求解即可.
训练3 一组样本数据的频率分布直方图如图所示,试估计此样 本数据的第50百分位数为________.
解析 样本数据低于10的比例为(0.08+0.02)×4=0.40, 样本数据低于14的比例为0.40+0.09×4=0.76,所以此样本 数据的第50百分位数在[10,14)内,估计此样本数据的第50
思考:中位数与第p百分位数有关系吗? 第50百分位数就是中位数,中位数是百分位数的特例, 百分位数是中位数的推广 统计中常用的百分位数还有四分位数
25%,50%,75%这三个分位数把一组由小到大排列后的 数据分成四等份,因此称为四分位数,其中第25百分位数也 称为第一四分位数或下四分位数,第75百分位数也称为第三 四分位数或上四分位数.还有第1百分位数,第5百分位数,第 95百分位数和第99百分位数.
解 (1)当0≤x≤200时,y=0.5x; 当200<x≤400时, y=0.5×200+0.8×(x-200)=0.8x-60; 当x>400时, y=0.5×200+0.8×200+1.0×(x-400)=x-140.
0.5x, 0 x 200, 所以y与x之间的函数解析式为 y 0.8x 60, 200 x 400,
0.05 0.03 0.04
0.02 1.00
解:月均用水量在13.2t以下的居民用户所占的比例为
23%+32%+13%+9%=77%. 在16.2t以下的居民用户所占的比例为
77%+9%=86%.
因此,80%分位数一定位于 13.2,16.2 内.由
13.2 3 0.80 - 0.77 14.2, 0.86 - 0.77
校”,这里的“90%”是百分位数吗? 提示 不是.是指能够考取本科院校的同学占同学总数的百分比. 2.“这次数学测试成绩的第70百分位数是85分”这句话是什么 意思?
提示 有70%的同学数学测试成绩小于或等于85分.
【训练1】 如图所示是某市3月1日至3月10日的最低气温(单位: ℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80 百分位数是( )
解:把27名女生的样本数据按从小到大排序,可得
148.0 149.0 154.0 154.0 155.0 155.0 157.0 158.0 158.0 159.0 161.0 161.0 162.5 163.0 163.0 164.0 164.0 164.0 171.0 172.0 172.0
155.5 162.0 165.0
根据频率分布表或频率分布直方图估计月均用水量的样 本数据的80%和95%分位数.
频率/组距
0.12
0.107
0.1
0.077
0.08
0.06 0.04
0.043 0.030 0.030
0.02
0
0.017 0.013
0.010
0.007
月平均用水量/t 1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
A.-2
B.0
C.1
D.2
解析 由折线图可知,这10天的最低气温按照从小到大的排列 为:-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个 数据,所以10×80%=8,是整数,则这10天最低气温的第80百
分位数是 2 2 2 . 2
答案 D
【训练2】 某市为了鼓励居民节约用电,实行“阶梯式”电价, 将该市每户居民的月用电量划分为三档,月用电量不超过200 千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过 400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分 按1.0元/千瓦时收费.
个数的平均数 13.6 13.8 13.7,称此数为这组数据的第80百分 2
位数,或 80%分位数.
思考:在实际决策中,市政府把月均用水标准定为多少合适? 14t.用样本数据的第80百分位数估计总体数据的第80 百分位 数为13.7左右.因为样本的取值规律与总体的取值规律之间会存 在偏差,所以,只要临界值近似为第80百分位数即可.也可以取 12×14=168(t).
x 140, x 400 .
(2)由(1)可知,当y=260时,x=400,即用电量低于400千瓦时 的占80%, 结合频率分布直方图可知
0.001100 2100b 0.003100 0.8, 100a 0.0005100 0.2.
解得a=0.001 5,b=0.002 0.
(3)设75%分位数为m, 因为用电量低于300千瓦时的所占比例为 (0.001+0.002+0.003)×100=60%, 用电量低于400千瓦时的占80%, 所以75%分位数m在[300,400)内, 所以0.6+(m-300)×0.002=0.75, 解得m=375(千瓦时),即用电量的75%分位数为375千瓦时.
可以估计月均用水量的样本数据的80%分位数约为14.2.
类似地,由 22.2 3 0.95- 0.94 22.95, 0.98- 0.94
可以估计月均用水量的样本数据的95%分位数约为22.95.
例2 根据树人中学高一年级的386名女学生中按分层抽样的 方法抽取了样本量为27的样本,如下
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.0 158.0 155.5 157.0 163.0 172.0 估计树人中学高一年级女生的第25,50,75百分位数.
9.2.2 总体百分位数的估计
引入:前面我们用频率分布表、频率分布直方图描述了居民 用户月均用水量的样本数据,通过对图表的观察分析,得出了 “大部分居民用户的月均用水量集中在一个较低值的区域”等推断. 若该市政府希望80%的居民用户生活用水费支出不受影响,根据 样本中100户居民用户的月均用水量数据,你能给市政府提出居 民用户月均用水量标准应该如何制定的建议?
百分位数为10 0.1 4 100.
0.36
9
答案 100 9
第p百分位数的定义如何叙述? 第p百分位数的定义 一般地,一组数据的第p百分位数是这样一个值,它使得这 组数据中至少有__p__%___的数据小于或等于这个值,且至少有 (100-p)%的数据大于或等于这个值. 总结求第p百分位数的步骤:
计算一组n个数据的第p百分位数的步骤 第1步,按__从__小__到__大___排列原始数据. 第2步,计算i=n×p%. 第3步,若i不是整数,而大于i的比邻整数为j,则第p百分 位数为第j项数据;若i是整数,则第p百分位数为第i项与 第(i+1)项数据的___平__均__数___.
157.0 162.5 170.0
由25%×27=6.75,50%×27=13.5,75%×27=20.25,可知样 本数据的第25,50,75百分位数为第7,14,21项的数据,分别为 155.5,161,164.据此可以估计树人中学高一年级女生的第 25,50,75百分位数分别约为155.5,161,164.
2.下列关于一组数据的第50百分位数的说法正确的是( A ) A.第50百分位数就是中位数 B.总体数据中的任意一个数小于它的可能性一定是50% C.它一定是这组数据中的一个数据 D.它适用于总体是离散型的数据 解析 由百分位数的意义可知选项B,C,D错误.
[微思考] 1.班级人数为50的班主任老师说“90%的同学能够考取本科院
列频率分布表
分组
频数累计
1.2,4.2 正正正正
4.2,7.2 正正正正正正
7.2,10.2 10.2Leabharlann 13.213.2,16.2
16.2,19.2
正正 正 正 正
19.2,22.2
22.2,25.2
25.2,28.2
合计
频数 23 32 13
9 9 5 3
4 2
100
频率 0.23 0.32 0.13 0.09 0.09
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位: 千瓦时)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份 100户居民每户的用电量,统计分析后得到如图所示的频率分 布直方图.若这100户居民中,今年1月份用电费用低于260元的 占80%,求a,b的值;
(3)根据(2)中求得的数据计算用电量的75%分位数.
例1 由于城市居民比较多,因此采用抽样调查的方式,通 过分析样本数据来估计全市居民用水量的分布情况.下面是通过 抽样得到的100位居民的月均用水量数据(单位:t)
9.0 13 .6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0 2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4 3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0 22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9 5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7 5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3 5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8 7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
76%的数据大于或等于24.( √ )
[微训练] 1.下列一组数据的第25百分位数是( A )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0
C.4.4
D.2.5
解析 把该组数据按照由小到大排列,可得:
2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6, 由i=10×25%=2.5,不是整数,则第3个数据3.2,是第25百分 位数.