2.2.2用样本的数字特征估计总体的数字特征
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
提示������和 a 的几何意义如图所示.显然,标准差越大,则 a 越大,数 据的离散程度越大,数据较分散;标准差越小,则 a 越小,数据的离散程 度越小,数据较集中在平均数������的周围.
四、方差 【问题思考】 1.人们有时用标准差的平方s2——方差来代替标准差,作为测量样本数据分散程 度的工具.你能依据标准差的计算公式写出方差的计算公式吗?
甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 如果你是教练,你应当如何对这次射击作出评价? 1.甲、乙两人本次射击的平均成绩分别为多少环?他们的平均成绩一样吗?
提示经计算得������甲 = 110(7+8+7+9+5+4+9+10+7+4)=7,同理可得 ������乙=7.他们的平均成绩一样.
5.做一做1:10名工人某天生产同一零件,生产的件数是 15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有
()
A.a>b>c B.b>c>a C.c>a>b D.c>b>a
解析:将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a=
100)2+(100-100)2]=1. (2)两台机床所加工零件的直径的平均值相同,又������甲2 > ������乙2 ,所以
乙机床加工零件的质量更稳定.
反思感悟1.在实际问题中,仅靠平均数不能完全反映问题,还要研究其
偏离平均值的离散程度(即方差或标准差):方差大说明取值分散性大,数
值不稳定;方差小说明取值分散性小,数值集中、稳定.
答案:13.2
三、标准差 【问题思考】
平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总 体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能 忽视的.因此,只有平均数还难以概括样本数据的实际状态.如:有两位射击运动员在 一次射击测试中各射靶10次,每次命中的环数如下:
(3)在这个问题中,中位数���和��� 众数均能反映该公司人员的工资水平.因为公司中少数人的 工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这 个公司人员的工资水平.
反思感悟1.深刻理解和把握平均数、中位数、众数在反映样本 数据上的特点,并结合实际情况,灵活应用.
2.如果样本平均数大于样本中位数,说明数据中存在许多较大的 极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如 果同时知道样本中位数和样本平均数,可以使我们了解样本数据中 极端数据的信息,帮助我们作出决策.
3.平均数对极端值敏感,而中位数对极端值不敏感.因此两者结合, 可较好地分析总体的情况.
探究二 平均数与方差的综合应用
【例2】甲、乙两机床同时加工直径为100 cm的98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差; (2)根据计算结果判断哪台机床加工零件的质量更稳定. 分析求平均数→求(xi-x)2→求方差s2
2.2用样本的数字特征估计总体的数字特征
一、众数、中位数和平均数 【问题思考】 1.众数是如何定义的?有什么特点?举例加以说明. 提示定义:在一组数据中,出现次数最多的数据叫做这组数 据的众数. 特点:(1)众数是这组数据中出现次数最多的数; (2)众数可以有一个或多个.如一组数据:2,2,3,4,4,5,5,6,7,8 的众数为2,4,5.
2.中位数是如何定义的?有什么特点?举例加以说明.
提示定义:将一组数据按大小依次排列,把处在最中间位置的一个
数据(或最中间两个数据的平均数)叫做这组数据的中位数.
特点:(1)排序后找中位数;(2)中位数只有一个;(3)中位数不一定是
这组数据中的数.如一组数据:2,2,3,4,4,5,5,6,7,8的中位数为
解:(1)������甲 = 16×(99+100+98+100+100+103)=100. ������乙 = 16×(99+100+102+99+100+100)=100. ������甲2 = 16×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100100)2+(103-100)2]=73, ������乙2 = 16×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-
2.难道这两个人的水平就没有什么差异了吗?你能作出这两人成绩的频 率分布条形图来说明其水平差异在哪里吗?
提示频率分布条形图如下:
(甲)
(乙)
从图上可以直观地看出,他们的水平还是有差异的,甲成绩比较分散,乙成
绩相对集中.
3.对于甲、乙的射击成绩除了画出频率分布条形图比较外,还有没 有其他方法来说明两组数据的分散程度?
2.关于统计的有关性质及规律
(1)若 x1,x2,…,xn 的平均数为������,那么 mx1+a,mx2+a,…,mxn+a 的平均
数是 m ������+a.
(2)数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等. (3)若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.
4.如何用数字去刻画这种分散程度呢? 提示考察样本数据的分散程度的大小,最常用的统计量是标准差.标 准差是样本数据到平均数的一种平均距离,一般用s表示.
5.所谓“平均距离”,其含义如何理解?
提示假设样本数据是 x1,x2,…,xn,������表示这组数据的平均数.xi 到������的
距离是|xi-������|(i=1,2,…,n).于是,样本数据 x1,x2,…,xn 到������的“平均距离” 是 S=|������1-������|+|������2-������������|+…+|������������-������|.由于上式含有绝对值,运算不太方便,因此, 通常改用如下公式来计算标准
1 2
(4+5)=4.5.
3.平均数是如何定义的?
提示定义:如果有n个数x1,x2,x3,…,xn,
那么
1 ������ = ������
(x1+x2+…+xn)叫做这n个数的平均数.
二、众数、中位数和平均数的几何意义
【问题思考】
1.如何在样本数据的频率分布直方图中,估计出众数的值?你能利用在上一节中调 查的100位居民的月均用水量的频率分布直方图加以说明吗?
提示还经常用甲、乙的极差与平均数一起比较说明数据的分散程 度.甲的环数极差=10-4=6,乙的环数极差=9-5=4.
它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以 给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意 到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统 计策略.
差:s=
1 ������
[(������1 -������)2
+
(������2 -������)2
+
…
+
(������������
-������)2 ].
6.考虑一个容量为 2 的样本:x1<x2,其样本的标准差为������22-������1,如果 记 a=������22-������1,那么在数轴上,������和 a 有什么几何意义?由此说明标准差的 大小对数据的离散程度有何影响?
提示平均数是频率分布直方图的“重心”,是直方图的 平衡点,因此,每个小矩形的面积与小矩形底边中点的横 坐标的乘积之和即为平均数的估计值.
4.根据众数、中位数、平均数各自的特点,你能分析它们对反映 总体存在的不足之处吗?
提示(1)众数体现了样本数据的最大集中点,但它对其他数据信息 的忽视使其无法客观地反映总体特征;(2)中位数是样本数据所占频 率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点, 但它对极端值的不敏感有时也会成为缺点;(3)由于平均数与每一个 样本的数据有关,所以任何一个样本数据的改变都会引起平均数的 改变,这是众数、中位数都不具有的性质.也正因如此,与众数、中 位数比较起来,平均数可以反映出更多的关于样本数据全体的信息, 但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性 降低.
提示在样本中,有50%的个体小于或等于中位数,也有50%的个体大于 或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图 的面积应该相等,由此可以估计中位数的值,下图中虚线代表居民月均 用水量的中位数的估计值,此数据值为2.02 t.
3.如何在样本数据的频率分布直方图中估计出平均数 的值?
探究三 频率分布直方图与样本的数字特征
【例3】 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成 五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、 五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
提示方差 s2=���1���[(x1-������)2+(x2-������)2+…+(xn-������)2],其中,xi(i=1,2,…,n)是样 本数据,n 是样本容量,������是样本平均数. 2.现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道 的.如何求得总体的平均数和标准差呢? 提示通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与 前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这 样做就是合理的,也是可以接受的.
人数 1
1
工资/元 30 000 20 000
2
1
53
20
15 000 10 000 8 000 6 000 4 500
(1)求该公司人员月工资的平均数、中位数、众数(精确到元); (2)假设副董事长的工资从20 000元提升到30 000元;董事长的工资从30 000元提 升到50 000元,那么新的平均数、中位数、众数又是什么?(精确到元) (3)你认为哪个统计量更能反映这个公司人员的工资水平?结合此问题谈一谈你 的看法. 分析平均数定义→计算平均数→将数据从小到大排列→得中位数、众数→结 论
提示众数大致的值就是样本数据的频率分布直方图中最高矩形的中点的横坐标. 从上一节中调查的100位居民的月均用水量的频率分布直方图可以看出,月均用水 量的众数估计是2.25 t,如图所示.
2.如何在样本数据的频率分布直方图中,估计出中位数的值?你能利用 在上一节中调查的100位居民的月均用水量的频率分布直方图加以说 明吗?
解:(1)平均数是 ������ =(30 000+20 000+15 000×2+10 000+8 000×5+6 000×3+4 500×20)÷33≈7 212(元),
中位数是4 500元,众数是4 500元.
(2)平均数是 '=(50 000+30 000+15 000×2+10 000+8 000×5+6 000×3+4 500×20)÷33≈8 121(元),中位数是4 500元,众数是4 500元.
平均数为������=9+15×(0.4+0.4+0.6+0.4+0.7)=9.5. 方差为 s2=15×[3×(9.4-9.5)2+(9.6-9.5)2+(9.7-9.5)2]=0.016. 答案:D
探究一 众数、中位数、平均数的简单应用
【例1】 某公司的33名人员的月工资如下:
职务 董事长 副董事长 董事 总经理 经理 管理员 职员
110×(10+12+14×2+15×2+16+17×3)=14.7,中位数b=15,众数c=17,显然
a<b<c,选D.
答案:D
6.做一做2:有一组数据,其中10,12,13,15,16出现的频率分别是
0.15,0.2,0.3,0.2,0.15,则该组数据的平均数为
.
解析:该组数据的平均数为
10×0.15+12×0.2+13×0.3+15×0.2+16×0.15=13.2.
3.做一做3:在一次歌手大奖赛上,七位评委为歌手打出的分数如下:
9.4 8.4 9.4 9.9 9.6 9.4 9.7 去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A.9.4,0.484 B.9.4,0.016
C.9.5,0.04 D.9.5,0.016 解析:去掉9.9和8.4得一组数:9.4,9.4,9.6,9.4,9.7,
四、方差 【问题思考】 1.人们有时用标准差的平方s2——方差来代替标准差,作为测量样本数据分散程 度的工具.你能依据标准差的计算公式写出方差的计算公式吗?
甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 如果你是教练,你应当如何对这次射击作出评价? 1.甲、乙两人本次射击的平均成绩分别为多少环?他们的平均成绩一样吗?
提示经计算得������甲 = 110(7+8+7+9+5+4+9+10+7+4)=7,同理可得 ������乙=7.他们的平均成绩一样.
5.做一做1:10名工人某天生产同一零件,生产的件数是 15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有
()
A.a>b>c B.b>c>a C.c>a>b D.c>b>a
解析:将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a=
100)2+(100-100)2]=1. (2)两台机床所加工零件的直径的平均值相同,又������甲2 > ������乙2 ,所以
乙机床加工零件的质量更稳定.
反思感悟1.在实际问题中,仅靠平均数不能完全反映问题,还要研究其
偏离平均值的离散程度(即方差或标准差):方差大说明取值分散性大,数
值不稳定;方差小说明取值分散性小,数值集中、稳定.
答案:13.2
三、标准差 【问题思考】
平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总 体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能 忽视的.因此,只有平均数还难以概括样本数据的实际状态.如:有两位射击运动员在 一次射击测试中各射靶10次,每次命中的环数如下:
(3)在这个问题中,中位数���和��� 众数均能反映该公司人员的工资水平.因为公司中少数人的 工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这 个公司人员的工资水平.
反思感悟1.深刻理解和把握平均数、中位数、众数在反映样本 数据上的特点,并结合实际情况,灵活应用.
2.如果样本平均数大于样本中位数,说明数据中存在许多较大的 极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如 果同时知道样本中位数和样本平均数,可以使我们了解样本数据中 极端数据的信息,帮助我们作出决策.
3.平均数对极端值敏感,而中位数对极端值不敏感.因此两者结合, 可较好地分析总体的情况.
探究二 平均数与方差的综合应用
【例2】甲、乙两机床同时加工直径为100 cm的98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差; (2)根据计算结果判断哪台机床加工零件的质量更稳定. 分析求平均数→求(xi-x)2→求方差s2
2.2用样本的数字特征估计总体的数字特征
一、众数、中位数和平均数 【问题思考】 1.众数是如何定义的?有什么特点?举例加以说明. 提示定义:在一组数据中,出现次数最多的数据叫做这组数 据的众数. 特点:(1)众数是这组数据中出现次数最多的数; (2)众数可以有一个或多个.如一组数据:2,2,3,4,4,5,5,6,7,8 的众数为2,4,5.
2.中位数是如何定义的?有什么特点?举例加以说明.
提示定义:将一组数据按大小依次排列,把处在最中间位置的一个
数据(或最中间两个数据的平均数)叫做这组数据的中位数.
特点:(1)排序后找中位数;(2)中位数只有一个;(3)中位数不一定是
这组数据中的数.如一组数据:2,2,3,4,4,5,5,6,7,8的中位数为
解:(1)������甲 = 16×(99+100+98+100+100+103)=100. ������乙 = 16×(99+100+102+99+100+100)=100. ������甲2 = 16×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100100)2+(103-100)2]=73, ������乙2 = 16×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-
2.难道这两个人的水平就没有什么差异了吗?你能作出这两人成绩的频 率分布条形图来说明其水平差异在哪里吗?
提示频率分布条形图如下:
(甲)
(乙)
从图上可以直观地看出,他们的水平还是有差异的,甲成绩比较分散,乙成
绩相对集中.
3.对于甲、乙的射击成绩除了画出频率分布条形图比较外,还有没 有其他方法来说明两组数据的分散程度?
2.关于统计的有关性质及规律
(1)若 x1,x2,…,xn 的平均数为������,那么 mx1+a,mx2+a,…,mxn+a 的平均
数是 m ������+a.
(2)数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等. (3)若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.
4.如何用数字去刻画这种分散程度呢? 提示考察样本数据的分散程度的大小,最常用的统计量是标准差.标 准差是样本数据到平均数的一种平均距离,一般用s表示.
5.所谓“平均距离”,其含义如何理解?
提示假设样本数据是 x1,x2,…,xn,������表示这组数据的平均数.xi 到������的
距离是|xi-������|(i=1,2,…,n).于是,样本数据 x1,x2,…,xn 到������的“平均距离” 是 S=|������1-������|+|������2-������������|+…+|������������-������|.由于上式含有绝对值,运算不太方便,因此, 通常改用如下公式来计算标准
1 2
(4+5)=4.5.
3.平均数是如何定义的?
提示定义:如果有n个数x1,x2,x3,…,xn,
那么
1 ������ = ������
(x1+x2+…+xn)叫做这n个数的平均数.
二、众数、中位数和平均数的几何意义
【问题思考】
1.如何在样本数据的频率分布直方图中,估计出众数的值?你能利用在上一节中调 查的100位居民的月均用水量的频率分布直方图加以说明吗?
提示还经常用甲、乙的极差与平均数一起比较说明数据的分散程 度.甲的环数极差=10-4=6,乙的环数极差=9-5=4.
它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以 给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意 到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统 计策略.
差:s=
1 ������
[(������1 -������)2
+
(������2 -������)2
+
…
+
(������������
-������)2 ].
6.考虑一个容量为 2 的样本:x1<x2,其样本的标准差为������22-������1,如果 记 a=������22-������1,那么在数轴上,������和 a 有什么几何意义?由此说明标准差的 大小对数据的离散程度有何影响?
提示平均数是频率分布直方图的“重心”,是直方图的 平衡点,因此,每个小矩形的面积与小矩形底边中点的横 坐标的乘积之和即为平均数的估计值.
4.根据众数、中位数、平均数各自的特点,你能分析它们对反映 总体存在的不足之处吗?
提示(1)众数体现了样本数据的最大集中点,但它对其他数据信息 的忽视使其无法客观地反映总体特征;(2)中位数是样本数据所占频 率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点, 但它对极端值的不敏感有时也会成为缺点;(3)由于平均数与每一个 样本的数据有关,所以任何一个样本数据的改变都会引起平均数的 改变,这是众数、中位数都不具有的性质.也正因如此,与众数、中 位数比较起来,平均数可以反映出更多的关于样本数据全体的信息, 但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性 降低.
提示在样本中,有50%的个体小于或等于中位数,也有50%的个体大于 或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图 的面积应该相等,由此可以估计中位数的值,下图中虚线代表居民月均 用水量的中位数的估计值,此数据值为2.02 t.
3.如何在样本数据的频率分布直方图中估计出平均数 的值?
探究三 频率分布直方图与样本的数字特征
【例3】 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成 五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、 五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
提示方差 s2=���1���[(x1-������)2+(x2-������)2+…+(xn-������)2],其中,xi(i=1,2,…,n)是样 本数据,n 是样本容量,������是样本平均数. 2.现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道 的.如何求得总体的平均数和标准差呢? 提示通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与 前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这 样做就是合理的,也是可以接受的.
人数 1
1
工资/元 30 000 20 000
2
1
53
20
15 000 10 000 8 000 6 000 4 500
(1)求该公司人员月工资的平均数、中位数、众数(精确到元); (2)假设副董事长的工资从20 000元提升到30 000元;董事长的工资从30 000元提 升到50 000元,那么新的平均数、中位数、众数又是什么?(精确到元) (3)你认为哪个统计量更能反映这个公司人员的工资水平?结合此问题谈一谈你 的看法. 分析平均数定义→计算平均数→将数据从小到大排列→得中位数、众数→结 论
提示众数大致的值就是样本数据的频率分布直方图中最高矩形的中点的横坐标. 从上一节中调查的100位居民的月均用水量的频率分布直方图可以看出,月均用水 量的众数估计是2.25 t,如图所示.
2.如何在样本数据的频率分布直方图中,估计出中位数的值?你能利用 在上一节中调查的100位居民的月均用水量的频率分布直方图加以说 明吗?
解:(1)平均数是 ������ =(30 000+20 000+15 000×2+10 000+8 000×5+6 000×3+4 500×20)÷33≈7 212(元),
中位数是4 500元,众数是4 500元.
(2)平均数是 '=(50 000+30 000+15 000×2+10 000+8 000×5+6 000×3+4 500×20)÷33≈8 121(元),中位数是4 500元,众数是4 500元.
平均数为������=9+15×(0.4+0.4+0.6+0.4+0.7)=9.5. 方差为 s2=15×[3×(9.4-9.5)2+(9.6-9.5)2+(9.7-9.5)2]=0.016. 答案:D
探究一 众数、中位数、平均数的简单应用
【例1】 某公司的33名人员的月工资如下:
职务 董事长 副董事长 董事 总经理 经理 管理员 职员
110×(10+12+14×2+15×2+16+17×3)=14.7,中位数b=15,众数c=17,显然
a<b<c,选D.
答案:D
6.做一做2:有一组数据,其中10,12,13,15,16出现的频率分别是
0.15,0.2,0.3,0.2,0.15,则该组数据的平均数为
.
解析:该组数据的平均数为
10×0.15+12×0.2+13×0.3+15×0.2+16×0.15=13.2.
3.做一做3:在一次歌手大奖赛上,七位评委为歌手打出的分数如下:
9.4 8.4 9.4 9.9 9.6 9.4 9.7 去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A.9.4,0.484 B.9.4,0.016
C.9.5,0.04 D.9.5,0.016 解析:去掉9.9和8.4得一组数:9.4,9.4,9.6,9.4,9.7,