2.2.2用样本的数字特征估计总体的数字特征PPT课件
合集下载
高中数学 2.2.2 用样本的数字特征估计总体的数字特征课件 新人教A版必修3
即这组数据的中位数是
1.70
;
这
组
数
据
的
平
均
数
是
-
x
=
1 17
(1.50×2+1.60×3+…+1.90×1)=281.775≈1.69(m). 答 17名运动员成绩的众数、中位数、平均数依次为1.75 m,
1.70 m,1.69 m.
要点二 平均数和方差的运用
例2 甲、乙两机床同时加工直径为100 cm的零件,为检验质 量,各从中抽取6件测量,数据为: 甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差; (2)根据计算结果判断哪台机床加工零件的质量更稳定.
高中数学·必修3·人教A版
2.2.2 用样本的数字特征估计总体 的数字特征
[学习目标] 1.正确理解样本数据标准差的意义和作用,学会计算数据的
标准差. 2.理解用样本的基本数字特征来估计总体的基本数字特征.
[知识链接] 1.在数据2,2,3,4,4,5,5,6,7,8中众数为_2_,__4_,__5_. 2.一组数据的和除以数据的个数所得到的数叫做这组数据的平
从中可以看出,月均用水量的众数估计是________;中位数 是________;平均数为________. 答案 2.25 t 2.02 t 2.02 t 解析 众数大致的值就是样本数据的频率分布直方图中最高 矩形的中点的横坐标,因此众数估计是2.25 t; 在样本中,有50%的个体小于或等于中位数,也有50%的个 体大于或等于中位数,因此,在频率分布直方图中,中位数 使得在它左边和右边的直方图的面积应该相等,由此可以估 计中位数的值,下图中虚线代表居民月均用水量的中位数的 估计值,此数据值为2.02 t.
人教A版必修3《2.2.2用样本的数字特征估计总体的数字特征》优化训练ppt课件
最中间位置 的一个数据(或中间两个数据的平均数)称为这 在____________
组数据的中位数.
注意:在频率分布直方图中,中位数左边和右边的直方图 相等 ,由此可以估计中位数的值. 的面积________
x1+x2+„+xn x= n (3)如果有n个数x1,x2,„,xn,那么_________________
如下(单位:mL):
342,348,346,340,344,341,343,350,340,342
343.6 则样本的平均数是________.
解析:由于数据较大,又都在常数 342 附近波动,把各数
据都减去 342,得 0,6,4,-2,2,-1,1,8,-2,0,
1 则 x ′=10×(0+6+4-2+2-1+1+8-2+0)=1.6, 即 x = x ′+342=343.6.
人员
平均环数- x 方差s2
甲 8.6 3.5
乙 8.9 3.5
丙 8.9 2.1
丁 8.2 5.6
从这四个人中选择一人参加奥运会射击项目比赛,最佳人 选是( C )
A.甲
C.丙
B.乙
D.丁
【问题探究】
如何通过频率分布直方图估计众数、中位数和平均数? 答案:(1)众数是最高矩形底边的中点;(2)中位数左边和右
边的直方图的面积应相等,由此可以估计中位数的值;(3)平均
数是频率分布直方图的“重心”,它等于每个小矩形的面积乘
以小矩形底边中点的横坐标之和.
题型 1 众数、中位数、平均数的求法
【例 1】 在一次中学生田径运动会上,参加男子跳高的 17 名运动员的成绩如下表: 成绩/米 1.50 1.60 1.65 1.70 人数/名
1 这组数据的平均数是 x =17×(1.50×2+1.60×3+1.65×
组数据的中位数.
注意:在频率分布直方图中,中位数左边和右边的直方图 相等 ,由此可以估计中位数的值. 的面积________
x1+x2+„+xn x= n (3)如果有n个数x1,x2,„,xn,那么_________________
如下(单位:mL):
342,348,346,340,344,341,343,350,340,342
343.6 则样本的平均数是________.
解析:由于数据较大,又都在常数 342 附近波动,把各数
据都减去 342,得 0,6,4,-2,2,-1,1,8,-2,0,
1 则 x ′=10×(0+6+4-2+2-1+1+8-2+0)=1.6, 即 x = x ′+342=343.6.
人员
平均环数- x 方差s2
甲 8.6 3.5
乙 8.9 3.5
丙 8.9 2.1
丁 8.2 5.6
从这四个人中选择一人参加奥运会射击项目比赛,最佳人 选是( C )
A.甲
C.丙
B.乙
D.丁
【问题探究】
如何通过频率分布直方图估计众数、中位数和平均数? 答案:(1)众数是最高矩形底边的中点;(2)中位数左边和右
边的直方图的面积应相等,由此可以估计中位数的值;(3)平均
数是频率分布直方图的“重心”,它等于每个小矩形的面积乘
以小矩形底边中点的横坐标之和.
题型 1 众数、中位数、平均数的求法
【例 1】 在一次中学生田径运动会上,参加男子跳高的 17 名运动员的成绩如下表: 成绩/米 1.50 1.60 1.65 1.70 人数/名
1 这组数据的平均数是 x =17×(1.50×2+1.60×3+1.65×
2.2.2用样本的数字特征估计总体的数字特征课件人教新课标
注:在只有样本频率散布直方图的情况下,我 们可以按上述方法估计众数、中位数和平均 数,并由此估计总体特征.
三数的优缺点
样本的众数、中位数和平均数常用来表示 样本数据的“中心值”.
1.众数和中位数容易计算,不受少数几个极端 值的影响,但只能表达样本数据中的少量信息.
2.平均数代表了数据更多的信息,但受样本中 每个数据的影响,越极端的数据对平均数的影 响也越大.
一天 10名工人生产的零件的中位数是( C )
A.14 B.16 C.15 D.17 【解析】选C.把件数从小到大排列为10,12,14, 14,15,15,16,17,17,19,可知中位数为15.
2.甲、乙两个班各随机选出 15名同学进行测验,所得成 绩的茎叶图如图.从图中看, _____班的平均成绩较高. 【解析】结合茎叶图中成绩的情况可知,
频率散布直方图中,你认为众数应在哪个
小矩形内?由此估计总体的众数是什么?
频率/组距
注意:哪段范围的数最多?
0.5
0
取最高矩形下端中点的
0.4
横坐标2.25作为众数.
0
0.3
0O 0.2
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
0
?由直方图看出众数是2.25,可
是抽样的数据中没有2.25,为什么 区间的中点值2.25是众数呢?
3.平均数的定义:一组数据的和除以数据的 个数所得到的数.
小练 习
求下列一组数的众数、中位数、平均数
(1)2,2,3,3,5,6,7
(2)2,3,5,5
判一判(正确的打“√”,错误的打“×”) (1)中位数一定是样本数据中的某个数.(× ) (2)在一组样本数据中,众数一定是唯一的.( × )
三数的优缺点
样本的众数、中位数和平均数常用来表示 样本数据的“中心值”.
1.众数和中位数容易计算,不受少数几个极端 值的影响,但只能表达样本数据中的少量信息.
2.平均数代表了数据更多的信息,但受样本中 每个数据的影响,越极端的数据对平均数的影 响也越大.
一天 10名工人生产的零件的中位数是( C )
A.14 B.16 C.15 D.17 【解析】选C.把件数从小到大排列为10,12,14, 14,15,15,16,17,17,19,可知中位数为15.
2.甲、乙两个班各随机选出 15名同学进行测验,所得成 绩的茎叶图如图.从图中看, _____班的平均成绩较高. 【解析】结合茎叶图中成绩的情况可知,
频率散布直方图中,你认为众数应在哪个
小矩形内?由此估计总体的众数是什么?
频率/组距
注意:哪段范围的数最多?
0.5
0
取最高矩形下端中点的
0.4
横坐标2.25作为众数.
0
0.3
0O 0.2
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
0
?由直方图看出众数是2.25,可
是抽样的数据中没有2.25,为什么 区间的中点值2.25是众数呢?
3.平均数的定义:一组数据的和除以数据的 个数所得到的数.
小练 习
求下列一组数的众数、中位数、平均数
(1)2,2,3,3,5,6,7
(2)2,3,5,5
判一判(正确的打“√”,错误的打“×”) (1)中位数一定是样本数据中的某个数.(× ) (2)在一组样本数据中,众数一定是唯一的.( × )
2.2.2 用样本的数字特征估计总体的数字特征 课件
s甲
s乙
4
5
6
7
8
9
10
例题1:画出下列四组样本数据的直方图 说明它们的异同点. 例题 画出下列四组样本数据的直方图,说明它们的异同点 画出下列四组样本数据的直方图 说明它们的异同点 (1) 5, 5, 5, 5, 5, 5, 5, 5, 5; (2) 4, 4, 4, 5 , 5, 5, 6, 6, 6; (3) 3 , 3 , 4 , 4 , 5, 6 , 6, 7 , 7; (4) 2 , 2 , 2 , 2, 5 , 8 , 8 , 8 , 8 ; 四组样本数据的直方图是: 解:四组样本数据的直方图是 四组样本数据的直方图是 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 o 频率
−
−
x =5
S=0.82
−
x=5
S=1.49
1 2 3 45 (2)
6 7 8
1 2 3 45
6 7 8
x =5
S=2.83
1 2 3 4 5 6 7 8
四组数据的平均数都是5.0,标准差分别是 标准差分别是0.00,0.82, 四组数据的平均数都是 标准差分别是 1.49,2.83.虽然它们有相同的平均数 但是它们有不 虽然它们有相同的平均数,但是它们有不 虽然它们有相同的平均数 同的标准差,说明数据的分散程度是不一样的 说明数据的分散程度是不一样的. 同的标准差 说明数据的分散程度是不一样的 标准差还可以用于对样本数据的另外一种解释.例如 标准差还可以用于对样本数据的另外一种解释 例如, 例如 − x 在关于居民月均用水量的例子中,平均数 在关于居民月均用水量的例子中 平均数 = 1.973 标准差s=0.868 ,所以 标准差 所以 − −
s乙
4
5
6
7
8
9
10
例题1:画出下列四组样本数据的直方图 说明它们的异同点. 例题 画出下列四组样本数据的直方图,说明它们的异同点 画出下列四组样本数据的直方图 说明它们的异同点 (1) 5, 5, 5, 5, 5, 5, 5, 5, 5; (2) 4, 4, 4, 5 , 5, 5, 6, 6, 6; (3) 3 , 3 , 4 , 4 , 5, 6 , 6, 7 , 7; (4) 2 , 2 , 2 , 2, 5 , 8 , 8 , 8 , 8 ; 四组样本数据的直方图是: 解:四组样本数据的直方图是 四组样本数据的直方图是 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 o 频率
−
−
x =5
S=0.82
−
x=5
S=1.49
1 2 3 45 (2)
6 7 8
1 2 3 45
6 7 8
x =5
S=2.83
1 2 3 4 5 6 7 8
四组数据的平均数都是5.0,标准差分别是 标准差分别是0.00,0.82, 四组数据的平均数都是 标准差分别是 1.49,2.83.虽然它们有相同的平均数 但是它们有不 虽然它们有相同的平均数,但是它们有不 虽然它们有相同的平均数 同的标准差,说明数据的分散程度是不一样的 说明数据的分散程度是不一样的. 同的标准差 说明数据的分散程度是不一样的 标准差还可以用于对样本数据的另外一种解释.例如 标准差还可以用于对样本数据的另外一种解释 例如, 例如 − x 在关于居民月均用水量的例子中,平均数 在关于居民月均用水量的例子中 平均数 = 1.973 标准差s=0.868 ,所以 标准差 所以 − −
高中数学 2.2.2用样本的数字特征估计总体课件 新人教B版必修2
2.2.2 用样本的数字特Байду номын сангаас估计总体 的数字特征
【课标要求】 1.会求样本的众数、中位数、平均数、标准差、方差. 2.理解用样本的数字特征来估计总体数字特征的方法. 3.会应用相关知识解决简单的统计实际问题. 【核心扫描】
1.求样本的众数、中位数、平均数、标准差、方差.(重
点) 2.常与概率等问题结合命题. 3.准确求出样本的数字特征,并理解其意义.(易混点)
(3)平均数受样本中的每一个数据的影响,“越离群”的数 据,对平均数的影响也越大.与众数和中位数相比,平均 数代表了数据更多的信息.当样本数据质量比较差时,使
用平均数描述数据的中心位置可能与实际情况产生较大的
误差. (4)如果样本平均数大于样本中位数,说明数据中存在许
多较大的极端值;反之说明数据中存在许多较小的极端
(3)分析男同学的平均分与中位数相差较大的主要原因是
什么?
[思路探索] 根据各种数据的定义及意义解决 1 - 解 (1) 利 用 平 均 数 计 算 公 式 得 x = (82×27 + 48 80×21)≈81.13(分). (2)∵男同学的中位数是75,
∴至少有14人得分不超过75分.
又∵女同学的中位数是80,
数的平均数.
2.深刻理解和把握平均数、中位数、众数在反映样本数 据上的特点,并结合实际情况,灵活应用.
【变式1】某校在一次考试中,甲、乙两班学生的数学成绩统 计如下: 分数 甲班 人数 乙班 3 5 15 3 13 11 选用平均数与众数、中位数评估这两个班的成绩? 解 甲班平均数79.6分,乙班平均数80.2分,从平均分看 成绩较好的是乙班;甲班众数为90分,乙班众数为70分, 50 1 60 70 80 90 100 6 12 11 15 5
【课标要求】 1.会求样本的众数、中位数、平均数、标准差、方差. 2.理解用样本的数字特征来估计总体数字特征的方法. 3.会应用相关知识解决简单的统计实际问题. 【核心扫描】
1.求样本的众数、中位数、平均数、标准差、方差.(重
点) 2.常与概率等问题结合命题. 3.准确求出样本的数字特征,并理解其意义.(易混点)
(3)平均数受样本中的每一个数据的影响,“越离群”的数 据,对平均数的影响也越大.与众数和中位数相比,平均 数代表了数据更多的信息.当样本数据质量比较差时,使
用平均数描述数据的中心位置可能与实际情况产生较大的
误差. (4)如果样本平均数大于样本中位数,说明数据中存在许
多较大的极端值;反之说明数据中存在许多较小的极端
(3)分析男同学的平均分与中位数相差较大的主要原因是
什么?
[思路探索] 根据各种数据的定义及意义解决 1 - 解 (1) 利 用 平 均 数 计 算 公 式 得 x = (82×27 + 48 80×21)≈81.13(分). (2)∵男同学的中位数是75,
∴至少有14人得分不超过75分.
又∵女同学的中位数是80,
数的平均数.
2.深刻理解和把握平均数、中位数、众数在反映样本数 据上的特点,并结合实际情况,灵活应用.
【变式1】某校在一次考试中,甲、乙两班学生的数学成绩统 计如下: 分数 甲班 人数 乙班 3 5 15 3 13 11 选用平均数与众数、中位数评估这两个班的成绩? 解 甲班平均数79.6分,乙班平均数80.2分,从平均分看 成绩较好的是乙班;甲班众数为90分,乙班众数为70分, 50 1 60 70 80 90 100 6 12 11 15 5
人教版 数学 2 用样本的数字特征估计总体的数字特征(共15张ppt)教育课件
电
:
那
你
的
第
一
口
罗
没
有
我
和
他
不
同
。
我
是
从
底
层
但
是
当
我
拍
完
但
是
我
年
轻
时
有
一
个
想
法
就
是
如
果
我
告
诉
你
怎
么
弄
–■
电
:
“
口
罗
部
爬
一
,
1
戏
有
上
来
的
我
个
5
分
钟
后
你
还
色
其
没
清
镜
没
有
楚 弄
有 怎
完 情
么
头
我
就
胆
怯
,
像
运
作
这
个
东
西
(
,
下
不
耐
烦
像
如
果
我
自
己
弄
费
电
影
一
五
分
钟
男
女
实
里
拍
个
就
弄
尼
摄
)
所
镜
完
所
以
最
是
拍 以
后
通
不
第
•: 其实兴趣真的那么重要吗?很多事情我 们提不 起兴趣 可能就 是运维 我们没 有做好 。想想 看,如 果一件 事情你 能做好 ,至少 做到比 大多数 人好, 你可能 没有办 法岁那 件事情 没有兴 趣。再 想想看 ,一个 刚来到 人世的 小孩, 白纸一 张,开 始什么 都不会 ,当然 对事情 开始的 时候也 没有 兴趣这 一说了 ,随着 年龄的 增长, 慢慢的 开始做 一些事 情,也 逐渐开 始对一 些事情 有兴趣 。通过 观察小 孩的兴 趣,我 们可以 发现一 个规律 ,往往 不是有 了兴趣 才能做 好,而 是做好 了才有 了兴趣 。人们 总是搞 错顺序 ,并对 错误豪 布知晓 。尽管 并不绝 对是这 样,但 大多数 事情都 需要熟 能生巧 。做得 多了, 自然就 擅长了 ;擅长 了,就 自然比 别人做 得好; 做得比 别人好 ,兴趣 就大起 来,而 后就更 喜欢做 ,更擅 长,更 。。更 良性循 环。教 育小孩 也是如 此,并 不是说 买来一 架钢琴 ,或者 买本书 给孩子 就可以 。事实 上,要 花更多 的时间 根据孩 子的情 况,选 出孩子 最可能 比别人 做得好 的事情 ,然后 挤破脑 袋想出 来怎样 能让孩 子学会 并做到 很好, 比一般 人更好 ,做到 比谁都 好,然 后兴趣 就自然 出现了 。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
以员工平均工资收入水平去描述他们单 位的收入情况。这是不合理的,因为这些员 工当中,少数经理层次的收入与大多数一般 员工收入的差别比较大,平均数受数据中的 极端值的影响大,所以平均数不能反映该单 位员工的收入水平。这个老板的话有误导与 蒙骗行为
11
2.2.2 用样本的数字特征估 计总体的数字特征(2)
0.30 0.20
0.15
0.14
0.10
0.08
0.06
0.04
0.04
0.02
o
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
分总析结::在在样本频数率据分中布,直有5方0%图的中个22.体0,小把于频或率等分于中布位直数方,图也划有5分0%左的右个体两大
于个或面等积于相中位等数的,分因界此线,在与频x轴率分交布点直的方横图坐中,标中称位为数中左位边和数右。边的直方图
讨论:众数估计总体情况有什么优缺点?
能够体现样本数据的最大集中点,但它 对其它数据信息的忽视使得无法客观地反映 总体特征。
5
如何从频率分布直方图中估计中位数?
前四个小矩形的面积 注:图中的数据是小矩形的面积即频率
频率 /组距
和=0.49
后四个小矩形的
0.50
0.25
面积和=0.26
0.40
0.22
8
如何从频率分布直方图中估计平均数 ?
频率 /组距
0.50 0.40
0.25 0.22
0.30 0.20
0.15
0.14
0.08
0.10
0.06
. . 0.04
.
..
. . . . 0.04 0.02
o
0.25
0.5
0.75
1 1.5 2
1.25 1.75
2.5
2.25 2.75
3
3.25
3.5
3.75
想一想:某次数学期中考试,毛毛同学得了78分。
全班共30人,其他同学的成绩为1个100分, 4个90 分, 22个80分, 以及一个2分和一个10分。毛毛计 算出全班的平均分为77分,所以毛毛回家告诉妈妈 说,他这次成绩处于班级“中上水平”。这种说法 对吗?
10
探究 P73
你认为“我们单位的收入水平比别的 单位高”这句话应当怎么解释?
4 4.5
4.25
注:图中的数据是小矩形的面积即频率2.02
月均用水量 / t
平均数等于频率分布直方图中每个小矩形 的面积乘以小矩形底边中点的横坐标之和。
9
思考:平均数估计总体情况有什么优缺点?
平均数与每一个样本的数据有关,与众数、中 位数比较起来,平均数可以反映出更多的关于样本 数据全体的信息,但平均数受数据中的极端值的影 响较位射击运动员在一次射击测试中各射靶 10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价?
如果看两人本次射击的平均成绩,由于 x甲7,x乙7 思考:两人射击的平均成绩是一样的.那么两个 人的水平就没有什么差异吗?若有差异你能说明 其水平差异在那里吗?
7
对极端值不敏感有弊的例子:
某人具有初级计算机专业技术水平, 想找一份收入好的工作。这时如果采用各个 公司计算机专业技术人员收入的中位数作为 选择工作的参考指标就会冒这样的风险:很 可能所选择公司的初级计算机专业技术水平 人员的收入很低,其原因是中位数对极端的 数据不敏感。这里更好的方法是同时用平均 数和中位数来作为参考指标,选择平均数较 大且中位数较大的公司就业。
2.2.2用样本的数字特征估计总 体的数字特征(1)
(众数、中位数、平均数)
1
三数概念
1、众数 在一组数据中,出现次数最多 的数据叫做这一组数据的众数。
2、中位数 将一组数据按从小到大(或从 大到小)依次排列,把处在最中间位置的 一个数据(或两个数据的平均数)叫做这 组数据的中位数。 3、平均数 一组数据的总和除以数据的个 数所得的值。
2
求下面这组数据的众数、中位数、平均数
4、4、4、6、6、6、6、8、8、8 众数为6 中位数为6 平均数
x 4446666888 10
3 4 4 6 3 8 10 10 10
6
也可以说平均数为各个不同数字乘以相应频率之和。
3
如何从频率分布直方图中估计众数?如图:
频率 /组距
0.50 0.40 0.30 0.20 0.10
13
甲、乙两人射击的平均成绩相等,观察两人成绩的频率分 布条形图,你能说明其水平差异在那里吗?
频率 0.4
(甲)
频率 0.4
(乙)
0.3
0.3
0.2
0.2
0.1
0.1
O 4 5 6 7 8 9 10 环数 O 4 5 6 7 8 9 10 环数
甲的成绩比较分散,乙的成绩相对集中,比较稳定.
一组数据的最大值与最小值的差称为极差; 极差越大,数据越分散,极差越小,数据越集中.
况下是一个优点,但它对极端值的不敏感有时也会成 为缺点,你能举例说明吗?
对极端值不敏感有利的例子:
考察100位居民的月均用水量表中的数据,如果把 最后一个数据错写成22,并不会对样本中位数产生影
响也就是说对极端数据不敏感的方法能够有效地预防
错误数据的影响,而在实际应用中人为操作的失误经
常造成错误数据。
上的图面积中应,该设相中等位。数为x,则 0.0 4 0.0 8 0.1 5 0.2 2 (x2)0.50.5
x2.02
6
思考:2.02这个中位数的估计值,与样本数据的中
位数2.0不同,为什么?
从频率分布直方图本身得不出原始的数据内容, 频率分布直方图已经损失一些样本信息。
思考:中位数不受少数极端值的影响,这在某些情
o
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
2.2
众数在样本数5 据的频率分布直方图中,
就是最高矩形的中点的横坐标。
4
思考:频率分布直方图中估计的众数与原始
数据中的众数2.3不同,为什么?
在频率分布直方图,我们只能直观地看出 数据的大概分布情况,从直方图本身得不出 原始的数据内容,直方图已经损失一些样本 信息。
甲的环数极差=10-4=6 乙的环数极差=9-5=4. 因此我们可以得到一种“去掉一个最高分,去掉一个最低分”1的4 统计策略.
考察样本数据的分散程度的大小,最常用的统计量是标准差
1、标准差是样本数据到平均数的一种平均距离。 一般用s表示。它用来描述样本数据的离散程度。 在实际应用中,标准差常被理解为稳定性。
11
2.2.2 用样本的数字特征估 计总体的数字特征(2)
0.30 0.20
0.15
0.14
0.10
0.08
0.06
0.04
0.04
0.02
o
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
分总析结::在在样本频数率据分中布,直有5方0%图的中个22.体0,小把于频或率等分于中布位直数方,图也划有5分0%左的右个体两大
于个或面等积于相中位等数的,分因界此线,在与频x轴率分交布点直的方横图坐中,标中称位为数中左位边和数右。边的直方图
讨论:众数估计总体情况有什么优缺点?
能够体现样本数据的最大集中点,但它 对其它数据信息的忽视使得无法客观地反映 总体特征。
5
如何从频率分布直方图中估计中位数?
前四个小矩形的面积 注:图中的数据是小矩形的面积即频率
频率 /组距
和=0.49
后四个小矩形的
0.50
0.25
面积和=0.26
0.40
0.22
8
如何从频率分布直方图中估计平均数 ?
频率 /组距
0.50 0.40
0.25 0.22
0.30 0.20
0.15
0.14
0.08
0.10
0.06
. . 0.04
.
..
. . . . 0.04 0.02
o
0.25
0.5
0.75
1 1.5 2
1.25 1.75
2.5
2.25 2.75
3
3.25
3.5
3.75
想一想:某次数学期中考试,毛毛同学得了78分。
全班共30人,其他同学的成绩为1个100分, 4个90 分, 22个80分, 以及一个2分和一个10分。毛毛计 算出全班的平均分为77分,所以毛毛回家告诉妈妈 说,他这次成绩处于班级“中上水平”。这种说法 对吗?
10
探究 P73
你认为“我们单位的收入水平比别的 单位高”这句话应当怎么解释?
4 4.5
4.25
注:图中的数据是小矩形的面积即频率2.02
月均用水量 / t
平均数等于频率分布直方图中每个小矩形 的面积乘以小矩形底边中点的横坐标之和。
9
思考:平均数估计总体情况有什么优缺点?
平均数与每一个样本的数据有关,与众数、中 位数比较起来,平均数可以反映出更多的关于样本 数据全体的信息,但平均数受数据中的极端值的影 响较位射击运动员在一次射击测试中各射靶 10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价?
如果看两人本次射击的平均成绩,由于 x甲7,x乙7 思考:两人射击的平均成绩是一样的.那么两个 人的水平就没有什么差异吗?若有差异你能说明 其水平差异在那里吗?
7
对极端值不敏感有弊的例子:
某人具有初级计算机专业技术水平, 想找一份收入好的工作。这时如果采用各个 公司计算机专业技术人员收入的中位数作为 选择工作的参考指标就会冒这样的风险:很 可能所选择公司的初级计算机专业技术水平 人员的收入很低,其原因是中位数对极端的 数据不敏感。这里更好的方法是同时用平均 数和中位数来作为参考指标,选择平均数较 大且中位数较大的公司就业。
2.2.2用样本的数字特征估计总 体的数字特征(1)
(众数、中位数、平均数)
1
三数概念
1、众数 在一组数据中,出现次数最多 的数据叫做这一组数据的众数。
2、中位数 将一组数据按从小到大(或从 大到小)依次排列,把处在最中间位置的 一个数据(或两个数据的平均数)叫做这 组数据的中位数。 3、平均数 一组数据的总和除以数据的个 数所得的值。
2
求下面这组数据的众数、中位数、平均数
4、4、4、6、6、6、6、8、8、8 众数为6 中位数为6 平均数
x 4446666888 10
3 4 4 6 3 8 10 10 10
6
也可以说平均数为各个不同数字乘以相应频率之和。
3
如何从频率分布直方图中估计众数?如图:
频率 /组距
0.50 0.40 0.30 0.20 0.10
13
甲、乙两人射击的平均成绩相等,观察两人成绩的频率分 布条形图,你能说明其水平差异在那里吗?
频率 0.4
(甲)
频率 0.4
(乙)
0.3
0.3
0.2
0.2
0.1
0.1
O 4 5 6 7 8 9 10 环数 O 4 5 6 7 8 9 10 环数
甲的成绩比较分散,乙的成绩相对集中,比较稳定.
一组数据的最大值与最小值的差称为极差; 极差越大,数据越分散,极差越小,数据越集中.
况下是一个优点,但它对极端值的不敏感有时也会成 为缺点,你能举例说明吗?
对极端值不敏感有利的例子:
考察100位居民的月均用水量表中的数据,如果把 最后一个数据错写成22,并不会对样本中位数产生影
响也就是说对极端数据不敏感的方法能够有效地预防
错误数据的影响,而在实际应用中人为操作的失误经
常造成错误数据。
上的图面积中应,该设相中等位。数为x,则 0.0 4 0.0 8 0.1 5 0.2 2 (x2)0.50.5
x2.02
6
思考:2.02这个中位数的估计值,与样本数据的中
位数2.0不同,为什么?
从频率分布直方图本身得不出原始的数据内容, 频率分布直方图已经损失一些样本信息。
思考:中位数不受少数极端值的影响,这在某些情
o
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
2.2
众数在样本数5 据的频率分布直方图中,
就是最高矩形的中点的横坐标。
4
思考:频率分布直方图中估计的众数与原始
数据中的众数2.3不同,为什么?
在频率分布直方图,我们只能直观地看出 数据的大概分布情况,从直方图本身得不出 原始的数据内容,直方图已经损失一些样本 信息。
甲的环数极差=10-4=6 乙的环数极差=9-5=4. 因此我们可以得到一种“去掉一个最高分,去掉一个最低分”1的4 统计策略.
考察样本数据的分散程度的大小,最常用的统计量是标准差
1、标准差是样本数据到平均数的一种平均距离。 一般用s表示。它用来描述样本数据的离散程度。 在实际应用中,标准差常被理解为稳定性。