均值、方差、标准差

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例2 高一(1)班学生年龄统计:(班级共有43 人)其中有20人18岁,13人17岁,7人16 岁,,3人15岁,求该班级的平均年龄。
分析 在班级年龄序列中18出现了20次, 17出现了13 次,16出现了7次,15出现了3次
解: x 18 20 1713 16 7 15 3 43
18 20 17 13 16 7 158 3
43
43
43
43
17
“加权平均数”
加权平均值 (用频率计算平均值)
一般地,若取值为 x1, x2, xn , 出现的次数分别
为 f1, f2 fn ,设频率为 p1, p2 , pn 则其加权平均数为
x1 p1 x2 p2 xn pn
怎样利用这些数据对重力加速度进行估计? 平均数
问题转化为:
实验结果测得一组数据为 a1 , a2,
an
用 算术平均数作为重力加速度“最理想的”近似 值,依据是什么呢?
处理实验数据的原则是使这个近似值与实验数 据之间的离差(偏差)最小、设近似值为x,
则它与n个实验值 ai(i=1,2,3,…,n)的平称均为数这或n个者数均的值
甲班 112 86 106 84 100 105 98 102 94 107
87 112 94 94 99 90 120 98 95 119
108 100 96 115 111 104 95 108 111 105
104 107 119 107 93 102 98 112 112 99

92 102 93
乙班
116 95 109
84 94 96 106
94 100 90 84 114
甲班均分
98 108 99 110 103
94 98 105 101 115 104 112 101 113 96
108 100 110 98 107 87 108 106 103 97
107 106 111 121 97 107 114 122 101 107
107 111 114 106 104 104 95 111 111 110
乙班均分
思考
某公司有经理1人,另有6名管理人员,5名高级
技工,10名工人和10名学徒,现需要增加一名新工人。
小张前来应聘,经理说:“我公司报酬不错,平均工
资每月1695元。”小张工作几天后找到经理说:“你
欺骗了我,我问过其他工人,每月一个人的工资超过
85 90 80 80 85 75 100 计算这组样本数据的极差、方差和标准差.
例2.甲、乙两种水稻试验品种连续5年的平均单位 面积产量如下(单位:t/hm2),试根据这组数据估 计哪一种水稻品种的产量比较稳定。
品种 第1年 第2年 第3年 第4年 第5年

9.8 9.9 10.1 10 10.2
收入范围
所占百分 比
10000 至 15000 10%
15000 至 20000 15%
20000 至 25000 20%
25000 至 30000 25%
30000 至 35000 15%
35000 至 40000 10%
40000 至 50000
5%
平均数的计算方法:
(1)定义法:已知 x1,x2,x3,…,xn 为某样本的 n 个数据,则这 n 个数据的平均数为: x = x1+x2+xn3+…+xn.
均数为 m x ﹢a。
(4)加权平均数:样本中,数据 x1 有 m1 个,x2 有 m2 个,…,xk 有 mk 个,则 x = m1xm1+1+mm2x2+2+……++mmkkxk.
情境引入二:
有甲乙两种钢筋,现从中各抽取一个样本 检查它们的抗拉强度,如下表:
甲 110 120 130 125 120 125 135 125 135 125
甲: 31 32 35 37 33 30 32 31 30 29
乙: 53 16 54 13 66 16 13 11 16 62
问: 哪种玉米苗长得齐高? 怎

x甲 =32
办 呢

x乙 =32
甲: 31 32 35 37 33 30 32 31 30 29 乙: 53 16 54 13 66 16 13 11 16 62
总体特征数:
在数学中,通常把能反映总体某种特征的量称为总体特征数
如何反映总体的特征数? 用样本的特征数估计总体的特征数!
情境引入一:
在利用单摆检验重力加速度的实验中,全班同学在 相同的条件下进行测试,得到下列数据(单位:m/s²)
9.62 9.54 9.78 9.94 10.01 9.66 9.88 9.68 10.32 9.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.94 9.65 9.79 9.42 9.68 9.70 9.84 9.90
其中 ( p1 p2 pn 1)
例3:由下表估计学生日平均睡眠时间
睡眠时间 人数
频率
[6,6.5)
5
0.05
[6.5,7)
17
0.17
[7,7.5)
33
0.33
[7.5,8)
37
0.37
[8,8.5)
6
0.06
[8.5,9]
2
0.02
合计
100
1
例4:由某单位年收入表试估计该单位职工 的平均年输入
极差、方差与标准差的区别和联系:
都是用来描述数据的离散程度,其中极差 是数据最大值与最小值的差,反映了一组数据 的变化的最大幅度,它对一组数据中的极端值 非常敏感。方差反映一组数据围绕平均数波动 的大小,标准差是以样本数据为单位表示波动 幅度。
例1:从高一(1)班的一次数学测验抽取一小组 成绩如下(保留整数):
x)
称为这个样本的标准差,分别称为样本方差、样本标准差
因为方差与原始数据的单位不同,且平方后可能夸 大了离差的程度,我们标准差来刻画一组数据的稳定 程度.
方差和标准差的意义:
描述一个样本和总体的波动(离散程度)大小的 特征数,标准差大说明波动大.
方差的运算性质:
如果数据 x1, x2 ,, xn 的平均数为 x ,
在这个问题中,总体月平均数能客观地反映工人的 月工资水平吗?为什么?
总体月平均数不能反映工人的月工资水平, 因为公司中少数人的月工资额与大多 数人 的月工资额差别较大,这样导致平均 数与 中位数的偏差较大,所以月平均数不 能反 映这个公司工人的月工资水平,而应 该应 用中位数或众数来反映工人的月工资 水平

100 105 110 115 120 125 130 135 140 145

说明甲比乙稳定
思 考 : 什么样的指标可以反映一组数据 变化范围的大小?
一组数据的最大值与最小值的差称为极差;
极差=最大值-最小值
极差越大,数据越分散,越不稳定 极差越小,数据越集中,越稳定
极差体现了数据的离散程度
某农场种植了甲、乙两种玉米苗,从中各抽取 了10株,分别测得它们的株高如下:

9.4 10.3 10.8 9.7 9.8
1、在一次歌手大奖赛上,七位评委为歌手打出的分数 如下: 9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分 和一个最低分后,所剩数据的平均值和方差分别为
__9_._5_,__0__.0_1_6______;
2、已知数据a1, a2 , a3的方差为2,则求数据 2a1, 2a2 , 2a3
的方差、标准差。
若x1, x2,, xn的方差为4,那么 x1 3, x2 3,, xn 3的方差为____
若x1, x2,, xn的方差为2,那么 这组数据均乘以4后的方差为____
• 样本方差的算术平方根叫做样本标准差。
设一组样本数据 x1, x2 , xn ,其平均数为 x ,则
s2

1 n
( x1

x)2

( x2

x)2


s2

1 n
n i1
( xi

x)2
(xn x)2
称s2为这个样本的方差,它的算术平方根
s
1 n
n i1
( xi
1500元,平均月工资怎么能是1695元呢?”经理拿出
如下表所示的工资表说:“你看,平均周工资就是
1695元。”
某公司内部结构以及工资分布:
人员 经理 管理人员 技工 工人 学徒 合计
月工资 11000 1250 1100 1000 500
人数 1
6
5 10 10 23
在这个问题中,总体月平均数能客观地反映工人的 月工资水平吗?为什么?
(2)加减常数法:数据 x1,x2,…,xn 都比较大或比 较小,且 x1,x2,…,xn 在固定常数附近波动, x =x1+x2+n …+xn,a 为接近 x 的常数,则 x1±a, x2±a,…,xn±a 的平均数为 x ±a.
(3)若 x1,x2,x3,…,xn 的平均数为 x , 那么 mx1﹢a, mx2﹢a,mx3﹢a,…,mxn﹢a 的平
离差分别为 x-a1,x-a2,…,x-an
读作:a 平均
a1 a2 an
a=
n
1n
= n i1 ai
平均数最能代表一个样本数据的集中趋势, 也就是说它与样本数据的离差最小。
例1 某校高一年级的甲乙两个班级(均为50人)的 数学成绩如下(总分150),试确定这次考试中,哪 个班的数学成绩更好一些 .
方差为 s2 ,则
(1)新数据 x1 b, x2 b,, xn b 的平均数为
x b,方差仍为 s2 .
(2)新数据 ax1, ax2,, axn的平均数为ax ,
方差为 a2s2 .
(3)新数据 ax1 b, ax2 b,, axn b
的平均数为 ax b,方差为a2s2 .

29 32 37

11
32
66

37(最大值) 29(最小值)
8极

66(最大值) 11(最小值)
55 差
如果甲乙两组数据的集中程度差异不大时,怎 么办呢?
我们可以考虑每一株的高度与平均高度的离差 离差的平方和越小,长的越齐
考察样本数据的分散程度的大小, 最常用的统计 量是方差和标准差。
• 样本中各数据与样本平均数的差的平方和的平 均数叫做样本方差;
乙 115 100 125 130 115 125 125 145 125 145
哪种钢筋的质量较好?
105 110 115 120 125 130 135 140 100 105 110 115 120 125 130 135 140 145
甲 乙
105 110 115 120 125 130 135 140
相关文档
最新文档