_方差分析法原理及实例

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(Yij Y ) 2 (Y i Y ) 2 2(Y i Y )(Yij Y i ) (Yij Y i ) 2
2 2 ( Y Y ) m ( Y Y ) i i i 1 j 1 i 1 k m k
(Y
j 1
m
ij
Y i) 0
误差公理
至此,求得参数
, i , i的估计量
(6-9)
ˆi Y i ˆ Y, ˆ i Yi Y ,
参数点估计
按照上述原则求参数估计量的方法称为最小二 乘法, , i , i 称为最小二乘估计量.
我们还可以证明 , i , i分别是参数 , i , i 的无 偏估计量。 将 和 i 分别用它们的估计量代替,可以得到试 验误差 ij 的估计量 eij,
2 (6-11) ( Y Y ) m ( Y Y ) ( Y Y ) i ij i ij 2 2 i 1 j 1 i 1 i 1 j 1 k m k k m
6.2
证明:
分解定理 自由度
总偏差 组间变差 组内变差
Yij Y (Y i Y ) (Yij Y i )
6.1 数学模型和数据结构
找出参数 ,1 , 2 ,...., k 和 2 的估计量
要 解 决 的 问 题
分析观测值的偏差 检验各水平效应 1 , 2 ,..., k 有无显著差异
参数点估计
用最小二乘法求参数 ,1 , 2 ,...., k 的估计量,然后 2 寻求 的无偏估计量. 须使参数 ,1 , 2 ,...., k 的估计值能使在水平Ai下求 得的观测值Yij与真值 i之间的偏差尽可能小。 为满足此要求,一般考虑用最小偏差平方和原则, 也就是使观测值与真值的偏差平方和达到最小.
相当于检验假设 H0 : i 0 (i=1,2,…,k) , H1 : αi不全为零
ST (Yij Y ) 2
6.3 显著性检验
可以证明当H0为真时,
S A m (Y i Y ) 2
SE (Yij Y i )2
SE SA 2 ST 2 2 ~ (k (m 1)) ~ (km 1) , 2 ~ (k 1), , 2 (6-16) 2
SE SA 并且 2 与 2 相互独立.

变差平方和/变差自由度
S A /(k 1) 2 S A /(k 1) (6-17) FA ~ F ( k 1 , k ( m 1 )) S E / k (m 1) 2 S E / k (m 1)
残差平方和/残差自由度
6.1 数学模型和数据结构
假定在水平Ai下重复做m次试验,得到观测值
Yi1 , Yi 2 ,...,Yim
表 6-3
1
2
… … … … … … …
j
… … … … … … …
m
合计
平均
A1 A2

Y11 Y21

Y12 Y22

Y1j Y2j

Y1m Y2m

T1 T2

Y1 Y2
… …
Ai

Yi1
fT f A f E
(6-13)
6.3 显著性检验
参数 假设 检验 的假 设条 件
观测值(i=1,2,...,k;j=1,2,...,m) 相互独立
在水平Ai条件下, Yij(j=1,2,...,m) 2 ( , 服从正态分布N i )
要判断在因素A的k个水平条件下真值之间是否 有显著性差异, 即检验假设 H0: 1 2 k , H1: 不全相等
表 6- 2
型号
yi
A 9.4
B 5.5
C 7.9
D 5.4
E 7.5
F 8.8
引言 方差分析的基本概念和原理
两个总体平均值比较的检验法 把样本平均数两两组成对:
y 1与 y 2, y 1与y 3 ,… y 1 与y 6 , y 2 与y 3 ,…,y 5 与y 6 ,共有
( C62 15)对。
较作用大小的一个基点(总体的平均值);
6.1 数学模型和数据结构
并且称
i i
为第i个水平Ai的效应.它表示水平的真值比一般 中等水平差多少。满足约束条件
1 2 k 0
可得
(6-6)
Yij i ij ;

i
0
i=1,2,…,k ;j=1,2,…,m
注意: 每次试验结果只能得到Yij,而(6-4)式中的 i 和 ij 都 不能直接观测到。
6.1 数学模型和数据结构
为了便于比较和分析因素A的水平Ai对指标影响 的大小,通常把 i 再分解为
i i
(i=1,2,…,k)
(6-5)
其中,
Baidu Nhomakorabea
1 k i 称为一般平均(Grand Mean),它是比 k i 1










引言 方差分析的基本概念和原理
上 述 方 法 存 在 的 问 题
工作量大
将这15对平均数一一 进行比较检验
置信度低
即使每对都进行了比较, 并且都以0.95的置信度得 出每对均值都相等的结论, 但是由此要得出这6个型 号的维修时间的均值都相 等。这一结论的置信度仅 是 (0.95)15 0.4632
研究的指标:维修时间记作Y, Y ~ N ( , 2 )
控制因素是生产线的型号,分为6个水平即A,B,C,
D,E,F,每个水平对应一个总体Yi(i=1,2,…,6)。
引言: 方差分析的基本概念和原理
现在的试验就是进行调查,每种型号调查4台,相当于
每个总体中抽取一个容量为4的样本,得到的数据记作yij (i =1,2,…,6; j=1,2,3,4),即为下表数据。 计算各样本平均数 y如下 : i


解得
由 解得
1 ˆ Yij Y km
m S 2 (Yij i ) 0 i j 1
(6-7)
1 m ˆ i Yij Y i Y m j 1
(6-8)
参数点估计
并由此得 i 的估计量
ˆi ˆ ˆ i Yi

eij Yij Y i
(6-10)
6.2
分解定理 自由度
为了由观测值的偏差中分析出各水平的效应,我们 研究三种偏差:Yij Y ,Y i Y 和 Yij Y . i 根据前面参数估计的讨论,它们分别表示 Yij , i 和 ij 的估计.
分解定理(教材中“加法定理”)
k (m 1) f e 个误差平方,则变差平方和 SA 中含有 (k 1) fA 个误差平方。
纯变差平方和
SA SA (k 1) 2 SA f A 2
成的,以及这些部分间的关系如何。
6.1单因素方差分析的数学模型和数据结构
结合单因素实验介绍方差分析的有关原理。 在单因素试验中,为了考察因素A的k个水平A1,A2,…, Ak对Y的影响,设想在固定的条件Ai下作试验.所有可 能的试验结果组成一个总体Yi,它是一个随机变量.可 以把它分解为两部分
Yi i i

Yi2

Yij

Yim

Ti

Yi
Ak
Yk1
Yk2
Ykj
Ykm
Tk
Yk
6.1 数学模型和数据结构
表中: 1 m Yi Yij (i=1,2,…,k) m j 1
(6-3)
Yij表示在Ai条件下第j次试验的结果,用式子表示就是
Yij i ij (i=1,2,…,k j=1,2,…,m) (6-4)
(1)将数据总的偏差平方和按照产生的原因分解成:
(总的偏差平方和)= (由因素水平引起的偏差平方和)+(随机误差平方和) (2)上式右边两个平方和的相对大小可以说明因素的不 同水平是否使得各型号的平均维修时间产生显著性差 异,为此需要进行适当的统计假设检验. 如何从数据中分离出两者的大小?-方差分析
方差分析的几个名词
• 什么是方差?
• 离均差
• 离均差平方和SS • 方差(2 • 标准差:S • 自由度: f S2 )=均方(MS)
• 关系: MS= SS/ f
方差分析的含义
方差是描述变异的一种指标,方差分析是一种假
设检验的方法。方差分析也就是对变异的分析。
是对总变异进行分析,看总变异是由哪些部分组
参数点估计
由(6-4)可知,上述偏差平方和
2 S ij (Yij i ) 2 (Yij i ) 2 i 1 j 1 k m
令下列各偏导数为零
S 0,
S 0 i
(i=1,2,…,k)
参数点估计

S 2 (Yij ) i 0
表 6- 1
对6种型号生产线维修时数的调查结果
序号 型号
1
2
3
4
A型 B型 C型 D型 E型 F型
9.5 4.3 6.5 6.1 10.0 9.3
8.8 7.8 8.3 7.3 4.8 8.7
11.4 3.2 8.6 4.2 5.4 7.2
7.8 6.5 8.2 4.1 9.6 10.1
引言: 方差分析的基本概念和原理
i=1,…,k,因素的水平数。
(6-1)
其中:
i 纯属A 作用的结果,称为在A 水平条件下 Y 的真值 i i i (也称为在Ai条件下Yi的理论平均). i 是实验误差(也称为随
机误差)。
i ~ N (0, 2 )
Yi ~ N (i , )
2
(6-2)
其中, i
2 和 都是未知参数(i=1,2,…,k).
当 FA F (k 1, k (m 1)) 时,拒绝H0, 当 FA F (k 1, , k (m 1)) 时,接受H0。 即:如果H0成立,F应等于1;相反应大于1,而且因素的影响越大, F值也越大
E(Se ) k (m 1) 2
2 Se / fe
E(SA ) (k 1)(m pA2 2 )
对试验进行多次测量所得到的一组数据 x1,x2,……xn,
由于受到各种因素的影响,各个测量值通常都是参差不齐
的,它们之间的差异称为误差。 随机因素引起 试验误差 系统误差
反映了测试结果 的精密度
反映测试条件对 测试结果的影响
由于试验条件 的改变
引言:方差分析的基本概念和原理
方差分析的基本原理 :
引言: 方差分析的基本概念和原理
例题 某公司计划引进一条生产线,为了选择一条质量优 良的生产线以减少日后的维修问题,他们对6种型号
的生产线作了初步调查,得到每个型号的生产线上
个月维修的小时数,每种型号调查4条,结果列于表
6-1。试问由此结果能否判定由于生产线型号不同而
造成它们在维修时间方面有显著差异?
其中 S A /(k 1) 和 S E / k (m 1) 称为均方(Mean Square).
6.3 显著性检验
利用(6-17)式来检验原假设H0是否成立.对于给定的显著水 平 ,可以从F分布表查出临界值 F (k 1, k (m 1)), 再根据样本观测 值算出FA的值.
pA 2 1 m 2 i k 1 i 1
pA 2 为 A 因素的水平变化所引起的平方和
VA SA / f A m pA 2 2 m pA 2 F 1 2 2 Ve Se / f e
由变差平方和 SA 的构成可以看出, A 因素的水平变化所引起的波动除了自身变化 引起的波动外,还有部分误差的影响。从误差平方和 Se 的构成可以看出,其含有
6.2

分解定理 自由度
ST (Yij Y ) 2
总差平方和 变差平方和
S A m (Y i Y ) 2
SE (Yij Y i )2
残差平方和
则分解定理(6-11)可写成
ST S A S E
(6-12)
6.2
分解定理 自由度
上式中, S T 称为总偏差平方和. S E 称为误差平方和(或组内 平方和); S A 称为因素A的效应平方和(或组间平方和), ST的自由度fT=km-1 SA的自由度fA=k-1 SE的自由度fE=k(m-1) 容易看出,自由度之间也有类似于分解定理(加法 定理)的关系
相关文档
最新文档