第7章 方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•该模型的假设: 1) 每个观测值都是来自总体平均数μij的随机 的、独立样本,共有t×b个总体被抽样。 2) t×b个总体中的任何一个均为正态且具有 相同的方差σ2 。 3) 处理和区组间没有交互作用。
两向方差分析排列表 双向表
重复 处理 1 2
1 x11 x12
2 x21 x22
b xb1 xb2
T
2 j
b2
(
T j
b)2 ]
t
1 b
T
2 j
(
T j )2 1 bt b
T
2 j
T2
bt
1 b
T
2 j
C
同理可证明 :
SSB 1 t
Ti2 C
而 : SSE SST SSA SSB
自由度的分解(双向方差分析):
总自由度=bt-1; 处理自由度=t-1; 区组自由度=b-1; 误差自由度=bt-1-(b-1)-(t-1)
Ti 区组合计
C T2 bt
ns
*
**
例(P110 ):鱼藤是重要的植物源农药,为测定各品种的产量,现 进行品种产量比较试验。试验设计为随机化完全区组,每小区 种植40株,各品种的平均干根重(kg)如下表:
处理 海南毛 台湾毛 台湾半 丰顺种 广西柳 新加坡
区组
鱼藤
鱼藤 蔓鱼藤 鱼藤 州鱼藤 鱼藤 区组合计Ti
处理合计Tj 19.14 17.23 28.27 22.17 23.99 17.60 T 128.40
处理平均 4.78 4.31 7.07 5.54 6.00 4.40
1)计算校正数C:
C T 2 128.402 686.94 bt 4 6
2)计算各变异来源的平方和:
a)SST x2 C 4.272 3.252 4.562 686.94 45.84
_
(xij x)2
ij
xi2j (
xij )2 bt
x2 T 2 x2 C, (C T 2 : 校正数)
bt
bt
_
而 :
(xij x)2
ij
_
_
_
__
_
_
[(xij xi x j x) (xi x) (x j x)]2
__
__
_
_
_
(x j x)2
[2]试验设计的基本原则和类型
A)试验设计的几个基本概念
1)指标:判断试验效果所采用的标准; 2)因素:认为有可能影响试验指标的条件; 3)水平:能影响试验指标的因素通常可以人为地加 以控制或分组,即因素的水平。
B)试验设计的三个基本原则
1)重复:可估计试验误差或降低试验误差; 2)随机:小区的放置原则; 3)局部控制:控制试验条件使之基本一致。
g)
处理均方 :
MS A
SSA t 1
;
区组均方 :
MS B
SSB ; b 1
误差均方 : MSE
SSE (b 1)(t 1)
h)
FA
MS A MS E
; FB
MS B MS E
i)
以一定的值查F值表,
确定H
的接受域和否定域
0
j)最后,可总结成一个方差分析表:
变异来源 自由度
平方和
均方
F值
处理
区组 (重复)
c) 总平方和 : SST x2 C,总自由度dfT bt 1
d ) 处理平方和 : SSA
Ti•2 b
C,处理自由度df A
t
1
e) 误差平方和 : SSE SST SSA
误差自由度dfE (bt 1) (t 1) bt t t(b 1)
f)
处理均方
:
误差 总和
t
SSA
T
2 j
C
b
MS A
SSA t 1
MS A MS E
b
SSB Ti2 C
t
SSB MSB b 1
MS B MS E
(b 1)(t 1)
SSE SST SSA SSB
MS E
SSE (b 1)(t 1)
bt 1
SST x2 C
T j 处理合计
T T j Ti
=bt-b-t+1 =b(t-1)-(t-1) = (b-1)(t-1)
单向方差分析 总自由度=bt-1; 处理自由度=t-1; 误差自由度=bt-1-(t-1) =bt-t =t (b-1)
9.3方差分析的步骤
1、固定因素模型(模型I)-单向方差分析
•固定因素模型(模型I)的假设: 1) t个随机样本取自t个平均数为μ1,μ2, …, μt的特定总体。 2) 每个总体均为正态总体。 3) 每个总体都有相等的方差σ2。
处理项F值
处理项方差 误差项方差
重复项F值
区组项方差 误差项方差
通常希望处理项的方差和误差项的方差不具同源性, 即处理间的效应存在。而区组项和误差项的方差具同 源性,即不同重复间误差不显著。
平方和(离均差平方和)
_
方差(均方) : S 2 (x x)2 n 1 自由度
总平方和及自由的裂解
_
_
__
_
__
(xij x j )2
(x j x)2 2
(xij x j )(x j x)
__
_
(x j x)2
(xij x j )2
SSA SSE
处理平方和 误差平方和
__
__
SSA
(x j x)2 b (x j x)2
_
b[
_2 ( xj
x j )2 ] b[ t
单向方差分析排列表 单向表
处理水平 treatment level
1
2

i

t
X11
X21

Xi1

Xt1
X12
X22

Xi2

Xt2






X1b
X2b

Xib

Xtb
处理合计 T1·
T2·

Ti·

Tt·
处理平均
x1•
x 2•

xi•

xt•
具体步骤
a) H0 : 1 2
b) 校正数 : C T 2 ; bt
_
_
处理平均 x j x1
_
x j
T j
b
T2
_
x2
_
xi
Ti
t
t
x1t x2t
xbt
Tt
_
xt
重复合计Ti
T1 T2 Tb
T x
重复平均xi
_
x1
_
x2
_
xb
_
x T bt
T T j Ti
1)平方和的分解(双向方差分析):
( x)2 (x x)2 x2
n
总平方和:SST
X21

Xi1

Xt1
X12
X22

Xi2

Xt2






X1b
X2b

Xib

Xtb
处理合计 T1·
T2·

Ti·

Tt·
处理平均
x1•
x 2•

xi•

xt•
两向方差分析排列表(随机化完全区组) 双向表
重复 处理 1 2
1 x11 x12
2 x21 x22
b xb1 xb2
处理合计T j T1
处理合计T j T1
_
_
处理平均 x j x1
_
x j
T j
b
T2
_
x2
_
xi
Ti
t
t
x1t x2t
xbt
Tt
_
xt
重复合计Ti
T1 T2 Tb
T x
重复平均xi
_
x1
_
x2
_
xb
_
x T bt
T T j Ti
具体步骤
a) H0 : 1 2
b) 校正数: C T 2 ; bt
3)二因素多水平:通常采用全面试验 设计(每水平交错组合1次,进行1次 试验)
二因素间没有交互作用
二因素间有交互作用
4)多因素多水平:正交试验设计
5)其他方法:如:平衡不完全区组设 计、裂区试验设计、正交拉丁方、二 次旋转回归试验设计等。
7.2 方差分析的基本思想
[1]方差分析的三个基本假设: 1)主效应的可加性(additivity)
c) 总平方和: SST x2 C,总自由度dfT bt 1
d ) 处理平方和: SSA
T2 j
b
C,处理自由度dfA
t
1
e) 区组平方和: SSB
T2 i
t
C,区组自由度dfB
b 1
f ) 误差平方和: SSE SST SSA SSB
误差自由度dfE (b 1)(t 1)
SSEຫໍສະໝຸດ Baidu SST SSA
MS E
SSE bt t
bt 1 SST x2 C
(具体例子见书P90-91例7.1)
2、随机因素模型(模型II)-单向方差分析
•统计假设为:H0
:
2
0, H1
:
2
0
P91例7.2
3、 随机化完全区组试验(双向方差分析模型)
与单向方差模型不同,双向方差分析模型表中观测 值包含两个方向中。
I 4.27 4.37 8.50 5.56 6.06 4.89 33.75
II 3.25 3.75 6.12 4.87 5.12 4.12 27.23
III 5.62 4.43 7.12 5.37 4.00 3.93 30.47
IV 6.00 4.68 6.53 6.37 8.81 4.56 36.95
C)试验设计的类型(不同的试验设计,使用的统计 分析方法特别是方差分析的方法不尽相同)
1)一因素二水平
随机:不成对法 t-检验;方差分析; 局部控制:成对法 t-检验
2)一因素多水平
随机化完全区组设计 重复数相等 重复数不相等
ABCD BCDA CDAB DABC
拉丁方试验设计(拉丁方:让n个数字或字母排成一 个n*n方块,使得在每一行、每一列中这n个数字或字 母都只出现1次。)
b)SSB
T2 i
C
33.752
36.952
686.94 8.77
t
6
c)SSA
T2 j
19.142 C
17.602
686.94 22.86
b
4
d )SSE SST SSA SSB 45.84 22.86 8.77 14.21
3)计算各变异来源的自由度:
a)总自由度dfT bt 1 24 1 23 b)处理自由度df A t 1 6 1 5 c)区组自由度dfB b 1 4 1 3 d )误差自由度dfE (b 1)(t 1) 3 5 15
xij i j ij (线性可加模型)
2)各处理不同样本的方差齐性 (homogeneous) 3)误差分布的正态性(normality)
[2]试验误差的来源(以随机化完全区组试验为例)
在一个试验中,实际上存在以下三部分的误差来源:
A)处理项:起源于效应本质的不同
B)区组项:又称重复项,指起源于地力i 或其
平):就要进行
C2 7
=21次 t检验;
C2 7
7! 2!(7
2)!
21
2)准确性将受到怀疑
设每对检验达到没有显著差异的正确结论都是 0.95(即:α=0.05)。这时,21对都得到正 确结论的概率为:0.9521,即达到至少一个 不正确结论的概率为:1-0.9521=10.34=0.66。因此不能认为这是可以接受的 检验,必须发掘一种新的方法,这种方法就 是方差分析(analysis of variance, ANOVA)。
第七章 方差分析及多重比较
7.1 引言 7.2 方差分析的基本思想 7.3 方差分析的步骤 7.4 多重比较 7.5 数据变换
7.1 引言
[1]方差分析的提出
t-检验:一因素二水平,二水平的平均数 之间的比较。如果是一因素多水平的问 题能否用 t-检验解决问题呢?能,但有 二个问题:
1)工作量:例如有7组数据(一因素七水
在一组试验数据中,总平方和为: (xij x)2
总自由度为bt-1
须把总平方和裂解为处理平方和、重复平方和 及误差平方和; 把总自由度裂解为处理自由度、重复自由度和 误差自由度。
单向方差分析排列表(固定因素模型-P87例7.1) 单向表
处理水平 treatment level
1
2

i

t
X11
MS A
SSA ; t 1
误差均方 :
MS E
SSE t(b 1)
g) F MS A MS E
h)
以一定的值查F值表,
确定H
的接受域和否定域
0
i)最后,可总结成一个方差分析表:
变异来源 自由度
平方和
均方
F值
处理 误差 总和
t
SSA
Ti•2 C b
MS A
SSA t 1
MS A MS E
t(b 1)
他环境条件的不一致
C)误差项:即抽样误差j ,起源于偶然因素的
影响
每个观测值ij xij均含有三部分的误差,据线性可加模
型:
xij i j ij
[3]方差分析的思路
怎样分别出处理项或区组项造成的变异是否存在?方 差分析的思路是:检验处理项的方差和误差项的方差 是否具同源性(同质性),如两项方差为同源(同质) 则说明处理效应不存在,如为非同源(同质),则处 理效应是存在的。区组项的效应检验同理。因此有:
SSA SSB SSE
处理平方和 重复平方和 误差平方和
因为离均差之和为0:
(x x) (x1 x) (x2 x) (xn x)
( x1
n
x
)
( x2
n
x
)
( xn
n
x
)
x1
x2
xn
n
x
n
x
x
0
不考虑重复项 (单向方差分析 )
_
_
__
(xij x)2
[(xij x j ) (x j x)]2
(xi x)2
(xij xi x j x)2
_ __ _
__
_
_
_
2
(x j x)(xi x) 2
(x j x)(xij xi x j x)
__
_
_
_
2
(xi x)(xij xi x j x)
__
__
_
_
_
(x j x)2
(xi x)2
(xij xi x j x)2
相关文档
最新文档