方差分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章方差分析
●了解方差分析的概念和作用;
●掌握方差分析的基本原理和步骤;
●掌握单向分组资料的方差分析;
●掌握两向分组和系统分组资料的方差分析。
能力目标:
●学会完全随机试验资料进行方差分析;
●学会单向分组资料进行方差分析;
●学会两向分组和系统分组资料进行方差分析。
对一个或两个样本进行平均数的假设测验,可以采用u测验或t测验来测定它们之间的差异显著性。
而当试验的样本数k≥3时,上述方法已不宜应用。
其原因是当k≥3时,就要进行k(k-1)/2次测验比较,不仅工作量大,而且精确度降低。
因此,对多个样本平均数的假设测验,需要采用一种更加适宜的统计方法,即方差分析法。
方差分析法是科学研究工作的
一个十分重要的工具。
第一节方差分析基本原理
方差分析(analysis of variance,ANOV A)就是将试验数据的总变异分解为来源于不同因
素的相应变异,并作出数量估计,从而发现各个因素在总变异中所占的重要程度。
即将试验
的总变异方差分解成各变因方差,并以其中误差方差作为和其他变因方差比较的标准,以推
断其他变因所引起变异量是否真实的一种统计分析方法。
一、自由度与平方和分解
方差是平方和除以自由度的商。
要将一个试验资料的总变异分解为各个变异来源的相应
变异,首先将总平方和与总自由度分解为各个变异来源的相应部分。
因此,平方和与自由度的分解是方差分析的第一步骤。
下面以单因素完全随机试验设计的资料为例说起。
假设有k 个处理,每个处理有n 个观察值,则该试验资料共有nk 个观察值,其观察值的组成如表7-1。
表7-1中,i 代表资料中任一样本;j 代表样本中任一观测值;x ij 代表任一样本的任一观测值;T t 代表处理总和;t x 代表处理平均数;T 代表全部观测值总和;x 代表总平均数。
表7-1 每处理具n 个观测值的k 组数据的符号表
处理
观察值
处理总和
T t 处理平均
t x 1
2 … j … n 1 x 11 x i 2 … x 1j … x 1n T t1 1t x 2 x 21 x i 2 … x 2j … x 2n T t2 2t x
… … … … … … … … …
i x i1 x i 2 … x ij … x in T ti ti x
… … … … … … … … …
k
x k 1
x k 2
… x kj
…
x k n
T tk tk x
T =∑x
x
在表7-1中,总变异是nk 个观测值的变异,故其自由度v =nk -1,而其平方和SS T 则为: =T SS 22
1
()nk ij x x x C -=-∑∑ (7-1)
(7-1)式中的C 称为矫正数:
2
2
()x T C nk
nk
=
=∑ (7-2) 产生总变异的原因可从两方面来分析:一是同一处理不同重复观测值的差异是由偶然因素影响造成的,即试验误差,又称组内变异;二是不同处理之间平均数的差异主要是由处理的不同效应所造成,称处理间变异,又称组间变异。
因此,总变异可分解为组间变异和组内变异两部分。
组间的差异即k 个x 的变异,故自由度1v k =-,而其平方和SS t 为: 2
2
1
()k
t
t ij
T SS n
x
x C n
=-=
-∑∑ (7-3)
组内的变异为各组内观测值与组平均数的变异,故每组具有自由度v =1n -和平方和
21
()n
ij
x
x -∑,而资料共有k 组,故组内自由度,v =(1)k n -,而组内平方和SS e 为:
21
1
()k n
e ij
t T t SS x
x SS SS =
-=-∑∑ (7-4)
因此,得到表7-1类型资料平方和与自由度的分解式为: 总平方和=组间(处理间)平方和+组内(误差)平方和
2
2
21
1
1
1
1
()()()k n
k k n
ij
t ij t i x
x n x x x x =-=-+-∑∑∑∑∑
(7-5)
记作: e t T SS SS SS +=
总自由度=组间(处理间)自由度+组内(误差)自由度
即: )1()1(1-+-=-n k k nk (7-6) 记作: DF T =DF t +DF e 将以上公式归纳如下:
总平方和 C x SS T -∑=2 总自由度 1-=kn DF T
处理平方和 C n
T SS t t -∑=2
处理自由度 1-=k DF t 误差平方和 t T e SS SS SS -= 误差自由度 )1(-=n k DF e 求得各变异来源的平方和与自由度后,进而求得:
总的方差
T
T
T
DF SS s 22=
处理间方差 t
t t
DF SS s 2
2=
误差方差 e
e e
DF SS s 2
2=
[例7.1] 设有A 、B 、C 、D 、E5个大豆品种(k =5),其中E 为对照,进行大区比较试验,成熟后分别在5块地测产,每块地随机抽取4个样点(n =4),每点产量(kg )列于表7-2,试作方差分析。
表7-2 大豆品比试验结果(kg/小区)
品 种
取 样 点
T t t x
1
2 3 4 A 23 21 24 21 89 22.25 B 21 19 18 18 76 19.00 C 22 23 22 20 87 21.75 D 19 20 19 18 76 19.00 E
15
16
16
17
64 16.00
392
x
=19.6
1.平方和的分解
(7-7)
(7-8)
已知54==k n ,,根据公式(7-2)和(7-7)可得
=C kn T 2=
20
3922
683.2 7= =T SS C x -∑28.122202123222=+++=
=
-∑=C n
T SS t t 23.101487766476892
2222=-++++C 5.211.1038.122=-=-=t T e SS SS SS
2.自由度的分解
根据公式(7-6)可得:
总变异自由度()19154=-⨯=T DF 品种间自由度415=-=t DF 误差自由度15)14(5=-⨯=e DF
3.计算各部分方差
根据公式(7-7)可得: 32.2553
.1012
==t s 43.115
5
.212==e s 总方差可以不计算。
二、F 分布与F 测验
1.F 分布
设想在一正态总体N (μ,σ2)中随机抽取样本容量为n 的样本k 个,将各样本观测值整理成表7-1的形式。
此时的各处理没有真实差异,各处理只是随机分的组。
因此,由(7-8)
式算出的2t s 和2e s 都是误差方差2
σ的估计量。
以2
e s 为分母,2t s 为分子,求其比值。
统计学
上把两个方差之比值称为F 值。
即 22/e t S S F = F 具有两个自由度:)1(,121-==-==n k df k df e t νν。
F 值所具有的概率分布称为F 分布。
F 分布密度曲线是随自由度DF 1、DF 2的变化而变化的一组偏态曲线,其形态随着DF 1、DF 2的增大逐渐趋于对称,如图7-1所示。
F 分布的取值范围是(0,+∞),其平均值F μ=1。
用)(F f 表示F 分布的概率密度函数,则其分布函数 F F ()为:
()F F α=P (F <αF )=()F f F dF α
⎰
因而F 分布右尾从αF 到+∞的概率为:
P (F ≥αF )1()()F F F f F dF α
α+∞
=-=
⎰
附表4,F 值表列出的是不同v 1和v 2下,P (F ≥αF )=0.05和P (F ≥αF )=0.01时的F 值,即右尾概率α=0.05和α=0.01时的临界F 值,一般记作F 0.05,F 0.01。
如查F 值表,当v 1=3,v 2=18时,F 0.05=3.16,F 0.01=5.09,表示如以v 1=DF t =3,v 2=DF e =18在同一正态总体中连续抽样,则所得F 值大于3.16的仅为5%,而大于5.09的仅为1%。
2.F 测验
F 值表是专门为检验2t s 代表的总体方差是否比2e s 代表的总体方差大而设计的。
若实际计
算的F 值大于0.05F ,则F 值在α=0.05的水平上显著,我们以95%的可靠性(即冒5%的风险)
推断2t s 代表的总体方差大于2e s 代表的总体方差。
这种用F 值出现概率的大小推断两个总体方
差是否相等的方法称为F 测验。
在方差分析中所进行的F 测验目的在于推断处理间的差异是否存在,检验某项变异因素的效应方差是否为零。
因此,在计算F 值时总是以被测验因素的方差作分子,以误差方差作分母。
应当注意,分母项的正确选择是由方差分析的模型和各项变异原因的期望均方决定的。
实际进行F 测验时,是将由试验资料所算得的F 值与根据v 2=DF t (大均方,即分子均方的自由度)、v 2=DF e (小均方,即分母均方的自由度)查附表F 值表所得的临界F 值与F 0.05、F 0.01相比较作出统计推断的。
若F <F 0.05,即P >0.05,不能否定0H ,统计学上把这一测验结果表述为:各处理间差
F (1ν=2,2ν=5)
(1ν=8,2ν=20)
(1ν=4,2ν=10)
f (F )
异不显著,不标记符号;若F 0.05≤F <F 0.01,即0.01<P ≤0.05,否定0H ,接受A H ,统计学上,把这一测验结果表述为:各处理间差异显著,在F 值的右上方标记“*”;若F ≥F 0.01,即P ≤0.01,否定H 0,接受H A ,统计学上,把这一测验结果表述为:各处理间差异极显著,在F 值的右上方标记“**”。
对于[例7.1],因为F =2
2e t s s =25.32/1.43=17.71;根据1ν=DF t =4,2ν=DF e =15查附表F
值表,得F >F 0.01 =4.89,P <0.01,表明5个不同大豆品种对产量的影响达到极显著差异。
在方差分析中,通常将变异来源、平方和、自由度、均方和F 值归纳成一张方差分析表,见表7-3。
表7-3 表7-2资料方差分析表
变异来源 SS DF s 2 F F 0.05 F 0.01 品种间 101.3 4 25.32 17.71** 3.04 4.89 品种内 21.5 15 1.43 总变异
122.8
19
因为经F 测验差异极显著,故在F 值17.71右上方标记“**”。
在实际进行方差分析时,只须计算出各项平方和与自由度,各项均方的计算及F 检验可在方差分析表上进行。
三、多重比较
经F 测验,差异达到显著或极显著,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。
因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。
统计上把多个平均数两两间的相互比较称为多重比较(multiple comparison )。
多重比较的方法比较多,常用的有最小显著差数法(LSD 法)和最小显著极差法(LSR 法),现分别介绍如下。
1.最小显著差数法
最小显著差数法(least significant difference ),又称LSD 法。
此方法是多重比较中最基本的方法。
它是两个平均数相比较在多样本试验中的应用,所以LSD 法实际上属于t 测验性质的,而t 测验只适用于测验两个相互独立的样本平均数的差异显著性。
在多个平均数时,任何两个平均数比较会牵连到其他平均数,从而降低了显著水平,容易作出错误的判断。
所以在应用LSD 法进行多重比较时,必须在测验显著的前提下进行,并且各对被比较的两个样本平均数在试验前已经指定,因而它们是相互独立的。
利用此法时,各试验处理一般是与指定的对照相比较。
LSD 法的步骤如下:
第一步 先计算样本平均数差数标准误21x x s -
21x x s -=
n
s e 2
2 (7-9) 第二步 计算出显著水平为α的最小显著差数αLSD 。
在t 测验中已知
2
12
1x x s x x t --=
在误差自由度下,查显著水平为α时的临界t 值,令上式t =αt ,移项可得
1212a x x x x t s --=⨯
故21x x -即等于在误差自由度下,显著水平为α时的最小显著差数,即LSD 。
12a a x x LSD t s -=⨯ (7-10)
当α=0.05和0.01时,LSD 的计算公式分别是 12
0.050.05
x x LSD t s -=⨯ (7-11) 12
0.010.01
x x LSD t s
-=⨯ (7-12)
任何两处理平均数的差数达到或超过LSD 0.05时,差异显著;达到或超过LSD 0.01时,差
异达到极显著。
由[例7.1]资料可得
845.04/43.12/2221=⨯==-n s s e x x (kg )
当误差自由度DF e =15时,查t 值表得:131.205.0=t , 921.201.0=t 所以,显著水平为0.05与0.01的最小显著差数为
120.050.05x x LSD t s -=⨯80.1845.0131.2=⨯=(kg )
120.010.01x x LSD t s -=⨯49.2845.0947.2=⨯=(kg )
第三步 各处理平均数的比较
表7-4中的各个品种与对照的的差数,分别与05.0LSD 、01.0LSD 比较:小于05.0LSD 者不显著,不标记符号;介于05.0LSD 与01.0LSD 之间者显著,在差数的右上方标记“*”;大于01.0LSD 者极显著,在差数的右上方标记“**”。
表7-4 5个大豆品种产量差异比较(LSD 法) 品种 平均数t x 与对照的差异
A 22.25 6.25** C 21.75 5.75**
B 19.00 2.0* D 19.00 2.0* E (CK )
16.00
—
比较结果说明B 、D 品种与对照差异显著,其余两个品种与对照差异达到极显著水平。
2.新复极差法
新复极差法,又称最小显著极差法(shortest significant ranges ,SSR)。
简称SSR 法,目前在农业科学研究中普遍应用。
此法的特点是将平均数按照大小进行排序,不同的平均数之间比较采用不同的显著标准。
如表7-4中由上到下的5个平均数是从大到小的次序排列的,两个极端平均数之差(22.25-16.00)=6.25是5个平均数的极差(全距),在这个极差中,又包括(22.25-19.00)、(21.75-16.00)、(22.25-19.00)、(21.75-19.00)、(19.00-16.00)、(22.25-21.75)、(21.75-19.00)、(19.00-19.00)、(19.00-16.00)9个全距,包括4、3、2个平均数的全距,每个全距是否显著,可用全距相当于平均数标准误的倍数(SSR )来衡量。
αSSR s R
x
= (7-13)
公式中的R 为全距,x s 为样本平均数的标准误
n
s s e x 2
=
本例题
60.04
43.12===
n s s e x 如果
x s R ≥SSR 0.05,说明差异显著;x
s R
≥SSR 0.01,说明差异极显著。
将这两个不等式转换成以下公式:
R ≥ SSR 0.05×x s = LSR 0.05 差异显著 R ≥ SSR 0.01×x s = LSR 0.01 差异极显著
公式中的αSSR 即在a 水平上的最小显著极差。
αSSR 数值的大小,一方面与误差方差的自由度有关,另一方面与测验极差所包括的平
均数个数(k )有关。
例如要测定表7-4中最大极差(22.25-16.00)=6.25是否显著,在这个
全距内,包括了5个平均数的全距。
因此应根据15=e DF ,5=k 查SSR 值表,得SSR 0.05=3.31,
SSR 0.01 = 4.58,将有关数值代入(7-14)公式中得:
LSR 0.05 =3 .31×0.60 = 1.99 LSR 0.01 = 4.58×0.60 = 2.75
22.25 –16.00 = 6.25>LSR 0.01,说明这个极差极显著。
相反,则为不显著。
现将表7-2资料按照SSR 法对平均数进行多重比较。
第一步 计算x s ,60.0=x s 第二步 计算LSR 值,因为
LSR SSR αα=×x s
故根据误差自由度和显著水平a 由附表5处的在k 下的SSR 值,将有关数值带入公式(7-14),得到表7-5。
(7-14)
表7-5 LSR 0.05和LSR 0.01计算表(0.60x
s =,15=e DF )
k 2 3 4 5 SSR 0.05 3.01 3.16 3.25 3.31 LSR 0.05 4.17 4.37 4.50 4.58 SSR 0.01 1.81 1.90 1.95 1.99 LSR 0.01
2.50
2.62
2.70
2.75
第三步 各处理平均数间的比较
将各处理平均数按大小顺序排列成表7-6,根据各LSR 值对各极差进行测验。
在表7-6中,采用的是标记字母法。
若显著水平a =0.05,差异显著性用小写英文字母表示,可先在最大的平均数上标上字母a ,并将该平均数与以下各个平均数相比,凡相差不显著的(R <LSR α)都标上字母a ,直至某一个与之相差显著的平均数则标以字母b ;再以该标有字母b 的平均数为准,与上方各个平均数比,凡是不显著的一律标以b ;再以标有b 的最大平均数为准,与以下各未标记的平均数比,凡是不显著的继续标以字母b ,直至某一个与之相差显著的平均数则标以字母c ;……;如此重复,直到最小的一个平均数有了标记字母为止。
在各平均数之间,凡是标有相同字母的,差异不显著,凡是标有不同字母的表示差异显著。
显著水平a =0.01时,用大写英文字母表示,标记方法同上述。
表7-6 表7-2资料的多重比较(SSR 法)
品种 平均数
差异显著性
a =0.05
a =0.01 A 22.25 a A C 21.75 a A B 19.00
b B D 19.00 b B E (CK )
16.00
c
C
第二节 单向分组资料方差分析
单向分组资料是指观察值按一个方向分组的资料,如表7-1和表7-2所示。
一、组内观察值数目相等的单向分组资料方差分析
通常来说,在试验或调查设计时力求各处理的观察值数(即各样本含量n )相等,以便于统计分析和提高精确度。
因此这类资料最为常见。
本章第一节[例7.1] 资料的方差分析就是实例,故不在赘述。
应用时,整理资料的格式和符号见表7-1,方差分析所应用的公式则归纳为表7-7。
表7-7 组内观察值数目相等的单向分组资料的方差分析所用公式(n 相等时)
变因 SS
DF
2s
F
标准误
处理间
C x SS T -∑=2
1-=k DF t
t t t
DF SS s 2
2=
22/e t S S F =
i j x x s -=
总变异
C x SS T -∑=2
1-=kn DF T
i j x x LSD t s αα-= LSR SSR αα=·x s
二、组内观察值数目不等的单向分组资料方差分析
有k 个处理,每个处理的观察值的数目分别是1n 、2n 、……、k n ,则为组内观察值数目不等资料。
在进行方差分析时有关公式因i n 不同需作相应改变。
1.在分解自由度与平方和时
总变异自由度
1-∑=i T n DF
处理间自由度
1-=k DF t 误差自由度 k n DF i e -∑=
(7-15)
总变异平方和 2
21
()
i
n T SS x x x C =
-=∑-∑
i
n T C ∑=2
处理间平方和 2
2
1()k
i t i i i T SS n x x C n ⎛⎫=-=∑- ⎪⎝⎭
∑
误差平方和 2
1
1
()
i
n k e i
T t SS x x SS SS =-=-∑∑
2.多重比较
由于各处理的重复次数不同,可先计算各n i 的平均数n 0。
()()()
12
20-∑∑-∑=k n n n n i i i (7-17)
然后有
12
x x s -= (7-18)
x s = (7-19)
[例7.2]
以A 、B 、C 、D 4种药剂处理水稻种子,得各处理苗高观察值(cm ),各处理
样点数不等,调查资料列于表7-8,试进行方差分析。
表7-8 不同药剂处理的水稻苗高(cm ) 药剂
样 点
t T
t x
i n
1
2 3 4 5 6 7 A 19 20 22 23 21 18 17 140 20.00 7 B 21 23 24 25 26 27 146 24.33 6 C 15 16 17 18 19 85 17.00 5 D
23
24
25
24
96
24.00
4
467=T 33.21=x
22=∑i n
分析步骤:
1.平方和与自由度的分解
22
46722
i T C n ===∑9 913.14
(7-16)
-+++=-=
∑2222
242019 C x
SS T 9 913.14=251.86
53.188913.14 9)49658561467140(2
2222=-+++=-⎪⎪⎭
⎫ ⎝⎛=∑C n T SS i i t 33.6353.18886.251=-=e SS
2.列方差分析表进行F 测验 方差分析表见表7-9。
表7-9 表7-8资料方差分析表
变异来源 SS
DF
2s
F
F 0.05 F 0.01 处理间 188.53 3 62.84
17.85**
3.16 5.09 误差 63.33 18 3.52 总变异
251.86
21
F 测验结果,F >F 0.01,说明不同药剂处理的水稻苗高有极显著差异,应进一步作多重比较。
3.多重比较
()()()
()
2
222222022(7654) 5.42512241i i i n n n n k ∑-∑-+++=
==≈∑-⨯-
839.05
52.30
2==
=
n s s e x
当18=e DF ,查附表5得k =2、3、4时的SSR ,将SSR 值分别乘以x s 值,得LSR 值列于表7-10。
差异显著性测验的结果列于表7-11。
表7-10 多重比较时的LSR 的计算
k 2 3 4 SSR 0.05 2.97 3.12 3.21 SSR 0.01 4.07
4.27
4.38
LSR 0.05 2.49 2.62 2.69 LSR 0.01
3.41
3.58
3.67
表7-11 不同药剂处理的水稻苗高差异显著性表(SSR 法)
处 理
苗高平均数(cm )
差异显著性
α=0.05
α=0.01
推断:处理B 、D 之间差异不显著,A 、C 之间差异显著;B 、D 与A 、C 之间差异达到极显著。
即B 、D 处理的苗高最高,A 、C 处理的最矮。
三、系统分组资料方差分析
系统分组资料就是组内(处理内)又分为亚组的单向分组资料,简称系统分组资料。
系统分组并不限于组内分亚组,在亚组内还可以分小组,小组内还可以分小亚组,如此循环分下去。
这种试验的设计方法称为巢式设计。
系统分组资料在农业试验上是比较常见的。
如对多块土地取土样分析,每块地取若干样点,而每一样点又作了数次分析的资料;或在调查果树病害,随机调查若干株,每株取不同部位若干枝条,每个枝条取若干叶片查其病斑数的资料;或在温室里做盆栽试验,每处理若干盆,每盆若干株的资料等,皆为系统分组资料。
以下仅讨论二级分组且每组观察值数目相等的系统分组资料的方差分析。
设一系统资料共有l 组,每个组内又分为m 个亚组,每个亚组内有n 个观察值,则该资料共有lmn 个观察值,其资料类型如表7-12。
表7-12 二级系统分组资料lmn 个观察值的符号表 (i =1,2,…;j =1,2,…,m ;k =1,2,…,n )
组 别 1 2 (i)
… l
亚组别
…
…
…
1
2
…j …
m … … 观察值
…
…
…
11i x 21i x 1ij x 1im x
12i x
22i x
2ij x
2im x
k i x 1
k i x 2
ijk x imk x
… …
n i x 1
n i x 2 ijn x
imn x 亚组总和ij T
1i T 2i T
ij T
im T
组总和i T T 1
T 2
… i T …
l T
∑=x T
亚组均数ij x
1i x
2i x
ij x im x
系统分组资料的变异来源分为组间(处理间)、组内亚组间和同一亚组内各重复观察值间(试验误差)三部分。
其自由度与平方和的计算公式如下:
B 24.33 a A D 24.00 a A A 20.00 b B
C C
17.00
c
C
总变异 1-=lmn DF T ∑-=C x
SS T 2
lm n
T C 2
=
组间(处理间)变异 1-=l DF t
C mn
T SS i
t -=
∑2
同一组内亚组间的变异 )1(-=m l DF d
mn
T n T SS i
ij
d
∑∑-
=
2
2
亚组内的变异 )1(-=n lm DF e
∑∑-
=n
T x
SS ij
e 22
因而可得方差分析表7-13。
表7-13 二级系统分组资料的方差分析表
变 异 来 源 SS DF 2s
F
组 间
C mn T
i
-∑2
l-1
1-l SS t
2
2d
t s s
组内亚组间
mn T n T
i ij
∑∑-22
l (m-1)
)
(1-m l SS d 22e
d s s
亚 组 内
∑∑-T x ij 2
2
lm (n -1)
)1(-n lm SS e
总 变 异
∑-C x
lmn -1
由表7-13可知,要测验各组(处理)间有无不同效应,测验假设H 0:02=t σ
2
2d
t s s F = (7-24) 要测验各亚组间有无不同效应,测验假设0:2
0=d H σ
2
2e d s s F = (7-25) 在进行组(处理)间平均数多重比较时平均数标准误为: mn s s d x 2
=
(7-26)
在进行组内亚组间平均数多重比较时平均数标准误为:
(7-20)
(7-21)
(7-22)
(7-23)
n s s e x 2=
(7-27)
[例7.3] 在温室内以4种培养液(l =4)培养某植物,每种培养液培养3盆(m =3),每盆4株(n =4),全试验共有12个花盆完全随机排列,其他管理条件相同,一个月后测定株高生长量(mm ),得结果于表7-14,试作方差分析。
表7-14 4种培养液下的株高增长量
培养液
()i
盆号
()j
生长量 (ijk x ) 盆内总和
()ij
T
总和/培养液()i T
平均/培养液(i x )
A
A 1 50 55 40 35 180 A 2 35 35 30 40 140 495 41.3 A 3 45 40 40 50 175 B
B 1
50 45 50 45 190 B 2 55 60 50 50 215 625 52.1 B 3 55 45 65 55 220 C
C 1
85 60 90 85 320 C 2 65 70 80 65 280 880 73.3 C 3 70 70 70 70 280 D
D 1
60 55 35 70 220 D 2 60 85 45 75 265 775 64.6 D 3
65
65
85
75
290
总和 T =2 775
1.平方和与自由度的分解
22
2275160 429.69434
T C lmn ===⨯⨯
总变异平方和 2222
755550+++=-=
∑ C x
SS T
=172 025.00-160 429.69=11 595.31
培养液间平方和 2
2
222
495625880775
34i
t
T SS C C mn +++=
-=-⨯∑
=167 556.25-160 429.69=7 126.56
培养液内盆间平方和mn
T n
T SS i
ij
d
∑∑-
=
2
2
=(1802+1402+…+2902)/4+(4952+6252+8802+7752)/3/4
=168 818.75-167 556.25=1 262.5
盆内株间平方和 ∑∑-
=
n
T x
SS ij
e 22
=172 025.00-168 818.75=3 206.25
总变异自由度 1T DF lmn =-=(4×3×4)-1=47 培养液间自由度 DF t =l -1=4-1=3
培养液内盆间自由度 ()1d DF l m =-=4×(3-1)=8 盆内株间自由度 ()1e DF lm n =-=4×3×(4-1)=36 培养液间方差 2
7126.55
2 375.523
T t t SS s DF === 培养液内盆间方差 2
1262.50
157.818d d d SS s DF === 盆内株间方差 23206.25
89.0636
e e e SS s DF =
== 2.列方差分析表进行F 测验
表7-15 表7-14资料的方差分析表
变 异 来 源 SS
DF
2s
F
F 0.05
F 0.01
培养液间 7 126.52 3 2 375.52 15.05
**
4.07 7.59 培养液内盆间 1 262.50 8 157.81 1.77 2.22 3.04 盆内株间 3 206.25 36 89.06 总变异
11 595.31
47
对培养液内盆间作F 测验,查F 值表,当v 1=8,v 2=36时,F 0.05=2.22,F 0.0l =3.04,现实得F =1.77<F 0.05,故盆间差异不显著。
对培养液间变异作F 测验,查F 值表,当v 1=3,v 2=8时,F 0.05=4.07,F 0.0l =7.59,现实得F =15.05>F 0.01,故否定H 0,培养液间差异极显著。
3.各培养液平均数间的比较
平均数标准误为:
63.34
381.1572
=⨯==mn s s d x (mm )
按v =8查SSR 值表得k =2、3、4时的SSR 值,并算得各LSR 值于表7-16。
由LSR 值对4种培养液植株生长量进行差异显著性测验的结果列于表7-17。
表7-16 4种培养液的LSR 值(SSR 法)
k 2 3 4 SSR 0.05 3.26 3.39 3.74 SSR 0.01 4.74 5.00 5.14 LSR 0.05 11.83 12.31 12.60 LSR 0.01
17.21
18.15
18.66
表7-17 4种培养液植株生长量(mm )的差异显著性
培 养 液
平均生长量
t
x
差异显著性
α=0.05 α=0.01 C D B A
73.3 64.6 52.1 41.3
a a
b b
A A
B B
C C
推断:4种培养液对生长量的效应,C 与B 、A 差异极显著,D 与A 差异极显著,D 与B 差异显著,其它处理间差异均不显著。
第三节 两向分组资料方差分析
两向分组资料是指试验指标同时受两个因素的作用而得到的观测值。
如选用几种温度和几种培养基培养某种真菌,研究其生长速度,其每一观测值都是某一温度和某一培养基组合同时作用的结果,故属两向分组资料,又叫交叉分组。
按完全随机设计的两因素试验数据,都是两向分组资料,其方差分析按各组合内有无重复观测值分为两种不同情况,本节将予以讨论。
一、组合内无重复观测值的两向分组资料方差分析
设有A 和B 两个因素,A 因素有a 个水平,B 因素有b 个水平,每一处理组合仅有一个观测值,则全试验共有ab 个观测值。
其资料类型如表7-18。
表中T A 和A x 分别表示各行(A 因素的各个水平)的总和及平均数;T B 和B x 分别表示各列(B 因素的各个水平)的总和及平均数;T 和x 表示全部数据的总和及平均数。
表7-18 两向分组资料每处理无重复观测值的数据符号
( i
1,2,…,a ;j =1,2,…,b )
A 因素
B 因素
T A
A x
B 1
B 2
…
B b
A 1 11x 12x … 1b x T A 1 1A x A 2
21x
22x
… 2b x
T A 2
2A x
A a
1a x
2a x
… ab x
T A a
Aa x
T B
T B 1
T B 2
… T Bb
T
B x 1B x 2B x …
Bb x
x
两向分组资料的总变异可分为A 因素、B 因素和误差三部分。
其计算公式如表7-19。
表7-19中F 测验假设为H 0:2A σ=0、H 0:2
B σ=0,试验资料如果A 、B 存在互作,则与
误差混淆,因而无法分析互作,也不能取得合理的试验误差估计。
只有AB 互作不存在时,才能正确估计误差。
但在田间进行随机区组试验时,处理可看作A 因素,区组可看作B 因素,处理与区组的互作在理论上又是不应存在,可看作误差。
故可按照表中的形式来整理试验数据。
表7-19 表7-18类型资料方差分析表
变异来源 SS DF
2s
F
x s
A 因素
∑-C b T
a
2
1-a A A DF SS 2
2
e A s s
b s e 2
B 因素 ∑-
C T b 2
1-b
B B DF SS
2
2
e
B s s
a s e 2
误差 B A T SS SS SS --
(1-a
)(1-b )
e
e DF SS
总变异
∑-C x
2
1-ab
[例7.4] 将A 1、A 2、A 3、A 4 4种生长素,并用B 1、B 2、B 3 3种时间浸渍菜用大豆品种种子,45天后测得各处理平均单株干物重(g )列于表7-20。
试作方差分析。
表7-20 生长素处理大豆的试验结果 生长素(A )
浸渍时间(B )
T A
A x
B 1
B 2 B 3 A 1 10 9 10 29 9.67 A 2 2 5 4 11 3.67 A 3 13 14 14 41 13.67 A 4
12 12 13 37
12.33 T B 37 40 41 T =118
B x
9.3
10.0
10.3
x
=9.83
1.平方和与自由度的分解
根据表7-19将各项变异来源的平方和及自由度进行分解。
22
1181106.3043
T C ab === ⨯
2222109131344-1106.3183.7T SS x C C =-=+++-= =∑
22222
291141371337.3-1106.3177.03
A
A
T SS C C b
+++=
-=-= =∑
2222
3740411162.51106.3 2.24
B
B
T SS C C a
++=
-=-= - =∑
183.7177.0 2.2 4.5e T A B SS SS SS SS =--=--=
2.列方差分析表进行F 测验
将以上结果填入表7-21中,并将自由度直接填入该表。
表7-21 表7-20资料的方差分析表
变异来源 SS
DF
2s
F
F 0.05
F 0.01
生长素间 177.0 3 59.0 78.67
**
4.76 9.78 时间间 2.2 2 1.1 1.47
5.14 10.92 误差 4.5 6 0.75 总变异
183.7
11
对生长素间差异作F 测验,查F 值表,当v 1=3,v 2=6时,F 0.05=9.78,现实得F =78.67>F 0.0l ,故否定H 0,不同的生长素间差异极显著,需作多重比较。
对浸渍时间间差异作F 测验,查F 值表,当v 1=2,v 2=6时,F 0.05=5.14,现实得F =1.47<F 0.05,故接受H 0,三种浸渍时间间差异不显著,不需作多重比较。
3.生长素间比较
0.5x s ===(g )
当v =6时,查SSR 值表得k =2、3、4时的SSR 值,并算得各LSR 值列于表7-22。
进而进行多重比较列于表7-23。
表7-22 4种生长素的LSR 值
k 2 3 4 SSR 0.05 3.46 3.58 3.64 SSR 0.01 5.24 5.51 5.65 LSR 0.05 1.73 1.79 1.82 LSR 0.01
2.62
2.76
2.83
表7-23 4种生长素处理的差异显著性
生长素平均干物重(g/株)
差异显著性
α=0.05 α=0.01
A3 A4 A1 A2 13.67
12.33
9.67
3.67
a
a
b
c
A
A
B
C
推断:4种生长素对大豆单株平均干物重的效应,除A3与A4比较差异不显著外,其余处理间比较有极显著差异。
二、组合内有重复观测值的两向分组资料方差分析
设试验有A、B两个因素,A因素有a个水平,B因素有b个水平,共有ab个处理组合,每一处理有n个观测值,于是资料共有abn个观测值。
如果试验按完全随机设计,则其资料的类型如表7-24。
表7-24两向分组资料每处理有重复观测值的数据结构
A因素重复
B因素
T A
A
x B1 B2…B b
A1 1
111
x
121
x…
11b
x
2
112
x
122
x…
12
b
x
n
11n
x
12n
x…
1bn
x
t
T
11
t
T
12
t
T…
1t b
T
1A
T
1A
x t
x
11
t
x
12
t
x…
1t b
x
A21
211
x
221
x…
21b
x
2
212
x
222
x…
22
b
x
n
21n
x
22n
x…
2bn
x
t
T
21
t
T
22
t
T…
2t b
T
2
A
T
2
A
x t
x
21
t
x
22
t
x…
2t b
x
…
A a 1
11
a
x
21
a
x…
1
ab
x
2
12
a
x
22
a
x…
2
ab
x
n
1a n
x
2
a n
x…
abn
x
t T 1ta T 2ta T … tab T Aa T
Aa x
t x
1ta x
2ta x … tab x
B T 1B T 2B T … Bb T T
x
B x
1B x
2B x
…
Bb x
表7-24中符号的含义:T A 为A 因素总和。
而1A T 、2A T …Aa T 分别为A 因素各个水平的总和。
A x 为A 因素平均数。
而1A x 、2A x …Aa x 分别为A 因素各个水平的平均数。
B T 为B 因素各个水平的总和,B x 为B 因素平均数。
而1B x 、2B x …Bb x 分别为B 因素各个水平的平均数。
t T 为处理组合总和,而11t T 、12t T …为各个处理的总和。
t x 为处理组合平均数,而11t x 、
12t x …为各个处理的平均数。
T 为试验资料总和,x 为试验资料平均数,x 为资料内任一观
测值。
这类资料在方差分析时,总变异可分解为A 因素、B 因素、AB 互作及误差4部分。
其各变异来源的平方和与自由度公式见表7-25。
表7-25 表7-24类型资料平方和与自由度的分解
变异来源 SS
DF 2s
F
x s
处理组合
2
/t
T n C -∑ ab -1
2t
s
22T
e
s s
A 因素
B 因素
2
/A
T bn C -∑ 1a - 2
A s 2
2
e A s s
bn s e 2
2/B
T
an C -∑
1b -
2
B s 2
2
e
B s s an
s e 2
A×B 互作
t A B SS SS SS --
()()11a b --
2AB s
2
2e
AB s s
n s e 2
试验误差
T t SS SS -
()1ab n -
2
e
s
总变异
2
x
C -∑
1abn -
在上述测验中,互作的分析非常重要。
通常首先由
F =2
2
e AB s s
测验互作的显著性。
如果互作不显著,则必须进而对A 、B 效应的显著性作测验,这时可以2
e s 作为F 测验的分母。
如果互作是显著的,则不必再测验A 、B 效应的显著性,直接进入各处理组合的多重比较,但习惯上往往仍对各因素效应作测验。
因为在互作显著时,因素平均效应的显著性在实际应用中的意义并不重要。
[例7.5] 施用A 1、A 2、A 3 3种肥料于B 1、B 2、B 3 3种土壤,以小麦为指示作物,每处理组合种3盆,得其产量结果(g )列于表7-26。
试作方差分析。
1.平方和与自由度的分解
根据表7-25将各项变异来源的自由度填于表7-27。
以下计算各变异来源的平方和,求得
207.72 63
334.4092
=⨯⨯=C
28.2195.170.130.12222=-+++=C SS T 58.2023
7
.517.383.382
2
2
=-+++=
C SS t
45.1793
32.1690.1222.1182
22=-⨯++=
C SS A
96.33
35
.1336.1343.1412
2
2
=-⨯++=
C SS B
202.58179.45 3.9619.17AB
SS =--=
70.1658.20228.219=-=e SS
将以上结果填入表7-27中。
表7-26 3种肥料施于3种土壤的小麦产量(g )
(a =3,b =3,n =3,abn =27)
肥料种类
(A )
盆号(n )
土壤种类(B )
T A
A x
B 1(油沙) B 2(二合) B 3(黏土) A 1
1 12.0 13.0 13.3 2
14.2
13.7
14.0
118.2
13.1
3
12.1 12.0 13.9
t T
38.3 38.7 41.2 A 2
1 12.8 14.
2 12.0 2
13.8 13.6 14.6 122.0
13.6 3
13.7 13.3 14.0
t T
40.3 41.1 40.6 A 3
1 21.4 19.6 17.6 169.2
18.8 2
21.2 18.8 16.6 3
20.1 16.4 17.5 t T
62.7 54.8 51.7
B T 142.3 134.6 133.5 T =409.4
B x
15.7
15.0
14.8
2.列方差分析表进行F 测验
表7-27 表7-26资料的方差分析
变异来源 SS DF 2s
F F 0。
05 F 0。
01 处理组合间 202.58 8 25.33 27.30** 2.51 3.71 肥料间(A ) 179.45 2 89.73 96.8** 3.55 6.01 土类间(B ) 3.96 2 1.98 2.13 3.55 6.01 肥料×土类(A×B )
19.17 4 4.79 5.16**
2.93 4.58 试验误差 16.70 18 0.928
总变异
219.28
26
由表7-27可知,该试验肥类×土类的互作和肥类的效应间差异都是极显著的,均需作多重比较,而土类间差异不显著,故不需作多重比较。
3.平均数的比较
(1)各处理组合平均数的比较 肥料×土类的互作显著,说明各处理组合的效应不是各单因素效应的简单相加,而是肥类效应随土类而不同(或反之);所以宜进一步比较各处理组合的平均数。
在此用新复极差测验法,求得
554.03
928.0==
x s (g )
由v =18时查SSR 值表得k =2、3…、12时的SSR 值,并算得各LSR 值列于表6-28。
表7-28 7-26资料各处理组合平均数的LSR α值
k 2 3 4 5 6 7 8 9 SSR 0.05 2.97 3.12 3.21 3.27 3.32 3.35 3.37 3.39 SSR 0.01 4.07 4.27 4.38 4.46 4.53 4.59 4.64 4.69 LSR 0.05 1.65 1.73 1.78 1.81 1.84 1.86 1.87 1.88 LSR 0.01
2.25
2.37
2.43
2.47
2.51
2.54
2.57
2.59
将表7-26的各个t T 值按/t t x T n =式计算各处理组合的平均数,列表7-29进行比较。
表7-29 表7-26资料各处理组合平均数比较(SSR 法)
处理组合 平均产量t x
差异显著性
α=0.05
α=0.01
A 3
B 1 20.9 a A A 3B 2 18.3 b B A 3B 3 17.2 b B A 1B 3 13.7 c
C A 2B 2 13.7 c C A 2B 3 13.5 c C A 2B 1 13.4 c C A 1B 2
12.9
c
C。