实验设计讲义
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实 验 设 计 讲 义
实验设计思想——变异分析
一个或两个样本平均数的假设测验,可用u 测验或t 测验来测定它们之间的差异显著性。
当实验的处理数是k ≥3时,上述方法已不敷应用。
其原因是当是k ≥3时就有k (k -1)/2个差数进行比较,不仅工作量非常大,且精确度降低。
因此,对多个样本平均数的假设测验,需采用一种更为合适的统计方法,即方差分析法。
方差分析是生产和科学研究工作的一个十分重要的工具。
第一节 方差分析的基本原理
方差分析就是将实验数据的总变异分解为来源于不同因素的相应变异,并作出数量估计,从而明确各个变异因素在总变异中所占的重要程度;也就是将实验数据的总变异方差分解成各变因方差,并以其中误差方差作为和其他变因方差比较的标准,以推断其他变因所引起的变异量是否真实的一种统计分析方法。
一、平方和与自由度的分解 方差是平方和除以自由度的商。
要想将一个实验资料的总变异分解为各个变异来源的相应变异,首先必须将总平方和与自由度分解为各个变异来源的相应部分。
因此,平方和与自由度的分解是方差分析的第一步。
下面先从简单的类型说起。
假设有k 个处理;每个处理有n 个观测值,则该资料共有nk 个观测值,其观测值的组成如表7-1。
表7-1中,i 代表资料中任一样本;j 代表样本中任一观测值;x ij 代表任一样本的任一观测值;T t 代表处理总和;t x 代表处理平均数;T 代表全部观测值总和;ti x 代表总平均数。
表7-1 每处理具n 个观测值的k 组数据的符号表
处理 样本 观察值
处理总和
T t
处理平均
t x 1
2
… j
… n
1 x 11 x i
2 … x 1j … x 1n T t1 1t x 2
x 21
x i 2
… x 2j
… x 2n
T t2
2t x
… …
…
… …
… …
… …
i
x i1
x i 2
… x i j
… x i n
T ti
ti x
… …
…
… …
… …
… …
k x k 1
x k 2
… x k j
… x k n
T ki tk x
T =∑x
x
在表7-1中,总变异是nk 个观测值的变异,故其自由度df =nk -1,而其平方和SS T 则为:
SS T =
221
()nk ij
x x x C -=-∑∑ (7-1)式中的C 称为矫正数:
2
()x T
C nk
nk
=
=
∑ (7-2) 产生总变异的原因可从两方面来分析:一是同一处理不同重复观测值的差异是由偶然因
素影响造成的,即实验误差,又称组内变异;二是不同处理之间平均数的差异主要是由处理的不同效应所造成,称处理间变异,又称组间变异。
因此,总变异可分解为组间变异和组内变异两部分。
组间的差异即k 个x 的变异,故自由度df =k —1,而其平方和SS t 。
为:
2
2
1
()
k
t
t ij T SS n x x C n
=-=
-∑∑
组内的变异为各组内观测值与组平均数的变异,故每组具有自由度df =n -1和平方和
21
()n
ij
x
x -∑,而资料共有k 组,故组内自由度,df =k (n -1),而组内平方和SS 为:
21
1()k
n
e ij t T t SS x x SS SS =-=-∑∑
因此,得到表7-1类型资料平方和与自由度的分解式为:
总平方和 = 组间(处理间)平方和 + 组内(误差)平方和
2
2
21
1
1
1
1
()()()k n
k k n
ij t ij t
i x
x n x x x x =-=-+-∑∑∑∑∑ 记作: SS T =SS t +SS e
总自由度 = 组间(处理间)自由度+组内(误差)自由度 即: (nk -1)=(k -1) +k (n -1) 记作: DF T =DF t +DF e
求得各变异来源的平方和与自由度后,进而求得: 总平方和 总自由度 df T =nk -1
处理平方和 处理自由度 df t =k -1
区组平方和 区组自由度 df r =n -1
误差平方和 误差自由度 df e =(k -1)(n -1)
均方用MS 表示,也可用s 2表示,两者可互换。
其组内均方MS e 也称误差均方,它是多个处理内均方的加权平均值,而第6章中s 2e 为甲、乙两样本(处理)均方的加权平均值,故s 2e 与MS e 意义相同。
[例7.1]设有A 、B 、C 、D4个大豆品种(k =4),其中D 为对照,进行大区比较实验,成熟后分别在四块地测产,每块地随机抽样5点,每点产量(kg )列于表7-2,试作方差分析。
表7-1 大豆大区抽样产量综合表
品种
样点
T t t x
1
2 3 4 5 1 35 41 28 38 31 173 34.6 2 28 22 19 35 29 133 26.6 3 29 35 34 39 32 169 33.8 4
25
26
21
27
22
121
24.2
2221
1T
t t r r e T t r SS x C
SS T C
n SS T C
k
SS SS SS SS =-=-=-=--∑
∑
∑
596(T )
29.8(x )
1、平方和的分解 已知n =5,k =4
2
2()59611760.854
x T C nk
nk =
=== ⨯∑ 22222
2222
(354122)17760.8751.2
17313316912117760.8403.25
751.2403.2348
T t
t e T t SS x C T SS C n SS SS SS =-=++
+- =+++=
-=- ==-=-=∑∑
2、自由度的分解
DF T =nk -1=5×4-1=19 DF t =k -1=4-1=3
DF e =k (n -1)=4×(5-1)=16
3、求各变因的均方
MS t =s 2t =
403.2
3t t SS DF =
=134.40 MS e =s 2e =
348
16
e e SS DF =
=21.7 总变异均方s 2T 无须计算。
以上品种内均方s 2e =21.75系4个品种内变异的合并均方值,它是表7-2资料的实验误差估计;品种间均方s 2t =134.40,则是不同品种产量效应的变异。
二、F 分布与F 测验
计算出均方后,要进一步测定不同处理的平均数差异是否显著,判断处理间是否存在真实的差别,要应用F 分布进行F 测验。
1、F 值定义和F 分布 在一个平均数为μ,方差为2
σ的正态总体中随机抽取两个独立样本,分别计算其均方s 12和s 22,将s 12和s 22的比值定义为F :
2
122
s F s =
(7-8) 此F 值具有s 12的自由度v 1和s 22的自由度v 2。
通常s 12>s 22所以习惯上称v 1为大方差自由度,v 2为小方差自由度。
如果在给定的v 1和v 2
的
图7-1 v 1、v 2不同的三个F 分布曲线
情况下,进行一系列随机独立抽样,就可得到一系列的F 值而形成一个F 分布,并制作成F 分布曲线(图7-1)。
F 分布是由v 1和v 2所决定的一系列曲线。
在v 1≤2时,曲线严重倾斜,呈反向J 形。
当v 1≥3时,曲线转为偏态。
F 分布的平均数F μ=1,其取值范围为[0,+∞]
F 分布下一定区间的概率可从已制成的统计表查出。
附表5系各种v 1和v 2下右尾概率α=0.05和α=0.01时的临界F 值(一尾概率表)。
如查附表5,v 1=5,v 2=12时,F 0.05=3.33,F 0.0l =5.64,即表示如以v 1=5,v 2=12在一正态总体中连续抽样时,则所得F 值大于3.33的概率仅有5%,而大于5.64的仅有1%。
2、F 测验的方法 F 测验的目的是为了测验处理效应是否确实存在(是否由误差造成)。
在进行处理间平均数差异显著性的F 测验时,把处理均方作分子,把误差均方作分母,即:
t
e
MS F MS =
(7-8) F 值可作为判断处理效应是否存在的依据。
若纯属误差所致,一次获得F ≥F 0.05的概率P ≤0.05,一次获得F ≥F 0.01的概率P ≤0.01。
根据小概率原理,一次获得F ≥F 0.05,则认为两变因差异显著;一次获得F ≥F 0.01,则认为两变因差异极显著;若F <F 0.05则认为差异不显著,即被测变因内各观测值之间的差异同于机误,或者说没有本质区别。
F 测验方法有3个步骤:
首先提出假设,H0:2t σ≤2e σ:处理(品种)间差异量小于或等于实验误差。
差异不显著。
对HA :2t σ>2
e σ:处理(品种)间差异量大于实验误差。
差异显著。
其次列方差分析表进行F 测验,为了避免差错和使测验计算结果一目了然,一般在这
一步骤应列一方差分析表进行F 测验。
格式见表7-3。
最后推断假设,按概率标准进行推断。
F <F0.05,P >0.05,差异不显著,接受H0,F ≥F0.05,P ≤0.05,差异显著,否定H0,接受HA 。
F ≥F0.01,P ≤0.05,差异极显著,否定H0,接受HA 。
如果F ≤1,不用查表即可判断差异不显著。
在实际应用中,为简便起见,“提出假设”这一步也可省略。
表7-3 方差分析表
变异来源 SS DF
MS F
F α
处理间 2t
T
T SS C n
=
-∑
DF t =k -1 MS t =SS t /DF t t
t e
MS F MS =
处理内 SS e =SS T -SS t DF e =k (n -1) MS e =SS e /DF e
总变异
SS T =
2
x
C -∑
DF T =nk -1
现对[例7.1]资料进行F 测验:
3、多重比较
(1)不同药剂处理与对照(未处理)间比较 计算均数差数标准误
12 1.732x x s -=
==
查t 表,当v =15时,t 0.05=2.131,t 0.01=2.947。
LSD 0.05= t 0.05×12x x s -=2.131×1.732=3.691
LSD 0.01= t 0.01×12x x s -=2.947×1.732=5.104
表7-11不同药剂处理与对照株高差异比较(LSD 法)
处理 C
D
B
A
E(CK)
平均苗高(t x )
30 25 23 18 15
与对照差异
15**
10**
8**
3
测验结果表明:用药剂C 、D 、B 处理黄瓜幼苗,株高极显著地高于对照E ;药剂A 处理与对照E 差异不显著。
(2)各处理间平均数的比较 计算平均数标准误
1.225SE =
== 根据v =15,查SSR 表得k =2、3、4、5时的SSR 0.05与SSR 0.01值,将SSR α值分别乘以SE
值,即得LSR α值于表7-5。
7-5多重比较的LSR α值计算
k SSR 0.05
SSR 0.01 LSR 0.05 LSR 0.01
2
3.01
4.17 3.69
5.11 3 3.16 4.37 3.87 5.35 4 3.25 4.50 3.98 5.51 5
3.31
4.58
4.06
5.61
7-6不同药剂处理的显著性(SSR 法)
处理 平均苗高(t x )
差异显著性
C D B A E(对照)
30 25 23 18 15
a b b c c
A A
B B
C C
D D
推断:药剂C 与B 、A 、E 差异极显著,药剂D 与A 、E 差异极显著,药剂B 与E 差异及显著,C 与D 、B 与A 差异显著,其它处理间差异均不显著。
二、组内观测值数目不等的单向分组资料的方差分析 组内观测值数目不等资料方差分析的原理、步骤与组内观测值数目相等的完全相同,不同的是各处理的样本容量n i 不等(即n 1≠n 2≠…n i …≠n k ),以n i 表示任一样本的样本容量,则该实验资料共有
1
k
i
n ∑个观测值。
在方差分析时,有关公式因n i
不同而需作相应改变。
1、 平方和与自由度的分解
总变异平方和 2
T SS X
C =
-∑
2
T C n
=
∑
处理间平方和 2
t t i
T SS C n =-∑
误差平方和 SS e =SS T -SS t 总变异自由度 1T i
DF n =
-∑
处理间自由度 DF t =k -1 误差自由度 e i
DF n k =
-∑
2、多重比较 由于各处理的重复数不同,可先算得各n i 的平均数n 0。
()()()
2
2
01i i i
n n n n k -=
-∑∑∑
然后有:
12x x s -=
SE =
[例7.3]调查某苹果品种短枝型1、2号与普通型、小老树枝条节间的平均长度(cm ),每类型样点数不等,调查资料列于表6-13,试测验不同类型树枝条节间长度的差异显著性。
表7-14某苹果品种不同类型树枝条节间长度
样点 x 短枝2号 1.9 1.7 1.6 1.8 1.8 1.8 1.8 1.7 1.9 16.0 1.78 9 普通型 2.2 2.3 2.4 2.5 2.4 2.4 2.4 2.3 2.2 2.2 2.2 25.5 2.32 11 T=68.1
x
=1.89
i
n ∑=36
2、列方差分析表进行F 测验 分析步骤:
1、 平方和与自由度的分解
2
268.14837.61128.823636
i
T C n
=
===∑
22227 1.8 1.7132.45128.82 3.63T SS X C C =-=++
+-=-=∑
22222
17.716.025.58.9()128.82 3.26109116
t t i T SS C n =-=+++-=∑
SS e =SS T -SS t =3.63-3.26=0.37 13613
5T i
DF n =
-=-
=∑ DF t =k -1=4-1=3 36432e i
DF n k =-=-=∑
类型间均方 3.26
1.0873t t t SS MS DF =
== 误差均方 0.37
0.01232
e e e SS MS DF =
== 2、列方差表分析表进行F 测验
表7—15 表7—14资料方差分析
变异来源 SS DF MS F
F 0.05
F 0.01
类型间 3.26 3 1.037 90.58**
2.90 4.46 误差 0.37 32 0.012 总变异
3.63
35
假设H 0:2t σ≤2e σ对H A :2t σ>2
e σ,F=MS t /MS e =1.087/0.012=90.58,查F 表,当v 1=3,
v 2=32时,F 0.05=2.90,F 0.0l =4.46,现实得F=90.58>F 0.01,P <0.01,故否定H 0,不同类型间差异极显著。
3、多重比较
()()()2
2
222220361091168.87936411i i i n n n n k ⎛⎫- ⎪-+++⎝⎭===≈⨯-⎛⎫
- ⎪⎝⎭
∑∑∑
0.037SE =
==
现v =32,按v =30查SSR 值表得k=2、3、4时的SSR α值,将SSR α值分别乘以SE 值,即得LSR α值于表7-16。
由SSR α值对4种类型果树枝条节间长度进行差异显著性测验的结果列于表7-17。
表7-16多重比较时的LSR 值计算
k SSR 0.05
SSR 0.01 LSR 0.05 LSR 0.01
2
2.89
3.89 0.107 0.144 3 3.04
4.06 0.112 0.150 4
3.12
4.16
0.115
0.154
7-17某苹果品种不同类型树枝条节间差异表(SSR 法)
类型 节间长度t x
差异显著性
α=0.05 α=0.01 短枝1号 短枝2号 普通型 小老树
2.32 1.78 1.77 1.48
a b b c
A B B C
推断:除短枝型1号与2号无差异外,其他类型之间差异都极显著。
普通型枝条节间 最长,小老树枝条节间最短。
三、系统分组资料的方差分析
系统分组资料,是组内(处理内)又分亚组的单向分组资料的简称。
系统分组并不限于组内仅分亚组,亚组内还可分小组,小组内还可分小亚组,……,如此一环套一环地分下去。
这种实验称为巢式实验。
在农业实验上系统分组资料是常见的。
如对数块土地取土样分析,每块地取了若干样点,而每一样点又作了数次分析的资料;或调查果树病害,随机取若干株,每株取不同部位若干枝条,每个枝条取若干叶片查其病斑数的资料;或在温室里作盆栽实验,每处理若干盆,每盆种若干株的资料等,皆为系统分组资料。
以下讨论二级系统分组资料的方差分析。
最简单的系统分组资料是二级系统分组资料。
它是l l 个组(处理),每组内又分m 个亚组,每个亚组内又有n 个观测值,则该资料共有lmn 个观测值,其资料类型如表7-18。
表7-18二级系统分组资料lmn 个观测值的数据结构 (1,2,;1,2,;1,2,i
l j m k n ===)
组(i ) 亚组(j ) 观测值ijk x
亚组
组
总和
()ij
T
平均
()ij
x
总和
T
平均(x )
1 111x 112x
… 11k x 11n x
T
11 x 11 2 121x
122x …
12k x …
12n x
T 12 x
12
1
…
…
…
…
…
T 1 1x
11m x
12
m x
1mk
x 1mn x 1m 1m 22x
11i 12i 1i k 1i n 1i 1i
i
2 21i x
22i x …
2i k x …
2i n x
2i T
2i x
…
…
…
…
…
j
1ij x
2ij x …
ijk x …
ijn x
ij T
ij x
i T
i x
m 1im x 2im x imk x imn x im T im T
1 11l x
12l x … 1l k x …
1
l n x
1l 1l
2 21l x
22l x …
2l k x …
2l n x
2l T
2l x
l
…
…
…
…
…
l T
l x
1lm x 2lm x lmk x lmn x lm lm
T x =∑ x lmn
=
T x =∑ x lmn
=
系统分组资料的变异来源分为组间(处理间)、组内亚组间和同一亚组内各重复观测值间(实验误差)三部分。
其平方和与自由度的计算公式如下:
总变异 1T DF lmn =-
2T SS X C =-∑ 2
T C lmn
=
组间(处理间)变异 DF t =l -1
2
i
t T
SS C mn
=
-∑
同一组内亚组间的变异 ()1d DF l m =-
22
ij
i
d T
T
SS n
mn
=
-
∑∑
亚组内的变异 ()1e DF lm n =-
22
ij
e T
SS x
n
=
-
∑∑
因而可得方差分析表7-19。
表7-19二级系统分组资料的方差分析
变异来源
SS
DF
MS
F
组间
()t
2
i
T C mn
-∑
l -1
/1t S l - /t d MS MS
组内亚()d 亚组内
()e
22
ij
i
T
T
n
mn
-
∑∑
()1l m - ()/1d SS l m -
/d e MS MS
22ij
T
x n
-
∑∑
()1lm n -
()/1e SS lm n -
总变异
2
x
C -∑
1lmn -
由表7-19可知,为测验各组(处理)间有无不同效应,测验假设H 0:2t σ=0
F=/t d MS MS
为测验各组间有无不同效应,测验假设H 0:2
d σ=0
F=/d e MS MS
在进行(处理)间平均数多重比较时均数标准误为:
SE =在进行组内亚组间平均数多重比较时均数标准误为:
SE =
[例7.4]在温室内以4种培养液(l =4)培养某作物,每种培养液培养3盆(m =3),每盆4株(n =4),全实验共有12个花盆完全随机排列,其它管理条件相同,一个月后测定株高生长量(mm ),得结果于表7-20,试作方差分析。
表7-20 4种培养液下的株高增长量
培养液
()i
盆号
()j
生长量 (ijk x ) 盆总和
()ij
T
培养液总和
()i T
培养液平均(i x )
A 1 A 2 35 35 30 40 140 495 41.3 A 3 45 40 40 50 175
B B 1 50 45 50 45 190 B 2 55 60 50 50 215 625 52.1 B 3 55 45 65 55 220
C 1 85 60 90 85 320 C 2 65
70
80
65
280
880
73.3
C 3 70 70 70 70 280 D
D 1 60 55 35 70 220 D 2 60 85 45 75 265 775 64.6 D 3
65 65 85 75 290
22
2775160429.69434T C lmn ===⨯⨯
总变异平方和 2222505575T SS X C C
=-=++
+-∑
=172 025-160 429.69=11 595.31
培养液间平方和 2
2222
49562588077534
i
t T
SS C C mn +++=
-=-⨯∑
167 556.25-160 429.69=7 126.56 培养液内盆间平
方和
()2
2
222180140290/4167556.25ij
i
d T
T
SS n
mn
=
-
=++-∑∑
=168 818.75-167 556.25=1 126.56
盆内株间平方和 22
172025168818.753206.25ij
e T
SS x
n
=
-
=-=∑∑
总变异自由度 1T DF lmn =-=(4×3×4)-1=47 培养液间自由度 DF t =l -1=4-1=3
培养液内盆间自由度 ()1d DF l m =-=4×(3-1)=8 盆内株间自由度 ()1e DF lm n =-=4×3×(4-1)=36
培养液间均方 7126.56
2375.523t t t SS MS DF =
== 培养液内盆间均方 1262.50
157.818
d d d SS MS DF =
==
盆内株间均方
2、列方差分析表进行F测验
表7-21表7-20资料方差分析
变异来源SS DF MS F F0.05F0.01培养液间7126.56 3 2375.52 15.05** 4.07 7.59
培养液内盆间盆内株间(误差)1262.50
3206.25
8
36
157.81
89.06
1.77
2.22
3.04
总变异11595.31 47
对培养液内盆间作F测验, F=MS d/MS e=157.81/89.06=1.77,查F表,当v1=8,v2=36时,F0.05=2.22,F0.0l=3.04,现实得F=1.77<F0.05,故盆间差异不显著。
对培养液间变异作F测验,
假设H0:2
t
σ=0,F=MS t/MS e=2375.52/157.81=15.05**,查F表,当v1=3,v2=8时,F0.05=4.07,
F0.0l=7.59,现实得F=15.05>F0.01,故否定H0,培养液间差异极度显著。
3、各培养液平均数间的比较平均数标准误为
3.63
SE===
按v=8查SSR值表得k=2、3、4时的SSRα值,并算得各得LSRα值于表7-21。
由SSRα值对4种培养液植株生长量进行差异显著性测验的结果列于表7-23。
表7-22 4种培养液的LSR值(SSR法)
P SSR0.05SSR0.01LSR0.05LSR0.01
2 3.26 4.74 11.8
3 17.21
3 3.39 5.00 12.31 18.15
4 3.47 5.14 12.60 18.66
表7-23 4种培养液植株生长量的差异显著性
平均生长量x差异显著性
D B A 64.6
52.1
41.3
a
b
b
AB
BC
C
推断:4种培养液对生长量的效应,C与B、A差异极显著,D与A差异极显著,D与B差异显著,其它处理间差异均不显著
第三节两向分组资料的方差分析
两向分组资料是指实验指标同时受两个因素的作用而得到的观测值。
如选用几种温度和几种培养基培养某种真菌,研究其生长速度,其每一观测值都是某一温度和某一培养基组合同时作用的结果,故属两向分组资料,又叫交叉分组。
按完全随时设计的两因素实验数据,都是两向分组资料,其方差分析按各组合内有无重复观测值分为两种不同情况,本节将予以讨论。
其它设计的两向分组资料,则留待以后介绍。
一、组合内无重复观测值的两向分组资料的方差分析
设有A和B两个因素,A因素有a个水平,B因素有b个水平,每一处理组合仅有
一个观测值,则全实验共有ab 个观测值。
其资料类型如表7-24,
表7-24两向分组资料每处理无重复观测值的数据结构
(1,2,,,1,2,,i
a j
b ==)
A 因素
B 因素
T A A x 1
2b A 1 11 12
…
1b
T A1
1A
x A 2 21x
22x
… 2b x
T A2 2A x
a 1a x 2a x a
b x Aa Aa x T B
T B1
T B2
… T Bb
T
B x 1B x 2B x Bb x x
表中T A 和A x 分别表示各行(A 因素的各个水平)的总和及平均数;T B 和B x 分别表示各列(B 因素的各个水平)的总和及平均数;T 和x 表示全部数据的总和及平均数。
两向分组资料的总变异可分为A 因素、B 因素和误差三部分。
其计算公式如表7-25。
表7-25中F 测验假设为H 0:2A σ=0,H 0:2
B σ=0,实验资料如果A 、B 存在互作,则
与误差混淆,因而无法分析互作,也不能取得合理的实验误差估计。
只有AB 互作不存在时,才能正确估计误差。
但在田间实验中,随机区组实验中,处理可看作A 因素,区组可看作B 因素,处理与区组的互作在理论上又是不应存在可看作为误差。
故可按照表中的形式来整理实验数据。
(见第9章)。
表7-25 表7-24类型资料方差分析表
变异来源 SS
DF
MS
F
SE
A 因素
2
/a
T
b C -∑
a -1
/A A SS
DF /a e MS MS
B 因素 误差
2/b T a C -∑
1b -
/B B SS DF /B e MS MS
T A B SS SS SS --
()()11a b --
/e e SS DF
总变异
2
x
C -∑
1ab -
[例7.5]将A 1、A 2、A 3、A 4 4种生长素,并用B 1、B 2、B 3 3种时间浸渍菜大豆品种种子,45天后测得各处理平均单株干物重(g )于表7-26。
试作方差分析。
表7-26 生长素处理大豆的实验结果
生长素(A )
浸渍时间(B )
T A A x
1
23A 1
10
9
10
29
9.67
A 2 2 5 4 11 3.67 A 3 13 14 14 41 13.67 A 4 12 12 13 37 12.33 T B
37 40 41 T=118
B x
9.3
10.0
10.3
x
=9.83
1、平方和及自由度的分解 根据表表7-25将各项变异来源的平方和及自由度分解。
22
1181160.343
T C ab ===⨯
22221091313441160.3183.7
T SS X C C =-=++
+-=-=∑
2
2222
291141371337.31160.3177.03
A
A T
SS C C b
+++=
-=-=-=∑
2222
3740411162.51160.3 2.24
B
B T SS
C C a
++=
-=-=-=∑
183.7177.0 2.2 4.5e T A B SS SS SS SS =--=--=
将以上结果填入表7-27中,并将自由度直接填入表7-27。
表7-27 表7-26资料的方差分析
变异来源 SS DF MS F
F 0。
05
F 0。
01
生长素间 177.0 3 59.0 78.67** 4.67 9.78 时间间 误差 2.2 4.5 2 6 1.1 0.75 1.47 5.14
10.92
总变异
183.7
11
2、列方差分析表进行F 测验 对生长素间差异作F 测验,假设H 0:2
A σ=0,得:
F=MS A /MS e =59.0/0.75=78.67**,按,当v 1=3,v 2=6查F 表得F 0.05=9.78,现实得F=78.6>F 0.0l ,故否定H 0,不同的生长素差异极显著,需作多重比较。
对浸渍时间间差异作F 测验,假设
H 0:2B σ=0,得:F=MS B /MS e =1.1/0.75=1.47,按,当v 1=2,v 2=6查F 表得F 0.05=5.14,现实
得F=1.47<F 0.05,故接受H 0,三种浸渍时间间差异不显著。
不需再作多重比较。
3、生长素间比较
0.25SE =
== 当v =6时,查SSR 值表得k=2、3、4时的SSR α值,并算得各LSR α值列于表7-28。
进
而进行多重比较列于表7-29。
表7-28 4种生长素的LSR 值
k SSR 0.05
SSR 0.01 LSR 0.05 LSR 0.01
2
3.46 5.24 1.73 2.62 3 3.58 5.51 1.79 2.76 4
3.64
5.65
1.82
2.83
表7-29 4种生长素处理的差异显著性
生长素
平均干物重(g/株)
差异显著性
A 3 A 4 A 1 A 2 13.67 12.33 9.67 3.67
a a
b c
A A
B C
推断:4种生长素对大豆单株平均干物重的效应,除A 3与A 4比较差异不显著外,其余4对比较都是极显著。
二、组合内有重复观测值的两向分组资料的方差分析
设实验有A 、B 两个因素,A 因素有a 个水平,B 因素有b 个水平,共有ab 个处理组合,每一处理有n 个观测值,于是资料共有abn 个观测值。
如果实验按完全随机设计,则其资料的类型如表7-30。
表7-30两向分组资料每处理有重复观测值的数据结构
B 因素
x
A 1
1 111x 121x … 11b x
2
112x
122x
… 12b x
n 11n x 12n x 1bn x t
11t 12t … 1t b 1A T
1A x
t x
11
t x
12
t x
…
1t b x
A 2
1 211x 221x … 21b x 2
212x
222x
… 22b x
n 21n x 22n x
2bn
x
t
21t
22t … 2t b
2A T
2A x
t x
21t x
22t x
… 2t b x
…
1 11a x 21a x … 1ab x
12a x
22a x 2ab x
A a
n 1a n x 2a n x abn x t
1ta 2ta … tab Aa T
x
t x 1ta x
2ta x … tab x
B 1B 2B … Bb T
x
B x
1B x
2B x
…
Bb x
表7-30内符号的含义:T A 为A 因素总和。
而1A T 、2A T …Aa T 分别为A 因素各个水平的总和。
A x 为A 因素平均数。
而1A x 、2A x …Aa x 分别为A 因素各个水平的平均数。
B T 为B 因素各个水平的总和。
B x 为B 因素平均数。
而1B x 、2B x …Bb x 分别为B 因素各个水平的平均数。
t T 处理组合总和,而11t T 、12t T …为各个处理的总和。
t x 处理组合平均数,而11t x 、12t x …为各个处理的平均数。
T 实验资料总和,x 实验资料平均数,x 为资料内任一观测值。
这类资料在方差分析时,总变异可分解为A 因素、B 因素、AB 互作及误差4部分。
其各变异来源的平方和与自由度公式见表7-31。
表7-31 表7-30类型资料平方和与自由度的分解
变异来源
SS
DF MS F
SE
处理组合
2
/t
T
n C -∑
ab
-1
A 因素
B 因素
2/A T bn C -∑
1a -
A MS /A e
MS MS
2/B T an C -∑
1b -
B MS /B e MS MS
A ×
B 互作 t A B SS SS SS --
()()11a b --
AB MS
/AB e MS MS
实验误差 T t SS SS -
()1ab n -
e MS
总变异
2
x
C -∑
1abn -
在上述测验中,互作的分析非常重要。
常首先由F=/AB e MS MS 测验互作的显著性。
如果互作不显著,则必须进而对A 、B 效应的显著性作测验,这时可以e MS 为F 测验的分母。
如果互作是显著的,则可以不必再测验A 、B 效应的显著性,可直接进入各处理组合的多重
比较,但习惯上往往仍对各因素效应作测验。
因为在互作显著时,因素平均效应的显著性在实际应用中的意义并不重要。
【例7.6】施用A 1、A 2、A 3、A 4 4种肥料于B 1、B 2、B 3 3种土壤,以小麦为指示作物,每处理组合3盆,得其产量结果(g )于表7-32。
试作方差分析。
1、平方和及自由度的分解 根据表7-31计算各变异来源的平方和及自由度:
22
536.78001.30433
T C abn ===⨯⨯
222212.013.013.88233.958001.30232.65T SS x C C =-=++
+-=-=∑
2
222
38.338.743.48215.048001.30213.743
t
t
T SS C C n
+++=
-=
-=-=∑
22222
118.2122.0169.2127.38187.698001.30186.39
33
A
A T
SS C C bn
+++=
-=-=-=⨯∑
2
222
185.6174.2176.98007.228001.30 5.9243
B
B T
SS C C an
++=
-=-=-=⨯∑
213.74186.39 5.9221.43AB t A B SS SS SS SS =--=--=
232.65213.7418.91e T t SS SS SS =-=-=
将以上结果填入表7-32中,并将自由度直接填入表7-32。
表7-32 4种肥料施于3种土壤的小麦产量
(a =4,b =3,n =3,abn =36)
肥料种类
土壤种类(B )
x A 1
2 14.2 13.7 14.0 118.2 13.1 3
12.1
12.0
13.9
t T
38.3 38.7 41.2 A 2
1 12.8 14.
2 12.0 2 13.8 13.6 14.6 122.0 13.6 3
13.7 13.3 14.0
t T
40.3 41.1 40.6 A 3
1 2 3
21.4 21.2 19.6 18.8 17.6 16.6 17.5 169.2 18.8 20.1 16.4 t T
62.7 54.8 51.7 A 4 2 14.1 12.7 15.1 127.3 14.1
t T
44.3 39.6 43.4 B T 185.6 174.2 176.9
536.7
14.9
B x
15.5
14.5
14.7
2、列方差分析表进行F 测验
表7-33 表7-32资料的方差分析
变异来源 SS DF MS F
F 0。
05
F 0。
01
处理组合间 213.74 11 19.43 24.66** 2.22 3.09 肥料间(A ) 土类间(B ) 186.39 5.92 3 2 162.13 2.96 78.85** 3.76 3.01 3.40 4.72 5.61 肥料×土类(A ×
B ) 21.43 6 3.57 4.53**
2.51
3.67 实验误差 18.91 24 0.788
总变异
232.65
35
由7-33可知,该实验肥类×土类的互作和肥类的效应间差异都是极显著的,均需作多重比较,而土类间差异不显著,故不需作多重比较。
3、平均数的比较
(1)各处理组合平均数的比较 肥类×土类的互作显著,说明各处理组合的效应不是各单因素效应的简单相加,而是肥类效应随土类而不同(或反之);所以宜进一步比较各处理组合的平均数。
在此用新复极差测验法,求得:
0.513SE =
== 由v =24时查SSR 值表得k=2、3…,12时的SSR α值,并算得各LSR α值列于表7-34。
表7-34 7-32资料各处理组合平均数的LSR α值
k 2 3 4 5 6 7 8 9 10 11 12 0.05SSR 0.01 3.96 4.14 4.24 4.33 4.39 4.44 4.49 4.53 4.57 4.60 4.62 LSR 0.05 1.49 1.57 1.62 1.65 1.68 1.70 1.71 1.73 1.73 1.74 1.75 LSR 0.01
2.03
2.12
2.18
2.22
2.25
2.28
2.30
2.32
2.34
2.36
2.37
将表7-32的各个t T 值按/t t x T n =式计算各处理组合的平均数,列表7-35进行比较。
表7-35 表7-32资料各处理组合平均数比较(SSR 法)
平均产量x 差异显著性
3 1 A 3B 2 18.3 b B A 3B 3 17.2 b B A 4B 1 14.8 c C A 4B 3 14.5 cd C A 1B 3 13.7 cd C A 2B 2 13.7 cd C A 2B 3
13.5
cd
C
A2B113.4 cd C
A4B213.2 cd C
A1B212.9 d C
A1B1 d C 由表7-35可见,A3B1处理组合的产量极显著地高于其他处理组合;其次为A3B2和A3B3,它们之间并无显著差异,但极显著地高于除A3B1外的其他处理组合;再次为A4B1处理组合,显著地高于A1B2和A1B1。
其余处理组合间均无显著差异。
(2)各肥类平均数的比较
0.296
ME===
据v=24时,查SSR值表得k=2、3、4时的SSRα值,并算得LSRα值列于表7-36。
多重比较结果列于表7-37。
表7-36 表7-32资料肥料类平均数的LSRα值
k SSR0.05SSR0.01LSR0.05LSR0.01
2 2.92 3.96 0.86 1.17
3 3.07 4.1
4 0.91 1.23
4 3.1
5 4.24 0.93 1.26
表7-37 表7-34资料各肥料类平均数的差异显著性(SSR法)
肥料种类平均数(
x差异显著性
A3 A4 A2 A1 18.8
14.1
13.6
13.1
a
b
bc
c
A
B
B
B
由表7-37可见,肥料A3与A4、A2、A1均有极显著的差异;A4与A1差异显著;但A4与A2、A2、与A1无显著差异。
4、结论肥料A3对小麦增产效果最好,土类间则无显著差异;但A3肥料施于油砂土(A
3
B1处理组合)却比施于其他土壤上更有突出的增产效果。