第四章 方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
( xij ) 2 km
( xi j Ti ) ( xij ) 2 C km
Ti2 C m
SSe=SST-SSA
●自由度的计算 dfT=km-1 =km-k+k-1 =k(m-1)+(k-1) =dfe+dfA dfA=k-1 dfe=k(m-1)=dfT-dfA ●方差的计算
2.各变因平方和与自由度及方差的计算 因为整个数据的总变异是由处理间的变异和处理内变异即误差 引起的变异,而方差又是由平方和与自由度构成的,即:
( x x ) 2 S n 1
2
因此,整个数据的平方和及自由度亦应由处理间及误差两部分构 成,即: 总平方和=处理间平方和+误差的平方和 总自由度=处理间自由度+误差的自由度 用 SS 表示平方和,用 df 表示自由度,用 T 代表总变异,用 e 代 表误差,则有: SST=SSA+SSe dfT=dfA+dfe
SSe=SST-SSA=2.7605-2.2218=0.5387 df:dfT=km-1=20-1=19 dfA=k-1=4-1=3 dfe=dfT-dfA=19-3=16 S:
2
2 SA
SS A 2.2218 0.7406 df A 3
2 Se
SSe 0.5387 0.0337 df e 16
x1 x 2
的差异显著,用*标记 的差异极显著,用**标记
≥LSD0.01 时,
x1 x 2
SD 的计算:
2 2 2 ( n1 1) S1 ( n 2 1) S 2 ( n k 1) S k 2 S Se n1 n 2 n k k
SD
2 SA
SS A df A
Ti2 C m k 1
2 Se
SSe SST SS A df e dfT df A
3.F 分布及 F 检验 ●F 分布——在一个 N(μ ,δ 2)总体中,随机抽取两个容量分
S 别为 n1 和 n2 的独立随机样本,其方差分别为 12 和
S 22
自交系号 1 2 3 4 2.21 1.40 1.65 1.42 叶球重(kg) 2.00 1.26 1.94 1.66 1.90 0.90 1.44 1.21 1.95 1.08 1.51 1.61 2.14 0.97 1.78 1.36 Ti 10.20 5.61 8.32 7.26 T=31.39
„ „ „ „ „ „
x1j x2j
„ „ „ „ „ „
x1m x2m
T1 T2
x1
x2
…
…
i
… …
xi1 xi2
…
xij
…
xim
…
Ti
xi
…
xk
…
k
… …
xk1 xk2
…
xkj
…
xkm
…
Tk T
x
1.变异因素的划分 各种生物现象都是一个变异的总体,它构成了试验的总 变异。划分变异因素就是确定总变异是由哪些因素引起的, 也就是将各种可能引起变异的因素逐个从总变异中分出。一 般而言,总变异是由两种因素引起的,一种是试验处理引起 的(处理间变异) ,另一种是取样误差引起的(处理内变异 即误差) 。变异因素的划分必须根据试验目的、设计方法和 资料的性质而定。例如有区组控制的试验,变因除了处理和 误差引起外,还有一部分是区组引起的。
S2 A Se 2 0.7406 21.9763 ** F 0.01 0.0337
F:
FA
dfA=3,dfe=16 时,F0.05=3.24,F0.01=5.29
表 4-4 资料的方差分析表
变 因 自交系 误 差 总变异 Df 3 16 19 SS 2.2218 0.5387 S2 0.7406 0.0337 F 21.9763** F0.05 3.24 F0.01 5.29
第四章
方差分析
●方差分析(analysis of variance) 方差分析,也称为变量分析,1923 年由 K.A.Fisher 提出。它可以解决试验中多个处 理的平均数之间差异显著性检验问题。它的应用非常广泛。它是在划分变异因素的基础 上,再计算各个变异因素的方差,从而进行方差比较的一种统计检验方法。
[ 2 ( x ij x i )( x i x ) 2 ( x ij x i ) ( x i x ) 0]
SST ( xij x ) 2
2 xij
( xij ) 2 km
2 xij C
( xij ) 2 C km
2
F
n1 2 2
y( F ) n2 2 n2 2 ( )! ( )! (n1 F1 n2 2 2
●F 分布的形状
n1 n2 ) 2
n1=1 或 2 时,曲线严重倾斜呈反丁型 n1≥3 时,曲线转为偏斜分布,有高峰
●F 检验 F 检验的条件: 变量 x 遵从正态分布 N(μ ,δ 2)
S12
和S 2 彼此独立
2
F 检验:Ho:μ 1=μ 2=„=μ
k
F
2 SA 2 Se
当 F≥Fα 时,否定 H0,说明被检验的多个样本中,至少有两个 之间的差异是显著的或极显著的。 当 F<Fα 时,肯是 H0,说明多个样本之间无显著性差异
Fα 的自由度组合为: A,dfe) (df
●方差分析模式表 表 4-2 变 因 df k-1 k(m-1) Km-1 SS
●平方和的计算 据平方和的定义及模式表,有: SS T ( xij x ) 2 ( xij xi xi x ) 2 [( xij xi ) ( xi x )] 2 ( xij xi ) 2 ( xi x ) 2 2 ( xij xi )( xi x ) ( xij xi ) 2 m ( xi x ) 2 SS e SS A (i 1, , k;j 1, , m) 2, 2,
,其比值用 F 表示,即:
2 S1 F 2 S2
如果按上述样本容量(或自由度)组合重复抽样,将会得到 一系列 F 值,这些 F 值的分布就叫作该自由度组合下的 F 分布。 那么在不同的自由度组合下就形成不同的 F 分布。 分布是衍生 F 总体。
●F 分布的概率密度函数
n1 n1 n2 2 ( )! n12 n2 n22
2S 2 n
2 2 Se n
df dfe dfT df A n1 n2 nk k k (n 1)
(n1=n2=„nk=n)
●●实例:表 4-3 资料的多重比较
LSD .05 t0.05 SD 2.12 0
LSD0.01 t0.01 S D 2.92
结论:4 个自交系中至少有 2 个自交系间差异极显著。
4.多重比较(multiple comparisons) 在 F 检验显著的基础上,须对各样本的平均值之间进行相 互比较,以确定哪些平均值之间有差异,哪些平均值之间无差 异,为选择最优处理(水平)提供依据。对不同平均值之间的 差异显著性同时进行比较,数理统计上称为“多重比较” 。 多重比较常用的方法有 3 种。 ●最小显著性差数法(least significant difference,即 LSD 法)
x2 C
SS A m ( xi x ) 2 m[ xi2 m xi2 ( xi ) 2 ] k ( xi ) 2 m k
2
xij m m
( xij ) 2 m
xij m m k
表 4-1 资料的方差分析表 S2
S
2 A
F
S2 F A 2 Se
F0。05
F0。01
处理 误差 总变异
SSA SSe
(dfA,dfe) (dfA,dfe)
2 Se
●实例:从青种平头甘蓝中选出 4 个自交系,从每个自交系中随机取 5 个 叶球称其重量。测验 4 个自交系叶球重量的差异显著性。 表 4-3 4 个甘蓝自交系叶球的重量(kg)
2 0.0337 0.25 5
2 0.337 0.34 5
(df=dfe=16,0.05=2.12) t (df=dfe=16,0.01=2.92) t
自交系 1 3 4 2
表 4-5 表 4-3 资料的 LSD 法检验结果 平均产量x i xi -1.122 xi -1.452 xi (kg)
∴ tα ·SD 称为最小显著性差数,用 LSDα 表示,即 LSDα = tα ·SD 当α =0.05 时,LSD0.05=t0.05·SD 称为 5%最小显著性差数 当α =0.01 时,LSD0.01=t0.01·SD 称为 1%最小显著性差数 当
x1 x 2
当
x1 x 2
≥LSD0.05 时,
●最小显著性极差法(least significant ranges,即 LSR 法) ●●它是采用平均数间的极差值在一定概率保证 下所算得的最小值即最小显著性差数 (LSRα ) 进行多 重比较的。不同平均数间极差所包含的平均数个数 (k)不同,最小显著性差数(LSRα )值亦不同。
●●LSR 法之 q 法 原理:由于 q 即: x1
一、方差分析的基本原理(以样本容量相等的单向分组资料为模式)
设因素 A 共有 k 个处理(水平) ,各处理均有 m 个观察值,则该资料共有 km 个观 察值。 表 4-1 单向分组资料模式表 处理号(组) 观察值(x ) 总和(T ) 平均 ( x i )
ij i
1 2
x11 x12 x21 x22
●●在一定的概率保证下,计算出任何两个平均值间差异显著的最小差数标准即最 小显著性差数(LSD) ,并以此为标准对任何两个平均值之间的差数进行比较,作出显 著性判断。 原理:∵当 t
x1 x 2 ≥tα SD
(α =0.05,0.01)
x 即: x1 x2 ≥tα ·SD 时, x1 - 2 的差异显著(或极显著) 。
x1 x 2 ≥qα SE
α
x2 ≥q
·SE
所以 x1 x 2 之间的差异显著或极显著。qα ·SE 称为最小显著 性极差值,用 LSRα 表示,即:LSRα =qα ·SE LSR0.05 称为 5%的最小显著性极差,LSR0.01 称为 1%最小显 著性极差。 SE 的计算:
S E S x S e n df df e
xi
2.040 1.122 1.664 1.452
x
Baidu Nhomakorabea=31.39
x
=1.5695
变因 自交系(A) 误差(e)
31 .39 2 SS: SS T x C ( 2.21 2.00 1.36 ) 20 2.7605
2 2 2 2
Ti 2 10.20 2 5.612 8.32 2 7.26 2 31.39 2 SS A C 2.2218 m 5 20
2 Se n
n 为样本容量 2 Se 误差的方差
实例: 表 4-6 qα 和 LSRα 2 q0.05 q0.01 LSR0.05 LSR0.01
Sx
表 4-3 资料的 q 法检验之 LSRα 值 k 3 3.65 4.78 0.300 0.392
0 .0337 0 .0821 5
2.040 1.664 1.452 1.122 0.918** 0.542** 0.330* 0.588** 0.212
-1.664 0.376**
结论:自交系 1 与 3、4、2 之间的差异均达极显著水平;3、4 显 著优于 2;3 与 4 之间差异不显著。 ●●LSD 法应用的条件 当多个处理都和一个对照(CK)比较时才可应用此法。
4 4.05 5.19 0.333 0.426
3.00 4.13 0.246 0.339
2 Se n
表 4-7 表 4-3 资料的 q 法检验结果 自交系 1 3 4 2