第六章方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2se( 2 LSD检验)
x
n0
x1 x2
n0
第三节双因素方差分析
1、试验指标:衡量试验结果的标准 2、因素(factor):也叫因子,是指对试验指标有影响,在研究中加以(控制)考虑的试验
4
条件。 3、可控因子:在试验中可以人为地加以调控的因子浓度、温度等 4、非控因子:不能人为调控的因素(气象、环境等) 5、固定因素:指因素的水平是经过特意选择的 6、随机因素:指因素的水平是从该因素水平总体中随机抽出的样本 7、水平(level):每个因素的不同状态(从质或量方面分成不同的等级) (因素是一个抽象的概念,水平则是一个较为具体的概念) 8、处理:指对试验对象施以不同的措施(对单因素试验而言,水平和处理是一致的,一个 水平就是一个处理;对多因素试验而言,处理就是指水平与水平的组合) 9、固定效应(fixed effect):由固定因素所引起的效应。 10、随机效应(random effect):由随机因素引起的效应。 11、二因素方差分析:是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。 12、固定模型:二因素都是固定因素 13、随机模型:二因素均为随机因素 14、混合模型:一个因素是固定因素,一个因素是随机因素 15、主效应(main effect):各试验因素的相对独立作用 16、互作(interaction):某一因素在另一因素的不同水平上所产生的效应不同。 17、因素间的交互作用显著与否关系到主效应的利用价值 如果交互作用不显著,则各因素的效应可以累加,各因素的最优水平组合起来,即为最优的 处理组合。 如果交互作用显著,则各因素的效应就不能累加,最优处理组合的选定应根据各处理组合的 直接表现选定。有时交互作用相当大,甚至可以忽略主效应。 二因素间是否存在交互作用有专门的统计判断方法,有时也可根据专业知识判断。 (一)无重复观测值的二因素方差分析 依据经验或专业知识,判断二因素无交互作用时,每个处理可只设一个观测值,即假定 A 因素有 a 各水平,B 因素有 b 个水平,每个处理组合只有一个观测值。
二、对多个处理进行平均数差异显著性检验时,采用 t 检验法的缺点:
(1)检验过程烦琐。 (2)无统一的试验误差,误差估计的精确性和检验的灵敏性低。 (3)推断的可靠性低,检验时犯α错误概率大。
三、试验指标(experimental index):
为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。常用的 试验指标有:身高、体重、日增重、酶活性、DNA 含量等等。
2
1.固定模型与随机模型的比较
1. 两者在设计思想和统计推断上有明显不同,因此进行方差分析时的公式推导也有所不同。其平方和与 df 的分解公式没有区别,但在进行统计推断时假设检验构成的统计数是不同的。
2. 模型分析的侧重点也不完全相同,方差期望值也不一样,固定模型主要侧重于效应值的估计和比较,而 随机模型则侧重效应方差的估计和检验 3. 对于单因素方差分析来说,两者并无多大区别 (三)混合模型(mixed model):指多因素试验中既有固定因素又有随机因素时所用的模型. 在实际应用中,固定模型应用最多,随机模型和混合模型相对较少
平方和
处理间平均数n 的差异是由处理效应引起的:
(xi
x)
处2(理xi内的x变) 异是(x由随x机i )误差0引起: (x xi )
1
略
方差分析表
平方和
自由度
方差
处理间 处理内 总变异
SSt
1 n
Ti 2 C
dft k 1
SSe SST SSt
dfe k(n 1)
SST x2 C
(三)平方和与 df 的分解
方差是离均差平方和除以自由度的商
2
2 (x )2 ; s2 (x x)
N
n 1
方差分析的基本思想 引起观测值出现变异分解为处理效应的变异和试验误差的变异。
要把一个试验的总变异依据变异来源分为相应的变异,首先要将总平方和和总 df 分解为各个变异来源的的
相应部分。
均方
F
处理间
Ti2 C
ni
k-1
st2
F
st2 se2
误差或处理内 SSe
∑ni-k
se2
总和
SST
∑ni-1
在作多重比较时,首先应计算平均数的标准误。由于各组内观测次数不等,因此应需先算得
各 ni 的平均数 n0 :
(各个处理的样本容量)
n0
2 ni
ni2
ni k1
s se2 (LSR检验)或s
1
1.方差分析的基本思想
处理效应
总变异
试验误差
2.方差分析的目的
确定各种原因在总变异中所占的重要程度。 处理效应 相差不大,应比试验误差大得多,说明试验处理影响是很大的,不可忽视。
3.方差分析的用途
1. 用于多个样本平均数的比较 2. 分析多个因素间的交互作用 3. 回归方程的假设检验 4. 方差的同质性检验
6
(1)平方和的分解:
C T2 abn
SST
2
( xijk x)
x2 C
SSA bn
2
(xi x)
Ti. 2 C bn
SSB an
2
(x j x)
T. j 2 C an
SSAB n
2
( xij xi. x. j x)
Tij2 n
C
SSA
SSB
六、试验处理(treatment):
事先设计好的实施在实验单位上的具体项目就叫试验处理。如进行饲料的比较试验时,实施在试验单位 上的具体项目就是具体饲喂哪一种饲料。
七、试验单位( experimental unit ):
在实验中能接受不同试验处理的独立的试验载体叫试验单位。一只小白鼠,一条鱼,一定面积的小麦等 都可以作为实验单位。
四、试验因素( experimental factor):
试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;若 同时研究两个或两个以上因素对试验指标的影响时,则称为两因素或多因素试验。
五、因素水平(level of factor):
试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如研究 3 个品种奶牛产奶量的高低, 这 3 个品种就是奶牛品种这个试验因素的 3 个水平。
方差分析所得到的结论只适合于选定的那几个水平,并不能将其结论扩展到未加考虑的其它水平上。 (二)随机模型(random model):指各处理的效应值τi 不是固定的数值,而是由随机因素所引起的效应。 这里τi 是一个随机变量,是从期望均值为 0,方差为σ2 的标准正态总体中得到的随机变量。得出的结论 可以推广到多个随机因素的所有水平上。 在随机模型中,水平确定之后其处理所产生的效应并不是固定的,试验重复时也很难得到相同的结果 方差分析所得到的结论,可以推广到这个因素的所有水平上
是指在 k 组处理中,每一处理皆含有 n 个观测值,其方差分析方法前面已做介绍,这里以方
差分析表的形式给出有关计算公式:
变异来源
平方和
自由度
均方
F
处理间
SSt
误差或处理内 SSe
总和
SST
k-1
st2
k(n-1)
se2
nk-1
F st2 se2
(2)组内观测次数不相等的方差分析
变异来源
平方和
自由度
SS AB df AB
se 2
SSe dfe
(4)F检验
(a)固定模型
FA
s
2 A
se2
;FB
sB2 se2
;FAB
s
2 AB
se2
(b)随机模型
FAB
s
2 AB
se2
;FA
s
2 A
s
2 AB
;FB
sB2
s
2 AB
(c)混合模型(A固定B随机)
FA
s
2 A
s
2 AB
;FB
s
2 B
se2
;FAB
s
2 AB
SSe
2
(xijk xij ) SST SS A SSB SS AB
(2)自由度分解
dfT abn 1 df A a 1 dfB b 1 df AB (a 1)(b 1) dfe ab(n 1) (3)各项的方差分别为
sA2
SS A df A
sB 2
SSB df B
s AB 2
第六章 方差分析
一、方差分析(Analysis of variance,ANOVA):
又叫变量分析,是英国著名统计学家 R . A . Fisher 于 20 世纪提出的。它是用以检验两个或多个均数间 差异的假设检验方法。它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。 方差分析的基本功能:对多组样本平均数差异的显著性进行检验
(二)具有重复观测值的二因素方差分析 具有重复观测值的二因素试验的典型设计是:假定 A 因素有 a 水平,B 因素有 b 水平,则每 一次重复都包括 ab 次实验,设试验重复 n 次,资料模式在 p98 因试验共有 n 次重复,试验的总次数为 abn 次。方差分析步骤和前面介绍的相类似,唯一不 同的是 F 检验的方法。 154
7
实际分析时,可将三因素试验数据列成三个两向表(A、B 因素组合,B、C 因素组合,A、C 因素组合),把三因素方差分析化为二因素方差分析。因此可以计算出 SSA、SSB、SSC、SSAB、 SSBC、SSAC,其中 SSA、SSB、SSC 不需要重复计算。
(二)数学模型
假定有 k 组观测数据,每组有 n 个观测值,则共有 nk 个观测值
用线性模型(linear model)来描述每一观测值: xij =μ + τi +εij (i=1,2,3…,k j=1,2,3…,n) μ -总体平均数;τi -处理效应;εij -试验误差 xij -是在第 i 次处理下的第 j 次观测值 要求εij 是相互独立的,且服从标准正态分布 N(0,σ2 )
dfT ab 1 dfA a 1 dfB b 1 dfe (a 1)(b 1) (3)各项的方差分别为
s
2 A
SSA df A
sB2
SSB dfB
se 2
SSe dfe
(4)F值得计算
FA
s
2 A
se2
FB
s
2 B
se2
无重复观测值的二因素方差分析,所估计的误差实际上是这两个因素的相互作用,这是在两 个因素不存在互作,或互作很小的情况下进行估计的。 但是,如果存在两个因素的互作,方差分析中就不能用互作来估计误差,必须在有重复观测 值的情况下对试验误差进行估计。
se2
第四节多因素方差分析(n) 实际工作中,往往需要考察三个或多个因素的效应。这相当于把二因素方差分析扩展到一般 情况。如在一个试验中,A 因素有 a 水平, B 因素有 b 水平, C 因素有 c 水平等,假设每 一处理都有 n 次重复,那么总观测次数为 abcn 次。本节仅对三因素的情况进行分析。
5
(1)平方和的分解
C T2 ab
SST
2
(xij x)
x2 C
SSA b
2
(xi. x)
Ti. 2 C b
2 SSB a (x. j x)
T. j 2 C a
SSe
2
(xij xi. x. j x) SST SSA SSB
(2)与平方和相应的自由度
八、重复(repetition):
在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单 位数称为处理的重复数。例如,用某种饲料喂 4 头猪,就说这个处理(饲料)有 4 个重复。
第一节 方差分析的基本原理 方差:又叫均方,是标准差的平方,是表示变异的量。在一个多处理试验中,可以得出一系列不同的观测 值。 观测值不同的原因:处理效应(treatment effect):处理不同引起;试验误差:试验过程中偶然性因素的 干扰和测量误差所致。
对于由样本估计的线性模型为: xij =x + ti +eij x -样本平均数;ti -样本处理效应;eij -试验误差 根据的τi 不同假定,可将数学模型分为以下三种:固定模型;随机模型;混合模型
(一)固定模型(fixed model):指各个处理的效应值τi 是固定值,各个的平均效应τi = μi - μ是一 个常量,且∑τi =0。就是说除去随机误差以后每个处理所产生的效应是固定的。 实验因素的各水平是根据试验目的事先主观选定的而不是随机选定的。 在固定模型中,除去随机误差之后的每个处理所产生的效应是固定的,试验重复时会得到相同的结果
dfT nk 1
st 2
SSt dft
se 2
SSe dfe
C T2 nk
3
第二节 单因素方差分析 90
在试验中所考虑的因素只有一个时,称为单因素实验。单因素方差分析是最简单的一种,它 适用于只研究一个试验因素的资料,目的在于正确判断该试验因素各处理的相对效果(各水 平的优劣).
(1)组内观测次数相等的方差分析