第九章 双因素和多因素方差分析
第九章 双因素完全随机设计
第二节 两因素实验资料的方差 分析
两因素实验资料的方差分析是指对实验指
标同时受到两个实验因素作用的实验资料的方 差分析。两因素实验按水平组合的方式不同, 分为交叉分组和系统分组两类,因而对实验资 料的方差分析方法也分为交叉分组方差分析和
系统分组方差分析两种
一、交叉分组资料的方差分析 设实验考察A、B两个因素,A因素分a个水平,B 因素分b个水平 。 所谓交叉分组是指A因素每个水平与 B因素的每个水平都要碰到 ,两者交叉搭配形成ab个水 平组合即处理 ,实验因素A 、B在实验中处于平等地 位 。 实验单位分成 ab 个组,每组随机接受一种处理 ,
互作用。
(二)两因素有重复观测值实验的 方差分析
A1 1 x111
A2 x211
··· ···
A
a
xa11
xa12 · · · xa1n μ
a1
数 据 的 一 般 模 式
B1
2
· · · n
x112
x11n μ
11
x212
x21n μ
21
···
· · ·
· · ·
···
1 B2 · · ·
x121 · · ·
(二)设计的基本特点
1.从设计条件:
• 研究中有两个自变量,每个自变量有两个或多个水
平
2.设计的方法
随机分配实验单元接受实验处理的结合,每个 实验单元接受一个实验处理的结合。
三.两因素完全随机实验设计与计算 举例
• 例:为提高粒粒橙饮料中汁胞的悬浮稳 定性,研究了果汁PH值(A)、魔芋精 粉浓度(B)两个因素的不同水平组合对 果汁黏度的影响。果汁PH值取3.5, 4.0,4.5三个水平,魔芋精粉浓度 (%)取0.1,0.15,0.2三个水平, 每个水平组合重复2次,进行完全随机化 实验。实验指标为果汁黏度(CP),越
方差分析2(双因素方差分析、多元方差分析、可视化)
⽅差分析2(双因素⽅差分析、多元⽅差分析、可视化)1 双因素⽅差分析1.1 双因素⽅差分析的实战dat<-ToothGrowthdatattach(dat)table(dat$supp,dat$dose)aggregate(len,by=list(dat$supp,dat$dose),FUN=mean)解释:根据投⽅式(橙汁OJ,维C素VC)supp和剂量dose来对⽛齿的长度len进⾏求均值dose<-factor(dose)解释:为了避免把dose变量认为是数值变量,⽽是把dose认为成分组变量,所以设置成因⼦类型factorfit<-aov(dat$len~dat$supp*dat$dose)解释:aov()做⽅差分析,把 + 换成了 * ,这两项dat$supp和dat$dosee就变成了交互项summary(fit)结果分析:可以看出P值很⼩,三个P值都⼩于0.05,说明不同的投喂⽅式supp对⽛齿的⽣长长度len是有显著影响的;说明不同的剂量dose对⽛齿的⽣长长度len是有显著影响的;说明在两种投喂⽅式下,不同的投喂⽅式supp和剂量dose的交互效应对⽛齿的⽣长长度len是有显著影响的1.2 可视化⽅法1interaction.plot(dat$dose,dat$supp,dat$len,type = "b",col=c("red","blue"),pch=c(16,18),main="XX")1.3 可视化⽅法2library(gplots)plotmeans(dat$len~interaction(dat$supp,dat$dose,sep=" "),connect=list(c(1,3,5),c(2,4,6)),col=c("red","blue"),main="XX",xlab="xlab")1.4 可视化⽅法3library(HH)interaction2wt(dat$len~dat$supp*dat$dose)2 重复测量⽅差分析dat<-CO2CO2$conc<-factor(CO2$conc)w1b1<-subset(CO2,Treatment=="chilled")uptake是植物光合作⽤对⼆氧化碳的吸收量,是因变量y,type是组间因⼦,是互斥的,表⽰的是两个不同地区的植物类型,要么是加拿⼤的植物,要么是美国的植物,不可能两个地⽅都是,conc是不同的⼆氧化碳的浓度,每⼀种植物都在所有的⼆氧化碳浓度下,所以conc是组内因⼦研究不同地区的植物作⽤,在某种⼆氧化碳的浓度作⽤下,对植物的光合作⽤效果有没有影响2.1 含有单个组内因⼦w和单个组间因⼦B的重复测量ANOVAfit<-aov(uptake~conc*Type+Error(Plant/(conc)),w1b1)summary(fit)结果分析:⼆氧化碳浓度和类型对植物光合作⽤都有显著影响2.2 可视化图形呈现(1)⽅式⼀par(las=2)par(mar=c(10,4,4,2))with(w1b1,interaction.plot(conc,Type,uptake,type = "b",col=c("red","blue"),pch=c(16,18)))(2)⽅式⼆boxplot(uptake~Type*conc,data=w1b1,col=c("red","blue"))3 多元⽅差分析library(MASS)attach(UScereal)dat<-UScerealshelf<-factor(shelf)y<-cbind(calories,fat,sugars)fit<-manova(y~shelf)summary(fit)结果分析:不同的货架shelf上,⾷物的热量calories,脂肪含量fat和含糖量sugars是⾮常显著不同的3.1 多元正态性center<-colMeans(y)n<-nrow(y) #⾏数p<-ncol(y) #列数cov<-cov(y) #计算⽅差d<-mahalanobis(y,center,cov)coord<-qqplot(qchisq(ppoints(n),df=p),d) #画图abline(a=0,b=1) #画参考线identify(coord$x,coord$y,labels = s(UScereal)) #给出交互式标出离群点3.2 稳健多元⽅差分析install.packages("rrcov")library(rrcov)wilks.test(y,shelf,method="mcd")结果分析:P值⼩于0.05,说明结果是显著性的,即不同货架上⾷物的热量calories,脂肪含量fat和含糖量sugars是⾮常显著不同的4 ⽤回归来做ANOVAlibrary(multcomp)dat<-cholesterollevels(dat$trt)fit.aov<-aov(response~trt,data=dat)summary(fit.aov)结果分析:aov⽅差分析,trt对response的影响⾮常显著fit.lm<-lm(response~trt,data=dat)summary(fit.lm)结果分析:lm回归分析,trt对response的影响⾮常显著,并且trt的每⼀项都显⽰出来了。
第九章双因素和多因素方差分析
第九章双因素和多因素方差分析引言方差分析是一种常用的统计方法,用于比较两个或多个组之间的差异。
双因素和多因素方差分析是方差分析的扩展,允许考虑两个或多个自变量对因变量的影响。
本文将介绍双因素和多因素方差分析的概念、假设检验、模型构建等内容。
双因素方差分析双因素方差分析主要用于对两个自变量对因变量的影响进行分析。
其中一个自变量称为因子A,另一个自变量称为因子B。
通过双因素方差分析,我们可以了解到两个自变量对因变量的主效应以及交互效应。
假设检验进行双因素方差分析时,我们需要对两个自变量的主效应和交互效应进行假设检验。
主效应是指每个因子对因变量的影响,交互效应是指两个因子之间是否存在相互影响。
在进行双因素方差分析时,我们需要提出以下假设:•零假设H0: 两个因子对因变量没有主效应和交互效应•备择假设H1: 至少一个因子对因变量有主效应或交互效应然后,我们可以通过方差分析结果的显著性检验来判断是否拒绝零假设。
模型构建双因素方差分析可以通过构建线性模型来进行。
通常,我们使用以下模型进行双因素方差分析:Y = μ + α + β + (αβ) + ε其中,Y表示因变量,μ表示总体均值,α表示因子A的主效应,β表示因子B的主效应,(αβ)表示交互效应,ε表示误差。
通过对数据进行拟合并计算模型中的各个参数,我们可以得到双因素方差分析的结果。
多因素方差分析多因素方差分析是对多个自变量对因变量的影响进行分析。
多因素方差分析可以包含两个以上的自变量,并且可以考虑每个自变量的主效应和交互效应。
假设检验进行多因素方差分析时,我们同样需要对每个自变量的主效应和交互效应进行假设检验。
假设检验的步骤与双因素方差分析类似。
模型构建多因素方差分析的模型构建与双因素方差分析类似,但是需要考虑多个自变量的影响。
Y = μ + α1 + α2 + … + αn + β + (αβ) + ε其中,Y表示因变量,μ表示总体均值,α1, α2, …, αn表示各个自变量的主效应,β表示交互效应,(αβ)表示两个或多个自变量之间的交互效应,ε表示误差。
两因素及多因素方差分析
第4页/共50页
③ 交互作用(互作,interaction)
在多因素试验中, 一个因素的作用要受到另一个因素的影 响,表现为某一因素在另一因素的不同水平上所产生的效应 不同,或者说,某一因素的简单效应随着另一因素水平的变
化而变化时,则称该两因素存在交互作用。
A1
B1
470
B2
480
B2-B1
10
平均
第23页/共50页
二 两因素单独观察值试验的方差分析
A、B两个试验因素的全部ab个水平组合
中,每个水平组合只有一个观察值,全部试 验共有ab 个观察值。其数据模式如表11—2 所示。
第24页/共50页
交 叉 分 组
A 因素 B1
B 因素
合计 平均
B2 … Bj … Bb
xi.
xi .
两
A1 x11 x12 … x1j … x1b x1 . x1.
SST=SSA+SSB+SSe dfT=dfA+dfB+dfe 各项平方和与自由度的计算公式为:
矫正数 C=x2../ab
总平方和
ab
ab
SST
(xij x..)2
xi2j C
i1 j 1
i1 j 1
A因素平方和
a
SS A b
i 1
(xi . x..)2
1 b
a i 1
xi2. C
表11-1日粮中加与不加赖、蛋氨酸雏鸡增重(g)
A1
B1
470
B2
480
B2-B1
10
平均
475
A2
A2-A1
平均
472
2
第九章 方差分析
第九章方差分析方差分析是从方差的角度,研究各有关因素对试验结果影响大小的有效方法.从数理统计的角度来看,方差分析是通过比较总体方差的各种估计量之间的差异,来分析等方差的正态总体是否具有相同的均值.称之为方差分析的原因,是在显著性检验中所用统计量的分子、分母都是总体方差的估计量.试验中,将要考察的指标称为试验指标或响应值,试验指标值的全体构成我们所关注的总体;影响试验指标的条件称为因素,因素所处的状态称为该因素的水平.如果试验仅考虑一个因素,则称为单因素试验,否则称为多因素试验.可能有多个因素影响试验指标,但总是取少数重要因素进行研究.在方差分析中,通常取1-3个因素进行研究.因素的水平可以是数量化的,也可以是定性的.例如要研究几个不同的小麦品种间产量的差异时,考虑的因素是品种,而每个水平便是一个小麦品种,是定性的水平;而在研究氮肥施用量对小麦产量的影响时,水平(氮肥施用量)则是数量化的.方差分析只研究各个水平对试验指标的影响是否显著,并不给出各水平的影响程度.因此,方差分析是定量地估计各因素对试验指标的影响的工具.9.1 单因素方差分析先看一个实例.例1 在饲养条件尽可能相同的条件下,检验某种激素对羊羔增重的效应.选用3个剂量进行试验,加上对照(不用激素)在内,每次试验要用4只羊羔,若进行4次重复试验,则共需要16只羊羔.一种常用的试验方法,是将16只羊羔随机分配到16个试验单元.这种方法被称为完全随机设计,在试验单元间的试验条件很一致的情况下,这种设计最为有效.经过200天的饲养后,各羊羔的增重数量(单位:kg)见表9.1.表9.1 各羊羔的增重数量(kg/每头/每200d)- 204 -- 205 -本例中,试验指标是羊羔的增重数量,只有1个因素——激素,为单因素试验.激素的4个剂量(含对照)构成因素的4个水平.单因素方差分析用于分析单因素试验中,各个水平对试验指标的影响是否显著.为叙述单因素方差分析问题,再看一个实例.例 2 一批由同种原料织成的同一种布,用不同染整工艺处理,然后进行缩水率试验,考察染整工艺对缩水率的影响,在其它条件尽可能相同时,测得缩水率(%)如表9.2所示.的染整工艺处理后,缩水率的全体构成的集合,假定2~(,)X N μσ.所考察的因素是染整工艺A ,5种不同的染整工艺A 1,A 2,…A 5为因素的5个水平,假定水平i A 下的样本来自相互独立且等方差的正态总体2~(,)(1,2,5)i i X N i μσ= ,它们都是总体X 的特款.就该批布中的任意4块分别考察5个水平上的缩水率,看作是4次重复试验.令i i αμμ=-,则αi 反映了水平A i 对缩水率的影响.由于x ij 是来自2~(,)i i X N μσ的样本,于是i j i i j i i j x μεμαε=+=++ (i =1,2,…,5;j =1,2,…,4).这里,εij 表示观测过程中各种随机影响引起的随机误差;εij 相互独立,服从均值为0,方差为σ2(未知)的正态分布.考察五个水平对缩水率的影响是否差异显著,即要检验假设012345:0H ααααα===== (9.1)一般地,设总体2~(,)X N μσ,因素A 有k 个水平A 1,A 2,…,A k .今对第i 个总体进行n i 次重复观测(i =1,2,…,k ),得到表9.3中的观测数据.- 206 - 表9.3 单因素方差分析数据表假定水平i A 下的样本来自相互独立、方差相同的正态总体2~(,)i i X N μσ(1,2,)i k = .令i i αμμ=-,则αi 反映了水平A i 对试验指标的影响.于是有i j i i j i i j x μεμαε=+=++(1,2,,;1,2,,)j i k j n == (9.2)其中,εij 表示试验观测过程中各种随机影响引起的误差;εij 相互独立,服从均值为0,方差为σ2(未知)的正态分布.称(9.2)为单因素方差分析的数学模型.令n = n 1 + n 2 + … + n k , (9.3)表示观测数据总数,不难证明111,0.kki i ii i n n μμα====∑∑单因素方差分析是要考察各个水平对试验指标影响的差异是否显著.因此,要检验的统计假设为012:0k H ααα==== (9.4)即检验观测数据x ij 是否来自k 个相同的总体.记11,in i ij i i j ix x x x n ⋅⋅⋅===∑, (9.5) 1111,in kkij i i j i x x x x x n⋅⋅⋅⋅⋅======∑∑∑, (9.6) 则i x ⋅为总体A i 的样本均值,x 为总样本的均值.(9.5)式与(9.6)式中的圆点表示已经求过和的指标,下同.令211()in k t ij i j S x x ===-∑∑, (9.7)211()in ke ij i i j S x x ⋅===-∑∑, (9.8)- 207 -21()kA i i i S n x x ⋅==-∑. (9.9)称S t 为总离差平方和,它反映了观测数据总的变异程度;显然,i x ⋅是i μ的无偏估计,又ij ij i x εμ=- ,于是ij ij i e x x ⋅=-是误差εij 的无偏估计.因此,称S e 为误差平方和或组内平方和,它反映了随机误差εij 对试验指标影响的总和;S A 是水平i A 的平均i x ⋅与总平均x 的离差平方和,其中系数i n 是对水平i A 上观测次数的体现.因此,A S 反映了因素A 的各水平i A 的均值间的差异程度,称A S 为因素平方和或组间平方和.由于2112112211111122111111()[()()]()2()()()()()2()()(ii ii iiiin kt ij i j n kij i i i j n n n kk k ij i ij i i i i j i j i j n n n kk kij i i i ij i i j i j i j i S x x x x x x x x x x x x x x x x x x x x x x x ==⋅⋅==⋅⋅⋅⋅======⋅⋅⋅⋅=======-=-+-=-+--+-=-+-+--=∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑221111)()iin n kkj i i i j i j x x x ⋅⋅====-+-∑∑∑∑于是有平方和分解公式:S t =S A +S e . (9.10) 其意义在于将因素平方和S A 与误差平方和S e 从总平方和S t 中分解出来.在各ij ε相互独立地服从N (0,σ2)分布的前提下,当假设(9.3)成立时,模型(9.2)变为i j i j x με=+(1,2,,;1,2,,)i i k j n == (9.11)即所有观测数据来自同一正态总体N (μ, σ2) ,于是由第六章(6.10)式知22/~(1)t S n σχ-.令21(),1,2,,in i ij i j S x x i k ⋅==-=∑- 208 -则/(1)i i S n -是来自总体i X 的样本方差,于是2/i S σ服从自由度为1i n -的χ2分布.而S e /σ2 =(S 1 + S 2 + …+S k ) /σ2,由12,,,k X X X 的独立性假定,知S 1,S 2,…,S k 相互独立.由χ2分布的可加性,知22/~()e S n k σχ- (9.12)至于A S 的分布性质,我们不假证明地给出如下定理: 定理1 (1) A S 与e S 相互独立;(2) 当假设(9.4)成立时,22/~(1)A S k σχ-.若用t f ,A f ,e f 分别表示t S ,A S ,e S 的自由度,由上述讨论得到t A e f f f =+ (9.13)称(9.13)为自由度分解公式.为了检验假设(9.4),取)/()1/(k n S k S F e A --=(9.14)当假设(9.4)成立时,由(9.12)及定理1,有~(1,)F F k n k -- (9.15)给定显著性水平α(0<α<1),查F 分布表得到自由度为(k -1, n -k )的F 分布临界值F α(k -1, n -k ),从样本算出F 统计量的值F 0,据F 0的大小作如下推断:若F 0 >F α(k -1, n -k )则拒绝假设(9.4),认为某些水平(并非全部)对试验指标的影响有显著差异;若F 0 ≤F α(k -1, n -k )则接受假设(9.4),认为各水平对试验指标的影响无显著差异.通常将单因素方差分析过程归结为如表9.4所示的单因素方差分析表. 为简化计算,还可以对所有观测数据同时加、减或同时乘、除一个非零常数.不难证明,对所有观测数据x ij 同时加、减一个任意常数不影响各平方和的值,同时乘、除以一个非零常数不影响F 统计量的值.即对原始数据x ij 做变换,0ijij x ax b a '=+≠后再进行方差分析,其结果不变.1 23 4计算得到:S A = =208,S e = 646,S t = S A + S e = 854.S A的自由度为k―1=3,S e的自由度为n―k =12.据此,列方差分析表如表9.5.由(9.13)式算出的F值为1.2879,查表得临界值F0.05(3,12)=3.49,从样本算出的F值1.2879远比5%显著水平要求的F值3.49小,因此认为各个处理间没有显著差异.值得注意的是,这并不证明4个处理间没有差异,可能存在真实的差异,但是在所选取的概率水平上,试验没有足够的灵敏度,未能检测出差异.单因素方差分析可在表(9.3)上计算.现对例2进行表格化计算.为便于计算,将表9.2中的各观测数据同减去5,在表9.6中表格化计算(9.14)和(9.15)式右端各项.注意到k i- 209 -- 210 -55.54,34.37,A e S S ==89.91.t A e S S S =+= 据此得到如表9.7所示的方差分析表.0.01F =6.07>4.89,故拒绝假设(9.1),认为染整工艺对缩水率的影响极显著.在方差分析中,仍用* *表示极显著(a≤0.01时显著),用*表示0.01<a≤0.05时显著.在单因素方差分析中,各水平上观测次数n 1,n 2,…,n k 可以不相等.但在实际问题中,多取n 1 = n 2 =…n k ,因为选择同样大小的样本有如下优点:(1)与方差相等的假设的偏离不会过大,方差相等的检验比较容易;(2)F 检验时出现的第二类错误变小;(3)均值的其它比较(参阅§9.3)较为简单.9.2 双因素方差分析在双因素方差分析中,假定试验指标受两个变异因素A 、B 的影响,并假定行因素A 有m 个水平A 1,A 2,…,A m ,列因素B 有r 个水平B 1,B 2,…,B r .在每对组合水平(A i , B j )上做一次试验,得到m ×r 个试验结果x ij (i =1,2,…,m ; j =1,2,…,r ).所有ij x 独立,实验数据见表9.8.假定总体2~(,)X N μσ,2~(,)ij ij x N μσ,则11m rij i jmr μμ==∑∑ (9.16) 再假定组合水平(A i , B j )下的效应可以用A i 下的效应i α和B j 下的效应j β之和来表示,即ij i j μμαβ=++其中- 211 -110,0mriii j αβ====∑∑(正负效应相互抵消). 表9.8 双因素方差分析观测数据表1111,,r m A Biij j ij j i r m μμμμ====∑∑则A i μ和B j μ分别表示水平i A和j B 上的总体均值,且有 ,A i i αμμ=-.B j j βμμ=-类似于单因素方差分析,可将双因素方差分析的线性模型表示为(1,2,,;1,2,,)ij i j ij x i m j r μαβε=+++== . (9.17)这里,εij 表示其它随机因素引起的随机误差,εij 相互独立,服从均值为0,方差为σ2(未知)的正态分布.双因素方差分析的检验假设为01120212:0(9.18):0(9.19)m r H H αααβββ====⎧⎨====⎩仍用n = m ×r 表示观测数据总数,记11,(1,2,,)ri ij i i j x x x x i m r ⋅⋅⋅====∑ (9.20)11,(1,2,,)mj ij j j i x x x x i r m⋅⋅⋅====∑ (9.21) 111,m rij i j x x x x n⋅⋅⋅⋅====∑∑ (9.22)- 212 - 21()mA i i S r x x ⋅==-∑ (9.23)21()rB j j S m x x ⋅==-∑ (9.24)211()mre ij i j i j S x x x x ⋅⋅===--+∑∑ (9.25)211()mrt ij i j S x x ===-∑∑ (9.26)则i x ⋅为水平A i 上的样本平均,j x ⋅为水平B j 上的样本平均,x 为总体平均.S A 是因素A 的水平A i 上的样本平均i x ⋅与总体平均x 的离差平方和,若因素A 对响应值影响显著,则至少有一个离差平方(i x ⋅-x )2 较大,从而S A 较大;而当因素A 的影响不显著时S A 较小.因此,S A 反映了因素A 对试验结果的影响.同样,S B 反映因素B 对试验结果的影响.将模型(9.17)写成μμμμμμμμε+--=-+-+-=Bj A i ij B j A i ij ij x x )]()([于是,ij ij i j e x x x x ⋅⋅=--+是εij 的估计值.因此,S e 为误差平方和,它反映了其它随机因素对试验结果的影响.通过简单的推导可以证明下列平方和分解公式:S t = S A + S B + S e , (9.27)定理 2 (1) A S ,B S ,e S 相互独立,且()22/~(1)(1)e S m r σχ--,()22/~1t S mr σχ-;(2) 当假设01H 成立时,22/~(1)A S m σχ-; (3) 当假设01H 成立时,22/~(1)A S m σχ-; 证明略.若用t f ,A f ,B f ,e f 分别表示t S ,A S ,B S ,e S 的自由度,则由定理2得到- 213 -t A B e f f f f =++ (9.28)称(9.28)为自由度分解公式.由定理2,有()/(1)~1,(1)(1)/(1)(1)A A e S m F F m m r S m r -=----- (9.29)显然,F A 越大说明因素A 对试验结果的影响越大.对给定的显著性水平α,查F 分布表得自由度为(m ―1, (m ―1)(r ―1))的F 分布临界值F α,若从样本由(9.29)式算出F A >F α,则拒绝假设H 01,认为因素A 对试验结果有显著影响;否则认为因素A 的影响不显著.类似地,可使用统计量()/(1)~1,(1)(1)/(1)(1)B B e S r F F r m r S m r -=----- (9.30)对因素B 进行显著性检验.若从样本由(9.30)式算出F A >F α,则拒绝假设H 02,认为因素B 对试验结果有显著影响;否则认为因素B 的影响不显著.上述讨论可归结为如表9.9所示的方差分析表.表9.9 双因素方差分析表例3 将土质基本相同的一块耕地分成均等的五个地块,每块又分成均等的四个小区.有四个品种的小麦,在每一地块内随机分种在四个区上,每小区的播种量相同,测得收获量如下表(单位:kg ),试以显著性水平α1=0.05, α2=0.01考察品种和地块对收获量的影响是否显著.解 为计算简单起见,每一收获量均减去32,列表计算.- 214 -注意到m =4,r =5,n =20,经计算得到S A = 134.65, S B = 14.10, S t = 175.03, S e = 26.28,查表得临界值F 0.05(4, 12)=3.26,F 0.01(3, 12)=5.95.由于F B <F 0.05(4, 12),故认为地块不同对收获量无显著影响.由于F A >F 0.01(3, 12),故认为品种不同对收获量影响极显著.9.3 多重比较当假设(9.4)被拒绝后,只能表明在显著水平α下,至少有两个子体的均值间差异显著,并不表示k 个均值之间两两的差异都显著.通常要进一步检验该因素在各水平上的均值两两之间的差异是否显著,以确定哪些水平对响应值有重要影响.我们称这种差异性检验为多重比较.多重比较的方法很多,而且每种方法都有各自的优、缺点.这里,我们介绍适用范围较广的两种方法.一种是Scheffe 方法(S 法),另一种是Tukey 方法(T 法).在进行所有两个均值的同时比较时,如果每次比较的冒险率(犯第一类错误的概率)为α,则S 法和T 法全体冒险率均为α.如果用t 检验进行所有两个均值的同时比较,当均值个数大于2时,尽管每拒绝1个假设所犯的错误都是α,但同时拒绝2个假设所犯的错误是221(1).ααααα+-=-->如果对7个均值进行两两比较,要比较2721C =次.给定拒绝每个假设(i j μμ=,- 215 -1≤i <j ≤7)的冒险率0.10α=,要拒绝所有21个假设,即判明7个均值互不相等所犯的错误将是211(1)0.89α--≈!显然,在使用t 检验进行所有两个均值的同时比较时,全体的冒险率随均值个数的增加而增加.因此,t 检验只能适用于随机抽出的两个均值的比较,并不适用于所有的两个均值的同时比较. 9.3.1 S 法仍用e f 表示误差平方和S e 的自由度,/e e e MS S f =表示均方误差,假定观测数据满足方差分析的基本要求.在单因素方差分析中,Scheffe (1953)给出用于检验假设H 0:μi = μj (1≤i <j ≤k )的统计量i j D S α= (9.31)其中),1()1(e f k F k S --=αα.当||i j i j x x D ->时,则拒绝假设H 0 :μi =μj ,认为水平A i 与水平A j 在显著水平α下差异显著;否则认为A i 与A j 差异不显著.对于双因素方差分析,我们可以分别对每个因素作单因素方差分析,进而进行多重比较.也可以按下述步骤进行近似的S 检验:1 若检验假设A j A i H μμ=:0,则使用统计量ij D S = (9.32) 其中),1()1(e a f m F m S --=α.当||i j ij x x D ⋅⋅->时,则拒绝A j A i H μμ=:0,否则接受H 0.2 若检验假设B j B i H μμ=:0,则使用统计量ij D S α= (9.33) 其中),1()1(e f r F r S --=αα.- 216 - 当||i j ij x x D ⋅⋅->时,则拒绝B j B i H μμ=:0,否则接受H 0.比如在例2中,k = 5, n 1 = n 2 = … = n 5 = 4, f e = 15, MS e = 2.29.取α=0.05,查表得F 0.05(4,15)=3.06.于是由(9.32)及(9.33)得24.1206.34205.0=⨯=S ,)51(74.3)4141(29.224.12≤<≤=+⨯⨯=j i D ij .12||0.025 3.74x x -=<,故μ1与μ2差异不显著. 15|| 3.925 3.74x x -=>,故μ1与μ5差异不显著.14|| 3.35 3.74x x -=<,但与临界值3.74较接近,虽在显著水平0.05下认为μ1与μ4差异不显著,却能看出二者间存在真实的差异.类似地,可对其中任二均值进行比较. 9.3.2 T 法在用T 法进行k 个水平上的均值μ1,μ2,…,μk 之间的两两比较时,要求各水平上的重复数相同,即n 1 = n 2 = … = n k ,并且还要求2cov(,),,1,2,,;i j x x b i j k i j σ==≠ .即i x 与j x 的协方差不依赖于i 和j .T 法所使用的统计量是(,e T q k f α= (9.34) 其中(,)e q k f α是自由度为(,)e k f 的t 化极差分布的上侧α分位点.(,)e q k f α可以从“多重比较的q 表”中查到.S 法无论水平重复数是否相同都适用,T 法只适用于水平重复数相同的情况;在进行所有均值间的两两比较时,T 法比S 法灵敏度高,能检出较小的差异.因此,在水平重复数相同时应当用T 法.9.4 双因素等重复试验的方差分析在双因素试验中,除考察因素A 和B 对试验结果的影响外,还应考虑A 、B- 217 -的各水平的搭配情况对试验结果的影响,称此为A 与B 的交互作用,并把它设想为某一因素,记为A B ⨯.为考虑交互作用A B ⨯,对因素A 、B 的各水平的每一搭配(A i ,B j )都进行l (l ≥2)次重复观测,得到表9.10中的观测数据.表9.10 双因素等重复试验数据记n mrl =,1111m r lijk i j k x x n ====∑∑∑11,,1,2,,;1,2,,.lij ijk ij ij k x x x x i m j r l ⋅⋅⋅=====∑111,,1,2,,.r li ijk i i j k x x x x i m rl⋅⋅⋅⋅⋅⋅=====∑∑ 111,,1,2,,.mlj ijk j j i k x x x x j r ml⋅⋅⋅⋅⋅⋅=====∑∑双因素等重复试验的方差分析计算量较大.其基本原理也是将总的偏差平方和作如下分解:- 218 - 211122111122111()()()()()m r lt ijk i j k mrlmijk ij i i j k i rm rj ij i j j i j e A B A BS x x x x rl x x ml x x k x x x x S S S S ===⋅⋅⋅====⋅⋅⋅⋅⋅⋅⋅===⨯=-=-+-+-+--+=+++∑∑∑∑∑∑∑∑∑∑ (9.35)其中各偏差平方和的表达式如下:2111()m r le ijk ij i j k S x x ⋅====-∑∑∑21()mA i i S rl x x ⋅⋅==-∑21()rB j j S ml x x ⋅⋅==-∑211()m rA B ij i j i j S k x x x x ⨯⋅⋅⋅⋅⋅===--+∑∑e S 为误差平方和,反映了随机误差对试验指标的影响;A S 和B S 分别为因素A 和B 的偏差平方和,分别反映了因素A 和B 对试验结果的影响程度,A B S ⨯为A 与B 的交互作用A B ⨯的偏差平方和.当假设“H A :因素A 对试验结果无显著影响”成立时()/(1)~1,(1)/[(1)]A A e S m F F m mr l S mr l -=---当假设“H B :因素B 对试验结果无显著影响”成立时()/(1)~1,(1)/[(1)]B B e S r F F r mr l S mr l -=---当假设“H AB :交互因素AB 对试验结果无显著影响”成立时()/[(1)(1)]~(1)(1),(1)/[(1)]A B B e S m r F F m r mr l S mr l ⨯--=----检验过程可归纳在如表9.11所示的方差分析表中.立性和等方差性.从理论上讲对上述假定都要通过样本进行统计检验.有关独立性问题,通常是通过试验设计来解决.至于正态性和等方差性,可以根据第八章进行拟合优度检验和Bartlett 检验,还可以对原始数据进行适当的变换,使之满足正态性和等方差性.习 题 九1. 某灯泡厂用四种不同配料方案制成的灯丝,生产了四批灯泡.在每批灯泡中随机地其中(1,2,3,4)i t i =表示第i 批灯泡的寿命.试问(1) 四种灯丝生产的灯泡的使用寿命有无显著差异(0.05α=)? (2) 用S 法比较任意两批灯泡平均寿命之间的差异性(0.05α=).2. 设有三种型号的设备制造同一产品,对每种型号的设备各观测其5天的日产量,数x i 表示第i种型号的设备的日产量.问不同型号的设备生产能力之间是否其中(1,2,3)i有显著差异?3. 为了解3种不同饲料对猪生长影响的差异,用3个品种的猪进行全面搭配试验,3个月后测得9头猪的体重增加量(单位:kg)如下表:试分析饲料之间及猪的品种之间对猪的体重增加有无显著差异.4. 一种火箭使用了四种燃料、三种推进器作射程试验,对于燃料与推进器的每一种搭试检验燃料和推进器对火箭射程是否有显著影响,以及两个因素的交互作用对火箭射程是否有显著影响.- 220 -。
统计学第九章 双因素和多因素方差分析
2、平方和的分解
与平方和相应的自由度分别为: 总自由度:df =abn-1
T
A因素处理间自由度:df =a-1
A
B因素处理间自由度:df =b-1
B
交互作用自由度:df =(a-1)(b-1)
AB
处理内自由度:dfe=ab(n-1) df =df +df +df +dfe
a b i=1 j =1
n
2
SSe= ∑∑∑yijk
i=1 j =1 k =1
a
b
2
1 a b 2 − ∑∑yij• = SST − SSA − SSB − SSAB n i=1 j=1
(五)各项均方的计算
MS
T
SS T SS T = = df T abn − 1
MS
A
SS A SS A = = a -1 df A
x9
x1 x2 x3 x4 x5 x6 x7 x8 33.5** 30.5** 29.75** 22** 19** 11.5 2.75 2.5
x8
31** 28** 27.25** 19.5** 16.5** 9 0.25
x7
30.75** 27.75** 27** 19.25** 16.25** 8.75
A因素误差平方和
SSA = bn∑(yi•• − y••• )
i=1
a
2
B因素误差平方和 SSB = an∑(y• j• − y••• )
b j=1
2
AB交互作用误差平方和
SSAB = n∑∑(yij• − yi•• − y• j• + y••• )
第九章 方差分析
3。计算各部分变异的均方 在方差分析中 ,方差也称为均方,是各部分的离均差平 方和除以其相应的自由度,用MS表示。基 本公式为:MS=SS/ν。 4。计算统计量F值 F值是指两个均方之比。 一般是用较大的均方除以较小的均方。故 F值一般不会小于1。
5。确定P值,推断结论 根据分子ν1,分母 ν2,查F界值表(方差分析用),得到F 值的临界值(critical value),即:如 果F≥F界值,则P≤0.05,在α=0.05水准 上拒绝H0,接受H1。可以认为各样本所代表 的总体均数不全相等。如果想要了解哪两 个样本均数之间有差异,可以继续进行各 样本均数的两两比较。
结论:拒绝H0。四个行业的服务质量有显著差异
用Excel分析
选一批单元格输入原始数据; 选中数据区域,“工具”→“数据分析”;
1.输入数据表;选“工具”→“数据分析 ”→“……‖
1.输入数据表;选“工具”→“数据分 析”→“单因素方差分析”
―单因素方差分析”对话框中:输入区 域,行,输出区域
Ar
X r1 ... X rnr
列和Ti X ij
j 1
ni
T 1
T2
...
Tr
总和 Ti
i 1
r
列平均X i Ti ni
(水平组内平均值)
X1
X2
...
Xr
r
(总平均值)
1 r X ni X i n i 1
其中诸
ni 可以不一样, ni n
i 1
单因素方差分析表
3.处理
处理——指按单因素的各个“水平”条 件或多因素的各个“水平”的组合条件进行 的重复实验。 例如,要研究性别因素对智力发展的影 响,可以从同龄学生中各抽取男女学生50名 参加智力测验。性别因素所分成的两个水平 (男和女)即两种处理。
第九章双因素和多因素方差分析
3 35 53 50 43 38 47 44 55 33 26 29 30
固定因素
本题中显然温度是一个因素,原料种类是另一个因 素。这两个因素各有三个水平。由于它们的影响都是可 控制、可重复的,因此都是固定因素。在同样温度、原 料下所做的几次实验应视为重复,它们之间的差异是由 随机误差所造成的 。
P ❖
171
二、随机模型
1、观察值的线性统计模型
2、提出假设
❖ 3、检验统计量的计算
在F检验时,A因素、B因素主效应的检验统计量是 以MSAB做分母;互作效应的检验统计量以MSe做分母 FA=MSA/MSAB FB=MSB/MAB FAB=MSAB/MSe
用F分布的上尾检验,拒绝域为F>Fα 注意:检验统计量的分母与统计量的第二自由度与固 定效应不同
添加剂 不同条件下大白鼠增量/g
B 添加剂
1
2
3
4
A
1 32,36 28,22 18,16 23,21
2 26,24 29,33 27,23 17,19
3 33,39 30,24 33,37 23,27
4 39,43 31,35 28, 36,34
❖ 该实验有可能属于哪几种模型?前提是什么?
❖ 如果认为是随机模型,设置重复与不设重复对分析结 果有无影响?
(b) 有交互效应
图中每条曲线代表B因素的一个水平。若各曲线平行或近似平 行,可认为无交互效应,否则为有交互效应。以上只是一种直观 的判断,在多因素方差分析的过程中,我们对交互作用的有无也 可进行统计检验。
零假设
H01: i =0, i=1, 2, ……a H02:βj=0, j=1, 2, ……b H03:()ij=0, i=1, 2, ……a, j=1, 2, ……b
双因素及多因素SPSS方差分析.ppt
0 0 0 0 0 0 0
3 6d 7 4 g i l 7 1 3 2
. 4 t
t .1 d
4 6 1 2 2 6 4 8 h 8 4
e
m SS u C 6 . 0 I3 . T 0 . D 6 . 0 L . T 0 . 6 T . T 3 . L 0 E T 0 C 6 a R 1 4 2 8 3 2 3 7
方差分析表
a. R Squared = .446 (Adjusted R Squared = .402)
NAU 李刚华
SPSS 协方差分析实例输出2 应用
参数估测值的输出结果表
P a r am e t e r E st i m a t e s Dependent Variable: 肺活量 95% Confidence Interval Parameter B Std. Error t Sig. Lower Bound Upper Bound Intercept 7.977 .886 8.998 .000 6.151 9.803 AGE -8.70E-02 .020 -4.447 .000 -.127 -4.670E-02 [TIME=1] .300 .303 .993 .330 -.323 .924 a [TIME=2] 0 . . . . . a. This parameter is set to zero because it is redundant.
NAU 李刚华
SPSS 多维交互效应方差分析实例输出1 应用
方差分析结果 因素变量表
w
j e
e D
e p a
e
c
n e e
rM l g t
p I e 0 0 0 0 0 0 0 0 e o Sr a eF r1 e 0 G 9 I5 7 G 2 G 7 G 4 o a r S q
(完整版)第9章方差分析思考与练习带答案
第九章方差分析第九章方差分析【思考与练习】一、思考题1. 方差分析的基本思想及其应用条件是什么?2. 在完全随机设计方差分析中各表示什么含义?SS SS SS、、总组间组内3. 什么是交互效应?请举例说明。
4. 重复测量资料具有何种特点?5. 为什么总的方差分析的结果为拒绝原假设时,若想进一步了解两两之间的差别需要进行多重比较?二、最佳选择题1. 方差分析的基本思想为A. 组间均方大于组内均方B. 误差均方必然小于组间均方C. 总变异及其自由度按设计可以分解成几种不同来源D. 组内方差显著大于组间方差时,该因素对所考察指标的影响显著组间方差显著大于组内方差时,该因素对所考察指标的影响显著E.第九章 方差分析3.完全随机设计的方差分析中,下列式子正确的是4. 总的方差分析结果有P<0.05,则结论应为A. 各样本均数全相等B. 各总体均数全相等C. 各样本均数不全相等D. 各总体均数全不相等E. 至少有两个总体均数不等5. 对有k 个处理组,b 个随机区组的资料进行双因素方差分析,其误差的自由度为A. kb k b --B. 1kb k b ---C. 2kb k b ---D. 1kb k b --+E. 2kb k b --+6. 2×2析因设计资料的方差分析中,总变异可分解为A. MS MS MS =+B A 总B. MS MS MS =+B 总误差C. SS SS SS =+B 总误差D. SS SS SS SS =++B A 总误差E. SS SS SS SS SS =+++B A A B 总误差7.观察6只狗服药后不同时间点(2小时、4小时、8小时和24小时)血药浓度的变化,本试验应选用的统计分析方法是A. 析因设计的方差分析第九章方差分析B. 随机区组设计的方差分析C. 完全随机设计的方差分析D. 重复测量设计的方差分析E. 两阶段交叉设计的方差分析8. 某研究者在4种不同温度下分别独立地重复10次试验,共测得某定量指标的数据40个,若采用完全随机设计方差分析进行统计处理,其组间自由度是A.39B.36C.26D.9E.39. 采用单因素方差分析比较五个总体均数得,若需进一步了解其中一P0.05个对照组和其它四个试验组总体均数有无差异,可选用的检验方法是A. Z检验B. t检验C. Dunnett–t检验D. SNK–q检验E. Levene检验三、综合分析题1. 某医生研究不同方案治疗缺铁性贫血的效果,将36名缺铁性贫血患者随机等分为3组,分别给予一般疗法、一般疗法+药物A低剂量,一般疗法+药物A 高剂量三种处理,测量一个月后患者红细胞的升高数(102/L),结果如表9-1所示。
双因素方差分析课件
双原因无反复(无交互作用)试验资料表
原因 B 原因 A
B1
A1
X11
...
...
Aa
X a1
a
T. j X ij T.1 i 1
X. j T. j a X .1
b
B2 ... Bb Ti. X ij X i. Ti. b j 1
X12 ... X1b
T1.
X 1.
... ... ... ...
➢ 有交互作用旳双原因试验旳方差分析
有检验交互作用旳效应,则两原因A,B旳不同水 平旳搭配必须作反复试验。
处理措施:把交互作用当成一种新原因来处理,
即把每种搭配AiBj看作一种总体Xij。
基本假设(1)X ij 相互独立;
(2)Xij ~ N ij , 2 ,(方差齐性)。
线性统计模型
原因B
总平均 旳效应
53 58 48
a
T. j Xij 197 232 183 i 1
b
Ti. X ij j 1 165 143 145 159
T 612
X i. Ti. b
55.0 47.7 48.3 53.0
X. j T. j a 49.3 58.0 45.8
X 51
解 基本计算如原表
a b
双原因方差分析措施
双原因试验旳方差分析
在实际应用中,一种试验成果(试验指标)往往 受多种原因旳影响。不但这些原因会影响试验成果, 而且这些原因旳不同水平旳搭配也会影响试验成果。
例如:某些合金,当单独加入元素A或元素B时, 性能变化不大,但当同步加入元素A和B时,合金性 能旳变化就尤其明显。
统计学上把多原因不同水平搭配对试验指标旳 影响称为交互作用。交互作用在多原因旳方差分析 中,把它当成一种新原因来处理。
第九章-两因素及多因素方差分析
B2
2
AA2 B、A2BB间=A存(1 B在A11交B21互+A2作AB2用B1 2。) 交-38互(2作A414用B2的+1大A82小B212为)4:
20
【例】假设学生分两类:在校和在职。把两类学生随 机分成两组,分别采用课堂讲授和交互式教学方法, 考试结果如下表。
课堂讲授 交互式教学
要说明两个因素的交互作用是否显著:
H0 : ( )11 12 ( )ab 0 HA : ( )11,( )12, ,( )ab不全为0
第三步:计算统计量
平方和的简易计算法:
SST
a i 1
bn
SST
j1 k 1
a
xi2jk i 1
ii11 jj11 kk 11
aa
bb
nn [[((xxii.... xx...... )) ((xx.. jj.. xx...... )) ((xxiijj.. xxii.... xx.. jj.. xx...... )) ((xxiijjkk xxiijj.. ))]]22
xb 2 n
ajb1 nk1
x2 ijk
x2
abn
a b
SiS1Aj1
kbn1n1 xiai2jS1k SxiA2axb2nabx1bn2n ia,1
x2 i
SaSxbB2n ,
1 an
b
SSxB2j
jj 11
ii
abn
x...)2
(xijk xij. )2
i1 j1 k 1
离差平方和的分解
a
SSA bn xi x 2 i 1
《双因素方差分析》课件
同样地,因素B对因变量的影响也是显著的,表 明在不同水平下,因变量的均值存在显著差异。
3
交互作用
分析结果表明,因素A和因素B之间存在显著的 交互作用,这种交互作用对因变量产生了显著影 响。
对未来研究的建议
扩大样本量
为了更准确地评估双因素方差分析的结果,建议在未来研究中扩大样本量,以提高分析 的稳定性和可靠性。
数据筛选
检查数据是否满足方差分析的前提假设,如正 态分布、方差齐性等。
数据编码
对分类变量进行适当的编码,以便在分析中使用。
模型拟合
确定模型
根据研究目的和数据特征,选择合适的双因素方差分析模型。
拟合模型
使用统计软件(如SPSS、SAS等)进行模型拟合,得到估计参数和模型拟合指标。
假设检验
检验主效应
考虑其他影响因素
除了因素A和因素B外,可能还有其他未考虑的因素对因变量产生影响。因此,未来的 研究可以考虑纳入更多的变量,以更全面地了解因变量的影响因素。
深入研究交互作用
双因素方差分析结果表明因素A和因素B之间存在交互作用。为了更深入地了解这种交 互作用的机制和效果,建议进行更详细的研究和探讨。
实际应用价值
主效应和交互效应检验
使用双因素方差分析来检验两个实验因素的 主效应和它们之间的交互效应。
结果解释
根据分析结果,解释实验因素对因变量的影 响以及交互作用的存在与否。
05 结论与建议
研究结论
1 2
因素A对因变量的影响
通过双因素方差分析,发现因素A对因变量的影 响显著,说明在因素A的不同水平下,因变量的 均值存在显著差异。
双因素方差分析的数学模型
双因素方差分析涉及两个实验因素,通常表示为A和B。
Stata软件操作教程 (9)
实验4.2双因素或多因素方差分析
一、实验基本原理 在现实研究中,一个事件不可能仅受一个因素的影响,
恰恰相反,一个事件是受多个因素综合作用的结果, 所以多因素方差分析相比单因素方差分析有更广泛的 应用空间。下面以双因素方差分析中无交互作用的情 况为例,介绍一下多因素方差分析的基本原理。
例如,利用sales.dta数据做方差分析的练习,在这个 数据中,反映了一种饮料的销售情况,这种饮料有4种 颜色,在5家超市进行销售,除颜色之外其他条件全部 相同,分析一下饮料的颜色是否对销售量有影响。
对此问题进行差分析的命令语句为:
oneway sales color, tabulate 这个命令语句中,oneway是进行单因素方差分析的命
一般情况下,双因素方差分析的数据如表4.3所示排列, 影响因素有A和B两个。
二、实验数据和实验内容 实验数据来源于对某国女性工作情况的调查,
其中变量married是代表是否结婚的分类变 量,children是代表是否拥有子女的分类变 量,wage代表工资水平。完整的数据在本 书附带光盘的data文件夹的“wwork.dta” 工作文件中。
习题
1.利用usaauto.dta数据进行单因素方差分析,分析内 容为美国汽车的价格price是否受进口还是国产的影响, 即以price为因变量,以foreign为分类变量进行单因素 分析,并且进行结果的解读。
2.利用womenwork.dta数据进行多因素方差分析,分 析内容为妇女受教育水平education是否受结婚 married和是否有子女children以及二者交互项的影响, 即以education为因变量,以married、children和 married*children为自变量进行多因素分析,并且进行 结果的解读。
双因素及多因素SPSS方差分析.ppt
主效应方差分析检验结果
NAU 李刚华
SPSS 2×2析因实验方差分析实例 应用
方差分析表
e e D p u q 9 5 6 9 3 5 0 . . . . . E . . . . . S 6 0 8 0 6 0 5 4 m u 9 . 5 . 6 . 9 . 3 . M S C 7 I 7 D 7 D 7 D 7 E 1T 1C a R q 3 7 8 7 8 2 0 3 a d 8 0 0 0 8 0 0 0 6 0 0 o o 5 3 n 5 1 R 5 1 1 R 5 1 R 5 8 r 2o 1o . u
因素变量表
N
Tests of Between-Subjects Effects Dependent Variable: YIELD Source Corrected Model Intercept REP COL VARIETY Error Total Corrected Total Type III Sum of Squares 27.717a 22588.751 4.460 1.695 21.563 77.302 22693.770 105.019 df 15 1 5 5 5 56 72 71 Mean Square 1.848 22588.751 .892 .339 4.313 1.380 F 1.339 16364.072 .646 .246 3.124 Sig. .211 .000 .666 .940 .015
SPSS 应用
方差分析
NAU 李刚华
单因变量多因素方差分析
SPSS 应用 单因变量多因素方差分析过程主对话框
NAU 李刚华
SPSS 定义分析模型对话框 应用
NAU 李刚华
SPSS 选择对照方法对话框 应用
生物统计学课件两因素和多因素方差分析
x 21n
x a11 x a12
x 22n
x a21 x a22
x 2bn x ijn
x ab1 x ab2
---
---
---
x a1n
x a2n
和
x .1.
x .2.
x abn x .b.
x 1.. x 2 ..
x a.. x ...
bn
xi..
xi jk
j1 k 1
an
x.j.
xi jk
两因素交叉分组实验的一般格式
因素A A1 i=1----a
因素B j=1----b
和
B1
B2
…… Bb
x 111
x 121
x 1b1
x 112
x 122
x 1b2
---
---
---
x 11n
x 12n
A2
x 211
x 221
x 212
x 222
x 1bn x 2b1 x 2b2
---
---
---
…… Aa
❖ 两因素交叉分组设计的实验:
实验中A因素有a 水平,B因素有b水平,则 每一次重复都包括ab次实验,并设实验重复 n次,则实验总次数为abn次。
❖ 重复实验:每一次实验都从头开始完整的做 一遍,得到ab个结果,这样的实验作n次, 则得到abn个数据。
两因素交叉分组方差分析
1. 固定效应模型。首先考虑有重复的情况。线 性统计模型为:
第九章 两因素和多因素方差分析
上一节我们讨论了最简单的方差分析——单因素 方差分析的原理与方法。在实际工作中,问题常 常比较复杂,要求我们同时考虑两种甚至更多因 素,以及这些因素共同作用的影响。
第九章 方差分析(7讲3版)
F < F0.05(1, 2 ) 时,则P>0.05,不拒绝H0,尚不能认为喂养三
种不同饲料的大白鼠红细胞数相同。
2019/9/27
11
二、方差分析的应用条件 1.随机样本相互独立; 2.各样本来自正态总体; 3.各总体方差相等,即方差齐性。
2019/9/27
12
第二节 完全随机设计资料的方差分析
该结论的意义为,至少有两种饲料喂养大鼠红细胞数总 体均数不同。如果想确切了解哪两种饲料喂养的大鼠红细 胞数有差异,可进一步作多个样本均数的两两比较。
2019/9/27
18
第三节 随机区组设计资料的方差分析
随机区组设计(randomized block design)也称为配伍组 设计。
2019/9/27
第九章 方差分析
景学安
2019/9/27
1
[学习要求] 了解:方差分析的基本思想和多个样本的方差齐性 检验的方法。 熟悉:方差分析的应用条件;不同设计方法离均差 平方和与自由度的分解。 掌握:完全随机设计、随机区组设计和析因设计的 方差分析方法;多个样本均数两两比较的方法。
2019/9/27
2
方差分析是多个样本均数比较的假设检验方法。主要用于: 1.进行两个或两个以上样本均数的比较; 2.分析多个因素的独立作用及多个因素之间的交互作用; 3.进行两个或多个样本的方差齐性检验等。
i
(
j X ij )2 C 52.532 66.232 87.622 1183.1307
ni
12
12
12
=1235.2565-1183.1307=52.1528
ν组间=k-1=3-1=2 SS组内=SS总-SS组间=72.1639-52.1528=20.0381
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)分析:固定模型下:
aj ai 1 2 3 4
y j
B 1 34 25 36 41 34 2 25 31 27 33 29 3 17 25 35 30 26.75 4 22 18 25 35 25
y i
24.5 24.75 30.75 34.75 28.69
变差来源 A B AB 误差 总和
例2:用两种不同的饲料添加剂A和B,以不同比 例搭配饲养大白鼠,每一种饲料添加剂取4个水平, 每一处理设两个重复。大白鼠增重结果列于下表。 请进行统计分析,并回答下列问题。
添加剂B 添加剂A 1 2 3 4 不同条件下大白鼠增量/g 1 32,36 26,24 33,39 39,43 2 28,22 29,33 30,24 31,35 3 18,16 27,23 33,37 28,32` 4 23,21 17,19 23,27 36,34
3、检验统计量的计算
在F检验时,A因素、B因素的检验统计量均以MSe做分母
FA=MSA/MSe FB=MSB/MSe 用F分布的上尾检验,拒绝域为F>Fα
(三)交互作用的判断
Tukey提供的方法进行因素间是否存在交互作用的 判断 P171
二、随机模型
1、观察值的线性统计模型
y ijk = + α i + β j + (αβ )i j + ε i jk,其中i = 1,2,a; j = 1,2,b; k = 1,2,n; ... ... ...
a
b
2
1 a b 2 ∑∑yij = SST SSA SSB SSAB n i=1 j=1
(五)各项均方的计算
MS
T
SS T SS T = = df T abn 1
MS
A
SS A SS A = = a -1 df A
SS B SS B MS B = = df B b 1
MSAB
SS AB SS AB = = (a - 1)(b - 1) df A
平方和 592.375 365.375 425.125 128 1510.875
自由度 3 3 9 16 31
均方 197.458 121.792 47.236 8
统计量F 24.68** 15.22** 5.904**
查F分布表: F0.95 (3,6) = 3.24; F0.99 (3,6) = 5.29; F0.95 (9,16) = 2.54; F0.99 (9,16) = 3.78
二、双因素交叉分组试验设计的描述
(一)双因素试验的数据描述 (二)观测值的描述 (三)平方和与自由度的分解 (四)平方和的简便计算公式 (五)各项均方的计算
(一)试验数据的描述
B1 y111 y112 ┆ y11n y211 因素A i=1., 2,3…,a A2 y212 ┆ y21n ┆ 因素B j=1.,2,3…,b B2 … y121 … y122 ┆ y12n y221 y222 ┆ y22n ┆ … … Bb y1b1 y1b2 ┆ y1bn y2b1 y2b2 ┆ y2bn ┆ y2.. 和
对A做检验时用随机模型,对B及AB交互效 应做检验时用固定模型。 P177
例1:随机选择4个小麦品种,施以三种肥料,小 区产量列于下表,该问题属于哪种模型?从方差 分析的结果可得出什么结论?
肥料种类 小麦品种 1 2 3 4 不同条件下小区产量/kg (NH4)2SO4 21.1 24.0 14.2 31.5 NH4NO3 18.0 22.0 13.3 31.4 Ca(NO3)2 19.4 21.7 12.3 27.5
2、提出假设
H 01: α i = 0, H A1: α i ≠ 0 H 02: β i = 0, H A2: β i ≠ 0 H 03:( αβ ) = 0, H A3:( αβ ) ≠ 0,其中 i = 1,2, a; j = 1,2, b ..., ..., ij ij
3、检验统计量的计算
在F检验时,A因素、B因素和互作效应的检验统计量均以 MSe做分母:FA=MSA/MSe FB=MSB/MSe FAB=MSAB/MSe 用F分布的上尾检验,拒绝域为F>Fα
第九章 双因素和多因素方差分析
学习目标
掌握:两因素交叉分组(有重复观察值、 无重复观察值)资料的方差分析方法。 熟悉:多因素试验线性模型和不同变异来 源期望均方构成。 了解:缺失数据的估计原理及方差分析方 法。
讲授内容
第一节 双因素方差分析概述 第二节 不同实验类型的双因素方差分析 第三节 多因素试验的方差分析 第四节 缺失数据的估计 第五节 数据变换
第一节 双因素方差分析概述
一、双因素试验汇中的几个基本概念
1、主效应(main effect):各实验因素相对独立的 效应,该效应水平的改变会造成因素效应的改变, 如包装方式对果汁销售量的影响。 2、互作效应(interaction):两个或多个实验因素的 相互作用而产生的效应。
3、无交互作用的双因素方差分析或无重复双因素方 差分析(Two-factor without replication):两个因素 对试验结果的影响是相互独立的,分别判断两个 因素对试验数据的影响。 4、有交互作用的双因素方差分析或可重复双因素方 差分析 (Two-factor with replication):如果两个因 素对试验数据的单独影响外,两个因素的搭配还 会对结果产生一种新的影响。
SST = ∑∑∑ yijk C
2 i =1 j =1 k =1
b
a
b
n
1 ∑yi 2 C SSA = bn i=1
a
SSB = 1 ∑yj C an j=1
2
SSAB = n∑∑(yij yi y j + y )
a b i=1 j =1
n
2
SSe= ∑∑∑yijk
i=1 j =1 k =1
A因素误差平方和
SSA = bn∑(yi y )
i=1
a
2
B因素误差平方和 SSB = an∑(y j y )
b j=1
2
AB交互作用误差平方和
SSAB = n∑∑(yij yi y j + y )
a b i=1 j =1 2
随机误差项平方和
SSe =
2 ( y ijk y ij) ∑∑∑ i =1 j =1 k =1 a b n
18.0 22.0 13.3 31.4 21.18
19.4 21.7 12.3 27.5 20.23
变差来源 小麦品种 肥料种类 误差 总和
平方和 442.17 12.47 7.69 462.33
自由度 3 2 6 11
均方 147.39 6.24 1.28
统计量F 115.02** 4.87
小麦品种间差异极显著,肥料间无显著差异。
yijkl = + α i + β j + γ k + (αβ )ij + (βγ ) jk + (αγ )ik + (αβγ )ijk + ε ijkl i = 1,2,a;j = 1,2,b;k = 1,2,c;l = 1,2,n ... ... ... ...
在F检验时,A因素、B因素主效应的检验统计量 是以MMSA/MSAB FB=MSB/MAB FAB=MSAB/MSe 用F分布的上尾检验,拒绝域为F>Fα 注意:检验统计量的分母与统计量的第二自由度 与固定效应不同
4、均方期望
E(MSe ) = σ
2、提出假设
H 01: σ α = 0, H A1: σ α > 0
2 2
H 02: σ β = 0, H A2: σ β > 0
2 2
H 03: σ αβ = 0, H A3: σ αβ > 0,其中 i = 1, 2, a ; j = 1, 2, b ..., ...,
2 2
3、检验统计量的计算
题解
解:本题影响产量的因素包括肥料种类和小麦品 种。该问题属于混合模型中无重复的两因素分组 交叉分析。
肥料种类 小麦品种 1 2 3 4
y j
不同条件下小区产量/kg (NH4)2SO NH4NO3 Ca(NO3)2
4
y i
19.5 22.57 13.27 30.13
21.1 24.0 14.2 31.5 22.7
1、观测值的描述
y ijk = + α i + β j + ε i j,其中 i = 1,2, a ; j = 1,2, b; ... ...
∑α
i =1
a
i
= 0; β j = 0; ε i j为相互独立且服从正态 分布 N 0, σ 2 的随机变量 ∑
j=1
b
(
)
2、提出假设
H 01: α i = 0 , H A1 : α i ≠ 0 H 02 : β i = 0 , H A2 : β i ≠ 0
SS e SS e MS e = = df e ab(n - 1)
第二节 不同实验类型的双因素方差分析
一、固定模型
(一)重复试验时的双因素方差分析 1、观察值的线性统计模型
y ijk = + α i + β j + (αβ )i j + ε i jk,其中 i = 1,2, a; j = 1,2,b; k = 1,2, n; ... ... ...
α i 表示因素A第i水平的处理效应 β j表示因素B第j水平的处理效应 ε ijk 表示随机误差
(αβ )ij 表示因素A的第i水平和因素B第i水平的交互效应
(三)平方和与自由度的分解
1、平方和的分解
总平方和SST被分解为A因素所引起的平方和SSA、 B因素所引起的平方和SSB、AB交互作用所引起 的平方和SSAB、误差平方和SSe