第九章__双因素和多因素方差分析
第九章双因素和多因素方差分析
第九章双因素和多因素方差分析引言方差分析是一种常用的统计方法,用于比较两个或多个组之间的差异。
双因素和多因素方差分析是方差分析的扩展,允许考虑两个或多个自变量对因变量的影响。
本文将介绍双因素和多因素方差分析的概念、假设检验、模型构建等内容。
双因素方差分析双因素方差分析主要用于对两个自变量对因变量的影响进行分析。
其中一个自变量称为因子A,另一个自变量称为因子B。
通过双因素方差分析,我们可以了解到两个自变量对因变量的主效应以及交互效应。
假设检验进行双因素方差分析时,我们需要对两个自变量的主效应和交互效应进行假设检验。
主效应是指每个因子对因变量的影响,交互效应是指两个因子之间是否存在相互影响。
在进行双因素方差分析时,我们需要提出以下假设:•零假设H0: 两个因子对因变量没有主效应和交互效应•备择假设H1: 至少一个因子对因变量有主效应或交互效应然后,我们可以通过方差分析结果的显著性检验来判断是否拒绝零假设。
模型构建双因素方差分析可以通过构建线性模型来进行。
通常,我们使用以下模型进行双因素方差分析:Y = μ + α + β + (αβ) + ε其中,Y表示因变量,μ表示总体均值,α表示因子A的主效应,β表示因子B的主效应,(αβ)表示交互效应,ε表示误差。
通过对数据进行拟合并计算模型中的各个参数,我们可以得到双因素方差分析的结果。
多因素方差分析多因素方差分析是对多个自变量对因变量的影响进行分析。
多因素方差分析可以包含两个以上的自变量,并且可以考虑每个自变量的主效应和交互效应。
假设检验进行多因素方差分析时,我们同样需要对每个自变量的主效应和交互效应进行假设检验。
假设检验的步骤与双因素方差分析类似。
模型构建多因素方差分析的模型构建与双因素方差分析类似,但是需要考虑多个自变量的影响。
Y = μ + α1 + α2 + … + αn + β + (αβ) + ε其中,Y表示因变量,μ表示总体均值,α1, α2, …, αn表示各个自变量的主效应,β表示交互效应,(αβ)表示两个或多个自变量之间的交互效应,ε表示误差。
第九章 方差分析
第九章方差分析方差分析是从方差的角度,研究各有关因素对试验结果影响大小的有效方法.从数理统计的角度来看,方差分析是通过比较总体方差的各种估计量之间的差异,来分析等方差的正态总体是否具有相同的均值.称之为方差分析的原因,是在显著性检验中所用统计量的分子、分母都是总体方差的估计量.试验中,将要考察的指标称为试验指标或响应值,试验指标值的全体构成我们所关注的总体;影响试验指标的条件称为因素,因素所处的状态称为该因素的水平.如果试验仅考虑一个因素,则称为单因素试验,否则称为多因素试验.可能有多个因素影响试验指标,但总是取少数重要因素进行研究.在方差分析中,通常取1-3个因素进行研究.因素的水平可以是数量化的,也可以是定性的.例如要研究几个不同的小麦品种间产量的差异时,考虑的因素是品种,而每个水平便是一个小麦品种,是定性的水平;而在研究氮肥施用量对小麦产量的影响时,水平(氮肥施用量)则是数量化的.方差分析只研究各个水平对试验指标的影响是否显著,并不给出各水平的影响程度.因此,方差分析是定量地估计各因素对试验指标的影响的工具.9.1 单因素方差分析先看一个实例.例1 在饲养条件尽可能相同的条件下,检验某种激素对羊羔增重的效应.选用3个剂量进行试验,加上对照(不用激素)在内,每次试验要用4只羊羔,若进行4次重复试验,则共需要16只羊羔.一种常用的试验方法,是将16只羊羔随机分配到16个试验单元.这种方法被称为完全随机设计,在试验单元间的试验条件很一致的情况下,这种设计最为有效.经过200天的饲养后,各羊羔的增重数量(单位:kg)见表9.1.表9.1 各羊羔的增重数量(kg/每头/每200d)- 204 -- 205 -本例中,试验指标是羊羔的增重数量,只有1个因素——激素,为单因素试验.激素的4个剂量(含对照)构成因素的4个水平.单因素方差分析用于分析单因素试验中,各个水平对试验指标的影响是否显著.为叙述单因素方差分析问题,再看一个实例.例 2 一批由同种原料织成的同一种布,用不同染整工艺处理,然后进行缩水率试验,考察染整工艺对缩水率的影响,在其它条件尽可能相同时,测得缩水率(%)如表9.2所示.的染整工艺处理后,缩水率的全体构成的集合,假定2~(,)X N μσ.所考察的因素是染整工艺A ,5种不同的染整工艺A 1,A 2,…A 5为因素的5个水平,假定水平i A 下的样本来自相互独立且等方差的正态总体2~(,)(1,2,5)i i X N i μσ= ,它们都是总体X 的特款.就该批布中的任意4块分别考察5个水平上的缩水率,看作是4次重复试验.令i i αμμ=-,则αi 反映了水平A i 对缩水率的影响.由于x ij 是来自2~(,)i i X N μσ的样本,于是i j i i j i i j x μεμαε=+=++ (i =1,2,…,5;j =1,2,…,4).这里,εij 表示观测过程中各种随机影响引起的随机误差;εij 相互独立,服从均值为0,方差为σ2(未知)的正态分布.考察五个水平对缩水率的影响是否差异显著,即要检验假设012345:0H ααααα===== (9.1)一般地,设总体2~(,)X N μσ,因素A 有k 个水平A 1,A 2,…,A k .今对第i 个总体进行n i 次重复观测(i =1,2,…,k ),得到表9.3中的观测数据.- 206 - 表9.3 单因素方差分析数据表假定水平i A 下的样本来自相互独立、方差相同的正态总体2~(,)i i X N μσ(1,2,)i k = .令i i αμμ=-,则αi 反映了水平A i 对试验指标的影响.于是有i j i i j i i j x μεμαε=+=++(1,2,,;1,2,,)j i k j n == (9.2)其中,εij 表示试验观测过程中各种随机影响引起的误差;εij 相互独立,服从均值为0,方差为σ2(未知)的正态分布.称(9.2)为单因素方差分析的数学模型.令n = n 1 + n 2 + … + n k , (9.3)表示观测数据总数,不难证明111,0.kki i ii i n n μμα====∑∑单因素方差分析是要考察各个水平对试验指标影响的差异是否显著.因此,要检验的统计假设为012:0k H ααα==== (9.4)即检验观测数据x ij 是否来自k 个相同的总体.记11,in i ij i i j ix x x x n ⋅⋅⋅===∑, (9.5) 1111,in kkij i i j i x x x x x n⋅⋅⋅⋅⋅======∑∑∑, (9.6) 则i x ⋅为总体A i 的样本均值,x 为总样本的均值.(9.5)式与(9.6)式中的圆点表示已经求过和的指标,下同.令211()in k t ij i j S x x ===-∑∑, (9.7)211()in ke ij i i j S x x ⋅===-∑∑, (9.8)- 207 -21()kA i i i S n x x ⋅==-∑. (9.9)称S t 为总离差平方和,它反映了观测数据总的变异程度;显然,i x ⋅是i μ的无偏估计,又ij ij i x εμ=- ,于是ij ij i e x x ⋅=-是误差εij 的无偏估计.因此,称S e 为误差平方和或组内平方和,它反映了随机误差εij 对试验指标影响的总和;S A 是水平i A 的平均i x ⋅与总平均x 的离差平方和,其中系数i n 是对水平i A 上观测次数的体现.因此,A S 反映了因素A 的各水平i A 的均值间的差异程度,称A S 为因素平方和或组间平方和.由于2112112211111122111111()[()()]()2()()()()()2()()(ii ii iiiin kt ij i j n kij i i i j n n n kk k ij i ij i i i i j i j i j n n n kk kij i i i ij i i j i j i j i S x x x x x x x x x x x x x x x x x x x x x x x ==⋅⋅==⋅⋅⋅⋅======⋅⋅⋅⋅=======-=-+-=-+--+-=-+-+--=∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑221111)()iin n kkj i i i j i j x x x ⋅⋅====-+-∑∑∑∑于是有平方和分解公式:S t =S A +S e . (9.10) 其意义在于将因素平方和S A 与误差平方和S e 从总平方和S t 中分解出来.在各ij ε相互独立地服从N (0,σ2)分布的前提下,当假设(9.3)成立时,模型(9.2)变为i j i j x με=+(1,2,,;1,2,,)i i k j n == (9.11)即所有观测数据来自同一正态总体N (μ, σ2) ,于是由第六章(6.10)式知22/~(1)t S n σχ-.令21(),1,2,,in i ij i j S x x i k ⋅==-=∑- 208 -则/(1)i i S n -是来自总体i X 的样本方差,于是2/i S σ服从自由度为1i n -的χ2分布.而S e /σ2 =(S 1 + S 2 + …+S k ) /σ2,由12,,,k X X X 的独立性假定,知S 1,S 2,…,S k 相互独立.由χ2分布的可加性,知22/~()e S n k σχ- (9.12)至于A S 的分布性质,我们不假证明地给出如下定理: 定理1 (1) A S 与e S 相互独立;(2) 当假设(9.4)成立时,22/~(1)A S k σχ-.若用t f ,A f ,e f 分别表示t S ,A S ,e S 的自由度,由上述讨论得到t A e f f f =+ (9.13)称(9.13)为自由度分解公式.为了检验假设(9.4),取)/()1/(k n S k S F e A --=(9.14)当假设(9.4)成立时,由(9.12)及定理1,有~(1,)F F k n k -- (9.15)给定显著性水平α(0<α<1),查F 分布表得到自由度为(k -1, n -k )的F 分布临界值F α(k -1, n -k ),从样本算出F 统计量的值F 0,据F 0的大小作如下推断:若F 0 >F α(k -1, n -k )则拒绝假设(9.4),认为某些水平(并非全部)对试验指标的影响有显著差异;若F 0 ≤F α(k -1, n -k )则接受假设(9.4),认为各水平对试验指标的影响无显著差异.通常将单因素方差分析过程归结为如表9.4所示的单因素方差分析表. 为简化计算,还可以对所有观测数据同时加、减或同时乘、除一个非零常数.不难证明,对所有观测数据x ij 同时加、减一个任意常数不影响各平方和的值,同时乘、除以一个非零常数不影响F 统计量的值.即对原始数据x ij 做变换,0ijij x ax b a '=+≠后再进行方差分析,其结果不变.1 23 4计算得到:S A = =208,S e = 646,S t = S A + S e = 854.S A的自由度为k―1=3,S e的自由度为n―k =12.据此,列方差分析表如表9.5.由(9.13)式算出的F值为1.2879,查表得临界值F0.05(3,12)=3.49,从样本算出的F值1.2879远比5%显著水平要求的F值3.49小,因此认为各个处理间没有显著差异.值得注意的是,这并不证明4个处理间没有差异,可能存在真实的差异,但是在所选取的概率水平上,试验没有足够的灵敏度,未能检测出差异.单因素方差分析可在表(9.3)上计算.现对例2进行表格化计算.为便于计算,将表9.2中的各观测数据同减去5,在表9.6中表格化计算(9.14)和(9.15)式右端各项.注意到k i- 209 -- 210 -55.54,34.37,A e S S ==89.91.t A e S S S =+= 据此得到如表9.7所示的方差分析表.0.01F =6.07>4.89,故拒绝假设(9.1),认为染整工艺对缩水率的影响极显著.在方差分析中,仍用* *表示极显著(a≤0.01时显著),用*表示0.01<a≤0.05时显著.在单因素方差分析中,各水平上观测次数n 1,n 2,…,n k 可以不相等.但在实际问题中,多取n 1 = n 2 =…n k ,因为选择同样大小的样本有如下优点:(1)与方差相等的假设的偏离不会过大,方差相等的检验比较容易;(2)F 检验时出现的第二类错误变小;(3)均值的其它比较(参阅§9.3)较为简单.9.2 双因素方差分析在双因素方差分析中,假定试验指标受两个变异因素A 、B 的影响,并假定行因素A 有m 个水平A 1,A 2,…,A m ,列因素B 有r 个水平B 1,B 2,…,B r .在每对组合水平(A i , B j )上做一次试验,得到m ×r 个试验结果x ij (i =1,2,…,m ; j =1,2,…,r ).所有ij x 独立,实验数据见表9.8.假定总体2~(,)X N μσ,2~(,)ij ij x N μσ,则11m rij i jmr μμ==∑∑ (9.16) 再假定组合水平(A i , B j )下的效应可以用A i 下的效应i α和B j 下的效应j β之和来表示,即ij i j μμαβ=++其中- 211 -110,0mriii j αβ====∑∑(正负效应相互抵消). 表9.8 双因素方差分析观测数据表1111,,r m A Biij j ij j i r m μμμμ====∑∑则A i μ和B j μ分别表示水平i A和j B 上的总体均值,且有 ,A i i αμμ=-.B j j βμμ=-类似于单因素方差分析,可将双因素方差分析的线性模型表示为(1,2,,;1,2,,)ij i j ij x i m j r μαβε=+++== . (9.17)这里,εij 表示其它随机因素引起的随机误差,εij 相互独立,服从均值为0,方差为σ2(未知)的正态分布.双因素方差分析的检验假设为01120212:0(9.18):0(9.19)m r H H αααβββ====⎧⎨====⎩仍用n = m ×r 表示观测数据总数,记11,(1,2,,)ri ij i i j x x x x i m r ⋅⋅⋅====∑ (9.20)11,(1,2,,)mj ij j j i x x x x i r m⋅⋅⋅====∑ (9.21) 111,m rij i j x x x x n⋅⋅⋅⋅====∑∑ (9.22)- 212 - 21()mA i i S r x x ⋅==-∑ (9.23)21()rB j j S m x x ⋅==-∑ (9.24)211()mre ij i j i j S x x x x ⋅⋅===--+∑∑ (9.25)211()mrt ij i j S x x ===-∑∑ (9.26)则i x ⋅为水平A i 上的样本平均,j x ⋅为水平B j 上的样本平均,x 为总体平均.S A 是因素A 的水平A i 上的样本平均i x ⋅与总体平均x 的离差平方和,若因素A 对响应值影响显著,则至少有一个离差平方(i x ⋅-x )2 较大,从而S A 较大;而当因素A 的影响不显著时S A 较小.因此,S A 反映了因素A 对试验结果的影响.同样,S B 反映因素B 对试验结果的影响.将模型(9.17)写成μμμμμμμμε+--=-+-+-=Bj A i ij B j A i ij ij x x )]()([于是,ij ij i j e x x x x ⋅⋅=--+是εij 的估计值.因此,S e 为误差平方和,它反映了其它随机因素对试验结果的影响.通过简单的推导可以证明下列平方和分解公式:S t = S A + S B + S e , (9.27)定理 2 (1) A S ,B S ,e S 相互独立,且()22/~(1)(1)e S m r σχ--,()22/~1t S mr σχ-;(2) 当假设01H 成立时,22/~(1)A S m σχ-; (3) 当假设01H 成立时,22/~(1)A S m σχ-; 证明略.若用t f ,A f ,B f ,e f 分别表示t S ,A S ,B S ,e S 的自由度,则由定理2得到- 213 -t A B e f f f f =++ (9.28)称(9.28)为自由度分解公式.由定理2,有()/(1)~1,(1)(1)/(1)(1)A A e S m F F m m r S m r -=----- (9.29)显然,F A 越大说明因素A 对试验结果的影响越大.对给定的显著性水平α,查F 分布表得自由度为(m ―1, (m ―1)(r ―1))的F 分布临界值F α,若从样本由(9.29)式算出F A >F α,则拒绝假设H 01,认为因素A 对试验结果有显著影响;否则认为因素A 的影响不显著.类似地,可使用统计量()/(1)~1,(1)(1)/(1)(1)B B e S r F F r m r S m r -=----- (9.30)对因素B 进行显著性检验.若从样本由(9.30)式算出F A >F α,则拒绝假设H 02,认为因素B 对试验结果有显著影响;否则认为因素B 的影响不显著.上述讨论可归结为如表9.9所示的方差分析表.表9.9 双因素方差分析表例3 将土质基本相同的一块耕地分成均等的五个地块,每块又分成均等的四个小区.有四个品种的小麦,在每一地块内随机分种在四个区上,每小区的播种量相同,测得收获量如下表(单位:kg ),试以显著性水平α1=0.05, α2=0.01考察品种和地块对收获量的影响是否显著.解 为计算简单起见,每一收获量均减去32,列表计算.- 214 -注意到m =4,r =5,n =20,经计算得到S A = 134.65, S B = 14.10, S t = 175.03, S e = 26.28,查表得临界值F 0.05(4, 12)=3.26,F 0.01(3, 12)=5.95.由于F B <F 0.05(4, 12),故认为地块不同对收获量无显著影响.由于F A >F 0.01(3, 12),故认为品种不同对收获量影响极显著.9.3 多重比较当假设(9.4)被拒绝后,只能表明在显著水平α下,至少有两个子体的均值间差异显著,并不表示k 个均值之间两两的差异都显著.通常要进一步检验该因素在各水平上的均值两两之间的差异是否显著,以确定哪些水平对响应值有重要影响.我们称这种差异性检验为多重比较.多重比较的方法很多,而且每种方法都有各自的优、缺点.这里,我们介绍适用范围较广的两种方法.一种是Scheffe 方法(S 法),另一种是Tukey 方法(T 法).在进行所有两个均值的同时比较时,如果每次比较的冒险率(犯第一类错误的概率)为α,则S 法和T 法全体冒险率均为α.如果用t 检验进行所有两个均值的同时比较,当均值个数大于2时,尽管每拒绝1个假设所犯的错误都是α,但同时拒绝2个假设所犯的错误是221(1).ααααα+-=-->如果对7个均值进行两两比较,要比较2721C =次.给定拒绝每个假设(i j μμ=,- 215 -1≤i <j ≤7)的冒险率0.10α=,要拒绝所有21个假设,即判明7个均值互不相等所犯的错误将是211(1)0.89α--≈!显然,在使用t 检验进行所有两个均值的同时比较时,全体的冒险率随均值个数的增加而增加.因此,t 检验只能适用于随机抽出的两个均值的比较,并不适用于所有的两个均值的同时比较. 9.3.1 S 法仍用e f 表示误差平方和S e 的自由度,/e e e MS S f =表示均方误差,假定观测数据满足方差分析的基本要求.在单因素方差分析中,Scheffe (1953)给出用于检验假设H 0:μi = μj (1≤i <j ≤k )的统计量i j D S α= (9.31)其中),1()1(e f k F k S --=αα.当||i j i j x x D ->时,则拒绝假设H 0 :μi =μj ,认为水平A i 与水平A j 在显著水平α下差异显著;否则认为A i 与A j 差异不显著.对于双因素方差分析,我们可以分别对每个因素作单因素方差分析,进而进行多重比较.也可以按下述步骤进行近似的S 检验:1 若检验假设A j A i H μμ=:0,则使用统计量ij D S = (9.32) 其中),1()1(e a f m F m S --=α.当||i j ij x x D ⋅⋅->时,则拒绝A j A i H μμ=:0,否则接受H 0.2 若检验假设B j B i H μμ=:0,则使用统计量ij D S α= (9.33) 其中),1()1(e f r F r S --=αα.- 216 - 当||i j ij x x D ⋅⋅->时,则拒绝B j B i H μμ=:0,否则接受H 0.比如在例2中,k = 5, n 1 = n 2 = … = n 5 = 4, f e = 15, MS e = 2.29.取α=0.05,查表得F 0.05(4,15)=3.06.于是由(9.32)及(9.33)得24.1206.34205.0=⨯=S ,)51(74.3)4141(29.224.12≤<≤=+⨯⨯=j i D ij .12||0.025 3.74x x -=<,故μ1与μ2差异不显著. 15|| 3.925 3.74x x -=>,故μ1与μ5差异不显著.14|| 3.35 3.74x x -=<,但与临界值3.74较接近,虽在显著水平0.05下认为μ1与μ4差异不显著,却能看出二者间存在真实的差异.类似地,可对其中任二均值进行比较. 9.3.2 T 法在用T 法进行k 个水平上的均值μ1,μ2,…,μk 之间的两两比较时,要求各水平上的重复数相同,即n 1 = n 2 = … = n k ,并且还要求2cov(,),,1,2,,;i j x x b i j k i j σ==≠ .即i x 与j x 的协方差不依赖于i 和j .T 法所使用的统计量是(,e T q k f α= (9.34) 其中(,)e q k f α是自由度为(,)e k f 的t 化极差分布的上侧α分位点.(,)e q k f α可以从“多重比较的q 表”中查到.S 法无论水平重复数是否相同都适用,T 法只适用于水平重复数相同的情况;在进行所有均值间的两两比较时,T 法比S 法灵敏度高,能检出较小的差异.因此,在水平重复数相同时应当用T 法.9.4 双因素等重复试验的方差分析在双因素试验中,除考察因素A 和B 对试验结果的影响外,还应考虑A 、B- 217 -的各水平的搭配情况对试验结果的影响,称此为A 与B 的交互作用,并把它设想为某一因素,记为A B ⨯.为考虑交互作用A B ⨯,对因素A 、B 的各水平的每一搭配(A i ,B j )都进行l (l ≥2)次重复观测,得到表9.10中的观测数据.表9.10 双因素等重复试验数据记n mrl =,1111m r lijk i j k x x n ====∑∑∑11,,1,2,,;1,2,,.lij ijk ij ij k x x x x i m j r l ⋅⋅⋅=====∑111,,1,2,,.r li ijk i i j k x x x x i m rl⋅⋅⋅⋅⋅⋅=====∑∑ 111,,1,2,,.mlj ijk j j i k x x x x j r ml⋅⋅⋅⋅⋅⋅=====∑∑双因素等重复试验的方差分析计算量较大.其基本原理也是将总的偏差平方和作如下分解:- 218 - 211122111122111()()()()()m r lt ijk i j k mrlmijk ij i i j k i rm rj ij i j j i j e A B A BS x x x x rl x x ml x x k x x x x S S S S ===⋅⋅⋅====⋅⋅⋅⋅⋅⋅⋅===⨯=-=-+-+-+--+=+++∑∑∑∑∑∑∑∑∑∑ (9.35)其中各偏差平方和的表达式如下:2111()m r le ijk ij i j k S x x ⋅====-∑∑∑21()mA i i S rl x x ⋅⋅==-∑21()rB j j S ml x x ⋅⋅==-∑211()m rA B ij i j i j S k x x x x ⨯⋅⋅⋅⋅⋅===--+∑∑e S 为误差平方和,反映了随机误差对试验指标的影响;A S 和B S 分别为因素A 和B 的偏差平方和,分别反映了因素A 和B 对试验结果的影响程度,A B S ⨯为A 与B 的交互作用A B ⨯的偏差平方和.当假设“H A :因素A 对试验结果无显著影响”成立时()/(1)~1,(1)/[(1)]A A e S m F F m mr l S mr l -=---当假设“H B :因素B 对试验结果无显著影响”成立时()/(1)~1,(1)/[(1)]B B e S r F F r mr l S mr l -=---当假设“H AB :交互因素AB 对试验结果无显著影响”成立时()/[(1)(1)]~(1)(1),(1)/[(1)]A B B e S m r F F m r mr l S mr l ⨯--=----检验过程可归纳在如表9.11所示的方差分析表中.立性和等方差性.从理论上讲对上述假定都要通过样本进行统计检验.有关独立性问题,通常是通过试验设计来解决.至于正态性和等方差性,可以根据第八章进行拟合优度检验和Bartlett 检验,还可以对原始数据进行适当的变换,使之满足正态性和等方差性.习 题 九1. 某灯泡厂用四种不同配料方案制成的灯丝,生产了四批灯泡.在每批灯泡中随机地其中(1,2,3,4)i t i =表示第i 批灯泡的寿命.试问(1) 四种灯丝生产的灯泡的使用寿命有无显著差异(0.05α=)? (2) 用S 法比较任意两批灯泡平均寿命之间的差异性(0.05α=).2. 设有三种型号的设备制造同一产品,对每种型号的设备各观测其5天的日产量,数x i 表示第i种型号的设备的日产量.问不同型号的设备生产能力之间是否其中(1,2,3)i有显著差异?3. 为了解3种不同饲料对猪生长影响的差异,用3个品种的猪进行全面搭配试验,3个月后测得9头猪的体重增加量(单位:kg)如下表:试分析饲料之间及猪的品种之间对猪的体重增加有无显著差异.4. 一种火箭使用了四种燃料、三种推进器作射程试验,对于燃料与推进器的每一种搭试检验燃料和推进器对火箭射程是否有显著影响,以及两个因素的交互作用对火箭射程是否有显著影响.- 220 -。
统计学第九章 双因素和多因素方差分析
2、平方和的分解
与平方和相应的自由度分别为: 总自由度:df =abn-1
T
A因素处理间自由度:df =a-1
A
B因素处理间自由度:df =b-1
B
交互作用自由度:df =(a-1)(b-1)
AB
处理内自由度:dfe=ab(n-1) df =df +df +df +dfe
a b i=1 j =1
n
2
SSe= ∑∑∑yijk
i=1 j =1 k =1
a
b
2
1 a b 2 − ∑∑yij• = SST − SSA − SSB − SSAB n i=1 j=1
(五)各项均方的计算
MS
T
SS T SS T = = df T abn − 1
MS
A
SS A SS A = = a -1 df A
x9
x1 x2 x3 x4 x5 x6 x7 x8 33.5** 30.5** 29.75** 22** 19** 11.5 2.75 2.5
x8
31** 28** 27.25** 19.5** 16.5** 9 0.25
x7
30.75** 27.75** 27** 19.25** 16.25** 8.75
A因素误差平方和
SSA = bn∑(yi•• − y••• )
i=1
a
2
B因素误差平方和 SSB = an∑(y• j• − y••• )
b j=1
2
AB交互作用误差平方和
SSAB = n∑∑(yij• − yi•• − y• j• + y••• )
第九章 方差分析
3。计算各部分变异的均方 在方差分析中 ,方差也称为均方,是各部分的离均差平 方和除以其相应的自由度,用MS表示。基 本公式为:MS=SS/ν。 4。计算统计量F值 F值是指两个均方之比。 一般是用较大的均方除以较小的均方。故 F值一般不会小于1。
5。确定P值,推断结论 根据分子ν1,分母 ν2,查F界值表(方差分析用),得到F 值的临界值(critical value),即:如 果F≥F界值,则P≤0.05,在α=0.05水准 上拒绝H0,接受H1。可以认为各样本所代表 的总体均数不全相等。如果想要了解哪两 个样本均数之间有差异,可以继续进行各 样本均数的两两比较。
结论:拒绝H0。四个行业的服务质量有显著差异
用Excel分析
选一批单元格输入原始数据; 选中数据区域,“工具”→“数据分析”;
1.输入数据表;选“工具”→“数据分析 ”→“……‖
1.输入数据表;选“工具”→“数据分 析”→“单因素方差分析”
―单因素方差分析”对话框中:输入区 域,行,输出区域
Ar
X r1 ... X rnr
列和Ti X ij
j 1
ni
T 1
T2
...
Tr
总和 Ti
i 1
r
列平均X i Ti ni
(水平组内平均值)
X1
X2
...
Xr
r
(总平均值)
1 r X ni X i n i 1
其中诸
ni 可以不一样, ni n
i 1
单因素方差分析表
3.处理
处理——指按单因素的各个“水平”条 件或多因素的各个“水平”的组合条件进行 的重复实验。 例如,要研究性别因素对智力发展的影 响,可以从同龄学生中各抽取男女学生50名 参加智力测验。性别因素所分成的两个水平 (男和女)即两种处理。
第9章 方差分析
方差分析简称 ANOVA(analysis of variance),就是利用试验观测值总偏差的可分解性,
将不同条件所引起的偏差与随机误差分解开来,按照一定的规则进行比较,以确定各种偏差 的影响程度和相对大小。当已确定某几种因素对试验结果有显著影响时,可使用方差分析检
验确定哪种因素对试验结果的影响最为显著及估计影响程度。
第 9 章 方差分析
学习目标
1、理解方差分析的基本思想; 2、熟练掌握单因素方差分析的基本原理及其实际应用; 3、熟练掌握双因素方差分析的基本原理及其实际应用。
基本概念
总离差平方和 组间离差平方和 组内离差平方和 检验统计量 自由度 单因素方 差分析 双因素方差分析
9.1 方差分析的基本认识
9.1.1 问题的提出
由于爽肤水是同一公司生产的,它们的成分、价格等可能影响销售量的因素全部相同,我们
把四种不同颜色的爽肤水的销售量均值分别记为 m1 , m2 , m3 , m4 ,由题意知,要检验假设
H0 : m1 = m2 = m3 = m4 ;
H1 : m1 , m2 , m3 , m4 不全相等
如果检验结果为 m1 , m2 , m3 , m4 不全相等,则表明爽肤水颜色对销售量产生影响。反之, 如果检验结果为 m1, m2 , m3 不存在显著影响,则可以认为爽肤水颜色对销售量没有影响,他
ST = SA + SB + SE
(9-11)
5
其中,
å å å ì
r
ïSA =
s
r
( Xi× - X )2 = s ( Xi× - X )2
ï
i=1 j=1
双因素方差分析有两种类型:一个是无交互作用的双因素方差分析,它假定因素 A 和因 素 B 的效应之间是相互独立的,不存在相互关系;另一个是有交互作用的双因素方差分析, 它假定因素 A 和 B 的结合会产生出一种新的效应。例如,若假定不同地区的消费者对某种颜 色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互 作用的背景,否则就是无交互作用的背景。下面我们将分别介绍无交互作用的双因素方差分 析和有交互作用的双因素方差分析。
双因素及多因素SPSS方差分析.ppt
0 0 0 0 0 0 0
3 6d 7 4 g i l 7 1 3 2
. 4 t
t .1 d
4 6 1 2 2 6 4 8 h 8 4
e
m SS u C 6 . 0 I3 . T 0 . D 6 . 0 L . T 0 . 6 T . T 3 . L 0 E T 0 C 6 a R 1 4 2 8 3 2 3 7
方差分析表
a. R Squared = .446 (Adjusted R Squared = .402)
NAU 李刚华
SPSS 协方差分析实例输出2 应用
参数估测值的输出结果表
P a r am e t e r E st i m a t e s Dependent Variable: 肺活量 95% Confidence Interval Parameter B Std. Error t Sig. Lower Bound Upper Bound Intercept 7.977 .886 8.998 .000 6.151 9.803 AGE -8.70E-02 .020 -4.447 .000 -.127 -4.670E-02 [TIME=1] .300 .303 .993 .330 -.323 .924 a [TIME=2] 0 . . . . . a. This parameter is set to zero because it is redundant.
NAU 李刚华
SPSS 多维交互效应方差分析实例输出1 应用
方差分析结果 因素变量表
w
j e
e D
e p a
e
c
n e e
rM l g t
p I e 0 0 0 0 0 0 0 0 e o Sr a eF r1 e 0 G 9 I5 7 G 2 G 7 G 4 o a r S q
双因素试验方差分析
SS E df E
SST
注意
df E dfT df A f B , SSE SST SSA SSB
各因素离差平方和的自由度为水平数减一,总平方 和的自由度为试验总次数减一。
双因素(无交互作用)试验的方差分析表
简便计算式:
SS A DA p, SSB DB p
双因素试验的方差分析
在实际应用中,一个试验结果(试验指标)往往 受多个因素的影响。不仅这些因素会影响试验结果, 而且这些因素的不同水平的搭配也会影响试验结果。 例如:某些合金,当单独加入元素A或元素B时, 性能变化不大,但当同时加入元素A和B时,合金性 能的变化就特别显著。 统计学上把多因素不同水平搭配对试验指标的 影响称为交互作用。交互作用在多因素的方差分析 中,把它当成一个新因素来处理。 我们只学习两个因素的方差分析,更多因素的 问题,用正交试验法比较方便。
双因素无重复(无交互作用)试验资料表
因素 B 因素 A
B1
X 11 ... X a1
B2
X 12 ... X a2
... Bb
... ... ... X 1b ... X ab
Ti. X ij X i. T b i.
j 1
b
A1 ... Aa
a b i 1 j 1
1 b i ij i 水平Ai对试验结果的效应 a j 1 1 a j ij j 水平Bj对试验结果的效应 b i 1 试验误差 ij X ij ij
特性:
i 1
a
i
0;
j 1
b
j
0; ij ~ N 0,
双因素方差分析课件
双原因无反复(无交互作用)试验资料表
原因 B 原因 A
B1
A1
X11
...
...
Aa
X a1
a
T. j X ij T.1 i 1
X. j T. j a X .1
b
B2 ... Bb Ti. X ij X i. Ti. b j 1
X12 ... X1b
T1.
X 1.
... ... ... ...
➢ 有交互作用旳双原因试验旳方差分析
有检验交互作用旳效应,则两原因A,B旳不同水 平旳搭配必须作反复试验。
处理措施:把交互作用当成一种新原因来处理,
即把每种搭配AiBj看作一种总体Xij。
基本假设(1)X ij 相互独立;
(2)Xij ~ N ij , 2 ,(方差齐性)。
线性统计模型
原因B
总平均 旳效应
53 58 48
a
T. j Xij 197 232 183 i 1
b
Ti. X ij j 1 165 143 145 159
T 612
X i. Ti. b
55.0 47.7 48.3 53.0
X. j T. j a 49.3 58.0 45.8
X 51
解 基本计算如原表
a b
双原因方差分析措施
双原因试验旳方差分析
在实际应用中,一种试验成果(试验指标)往往 受多种原因旳影响。不但这些原因会影响试验成果, 而且这些原因旳不同水平旳搭配也会影响试验成果。
例如:某些合金,当单独加入元素A或元素B时, 性能变化不大,但当同步加入元素A和B时,合金性 能旳变化就尤其明显。
统计学上把多原因不同水平搭配对试验指标旳 影响称为交互作用。交互作用在多原因旳方差分析 中,把它当成一种新原因来处理。
第九章方差分析报告与实验设计
3. 四个样本的均值越接近,推断四个总体均值相 等的证据也就越充分
4. 样本均值越不同,推断总体均值不同的证据就 越充分
如果原假设成立,即H0: m1 = m2 = m3 = m4 四个行业被投诉次数的均值都相等 意味着每个样本都来自均值为、差为2的
同一正态总体
f(X)
X
1 2 3 4
若备择假设成立,即H1: mi (i=1,2,3,4)不全 相等
至少有一个总体的均值是不同的 四个样本分别来自均值不同的四个正态总体
f(X)
X
3 1 2 4
四、问题的一般提法
1. 设因素有k个水平,每个水平的均值分别用 1、 2、 、 k 表示
第1步:选择【工具】下拉菜单,并选择【数据分析】选项,
第2步:在分析工具中选择【单因素方差分析】,然后单击 【确定】 ,
第3步:当对话框出现时, 在【输入区域】方框内输入数据单元格区域A3:D9。 在【a】方框内输入0.05(可根据需要确定。 在【输出选项】中选择优输出区域。
结果如图9-6
图9-6 用XExcel 进行方差分析的步骤
i1
组 内 平
旅游业:
6
(x2i x2)2 924
i1
SSE=700+924 +434+650
=2708
方
和
5
航空公司: (x3i x3)2 434
i1
家电制造业: 5 (x4i x4)2 650
i1
于是: ST=SSE+SSA
(4)计算统计量
SST的自由度为n-1; SSA的自由度为k-1; SSE的自由度为n-k。
第九章两因素及多因素方差分析
ab
x..k
xijk
i1 j1
abn
x...
xijk
i1 j1 k 1
i 1, 2,..., a j 1, 2,...,b k 1, 2,..., n
离差平方和的分解
aa
SSSSTT
bb
nn ((xxiijjkk xx...... ))22
ii11 jj11 kk 11
4 -149
-10
131
153
解:
根据经验,密度与施肥量之间不存在交互作用
C x.2. 3922 9604.0 ab 16
ab
SST
xi2j C 246868 9604.0 237264.0
i1 j1
SS A
1 b
a i 1
xi2.
C
74862 4
9604.0
9111.5
SSB
HA : 1,2, ,b不全为0
第二步:提出零假设和备择假设
要说明两个因素的交互作用是否显著:
H0 : ( )11 12 ( )ab 0 HA : ( )11,( )12, ,( )ab不全为0
第三步:计算统计量
平方和的简易计算法:
SST
a i 1
bn
SST
j1 k 1
a
xi2jk i 1
发酵实验方差分析表
变差来源 原料 A 温度 B
AB 误差 总和
平方和 1554.17 3150.58 808.75 1656.50 7170.00
自由度 2 2 4
27 35
均方 777.09 1575.29 202.19 61.35
F 12.67** 25.68** 3.30*
第九章方差分析及回归分析
解:2 SE /(n r) 0.000016
1 x1 0.242, 2 x2 0.256, 3 x3 0.262 x 0.253
1 x1 x 0.011, 2 x2 x 0.003
2019/11/8
1
例1 设有三台机器,用于生产规格相同的铝 合金薄板。取样,测量薄板的厚度精确至千 分之一厘米。得结果如下表所示。
铝合金板的厚度
机器1
机器2
机器3
0.236
0.257
0.258
0.238
0.253
0.264
0.248
0.255
0.259
0.245
0.254
0.267
0.243
0.261
SE ( X i1 X1)2
( X is X s )2
i 1
i 1
nj
(Xij X j )2 / 2 ~ 2 (nj 1)
i1
由 2分布的可加性知
s
SE / 2 ~ 2 ( (nj 1)) j 1
SE / 2 ~ 2(n s)
因F0.05(2,12) 3.89 32.92,
故在水平0.05下拒绝H0 , 认为各台机器生产的 薄板厚度有显著差异。
2019/11/8
23
(五)未知参数的估计
不管H0是否为真,ˆ 2
SE nr
是
2的无偏估计。
拒绝还是接受H0,需要作出两总体N (i , 2)和N (k , 2),
( Xij Xi.)( Xi. X )
i1 j1
i1
L2-第九章 方差分析
总 N 1 24 1 23
SS处理 ni X i X X i ni C
2 2 i
550.012 537.30 2 618.19 2 726.282 246398.0820 6 6 6 6 3742.5521
在实际运用中,往往将上述过程总结为如下的方差分析
表。
二、方差分析的应用条件 进行方差分析时,数据应满足以下两个应用条件: 1. 各样本是相互独立的随机样本,均服从正态分布。 当样本含量较小时,资料是否来自正态分布的总体难 于进行直观判断和检验,常常根据过去的经验;当样 本含量较大时,无论资料是否来自正态分布总体,数
变异、区组的变异和随机误差三个部分。
数理统计可以证明它们有如下的数量关系。
SS总 SS处理 SS区组 SS误差
总 处理 区组 误差
具体计算公式见下表:
二、随机区组设计资料方差分析的基本步骤 随机区组设计资料的方差分析步骤概括如下: ①. 建立假设 对于处理组 H0:4个总体均数全相等 H1:4个总体均数不等或不全相等 对于区组 H0:6个总体均数全相等 H1:6个总体均数不等或不全相等
bk个格子中,每个格子仅有一个数据Xij(i=1,2,3,,k; j=1,2,3,,b), 而无重复,因此其方差分析属无重复数据 的双向(因素)方差分析(two-way ANOVA)。
一、离均差平方和与自由度的分解 从该例数据表可以看出,随机区组设计资料的总变异 可以分解为:除处理的变异、随机误差外,还可分离 出区组变异。 区组变异 为6个不同窝别家兔血糖浓度值的样本均数
X j 各不相同,即 X j 与总均数 X 的不同。它既包含6个
区组的差异,也包含随机误差,其大小可用区组均方
Stata软件操作教程 (9)
实验4.2双因素或多因素方差分析
一、实验基本原理 在现实研究中,一个事件不可能仅受一个因素的影响,
恰恰相反,一个事件是受多个因素综合作用的结果, 所以多因素方差分析相比单因素方差分析有更广泛的 应用空间。下面以双因素方差分析中无交互作用的情 况为例,介绍一下多因素方差分析的基本原理。
例如,利用sales.dta数据做方差分析的练习,在这个 数据中,反映了一种饮料的销售情况,这种饮料有4种 颜色,在5家超市进行销售,除颜色之外其他条件全部 相同,分析一下饮料的颜色是否对销售量有影响。
对此问题进行差分析的命令语句为:
oneway sales color, tabulate 这个命令语句中,oneway是进行单因素方差分析的命
一般情况下,双因素方差分析的数据如表4.3所示排列, 影响因素有A和B两个。
二、实验数据和实验内容 实验数据来源于对某国女性工作情况的调查,
其中变量married是代表是否结婚的分类变 量,children是代表是否拥有子女的分类变 量,wage代表工资水平。完整的数据在本 书附带光盘的data文件夹的“wwork.dta” 工作文件中。
习题
1.利用usaauto.dta数据进行单因素方差分析,分析内 容为美国汽车的价格price是否受进口还是国产的影响, 即以price为因变量,以foreign为分类变量进行单因素 分析,并且进行结果的解读。
2.利用womenwork.dta数据进行多因素方差分析,分 析内容为妇女受教育水平education是否受结婚 married和是否有子女children以及二者交互项的影响, 即以education为因变量,以married、children和 married*children为自变量进行多因素分析,并且进行 结果的解读。
双因素方差分析方法
(
)
dfT , df A , df B , df E ,则
SS A df A MS A = ~ F ( ( a 1) , ( a 1)( b 1) ) FA = SS E df E MS E
SS B df B MS B = ~ F ( ( b 1) , ( a 1)( b 1) ) FB = SS E df E MS E
结论:工人对产品的产量有显著影响, 结论:工人对产品的产量有显著影响, 机器对产品的产量有极显著影响. 机器对产品的产量有极显著影响.
例1的上机操作 的上机操作
原始数据,行因素水平, 原始数据,行因素水平,列因素水平
对应例1 对应例 的数据输入方式
工人对产品产量有显著影响,而机器对产品产量的影响极显著. 工人对产品产量有显著影响,而机器对产品产量的影响极显著.
1 b 水平A α i = ∑ ij = i i 水平 i对试验结果的效应 a j =1 1 a 水平 β j = ∑ ij = i j 水平Bj对试验结果的效应 b i =1 试验误差 ε ij = X ij ij
特性: 特性:
∑ α i = 0;
i =1
a
β j = 0; ε ij ~ N ( 0, σ 2 ) ∑
SST = ∑∑ X ij X
i =1 j =1
a
b
(
)
2
可分解为: 可分解为:SST = SS A + SS B + SS E
SS A = b∑ X i. X
SS B = a ∑ X . j X
j =1 a b
a
i =1 b
(
)
2
称为因素A的离差平方和, 称为因素 的离差平方和, 的离差平方和 对试验指标的影响. 反映因素 A 对试验指标的影响. 称为因素B的离差平方和, 称为因素 的离差平方和, 的离差平方和 对试验指标的影响. 反映因素 B 对试验指标的影响.
第九章 方差分析(7讲3版)
F < F0.05(1, 2 ) 时,则P>0.05,不拒绝H0,尚不能认为喂养三
种不同饲料的大白鼠红细胞数相同。
2019/9/27
11
二、方差分析的应用条件 1.随机样本相互独立; 2.各样本来自正态总体; 3.各总体方差相等,即方差齐性。
2019/9/27
12
第二节 完全随机设计资料的方差分析
该结论的意义为,至少有两种饲料喂养大鼠红细胞数总 体均数不同。如果想确切了解哪两种饲料喂养的大鼠红细 胞数有差异,可进一步作多个样本均数的两两比较。
2019/9/27
18
第三节 随机区组设计资料的方差分析
随机区组设计(randomized block design)也称为配伍组 设计。
2019/9/27
第九章 方差分析
景学安
2019/9/27
1
[学习要求] 了解:方差分析的基本思想和多个样本的方差齐性 检验的方法。 熟悉:方差分析的应用条件;不同设计方法离均差 平方和与自由度的分解。 掌握:完全随机设计、随机区组设计和析因设计的 方差分析方法;多个样本均数两两比较的方法。
2019/9/27
2
方差分析是多个样本均数比较的假设检验方法。主要用于: 1.进行两个或两个以上样本均数的比较; 2.分析多个因素的独立作用及多个因素之间的交互作用; 3.进行两个或多个样本的方差齐性检验等。
i
(
j X ij )2 C 52.532 66.232 87.622 1183.1307
ni
12
12
12
=1235.2565-1183.1307=52.1528
ν组间=k-1=3-1=2 SS组内=SS总-SS组间=72.1639-52.1528=20.0381
双因素试验的方差分析
设:
X ijk ~ N ij , 2 , i 1,2,, r, j 1,2,, s, k 1,2,, t ,
各
X ijk
独立, ij , 2 均为未知参数。或写成:
2 ijk ~ N 0, , 各 ijk 独立 i 1,2,, r , j 1,2,, s, k 1,2,, t.
双因素试验的方差分析
影响试验结果的因素不止一个,要用双因素
或 多因素的方差分析;
确定哪些因素是主要的,它们对试验结果的
影响是否显著; 它们之间是否有交互作用。
(一)双因素等重复试验(有交互作用)的方差分析设有两个因
素A,B作用于试验的指标。 因素A有r个水平
因素B有s个水平
A1 , A2 ,, Ar
X . j.
1 r t X ijk , j 1,2,, s. rt i 1 k 1
总偏差平方和(称为总变差)
ST X ijk X .
2 i 1 j 1 k 1 r s t
ST写成:
S T X ijk X
i 1 j 1 k 1 s t r
1 1319 .82 2 2 2 S A B 110.8 91.9 90.1 2 24 S A S B 1768 .69250 , S E ST S A S B S A B 236.95000 .
得方差分析表如下:
表9.11 例1的方差分析表 方差来源 平方和 自由度 均 方 F 值
A1 A2
X 121 , X 122, , X 12t
…
X 211 , X 212, X 221 , X 222, , X 21t , X 22t
-方差分析
第12页,共47页。
取
F
SS A SSE
r 1 n r |H0成立 ~
F(r 1,n r),
给定显著性水平 ,当F F1 (r 1, n r) 时,
则拒绝 H0
也就是说有 1 的把握认为因素对指标有显著影响,
即 i 间的差异是显著的.
第13页,共47页。
数学模型
考虑的因素记为A,假定它有r个水平,并对水平Ai作ni次
SS A
SS E SS T
p1
p(n 1)
MS A
SS A p1
MS E
SS E p(n 1)
np 1
F MSA MSE
第16页,共47页。
SST , SSA , SSE 的计算
n
Ti• xij i 1,2,,p j1
pn
T••
xij
i1 j1
SST
p i 1
n j1
x i2j
r
ni
i1
,组平均值
xi
1 ni
ni
xij
j1
,
总平均值
x
1 n
r i1
ni j1
xij
1 n
r
nixi
i1
,则有平方和分解式:
第11页,共47页。
r ni
r ni
r
SST
(xij x)2
(xij xi )2 ni (xi x)2 SSE SSA
i1 j1
i1 j1
表 9.2.2 双因素等重复试验的方差分析数据
因素 B
因素 A
B1
B2
…
Bq
A1
x111 , x112 , x11r
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
a
b
2
1 a b 2 y ij SS T SS A SS B SS AB n i 1 j 1
(五)各项均方的计算
MST SST SST dfT abn 1
MS A
SS A SS A df A a -1 SSB SSB dfB b 1
总自由度:df =abn-1
T
A因素处理间自由度:df =a-1
A
B因素处理间自由度:df =b-1
B
交互作用自由度:df =(a-1)(b-1)
AB
处理内自由度:dfe=ab(n-1) df =df +df +df +dfe
T A B AB
(四)平方和的简便计算方式
SS T y ijk C
j1
b
2、提出假设
H 01: i 0, H A1: i 0 H 02: i 0, H A2: i 0
3、检验统计量的计算
在F检验时,A因素、B因素的检验统计量均以MSe做分母
FA=MSA/MSe FB=MSB/MSe
用F分布的上尾检验,拒绝域为F>Fα
(三)交互作用的判断
2 2
H 02: 0, H A2: 0
2 2
H 03: 0,H A3: 0,其中i 1,2, ...,a; j 1,2, ...,b
2 2
3、检验统计量的计算
在 F 检验时, A 因素、 B 因素主效应的检验统计量
是以 MSAB 做分母;互作效应的检验统计量以 MSe
二、双因素交叉分组试验设计的描述
(一)双因素试验的数据描述
(二)观测值的描述
(三)平方和与自由度的分解 (四)平方和的简便计算公式
(五)各项均方的计算
(一)试验数据的描述
B1 y111 y112 ┆ y11n y211 因素A i=1., 2,3„,a A2 y212 ┆ y21n ┆ ya11 Aa ya12 ┆ ya1n y.1. 因素B j=1.,2,3„,b B2 … y121 … y122 ┆ y12n y221 y222 ┆ y22n ┆ ya21 ya22 ┆ ya2n y.2. … … … … Bb y1b1 y1b2 ┆ y1bn y2b1 y2b2 ┆ y2bn ┆ yab1 yab2 ┆ yabn y.b. ya.. y2.. 和
A1
y1..
┆
┆
和
y…
(二)观测值的描述
对于上表中的每一个观测值可用线性统计模型描述
y ijk i j ij ijk 其中表示所有观测值的总平 均数
i 表示因素A第i水平的处理效应 j表示因素B第j水平的处理效应 ijk 表示随机误差
ij 表示因素A的第i水平和因素B第i水平的交互效应
23,27
36,34
该实验有可能属于哪几种模型?前提是什么?
如果认为是随机模型,设置重复与不设重复对
分析结果有无影响?
若实验本身是固定模型,但分析时误认为随机
模型,对结论有何影响?若不设重复,又有何
影响?
题解:(1)该实验可能属于固定模型、随机模型、 混合模型。取决于添加剂本身的性质,即添加剂 的效果能否严格重复。
第五节 数据变换
第一节 双因素方差分析概述
一、双因素试验汇中的几个基本概念
效应,该效应水平的改变会造成因素效应的改变,
如包装方式对果汁销售量的影响。
1 、主效应( main effect ):各实验因素相对独立的
2、互作效应(interaction):两个或多个实验因素的
相互作用而产生的效应。
3、无交互作用的双因素方差分析或无重复双因素方
a a n 2 E (MS B ) 2+ j b 1 i 1
(二)无重复实验时的双因素方差分析
1、观测值的描述
y ijk i j i j,其中i 1,2, ...a; j 1,2, ...b;
i 1
a
i
0; 分布N 0, 2 的 随机变量 j 0; i j为相互独立且服从正态
MS B
MS AB
SS AB SS AB a - 1b - 1 df A
SSe SSe MSe dfe ab(n - 1 )
第二节 不同实验类型的双因素方差分析
一、固定模型
(一)重复试验时的双因素方差分析 1、观察值的线性统计模型
yijk i j i j i jk,其中i 1,2, ...a; j 1,2, ...b; k 1,2, ...n;
做分母
FA=MSA/MSAB FB=MSB/MAB FAB=MSAB/MSe
用F分布的上尾检验,拒绝域为F>Fα
注意:检验统计量的分母与统计量的第二自由度
与固定效应不同
4、均方期望
E(MSe )
2
2
E(MS A ) +n bn
2 2
2
E(MSB ) +n an
MSe做分母:FA=MSA/MSe FB=MSB/MSe FAB=MSAB/MSe
用F分布的上尾检验,拒绝域为F>Fα
4、均方期望
E(MSe )
2
bn a 2 E ( MS A ) + i a 1 i 1
2
a n 2 E (MS AB ) + ij (a 1)(b 1) i 1 2
交叉分析。
肥料种类 小麦品种 1 2 3 4
y j
不同条件下小区产量/kg (NH4)2SO NH4NO3 Ca(NO3)2
4
y i
19.5 22.57 13.27 30.13
21.1 24.0 14.2 31.5 22.7
18.0 22.0 13.3 31.4 21.18
19.4 21.7 12.3 27.5 20.23
自由度 3 3 9
均方 197.458 121.792 47.236
统计量F 24.68** 15.22** 5.904**
误差 总和
128 1510.875
16 31
8
查F分布表: F0.95 (3,6) 3.24; F0.99 (3,6) 5.29; F0.95 (9,16) 2.54; F0.99 (9,16) 3.78
变差来源 小麦品种 肥料种类 误差 总和
平方和 442.17 12.47 7.69 462.33
自由度 3 2 6 11
均方 147.39 6.24 1.28
统计量F 115.02** 4.87
小麦品种间差异极显著,肥料间无显著差异。
例 2 :用两种不同的饲料添加剂 A 和 B ,以不同比
例搭配饲养大白鼠,每一种饲料添加剂取4个水平,
差分析 (Two-factor without replication) :两个因素
对试验结果。两个因素对试验数据的影响。
4、有交互作用的双因素方差分析或可重复双因素方
差分析 (Two-factor with replication):如果两个因
素对试验数据的单独影响外,两个因素的搭配还
会对结果产生一种新的影响。
j1
b
2
AB交互作用误差平方和
SS AB n y ij y i y j y
a b i 1 j 1
2
随机误差项平方和
2 SSe (y ijk y ij) i 1 j 1 k 1 a b n
2、平方和的分解
与平方和相应的自由度分别为:
分析的结果可得出什么结论?
肥料种类 小麦品种 1 不同条件下小区产量/kg (NH4)2SO4 21.1 NH4NO3 18.0 Ca(NO3)2 19.4
2
3 4
24.0
14.2 31.5
22.0
13.3 31.4
21.7
12.3 27.5
题解
解:本题影响产量的因素包括肥料种类和小麦品
种。该问题属于混合模型中无重复的两因素分组
(三)平方和与自由度的分解
1、平方和的分解
总平方和SST被分解为A因素所引起的平方和SSA、 B因素所引起的平方和SSB、AB交互作用所引起 的平方和SSAB、误差平方和SSe
A因素误差平方和
SS A bn y i y
i 1
a
2
B因素误差平方和 SS B an y j y
2 i 1 j 1 k 1
b
a
b
n
SS A 1
bn i 1
a
y an
a
y j C
2 j1 b 2
SS AB n y ij y i y j y
i 1 j 1
n
SSe y ijk
所以FA、FB、FC均达极显著,所以大白鼠增重与 添加剂A、B及其交互作用都有显著关系。
随机模型下:
FA MS A 4.18* * MS AB
MS B FB 2.58 MS AB
FAB
MS AB 5.904* * MSe
查F分布表: F0.95 (3,9) 3.86; F0.99 (3,9) 6.99
第九章 双因素和多因素方差分析
学习目标
掌握:两因素交叉分组(有重复观察值、
无重复观察值)资料的方差分析方法。