多因素方差分析平方和与自由度的分解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
D O I:10.13546/ki.tjyjc.2020.12.013 ^——-r-----—j'
-------------------[理论探讨
多因素方差分析平方和与自由度的分解
林必博,周济铭
(杨凌职业技术学院生物工程学院,陕西杨凌712100)
摘要:方差分析是数理统计中最常用的一种统计分析方法。
为了用简单、明了、实用的统计分析方法取 代艰涩难懂的数学模型建立和公式演算,阐明多因素多水平试验方差分析的思想以及平方和与自由度分解方 法,文章总结完善了一套简单实用的因果关联表法进行方差分析中平方和与自由度分解计算方法,适用于教学 工作者和科研工作者,也适用于统计软件开发工作者。
关键词:方差分析;平方和;自由度
中图分类号:0212.6 文献标识码:A文章编号:1002-6487(2020)12-0064-03
0引亩
方差分析是在可比较的数据中,把数据间总的“离均差 平方和”按各指定的变差来源进行分解的一种技术[11。
其核 心要义就是将引起试验结果(试验指标)变化的原因进行 分析分解,并计算出各个原因引起试验结果变化的均方,再进行试验处理均方与误差均方大小比较(F检验),对试 验处理有效无效做出结论<21。
多因素多水平试验方差分析与单因素多水平试验方 差分析的基本思想是一致的,不同之处在于各因素对试验 指标起作用,而且各因素的不同水平搭配也对试验指标起 作用,即各因素间存在众多的交互作用'文献[4]在试验 结果变化原因分析分解时,全面考虑了三因素主效作用和 各因素间交互作用,并给出了分析原理,但也采用了数学 建模形式讲解。
本文重点介绍有交互作用三因素随机区 组试验设计方差分析平方和与自由度分解计算方法,不再 采用建模形式,而是采用列因果关联表进行分解计算。
且 不同的试验设计各具有不同的应用特点,引起试验结果变 化的原因也各不相同。
但同一类型试验具有相似的试验 结果变化原因,因此,可按试验设计类型对试验结果变化 原因进行分析分解。
1引起试脸结果变化的通因分析
随机区组试验设计是一种常用的试验设计方法,也是 试验三大原则:重复原则、随机原则、局部控制原则的最好 应用和体现,具有较高的精确性和灵活性。
试验在实施时 严格控制同一区组内非研究因素干扰,实现最大化可比 性,不同区组之间允许存在差异。
因此,这类试验结果采 用方差分析时,试验结果变化主干原因可分解为:
总变差=试验处理变差+区组变差+误差变差。
对A、B、C三因素试验,在处理有效情况下,若各因素 间存在交互作用或各因素间交互作用不明确,则试验处理 变差还可分解为:
试验处理变差=A因素变差+B因素变差+ C因素变 差+A因素与B因素互作变差(A x B)+A因素与C因素互 作变差(A x C)+ B因素与C因素互作变差(B x C)+ A因素、B因素、C因素互作变差(A x B x C)。
其平方和及自由度分解如下:
SST=SS,+SSr+SS e,dfT^df,+dfr+dfe
SS,= SSA+SSg+ ssc+SSA xB+SSAxC+SSBxC+SSA xB xC dft=4fA+dfB+dfc+dfA xB + dfAxC+dfBxC + dfA xB)(C
2平方和与自由度分解计算
在方差分析中,为了估算各个变化原因的均方(方差)大小,必须要先计算各个变化原因的平方和及自由度,这 就是平方和及自由度分解计算。
在以往教学中,主要采用 建立数学模型、公式演算来讲解,抽象而难理解,不利于厘 清平方和及自由度分解思路和方法掌握,教学效果不理 想。
本文总结了应用因果关联表进行平方和及自由度分 解计算,提髙了学生对这部分内容的理解和掌握,增强了 学生试验分析应用技能。
因果关联表就是将试验中设置的试验处理和主要要 解决的干扰因素等明确引起试验结果变化的原因作为表 头,将试验结果原始数据填写进各单元格,通过计算各行 或各列的算数平均数,达到分解隐含于试验原始数据中的 各个原因的变差,即实现各变化原因的平方和及自由度分 解。
因表头是原因,对应的各行或各列平均数是结果,故 称为因果关联表。
这种列表的方法比较简单、直观、明了,易于掌握,不易遗漏和出错。
作者简介:林必博(1982—),男,陕西商洛人,硕士,讲师,研究方向:生物技术及应用。
(通讯作者)周济铭(1966—),男,陕西岐山人,副教授,研究方向:农业生物技术。
64 统计与决策2020年第12期•总第552期
(W^W W)
例如N、P、K三种肥料配方施用对玉米产量影响研究
试验,三因素各为2水平,5次重复,随机区组设计,试验结
果如表1所示,试作方差分析平方和与自由度分解计算。
表1 N、P、K三种肥料配方施用对玉米产置影响研究试验结果
区组
处理
N.P.K,NJMC丨n,p2k,n,p,k2n,p2k2N^K丨N zP.K a
151.261.454.255.460.861.259.362.7 253.359.356.457.262.363.158.064.5 352.857.553.154.663.464.955.261.9 454.262.355.650.961.760.553.765.2 554.062.554.765.958.853.766.862.2表2 处理、区组因果关联表
区组
处理
N.P.K,NjP丨K丨n,p2k,N丨P_K2N^K,N JP丨K2N z P2K2xr
151.261.454.255.460.861.259.362.758.3 253.359.356.457.262.363.158.064.559.3 352.857.553.154.663.464.955.261.957.9 454.262.355.650.961.760.553.765.258.0 554.062.554.765.958.853.766.862.259.8 X53.160.654.856.861.460.758.663.358.7表2中最后一行8个平均数分别对应8个不同处理,反映了试验处理对试验结果的影响;最后一列5个平均数 对应5个不同区组,反映了试验区组对试验结果的影响。
这两组平均数是计算处理和区组平方和与自由度的依 据。
表中最后一个单元格中的平均数是所有数据的平均 数。
也是'X,和又这两组平均数的平均数。
因此:
40
^r= £(^.-'X)2;C=4〇-l
55r= 5£(^-'J〇2;^= 8-l
/=1
SST=^X-'X f-dfT=5-\
r=1
试验误差的平方和与自由度可由下式计算:
-S S-SSr,d f=dfT-df,-dfr
表3 N、PK因果关联表
PK
N
N,N,'X|>K 51.261.4
53.359.3
P,K,52.857.556.8
54.262.3
54.062.5
54.261.2
56.463.1
p2k,53.164.957.7
55.660.5
54.753.7
55.459.3
57.258.0
P.fc54.655.257.7
50.953.7
65.966.8
60.862.7
62.364.5
P2K263.461.962.4
61.765.2
58.862.2
56.560.858.7
表3中最后一行2个平均数分别对应N肥2个不同水 平,反映了 N肥对小区玉米产量的影响;最后一列4个平 均数对应P肥与K肥二因素4个水平组合,反映了 P肥、K 肥共同对小区玉米产量的影响。
这两组平均数是计算N 肥主效应和P肥K肥共同效应平方和与自由度的依据。
表中最后一个单元格中的平均数是所有数据的平均数。
也是'X N和'Xpx这两组平均数的平均数。
因此:
SS n=20^(XN-'X)2;dfN=2-\
N=\
5V= l〇Z(^-'^)2;^=4-1
P K=\
表4 P、NK因果关联表
NK
P
P.P2XN K
51.254.2
53.356.4
N,K,52.853.154.0
54.255.6
54.054.7
61.461.2
59.363.1
n2k,57.564.960.6
62.360.5
62.553.7
55.460.8
57.262.3
n,k254.663.459.1
50.961.7
65.958.8
59.362.7
58.064.5
N2K255.261.960.9
53.765.2
66.862.2
'XP57.360.058.7
表4中最后一行2个平均数分别对应P肥2个不同水 平,反映了 P肥对小区玉米产量的影响;最后一列4个平均 数对应N肥与K肥二因素4个水平组合,反映了 N肥、K肥 共同对小区玉米产量的影响。
这两组平均数是计算P肥 主效应和N肥K肥共同效应平方和与自由度的依据。
表 中最后一个单元格中的平均数是所有数据的平均数。
也 是'X P和'X™这两组平均数的平均数。
因此:
55/>= 20^(^/,-'X)2;dfp=2-l
/»*1
5V= l〇X(Z^-'^)2;dfN K=4-l
N K=\
下页表5中最后一行2个平均数分别对应K肥2个不 同水平,反映了 K肥对小区玉米产量的影响;最后一列4 个平均数对应N肥与P肥二因素4个水平组合,反映了 N 肥、P肥共同对小区玉米产量的影响。
这两组平均数是计 算K肥主效应和N肥P肥共同效应平方和与自由度的依 据。
表中最后一个单元格中的平均数是所有数据的平均 数。
也是飞1(和1#这两组平均数的平均数。
因此:55^=20 X(XK-'X)2-dfK=2-\
K=\
统计与决策2020年第12期•总第552期
65
表5 K、NP因果关联表
NP
K
K,K,x w 51.255.4
53.357.2
N丨P,52.854.655.0
54.250.9
54.065.9
61.459.3
59.358.0
n2p_57.555.259.6
62.353.7
62.566.8
54.260.8
56.462.3
n,p253.163.458.1
55.661.7
54.758.8
61.262.7
63.164.5
n1p264.961.962.0
60.565.2
53.762.2
X,57.360.058.7
Z^XN P~'X)2;dfN P=4-1
NP=\
由于:
SSt=SSN+SSp+SSK+SSN xP+SSNxK+SSpxK+SSN xP xK dft=df n+df p dfK dfN xP七dfN xK+dfPxK dfN r iP x K
因此:
S S N,P=S S NP ~ S S N ~ S S P ^df N,P= df N P ~ df N ~ df p=
(4-1)-(2-1)-(2 -1)=1
S S N xK=S S NK ~ S S N ~ S S K ^df N x K=d f N K~df N~df K
=(4-1)-(2-1)-(2-1)=1
SS p X K=SSP K—SS p—SS K\df P x K=dfP K—dfp—dfK
=(4-l)-(2-l)-(2-l)=l
dft^puK^dft—dfN—dfp—dfk—dff^p—dff^K—dfpxK
=(8-l)-l-l-l-l-1-1=1
对上文列举N、P、K三种肥料配方施用对玉米产量影 响研究试验,通过列表2,将处理、区组、误差三方面平方 和及自由度分解出来;若处理有效,且各因素间交互作用 需要分析,又可通过列表3、表4、表5三个因果关联表,将 N肥、P肥、K肥主效作用,N肥与P肥互作、N肥与K肥互 作、P肥与K肥互作,N肥与P肥与K肥互作七个方面的平 方和及自由度分解出来,实现有交互作用三因素多水平试 验方差分析中平方和与自由度分解计算。
3结束语
数理统计教学的主要任务之一是培养学生建立清晰 的思维方法,掌握一种简单实用的分析工具,因此,在教学 过程中清晰地阐述方差分析的基本思路,厘清平方和与自 由度分解的基本原理,掌握关联表法分解平方和与自由度 的方法就十分必要。
方差分析中平方和与自由度分解是 重点,也是难点,为了让学生直观明了掌握这一技能,就应 从离均差平方和概念出发进行分解计算。
本文根据随机 区组试验设计的特点,利用因果关联表法,对有交互作用 三因素多水平随机区组试验方差分析中平方和与自由度 分解进行了阐述,采用列因果关联表的方法代替公式推导 演算,将各个原因对应的结果值筛选出来,通过直接计算 离均差平方和实现分解任务,降低了分解的难度和抽象 性,也减少了学生计算出错的概率。
参考文献:
[1] 吴坚•应用概率统计(第二版)[M].北京:高等教育出版社,2007.
[2] 盛驳.概率论与数理统计(第三版)[M].上海:上海交通大学出版社,
2011.
[3】张忠群.概率论与数理统计[M].贵阳:贵州大学出版社,2008.
[4】郭萍.有交互影响的三因素方差分析原理及应用[J].曲阜师范大学 学报(自然科学版),2015,41(4).
(责任编辑/浩天)
D eco m p o sitio n o f Square Sum and D egrees o f F reedom in M ultivariate A N O V A
Lin Bibo1,Zhou Jiming
(Faculty of Bioengineering,Yangling Vocational and Technical College,Yangling Shaanxi 712100, China)
Abstract:Analysis of variance(A N O V A)i s one of the most commonly used statistical analysis methods in mathematical statistics.In order to uses simple,clear and practical statistical analysis method to replace the difficult mathematical model establishment and formula calculation,and to clarify the idea of multi-factor and multi-level test variance analysis and the decomp>osition method of square s u m and freedom degrees,this paper summarizes and improves a set of simple and practical methods of causal association table for decomposing and calculating the s um of squares and degrees of freedom in A N O V A,which i s suitable for teaching and research workers as well as statistical software developers.
K e y w o r d s:analysis of variance;square s u m;degree of freedom
66统计与决策2020年第12期•总第552期。