方差分析变异分解思路剖析(精品文档)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方差分析变异分解思路剖析
第一部分:方差分析变异分解的整体思想
差分析法是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术,方差分析实质上是关于观测值变异原因的数量分析。
从变异性分解角度来看,主要是对观测值的总变异进行分解。
分解为两大部分:第一,来自于自变量不同处理效应的影响;第二,来自于误差因素的影响(即包括随机化选择被使过程中所产生的随机因素,也包括一些无法辨别来源的残差)。
以单因素完全随机设计为例。
某心理学家为了考察训练教程对儿童创造思维能力的影响,将20名被试随机分成四个组,每组5人,每组采用一种教程进行训练,一学期后每个被试的创造思维能力评分如下表,试检验训练教程的作用是否有显著的差异。
在这个例子中,自变量为训练教程,一共有四个水平。
因变量为创造性思维能力得分。
那么所有被试在因变量上得分的差异性(即变异)可以分解为两个来源:第一,由于自变量的四个水平所产生的四个组之间的差异性;第二,由于选择被试所导致的组内被试之间的差异性。
第二部分:不同实验设计下变异来源分解剖析
一、单因素完全随机设计
此主题相关图片
变异分解的一般逻辑:
首先,计算总变异;
然后,计算处理产生的变异;
最后,用总变异减去处理产生的变异即误差变异。
在单因素完全随机设计中,处理产生的变异即水平组间变异。
利用原始数据计算变异的公式规律:
第一,总平方和和组间平方和的后一项记为CM,矫正数,均为总数据和的平均平方。
求多少和,即对多少平均。
第二,总平方和的前一项为所有原始数据平方的和。
第三,组间平方和的前一项为每组数据和的平方求平均,然后把几个组的计算结果相加。
PS:对我们的启示是在平方和处理变异分解过程中,我们只要搞清楚处理处理是指那几个
组就差异就可以了。
以第一部分中单因素随机实验设计为例。
具体数据见下表:
此主题相关图片
总数据和为477,总数据和的平方为:227529,平均的总数据和的平方为:11376.45(有20个数据)。
该项即为矫正项。
所有原始数据平方的和为:13309。
因此,总平方和为1932.55。
组间平方和的前一项为每组数据和的平方求平均,然后把几个组的计算结果相加。
即:12930.2。
因此,组间平方和为:1553.75。
组内平方和为总平方和减去组间平方和。
因此,组内平方和为:378.80。
具体结果见下表。
此主题相关图片
总结:我们发现,在方差分析不同实验设计的变异分解中,总变异的概念是一致的,矫正项的概念是一致的。
而误差变异又可以通过总变异减去处理变异即可。
因此,只要搞清楚处理变异的计算就可以搞定所有实验设计下方差变异的分解问题。
处理变异计算的关键点:只要搞清楚处理来源涉及到哪几个处理水平之间的差异性即可。
下面以各种其它实验设计的方差分解为例,进一步理解这一思想。
二、单因素随机区组设计
单因素随机区组设计和单因素完全随机设计的区别是单因素区组设计通过区组因素很好的控制了一个无关变量对因变量的影响(即:区组因素是一个无关变量)。
在统计上来说,是通过估计出区组因素所产生的平方和,减少了误差平方和的大小,从而提高了统计检验效力。
单因素随机区组设计的一个前提条件是:区组因素和自变量因素之间不存在交互作用。
否则需要采用两因素析因实验设计。
单因素随机区组设计的总变异被分解为以下的几个部分:
第一,自变量效应所产生的变异;
第二,区组效应所产生的变异;
第三,误差变异。
自变量效应所产生的变异以及区组效应所产生的变异的计算方法同单因素完全随机设计的组间效应的计算。
关键是要搞清楚是在计算哪几个组之间的变异性。
三、单因素重复测量实验设计
单因素重复测量实验设计和单因素完全随机实验设计的区别在于被试分配到处理中的方法是不一样的。
在单因素完全随机设计中,不同处理水平下的被试是不一样的。
而在单因素重复测量实验设计中,所有的被试均接受了所有处理水平的影响。
单因素重复测量实验设计的优点是可以控制被试间差异这一无关变量对因变量所造成的影响。
从统计上来说,是通过把被试间差异所导致的变异从误差变异中区分出来,减少了误差平方和的大小,从而提高了统计检验效力。
单因素重复测量实验设计的总变异可以分解为以下几个部分:
第一,自变量效应所产生的变异;
第二,被试间差异所导致的变异;
第三,误差变异。
下图反映的是三种不同的单因素实验设计的被试分配方案:
此主题相关图片
四、多因素析因完全随机实验设计
多因素析因完全随机实验设计属于被试间设计的一个多因素析因实验设计,其优点是可以进行交互作用的分析。
交互作用产生的变异是通过对组间变异分解实现的。
在多因素析因完全随机实验设计中,我们把组间变异分解为主效应和交互作用效应。
已2*3完全随机析因设计为例。
假定存在两个自变量因素A和B,A有两个水平,称为A1,A2,B有三个水平,称为B1,B2,B3。
那么组间总变异是由A因素和B因素相交以后产生的6个处理水平组所产生的变异。
而A因素的主效应和B因素的主效应是分别由A因素2个水平组和B因素的三个水平组所产生的。
交互作用效应即用组间效应减去A因素和B因素的主效应获得的。
2*3完全随机析因设计的总变异可以分解为以下几个部分:
第一,A因素主效应所产生的变异;
第二,B因素主效应所产生的变异;
第三,AB因素的交互作用效应所产生的变异;
第四,误差变异。
五、多因素析因重复测量实验设计
多因素析因重复测量实验设计属于被试内设计,其与单因素重复测量实验设计的差别同多因素完全随机析因设计和单因素完全随机设计的区别。
其优点也是可以进行交互作用的分析。
在此不在赘述。
多因素析因重复测量实验设计的总变异可以分解为以下几个部分:
第一,A因素主效应所产生的变异;
第二,B因素主效应所产生的变异;
第三,AB因素的交互作用效应所产生的变异;
第四,被试间差异所导致的变异;
第五,误差变异。
六、多因素析因混合实验设计
多因素析因混合实验设计即包括了组间因素,也包括了组内因素(即被试内因素)。
因此在分析过程中是最复杂的。
其复杂性只要体现在对于组间因素的效应分析所采用的误差因素和对组内因素的效应分析所采用的误差因素是不一样的。
也可以认为是把组间设计的方差分解和组内因素的方差分解结合起来的一种方差分析技术。
具体分解过程可以参考舒华《多因素实验设计》一书。