心理学统计方差分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
近来关于随机区组和被试内实验设计以及对应的方差分析的问题,多人追问不止。既自觉已思路清晰、天下无敌。特本着一半自己再梳理一下,一半友好互助的形式小写个群邮件,充个英勇,让大家也分享下。定是不足与不当多多,盼批评指正。
相信把这个东西认真看完,思路不清晰的童鞋马上也会思路清晰起来。
看似很复杂,实际上我尽全力做到深入浅出,因此,相信只要是地球人都可以看得懂。
一、随机区组的被试分配:
a1 a2
区组 b1 b2 b1 b2
1 1 4 7 10
2 2 5 8 11
3 3 6 9 12
数据刻意简单化,不合理没有关系。
是个2*2随机区组设计,3个区组。
如何分配被试?首先,随机区组的每个区组的被试应该是有差异的,否则就不需要分区组了,直接完全随机就可以了。
因此随机区组的前提是:区组间异质,而区组内的被试尽可能同质。
被试有以下几个情况:
第一分配方式:假设该实验的被试总个数为24个,每个区组的被试为8个。他可以有两种分配方式
1、将每组中的任意每2个被试随机接受一种处理,2*4=8
2、8人同时接受所有的处理,1*8=8
需要注意的三个问题:
1、一般都用第一种情况,第二种不用,因为区组内的这8个人本来就是理论上的同质的,所以只要把他们分开,随机接受不同的处理就能说明问题,这样可以省时,省钱,还能避免每个人由于重复测量导致的额外变量的增加。
2、它强调了区组内的被试随机接受不同的实验处理,也因此叫随机区组。
3、它要求每个区组的被试单位应该是实验处理水平的整数倍。如8/4=2
第二种分配方式:假设该实验的被试一共是3个,就是说,一个被试为一个区组。那么每个区组的这个被试全部接受实验的4个不同水平的处理。这个时候就需要平衡实验的顺序,防止一个人不短的被实验而出现的顺序效应,如何平衡,一般用“ABBA”或所谓的“拉丁方”。
第三种分配方式:当一个大团体(如学校)为一个区组的时候,而大团体中又有小团体的时候(如学校中的班级),通常让一个小团体接受一种处理。例如:ABC分别是不同的三个学校,他们各自为一个区组,那么A学校是区组一,A学校就要抽四个班级出来,每个班级随机接受一种实验处理。
注意:传统的观点认为上述“第二种方式”----一个被试为一个区组的情况不叫区组,叫被试内设计,就是因为每个被试都接受了不同的实验处理,因此没有随机可言。其具体的方差分析和随机区组的方差分析也有所差别。表现在SS残差的是否细分。具体往下看。
二、随机区组的方差分析
还是那个例子:
a1 a2
b1 b2 b1 b2
区组处理1 处理2 处理3 处理4
1 1 4 7 10
2 2 5 8 11
3 3 6 9 12
假定研究某种药物对某种操作的影响
自变量A(药物)有两个水平,药物分别是0单元和2单元
自变量B(实验环境)有两个水平,环境1和环境2。
分别取三个不同层次的个体,分别是:少年、青年、老年。
数据刻意简单化,不合理没有关系。
是个2*2随机区组设计
区组的个数n=3
a因素的处理水P=2
b因素的处理水平q=2
所有的处理水平p*q=4
所有的被试单位=N =npq =3*2*2=12
为了本质化,特意把所有的无聊的SS后面的字母统统去掉,用汉字表达
平方和的分解:
SS总=SS处理间+SS区组+SS残差
1、SS总=整个实验的每个具体测量值和整个实验的总平均数差的平方再求和。
即:SS总=∑(X-μ)^2(μ=总平均数,X=各原始测量值)
2、“SS处理间”是什么意思?
例子一共有4种处理,因此,SS处理间=4种处理中,n倍的“每一种处理的平均值与整个实验总平均值差的平方再求和”。
即:SS处理间=n*[∑(各种处理平均值-μ)^2](μ=总平均数)
3、“SS区组”是什么意思?
例子一共有3个区组,因此,SS区组=3个区组中,pq倍的“每一个区组的平均值与整个实验总平均值差的平方再求和”。
即:SS区组=pq*[∑(各区组平均值-μ)^2](μ=总平均数)
如何具体求SS总、SS处理间、SS区组?
1、求SS总:
因为SS总=∑(X-μ)^2(μ=总平均数,X=各原始测量值)
又因为整个实验的总平均数=6.5
因此SS总=∑(X-μ)^2=(1-6.5)^2+(2-6.5)^2+(3-6.5)^2+……+(12-6.5)^2 (μ=总平均数,X=各原始测量值)
2、求SS处理间:
因为SS处理间= n*[∑(各种处理平均值-μ)^2](μ=总平均数,X=各原始测量值)
又因为处理1的平均值是2;处理2的平均值是5;处理3是8,处理4的是11。
因此SS处理间= n*[∑(各种处理平均值-μ)^2]=3*[(2-6.5)^2+(5-6.5)^2+(8-6.5)^2+(11-6.5)^2]
3、求SS区组:
因为SS区组= pq*[∑(各区组平均值-μ)^2](μ=总平均数,X=各原始测量值)
又因为区组一的平均值是5.5,区组二的平均值是6.5,区组三的平均值是7.5。
因此SS区组= pq*[∑(各区组平均值-μ)^2]=4*[(5.5-6.5)^2+(6.5-6.5)^2+(7.5-6.5)^2]
4、求SS残差:
直接用SS残差= SS总-SS处理间-SS区组
但是实际中,计算一般不用先求对应的平均数,而是直接用原始数据。
根据数学转化,可以得出以下等式:(数学转换过程不需要管)
1、SS总=∑(X-μ)^2=∑X^2-[(∑X) ^2]/npq(μ=总平均数,X=各原始测量值)
2、SS处理间= n*[∑(各种处理平均值-μ)^2]=∑[(各种处理的总值^2)/n]-[(∑X) ^2]/npq(X=各原始测量值)
3、SS区组= pq*[∑(各区组平均值-μ)^2]=∑[(各区组的总值^2)/pq]-[(∑X) ^2]/npq(X=各原始测量值)
所以可以用原始数据这么计算: