第六章 方差分析
教育与心理统计学 第六章 方差分析考研笔记-精品
第六章方差分析第一节方差分析概述一.方差分析的定义[用途]定义:用途方差分析也称为变异数分析,是在教育与心理研究中最常用的变量分析方法,其主要功能在于分析测量或实验数据中不同来源的变异对总变异的贡献大小,从而确定测量或实验中因素对反应变量是否存在显著影响。
即用于置信度不变情况下的多组平均数之间的差异检验。
它既可以比较两个以上的样本平均数的差异检验,也可以应用于一个因素多种水平以及多个因素有多种水平的数据分析。
二.方差分析的作用方差分析主要应用于两种以上实验处理的数据分析,同时匕徽两个以上的样本平均数,推断多组资料的总体均数是否相同,也即检验多组数据之间的均数差异是否有统计意义。
在这个意义,也可以将其理解为平均数差异显著性检验的扩展。
当我们用多个t检验来完成这一过程时,相当于从t分布中随机抽取多个t值,这样落在临界范围之外的可能大大增加,从而增加了I型错误的概率,我们可以把方差分析看作t检验的增强版。
方差分析一次检验多组平均数的差异,降低了多次进行两组平均数检验所带来的误差。
在进行方差分析时,设定的假设是综合虚无假设,即假设样本所归属的所有总体的平均数都相等。
如果检验的结果是存在显著性差异,只能说明多组平均数之间存在显著性差异,但是无法确定究竟哪些组之间存在显著性差异,此时需要运用事后检验的方法来确定。
三.方差分析的相关概念一(一)数据的变异(1)变异:统计中的变异是普遍存在的7一般意义上的变异是指标志(包括品质标志和数量标志)在总体单位之间的不同表现。
可变标志的属性或数值表现在总体各单位之间存在的差异,统计上称之为变异,这是广义上的变异,即包括了品质标志和数量标志,有时仅指品质标志和在总体单位之间的不同表现。
注:随机性,即变异性。
(2)组间变异[组间差异]:组间变异表示处理间变异,主要指由于接受不同的实验处理(实验处理效应)而造成的各组之间的变异,可以用两个平均数之间的离差来表示,可将组间离差平方和记为SS AO组间差异可用组间方差来表征,用符号MS B表示。
第六章 方差分析 《统计学》PPT课件
若因素 A 和 B 的每个水平组合只有一个观测值,即 k 1,则上式可简化为:
xij x i j ij
( i =1,2,…,r; j =1,2,…, s )
二、只考虑主效应的双因素方差分析
二、只考虑主效应的双因素方差分析
如果影响因素的不同水平对因变量产生了显著影响,那么,它和随 机因素共同作用必然会使观测值有显著变动;反之,如果影响因素 的不同水平没有对因变量产生显著影响,那么,观测值的变动可以 归结为随机变量的影响所致。
二、方差分析的基本思想
总变异
组间变异
组内变异
i
二、方差分析的基本思想
总变异 SST
组间变异 SSA (不同促销方式引起,包含随机误差) 组内变异 SSE (随机误差)
F SSA (r 1) SSE (n r)
r
SSA ni (xi x)2 i1
r ni
SSE (xij xi )2 i1 j1
r ni
SST SSA SSE (xij x)2 i1 j1
式中:n 为总样本量,r 为因素 A 的水平数,ni 为第 i 水平下的样本数,r -1和 n - r 分别为 SSA 和 SSE 的自由度。 F 统计量服从( r -1, n - r )个自由度的 F 分布。
自变量对因变量影响效应的大小通过因变量的误差有多少是由于自变量造成的来体现。 因此,方差分析是通过对数据误差的分析来检验影响效应是否显著。
一、方差分析基本概念
待分析的指标一般称为“因变量”或“响应变量”(dependent variable,通常用x或y表示),即调查类数据中我们所获得的现象 数量表现或实验类数据的实验结果。
生物统计学 第六章 方差分析
������������������
������
F分布右尾从F 到+∞的概率为:
P( F F ) 1 F ( F )
F
f ( F )dF
方差分析
图6-1 F分布密度曲线
F分布的取值范围是(0,+∞),其平均值为������������ =1。 附表4列出了不同自由度条件下的右尾概率。 应用举例 当������������1 =3, ������������2 =18时,������0.05(3,18) =?? 方差分析
方差分析
第四步
列出方差分析表 方差分析表
平方和 (SS) 24.3215 0.0060 24.3275 自由度 (df) 3 16 19
变异来源 处理间 处理内 总变异
均方(MS) 8.1072 0.0004
F值 20268**
方差分析
5.多重比较 F检验的结果显著,仅说明k个平均数间有显著差异, 但不能说明哪些平均数间有显著差异。 定义:判断不同处理平均数两两间差异的显著性, 每个处理的平均数都要与其他的处理进行比较, 这个种差异显著性检验方法就叫做多重比较。 方法:主要有(1)最小显著差数法LSD,(2) 最小显著极差法LSR(q检验法和邓肯检验法)
方差分析
线性数学模型 ������������������ = ������ + ������������ + ������������������ ������������������ = ������.. + (������������. − ������.. ) + (������������������ − ������������. ) kn观测值的总变异=处理间的变异+处理内的变异 其中第i处理j个观测值分解为:全试验观测值总体的 平均数(������)、第i个处理的效应(������������ )和试验误差(������������������ )。 ������������������ 相互独立且服从正态分布,所以各处理A������ 所属总 体也服从正态分布N(������������ ,������ 2 )。 基本假定 效应的可加性、分布的正态性、方差 的同质性(各处理的方差相等)。
5第六章方差分析
练习
• 以小鼠研究正常肝核糖核酸(RNA)对癌细 胞的生物学作用,试验分为对照组(生理 盐水)、水层 RNA组和酚层RNA组,分别用 此三种不同处理诱导肝细胞的FDP酶活力, 得数据如下。该三组资料均服从正态分布, 试比较三组均数有无差别?
ex_36.sas
表 6.1 对照组
2.79 2.69 3.11 3.47 1.77 2.44 2.83 2.52
复相关系数(确定系数),变异系数,均方根,总均数
对自变量的检验
R-Square:等于模型的平方和除以总 平方和,用于度量在因变量的变差 里能够由模型决定的比例有多少, 越接近1,效果越好。
检验的显著水平、自由度、 误差均方
具有相同字母的组间 均值差异没有统计学意义。
第2组具有A和B两个字母,所以 第二组和第三组,第一组均没有差异。
单因素方差分析
假设某单因素试验有k个处理,每个处理有n次重 复,共有nk个观测值。这类试验资料的数据模式
如下表所示。
(一)总平方和的分解 在上表中,反映全部观测值总变异的总平方和
是各观测值xij与总平均数的离均差平方和,记 为SST。即
kn
SST
( xij x.. ) 2
i1 j 1
nj 组内样本容量j 1,2,,n ki 组数,即水平数i 1,2,,k x.. 总平均数 xij i水平下第 j个样样本
变 差
组间 变差
总 变 差 组内 变差
组数(水平数)
(二)总自由度的剖分
在计算总平方和时,资料中的各个观测值要
kn
受 (xij x这..) 一0 条件的约束,故总自由度等于 i1 j1
资料中观测值的总个数减1,即kn-1。
dfT kn 1 df t k 1 df e dfT df t
第六章方差分析
2se( 2 LSD检验)
x
n0
x1 x2
n0
第三节双因素方差分析
1、试验指标:衡量试验结果的标准 2、因素(factor):也叫因子,是指对试验指标有影响,在研究中加以(控制)考虑的试验
4
条件。 3、可控因子:在试验中可以人为地加以调控的因子浓度、温度等 4、非控因子:不能人为调控的因素(气象、环境等) 5、固定因素:指因素的水平是经过特意选择的 6、随机因素:指因素的水平是从该因素水平总体中随机抽出的样本 7、水平(level):每个因素的不同状态(从质或量方面分成不同的等级) (因素是一个抽象的概念,水平则是一个较为具体的概念) 8、处理:指对试验对象施以不同的措施(对单因素试验而言,水平和处理是一致的,一个 水平就是一个处理;对多因素试验而言,处理就是指水平与水平的组合) 9、固定效应(fixed effect):由固定因素所引起的效应。 10、随机效应(random effect):由随机因素引起的效应。 11、二因素方差分析:是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。 12、固定模型:二因素都是固定因素 13、随机模型:二因素均为随机因素 14、混合模型:一个因素是固定因素,一个因素是随机因素 15、主效应(main effect):各试验因素的相对独立作用 16、互作(interaction):某一因素在另一因素的不同水平上所产生的效应不同。 17、因素间的交互作用显著与否关系到主效应的利用价值 如果交互作用不显著,则各因素的效应可以累加,各因素的最优水平组合起来,即为最优的 处理组合。 如果交互作用显著,则各因素的效应就不能累加,最优处理组合的选定应根据各处理组合的 直接表现选定。有时交互作用相当大,甚至可以忽略主效应。 二因素间是否存在交互作用有专门的统计判断方法,有时也可根据专业知识判断。 (一)无重复观测值的二因素方差分析 依据经验或专业知识,判断二因素无交互作用时,每个处理可只设一个观测值,即假定 A 因素有 a 各水平,B 因素有 b 个水平,每个处理组合只有一个观测值。
生物统计学 第六章 方差分析
该法是最小显著差数(Least significant difference) 法的简称,是Fisher 1935年提出的,多用于检验某一对 或某几对在专业上有特殊探索价值的均数间的两两比 较,并且在多组均数的方差分析没有推翻无效假设H0 时也可以应用。该方法实质上就是t检验,检验水准无 需作任何修正,只是在标准误的计算上充分利用了样 本信息,为所有的均数统一估计出一个更为稳健的标 准误,因此它一般用于事先就已经明确所要实施对比 的具体组别的多重比较。
xij i ij
它是方差分析的基础。
6.2 方差分析的原理
方差分析的基本原理是认为不同处理组的均数间 的差别基本来源有两个: (1) 随机误差,如测量误差造成的差异或个体间的差 异,称为组内差异,用变量在各组的均值与该组内变 量值之偏差平方和的总和表示,记作 SS e ,组内自由度 df e 。 (2) 实验条件,即不同的处理造成的差异,称为组间 差异。用变量在各组的均值与总均值之偏差平方和表 示,记作 SSt ,组间自由度 df t 。 总偏差平方和 SST SSt SSe 。
6.1 方差分析的相关术语
研究马氏珠母贝三亚、印度品系在不同地区的生 长差异,选择同一批繁殖的两品系马氏珠母贝的稚贝, 分别在海南黎安港、广东流沙港、广西防城港三个海 区进行养殖,每个地区每个品系养殖1000个,1年后 测定马氏珠母贝壳高与总重,比较生长差异。 这里壳高与总重称为试验指标,在试验中常会测定 日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生 理生化和体型指标(如血糖含量、体高、体重)等,这些 都是试验指标,就是我们需要测量的数据。
6.4 均值间的两两比较
对完全随机设计多组平均水平进行比较时,当资料满 足正态性和方差齐性,就可以尝试方差分析,若得到 P>α的结果,不拒绝零假设,认为各组样本来自均数相 等的总体,即不同的处理产生的效应居于同一水平, 分析到此结束; 若方差分析结果P≤α,则拒绝零假设, 接受备择假设,认为各处理组的总体均数不等或不全 相等,即各个处理组中至少有两组的总体均数居于不 同水平。这是一个概括性的结论,研究者往往希望进 一步了解具体是哪两组的总体均数居于不同水平,哪 两组的总体均数相等,这就需要进一步作两两比较来 考察各个组别之间的差别。
第六章 方差分析
§6.1 §6.2 §6.3 方差分析概述 单因素方差分析 双因素方差分析
方差分析是对多个总体均值是否相等 这一假设进行检验
1
2
例 某公司想对新销售人员进行不同的销售培 训,为了比较它们的有效性,随机选择了三组 销售人员,每组五人。 一组接受 A课程销售训练 一组接受 B课程销售训练 另一组 C没有参与任何训练 当前两组的训练课程结束时,收集训练后两个 星期内的各组销售人员的销售记录如下:
9
10
1、计算水平均值
步骤 步骤
计算水平均值 F检验 单因素方差分析 计算离差平方和 计算平均平 方
因素 因素 水平 水平
一个独立的变量,是方差 分析研究的对象。 因素中的内容称为水平。
xj =
∑x
i =1
nj
ij
nj
其中,xij是第 j种水平下的第 i个观测值, n表 j 示第 j 种水平的观测值个数。
1 2 3 4 5 均值
A 课程 2058 2176 3449 2517 944
B 课程
3339
2777 3020 2437 3067
C 2228 2578 1227 2044 1681
2228.8
2928
1951.6
• 从上表可以看出,各组样本数据差异较大, 尤其是3组与1、2组的均值具有一定的差异。 这是否说明销售训练会提高销售业绩呢?当 然这种差异也许是由于随机因素所造成,所 以需要进行统计检验。
x =
r
( j = 1, 2, L, k )
SSC = ∑∑ (x. j − x )
i =1 j =1 k r
2
∑∑x
i =1 j =1
k
【生物统计】第六章 方差分析
722 922 562 1162 SSt C 7056 504 n 4
Ti 2
dft k 1 4 1 3
SSe SST SSt 602 504 98
dfe dfT dft k (n 1) 4 (4 1) 12
yij y
C
试 验 误 差
yi y
A BLeabharlann yij yiA B C
A
B
C
-2 -2 -2 -2
0 0 0 0
2 2 2 2
-3 -2 -2 -1
-1 0 0 1
0 1 2 5
-1 0 0 1
-1 0 0 1
-2 -1 0 3
SSt n( yi y )2 32
SST ( yij y )2 50
2 2
因为
SST ( yij y ) ( yij yi yi y )
2
( y y ) 0
i
所以 SST SSt SSe
第一节 方差分析的基本原理
自由度的分解 总自由度: 处理项自由度: 误差项自由度:
dfT nk 1
dft k 1
dfe dfT dft k (n 1)
SSe ( yij yi )2 18
第一节 方差分析的基本原理
通过前面的平方和的直观分解可以看出: SSe SSt
SST SSt SSe
2
当然也可以由公式推导出来:
( yij yi ) ( yi y ) 2 (yij yi ) ( yi y )
18 23 14 29
y 21
第一节 方差分析的基本原理
SPSS_第6章 方差分析
-12.3756
15.7090
-31.0423
-2.9577
-15.7090
12.3756
-32.7090
-4.6244
2.9577
31.0423
4.6244
32.7090
40
结果2
英语
Subset for alpha = .05
Student-Newman-Keul sa
g rou p 2 1 3 Si g.
Std. Deviation 13.70280 12.42176 6.96898 13.79175
Std. Error 5.59414 5.07116 2.84507 3.25075
95% Confidence Interval for M ea n
Lower Bound Upper Bound
58.7865
75 70
74
80 72
72
77 66
68
68 72
71
75 70
71
75 70
Xt =72
4
从上表可知,三种不同实验教材的教学效果不完全 一致,表现在三个不同实验处理组的平均数之间存 在差异;同时,同一实验组内部的5名样本的反应变 量也存在差异。
5
我们可以将三个实验组的所有15名样本分数的差异 分为两部分:实验组间的差异(称为组间差异)和 实验组内的差异(称为组内差异)。
18.66667* 6.58815
*. The mean difference is significant at the .05 level.
Si g. .804 .021 .804 .013 .021 .013
95% Confidence Interval
统计学第六章方差分析
总离差平方和=组间离差平方和+组内离差平方和
方差的分解
组间方差反映出不同的因子对样本波动的影响;组内方差则是不考虑组间方差的纯随机影响。
如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因子是引起波动的主要原因,可认为因子对实验的结果存在显著的影响 ;
第28页,共55页。
X4
第24页,共55页。
如果备择假设成立,即H1: (i=1,2,3,4)不全相等
– 至少有一个总体的均值是不同的
– 有系统误差
Xi
这意味着四个样本分别来自均值不同的四个正态总体 。
第25页,共55页。
f(X)
X
X1 X2 X3
X4
第26页,共55页。
方差的分解 样本数据的波动又两个来源:一个是随机波动;一个是因子影响。样本数据的波动,可通过离差平方和来反映。这个离差平 方和可分解为组间方差与组内方差两部份。即
算术均值
x1 x...2....
x3
方差
S12 S22
.......
Sr2
si2ni1 1jn i1
2
xijxi
(i1,2, ,r)
第37页,共55页。
SST是全部观察值 与总平均值的离差平方和,反映全部观察值的离散状况。 其计算公式为:
r n
2
SST
xij X
i1 j1
SST反映了全部数据总的误差程度。
样本均值越不同,我们推断总体均值不同的证据就越充分。
第22页,共55页。
• 如果原假设成立,即H0: = = • 四种颜色饮料销售的均值都相等
– 没有系统误差
•
这意味着每个样本都来自均值为 、方差为2的同一正态总体
第六章 方差分析
班组
水平
观测值
因素
分析均值间是否有明显差异。
3、方差分析的基本假定
方差分析基本假定的一般性的表述为,设因
素 A 有个 k 水平,在每个具体水平下,总体分布
为 N j, 2 ,j 1, 2, ,k 。注意这里个总体
方差均相等,并且在每个水平下抽取一个样本,
所取得的个样本相互独立。
注:
最后,构造统计量: 不加证明的引入如下的结论: 1)SSA与SSE相互独立
2) SSE ~ 2 n k 2 3)原假设成立情况下 SSA ~ 2 k 1 2 因此构造统计量:
SSA 2 k 1 F = SSE 2 n k SSA H 0为真 k 1 ,则F ~ F k 1,n k SSE nk
实际计算中主要有如下计算流程 a)水平均值 水平均值是指根据具体水平下的观察值的均 值。有计算公式为 nj 1 xi xij ni j 1 b)总均值 总均值是指全部观察值的均值
x 1
ni
i 1
k
x
i 1 j 1
k
ni
ij
1
ni
i 1
k
x
i 1
k
i
ni
c)总离差平方和 反映了全部观察值离散程度的总规模。有
H1:1, 2, , k 不全相等
2) 构造统计量及拒绝域 首先,分析三类离差平方和: a)总离差(总变差)平方和: 各样本观察值之间的差异称之为总差异,用总 离差平方和来表示。总离差平方和是每一观察值与 其总均值的离差的平方的总和。 b)组内离差(组内变差)平方和: 同一水平下观察值之间的差异,用组内离差平 方和来度量。 c)组间离差(组间变差)平方和: 不同水平观察值之间的差异,称之为组间离差, 用组间离差平方和来度量。
第06章 方差分析
MT 含量的总体均值相同; MT 含量的总体均值不全相同;
H 1( A) : 1 、 2 、 3 不全相同,即三组大鼠
H 0 ( B ) : 1 2 10 ,即不同窝别大鼠 H 1( B ) : 1 、 2 、…、 10
MT 含量的总体均值相同;
不全相同,即不同窝别大鼠 MT 含量的总体均值
样,只反映随机误差作用的大小。
从上面可以看出方差分析的思想逻辑:
将全部观测值的总变异按影响结果的诸因 素分解为相应的若干部分变异,构造出反映各
部分变异作用的统计量,在此基础上,构建假
设检验统计量,以实现对总体参数的推断。
将结果整理成方差分析表
完全随机设计的方差分析表 变异来源 平方和 SS
SS T ( X ij X ) 2
第五节
方差齐性检验
第一节 完全随机设计的方差分析
例6.1 拟探讨枸杞多糖(LBP)对酒精性脂肪
肝大鼠GSH(mg/gprot)的影响,将36只大鼠随
机分为甲、乙、丙三组,其中甲(正常对照组)
12只,其余24只用乙醇灌胃10周造成大鼠慢性 酒精性脂肪肝模型后,再随机分为2组,乙 (LBP治疗组)12只,丙(戒酒组)12只,8周 后测量三组GSH值。试问三种处理方式大鼠的 GSH值是否相同?
• 三者的关系如下:SST SS A SS B SS e
方差分析表
随机区组设计的方差分析表 变异来源 平方和 SS
SS T ( X ij X ) 2
k m
自由度
均方 MS
F值
总变异
i 1 j 1
T n 1
= ( n 1) S 2 处理组间
SS A m( X i X ) 2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6.2 单因素方差分析
• 解决的问题类型
设有k个教学方案,各个方案的效果如表6.1所示。 问:怎样判断这k个方案的效果是否有显著区别 (均值是否相同)?
所谓的单因素是指只有“方案”这个变量(因素)。 不同方案就是“方案”这个变量的不同取值。这 些不同的“取值”又称为“方案”这个因素的不 同“水平”。
受不同因素的影响,研究所得数据会不同。造成 差异的原因可分为两类:1)随机误差,如测量误差 造成的差异或个体间的差异,称为组内差异;2)实 验条件,即不同的处理造成的差异,称为组间差异。 方差分析的目的是分析分组的平均数是否相等。 如果相等,说明组间没有差别;如果不相等,说明组 间平均数有差异,这时分组(或处理)是有效的。
但其独特的地方是,它并不直接利用平均数来比 较,而是利用与方差有关的统计指标总变差(SST)、 组间变差(SSB)、组内变差(SSW)的关系来进行 判别。
收 入Biblioteka 男 女Y总=800元
Y女=800元
Y男=800元
收 Y男=1000元 入
男 女
Y总=800元
Y女=600元
收 入 Yi-
男 女
y
Yi-
表 单因素方差分析的已知条件
方案1 方案2 X11 X21 X12 X22 „ „ X1n X2n
„
方案k
„
Xk1
„
Xk2
„
„
„
Xkn
注:表中ni表示方案i的实验个数。
6.2 单因素方差分析实例
P120 研究3个组(分别接受了3种不同的教学方法)在 英语成绩上是否有显著差异,如表6.3所示。 方法1/group1 99 88 79 方法2/group2 70 72 87 方法3/group3 79 56 89
即按照定类变量的不同水平来分组,看每个分
组的定距变量的平均数是否有差异。不同组间 的平均数差异越小,两个变量间的关系越弱; 相反,平均数差异越大,变量间关系越强。
不 同性 别 的 分组 平 均数 比 较 现在 每月工 资 性别 男 女 Total Mean 752.40 601.97 680.95 N 452 409 861 Std. Deviation 573.13 413.16 508.82
协方差分析实例
• P146:例6.4 研究一个班3组同学(分别接 受了3种不同的教学方法)在数学成绩上是否 有显著差异。已知这些同学的数学入学成绩, 见数据文件“3组学生的数学成绩”。 • 统计分析过程:Analyze->General Linear Model-> Univariate
Dependent: Math Fixed Factors:group Covariate:score1
y男
y男 - y
y男
y女 - y
SST(总变差 ) ( yij y )
2
y
y女
SSW(组内变差 ) ( yij y j )
2 2
SSB(组间变差 ) ( y j y )
SST=SSB+SSW
SST是总变差,即未分组的数据的变差,总方差的分子。
SST ( yij y )
无穷大之间。当该值>1,则说明组与组间的差别大于
组内的差别,也就说明这时组间平均数的差异是存在的。
• 组内SSw 、组间SSb除以各自的自由度(组内 dfw =n-m,组间dfb=m-1,其中n为样本总 数,m为组数),得到其均方MSw和MSb, MSb/MSw比值构成F分布,用F值与其临界 值比较,推断各样本是否来自相同的总体:
一种情况是处理没有作用,即各组样本 均来自同一总体,F=MSb/MSw≈1。 另一种情况是处理确实有作用,那么, F=MSb>>MSw (远远大于)。
a 性 别 与 工 资 的 方 差 分 析 表 ( ANOVA ) Sum of Squares 4858896.821 217789827.6 222648724.4 Mean Square 4858896.8 253538.798
GLM Univariate选项:
• 选择分析模型Model:
1.默认全模型Full Factorial:包括所有因素变量的主效应、所有协 变量的主效应、所有因素与因素的交互效应,不包括协变量与其他因 素的交互效应。 2.自定义模型Custom:主效应(Main effects及其因素变量)、交互 变量(有交互效应维数之分)
不 同文 化 程 度的 分 组平 均 数比 较 现在每月工 资 文化程度 Mean 不 识 字 或 识 字 很 少 302.86 初小 460.28 高小 773.50 初中 546.95 高 中 中 专 或 中 技 676.57 大专 793.66 大学本科 828.86 研究生以上 666.00 未回答 603.33 Total 680.95 N 7 18 22 213 312 146 125 15 3 861 Std. Deviation 137.93 176.64 1386.82 326.58 470.18 460.91 618.19 325.00 194.44 508.82
在科学实验中常常要探讨不同实验条件或
处理方法对实验结果的影响。通常是比较不同
实验条件下样本均值间的差异。 例如,在学校教学中,探讨多种版本教材 的实施效果,或者是研究不同教学方法对教学 效果的影响等。
类似的问题都可以通过方差分析来处理。
• 方差分析是用以测量定类变量和定距变量的关
系强度的方法。 当一个变量为定类变量(分类在3类以 上),另一变量为定距变量时,两变量间是否 有关,通常以分组平均数比较的方法来考察。
重复实验的双因素方差分析的已知条件
因素B1 因素B2
X121„ X12t
„
„ „ „ „
因素Bn
X1n1„ X1nt X2n1„ X2nt „ Xsn1„ Xsnt
因素A1
„ 因素As
X111„ X11t
因素A2 X211 „ X21t X221„ X22t
„ Xs11„ Xs1t „ Xs21„ Xs2t
6.3 双因素方差分析
• 双因素方差分析用来研究两个自变量(如教学方 法、性别)与一个因变量之间的关系,即同时比 较两个自变量(或因素)。这些自变量又称为主 效应。
• 具有两个或更多自变量的设计称为析因方差分析。
析因方差分析的一个优点是:既能揭示各个自变
量对因变量的作用,又能揭示自变量之间的相互
作用;后者是一系列单因素方差分析所不能明显 揭示的。
2
SSB是组间变差,各组平均数与总平均数的离差平方和
SSB ( y j y )
2
SSW是组内变差,每组数据和该组平均数的离差平方和。
SSW ( yij y j )
三者的关系是:
2
SST=SSB+SSW
由于方差和变差标志着每一数据对其平均数的偏离
(即异质性),因此,SSB/SSW的含义就可理解为组 间异质性和组内异质性的比较。其取值的范围在 0到正
绝零假设, 说明样本来自不同的正态总体,说 明处理造成均值的差异有统计意义;否则, F<F0.05((dfb,dfw), p>0.05不能拒绝零假设,说明 样本来自相同的正态总体,处理间无差异。
• 总之,方差分析的基本思想是把所有观察值 之间的变异分解为几个部分,即把描写观察 值之间的变异的离均差平方和分解为某些因 素的离均差平方和和随机抽样误差,进而计 算其均方,然后相互比较,做统计学处理, 确定各因素(控制变量)对研究对象的影响 力大小。通过方差分析,分析不同水平的控 制变量是否对结果产生了显著影响。
• 在一般进行方差分析时,要求除研究的因素外应该保 证其他条件的一致。然而在实际问题中,有些随机因 素是很难人为控制的,但它们又会对结果产生显著的 影响。要消除其他因素的影响,应采用协方差分析。
• 协方差分析是将那些很难控制的因素作为协变量,在 排除协变量影响的条件下,分析控制变量对观察变量 的影响,从而更加准确地对控制变量进行评价。 • 协方差分析要求协变量应是连续数值型,多个协变量 间互相独立,且与控制变量之间没有交互影响。
6.2 单因素方差分析
• 也称为一维方差分析,对二组以上均值加以比较。
• 检验由单一因素影响的一个(或几个相互独立的) 分析变量由因素各水平分组的均值之间的差异是否 有统计意义。
• 并可以进行两两组间均值的比较,称作组间均值的 多重比较,还可以对该因素的若干水平分组中哪些 组均值不具有显著性差异进行分析。
59
54
66
54
99
23
89
92
89
6.2 单因素方差分析实例
• 根据数据建立数据文件“三组教学方法英语 成绩.SAV”。 • 统计分析过程
Analyze->Compare Means->One-Way ANOVA
Dependent List:english Factor:group Options选项:Descriptive描述统计量, Homogeneity-of-variance方差齐次性检验,Means plot均值分布图 Post Hoc选项: 均值多重比较LSD和Tamhane’s T2 (各种方法的使用条件——方差齐或不齐) Contrasts选项: 多项式比较,Polynomial->”Linear” (线性分解)
3.选择分解平方和的方法(默认为TYPE III)
4.Include Intercept in model :系统默认截距包括在回归模型中
• 选择对照方法Contrasts
• 选择分布图形Plots
• 选择多重比较分析Post Hoc • 保存运算结果的选择项Save • 选择输出项Options