交互作用双因子方差分析
6-2交互作用双因子方差分析解读
三、离差平方和的分解
记
1 r s t x xijk rst i 1 j 1 k 1
称为样本总平均;
1 t xij xijk t k 1
xi 1 s t xijk st j 1 k 1
称为水平组合 Ai , B j 下的样本均值; 称为水平 Ai 下的样本均值; 称为水平 B j 下的样本均值。
r r r i 1
s
0
i 1
s
i 1
s
ij uij ui u j u uij ui su i su i 0
j 1 j 1 j 1
所以,如果 H 02 成立,那么因素 B 各效应的水平皆为零; 如果 H 03 成立,那么 ij 0
2 i 1 j 1 k 1
i 1 j 1 k 1 r s t
i 1 j 1 k 1
i 1 j 1 k 1
可以验证上式右边所有的交叉乘积项皆为零 记
SE
SA
2
xijk xij
r s t
2
2
xi x
i 1 j 1 k 1 r s t i 1 j 1 k 1 r s t
rs t 1 2 S A B r 1s 1 ~ F r 1s 1, rs t 1 2 S E rs t 1
2
SB
s 1
,可得 若控制犯第一类错误的概率不超过
x 2 s1 , x 2 s 2 , , x 2 st
……
x r11 , x r12 , , x r1t
……
x r 21 , x r 22 , , x r 2 t
……
x rs 1 , x rs 2 , , x rst
商务统计学课件-有交互作用双因素方差分析问题描述
有交互作用双因素方差分析问题描述
因素B 因素A
B1
A1
X111, X112 ,
..., X11t
… Bj
… X1 j1, X1 j2 , ..., X1 jt
…
…
…
…
Ai
X i11, X i12 , ..., X i1t
… X ij1, X ij2 , ..., X ijt
…
…
…
…
X k11, X k12 ,
ij
ijs
ijs ~ N (0, 2 ), 各 ijs独立
i 1, 2,..., k; j 1, 2,..., r; s 1, 2,..., t
X ij
ij ai bj (ab)ij ijs
ijs ~ N (0, 2 ), 各 ijs独立
i 1, 2,..., k; j 1, 2,..., r; s 1, 2,..., t
… ..., X krt
… Tr
… Xr
…
Ti
Xi
…
…
Tk
Xk
总和 总均值
TX
有交互作用双因素方差分析问题描述
所考察的因素记为 A、B
因素 A共有 k个水平 因素B 共有 r个水平
Xijs ~ N ( ij , 2 )(i 1, 2,..., k; j 1, 2,..., r; s 1, 2,...,t) 其中,ij , 2 均未知
1r
i
r ij j1
1k
k j
ij
i1
ai
i
bj
j
i 1, 2,..., k
j 1, 2,..., r i 1, 2,..., k j 1, 2,..., r
论文—双因素试验的方差分析
X ijk ~ N (ij , 2 ) ( ij 和 2 未 知 ), 记 X ijk i = ijk , 即 有
ijk X ij ijk ~ N (0, 2 ), 故 X ijk ijk 可视为随机误差. 从而得到如下数学模型
X ijk ij ijk, ijk ~ N(0, 2), 各 ijk 相互独立, i 1, , r; j 1, , s; k 1, , t;
1 st
1 rt
X
j 1 k 1
r t
s
t
ijk
,i=1,2, ,r,
X
j =
X
i 1 k 1
类似地,引入记号: , i , j , i , j , 易见
i 1
r
i 0 ,
j 1
s
j
0.
为水平 B j 的效应. 这样可以将
仍称 为总平均,称 i 为水平 A i 的效应,称 成
ij
j
ij
表示
= + i + j +
ij
( i 1, , r; j 1, , s ) ,
(3)
与无重复试验的情况类似,此类问题的检验方法也是建立在偏差平方和的分解上的。 2. 偏差平方和及其分解 引入记号: X =
1 rst
X
i 1 j 1 k 1
r
s
t
ijk
,
X
ij =
1 X ijk ,i=1,2, ,r,j=1,2, ,s, t k 1
t
X
i =
试 验 结 因 素 果 A 因 素 B
交互作用双因子方差分析
st
xijk
j1 k 1
称为水平 Ai 下的样本均值;
x• j•
1 rt
r i1
t
xijk
k 1
称为水平 B j 下的样本均值。
r s t
考虑总变差平方和 ST 2 xijk x 2 的如下分解:
i1 j1 k 1
r s t
ST 2
xijk x 2
i1 j1 k1 rst
若 H01 成立,即 1 2 r 0 ,那么,虽然 不能苛求做为诸i 的估计值之平方和的若干倍的S A2
rst
r
( xi•• x 2 st xi•• x 2 )恰好等于零,
i1 j1 k 1
i 1
但相对于 SE
2
来说一定不应太大,倘若
SA2 SE2
超过某个界
限值k1 ,我们就有理由拒绝H01 ,故
0.
s
类似地,由 j
j 1
s j 1
u• j u
1 r
s j 1
r i 1
uij
su
0
r
r
r
ij uij ui• u• j u uij u• j ru• j ru• j 0
i 1
i 1
i 1
s
s
s
ij uij ui u• j u uij ui• sui• sui• 0
2
=
xijk xij• xi•• x x• j• x xij• xi•• x• j• x
i1 j 1 k 1
r s t
rst
rst
xijk xij• 2 xi•• x 2 x• j• x 2
i1 j1 k 1
i 1 j 1 k 1
商务统计学 8.10有交互作用双因素方差分析假设检验
i=1 j=1 s=1
å 其中,X ij×
=
1 t
t s =1
X ijs
是水平组合
下的样本均值
邋 ? k r t
交互作用离差平方和 SSAB =
( X ij鬃- X i 鬃- X j? + X )2
i=1 j=1 s=1
构建检验统计量
邋 ? k r t
令T=
X ijt = krtX
i=1 j=1 s=1
构建检验统计量
邋 ? k r t
总离差平方和 SST =
( X ijs - X )2
i=1 j=1 s=1
邋 ? 其中,X
=
1 krt
k i =1
rt j=1 s=1
Xijs 是数据的总平均
组间离差平方和
邋 ? 邋 k r t
SSA =
( X i鬃- X )2
i=1 j=1 s=1
其中,X
i鬃 =
1 rt
rt
X ijs
j=1 s=1
为水平
邋 ? 邋 1 k
X = X SSB =
r
t ( X鬃j - X )2 其中, 鬃j
kt i=1 j=1 s=1
kt i=1 s=1
ijs 为水平
下的样本均值 下的样本均值
构建检验统计量
邋 ? 随机误差平方和 SSE = k
r
t
( X ijs -
X
)2
ij×
T2 krt
邋 ? å k r t
SSA =
( X i鬃- X )2
i=1 j=1 s=1
=1 rt
k
Ti鬃2 -
i =1
T2 krt
双因子方差分析例子
【双因素方差分析例题】下表数据是在4个地区种植的3种松树的直径.试对松树的直径数据进行种树与地区的双因素方差分析?模型识别树种和地区是对松树的直径都有可能产生影响的两个因子,并且二者之间还有可能产生交互作用,即有可能出现某个地区最适合(不适合)某种松树的生长情况.地区因子有4个水平,树种因子有三个水平,在每一个水平下分别抽取了5个样本.我们先利用MATLAB提供的命令anova2()来对本题作双因子方差分析.再用单因子方差分析确定其它问题.MATLAB数据处理clearA=[23 15 26 13 21 25 20 21 16 18 21 17 16 24 27 14 11 19 20 24]; B=[28 22 25 19 26 30 26 26 20 28 19 24 19 25 29 17 21 18 26 23]; C=[18 10 12 22 13 15 21 22 14 12 23 25 19 13 22 18 12 23 22 19]; X=[A',B',C'];⑴双因子方差分析reps=5;[p,Table]=anova2(X,reps,'off')p =0.0004 0.3996 0.4156Table ='Source' 'SS' 'df' 'MS' 'F' 'Prob>F''Columns' [ 352.5333] [ 2] [176.2667] [9.1369] [4.3408e-004] 'Rows' [ 58.0500] [ 3] [ 19.3500] [1.0030] [ 0.3996]'Interaction'[ 119.6000] [ 6] [ 19.9333] [1.0333] [ 0.4156]'Error' [ 926.0000] [48] [ 19.2917] [] []'Total' [1.4562e+003][59] [] [] []双因子方差分析结果说明:我们看到返回向量p有3个元素,分别表示输入矩阵X的列、行及交互作用的均值相等的最小显著性概率,由于X的列表示树种方面的因素,行表示地区方面的因素,所以根据这3个概率值我们可以知道:树种因素方面的差异显著,地区之间的差异和交互作用的影响不显著(没有某种树特别适合在某地区种植).接下来对树种进一步作单因子方差分析.⑵单因子方差分析[p,anovatab,stats]=anova1(X,[],'on')p =3.7071e-004anovatab ='Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Columns' [352.5333] [2] [176.2667] [9.1036] [3.7071e-004] 'Error' [1.1036e+003] [57] [ 19.3623] [] []'Total' [1.4562e+003] [59] [] [] []stats =gnames: [3x1 char]n: [20 20 20]source: 'anova1'means: [19.5500 23.5500 17.7500]df: 57s: 4.4003图三种松树直径的box图单因子方差分析结果说明:单因子方差分析进一步确认了树种之间的差异是显著的,由box图可以看出树种B的平均直径最大,故可认为树种B最好.实际上,作多重比较得出的结论更细腻、丰富一些.。
双因子方差分析[1]
由上述计算可得
1 ST yij ( yij ) 2 46.29 38.52 7.77 n i j i 1 j 1
2 r s
1 r 2 1 r s 1 2 S A yi. ( yij ) 131.43 38.52 5.29 s i1 n i1 j 1 3 1 s 2 1 1 2 S B y. j ( yij ) 162.92 38.52 2.22 r j 1 n i j 4 S e ST S A S B 0.26
A 因 子
y.2 …… y.s
1 ij , rs i 1 j 1 1 s i. ij , s j 1
这里仍假定yij是独立地取自分布为N(μij,σ2)的正态母体的 子样。为研究问题方便,仍如单因子方差分析一样把参数改 变一下,令 r s
称为一般平均。 i 1,2,, r
其中
S e ( yijk yij. )
FB ~ F (2,6)
查表得F1 F0.95 (2,6) 5.1
因
FA F1 (3,6)
FB F1 (2,6)
故拒绝H01,H02认为因子A、B对化验结果都有显著 影响
2、具有交互效应的二因子方差分析 在这种情形下,用前面的记号,因为两因子A 与B存在交互效应 会有μij≠μ+αi+βj 记γij=μij-μ-αi-βj 称它为因子A的第i个水平和因子B的第j个水平 的交互效应,其满足关系式:
.yr11,……yr1t yr21,……yr2t
… … y1s1,……y1st … y2s1,……y2st … … … … yrs1,……yrst …
6-2双因素方差分析
• H0:m1=m2=m3=m4=m5 (地区对销售量无显著影响) • H1:mj (j =1,2,…,5) 不全相等 (有显著影响)
【例】有4个品牌的彩电在5个地区销售,为分析彩电的品牌( 品牌因素)和销售地区(地区因素)对销售量的影响,对每显著 个品牌在各地区的销售量取得以下数据。试分析品牌和销售 地区对彩电的销售量是否有显著影响?(=0.05)
5. 误差项平方和: SSE SST SSR SSC SSRC
SST=SSR+SSC+SSRC+SSE
可重复双因素方差分析表
(基本结构)
误差来源 平方和 自由度
(SS)
(df)
均方 (MS)
F值
P值
F 临界值
行因素 列因素 交互作用
误差
SSR SSC SSRC SSE
k-1 MSR FR r-1 MSC FC (k-1)(r-1) MSRC FRC kr(m-1) MSE
replication)
3. 如果除了行因素和列因素对试验数据的单
独影响外,两个因素的搭配还会对结果产 生一种新的影响,这时的双因素方差分析
称为有交互作用的双因素方差分析或可重 复 双 因 素 方 差 分 析 (Two-factor with
replication )
双因素方差分析的基本假定
1. 每个总体都服从正态分布 ▪ 对于因素的每一个水平,其观察值是来自正态分布
不同品牌的彩电在5个地区的销售量数据
品牌因素 地区1
地区因素 地区2 地区3 地区4
品牌1
365
350
343
340
品牌2
345
368
363
交互作用双因子方差分析
交互作用双因子方差分析交互作用双因子方差分析(Two-way ANOVA with interaction)是一种用于分析两个自变量对因变量的影响以及这两个自变量之间是否存在交互作用的统计分析方法。
在实验设计和数据分析中应用广泛,尤其适用于探究多个因素对结果的影响和相互作用的情况。
交互作用双因子方差分析是在传统的方差分析的基础上进一步扩展的方法,将实验因素划分为两个或更多的自变量,并考察这些自变量之间是否存在相互作用。
与传统的单因子方差分析相比,交互作用双因子方差分析可以更全面地分析因素对结果的影响,从而更准确地解释实验结果。
在进行交互作用双因子方差分析之前,首先需要构建一个实验设计矩阵,确定两个自变量的水平以及实验对象的分组情况。
然后,通过对数据进行方差分析,可以得到各自变量的主效应(main effects)和交互作用效应(interaction effects)的显著性检验结果。
主效应是指自变量对因变量的独立影响,通过比较不同水平下因变量的均值差异来进行检验。
交互作用效应是指两个自变量同时作用对因变量的影响,通过比较不同组合下因变量的均值差异来进行检验。
显著性检验可以使用方差分析表(ANOVA table)来进行,通过计算误差平方和与因子平方和来判断各效应的显著性。
双因子方差分析的优势在于可以准确地评估两个自变量的影响,并且可以检验出两个自变量之间是否存在交互作用。
通过交互作用效应的检验,可以了解不同因素之间的复杂关系,进一步深入理解研究对象的特性。
然而,交互作用双因子方差分析也存在一些注意事项。
首先,样本量需要足够大,以保证分析结果的稳定性和可靠性。
其次,实验设计需要合理,各水平之间应该具有一定的平衡性。
此外,还需要注意数据的正态性和方差齐性,以确保方差分析的准确性。
总之,交互作用双因子方差分析是一种重要的统计分析方法,可以分析两个自变量对因变量的影响和相互作用。
通过准确评估各自变量的主效应和交互作用效应,可以更加全面地解释实验结果,为研究提供有力的支持和指导。
双因素ANOVA交互作用分析
双因素ANOVA交互作用分析双因素ANOVA(Analysis of Variance)是一种常用的统计方法,用于分析两个或多个因素对于一个或多个连续变量的影响。
在双因素ANOVA中,我们可以研究两个因素的主效应以及它们之间的交互作用。
本文将介绍双因素ANOVA交互作用分析的基本概念、假设检验和结果解读。
一、基本概念双因素ANOVA交互作用分析是一种多元方差分析方法,用于研究两个因素对于一个或多个连续变量的影响,并探究这两个因素之间是否存在交互作用。
在双因素ANOVA中,我们将变量分为两个因素:因素A 和因素B。
因素A可以是一个分类变量,比如性别(男、女),因素B 也可以是一个分类变量,比如治疗组(A组、B组)。
我们希望通过双因素ANOVA来分析因素A、因素B以及它们之间的交互作用对于连续变量的影响。
二、假设检验在双因素ANOVA交互作用分析中,我们需要进行三个假设检验:因素A 的主效应、因素B的主效应以及因素A和因素B之间的交互作用。
1. 因素A的主效应假设因素A对于连续变量有显著影响,我们可以进行如下假设检验:H0:因素A对于连续变量没有显著影响H1:因素A对于连续变量有显著影响2. 因素B的主效应假设因素B对于连续变量有显著影响,我们可以进行如下假设检验:H0:因素B对于连续变量没有显著影响H1:因素B对于连续变量有显著影响3. 因素A和因素B之间的交互作用假设因素A和因素B之间存在交互作用,我们可以进行如下假设检验:H0:因素A和因素B之间不存在交互作用H1:因素A和因素B之间存在交互作用三、结果解读在进行双因素ANOVA交互作用分析后,我们可以得到以下结果:1. 主效应结果如果因素A的主效应和因素B的主效应都显著,说明因素A和因素B对于连续变量都有显著影响。
如果只有一个因素的主效应显著,说明只有这个因素对于连续变量有显著影响。
如果两个因素的主效应都不显著,说明这两个因素对于连续变量没有显著影响。
双因素方差分析课件
双原因无反复(无交互作用)试验资料表
原因 B 原因 A
B1
A1
X11
...
...
Aa
X a1
a
T. j X ij T.1 i 1
X. j T. j a X .1
b
B2 ... Bb Ti. X ij X i. Ti. b j 1
X12 ... X1b
T1.
X 1.
... ... ... ...
➢ 有交互作用旳双原因试验旳方差分析
有检验交互作用旳效应,则两原因A,B旳不同水 平旳搭配必须作反复试验。
处理措施:把交互作用当成一种新原因来处理,
即把每种搭配AiBj看作一种总体Xij。
基本假设(1)X ij 相互独立;
(2)Xij ~ N ij , 2 ,(方差齐性)。
线性统计模型
原因B
总平均 旳效应
53 58 48
a
T. j Xij 197 232 183 i 1
b
Ti. X ij j 1 165 143 145 159
T 612
X i. Ti. b
55.0 47.7 48.3 53.0
X. j T. j a 49.3 58.0 45.8
X 51
解 基本计算如原表
a b
双原因方差分析措施
双原因试验旳方差分析
在实际应用中,一种试验成果(试验指标)往往 受多种原因旳影响。不但这些原因会影响试验成果, 而且这些原因旳不同水平旳搭配也会影响试验成果。
例如:某些合金,当单独加入元素A或元素B时, 性能变化不大,但当同步加入元素A和B时,合金性 能旳变化就尤其明显。
统计学上把多原因不同水平搭配对试验指标旳 影响称为交互作用。交互作用在多原因旳方差分析 中,把它当成一种新原因来处理。
6-2交互作用双因子方差分析解析
无交互作用的 双因素方差分析
假定因素A和因素 B的效应之间是相 互独立的,不存 在相互关系
有交互作用的 双因素方差分析
假定因素A和因素B 的结合会产生出一 种新的效应
二、数据结构
r 个不同的水平 A1 , , Ar , 设因素A 有
s 个不同的水平 B1 , , Bs , 因素B 有
现对因素A 、B 的每一种不同的水平组合: Ai , B j i 1,2, , r ; j 1,2, , s 都安排t t 2 次试验(称为等重复试验) ,假 定各次试验是相互独立的,得到如下试验结 果:
ij相互独立同分布N (0, 2 )
1 r s 记:u uij ——理论总均值 rs i 1 j 1
1 s 记:ui uij —因素A在i水平下的理论平均 s j 1
1 r 记:u j uij —因素B在j水平下的理论平均 r i 1
uij u ui u u j u uij ui u j u
显然
记:i = ui u
记: j = u j u
它是水平 它是水平 Ai 下的理论均值与理论总均值的偏差,称为水平 Ai 下的效应;
Bj
记:rij uij ui u j u uij u i j
所以 r ij
是总效应 uij u 减去 Ai 的效应 i 后的剩余部分,称为水平组合 Ai , B j 的交互效应。
u ij u (视为总效应)是由如下四部分组成:
Ai 下的效应 i ; (1)水平 j ; (2)水平B j 下的效应 A , B ij (3)水平组合 i j 的交互效应 ; ij (4)随机因素引起的随机波动 .
4-两因子方差分析
5.07 4.13
3.21 3.50
3.17 2.47 3.07
Hale Waihona Puke 3.75 2.84 3.10
2.50 3.09 1.99
2.65 2.90 2.42
2.62 2.75 2.37
1
6.17 4.07
5.12
3.78 4.22
5.31 3.92 4.78 4.64 5.26 3.78
3.75 3.63 3.51 5.22 4.35 5.23
i 1 j 1 p 1 r c
r
c
m
2
SS I m ( y ij . y i .. - y. j . y )
i 1 j 1 r
2
SS A cm ( y i .. y )
i 1
2
SS B rm ( y. j . y )
j 1
c
2
定理2 在双因子方差分析模型 中,有
故在不存在交互作用的 前提下,考察 因子的各个水平 A 均值是否一致,等价于 检验 H 0 A : a i . 0, i 1, , r vs H 1 A : 至少有一个 i . 不为0 a
(3)B因子各水平对结果的影 响有无显著差别
同理在不存在交互作用 的前提下,考察 因子的各个 B 水平均值是否一致,等 价于检验 H 0 B : a. j 0, j 1, , c vs H 1 A : 至少有一个 . j 不为0 a
3.46 3.78 5.13 4.12
2.75 2.70 3.13 2.86
3.70 3.90 4.18 3.91
分析
毒素C对肺活量影响严重,毒 A对三个工厂的 素
工人作用不同三种毒素对工厂 的肺活量影响顺序是 . 1 C,B,A,而工厂3的肺活量影响顺序是 ,A,B, C 故可能存在交互作用 .
8.9有交互作用双因素方差分析问题描述
r
mij
j =1
=1 k
k
1
i=1 mi鬃= r
r
mj
j =1
å1 r
mi× = r
mij
j =1
å m×j
=
1 k
k i =1
mij
ai = mi× - m
bj = m×j - m
i =1, 2,..., k
j =1, 2,..., r i =1, 2,..., k j =1, 2,..., r
(ab)ij = mij - mi鬃- m j + m
ì ï
X ij
= mij
+ ai
+bj
+ (ab)ij
+e ijs
ï ïï
e ijs
~
N (0,s
2 ), 各e ijs独立
í ï
i
=1, 2,..., k;
j
=1, 2,..., r; s
=1, 2,..., t
邋 邋 ï k
r
k
r
ï ïî
ai
i =1
= 0; bj
i =1
= 0; (ab)ij
i =1
… ..., X krt
… T鬃r
… X 鬃r
…
Ti鬃
X i鬃
…
…
Tk鬃
X k鬃
总和 总均值
TX
有交互作用双因素方差分析问题描述
所考察的因素记为
因素 共有 个水平 因素 共有 个水平
Xijs ~ N(mij ,s 2)(i =1, 2,..., k; j =1, 2,..., r; s =1, 2,...,t) 其中,
8.10有交互作用双因素方差分析假设检验
SSB/(r SSE / (kr(t
1) - 1))
=
MSB MSE
~
F (r
-
1, kr(t
-
1))
FA
=
SSA s2
(k - 1)
SSE s2
(kr(t - 1))
=
SSA/(k SSE / (kr(t
1) - 1))
=
MSA MSE
~
F(k
-
1,
kr(t
-
1))
FA´
B
提出假设
检验假设 H0 : a1 = a2 = ... = ak = 0 H1 : a1, a2 ,..., ak不全为零
检验假设 H0¢: b1 = b2 = ... = br = 0 H1¢: b1,b2 ,..., br不全为零
检验假设 H0ⅱ: (ab)ij = 0 H1ⅱ: (ab)ij 不全为零 (i =1, 2,..., k; j =1, 2,..., r)
得出检验结论
表 有交互作用双因素方差分析表
差异来源 离差平方和 自由度
F值
F 临界值
P值
因素 A 因素 B
交互作用
SSA k - 1
SSA/(k - 1) FA =
SSE / (kr (t - 1))
Fa (k - 1, kr (t - 1))
SSB r - 1
SSB /(r - 1) FB =
SSE / (kr (t - 1))
i=1 j=1 s=1
å 其中,X ij×
=
1 t
t s =1
X ijs
是水平组合
方差分析中的多因子交互作用
⽅差分析中的多因⼦交互作⽤多因⼦⽅差分析的因⼦交互作⽤可以这样理解,⽐如经常吃的消炎药头孢,通常会认为服⽤三⽚要⽐服⽤⼀⽚效果好,但经过实际验证测试发现,男⼥之间⽤药效果并不相同。
对于男性⽽⾔,吃三⽚的效果好些,⽽对⼥性⽽⾔,吃⼀⽚效果要更好。
这种情况下,头炮剂量和性别之间便产⽣了了交互作⽤。
多因⼦⽅差分析中,当交互作⽤存在时,单纯去研究某个因素的作⽤已没有意义,需要分别探讨这个变量在另⼀个因素不同⽔平上的作⽤模式。
有⽆交互项对⽅差分析构成的影响多因⼦⽅差分析可以理解为下图的形式,即模型中,⼯资是由基准值、受教育程度、性别、受教育程度与性别的交互作⽤以及未解释的变量等⼏部分构成,这其中便涉及到了多因⼦交互作⽤的问题。
在双因素⽅差分析模型中,如果模型没有交互项的概念,则模型可以简化理解为:⼯资=教育程度+性别;如果模型带有交互项的概念,则模型可以简化理解为⼯资=教育程度+性别+教育程度*性别。
是否设置交互项多因⼦⽅差分析中,是否需要设置交互项呢?在控制实验中,⽅差分析是否含有交互项是很明确的,如果两个因素对实验结果的影响是相互独⽴的,那么只需考虑主效应,使⽤⽆交互的⽅差分析;如果两因素对实验结果的影响⾮独⽴,那么就应该使⽤有交互项的⽅差分析。
换个⾓度说,或者如果模型中只有研究变量和控制变量,此时不需要交互项,如果模型中除了研究变量和控制变量,还有调节变量,那么就需要交互项。
随机区组设计中,除了主要研究的变量以外,其他因素都是控制变量,只会起到降低⽅差分量的作⽤。
在回顾性实验研究中,由于事前⽆法对变量进⾏有效的控制,⽽且各因素对结果的影响程度也缺乏理论体系的⽀撑,即变量间的交互⾏为没有理论判断依据,这时可以只通过检验交互项是否显著来决定模型中是否纳⼊交互项。
其实,除⾮有理论认为交互项没有意义,否则⼀般都可以通过统计检验交互项的显著性去判断并决定要不要纳⼊交互项。
⽅差分析中解释变量的类型⽅差分析中解释变量有研究变量、控制变量、调节变量以及中介变量等⼏种类型:1 研究变量:只在解释类模型中出现,是模型中最为关键的变量,例如营销场景中的销售量这个变量即为研究变量;2 控制变量:除了研究变量外,任何对Y有影响的变量均为控制变量,这⾥的控制变量对于研究变量没有调节作⽤,控制变量只起到承担⽅差分量的作⽤。
3考虑交互作用的双因子方差分析
§6.3 考虑交互作用的双因子方差分析在前一节中,我们介绍了无重复观测、不考虑交互作用的双因子方差分析。
在这种方差分析中,我们设随机变量 j i ξ 的均值 j i j i βαμμ++= ,也就是说,假设因子A 和因子B 的作用只是简单的叠加关系。
但是,在很多实际问题中,A 和 B 的作用并不只是简单的叠加关系。
例如,某种农作物有1A 、2A 两个品种,分别施以 1B 、2B 两种不同的肥料,每种组合进行1从表格中第1列数据来看,品种 2A 比 1A 好,从 1A 改为 2A ,产量大约可以提高216485=- ;从表格中第1行数据来看,肥料 2B 比 1B 好,从 1B 改为 2B ,产量大约可以提高346498=- 。
如果因子A 和 B 的作用,即品种和肥料的作用,是简单的叠加关系,那么,从组合),(11B A 改为 ),(22B A ,产量大约可以提高到119342164)6498()6485(64=++=-+-+ 。
事实上,在水平组合 ),(22B A 下,产量只有 77 ,与 119 相距甚远。
由此可见,品种和肥料的作用,并不是简单的叠加关系。
对于品种 1A 来说,肥料 2B 比 1B 好,对于品种 2A 来说,则恰恰相反,肥料 1B 比 2B 好。
在品种和肥料之间,显然有一个如何搭配组合的问题,搭配得好,产量就高,搭配得不好,产量就不高。
我们把这种由于各个因子的各种水平的搭配组合而产生的作用,称为交互作用。
在实际问题中,交互作用是经常存在的。
但是,在前面介绍的的双因子方差分析中,因为没有重复观测,很难把交互作用与随机误差区分开来,所以我们不得不放弃考虑交互作用。
如果我们在进行双因子方差分析时,对每一种水平组合多作几次重复观测,就能比较容易地辨别出,哪些是交互作用,哪些是随机误差的作用。
下面,我们来看一下,有重复观测、考虑交互作用的双因子方差分析应如何处理。
问题 设某个指标的取值可能与 A 、B 两个因子有关,因子 A 有 r 个水平:r A A A ,,,21 ;因子B 有 s 个水平:s B B B ,,,21 。
6-2双因素方差分析
可重复双因素分析
(平方和的计算)
• 设:x ijl 为对应于行因素的第i个水平和列因素的
•
第 j 个水平的第 l 行的观察值
•
x i. 为行因素的第i个水平的样本均值
•
x . j 为列因素的第j个水平的样本均值
•
x ij
对应于行因素的第i个水平和列因素的第j 个水平组合的样本均值
•
x 为全部 n个观察值的总均值
replication )
双因素方差分析的基本假定
1. 每个总体都服从正态分布 对于因素的每一个水平,其观察值是来自正态分布
总体的简单随机样本
2. 各个总体的方差必须相同 对于各组观察数据,是从具有相同方差的总体中抽
取的
3. 观察值是独立的
无交互作用的双因素方差分析 (无重复双因素分析)
i1 j1
i1 j1
i1 j1
SST = SSR +SSC+SSE
分析步骤
(构造检验的统计量)
计算均方(MS)
误差平方和除以相应的自由度
三个平方和的自由度分别是
• 总误差平方和SST的自由度为 kr-1 • 行因素平方和SSR的自由度为 k-1 • 列因素平方和SSC的自由度为 r-1 • 误差项平方和SSE的自由度为 (k-1)×(r-1)
总和
SST
n-1
m为样本的行数
行(时段) 174.05
1
174.05 44.0633 5.70E-06 4.494
列(路段) 92.45
1
92.45 23.4051 0.0002 4.494
交互作用
0.05
1
0.05 0.0127 0.9118 4.494
双因子方差分析
中的参数共有 1 + I + J + IJ = (I + 1)(J + 1) 个,已经超出原来参数 µij 的个数( IJ )。 为方便分析起见,我们对因子各种效应的参数施加以下约束:
µij = µ + α i + β j + γ ij ,
(2.2.2)
在上述表达式中, µ 表示响应变量 y 在“标准”状态下的理论均值,称为“总均 值”(grand mean), α i 表示 A 因子的第 i 水平对 y 的单独效果,称为 A 因子的 “主效应”(main effect), β j 表示 B 因子的第 j 水平对 y 的单独效果,称为 B 因
(2.2.3)的约束只有在均衡的试验中才是有效的。在(2.2.3)中共有 I + J + 2 个约束,但 是在后面的 I + J 个约束中,由任意 I + J −1 个可以推出另一个,因此实际上只有 I + J + 1个独立的约束。这样独立参数的个数仍然是 IJ 个( (I + 1)(J + 1) − (I + J + 1)
以解释为 A 因子主效应的总体效果。SSA 中有 I 个平方项,满足一个约束条件:
∑iαˆi = 0 ,因此 SSA 的自由度为
f SSA = I − 1
(2.2.14)
∑ 定义 SSA 的均方为 MSSA=SSA/(I-1)。类似地,由(2.2.10), SSB = IK j βˆj2 , 其中
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
B1
B2
A1
x111, x112, , x11t
x121, x122, , x12t
A2
x211, x212, , x21t
x221, x222, , x22t
……
……
Ar
xr11, xr12, , xr1t
xr21, xr22, , xr2t
…… …… …… ……
Bs x1s1, x1s2, , x1st x2s1, x2s2, , x2st
现 对 因 素A 、B 的 每 一 种 不 同 的 水 平 组 合 :
Ai , B j i 1,2, , r; j 1,2, , s
都 安 排 t t 2 次 试 验 ( 称 为 等 重 复 试 验 ), 假
定各次试验是相互独立的,得到如下试验结 果:
1.双因素方差分析的数据结构如表所示:
称为水平 Ai 下的样本均值;
x• j•
1 rt
r i1
t
xijk
k 1
称为水平 B j 下的样本均值。
r s t
考虑总变差平方和 ST 2 xijk x 2 的如下分解:
i1 j1 k 1
r s t
S T 2
x ijk x 2
i1 j1 k 1
r s t
偏差平方和。
则得到总变差平方和的分解式:
ST 2
SE2
SA2
SB2
S2 A B
(6.31)
r s t
下面分析 S E 2
xijk xij• 2
i1 j1 k 1
在i 、 j 给定时,t 个数据 xijk ( k 1,2, ,t )与其
t
平均值 xij• 的偏差平方和 xijk xij• 2 纯粹是由随机因
r
1, rs t
1
K2
rs
s
1
t 1
F
s
1, rs t
1
K3
r
rs
1s t
1
1
F
r
1s
1, rs t
1
( 6.36) ( 6.37) ( 6.38)
通常是直接给出其拒绝域
W01
S
SA
2 E
2 r 1
rst 1
F
r
1, rst
1
W02
S
SB
2 E
2 s 1
rst 1
F
s
1, rst
(6.19)
的t 个样本观测值.
对不同的水平组合 Ai , B j ,假定各总体的方差相
等,但均值uij 可能存在差异。
2.双因素试验的方差分析的数学模型
X ij u ijij,
i 1 ,2 L r(因 素 A 的 水 平 ) , j 1 ,2 L s因 素 B 的 水 平 ,
ij相 互 独 立 同 分 布 N (0,2)
估计值。
若 H 01 成 立 , 即 1 2 r 0 , 那 么 , 虽 然 不 能 苛 求 做 为 诸 i 的 估 计 值 之 平 方 和 的 若 干 倍 的S A 2
rst
r
( x i•• x 2 st x i•• x 2 ) 恰 好 等 于 零 ,
i1 j1 k 1
2
=
x ijk x ij • x i•• x x • j• x x ij • x i•• x • j• x
i1 j1 k 1
r s t
rst
rst
x ijk x ij • 2 x i• • x 2 x • j• x 2
i1 j1 k 1
后的剩余部分,称为水平组合 Ai,Bj 的交互效应。
于 是 X ij ~ N u ij , 2 可 以 等 价 的 表 示 为 :
X ij u ij ij u i j ij ij
ij ~ N 0, 2
,
i 1,2, , r ; j 1,2, , s
这 表 明 , 在 因 素 A, B 的 不 同 水 平 组 合 下 , 试 验 结 果 的 相 对 差 异 u ij u ( 视 为 总 效 应 ) 是 由 如 下 四 部 分 组 成 :
( 1) 水 平Ai 下 的 效 应 i ;
( 2) 水 平 B j 下 的 效 应 j ;
( 3 ) 水 平 组 合 Ai , B j 的 交 互 效 应 ij ;
( 4 ) 随 机 因 素 引 起 的 随 机 波 动 ij .
i r1 i i r1ui•u1 si r1js 1uijru 0
H 03 的拒 绝域为W 03S A SEB 2
2
k3
(6.35)
为 了 确 定 界 限 值k1 、 k 2 、k3 , 按 照 显 著 性 检 验 的 一 般
步骤,我们需要知道当相应的原假设成立时各检验统
计量的分布,
可以证明,
在 H 01 成 立 时
S A 2 r 1 ~ F r 1, rs t 1 S E 2 rs t 1
i1 j1 k 1
i1 j1 k 1
r s t
x ij • x i•• x • j• x 2 + ( 交 叉 乘 积 项 )
i1 j1 k 1
可以验证上式右边所有的交叉乘积项皆为零
r s t
记
S E 2
x ijk x ij • 2 称 为 误 差 平 方 和 。
i1 j1 k 1
js 1j js 1u•ju1 rjs 1i r1uijsu 0
r
r
ij uijui•u•ju=0
i1
i1
s
s
ij uij uiou•j u=0
j1
j1
因此,要鉴别因素A 是否对结果有显著影响,只
需鉴别因素A 水平的改变是否导致试验结果的明显变
化,这等价于检验因素A 各水平的效应是否相等,即
1
W03
S
2 AB
SE2
r 1s 1
rst 1
F
r
1s
1, rst
1
在方差分析的实际应用中,仍是规范为填写如下的
方差分析表
方差来源
因素A
平方和
S
2 A
因素B
S
2 B
交互效应
S2 A B
A B
随机因素
S
2 E
总和
S
2 T
自由度
均方
r 1 s 1
r 1s 1
S
2 A
S
2 A
r 1
S
2 B
S
2 B
双因 素方 差分 析的 类型
无交互作用的 双因素方差分析
有交互作用的 双因素方差分析
假定因素A和因素 B的效应之间是相 互独立的,不存在 相互关系
假定因素A和因素B 的结合会产生出一 种新的效应
二、数据结构
设 因 素A 有 r 个 不 同 的 水 平 A1 , , Ar , 因 素B 有 s 个 不 同 的 水 平 B1 , , B s ,
(6.30)
是否成立。
r
r
由于 i
i 1
i 1
ui• u
1 s
r i 1
s
uij
j 1
ru
0,
因此,如果
H
成立,那么因素
01
A各水平的效应必皆为
0.
s
类似地,由 j
j 1
s j 1
u• j u
1 r
s j 1
r i 1
uij
su
0
r
r
r
ij uij ui• u• j u uij u• j ru• j ru• j 0
记 : i=ui•u
它是水平 A i 下的理论均值与理论总均值的偏差,称为水平A i 下的效应;
记 : j=u•j u
它是水平 B j 下的理论均值与理论总均值的偏差,称为水平B j 下的效应;
记 : rijuijui•u•ju u ij u i j
所以 r ij 是总效应 uij u 减去 A i 的效应 i 和 B j 的效应 j
rst
S x x 2
2
A
i•• i1 j1 k 1
称为因素A 的主效应偏差平方和。
r s t
S x x 2
2
B
• j• i1 j1 k 1
称为 因素B 的 主效应 偏差平方 和。
r s t
S A B 2 i1 j 1 k 1 x ij • x i•• x • j• x 2 称 为 A B 的 交 互 效 应
第二节 双因素方差分析
➢ 双因素方差分析的类型 ➢ 数据结构 ➢ 离差平方和的分解 ➢ 应用实例
一、 双因素方差分析的类型
如果在试验中有两个可控制因素 A, B ,同时发生变
化,而其它可控制因素均保持不变,这样的试验称为
双因素试验。
双因素试验方差分析的作用是同时鉴别两个因素
对结果可能产生的影响。
例如饮料销售,除了关心饮料颜色之外,我们还想 了解销售地区是否影响销售量,如果在不同的地区, 销售量存在显著的差异,就需要分析原因。采用不 同的销售策略,使该饮料品牌在市场占有率高的地 区继续深入人心,保持领先地位;在市场占有率低 的地区,进一步扩大宣传,让更多的消费者了解、 接受该生产线。
k 1
素引起的,因此,在各种水平组合下总的误差平方和
SE2 就基本上刻划了整个试验中随机因素作用的强 度,以它为尺度来比较各种效应的大小应该说是合理
的。
从矩估计的角度看, x 、 xi•• 、 x• j• 、xij• 分别是 u 、 ui• 、u• j 、uij 的估计值,因此, xi•• x 可作为i ui• u 的估计值; x• j• x 可作为 j u• j u 的估计值; xij• xi•• x• j• x 可作 为 rij u ij u i• u • j u 的