6-2交互作用双因子方差分析解读
带交互作用的双因素方差分析的线性回归建模
![带交互作用的双因素方差分析的线性回归建模](https://img.taocdn.com/s3/m/99fa26a2cd22bcd126fff705cc17552707225e6c.png)
统计与决策2021年第1期·总第565期摘要:文章引入虚拟变量,将带交互作用的双因素方差分析进行了线性回归模型重构,给出了模型的参数估计,证明了回归分析的误差分解与方差分析的离差分解是一致的,得出方差分析的因素显著性F 检验与回归模型的显著性检验的等价性。
同时对方差分析的多重比较t 检验和线性模型的回归系数检验做了比较,指出了他们之间的联系和差异性,分析了差异来源是由于样本的选择差异,最后通过实例给出了两种方法的具体实现。
关键词:方差分析;多元线性回归;虚拟变量;多重比较中图分类号:O212.1文献标识码:A 文章编号:1002-6487(2021)01-0010-05带交互作用的双因素方差分析的线性回归建模黄伯强1,李启才2(1.南京师范大学中北学院;2.南京师范大学数学科学学院,南京210023)基金项目:国家自然科学基金资助项目(11701288);南京师范大学青蓝工程项目(2016);南京师范大学中北学院优秀教学团队建设项目(2018jxtd007)作者简介:黄伯强(1981—),男,江苏宜兴人,硕士,讲师,研究方向:概率论与数理统计。
李启才(1979—),男,安徽东至人,博士,副教授,研究方向:随机控制理论及其应用。
0引言方差分析与回归分析是数理统计中重要的两种统计方法,方差分析主要用来讨论不同试验因素对结果的影响是否存在差异性,分为单因素方差分析与双因素方差分析;回归分析是研究自变量与因变量之间函数关系的模型,比较常见的是线性回归模型。
一般的统计学教材都是单独介绍这两个内容,但这两种统计方法存在一定的相互关系。
许多学者对此做过研究,如刘晓华等(2012)讨论了单因素方差分析与虚拟变量回归,研究了这两种方法下显著性差异检验的等价性,但没有给出双因素方差分析下的回归建模;傅莺莺等(2019)将单因素方差分析纳入线性回归的理论体系,给出了回归系数的几何解释,并比较了单因素方差分析方法下两种统计方法的t 检验基本一致,但也只有单因素方差分析的讨论,缺乏双因素方差分析下回归模型的重构。
双因素试验的方差分析
![双因素试验的方差分析](https://img.taocdn.com/s3/m/c8ee15d0760bf78a6529647d27284b73f24236a4.png)
i 1
j 1
要判断因素A,B及交互作用AB对试验结果是否 有显著影响,即为检验如下假设是否成立:
H01 :1 2 a 0
H02 : 1 2 b 0
H03 : ij 0 i 1, 2, , a; j 1, 2, ,b
➢ 总离差平方和的分解定理 仿单因素方差分析的方法,考察总离差平方和
a
Ti.2
b,
i1
p T 2 ab ,
DB
b
T.
2 j
a,
j1
ab
R
X
2 ij
i1 j1
例1 设甲、乙、丙、丁四个工人操作机器Ⅰ、Ⅱ、Ⅲ各一天, 其产品产量如下表,问工人和机器对产品产量是否有显著 影响?
机器 B 工人 A
ⅠⅡ
Ⅲ
甲
50 63 52
乙
47 54 42
丙
47 57 41
F值
F 值临介值
因素A 因素B
SS A SSB
df A
MS A
SS A df A
FA
MS A MSE
df B
MSB
Байду номын сангаас
SSB df B
FB
MSB MSE
F (a 1 ,
ab n 1) F (b 1 ,
ab n 1)
A B
误差 总和
SS AB
SSE SST
df AB df E dfT
MS AB SS AB
F0.01 3,6 9.78 F0.05 3,6 4.76 F0.01 2,6 10.92
FB F0.01 2,6
结论:工人对产品的产量有显著影响, 机器对产品的产量有极显著影响。
8.9有交互作用双因素方差分析问题描述
![8.9有交互作用双因素方差分析问题描述](https://img.taocdn.com/s3/m/5d9928bc9ec3d5bbfc0a7412.png)
均未知
ì ï
X ijs
=
mij
+e ijs
ï í ï
e ijs
~
N (0,s
2 ),
各e ijs独立
ïî i =1, 2,..., k; j =1, 2,..., r; s =1, 2,...,t
——有交互作用双因素方差分析的数学模型
有交互作用双因素方差分析问题描述
邋 邋 引入符号
m=
1 kr
k i =1
= 0;
(ab)ij
j =1
=0
小结
1.有交互作用双因素方差分析应用实例 2.有交互作用双因素方差分析问题描述
思考练习
有交互作用双因素方差分析中因变量的取值受
因素B 因素A
B1
A1
X111, X112 ,
..., X11t
…
Bj
… X1 j1, X1 j2 , ..., X1 jt
…
…
…
…
Ai
Xi11, Xi12 , ..., Xi1t
… X ij1, X ij2 , ..., Xijt
…
…
…
…
X k11, X k12 ,
… ..., X krt
… T鬃r
… X 鬃r
…
Ti鬃
X i鬃
…
…
Tk鬃
X k鬃
总和 总均值
TX
有交互作用双因素方差分析问题描述
所考察的因素记为
因素 共有 个水平 因素 共有 个水平
Xijs ~ N(mij ,s 2)(i =1, 2,..., k; j =1, 2,..., r; s =1, 2,...,t) 其中,
双因素方差的定义和使用条件
![双因素方差的定义和使用条件](https://img.taocdn.com/s3/m/f7e1059627fff705cc1755270722192e4436585b.png)
双因素方差的定义和使用条件
双因素方差分析(Two-way ANOVA)是一种统计方法,用于分析两个因
素对实验结果的影响。
该方法主要用来检验两个因子对因变量的交互作用。
双因素方差分析特别适用于那些同时受到两个或更多因素影响的因变量研究。
使用双因素方差分析时,需要满足以下条件:
1. 独立性:各个观测值之间必须相互独立,这意味着每个观测值都不受其他观测值的干扰。
2. 正态性:样本必须来自正态分布总体。
3. 方差齐性:各个总体的方差必须相等,即抽样的总体必须是等方差的。
4. 样本容量:每个组中的观测值数量应该足够多,这样才能保证估计的参数接近真实值。
5. 满足其他假设:例如,误差项应该是随机的,并且服从均值为0的正态分布。
双因素方差分析的步骤如下:
1. 提出假设:包括主效应和交互效应的假设。
2. 方差分析表:列出观测值的数量、各组的均值和方差以及总均值和总方差。
3. F检验:通过F检验来检验主效应和交互效应的显著性。
4. 结果解释:如果F检验的结果显著,则说明主效应或交互效应对因变量有影响;否则,说明没有影响。
以上信息仅供参考,如需获取更多详细信息,建议咨询统计学专家或查阅统计学相关书籍。
数理统计方法题解6-2
![数理统计方法题解6-2](https://img.taocdn.com/s3/m/277d1201b52acfc789ebc9b9.png)
6.5 在某种化工产品的生产过程中,选择3种不同的浓度:1A =2% ,2A = 4% ,3A = 6% ;4种不同的温度:1B =10︒C ,2B =24︒C ,3B =38︒C ,4B =52︒C ;每种浓度和温度的组合都重复试验2问:(1)浓度的不同对产品收率是否有显著的影响?(显著水平) (2)温度的不同对产品收率是否有显著的影响?(显著水平05.0=α)(3)浓度与温度的交互作用对产品收率是否有显著的影响?(显著水平05.0=α) 解 这是一个考虑交互作用的双因子方差分析问题。
浓度就是因子A ,温度就是因子B 。
设各种浓度与温度下的收率为 j i ξ~),(2σμj i N ,其中,j i j i j i γβαμμ+++=,3,2,1=i ,4,3,2,1=j 。
检验浓度对产品收率是否有显著的影响,相当于要检验 01H :321ααα== 。
检验温度对产品收率是否有显著的影响,相当于要检验 02H :4321ββββ=== 。
检验交互作用对产品收率是否有显著的影响,相当于要检验03H :341211γγγ=== 。
计算结果见下表:06.7492.2588.282.1682.862.100.1811=+++++==∑∑==r i sj j i e SS SS 。
方差分析表为:因为 ))1(,1(89.309.41--=>=-t s r r F F A α,所以拒绝 01H , 浓度的不同对产品收率有显著的影响。
因为 ))1(,1(49.371.01--=<=-t s r s F F B α ,所以接受02H ,温度的不同对产品收率没有显著的影响。
因为 ))1(),1)(1((00.383.01---=<=-t s r s r F F AB α ,所以拒绝03H ,浓度与温度的交互作用对产品收率没有显著的影响。
6.6 某化工厂为了提高塑料大红R 颜料的收率,对合成过程中的酰氯化反应条件进行3因子3水平正交试验,所取的因子和水平分别为:因子 A 是酰氯化温度,1A 是85︒C ,2A 是95︒C ,3A 是105︒C ; 因子 B 是SOCl 2用量,1B 是4.2 ml ,2B 是4.6 ml ,3B 是5.0 ml ; 因子 C 是催化剂用量,1C 是0.2 ml ,2C 是0.5 ml ,3C 是0.8 ml 。
6-2双因素方差分析
![6-2双因素方差分析](https://img.taocdn.com/s3/m/3d1d58580a4e767f5acfa1c7aa00b52acfc79cce.png)
• H0:m1=m2=m3=m4=m5 (地区对销售量无显著影响) • H1:mj (j =1,2,…,5) 不全相等 (有显著影响)
【例】有4个品牌的彩电在5个地区销售,为分析彩电的品牌( 品牌因素)和销售地区(地区因素)对销售量的影响,对每显著 个品牌在各地区的销售量取得以下数据。试分析品牌和销售 地区对彩电的销售量是否有显著影响?(=0.05)
5. 误差项平方和: SSE SST SSR SSC SSRC
SST=SSR+SSC+SSRC+SSE
可重复双因素方差分析表
(基本结构)
误差来源 平方和 自由度
(SS)
(df)
均方 (MS)
F值
P值
F 临界值
行因素 列因素 交互作用
误差
SSR SSC SSRC SSE
k-1 MSR FR r-1 MSC FC (k-1)(r-1) MSRC FRC kr(m-1) MSE
replication)
3. 如果除了行因素和列因素对试验数据的单
独影响外,两个因素的搭配还会对结果产 生一种新的影响,这时的双因素方差分析
称为有交互作用的双因素方差分析或可重 复 双 因 素 方 差 分 析 (Two-factor with
replication )
双因素方差分析的基本假定
1. 每个总体都服从正态分布 ▪ 对于因素的每一个水平,其观察值是来自正态分布
不同品牌的彩电在5个地区的销售量数据
品牌因素 地区1
地区因素 地区2 地区3 地区4
品牌1
365
350
343
340
品牌2
345
368
363
单因素方差分析与双因素方差分析 原理的相同点与不同点?
![单因素方差分析与双因素方差分析 原理的相同点与不同点?](https://img.taocdn.com/s3/m/bcd6c9665f0e7cd18525363d.png)
总离差平方和SST的自由度为r×k-1=n-1; 因素A的离差平方和SSA的自由度为r-1; 因素B的离差平方和的自由度为k-1; 随机误差SSE的自由度为(r-1)×(k-1)
第八章 方差分析
地区消费者不同的特殊偏爱,这就是两个因素结合 后产生的新效应,属于有交互作用的背景;
否则,就是无交互作用的背景。有交互作用的 双因素方差分析已超出本书的范围,这里介绍无交 互作用的双因素方差分析。
第八章 方差分析
6.3.2 数据结构
双因素方差分析的数据结构如表所示:
表 8-7 双因素方差分析数据结构
第八章 方差分析
方差分析解决的主要问题是什么? 单因素方差分析与双因素方差分析 原理的相同点与不同点? 正交实验设计的基本原理是什么?
第八章 方差分析
8.1 方差分析的基本问题
[例题] 某公司计划引进一条生产线.为了选择一
条质量优良的生产线以减少日后的维修问题, 他们对6种型号的生产线作了初步调查,每种型 号调查4条,结果列于表8-1。这些结果表示每 个型号的生产线上个月维修的小时数。试问由 此结果能否判定由于生产线型号不同而造成它 们在维修时间方面有显著差异?
在实际问题的研究中,有时需要考虑两个因素 对实验结果的影响。
例如饮料销售,除了关心饮料颜色之外,我们 还想了解销售地区是否影响销售量,如果在不同的 地区,销售量存在显著的差异,就需要分析原因。 采用不同的销售策略,使该饮料品牌在市场占有率 高的地区继续深入人心,保持领先地位;在市场占 有率低的地区,进一步扩大宣传,让更多的消费者 了解、接受该生产线。
第八章 方差分析
6.3.1 双因素方差分析的类型
若把饮料的颜色看作影响销售量的因素A,饮料 的销售地区则是影响因素B。对因素A和因素B同时进 行分析,就属于双因素方差分析。
双因素试验方差分析
![双因素试验方差分析](https://img.taocdn.com/s3/m/dfa148dc0c22590102029dc4.png)
SS E df E
SST
注意
df E dfT df A f B , SSE SST SSA SSB
各因素离差平方和的自由度为水平数减一,总平方 和的自由度为试验总次数减一。
双因素(无交互作用)试验的方差分析表
简便计算式:
SS A DA p, SSB DB p
双因素试验的方差分析
在实际应用中,一个试验结果(试验指标)往往 受多个因素的影响。不仅这些因素会影响试验结果, 而且这些因素的不同水平的搭配也会影响试验结果。 例如:某些合金,当单独加入元素A或元素B时, 性能变化不大,但当同时加入元素A和B时,合金性 能的变化就特别显著。 统计学上把多因素不同水平搭配对试验指标的 影响称为交互作用。交互作用在多因素的方差分析 中,把它当成一个新因素来处理。 我们只学习两个因素的方差分析,更多因素的 问题,用正交试验法比较方便。
双因素无重复(无交互作用)试验资料表
因素 B 因素 A
B1
X 11 ... X a1
B2
X 12 ... X a2
... Bb
... ... ... X 1b ... X ab
Ti. X ij X i. T b i.
j 1
b
A1 ... Aa
a b i 1 j 1
1 b i ij i 水平Ai对试验结果的效应 a j 1 1 a j ij j 水平Bj对试验结果的效应 b i 1 试验误差 ij X ij ij
特性:
i 1
a
i
0;
j 1
b
j
0; ij ~ N 0,
6-2交互作用双因子方差分析解析
![6-2交互作用双因子方差分析解析](https://img.taocdn.com/s3/m/651f0055f46527d3250ce016.png)
无交互作用的 双因素方差分析
假定因素A和因素 B的效应之间是相 互独立的,不存 在相互关系
有交互作用的 双因素方差分析
假定因素A和因素B 的结合会产生出一 种新的效应
二、数据结构
r 个不同的水平 A1 , , Ar , 设因素A 有
s 个不同的水平 B1 , , Bs , 因素B 有
现对因素A 、B 的每一种不同的水平组合: Ai , B j i 1,2, , r ; j 1,2, , s 都安排t t 2 次试验(称为等重复试验) ,假 定各次试验是相互独立的,得到如下试验结 果:
ij相互独立同分布N (0, 2 )
1 r s 记:u uij ——理论总均值 rs i 1 j 1
1 s 记:ui uij —因素A在i水平下的理论平均 s j 1
1 r 记:u j uij —因素B在j水平下的理论平均 r i 1
uij u ui u u j u uij ui u j u
显然
记:i = ui u
记: j = u j u
它是水平 它是水平 Ai 下的理论均值与理论总均值的偏差,称为水平 Ai 下的效应;
Bj
记:rij uij ui u j u uij u i j
所以 r ij
是总效应 uij u 减去 Ai 的效应 i 后的剩余部分,称为水平组合 Ai , B j 的交互效应。
u ij u (视为总效应)是由如下四部分组成:
Ai 下的效应 i ; (1)水平 j ; (2)水平B j 下的效应 A , B ij (3)水平组合 i j 的交互效应 ; ij (4)随机因素引起的随机波动 .
8.9有交互作用双因素方差分析问题描述
![8.9有交互作用双因素方差分析问题描述](https://img.taocdn.com/s3/m/5d9928bc9ec3d5bbfc0a7412.png)
r
mij
j =1
=1 k
k
1
i=1 mi鬃= r
r
mj
j =1
å1 r
mi× = r
mij
j =1
å m×j
=
1 k
k i =1
mij
ai = mi× - m
bj = m×j - m
i =1, 2,..., k
j =1, 2,..., r i =1, 2,..., k j =1, 2,..., r
(ab)ij = mij - mi鬃- m j + m
ì ï
X ij
= mij
+ ai
+bj
+ (ab)ij
+e ijs
ï ïï
e ijs
~
N (0,s
2 ), 各e ijs独立
í ï
i
=1, 2,..., k;
j
=1, 2,..., r; s
=1, 2,..., t
邋 邋 ï k
r
k
r
ï ïî
ai
i =1
= 0; bj
i =1
= 0; (ab)ij
i =1
… ..., X krt
… T鬃r
… X 鬃r
…
Ti鬃
X i鬃
…
…
Tk鬃
X k鬃
总和 总均值
TX
有交互作用双因素方差分析问题描述
所考察的因素记为
因素 共有 个水平 因素 共有 个水平
Xijs ~ N(mij ,s 2)(i =1, 2,..., k; j =1, 2,..., r; s =1, 2,...,t) 其中,
如何进行有交互多因方差分析
![如何进行有交互多因方差分析](https://img.taocdn.com/s3/m/b4b6c71aeffdc8d376eeaeaad1f34693daef1093.png)
如何进行有交互多因方差分析
1、为了说明如何进行有交互作用多因素方差分析,我们使用盈质统计分析软件打开一个包含例子数据的Excel文件。
这是某烘焙店推出的某新款面包试吃评分,为了得到最优的口感,分别调整了糖含量和添加剂含量,在5%的显著性水平上,我们用有交互的方差分析对评分结果进行分析和分组。
2、在“方差分析菜单”下,点击“多因素方差分析”。
3、响应选择“面包试吃评分”,因子,单击“点击添加按钮”,选择“含糖量”、“是否含添加剂”,添加至右边,确认提交,勾选交互作用选项。
4、点击确定,会自动生成有交互作用的双因素方差分析结果和Tukey多重比较分组结果。
5、我们来看这个例子的分析结果,首先看因子信息,列出了两个因子的各个水平。
重点看方差分析表各个因子的P值,含糖量P值为0,小于显著性水平0.05,说明含糖量对面包的试吃评分有影响;是否含添加剂,P值为0.001,说明是否含添加剂对试吃评分也有影响;含糖量:是否含添加剂的P值为0,说明含糖量与是否含添加剂对面包试吃评分有交互作用的影响。
6、最后看通过Tukey方法给出的多重比较结果分组。
分别按因子进行了比较和
分组。
“含糖量”因子,“中”和“高”同属A组,“低”和“无”分属B和C组。
“是否含添加剂”因子,“不含”和“含”分属A和B组;重点看“含糖量”和“是否含添加剂”交互作用的分组,按评分由高至低排列,得到评分最高的A组为含糖量中等,且含有添加剂,所以,店家决定按这个配方制作该款面包,以得到最优口感。
7、如需查看完整视频或了解更多信息,请百度搜索“盈质统计分析软件”进行查看。
有交互影响的双因素方差分析
![有交互影响的双因素方差分析](https://img.taocdn.com/s3/m/4210ee5e195f312b3169a591.png)
2、有交互影响的双因素方差分析假设两个因素A 和B ,因素A 有a 个水平,因素B 有b 个水平,对每一个水平A i B j重复了n 次试验。
X ijk 为在因素A 的第i 个水平,因素B 的第j 个水平下进行第k 次试验时的观察值(i =1,2... a ;j =1,2,...b ;k =1,2,...,n)。
有交互影响的双因素方差分析表如下:表9-12 有交互影响的双因素分析表其中:21()ai SSA bn i X A ==*∑-21()bj SSB na j X B==*-∑211(())ab i j SSAB n i jij X AB A B =-=--+∑∑2111()()abni j k SSE ijk ijA B X ====-⨯∑∑∑ 在显著性水平α下,如果F>临界值F α,则拒绝原假设,认为差异显著。
小案例9-2:不同路段和不同时间段对行车时间的影响城市道路交通管理部门为研究不同的路段和不同的时间段对行车时间的影响,让一名交通警察分别在两个路段和高峰期与非高峰期亲自驾车进行试验,通过试验共获得了20个行车时间的数据,如表9-13。
试分析路段、时段以及路段和时段的交互作用对行车时间的影响。
路段与时段对行车时间的影响:交互作用 无交互作用图9-1 有无交互作用的图示表9-13 不同的路段和不同的时间段对行车时间的影响数据表 (单位:min)路段(列变量)路段1路段2 时段(行变量)高 峰 期26 19 24 20 27 23 25 22 2521 非 高 峰 期20 18 17 17 22 13 21 16 1712通过计算,可以得到如表9-14所示的交互作用方差分析表。
可以得到:不同路段对行车时间有显著影响,不同时段对行车时间有显著影响,而路段与时段的交互作用对行车时间没有显著影响。
表9-14 交互作用方差分析表差异源 SS df MS F P 值 样本 174.0500 1 174.0500 44.0633 0.00000 列 92.4500 1 92.4500 23.4051 0.00002 交互 0.0500 1 0.0500 0.01270.9118内部 63.200 16 3.9500总计329.7519。
第九章双向方差分析
![第九章双向方差分析](https://img.taocdn.com/s3/m/27756813f11dc281e53a580216fc700abb6852bf.png)
第九章双向方差分析
双向方差分析的基本原理是将观测值拆分为不同因素和交互作用的影响,并通过计算方差分析来判断因素和交互作用是否显著。
这种方法可以
帮助研究者确定不同因素对观测值的相对重要性,以及它们之间的相互关系。
双向方差分析有两个自变量和一个因变量。
第一个自变量称为行因素,第二个自变量称为列因素,因变量是我们想要比较的指标。
例如,我们可
以考察一个药物对不同性别和年龄组别的患者的疗效,并将性别和年龄分
别作为行因素和列因素,疗效作为因变量。
在进行双向方差分析之前,我们需要先进行数据收集和整理,确保数
据的完整性和合理性。
然后,我们可以通过计算方差分析表来检验不同因
素和交互作用的显著性。
双向方差分析的结果可以呈现在图形或表格中,以便更直观地理解和
比较不同因素和交互作用的影响。
例如,我们可以通过绘制柱状图来显示
不同因素和交互作用对观测值的平均影响,并通过误差线来表示平均值的
置信区间。
双向方差分析还可以用于比较多个因素和交互作用之间的差异。
例如,如果我们有一个实验涉及三个因素和它们之间的交互作用,我们可以使用
双向方差分析来比较这些因素和交互作用之间的差异,以确定哪些因素和
交互作用对观测值的影响最显著。
总之,双向方差分析是一种非常有用的统计方法,可以帮助研究者比
较和分析两个或多个因素对观测值的影响,并判断它们之间的交互作用是
否显著。
它不仅可以提供关于不同因素和交互作用的相对重要性的信息,还可以为进一步的研究和决策提供科学依据。
双因素方差分析
![双因素方差分析](https://img.taocdn.com/s3/m/0cd2f2500a1c59eef8c75fbfc77da26924c59663.png)
1)(m
1))
在H0B 成立时, 检验统计量
FB
SSMB (m 1) SSE (l 1)(m 1)
H0B真
~ F(m
1,(l
1)(m
1))
概率论与数理统计
❖ 1.无交互作用的双因素方差分析
➢ 要说明因素A有无显著影响, 就是要检验如下假设:
H0A:1 = 2 = … = l = 0, H1A:1, 2, …,l 不全为零
lm
➢ 误差平方和: SSE
( xij xi. x. j x )2
i1 j1
lm
➢ 总离差平方和: SST
( xij x )2
i1 j1
➢ 可以证明: SST = SSMA + SSMB + SSE
概率论与数理统计
❖ 1.无交互作用的双因素方差分析
➢ 可以证明: 构造检验统计量
ij~N(0, 2), 且相互独立, 1 ≤ i ≤ l, 1 ≤ j ≤ m,
l
ai 0,
i 1
m
j 0
j1
其中表示平均的效应, i和j分别表示因素A的第i个水 平和因素B的第j个水平的附加效应, ij为随机误差,假定ij
相互独立并且服从等方差的正态分布.
概率论与数理统计
❖1. 无交互作用的双因素方差分析
SSMA SSMB SSE
SSMA / (l – 1) MSA / MSE PA SSMB / (m – 1) MSB / MSE PB SSE / (l – 1)(m – 1)
全部
lm – 1
SSMA + SSMB +SSE
其中MSA = SSMA/(l – 1), MSB = SSMB/(m – 1),
双因子方差分析[1]
![双因子方差分析[1]](https://img.taocdn.com/s3/m/1b3c6d5f763231126fdb114c.png)
上面我们讨论了单因子试验中的方差分 析,但在实际问题中,更多出现的却是 多因素试验,往往需要同时研究几种因 素对试验结果的影响,比如农业生产中 需要同时研究肥料和种子品种对农作物 产量的影响。这样的问题就存在两个因 子:一个因子是肥料的种类,一个因子 是种子的品种。
它们两者同时影响着农作物的产量。我们 希望通过试验选取使产量达到最高的肥料 种类和种子品种。由于有两个因子的影响, 就产生一个新问题:不同种类的肥料和不 同品种的种子对产量的联合影响不一定是 它们分别对产量影响的迭加,也就是说肥 料类型和种子品种要搭配得当才能得到最 高产量,这类各因子的不同水平的搭配所 产生的影响在统计学中称为交互作用。各 因子间是否存在交互作用是多因子方差分 析中产生的新问题。
ESe (r 1)(s 1) 2
因此在H01和H02为真时,
SA , SB r 1 s 1
分别是σ2的无偏估计,为此构造统计量
FA
Se
SA (r
(r 1) 1)(s 1)
~
F ((r
1),(r
1)(s 1))
FB
Se
SB (r
(s 1) 1)(s 1)
~
F((s 1),(r 1)(s 1))
变一下,令
1 rs
r i1
s
ij ,
j 1
称为一般平均。
i.
1 s
s j 1
ij
,
i 1,2,,r
. j
1 r
r i1
ij
,
j 1,2, s
i i. , i 1r , 称i为因子A的第i个水平的效应。
j . j , j 1s , 称 j为因子B的第j个水平的效应。
双因素方差分析
![双因素方差分析](https://img.taocdn.com/s3/m/6464216fb90d6c85ec3ac6d1.png)
三、双因素方差分析
在上述误差平方和的基础上计算均方,也就是将各平方和除 以相应的自由度。与各误差平方和相对应的自由度分别为:
SST的自由度为kr-1,SSR的自由度为k-1,SSC的自由度 为r-1,SSE的自由度为(k-1)(r-1)。
为构造检验统计量,需要计算下列各均方: ①行因素的均方,记为MSR。 ②列因素的均方,记为MSC。 ③随机误差的均方,记为MSE。
三、双因素方差分析
二、 无交互作用的双因素方差分析
1. 数据结构
在无交互作用的双因素方差分析中,由于有两个 因素,因而在获取数据时,需要将一个因素安排在“ 行”的位置,称为行因素;另一个因素安排在“列” 的位置,称为列因素。设行因素有k个水平,列因素 有r个水平,行因素和列因素的每一个水平都可以搭配 成一组,观察它们对试验指标的影响,共抽取kr个观 察数据,其数据结构见表7-8。
三、双因素方差分析
“全因子”单选按钮为系统默认项,用 来建立全模型。全模型中包括因素之间的交 互作用。如果选择分析两个因素的交互作用 ,则必须在每种水平组合下取得两个以上的 试验数据,才能实现两个因素的交互作用的 分析。如果不考虑因素间的交互作用,则应 当选择自定义模型。
三、双因素方差分析
“设定”单选按钮用来自定义模型,本例选择此项并激活下面的各项操 作,如图7-12所示。
三、双因素方差分析
2. 分析步骤
与单因素方差分析类似,双因素方差分析也包括提出假设、构造检验 统计量和决策分析等步骤。
(1)提出假设。
为了检验两个因素的影响,需要对两个因素分别提出如下假设:
①对行因素提出假设。
H0∶μ1=μ2=…=μk=μ
行因素(自变量)对因变量没有显著影响
双因素差分析方法
![双因素差分析方法](https://img.taocdn.com/s3/m/31115a9110a6f524cdbf8581.png)
SSA称为因素A的离差平方和,反映因素 A 对试验 指标的影响。 SSB称为因素B的离差平方和,反映因素 B 对试验指标的影响。SSAB称为交互作用的离差平方和, 反映交互作用AB对试验指标的影响。SSE称为误差平 方和,反映试验误差对试验指标的影响。
若“各因素、各水平及其交互作用的影响无统计意义”的假设
F A S S S S E Ad d f fE A M M S S E A~ F a 1 ,a 1 b 1 F B S S S S E Bd d f fE B M M S S E B~ F b 1 ,a 1 b 1
对给定的检验水平 ,
当 F A F a 1 ,a 1 b 1 时,
H 0 2:12 Lb 0
H 0 3 :
0i 1 ,2 ,L ,a ;j 1 ,2 ,L ,b i j
➢ 总离差平方和的分解定理 仿单因素方差分析的方法,考察总离差平方和
a b n
2
SST
Xijk X
i1 j1k1
可分解为: S S T S S A S S B S S A B S S E
bi1
ij
gj
水平Bj对试验结果的效应
ijijij 交互效应
ijk Xijk ij 试验误差
a
b
特性: i 0; j 0;
i1
j1
a
b
ij0 ; ij0 ;ijk~N 0 ,2
i 1
j 1
要判断因素A,B及交互作用AB对试验结果是否 有显著影响,即为检验如下假设是否成立:
H 0 1:12 La 0
称为因素A的离差平方和, 反映因素 A 对试验指标的影响。
i1
b
SSB a
2
X.j X
双因素方差分析法
![双因素方差分析法](https://img.taocdn.com/s3/m/55beccef4afe04a1b071def3.png)
1 b 水平A α i = ∑ µij − µ = µi i − µ 水平 i对试验结果的效应 a j =1 1 a 水平 β j = ∑ µij − µ = µi j − µ 水平Bj对试验结果的效应 b i =1 试验误差 ε ij = X ij − µij
特性: 特性:
∑ α i = 0;
i =1
Fα ( ( a − 1 ) ,
df E
df T
SS E MSE = df E
SS T
注意
df E = dfT − df A − f B , SS E = SST − SS A − SS B
各因素离差平方和的自由度为水平数减一, 各因素离差平方和的自由度为水平数减一,总平方 和的自由度为试验总次数减一。 和的自由度为试验总次数减一。
dfT = n −1 = 11 df A = a −1 = 3 df B = b −1 = 2
SSE = SST − SSA − SSB = 32.83 df E = df A ⋅ dfb = 6
MSA = SSA df A = 38.223
F0.01 ( 3,6) = 9.78 F0.05 ( 3,6) = 4.76
双因素方差分析方法
双因素试验的方差分析
在实际应用中,一个试验结果(试验指标) 在实际应用中,一个试验结果(试验指标)往往 受多个因素的影响。不仅这些因素会影响试验结果, 受多个因素的影响。不仅这些因素会影响试验结果, 而且这些因素的不同水平的搭配也会影响试验结果。 而且这些因素的不同水平的搭配也会影响试验结果。 例如:某些合金,当单独加入元素 或元素 或元素B时 例如:某些合金,当单独加入元素A或元素 时, 性能变化不大,但当同时加入元素A和 时 性能变化不大,但当同时加入元素 和B时,合金性 能的变化就特别显著。 能的变化就特别显著。 统计学上把多因素不同水平搭配对试验指标的 影响称为交互作用。 影响称为交互作用。交互作用在多因素的方差分析 把它当成一个新因素来处理。 中,把它当成一个新因素来处理。 我们只学习两个因素的方差分析, 我们只学习两个因素的方差分析,更多因素的 问题,用正交试验法比较方便。 问题,用正交试验法比较方便。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、离差平方和的分解
记
1 r s t x xijk rst i 1 j 1 k 1
称为样本总平均;
1 t xij xijk t k 1
xi 1 s t xijk st j 1 k 1
称为水平组合 Ai , B j 下的样本均值; 称为水平 Ai 下的样本均值; 称为水平 B j 下的样本均值。
r r r i 1
s
0
i 1
s
i 1
s
ij uij ui u j u uij ui su i su i 0
j 1 j 1 j 1
所以,如果 H 02 成立,那么因素 B 各效应的水平皆为零; 如果 H 03 成立,那么 ij 0
2 i 1 j 1 k 1
i 1 j 1 k 1 r s t
i 1 j 1 k 1
i 1 j 1 k 1
可以验证上式右边所有的交叉乘积项皆为零 记
SE
SA
2
xijk xij
r s t
2
2
xi x
i 1 j 1 k 1 r s t i 1 j 1 k 1 r s t
rs t 1 2 S A B r 1s 1 ~ F r 1s 1, rs t 1 2 S E rs t 1
2
SB
s 1
,可得 若控制犯第一类错误的概率不超过
x 2 s1 , x 2 s 2 , , x 2 st
……
x r11 , x r12 , , x r1t
……
x r 21 , x r 22 , , x r 2 t
……
x rs 1 , x rs 2 , , x rst
Ar
在水平组合 Ai , B j 下的 t 次试验,由于所有可控制 因素均没有发生变化,试验结果 xij1 , xij 2 ,, xijt 的差异 纯粹是由随机因素引起的,故可将数据 xij1 , xij 2 ,, xijt 看成是来自正态总体
i 1,2,, r; j 1,2,, s .
H 02 、 H 03 中的三组参数 i 以上 3 个假设H 01 、 、 、 j
ij 都是未知的,为了对三个假设成立与否进行检验,
仍只能依据试验观测值 xijk ( i 1,2, , r ; j 1,2, , s; k 1, , t ) 并且仍是从分析这组数据的离散性着手。
2 r s t 2
x j
1 r t xijk rt i 1 k 1
考虑总变差平方和 S T xijk x 的如下分解:
i 1 j 1 k 1
ST xijk x
2 r s t
2
= xijk xij xi x x j x xij xi x j x
x ij x i x j x 可作为rij u ij u i u j u 的
估计值。
若 H 01 成立,即 1 2 r 0 ,那么,虽然
SA i 的估计值之平方和的若干倍的 不能苛求做为诸
r s t 2 r 2 i 1 j 1 k 1 i 1
例如饮料销售,除了关心饮料颜色之外,我们还想 了解销售地区是否影响销售量,如果在不同的地区, 销售量存在显著的差异,就需要分析原因。采用不 同的销售策略,使该饮料品牌在市场占有率高的地 区继续深入人心,保持领先地位;在市场占有率低 的地区,进一步扩大宣传,让更多的消费者了解、 接受该生产线。
双因 素方 差分 析的 类型
j 1
s
因此,要鉴别因素A 是否对结果有显著影响,只 需鉴别因素A 水平的改变是否导致试验结果的明显变 化,这等价于检验因素A 各水平的效应是否相等,即 检验假设
H 01 : 1 2 r
(6.果有显著影响, 类似地,要鉴别因素 等价于检验假设
r
i 1 j 1 k 1 s t
2
xijk xij xi x x j x
2 r s t 2 r s t
i 1 j 1 k 1 r s t
2
xij xi x j x +(交叉乘积项)
t 2 k 1
素引起的,因此,在各种水平组合下总的误差平方和
S E 就基本上刻划了整个试验中随机因素作用的强
度,以它为尺度来比较各种效应的大小应该说是合理 的。
2
从矩估计的角度看,
x 、xi 、x j 、xij 分别是
uij 的估计值,因此, u 、ui 、u j 、
xi x 可作为 i u i u 的估计值; x j x 可作为 j u j u 的估计值;
u ij u (视为总效应)是由如下四部分组成:
Ai 下的效应 i ; (1)水平 j ; (2)水平B j 下的效应 A , B ij (3)水平组合 i j 的交互效应 ; ij (4)随机因素引起的随机波动 .
1 r s i ui u s uij ru 0 i 1 i 1 i 1 j 1
第二节
双因素方差分析
双因素方差分析的类型 数据结构 离差平方和的分解 应用实例
一、 双因素方差分析的类型
如果在试验中有两个可控制因素 A, B ,同时发生变 化,而其它可控制因素均保持不变,这样的试验称为 双因素试验。 双因素试验方差分析的作用是同时鉴别两个因素 对结果可能产生的影响。
r r
1 s r j u j u r uij su 0 j 1 j 1 j 1 i 1
s s
u
i 1 ij i 1
r
r
ij
ui u j u =0
j 1
s
ij
uij ui u j u =0
1.双因素方差分析的数据结构如表所示:
B1 A1 A2
x111 , x112 , , x11t
x 211 , x 212 , , x 21t
B2
x121 , x122 , , x12t
x 221 , x 222 , , x 22t
…… …… …… …… ……
Bs
x1s1 , x1s 2 , , x1st
H 02 : 1 2 s
(6.29)
是否成立。 要鉴别因素A 与因素B 是否存在交互效应,等价于 检验假设 H 03 : ij i 1,2, , r ; j 1,2, , s 全相等 是否成立。 (6.30)
1 r s 由于 i u i u u ij ru 0 , s i 1 j 1 i 1 i 1
2
( xi x st xi x )恰好等于零,
SA S 但相对于 E 来说一定不应太大,倘若 2 超过某个界 SE
2
2
H 01 ,故 限值 k1 ,我们就有理由拒绝
S A2 取 H 01 的拒绝域为 W01 2 k1 SE
偏差平方和。
则得到总变差平方和的分解式:
ST SE S A SB S A B
r s t
2
2
2
2
2
(6.31)
下面分析 S E xijk xij
2
i 1 j 1 k 1
2
在 i 、 j 给定时,t 个数据 xijk ( k 1,2,, t )与其 平均值 xij 的偏差平方和 xijk xij 纯粹是由随机因
X ij ~ N uij , 2
(6.19)
的 t 个样本观测值.
对不同的水平组合 Ai , B j ,假定各总体的方差相
等,但均值 u ij 可能存在差异。
2.双因素试验的方差分析的数学模型
X ij uij ij , i 1,2 r (因素A的水平),j 1,2 s因素B的水平,
i 1 j 1 k 1 r s t
称为误差平方和。
A 的主效应偏差平方和。 称为因素 B 的主效应偏差平方和。 称为因素
2
2
SB
2
x j x
2
i 1 j 1 k 1
2
S AB
xij xi x j x 称为 A B 的交互效应
显然
记:i = ui u
记: j = u j u
它是水平 它是水平 Ai 下的理论均值与理论总均值的偏差,称为水平 Ai 下的效应;
Bj
记:rij uij ui u j u uij u i j
所以 r ij
是总效应 uij u 减去 Ai 的效应 i 后的剩余部分,称为水平组合 Ai , B j 的交互效应。
r r
因此,如果 H 01成立,那么因素 A 各水平的效应必皆为 0.
1 s r 类似地,由 j u j u u ij su 0 r j 1 i 1 j 1 j 1
s s
ij uij ui u j u uij u j ru j ru j
下的理论均值与理论总均值的偏差,称为水平 B j 下的效应;
和 B j 的效应 j
于是 X ij ~ N u ij , 2 可以等价的表示为:
X ij uij ij u i j ij ij , i 1,2, , r ; j 1,2, , s 2 ij ~ N 0, 这表明,在因素A, B 的不同水平组合下,试验结果的相对差异
无交互作用的 双因素方差分析