实验优化设计 第4章 方差分析
第四章方差分析修改 ppt课件
21
第二节 完全随机设计资料的方差分析
变异程度除了与离均差平方和的大小有关外, 还与其自由度有关,将各部分离均差平方和除 以相应自由度,其比值称为均方差,简称均方 (mean square,MS)。
MS组间
SS组间
组间
MS组内
SS组内
组内
22
第二节 完全随机设计资料的方差分析
组间均方与组内均方的比值称为F 统计量
3.组内变异 在同一处理组中,虽然每个受 试对象接受的处理相同,但测量值各不相同, 各组内Xij大小各不相同,与本组的样本均数 也不相同,这种变异称为组内变异(误差)。 组内变异可用组内各测量值Xij与其所在组的
均数的差值的平方和表示,记为SS组内, 表示
随机误差(含个体差异和测量误差)的影响。 又称误差变异
F
MS组间 MS组内
组 组 内 间 变 变 处 异 异 误 理 误 差差
1 组间 2 组内
23
第二节 完全随机设计资料的方差分析
F 值(Fisher)接近于l,就没有理由拒绝H0; 反之,F 值越大,拒绝H0的理由越充分。数 理统计的理论证明,当H0成立时,F 统计量 服从F 分布。F 分布有两个自由度, 分子自
8
第二节 完全随机设计资料的方差分析
一、完全随机设计
编号
1 2 3 4 5 6 7 … 59 60
随机数 26 08 73 37 32 04 05 … 06 79
序号
17 9 44 24 20 2 4 … 6 50
分组结果 甲 甲 丙 乙 甲 甲 甲 … 甲 丙
9
表9-1 2型糖尿病患者治疗4周后餐后2小时血糖下降值(mmol/L)
26
【优化试验设计】优化设计(方差分析)2016
• 总偏差平方和S及其自由度还满足下列关系:
a
S S j S j S j S j
j 1
c因
c交
c空
a
f f f j f j f j
j 1
c因
c交
c空
• 总偏差平方和等于正交表所有列偏差平方和之和,等于所有 试验因素、试验考察交互作用和空列偏差平方和之和;其自 由度等于各列自由度之和,等于试验因素、试验考察交互作 用和空列的自由度之和。
差,则有:
(n 1)S 2
2
~
2 (n 1)
25
F分布:
设 U ~ 2 (n1) ,V ~ 2 (n2 ) ,且U、V独立,则称随机变量:
F U / n1 V / n2
服从自由度为(n1,n2)的F分布,记为F~F(n1,n2)。
F临界值是根据统计数学原理而编制的F分布表(Fα(f1, f2)),对 于不同的 α值,设计了不同的F分布表
P[FA F ( f A , fe )] 1
如果 FA F ( f A , fe ) ,就可以拒绝接受原假设,并认为在显著
水平 下,因素 A的水平变动对试验指标有显著的影响,而作
这一结论的置信度为1- ,犯错误的几率为 。
常用的F表有α=0.01、0.05、0.10、0.25几种, α称为置信度
S j
a b
b
( y jk
k 1
y)2
其中:y jk
y jk a
b
ab 2 b [ k 1 ( y jk
2
y
2yy
jk )]
a b 2
2
b
方差分析(ANOVA)PPT参考课件
三、多个样本均数的两两比较
34
2020/1/15
方差分析能说明什么问题?
不拒绝H0,表示拒绝总体均数相等的证据不
足 分析终止
拒绝H0,接受H1, 表示总体均数不全相等
哪两两均数之间相等?哪两 两均数之间不等?
需要进一步作多重比较
35
2020/1/15
能否用T检验呢 当有k个均数需作两两比较时,比较的次数共 有c= = k!/(2!(k-2)!)=k(k-1)/2
18~岁 21.65 20.66
… … 18.82 16 22.07 8.97
30~岁 27.15 28.58
… … 23.93 16 25.94 8.11
45~60岁 20.28 22.88 … … 26.49 16 25.49 27 7.19
2020/1/15
基本步骤
(1)建立假设,确定检验水准
2020/1/15
单因素方差分析 (1) 方差齐性检验
结果分析
2020/1/15
Test of Homogeneity of Variances
no
Levene Statistic 3.216
df1 2
df2 33
Sig. .053
Levene方法检验统计量为3.216,其P值为0.053,可 认为样本所来自的总体满足方差齐性的要求。
方差分析(ANOVA)
1
2020/1/15
n4
n3 n2 n1
Y4
Y3 Y2
Y1
2
2020/1/15
例子:某研究者在某单位工作人员中进行了体重指 数(BMI)抽样调查,随机抽取不同年龄组男性受试 者各16名,测量了被调查者的身高和体重值,由此按 照BMI=体重/身高2公式计算了体重指数,请问,不 同年龄组的体重指数有无差异。
方差分析法PPT课件
计算各样本平均数 y 如i 下:
表 6-2
型号
ABCDE F
yi
9.4 5.5 7.9 5.4 7.5 8.8
•5
引言 方差分析的基本概念和原理
两个总体平均值比较的检验法 把样本平均数两两组成对:
y 1与 y ,2 与y 1 ,…y 3 与 y ,1 与y 6 ,…y ,2 与y 3 ,共有y (5
6.3 显著性检验
利用(6-17)式来检验原假设H0是否成立.对于给定的显著水
平,可以从F分布表查出临界值
A的值.
F(k1,k(再m根1)据),样本观测值算出F
当 FAF(k1,时k(m ,拒1绝))H0,
当 FAF(k1,,时k(m ,接1 受))H0。
即:如果H0成立,F应等于1;相反应大于1,而且因素的影响越大, F值也越大
m
km
T Tj Yij
•38
j1
作统计假设:6种型号的生产线平均维修时数无显 著差异,即
H0: i=0(i=1,2,…,6),H1:i不全为零
•37
6.3 显著性检验
计算SA及SE
k
SA
k
m
i1
(Yi
Y)2
Ti2
i1
m
T2 km
k
km
km
Ti2
SE i1
(Yij Yi)2
j1
i1
j1Yij2i1m
m
Ti Yij
j 1
相当于检验假设
H0 : i 0 (i=1,2,…,k) , H1 : αi不全为零
•29
6.3 显著性检验
可以证明当H0为真时,
ST
2
~2(k
实验优化设计第4章方差分析
(4) 因素的主效应和因素间的交互效应 某因素单独对实验结果所产生的影响或作用,称该因 素的主效应。
因素间的交互作用是指除了因素“孤立地”影响实验 结果之外,还存在因素间不同水平互相搭配,联合在一 起共同对实验结果产生影响。这是在科学实验中常常遇 到的问题。
6
[例4-3] 有A、B两种药物治疗缺铁性贫血,患者12例,分为4组。实验方案是: 第一组用一般疗法;第二组在一般疗法基础上加用A药;第三组在一般疗法基 础上加用B药,第四组在一般疗法基础上A、B两药同时使用。一个月后观察红 细胞增加数。要求分析两种药物的疗效,数据见表4-3。
相 对 偏 差 平 方 和 偏 差 偏 平 差 方 平 和 方 自 和 由 度
12
随机变数的自由度是由数据个数n及数据所受的线性约束方程个数m所决定 的。这n个数据的平方和的自度为n-m。
① 总平方和ST的自由度 vT =N-1 =ar-1
② 因素A偏差平方和SA的自由度 vA=a-1
③ 误差平方和Se的自由度 ve=N-a=ar-a=a(r-1)
分组 第一组 (一般疗法) 第二组 (一般+A药) 第三组 (一般+B药)
1
2
3
平均值
0.8
0.9
0.7
0.8
1.3
1.2
1.1
1.2
0.9
1.1
1.0
1.0
第四组 (一般+A药+B药) 2.1
2.2
2.0
2.1
这种因素之间的相互作用即为交互效应。如果交互效应存在,说明两个因素不 是相互独立的。
把因素A和B的交互作用记为A×B。这里的符号“×”是交互 的记号,不要理解为乘号。两个因素的交互作用好象是在这 两个因素的单独作用之外,另有一个“假想因素”在起作用。
方差分析(ANOVA)实验设计和分析
第4章方差分析(ANOV A)实验设计和分析Catherine Potvin4.1生态学问题弄懂生态学问题需要将各种环境因子的影响分开,生态工作者用实验来解决这个问题。
不论在野外还是在控制环境条件下,可控实验都可以让生态工作者们只变化一个因子来检验其影响。
例如,生长箱能使生物体生长在完全相同的温度而不同的光周期的条件下,或相同的光强而不同温度条件下的实验成为可能。
在控制实验中,通常最希望的情况是环境‘背景’,即所有的影响因子, 不是自由地变化,而是精确地得到控制,这样就能够保证在改变目标变量时,观测的反应不会受到其它因素的影响。
因而控制环境条件, 例如使用生长箱和温室,成为植物生态学的一个常用的方法,如同动物生态学中使用的生长柜和水族槽一样。
本章第一部分,我要讲一下作为实验生态学基本工具的方差分析(ANOV A)。
本章重点放在实验设计上。
虽然人们一般认为生长箱会提供同一环境条件,但不论在一个生长箱内还是生长箱间都存在环境异质性(Lee和Rawlings 1982;Potvin等1990a),因而能够充分处理环境异质性的实验设计将在本章中述及。
尽管我的论述主要是以生长箱实验为基础,其原理在其它类型的控制或野外环境的实验研究中同样适用(第5,15和16章)。
我还要讨论错误实验设计的代价。
本章应视为实验设计的起步点,这个起步点就是要考虑各种影响因素。
实验者通常进行的实验比这里展开的要复杂。
但是一旦懂得了基本原理,讨论各种实验设计就相对简单一些。
更详细的论述请见Cochran & Cox(1957)和Winter(1991)。
4.2 统计问题:环境变化与统计分析正如Underwood(1997)建议的一样,生态实验设计的第一步是建立一个线性模型使研究者能够将感兴趣的变量(因素)独立出来。
由于实验设计支配误差项,建立线性模型取决于所研究的因子以及具体的实验设计。
在任何一个实验开始时,最基本的是要检验空间与时间变化的格局。
方差分析
方差分析
▲方差分析的基本思想(思路) ▲试验结果变化原因的分析分解 ▲平方和分解和自由度分解 ▲ F测验
▲多重比较
▲方差分析的基本思想
方差是平方和除以自由度的商。 所谓方差分析(analysis of variance) ,是关于多个样本平均 数的假设测验方法,是将总变异剖分为各个变异来源的相应 部分,从而发现各变异原因在总变异中相对个独立样本,分别求得其均方 s12 和 s22,将 s12 和 s22 的比值定义为F:
2 2 F(1, 2 ) s1 s2
此F值具有s12 的自由度 v1 和 s22 的自由度 v2。 所谓F分布,就是在给定的 v1 和 v2 下按上述方法从正 态总体中进行一系列抽样,就可得到一系列的F 值而作成 一个分布。 F分布下一定区间的概率可从已制成的统计表查出。
表3.3 资料1LSR值的计算(新复极差测验)
p 2 SSR0.05 3.08 SSR0.01 4.32 LSR0.05 4.40 LSR0.01 6.18
3
4
3.23
3.33
4.55
4.68
4.62
4.76
6.51
6.69
当p=2时,
yD yB =6(cm) yB y A =5(cm)
5%水平显著; 5%水平显著;
y A yC =4(cm)
当p=3时,
不显著。
1%水平上显著; 1%水平上显著。 1%水平上显著。
yD y A =11(cm)
yB yC =9(cm)
当p=4时,
yD yC =15(cm)
结论:资料1的4个处理的苗高,除处理A与C差异不显
著外,其余处理间均达显著差异。
第4讲5(2) 正交试验设计(方差分析)
3
4 5 6 7 8 K1j K2j K1j-K2j SSj
1
1 2 2 2 2 9.9 10.31 -0.41 0.021
2
2 1 1 2 2 9.42 10.79 -1.37 0.235
2
2 2 2 1 1 10.21 10 0.21
1
2 1 2 1 2 10.23 9.98 0.25
1
2 2 1 2 1 10.24 9.97 0.27
拟水平列:第2列
表4-36
试验号 试验号 1 2 3 4 5 6 7 8 9 K1j K2j K3j k1j k2j k3j 调整R' 优水平 优组合 主次顺序 A 1 1 1 1 2 2 2 3 3 3 275.5 252.0 270.0 91.8 84.0 90.0 7.8 A1
例3 试验结果分析表
水 试 验 1 2 3 4 平 号 列 号 A 1 1 1 1 B 1 1 2 2 A×B 1 1 2 2 C 1 2 1 2 A×C 1 2 1 2 B×C 1 2 2 1 误差列 1 2 2 1 数据 5.26 3.90 6.90 7.03
5
6 7 8
2
2 2 2
1
1 2 2 18.68
2
1 2 1 2 11.4 11.5
2
2 1 2 1 10.2 12.7
1
1 2 2 1 12.1 10.8
1
2 1 1 2 12.5 10.4
129.96 132.25
104.04 161.29
146.41 116.64
156.25 108.16
自由度计算: df B df C 2 - 1 1 dfe df 4 df5 1 1 2 (2)显著性检验
第4章 方差分析、正交试验设计
r r
i 2 ( X ij X i )( X i X ) 2[( X i X ) ( X ij X i )] 其中: 2 ( X ij X i )(X i X ) 21[(X i X )1( X ij X i )] 其中: i 1 j 1 i j
r i 1 j 1
i
j n 1 r ni n i 1 11r X X ij ni X i n i 1 j 1 n i 1
X rX 1 r n X 1 r n X ij i i
i 1
i 1 QT ( jX1ij X ) 2
r
i 1 j 1 r r
ni ni
i 1
j 1
r
i 1
j 1
i 1 i 1
E、
QE
2 [( X i X )(ni X i ni X i )] 0
i 1
i
Ar
QT QE QA
QA
r n r 于是,总离差平方和被分解为组内离差平方和与 ( X ij X i )2 ni ( X i X )2 从而: QT i 1 j 1 i 1 组间离差平方和之和。 QE ——反映了 ij 的作用 ②组内离差平方和 ②组内离差平方和QQE——反映了 的作用 ②组内离差平方和 E ——反映了 ij 的作用 ②组内离差平方和QEEE ——反映了ijij的作用 ②组内离差平方和 Q ——反映了 ij ij 的作用 r ②组内离差平方和 ③分解定理 QA 2 Q E——反映了的作用 QEn、 X ) ②组内离差平方和Q ——反映了 )] n ( ) ij 的作用 QEr ( X ij nn [( ) ( i n r r r rn 2 2 2 i 1 ( jXX X )) 2 ( X 1 n Q r ) QQQ ( X ij X 设 [( Yn ( 立 ( ij) ,ij ) 2 [( ( ( )] , ) ) ) (Q 2 (i ~ ( E 理 ( Q 定 E ((XijX:XiX)))2Y11r,Yn12,i相)互独)])]QiAr( N(( i )i ) 2 4.1.1 X i j [([( QT)ij( E i , Yjn (0 )1 , )] )] QE i 11j j11 ij X i i[( i ij ) ( i i )] 1 ij i i i) ③组间离差平方和1Qj 1 ——反映了 i 的作用. ii 1j11j 11 A i 1 j 1 i 2 2 Q A——反映了 Y 2 ~ 2 (n) , 又 若 ③组间离差平方和 是 r——反映了的作用. i ③组间离差平方和 QQ A——反映了 的作用. 1,2,n,于是,总离差平方和被分解为组内离差平方和 n , 于 Q ——反映了i 的作用. n ③组间离差平方和 r ③组间离差平方和 A A Q Y1 Y22 ③组间离差平方和 QA ——反映了i iri i的作用. 的作用. 2 rr rr nn Q ni ( X i 2X ) ni的作用.i ( )]2 i [( i ③组间离差平方和rrr A ——反映了 QA r ( X i X ) rn n QQ1 (( Xi i ) 2 i ( X i QiX 2 2, ni 1, n 的线性组合的 X 22 r i i QA rnQ21X X )Q2,nn1 ( X iX )是 Yr2 , Y )])] 2 ( Q A ( X X2) n ( X X ) 2 Y1 n r[([([( ( )] 其中 ) i 1 j Q 组间离差平方和之和。 nn ( ( )] 2 nj j 1 X i X ) i 1 1r ni ( Xi X ) 2 Q A r ii1 1( r [( i 1
方差分析及回归分析ppt课件
,
j
SE
( X ij X . j )2
j 1 i1
(1,8) (1,9)
s nj
s
SA
(X.j X )2 nj (X.j X )2
j 1 i1
j 1
s
n
j
X
2 .j
nX
2
(1,10)
j 1
• SE称为误差平方和, SA表示Aj水平下的
样本均值与数据总平均的差异,叫做效
应平方和,他是由水平Aj的效应的差异 以及随机误差引起的。
nj
记T. j X ij , j 1,2,...,s,T..
s
n j X ij则有
i 1
j1 i1
ST
s j 1
nj i 1
X
2 ij
nX
2
s j 1
nj i 1
X
2 ij
T..2 n
,
(1,21)
SA
s
n
j
X
2 .j
j 1
nX 2
T s 2 .j
n j1 j
T..2 n
Xij - μj可以看成是随机误差。记为Xij - μj =εij ,则 Xij 可以写为
Xij = μj +εij
εij ~N(0, σ2),各εij独立
(1,1)
i=1,2,…,nj , j=1,2,…,s (1,1)称为单因素方差分析的数学模型。
方差分析的任务
I. 检验s个总体 Xi1 ~ N (1, 2), Xi2 ~ N (2, 2)... Xis ~ N (s , 2) 的均值是否相等,即检验假设
这时模型(1.1)可以改写为:
X ij j ij ,
方差分析与试验设计方法总结
试验设计的缺点
• 需要预先确定实验因素的数量和水平 • 实验设计较为复杂 • 可能引入分组误差
方差分析与试验设计的改进方法
方差分析与试验设计的改进方法
• 结合使用多种试验设计方法 • 采用多元方差分析 • 提高数据的准确性和可靠性
方差分析与试验设计的改进策略
• 在实验设计阶段进行预实验 • 采用适应性实验设计方法 • 利用统计软件进行实验设计和方差分析
试验设计(Experimental Design)
• 是一种科学实验的方法 • 用于安排实验条件和操作步骤 • 以最小的实验成本获得最大的实验信息
试验设计的目的
• 提高实验效率 • 减少实验误差 • 找出影响实验结果的关键因素
试验设计的基本要素
试验设计的三个基本要素
• 处理:对实验对象实施的干预措施 • 对象:实验研究的对象 • 环境:实验研究的环境条件
试验设计在方差分析中的注意事项
• 确保试验设计满足方差分析的前提条件 • 合理选择方差分析的统计模型 • 谨慎解释方差分析的结论
方差分析与试验设计的综合案例
方差分析与试验设计的综合案例
• 通过试验设计安排实验 • 利用方差分析评估实验结果 • 优化实验方案
方差分析与试验设计的综合应用
• 在药物研发领域 • 在农业生产领域 • 在工业生产领域
随机区组试验设计的优点
• 可以消除实验对象之间的差异 • 提高实验效率
拉丁方试验设计
拉丁方试验设计的定义
• 将实验因素按拉丁方排列,以减少实验误差 • 每一种实验因素的排列顺序相同
拉丁方试验设计的优点
• 可以减少实验误差 • 提高实验效率
拉丁方试验设计的缺点
• 需要预先确定实验因素的数量和水平 • 实验设计较为复杂
方差分析_精品文档
2021/5/27
44
2.2 组内观测次数相等的方差分析 K组处理中,每一处理皆有n个观测值,其方
差分析方法同前。
表5. 组内观测次数相等的单因素方差分析
2021/5/27
45
例2.测定东北、内蒙古、河北、安徽、贵 州五个地区冬季针矛的长度,每个地区
随机抽取4个样本,测定结果如表示,试 比较各地区针毛长度差异显著性。
27
其中平均数差数标准误计算公式:
s x1x2
s12s22 n1 n2
se2(n11n12)
当n1=n2时,sx1x2
2se2 n
s e 2 为处理内误差方差,n为每一处理观察次数。
2021/5/27
28
例1. 表1. 氨氮含量(ppm)
2021/5/27
29
根据例1, s 2se2 2*9.112.13
2021/5/27
9
1.4.1 平方和的分解 总平方和=处理间平方和+处理内平方和
SSTSSt SSe
k
S S T 1
n(x x )2x 2 ( x )2x 2 T 2
1
k n
k n
令 C T 2 ,
kn
SST x2C
SSt =
Ti2 C n
SSe SSTSSt
2021/5/27
10
2021/5/27
39
例如,分析不同施肥量是否给农作物产
量带来显著影响,考察地区差异是否影 响妇女的生育率,研究学历对工资收入 的影响等。这些问题都可以通过单因素 方差分析得到答案。
2021/5/27
40
• 单因素方差分析的第一步是明确观测变 量和控制变量。例如,上述问题中的观
实验优化设计——方差分析实例
方差分析实验数据摘自论文1.实验数据淬火温度和回火温度对4Cr5MoSiV1抗拉强度的影响回火温度℃淬火温度℃580 600 6201020 1655 1694 1276 1648 1690 1269 1662 1698 12831050 1779 1786 1359 1776 1782 1360 1782 1788 13571070 1831 1803 1399 1835 1810 1406 1827 1800 13922.单因素方差分析淬火温度为1020℃时方差分析:单因素方差分析SUMMARY组观测数求和平均方差列1 3 4965 1655 49列2 3 5082 1694 16列3 3 3828 1276 49方差分析差异源SS df MS F P-value F crit 组间319886 2 159943 4209.026 3.61E-10 5.143253 组内228 6 38总计320114 8淬火温度为1050时方差分析:单因素方差分析SUMMARY组观测数求和平均方差列1 3 5337 1779 9列2 3 5356 1785.333 9.333333列3 3 4076 1358.667 2.333333方差分析差异源SS df MS F P-value F crit组间358764.7 2 179382.3 26039.37 1.53E-12 5.143253组内41.33333 6 6.888889总计358806 8淬火温度为1070摄氏度时方差分析:单因素方差分析SUMMARY组观测数求和平均方差列1 3 5493 1831 16列2 3 5413 1804.333 26.33333列3 3 4197 1399 49方差分析差异源SS df MS F P-value F crit组间351630.2 2 175815.1 5774.949 1.4E-10 5.143253组内182.6667 6 30.44444总计351812.9 82.无重复双因素分析方差分析:无重复双因素分析SUMMARY 观测数求和平均方差行1 3 4625 1541.667 53314.33行2 3 4924 1641.333 59796.33行3 3 5033 1677.667 58437.33列1 3 5265 1755 8176列2 3 5283 1761 3439列3 3 4034 1344.667 3936.333方差分析差异源SS df MS F P-value F crit 行29749.56 2 14874.78 43.97208 0.001893 6.944272 列341742.9 2 170871.4 505.1217 1.56E-05 6.944272误差1353.111 4 338.2778总计372845.6 83.有重复双因素分析方差分析:可重复双因素分析SUMMARY580600620总计1020观测数 3 3 3 9求和4965 5082 3828 13875平均1655 1694 1276 1541.667方差49 16 49 40014.251050观测数 3 3 3 9求和5337 5356 4076 14769平均1779 1785.333 1358.667 1641方差9 9.333333 2.333333 44850.751070观测数 3 3 3 9求和5493 5413 4197 15103平均1831 1804.333 1399 1678.111方差16 26.33333 49 43976.61总计观测数9 9 9求和15795 15851 12101平均1755 1761.222 1344.556方差6150.5 2622.444 2973.778方差分析差异源SS df MS F样本89584.3 2 44792.15 1783.758 P-value F crit 列1026343 2 513171.7 20436.04 2.03E-21 3.554557 交互3937.481 4 984.3704 39.20059 6.21E-31 3.554557 内部452 18 25.11111 1.18E-08 2.927744总计112031726。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4
(2) 水平与水平数 因素在实验中所取的具体数值或状态,称为该因素的水平。水平也叫位级。 若某因素记为A,则因素A的a个不同水平可分别记做:A1、A2、…、Aa。
三个偏差平方和的自由度之间有如下的关系: vT= vA + ve
这也称自由度的可分解性。
13
若记总偏差相对平方和为VT,因素A相对偏差平方和 为VA,误差相对平方和为Ve,则它们分别为:
VT=ST / vT VA=SA / vA Ve=Se / ve VA、Ve可分别认为是因素A与误差e关于实验结果的平 均效应,并分别称它们为因素A均方差和误差均方差。 均方差也简称均方或方差。
方差来源 因素A 因素e 总和
平方和S SA Se ST
自由度v vA ve N-1
均方V VA Ve
F值 临界值 显著性
FA
Fα (vA, ve)
4.3.5 实例分析 [例4-4] 某厂进行合成反应实验,欲考察某种触媒用量对合成物产出量的影 响。现选取三种触媒用量A1, A2, A3,各做4次实验,实验数据见表4-6。
10
(2) 偏差的构造
用偏差平方和来构造各偏差,
11
由各偏差平方和的构造可以看出,利用偏差平方和作 为数据变异性的一个度量,直观看来,这是合理的。但在 同样的波动程度下,测定数据越多,计算出的偏差平方和 就越大。因此,仅用偏差平方和来反映数据的各种变异显 然是不够的,还应当考虑测定值个数对偏差平方和的贡献, 这便是相对偏差平方和。
4.2 方差分析的基本原理 4.2.1 固定效应模型的分析 (1) 问题的描述 以固定效应模型的单因素等重复实验为例,来说明方差 分析的基本原理。
8
表4-3 单因素等重复实验的典型数据
实验结果用线性统计模型来描述:
yij=m+ti+eij (i=1,2,…,a;j=1,2,…,r)
m是所有水平的共同参数,叫总均值,ti是第i个水平的唯一的一个参数, 叫做第i个水平的水平效应,eij是随机误差。
16
(2) 统计量F的分布 FA=VA / Ve ~ F(vA, ve) 这表明,统计量FA服从以其分子的自由度为第一自由度, 分母的自由度为第二自由度的F分布。
(3) 检验统计量 对于给定的检验显著性水平a,F Fa (F分布的a分数 位)的概率等于a,即 P [F≥Fa]=a 当一次检验中出现F≥Fa这一小概率事件时,有理由拒 绝原假设H0,即否定不同条件下的总体,其均值完全相同 的假设,认为因素的效应显著,不同条件下的总体均值有 明显的不同。 反之,若F≤Fa,则接受原假设H0,即认为不同条件下 的各总体,均值并没有明显地变化,因素效应与误差效应 相比,不够显著。
单因素方差分析则是仅仅讨论一种实验条件对实验结果有无显著影响 的分析。
单因素方差分析对因素的水平数没有限制,可任意选择。 单因素方差分析对重复性有要求,即它要求有重复实验,至于重复次 数则可以任意选择。单因素实验重复数一般应在3次以上。
4.3.1 数据描述
20
4.3.2 平方和及自由度分解 (1) 记单因素实验的总偏差平方和为ST,因素A偏差平方和为SA,误 差e偏差平方和为Se, 则
[例4-2] 某反应产物的收率受催化剂品种与反应温度的影响,现选取三种 催化剂(记做A1、A2、A3),四种不同的温度(记做B1、B2、B3、B4), 在催化剂与温度的12种不同的组合条件下,随机地进行实验。若记催化剂 为Ai和温度为Bj时的合成收率为xij,得表4-2所示的数据。
温度
催化剂
B1
B2
➢ 在原假设H0:m1=m2=…=ma=m成立的前提下,比值F 的分子、分母都是总体方差σ2的无偏估计量,故统计量 F应当“很接近于1”。 ➢如果因素A的均方差VA比误差均方差Ve大得很多,即F 值比“1”大得多,则与原假设H0相矛盾,这时,我们有 理由拒绝原假设成,即认为因素A的不同条件(水平) 形成均值不完全相等的a个正态总体。
乙
31.5
36.6
34.2
34.8 34.30
丙
34.9
36.8
36.3
35.8 35.95
最终实验结果之间的差异可能源于催化剂的改变,也可能源于实验误差。
问题:① 实验结果的差异是催化剂的变化所引起的, 还是实验中的偶然误差引起的?如何鉴别?② 不同催 化剂对产品收率的影响是否显著?如何检验?
2
再看下面的一个例子。
• 影响因素可分为可控因素和不可控因素。 • 实验温度、原料浓度等往往属于可控因素,它是实验研究的主要因素。 而大气温度、压强、湿度、风向等往往是不可控因素。
• 在判别介入的实验因素时,下列三种情况一般可以不作考察: • ①对实验指标的影响规律已经明确,或已知对实验考核指标没有影响 的因素; • ②实验时技术条件不具备,或测试技术不完善,测不出数值的因素; • ③虽能测出因素的值,但不具备控制手段,不能把因素控制在指定水 平上的因素。
分组 第一组 (一般疗法) 第二组 (一般+A药) 第三组 (一般+B药)
1
2
3
平均值
0.8
0.9
0.7
0.8
1.3
1.2
1.1
1.2
0.9
1.1
1.0
1.0
第四组 (一般+A药+B药) 2.1
2.2
2.0
2.1
这种因素之间的相互作用即为交互效应。如果交互效应存在,说明两个因素不 是相互独立的。
把因素A和B的交互作用记为A×B。这里的符号“×”是交互 的记号,不要理解为乘号。两个因素的交互作用好象是在这 两个因素的单独作用之外,另有一个“假想因素”在起作用。
(4) 因素的主效应和因素间的交互效应 某因素单独对实验结果所产生的影响或作用,称该因 素的主效应。
因素间的交互作用是指除了因素“孤立地”影响实验 结果之外,还存在因素间不同水平互相搭配,联合在一 起共同对实验结果产生影响。这是在科学实验中常常遇 到的问题。
6
[例4-3] 有A、B两种药物治疗缺铁性贫血,患者12例,分为4组。实验方案是: 第一组用一般疗法;第二组在一般疗法基础上加用A药;第三组在一般疗法基 础上加用B药,第四组在一般疗法基础上A、B两药同时使用。一个月后观察红 细胞增加数。要求分析两种药物的疗效,数据见表4-3。
25
4.4 双因素实验方差分析
4.4.1 双因素无重复实验的方差分析
(1) 双因素无重复实验 在双因素实验中有两个变动因素,记这两个变动因素为 A和B。 设因素A有a个不同水平:A1,A2,…,Aa;因素B有b 个不同水平:B1,B2,…,Bb,则因素A与因素B之间共 有ab种不同的水平搭配(组合)方式。 双因素实验要比单因素实验复杂得多,因为两个因素可 能存在着交互作用。 但双因素无重复实验,即便存在交互作用的影响,也不 能够对其进行分析,因为每一种实验条件下,只有一个实 验结果,这使得交互作用和实验误差混杂在一起,无法分 解开来,故对双因素无重复实验来说,交互作用只好与实 验误差合在一起当作误差考虑。
Ai称为因素A的第i种水平或第i种位级。 因素选定的不同取值的个数,称为该因素的水平数。
(3) 重复或重复数 在相同条件下进行2次及2次以上的实验,称重复实验或有重复实验。 重复是研究实验随机误差的基本手段。应在条件允许的情况下,尽可能
地采取重复实验,使样本容量足够地大,以保证实验与分析的可靠性。
5
17
(4) 方差分析的程序
①提出原假设H0和备择假设H1。 ②计算各因素偏差平方和、误差偏差平方和,以及各 偏差平方和的自由度。 计算统计量F。 ③查临界值。 先选定显著性水平a,查F分布的临界值表Fa (v因, ve)。 ④判断。 当某个因素的统计量F大于等于该因素检验临界值时, 则认为该因素作用显著,拒绝相应的原假设。否则,认 为该因素不显著。 显著性程度可用“*”号表示。一般情况下:对显著水 平a=0.05,仍判为不显著时,可记为“-”;对a=0.05 判为显著时,可记为“*”;对a=0.01判为显著时,可 记为“**”,此时,也称高度显著。
14
4.2.2 方差分析原理与程序
➢方差分析是利用实验观测值总偏差的可分解性,将不 同条件所引起的偏差与实验误差分解开来,按照一定的 规则进行比较,以确定条件偏差的影响程度及其相对大 小。 ➢应用方差分析可检验确定哪种因素对实验结果的影响 最为显著,以及估计影响程度
15
(1) 统计量的构造 F=VA / Ve 把它作为检验因素A是否作用显著的统计量。
ST=R-CT=71156-70840.33=315.67 SA=QA-CT=71083.5-70840.33=243.17 Se=R-QA=71156-71083.5=72.5 vT=N-1=11, vA=a-1=2, ve=N-a=9 VA=SA/ vA=243.17/2=121.58 Ve=Se/ ve=72.5/9=8.06 FA=VA/Ve=121.58/8.06=15.08
18
注意到,F分布的分位数Fa (v因, ve) 总是大于或等于1 的,因此当某个因素的均方差小于误差均方差时,就可 以直接判定它为不显著的因素。
⑤列方差分析表。 各因素给总偏差平方和所做的贡献能—目了然,检验过 程及关键数据也简明清晰,这便于发现、检查计算过程中 的错误。
19
4.3 单因素方差分析
4 方差分析
4.1 引言 4.1.1 问题的提出
如何比较不同实验条件下的实验结果?
先看一个简单的例子。 [例4-1] 为了考察三种催化剂对某一化工产品收率的影响,在其它条件不 变的情况下,每种催化剂重复实验4次,所得收率的数据见表4-1所示。