正交试验方差分析
实验设计的方差分析与正交试验
实验设计的方差分析与正交试验一、实验设计中的方差分析方差分析(analysis of variance,ANOVA)是一种统计方法,用于比较不同组之间的均值差异是否具有统计学上的显著性。
在实验设计中,方差分析主要被用来分析因变量(dependent variable)在不同水平的自变量(independent variable)中的变化情况。
通过比较不同组之间的方差,判断是否存在显著差异,并进一步分析差异的原因。
1. 单因素方差分析单因素方差分析是最简单的方差分析方法,适用于只有一个自变量的实验设计。
该方法通过比较不同组之间的方差来判断各组均值是否有差异。
步骤如下:(1)确定研究目的,选择合适的因变量和自变量。
(2)设计实验,确定各组的样本个数。
(3)进行实验,并收集数据。
(4)计算各组的平均值和总平均值。
(5)计算组内方差和组间方差。
(6)计算F值,通过计算F值来判断各组均值是否有显著差异。
2. 多因素方差分析多因素方差分析是在单因素方差分析的基础上,增加了一个或多个自变量的情况下进行的。
这种方法可以用来分析多个因素对因变量的影响,并判断各因素的主效应和交互效应。
步骤如下:(1)确定研究目的,选择合适的因变量和多个自变量。
(2)设计实验,确定各组的样本个数。
(3)进行实验,并收集数据。
(4)计算各组的平均值和总平均值。
(5)计算组内方差、组间方差和交互方差。
(6)计算F值,通过计算F值来判断各组均值是否有显著差异。
二、正交试验设计正交试验设计是一种设计高效实验的方法,可以同时考虑多个因素和各个因素之间的交互作用,并通过较少的试验次数得到较准确的结果。
1. 正交表的基本原理正交表的设计是基于正交原理,即每个因素和其他所有因素的交互效应都是独立的。
通过正交表设计实验,可以确保各因素和交互作用在样本中能够均匀地出现,从而减少误差来源,提高实验结果的可靠性。
2. 正交试验设计的步骤(1)确定要研究的因素和水平。
第4讲5(1) 正交试验设计(方差分析)
处理号 1 2
第1列(A) 1 1
表 L9(34)正交表
第2列 1 2
第3列 1 2
第4列 1 2
因素A第1 试验结果y水i 平3次
重复测定 y1 值 y2
3
1
3
3
3
y3
单4 因素 2
1
2
3
y4
试5 验数 2
2
3
1
y5
因素A第2
SS据A6=资13(料y1 y22
格式 78=13(K12
3 K322
y3)2 (y43y5
K32)-
T2 9
1 2
y6)2 ( 1 y7 3 1
y 82y 9)2 2 3
(y1yy62 ...
9
y7 y8
y水9)平2(修 3次正重项) 复测定值
9
3
3
2
1
y9
分析第1列因素时,其它列暂不考虑,将其看做条件因因素素A。第3
因素 重复1 重复2 重复3
显著影响
(6)列方差分析表
(1)偏差平方和分解:
总偏差平方和=各列因素偏差平方和+误差偏差平方和
SST SS因素 SS空列(误差)
(2)自由度分解:
dfT df因素 df空列( 误列(
(3)方差:MS因素=
SS因素 df因素
,MS误差=
SS误差 df误差
(4)构造F统计量:
F因素=
MS因素 MS误差
(5)列方差分析表,作F检验
若计算出的F值F0>Fa,则拒绝原假设,认为 该因素或交互作用对试验结果有显著影响;若 F0≼Fa,则认为该因素或交互作用对试验结果 无显著影响。
正交试验方差分析
1(50) 1(6.5) 1(2.0) 1 1 2 2 2(7.0) 2(2.4) 3(7.5) 3(2.8 2 3 1 3 2 3
2(55) 1
3(58) 1
8பைடு நூலகம்
9 K1j
3
3 15.76
2
3 25.18
1
2 22.65
3
1 20.74
10.9
8.95
T 65.58
K2j
K3j K1j2 K2j2 K3j2
n
对上式做如下变换
SST ( X ij X ) 2 ( X ij X i. X i. X ) 2
i 1 j 1 i 1 j 1
r
n
r
n
( X ij X i. ) ( X i. X ) 2 (X ij X i. )( X i. X )
各式的物理意义
X
所有数据的平均值称为总平均 值 第i个水平的数据平均值称为组平均值 随机误差,又称为组内离差平方和
X i.
SSE 表示每一个数据与其组平均值的离差平方和,反映了实验中的
SS A
表示组平均值与总的平均值得离差平方和,反映了由于因素不同水平引 起的差异又称为组间离差平方和
再稍做整理
X 总和 2 2 SST ( X ij X ) ( X ij ) N i 1 j 1 i 1 j 1 X 总和 校正项CF N
2 2 i 1 j 1 r n i 1 j 1 r n i 1 j 1
r
n
r
n
r
n
( X ij X i. ) ( X i. X ) 2
2 i 1 j 1 i 1 j 1
高级篇 第二章 正交试验设计及统计分析-方差分析
0.415
(2)显著性检验
根据以上计算,进行显著性检验,列出方差分析表,结果见表10-24
变异来源
A B C△ 误差e 误差e△ 总和
平方和 45.40 6.49 0.31 0.83 1.14 53.03
自由度 2 2 2 2 4
表10-24 方差分析表
均方 F值
Fa
22.70 79.6 F0.05(2,4) =6.94
油温℃A 1 1 2 2 3 3 4 4
1.8 4.5 9.8 6.8 3.24 20.25 96.04 46.24
表10-27 试验方案及结果分析
含水量%B 油炸时间s C
1
1
空列 1
2Hale Waihona Puke 2211
2
2
2
1
1
2
1
2
1
2
1
2
2
2 11.4
1 10.2
1 12.1
11.5
12.7
10.8
空列 1 2 2 1 2 1 1 2
3.24 11.4 F0.01(2,4)=18.0
0.16
0.41
0.285
显著水平 ** *
因素A高度显著,因素B显著,因素C不显著。 因素主次顺序A-B-C。
(3)优化工艺条件的确定
本试验指标越大越好。对因素A、B分析,确定优 水平为A3、B1;因素C的水平改变对试验结果几乎无影
响,从经济角度考虑,选C1。优水平组合为A3B1C1。 即温度为58℃,pH值为6.5,加酶量为2.0%。
K2k2 SST=QT CT
…
Kmk2 SSk
Q
=
j
1 r
正交试验方差分析(通俗易懂)
第十一章正交设计试验资料的方差分析在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。
正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。
第一节、正交设计原理和方法(一) 正交设计的基本概念正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。
它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。
例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响:A因素是氮肥施用量,设A1、A2、A3 3个水平;B因素是磷肥施用量,设B1、B2、B3 3个水平;C因素是钾肥施用量,设C1、C2、C3 3个水平。
这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。
如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。
但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。
如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。
正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。
正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。
如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。
一、正交设计的基本原理表11-1 33试验的全面试验方案正交设计就是从全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。
图1中标有‘9 ’个试验点,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。
即:(1)A1B1C1(2)A1B2C2(3)A1B3C3(4)A2B1C2(5)A2B2C3 (6)A2B3C1(7)A3B1C3(8)A3B2C1(9)A3B3C2上述选择,保证了A因素的每个水平与B因素、C 因素的各个水平在试验中各搭配一次。
第6章-正交试验设计结果的方差分析
(4)计算F值
• 各均方除以误差的均方,例如:
FABiblioteka VA Ve或FA
VA V e
FAB
VAB Ve
或
FAB
VAB Ve
(5)显著性检验
• 例如: • 若 FAF(fA,f,e)则因素A对试验结果有显著影
响 • 若 F A BF (fA B,fe,)则交互作用A×B对试验结
果有显著影响
(6)列方差分析表
设:
QT
n
x
2 i
i1
n
T xi i1
②各因素引起的离差平方和
• 第j列所引起的离差平方和 :
Sj
1( m r p1
Kp2j
)T2 n
k
ST S j Se j 1
③交互作用的离差平方和
• 若交互作用只占有一列,则其离差平方和就等于 所在列的离差平方和
• 若交互作用占有多列,则其离差平方和等于所占 多列离差平方和之和,
• 例:3时
S S S AB ( AB ) 1 ( AB ) 2
④试验误差的离差平方和
• 方差分析时,在进行表头设计时一般要求留有空 列,即误差列
• 误差的离差平方和为所有空列所对应离差平方和 之和 :
Se S空列
(2)计算自由度
①总自由度 :=n-1 ②任一列离差平方和对应的自由度 :
=m-1 ③交互作用的自由度 :(以A×B为例) ×B= × ×B=(m-1 ) 若m = 2, ×B= 若m = 3, ×B= 2 + ④误差的自由度:
• 方差分析的基本步骤如下: • (1)计算离差平方和 • (2)计算自由度 • (3)计算平均离差平方和(均方) • (4)计算F 值 • (5)显著性检验
第三章 正交试验设计(2)-正交试验数据方差分析和贡献率分析
σ = ˆ
t 0 .975
132 / 4 = 5.74 , 。 ( 4 ) = 2 . 7764
μ 3⋅2
的0.95的置信区间是:
68 ± 2.7764 × 5.74 / 1.8 = 68 ± 11.9 = (56.1,79.9)
贡献率分析
当试验指标不服从正态分布时, 进行方差分析的依据就不充分,此 时可以通过比较个因素的“贡献率” 衡量因素作用的大小。
μ 3.2 的 1 − α 置信区间为: μ 3.2± t1−α / 2 ( f e′)σ / ne ˆ ˆ
′ ˆ 这里 σ = S e / f e′ , ′ S e = S e + 不显著因子的平方和, f e′ = f e + 不显著因子的自由度,
ne = 试验次数 1 + 显著因子自由度之和
n e = 9 /( 1 + f A + f C ) = 9 / 5 = 1 . 8 , ′ S e = S e + S B=132 , f ′ = f + f =4 ,
ˆ ˆ μ = y = 50 , a3 = T13 − y = 61 − 50 = 11 ,
ˆ c 2 = T32 − y = 57 − 50 = 7 ,
•A3C2 水平组合下指标均值的无偏估计可以取为: ˆ ˆ ˆ ˆ μ 3⋅2 = μ + a3 + c 2 = 50+11+7=68。
区间估计
… Continue
因子水平表 因子 A:反应温度(℃) B:反应时间(分) C:加碱量(%) 水平 一 80 90 5 二 85 120 6 三 90 150 7
试验计划与试验结果
试验号 1 2 3 4 5 6 7 8 9 因子 反应温度 ℃ (1)80 (1)80 (1)80 (2)85 (2)85 (2)85 (3)90 (3)90 (3)90 反应时间 分 (1) 90 (2)120 (3)150 (1) 90 (2)120 (3)150 (1) 90 (2)120 (3)150 加碱量 试验结果 y % 转化率(%) (1)5 31 (2)6 54 (3)7 38 (2)6 53 (3)7 49 (1)5 42 (3)7 57 (1)5 62 (2)6 64
正交试验的方差分析
x 1 4
20 K 1
5 l 1
xkl
1 4
4 K 1
xk
4.2
• 依次求出Q、f、S2、F,与F表比较 2 Q1=10 (xi1 x )2 i 1 =10×[(3.65-4.2)2+(4.75-4.2)2]=6.05
• 其余Qj (j=2,3)同理可求
45
Qr
(xkl xk )2
产率
产率
﹪
-55
xK
50
-5
59
4ቤተ መጻሕፍቲ ባይዱ
56
1
58
3*
55
0
58
3
47
-8
52
-3
x = -5/8
(1)方差分析 • 依次求出Q、f、S2、F,与F表比较
第1列差方和:
2
Q1=4 (xi1 x )2 i 1 = 4{[3/4-(-5/8)]2+[(-2)-(-5/8)]2} = 121/8
• 其余Qj(j=2…7)同理可求
9-3-2 关于Qr的计算 一 表头留出空白列
其它的列若与空白列的Q值相近,加起来共同作 为Qr的估计值,可以提高方差分析检验的灵敏度(自 由度增大了)
二 无空白列
1 根据以往资料
若已知 2 ,可认为fr=∞,此时
F
Q因子 / f因子
2
,查表 Fα (f因子,∞)
2 选更大的正交表,从而留出空白列
1
2
2
1
1
2
2
1
2
2
1
2
1
1
2
3
2
-12
-12
-4
-5
正交试验设计2正交试验数据方差分析和贡献率分析
正交试验设计2正交试验数据方差分析和贡献率分析正交试验设计是一种实验设计方法,通过选择适当的试验水平组合和设置统计模型,以减少试验阶段的试验次数和工作量,提高试验的效率和准确性。
正交设计通过对变量进行排列组合,使各变量的效应独立出现并减少副效应的影响,从而使实验结果更加可靠。
正交设计数据分析方法方差分析(ANOVA)是一种统计方法,用于测试在不同因素水平下的平均值是否相等。
在正交试验中,方差分析可以用于测试各个因子对试验结果的影响是否显著。
方差分析通常包括总体均值检验、各因子的效应检验以及误差项的检验。
通过方差分析可以确定哪些因子对试验结果的影响是显著的,进而确定最佳的试验条件。
贡献率分析是一种用于确定各个因子对试验结果的贡献程度的方法。
贡献率分析可以通过计算各个因子的均方根(RMS)值来确定各个因子的贡献程度。
贡献率可以用来排除一些不显著的因子,从而进一步优化试验条件。
1.节省试验次数和工作量:由于正交设计能够减少变量之间的相关性,可以通过较少的试验次数得到可靠的结果。
2.减少误差项:正交设计通过考虑副效应的影响,减少了试验误差的可能性,提高了数据的可靠性。
3.确定关键因素:正交设计通过方差分析和贡献率分析,可以确定对试验结果有着显著影响的关键因素,从而进行进一步优化。
4.灵活性:正交设计可以根据实验需求进行灵活的调整和改变,以适应多样的试验条件和目标。
总结正交试验设计是一种有效的实验设计方法,可用于减少试验次数和工作量,提高试验效率和准确性。
方差分析和贡献率分析是对正交设计数据进行进一步分析和总结的重要工具,可以帮助确定关键因素和优化试验条件。
正交试验设计能够在实验设计的早期阶段对各个因子进行全面考虑,从而为实验结果的有效性和可靠性打下基础。
正交试验方差分析(通俗易懂)
正交试验⽅差分析(通俗易懂)第⼗⼀章正交设计试验资料的⽅差分析在实际⼯作中,常常需要同时考察 3个或3个以上的试验因素,若进⾏全⾯试验,则试验的规模将很⼤,往往因试验条件的限制⽽难于实施。
正交设计是安排多因素试验、寻求最优⽔平组合的⼀种⾼效率试验设计⽅法。
第⼀节、正交设计原理和⽅法(⼀) 正交设计的基本概念正交设计是利⽤正交表来安排多因素试验、分析试验结果的⼀种设计⽅法。
它从多因素试验的全部⽔平组合中挑选部分有代表性的⽔平组合进⾏试验,通过对这部分试验结果的分析了解全⾯试验的情况,找出最优⽔平组合。
例如,研究氮、磷、钾肥施⽤量对某⼩麦品种产量的影响:A因素是氮肥施⽤量,设A1、A2、A3 3个⽔平;B因素是磷肥施⽤量,设B1、B2、B3 3个⽔平;C因素是钾肥施⽤量,设C1、C2、C3 3个⽔平。
这是⼀个3因素每个因素3⽔平的试验,各因素的⽔平之间全部可能的组合有27种。
如果进⾏全⾯试验,可以分析各因素的效应,交互作⽤,也可选出最优⽔平组合。
但全⾯试验包含的⽔平组合数较多,⼯作量⼤,由于受试验场地、经费等限制⽽难于实施。
如果试验的主要⽬的是寻求最优⽔平组合,则可利⽤正交设计来安排试验。
正交设计的基本特点是:⽤部分试验来代替全⾯试验,通过对部分试验结果的分析,了解全⾯试验的情况。
正交试验是⽤部分试验来代替全⾯试验,它不可能像全⾯试验那样对各因素效应、交互作⽤⼀⼀分析;当交互作⽤存在时,有可能出现交互作⽤的混杂。
如对于上述3因素每个因素3⽔平试验,若不考虑交互作⽤,可利⽤正交表L9(34)安排,试验⽅案仅包含9个⽔平组合,就能反映试验⽅案包含27个⽔平组合的全⾯试验的情况,找出最佳的⽣产条件。
⼀、正交设计的基本原理表11-1 33试验的全⾯试验⽅案正交设计就是从全⾯试验点(⽔平组合)中挑选出有代表性的部分试验点(⽔平组合)来进⾏试验。
图1中标有‘9 ’个试验点,就是利⽤正交表L9(34)从27个试验点中挑选出来的9个试验点。
正交试验设计中的方差分析
目的
通过方差分析,可以确定不同组之间 的平均值差异是否由随机误差引起, 还是由处理因素或自变量引起。
方差分析的数学模型
数学模型
方差分析使用数学模型来描述数据之间的关系,特别是不同组之间的平均值差异。模型通常包括组间差异和组内 差异两部分。
医学研究
通过正交试验设计中的方差分析,研究不同治疗方案、药物剂量等因素对疾病治疗效果的影响,为临床 治疗提供科学依据。
方差分析的局限性
04
方差分析对数据的要求
独立性
数据必须是相互独立的,不存 在相互关联或依赖关系。
正态性
数据应符合正态分布,才能保 证统计推断的准确性。
同方差性
各组数据的方差应相等,否则 可能导致误判。
制定试验方案
根据正交表设计试验方案,确定每个因素的每个 水平。
实施试验
按照试验方案进行试验,记录每个试验的结果。
方差分析
利用方差分析法对试验结果进行分析,确定各因 素对试验结果的影响程度和显著性。
优化方案
根据方差分析结果,优化试验方案,进行下一步试验。
方差分析的基本原理
02
方差分析的定义与目的
定义
拉丁方设计方差分
析
适用于需要控制试验条件的试验, 通过拉丁方设计平衡试验条件和 试验误差。
正交试验设计中的方差分析步骤
确定试验因素和水平
根据研究目的和实际情况确定试验因 素和水平。
制定正交表
根据试验因素和水平选择合适的正交 表。
安排试验
按照正交表进行试验,记录试验数据。
方差分析
对试验数据进行方差分析,包括自由 度、离均平方和、均方、F值等计算。
正交试验方差分析(通俗易懂)
第十一章正交设计试验资料的方差分析在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。
正交设计是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。
第一节、正交设计原理和方法(一)正交设计的基本概念正交设计是利用正交表来安排多因素试验、分析试验结果的一种设计方法。
它从多因素试验的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。
例如,研究氮、磷、钾肥施用量对某小麦品种产量的影响:A因素是氮肥施用量,设A1、A2、A33个水平;B因素是磷肥施用量,设B1、B2、B33个水平;C因素是钾肥施用量,设C1、C2、C33个水平。
这是一个3因素每个因素3水平的试验,各因素的水平之间全部可能的组合有27种。
如果进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。
但全面试验包含的水平组合数较多,工作量大,由于受试验场地、经费等限制而难于实施。
如果试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。
正交设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。
正交试验是用部分试验来代替全面试验,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。
4)安排,试如对于上述3因素每个因素3水平试验,若不考虑交互作用,可利用正交表L9(3 验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。
一、正交设计的基本原理表11-133试验的全面试验方案正交设计就是从全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)4)从27个试验点中挑选出来的来进行试验。
图1中标有‘9’个试验点,就是利用正交表L9(3 9个试验点。
即:(1)A1B1C1(2)A1B2C2(3)A1B3C3(4)A2B1C2(5)A2B2C3(6)A2B3C1(7)A3B1C3(8)A3B2C1(9)A3B3C2上述选择,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配一次。
第五章 方差分析和正交试验
r
i 表示组内理论均值, eij 表示随机误差, eij ~ N (0, 2 ), i 称为效应值. ni i 0.
单因素方差分析的数学模型为 : Yij i eij (i 1, 2, , r; j 1, 2, , ni ) 2 e ~ N ( 0 , ), eij 互相独立; ij n n 0. i i i 1
•步骤2:表头设计.见下表:一般至少安排有一个空列.
17
结束
•步骤3:制订试验方案, 见下表:
18
结束
•步骤4:作试验得到得率 yi .填入表中.作试验时采用随机顺序. •步骤5:计算统计量,填入表5.4.5中.
水平数r 3, 每水平在 1列中出现次数 m 3, 试验数n rm 9, 试验结果为Y1 , Y2 , , Yn , K jl为j列中水平为l (l 1,2, , r )的试验结果之和 . 这里K11 y1 y2 y3 , K 23 y3 y6 y9 . 记K K jl , 显然, K Yi , 与j无关.
l 1 i 1 n 1 2 1 r 2 2 2 P K , Q j K jl , S j Q j P, Q Yi 2 , ST Q P. n m l 1 i 1 r n
S Yi Y
2 T j 1
r
2
1 2 2 2 2 S , Y K , 这里, ST S12 S 2 S3 S4 . n j 1
EYi i , EY ,
2 总离差平方和 ST Yij Y , r ni 2 i 1 r j 1
组间差平方和 S 组内差平方和 S
正交试验设计中的方差分析
那么正交试验的方差分析可以从以下几步进行:
1.计算差方和(离差平方和): 包括以下几部分:
1)各因素差方和:
正交试验都是多因素多水平的试验,因此有必要对各因素的 差方和进行计算。 各因素差方和等于它的各水平均值k1A,k2A,…,kmA之间偏差平 方和。 以因素A为例,它在正交表中的某列,用xij表示A在第i个水 平的第j次试验结果,则;
即:fA×B=fA×fB 试验误差的自由度fe=fT-f因 。
3.计算平均差方和(均方): 在计算各因素的差方和时,按照前面的讲述,它是各水平的 偏差方的和,其大小与水平数有关,故此还不能确切的反映 各因素的情况。为了消除水平数的影响,可以计算其平均差 方和:
因素的平均差方和=因素差方和 =Q因 因素的自由度 f因
试验误差的差方和是所有试验结果在不同水平下的指标值与该 水平下的均值之间的差的平方和。它是由随机误差引起的,故 叫误差的差方和。
Qe QT ( QA QB QN )
2.计算自由度:
试验的总自由度: fT n 1
各因素自由度: f因 m 1
如果有交互作用,则交互作用的自由度为两因素自由度之积:
一.几个数据处理中常用的数理统计名词:
首先对几个数理统计名词进行回顾
1. 平均值 x
就是所有数据的和除以数据的个数。
x
1 n
n i 1
xi
1 n
x1
x2
xn
总体平均值:
1 n
n
xi
i 1
n
总体:数理统计学中指的是研究对象的某一特性值的全体; 样本:从总体中随机抽出的一组测量值。
2.极差 R: 就是一组数据中的最大值减去最小值得到的差值。 3.差方和Q: 测量值对平均值的偏差的平方和,就叫~。也叫离差平方和。
QC工具方法培训-正交试验、方差分析
0.381 0.487
125
0.174
11
0.553 0.684
26
0.374 0.478
150
0.159
12
0.532 0.661
27
0.367 0.470
200
0.138
13
0.512 0.641
28
0.361 0.463
300
0.113
14
0.497 0.623
29
0.355 0.456
400
652 4.922819 0.035945 4.256495
9
132.4444
总计
2496
11
设α=0.05,则 F1-0.05(2,9)=4.26 拒绝原假设
13
第一节 方差分析
水平
数据
课堂练习: A1 6
5
7
A2 2
1
3
方差分析:单因素方差分析
SUMMARY
组
观测数 求和
A1
3
18
A2
3
6
方差分析
0.095
15
0.482 0.606
30
0.349 0.449 1000 0.062
1%
0.418 0.393 0.372 0.354 0.325 0.302 0.283 0.267 0.254 0.228 0.208 0.181 0.143 0.123 0.081
21
第二节 回归分析
(三) 一元线性回归方程——定量分析
i1 j 1
16
第一节 方差分析
水平
A1:原结构 A2:改进方案1 A3:改进方案2
正交试验的方差分析
计算平均离差平方和(均方):
在计算各因素离差平方和时,我们知道,它们都是若干项平方的和, 它们的大小与项数有关,因此不能确切反映各因素的情况。为了消 除项数的影响,我们计算它们的平均离差的平方和。
因素的平均离差平方和 = (因素离差的平方和)/因素的自由度 = S因 /f因
试验误差的平均离差平方和 = (试验误差的离差的平方和)/试验误差的自由度 = SE / fE
33.212 ) 377.17, 35.882 ) 376.29,
QC
1 (6.272 9
35.212
59.162 )
531.00,
Q( AXB)1
1 (35.632 9
32.082
32.932 )
375.89,
Q( AXB)2
1 (34.302 9
31.732
34.612 ) 375.68,
考 虑A,B的交互作用。试进行方差分析。
第22页/共47页
第三节: 2水平正交设计的方差分析
解:(选用正交表L8(27)
第23页/共47页
第三节: 2水平正交设计的方差分析
这 里
ST
QT
P
8
xk2
k 1
T2 8
65668 1 (724)2 8
146
SA
1 8
(K1
K2 )2
1 8
(366 358)2
第四节:混合型正交设计的方差分析
混合型正交设计的方差分析,本质上与一般水平数相等正交设计 的
方差分析相同,只要在计算时注意到各水平数的差别就行了。
8
现以L8(4X24)混合S型T 正交QT表为P例:k 1
xk2
1 8
23正交试验的方差分析
4.2.3 正交试验的方差分析简单地说,方差分析是把试验观测数据分解为各个影响因素的波动和误差波动,然后将它们的平均波动进行比较。
其中心点是把试验观测数据总的波动分解为反映因素水平变化引起的波动和反映试验误差引起的波动两部分。
前者是由于因素本身的离散性而存在的方差,简称为产品方差,它是产品所固有的;后者是由于试验误差(也称残差)二引起的方差,简称为试验方差,它是由试验中的随机因素所引起的。
方差分析亦即把观测数据的总的偏差平方和(S T)分解为反映必然性的各个因素的偏差平方和(S A、S B、…S N)与反映偶然性的误差偏差平方和(S e),并计算比较它们的平均偏差平方和,以找出对试验观测数据起决定性影响的因素(即显著性或高度显著性因素)作为进行定量分析判断的依据。
前面讲过的直观分析法虽然简单明了,计算工作量少,便于普及推广,但它不能把试验过程中试验条件改变所引起的数据波动与试验误差引起的数据波动区分开,同时对影响试验结果的各因素的重要程度,不能给以精确的数量估计。
而方差分析能够为分析提供一个标准,判断各因素的作用是否显著,从而弥补了直观分析法的不足。
为了考察某个因素对指标的作用,必须将总误差分解为条件误差和试验误差,并比较之,作出因素对指标的作用是否显著的结论。
这种分析方法称为方差分析法。
由于试验过程中误差的影响,不能直接测得试验结果的真值,但可以用同一条件下试验结果的平均值来代替真值,这样可近似反映出误差的大小。
同时,对误差来说,它们的正负是没有意义的。
主要的是知道它们的绝对值在什么范围内波动,所以,取它们的差值的平方和就可得到。
F值的大小,可以用来判断因素水平对考察指标影响的显著性。
F值接近1,说明因素水平改变对考察指标的影响在误差范围内,即水平间无显著差异;F值越大,说明因素水平的改变对指标的影响,超过了试验误差造成的影响,即条件误差相对试验误差大得多。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三节正交试验设计及其方差分析
在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验),多因素试验由于要考虑的因素较多,当每个因素的水平数较大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表——正交表,来安排试验,通过少量的试验,获得满意的试验结果.
1.正交试验设计的基本方法
正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表.
正交表是预先编制好的一种表格.比如表9-17即为正交表L4(23),其中字母L表示正交,它的3个数字有3种不同的含义:
(1) L4(23)表的结构:有4行、3列,表中出现2个反映水平的数码1,2.
列数
↓
L4 (23)
↑↑
行数水平数
(2)L4(23)表的用法:做4次试验,最多可安排2水平的因素3个.
最多能安排的因素数
↓
L4(23)
↑↑
试验次数水平数
(3) L4(23)表的效率:3个2水平的因素.它的全面试验数为23=8次,使用正交表只需从8次试验中选出4次来做试验,效率是高的.
L4(23)
↑↑
实际试验数理论上的试验数
正交表的特点:
(1)表中任一列,不同数字出现的次数相同.如正交表L4(23)中,数字1,2在每列中均出现2次.
(2)表中任两列,其横向形成的有序数对出现的次数相同.如表L4(23)中任意两列,
数字1,2间的搭配是均衡的.
凡满足上述两性质的表都称为正交表(Orthogonal table).
常用的正交表有L9(34),L8(27),L16(45)等,见附表.用正交表来安排试验的方法,就叫正交试验设计.一般正交表L p(n m)中,p=m(n-1)+1.下面通过实例来说明如何用正交表来安排试验.
例9.7 提高某化工产品转化率的试验.
某种化工产品的转化率可能与反应温度A,反应时间B,某两种原料之配比C和真空度D有关.为了寻找最优的生产条件,因此考虑对A,B,C,D这4个因素进行试验.根据以往的经验,确定各个因素的3个不同水平,如表9-18所示.
分析各因素对产品的转化率是否产生显著影响,并指出最好生产条件.
解本题是4因素3水平,选用正交表L9(34).
把表头上各因素相应的水平任意给一个水平号.本例的水平编号就采用表9-18的形式;将各因素的诸水平所表示的实际状态或条件代入正交表中,得到9个试验方案,如表9-20所示.
从表9-20看出,第一行是1号试验,其试验条件是:
反应温度为60℃,反应时间为2.5小时,原料配比为1.1∶1,真空度为500毫米汞柱,记作A1B1C1D1.依此类推,第9号试验条件是A3B3C2D1.
由此可见,因素和水平可以任意排,但一经排定,试验条件也就完全确定.按正交试验表9-20安排试验,试验的结果依次记于试验方案右侧,见表9-21.
2.试验结果的直观分析
正交试验设计的直观分析就是要通过计算,将各因素、水平对试验结果指标的影响大小,通过极差分析,综合比较,以确定最优化试验方案的方法.有时也称为极差分析法.
例9.7中试验结果转化率列在表9-21中,在9次试验中,以第9次试验的指标86为最高,其生产条件是A3B3C2D1.由于全面搭配试验有81种,现只做了9次.9次试验中最好的结果是否一定是全面搭配试验中最好的结果呢?还需进一步分析.
(1)极差计算
在代表因素A的表9-21的第1列中,将与水平“1”相对应的第1,2,3号3个试验结果相加,记作T11,求得T11=151.同样,将第1列中与水平“2”对应的第4,5,6号试验结果相加,记作T21,求得T21=183.
一般地,定义T ij为表9-21的第j列中,与水平i对应的各次试验结果之和(i=1,2,3; j=1,2,3,4).记T为9次试验结果的总和,R j为第j列的3个T ij中最大值与最小值之差,称为极差.
显然T=
3
1ij
i
T =
∑,j=1,2,3,4.
此处T11大致反映了A1对试验结果的影响,
T21大致反映了A2对试验结果的影响,
T31大致反映了A3对试验结果的影响,
T12,T22和T32分别反映了B1,B2,B3对试验结果的影响,
T13,T23和T33分别反映了C1,C2,C3对试验结果的影响,
T14,T24和T34分别反映了D1,D2,D3对试验结果的影响.
R j反映了第j列因素的水平改变对试验结果的影响大小,R j越大反映第j列因素影响越
大.上述结果列表9-22.
(2) 极差分析(Analysis of range)
由极差大小顺序排出因素的主次顺序:
主→次
B;A、D;C
这里,R j值相近的两因素间用“、”号隔开,而R j值相差较大的两因素间用“;”号隔开.由此看出,特别要求在生产过程中控制好因素B,即反应时间.其次是要考虑因素A和D,即要控制好反应温度和真空度.至于原料配比就不那么重要了.
选择较好的因素水平搭配与所要求的指标有关.若要求指标越大越好,则应选取指标大的水平.反之,若希望指标越小越好,应选取指标小的水平.例9.7中,希望转化率越高越好,所以应在第1列选最大的T31=185;即取水平A3,同理可选B3C1D3.故例9.7中较好的因素水平搭配是A3B3C1D3.
例9.8某试验被考察的因素有5个:A,B,C,D,E.每个因素有两个水平.选用正交表L8(27),现分别把A,B,C,D,E安排在表L8(27)的第1,2,4,5,7列上,空出第3,6列仿例9.7做法,按方案试验.记下试验结果,进行极差计算,得表9-23.
表9-23
j 的大小顺序排出因素的主次顺序为
主→次
A、B;D;C、E
最优工艺条件为A2B1C1D2E1.
表9-23中因没有安排因素而空出了第3,6列.从理论上说,这两列的极差R j应为0,但因存有随机误差,这两个空列的极差值实际上是相当小的.
3.方差分析
正交试验设计的极差分析简便易行,计算量小,也较直观,但极差分析精度较差,判断
因素的作用时缺乏一个定量的标准.这些问题要用方差分析解决.
设有一试验,使用正交表L p (n m ),试验的p 个结果为y 1,y 2,…,y p ,记
T =1
p
i i y =∑, y =11p i i T
y p p ==∑,
S T =
2
1
()
p
i
i y y =-∑
为试验的p 个结果的总变差;
S j =2
2
2111n
n ij ij i i T T T r T r
p r p ==⎛⎫-=- ⎪⎝⎭∑∑ 为第j 列上安排因素的变差平方和,其中r =p/n .可证明
S T =
1
m
i
j S
=∑
即总变差为各列变差平方和之和,且总变差S T 的自由度为p -1,第j 列变差S j 的自由度为
n -1.当正交表的所有列没被排满因素时,即有空列时,所有空列的S j 之和就是误差的变差平方和S e ,这时S e 的自由度f e 也为这些空列自由度之和.当正交表的所有列都排有因素时,即无空列时,取S j 中的最小值作为误差的变差平方和S e .
从以上分析知,在使用正交表L p (n m )的正交试验方差分析中,对正交表所安排的因素选用的统计量为:
F =
1j
e
e
S S n f -.
当因素作用不显著时,
F ~F (n -1,f e ),
其中第j 列安排的是被检因素.
在实际应用时,先求出各列的S j /(n -1)及S e /f e ,若某个S j /(n -1)比S e /f e 还小时,则这第j 列就可当作误差列并入S e 中去,这样使误差S e 的自由度增大,在作F 检验时会更灵敏,将
所有可当作误差列的S j 全并入S e 后得新的误差变差平方和,记为S e Δ,其相应的自由度为f e Δ
,这时选用统计量
F =
1
j e e
S S n f - ~F (n -1,f e Δ
). 例9.9 对例9.8的表9-23作方差分析.
表9-23
解 由表9-23的最后一行的极差值R j ,利用公式S j =2
211
n ij i T T r p
=-∑,得表9-24.
表9-24
表9-24中第3,6列为空列,因此S e =S 3+S 6=1.250,其中f e =1+1=2,所以S e /f e =0.625,而第7列的S 7=0.125,S 7/f 7=0.125/1=0.125比S e /f e 小,故将它并入误差. S e Δ=S e +S 7=1.375,f e Δ
=3.整理成方差分析表9-25.
表9-25
由于F 0.05(1,3)=10.13, F 0.01(1,3)=34.12,故因素A ,B 作用高度显著,因素C 作用不显著,因素D 作用显著,这与前面极差分析的结果是一致的.F 检验法要求选取S e ,且希望f e 要大,故在安排试验时,适当留出些空列会有好处的.前面的方差分析中,讨论因素A 和B 的交互作用A ×B .这类交互作用在正交试验设计中同样有表现,即一个因素A 的水平对试验结果指标的影响同另一个因素B 的水平选取有关.当试验考虑交互作用时,也可用前面讲的基本方法来处理.本章就不再介绍了.。