第六章--方差分析与正交试验设计
实验设计的方差分析与正交试验
实验设计的方差分析与正交试验一、实验设计中的方差分析方差分析(analysis of variance,ANOVA)是一种统计方法,用于比较不同组之间的均值差异是否具有统计学上的显著性。
在实验设计中,方差分析主要被用来分析因变量(dependent variable)在不同水平的自变量(independent variable)中的变化情况。
通过比较不同组之间的方差,判断是否存在显著差异,并进一步分析差异的原因。
1. 单因素方差分析单因素方差分析是最简单的方差分析方法,适用于只有一个自变量的实验设计。
该方法通过比较不同组之间的方差来判断各组均值是否有差异。
步骤如下:(1)确定研究目的,选择合适的因变量和自变量。
(2)设计实验,确定各组的样本个数。
(3)进行实验,并收集数据。
(4)计算各组的平均值和总平均值。
(5)计算组内方差和组间方差。
(6)计算F值,通过计算F值来判断各组均值是否有显著差异。
2. 多因素方差分析多因素方差分析是在单因素方差分析的基础上,增加了一个或多个自变量的情况下进行的。
这种方法可以用来分析多个因素对因变量的影响,并判断各因素的主效应和交互效应。
步骤如下:(1)确定研究目的,选择合适的因变量和多个自变量。
(2)设计实验,确定各组的样本个数。
(3)进行实验,并收集数据。
(4)计算各组的平均值和总平均值。
(5)计算组内方差、组间方差和交互方差。
(6)计算F值,通过计算F值来判断各组均值是否有显著差异。
二、正交试验设计正交试验设计是一种设计高效实验的方法,可以同时考虑多个因素和各个因素之间的交互作用,并通过较少的试验次数得到较准确的结果。
1. 正交表的基本原理正交表的设计是基于正交原理,即每个因素和其他所有因素的交互效应都是独立的。
通过正交表设计实验,可以确保各因素和交互作用在样本中能够均匀地出现,从而减少误差来源,提高实验结果的可靠性。
2. 正交试验设计的步骤(1)确定要研究的因素和水平。
第六章 正交试验设计
第六章正交试验设计(I)教学内容与要求(1)了解正交试验设计的优点,掌握正交表的表示符号、基本结构和特点,掌握正交试验设计的基本步骤。
(2)掌握单指标正交试验、多指标正交试验、有交互作用正交试验、混合水平的正交试验的直观分析法;(3)理解单指标正交试验、多指标正交试验、有交互作用正交试验、混合水平的正交试验的方差分析法。
(4)了解Ecxel在正交试验设计中应用。
(II)教学重点正交试验的直观分析法。
(III)教学难点正交试验的方差分析。
6.1 概述6.1.1 正交试验设计方法的优点和特点用正交表安排多因素试验的方法,称为正交试验设计法。
我国60年代开始使用,70年代得到推广。
这一方法具有这样的特点:①完成试验要求所需的实验次数少。
②数据点的分布很均匀。
③可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。
因此日益受到科学工作者的重视,在实践中获得了广泛的应用。
例6-1:某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表6-1)。
试验的目的是为提高合格产品的产量,寻找最适宜的操作条件。
表6-1 因素水平表对此实例该如何进行试验方案的设计呢?很容易想到的是第一方案:(全面搭配法方案)A2——…A3——…此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达33=27次。
(指数3代表3个因素,底数3代表每因素有3个水平)想节省费用而又快出成果的人提出了第二方案:(简单比较法方案)。
先固定A和B,只改变C,观察因素C不同水平的影响。
作了如下的三次实验:发现C=C2的那次实验的效果最好,合格产品的产量最高,因此认为在后面的实验中因素C应取C2水平。
固定A和C,改变B的三次实验为:发现B=B3的那次实验效果最好,因此认为因素B宜取B3水平。
固定B和C,改变A 的三次实验为:发现因素A宜取A2水平。
因此可以引出结论:为提高合格产品的产量,最适宜的操作条件为A2B3C2。
正交试验设计及其方差分析
第三节正交试验设计及其方差分析在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验),多因素试验由于要考虑的因素较多,当每个因素的水平数较大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表——正交表,来安排试验,通过少量的试验,获得满意的试验结果.1.正交试验设计的基本方法正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表.正交表是预先编制好的一种表格.比如表9-17即为正交表L4(23),其中字母L表示正交,它的3个数字有3种不同的含义:(1) L4(23)表的结构:有4行、3列,表中出现2个反映水平的数码1,2.列数↓L4 (23)↑↑行数水平数(2)L4(23)表的用法:做4次试验,最多可安排2水平的因素3个.最多能安排的因素数↓L4 (23)↑↑试验次数水平数(3) L4(23)表的效率:3个2水平的因素.它的全面试验数为23=8次,使用正交表只需从8次试验中选出4次来做试验,效率是高的.L4 (23)↑↑实际试验数理论上的试验数正交表的特点:(1)表中任一列,不同数字出现的次数相同.如正交表L4(23)中,数字1,2在每列中均出现2次.(2)表中任两列,其横向形成的有序数对出现的次数相同.如表L4(23)中任意两列,数字1,2间的搭配是均衡的.凡满足上述两性质的表都称为正交表(Orthogonal table).常用的正交表有L9(34),L8(27),L16(45)等,见附表.用正交表来安排试验的方法,就叫正交试验设计.一般正交表L p(n m)中,p=m(n-1)+1.下面通过实例来说明如何用正交表来安排试验.例9.7 提高某化工产品转化率的试验.某种化工产品的转化率可能与反应温度A,反应时间B,某两种原料之配比C和真空度D有关.为了寻找最优的生产条件,因此考虑对A,B,C,D这4个因素进行试验.根据以往的经验,确定各个因素的3个不同水平,如表9-18所示.表9-18解本题是4因素3水平,选用正交表L9(34).把表头上各因素相应的水平任意给一个水平号.本例的水平编号就采用表9-18的形式;将各因素的诸水平所表示的实际状态或条件代入正交表中,得到9个试验方案,如表9-20所示.从表9-20看出,第一行是1号试验,其试验条件是:反应温度为60℃,反应时间为2.5小时,原料配比为 1.1∶1,真空度为500毫米汞柱,记作A1B1C1D1.依此类推,第9号试验条件是A3B3C2D1.由此可见,因素和水平可以任意排,但一经排定,试验条件也就完全确定.按正交试验表9-20安排试验,试验的结果依次记于试验方案右侧,见表9-21.2.试验结果的直观分析正交试验设计的直观分析就是要通过计算,将各因素、水平对试验结果指标的影响大小,通过极差分析,综合比较,以确定最优化试验方案的方法.有时也称为极差分析法.例9.7中试验结果转化率列在表9-21中,在9次试验中,以第9次试验的指标86为最高,其生产条件是A 3B 3C 2D 1.由于全面搭配试验有81种,现只做了9次.9次试验中最好的结果是否一定是全面搭配试验中最好的结果呢?还需进一步分析. (1) 极差计算在代表因素A 的表9-21的第1列中,将与水平“1”相对应的第1,2,3号3个试验结果相加,记作T 11,求得T 11=151.同样,将第1列中与水平“2”对应的第4,5,6号试验结果相加,记作T 21,求得T 21=183.一般地,定义T ij 为表9-21的第j 列中,与水平i 对应的各次试验结果之和(i =1,2,3; j =1,2,3,4).记T 为9次试验结果的总和,R j 为第j 列的3个T ij 中最大值与最小值之差,称为极差.显然T =31iji T=∑,j =1,2,3,4.此处T 11大致反映了A 1对试验结果的影响,T 21大致反映了A 2对试验结果的影响, T 31大致反映了A 3对试验结果的影响,T 12,T 22和T 32分别反映了B 1,B 2,B 3对试验结果的影响, T 13,T 23和T 33分别反映了C 1,C 2,C 3对试验结果的影响, T 14,T 24和T 34分别反映了D 1,D 2,D 3对试验结果的影响.R j 反映了第j 列因素的水平改变对试验结果的影响大小,R j 越大反映第j 列因素影响越大.上述结果列表9-22. 表9-22由极差大小顺序排出因素的主次顺序: 主→次B ;A 、D ;C这里,R j 值相近的两因素间用“、”号隔开,而R j 值相差较大的两因素间用“;”号隔开.由此看出,特别要求在生产过程中控制好因素B ,即反应时间.其次是要考虑因素A 和D ,即要控制好反应温度和真空度.至于原料配比就不那么重要了.选择较好的因素水平搭配与所要求的指标有关.若要求指标越大越好,则应选取指标大的水平.反之,若希望指标越小越好,应选取指标小的水平.例9.7中,希望转化率越高越好,所以应在第1列选最大的T 31=185;即取水平A 3,同理可选B 3C 1D 3.故例9.7中较好的因素水平搭配是A 3B 3C 1D 3.例9.8 某试验被考察的因素有5个:A ,B ,C ,D ,E .每个因素有两个水平.选用正交表L 8(27),现分别把A ,B ,C ,D ,E 安排在表L 8(27)的第1,2,4,5,7列上,空出第3,6列仿例9.7做法,按方案试验.记下试验结果,进行极差计算,得表9-23. 表9-23试验目的要找出试验结果最小的工艺条件及因素影响的主次顺序.从表9-23的极差R j的大小顺序排出因素的主次顺序为 主 → 次A 、B ;D ;C 、E最优工艺条件为A 2B 1C 1D 2E 1.表9-23中因没有安排因素而空出了第3,6列.从理论上说,这两列的极差R j 应为0,但因存有随机误差,这两个空列的极差值实际上是相当小的.3.方差分析正交试验设计的极差分析简便易行,计算量小,也较直观,但极差分析精度较差,判断因素的作用时缺乏一个定量的标准.这些问题要用方差分析解决.设有一试验,使用正交表L p (n m ),试验的p 个结果为y 1,y 2,…,y p ,记T =1pi i y =∑, y =11p i i Ty p p ==∑,S T =21()pii yy =-∑为试验的p 个结果的总变差;S j =222111nn ij ij i i T T T r T r p r p ==⎛⎫-=- ⎪⎝⎭∑∑ 为第j 列上安排因素的变差平方和,其中r =p/n .可证明S T =1mij S=∑即总变差为各列变差平方和之和,且S T 的自由度为p -1,S j 的自由度为n -1.当正交表的所有列没被排满因素时,即有空列时,所有空列的S j 之和就是误差的变差平方和S e ,这时S e 的自由度f e 也为这些空列自由度之和.当正交表的所有列都排有因素时,即无空列时,取S j 中的最小值作为误差的变差平方和S e .从以上分析知,在使用正交表L p (n m )的正交试验方差分析中,对正交表所安排的因素选用的统计量为: F =1jeeS S n f -.当因素作用不显著时, F ~F (n -1,f e ),其中第j 列安排的是被检因素.在实际应用时,先求出各列的S j /(n -1)及S e /f e ,若某个S j /(n -1)比S e /f e 还小时,则这第j 列就可当作误差列并入S e 中去,这样使误差S e 的自由度增大,在作F 检验时会更灵敏,将所有可当作误差列的S j 全并入S e 后得新的误差变差平方和,记为S e Δ,其相应的自由度为f e Δ,这时选用统计量 F =1je eS S n f - ~F (n -1,f e Δ).例9.9 对例9.8的表9-23作方差分析.解 由表9-23的最后一行的极差值R j ,利用公式S j =2211n ij i T T r p=-∑,得表9-24.表9-24中第3,6列为空列,因此S e =S 3+S 6=1.250,其中f e =1+1=2,所以S e /f e =0.625,而第7列的S 7=0.125,S 7/f 7=0.1251=0.125比S e /f e 小,故将它并入误差. S e Δ=S e +S 7=1.375,f e Δ=3.整理成方差分析表9-25. ee由于F 0.05(1,3)=10.13, F 0.01(1,3)=34.12,故因素A ,B 作用高度显著,因素C 作用不显著,因素D作用显著,这与前面极差分析的结果是一致的.F检验法要求选取S e,且希望f e 要大,故在安排试验时,适当留出些空列会有好处的.前面的方差分析中,讨论因素A和B 的交互作用A×B.这类交互作用在正交试验设计中同样有表现,即一个因素A的水平对试验结果指标的影响同另一个因素B的水平选取有关.当试验考虑交互作用时,也可用前面讲的基本方法来处理.本章就不再介绍了.。
正交试验设计中的方差分析
免。
QT
m i 1
p j 1
xij
x
2
m i 1
p
xi2j
j 1
1 mp
m i 1
p
2
xij
j1
按照差方和的加和性,总差方和等于各因素形成的差方和的 总和。
QT QA QB QN Qe
其中Qe为残差平方和,即误差的差方和。
3) 试验误差的差方和Qe:
试验误差的差方和是所有试验结果在不同水平下的指标值与该 水平下的均值之间的差的平方和。它是由随机误差引起的,故 叫误差的差方和。
Qe QT ( QA QB QN )
2.计算自由度:
试验的总自由度: fT n 1
各因素自由度: f因 m 1
如果有交互作用,则交互作用的自由度为两因素自由度之积:
明该因素对试验结果(试验指标)的影响显著,两个数差别 越大,说明该因素的显著性越大。
一.几个数据处理中常用的数理统计名词:
首先对几个数理统计名词进行回顾
1. 平均值 x
就是所有数据的和除以数据的个数。
x
1 n
n i 1
xi
1 n
x1
x2
xn
总体平均值:
1 n
n
xi
i 1
n
总体:数理统计学中指的是研究对象的某一特性值的全体; 样本:从总体中随机抽出的一组测量值。
2.极差 R: 就是一组数据中的最大值减去最小值得到的差值。 3.差方和Q: 测量值对平均值的偏差的平方n 1 i1
2
xi x
Q n 1
7.标准偏差s: 方差的平方根。
1 n
第6章 正交试验设计
A2B3C1
A2B2C3
A3B3C2
A1B3C3
2 A1B2C2 3
1
5 4 18
6
8 9
7
13
12
17
16 19 20 15
14
10 24 23
11
25 26
立方体上共 有9 个面, 设对应于A1、 A2、A3的是 左、中、右 三个面;对 应于B1、B2、 B3的是下、 中、上三个 面;对应于 C1、C2、C3 的是前、中、 后三个面。
L 正交表的代号
m正交表的列数
Ln r
n 正交表的行数
m
(最多能安排的因素个数, 包括交互作用、误差等)
r 各因素的水平数
(各因素的水平数相等)
(需要做的试验次数)
正交表符号的意义
正交表的纵列数 (最多允许安排因素的个数)
L8(27)
正交表的代 号
字码数(因素的水平数)
正交表的横行数
如
R越大,因素越重要
若空列R较大,可能原因:
漏掉某重要因素
因素之间可能存在不可忽略的交互作用
(6)优方案的确定
优方案:在所做的试验范围内,各因素较优的水 平组合 若指标越大越好 ,应选取使指标大的水平 若指标越小越好,应选取使指标小的水平 还应考虑:降低消耗、提高效率等 在本例中,试验指标是乳化能力,指标越大越好, 所以应挑选每个因素的K1 ,K2 ,K3(或k1 ,k2 ,k3) 中最大的值对应的那个水平 。
21
A1B1C1
22
A2B1C2
27
A:
考虑兼顾全面试验法和简单比较法的优点, 利用根据数学原理制作好的规格化表—— 正交表来设计试验不失为一种上策。 用正交表来安排试验及分析试验结果,这 种方法叫做正交试验法。 事实上,正交最优化方法的优点不仅表现 在试验的设计上,更表现在对试验结果的 处理上。
正交试验设计(方差分析)
子
A 罗拉加压 10×11×10 (原工艺) 11×12×10 13×14×13
B 后区牵伸 1.80 (原工艺) 1.67 1.50 6 8 10
C 后区隔距 (原工艺)
返回
首先要选择一个合适的正交表,选 L9 (34 ) 来制定试验 方案. 其次,将A、B、C三个因素随机地填在表的三列上, 如A、B、C依次放在1,2,3列,第4列为空列,这个过 程叫表头设计.
A1 1、 2、 3、 4、
A2 5、 6 7、
A3 8、 9
各水平所在的试 验号
各水平所在试验 号的试验数据
1.5、1.3、-0.2
2.6、1.4、-0.3
2.8、 0.4、 0
在因素A每个水平的三次试验中,因素B、C三个水平 都分别各出现一次,因此,可以理解为因素A有三个水平, 每个水平重复做三次试验,按照单因子方差分析:
第4 列 1 2 3
因素A第1 水平3次 试验结果yi 重复测定 y1 值 y2 y3
单因素 4 2 1 2 3 y4 5 2 2 3 1 y5 因素A第2 试验数 1 (y1 y2 ... y9 ) SS 6 = ( y1 y22 y3 ) (y4 3y5 y6 ) (y7 y8 2y9 ) (修正项) 水平 3次重 1 y6 据资料 3 9 复测定值 7 1 3 1 3 2 y7 T 格式 = (K K K ) 8 3 2 1 3 y8
,
,
同理可选出因素B和因素C的最好条件分别为B3、C1。 于是通过 “算一算”得到一个较优的水平组合A1 B3C1.称为 “算一算” 的好条件. 比较“直接看”的好条件A2B3C1与 “算一算”的好条 件A1 B3C1,除了因素A的水平不同外,其它两个因素所取 的好条件是一致的。又因为第一列的极差与误差列的极差 接近,认为因素A对条干不匀率的影响不显著,为方便操作 选取原工艺A1.最后确定最优工艺为A1B3C1.
第6章-正交试验设计结果的方差分析
(4)计算F值
• 各均方除以误差的均方,例如:
FABiblioteka VA Ve或FA
VA V e
FAB
VAB Ve
或
FAB
VAB Ve
(5)显著性检验
• 例如: • 若 FAF(fA,f,e)则因素A对试验结果有显著影
响 • 若 F A BF (fA B,fe,)则交互作用A×B对试验结
果有显著影响
(6)列方差分析表
设:
QT
n
x
2 i
i1
n
T xi i1
②各因素引起的离差平方和
• 第j列所引起的离差平方和 :
Sj
1( m r p1
Kp2j
)T2 n
k
ST S j Se j 1
③交互作用的离差平方和
• 若交互作用只占有一列,则其离差平方和就等于 所在列的离差平方和
• 若交互作用占有多列,则其离差平方和等于所占 多列离差平方和之和,
• 例:3时
S S S AB ( AB ) 1 ( AB ) 2
④试验误差的离差平方和
• 方差分析时,在进行表头设计时一般要求留有空 列,即误差列
• 误差的离差平方和为所有空列所对应离差平方和 之和 :
Se S空列
(2)计算自由度
①总自由度 :=n-1 ②任一列离差平方和对应的自由度 :
=m-1 ③交互作用的自由度 :(以A×B为例) ×B= × ×B=(m-1 ) 若m = 2, ×B= 若m = 3, ×B= 2 + ④误差的自由度:
• 方差分析的基本步骤如下: • (1)计算离差平方和 • (2)计算自由度 • (3)计算平均离差平方和(均方) • (4)计算F 值 • (5)显著性检验
第6章正交试验设计
第6章正交试验设计正交试验设计是一种科学的方法,用于研究多个因素和水平对一个特定实验结果的影响。
这种方法在很多领域都有广泛的应用,包括工程、医学、社会科学和生物科学等。
下面将详细介绍正交试验设计的基本概念、方法和应用。
一、基本概念正交试验设计是一种基于正交性原理的试验设计方法。
正交性原理是指在一组因素中,任意两个因素的不同水平之间都没有相关性。
这意味着每个因素的不同水平都可以独立地影响实验结果,而不会与其他因素的水平产生交互作用。
在正交试验设计中,通常将实验条件或因素设定为不同的水平,并将这些水平组合成一个正交表。
正交表是一种表格,其中每一行代表一个因素的不同水平组合,每一列代表一个因素的独立水平。
通过使用正交表,可以方便地安排多个因素的试验,并有效地分析实验结果。
二、方法1.确定因素和水平在正交试验设计中,首先需要确定要研究的因素和每个因素的水平。
因素是指可能影响实验结果的变量,而水平是指每个因素的不同取值。
在确定因素和水平时,需要考虑实验的目的、现有条件和实际应用等因素。
2.制定正交表根据确定的因素和水平,可以制定一个正交表。
正交表的行数代表实验次数,列数代表因素的数量,而每个单元格则代表一个具体的实验条件或结果。
通常,正交表可以分为标准型和非标准型两大类。
标准型正交表适用于均匀分布在各个因素的水平上,而非标准型正交表则适用于不均匀分布或某些特定条件下的实验设计。
3.实施试验按照正交表中的安排进行试验,记录每次实验的条件和结果。
在实施试验时,需要注意控制实验条件的一致性,以避免误差和干扰因素的影响。
4.分析结果通过对实验结果进行分析,可以得出每个因素对实验结果的影响程度和各因素之间的交互作用。
常用的分析方法包括极差分析、方差分析、回归分析和主成分分析等。
通过分析结果,可以得出最佳的实验条件组合,为实际应用提供指导。
三、应用正交试验设计在许多领域都有广泛的应用,例如:1.工程领域:在机械制造、电子产品制造和化工生产等领域中,经常需要研究多个因素对产品性能的影响。
正交设计与方差分析
正交设计适用于多因素、多水平的试验安排,而方差分析 适用于检验数据间的差异和因素显著性。
04
正交设计与方差分析的实例
正交设计实例
实验设计
正交设计是一种实验设计方法, 通过选择合适的正交表,安排多 因素多水平的实验,以最小实验 次数获得尽可能多的信息。
特点
正交设计具有均衡分散、整齐可 比的特点,能够快速有效地找到 最优方案。
THANKS
感谢观看
复合正交设计
适用于多个因素,每个因素有多个水平的实验。
混合水平正交设计
适用于某些因素水平较多,而其他因素水平较少 的实验。
02
方差分析简介
方差分析的定义
• 方差分析(ANOVA)是一种统计分析方法,用于比较两 个或多个组之间的平均值差异是否显著。它通过分析数据 的变异来源,将总变异分解为组间变异和组内变异,从而 评估不同组之间的差异是否具有统计意义。
适用范围有限
正交设计主要适用于多因素、多水平的实验设计,对于其他类型 的实验可能不太适用。
对实验条件要求较高
正交设计要求实验条件相同,对于实验条件不易控制的情况可能不 太适用。
对实验结果分析要求较高
正交设计需要对实验结果进行复杂的统计分析,对于数据分析能力 要求较高。
正交设计与方差分析的发展趋势
多元化
正交设计与方差分析在未来的应用前景
科学研究
正交设计与方差分析在科学研究领域的应用将会越来越广泛,特别是在生物、化学、物理 等领域。
工业生产
工业生产中需要进行大量的实验研究和数据分析,正交设计与方差分析可以为工业生产提 供有效的实验设计和数据分析方法。
数据分析
正交设计与方差分析作为一种统计分析方法,在数据分析领域的应用将会越来越广泛。
正交试验设计中的方差分析
目的
通过方差分析,可以确定不同组之间 的平均值差异是否由随机误差引起, 还是由处理因素或自变量引起。
方差分析的数学模型
数学模型
方差分析使用数学模型来描述数据之间的关系,特别是不同组之间的平均值差异。模型通常包括组间差异和组内 差异两部分。
医学研究
通过正交试验设计中的方差分析,研究不同治疗方案、药物剂量等因素对疾病治疗效果的影响,为临床 治疗提供科学依据。
方差分析的局限性
04
方差分析对数据的要求
独立性
数据必须是相互独立的,不存 在相互关联或依赖关系。
正态性
数据应符合正态分布,才能保 证统计推断的准确性。
同方差性
各组数据的方差应相等,否则 可能导致误判。
制定试验方案
根据正交表设计试验方案,确定每个因素的每个 水平。
实施试验
按照试验方案进行试验,记录每个试验的结果。
方差分析
利用方差分析法对试验结果进行分析,确定各因 素对试验结果的影响程度和显著性。
优化方案
根据方差分析结果,优化试验方案,进行下一步试验。
方差分析的基本原理
02
方差分析的定义与目的
定义
拉丁方设计方差分
析
适用于需要控制试验条件的试验, 通过拉丁方设计平衡试验条件和 试验误差。
正交试验设计中的方差分析步骤
确定试验因素和水平
根据研究目的和实际情况确定试验因 素和水平。
制定正交表
根据试验因素和水平选择合适的正交 表。
安排试验
按照正交表进行试验,记录试验数据。
方差分析
对试验数据进行方差分析,包括自由 度、离均平方和、均方、F值等计算。
第6章正交试验
第六章 正交试验设计试验设计是数理统计中一个很庞大的分支, 其内容十分丰富, 本章只介绍正交试验设计(简称正交设计或正交试验). 正交试验设计是利用“正交表”进行科学地安排与分析多因素试验的方法, 其主要优点是能在很多实验方案中挑选出代表性较强的试验方案, 并通过对少数试验方案之试验结果的分析, 推断出最优方案, 得到比试验结果本身给出的还要多得多的有关多因素之信息. 在正交试验中, 对试验结果的分析, 通常采用直观分析法(也称极差分析法)和方差分析法.第一节 引 言一、正交试验设计的背景引例 为了提高维尼纶耐水性能, 需要分析维尼纶生产的最后一道工序—醛化过程. 醛化过程的好坏用一个叫缩醛化度的指标来衡量, 缩醛化度越高, 纤维的耐水性能越好. 但影响缩醛化度的因素很多, 如反应时间、反应温度、甲醛浓度、硫酸浓度、芒硝浓度等. 这些因素除芒硝浓度取三个水平外, 其余四个因素都各取七个水平. 这样多的因素和水平, 若全面试验需做3×74=7203次试验, 约用五年时间, 这实际上是行不通的.面对上述试验问题, 我们很希望只选做其中一部分有代表性的试验而又能较好地反应全面醛配可能出现的各种情况, 以便从中挑选出较好的试验方案, 这正是正交试验设计所研究的范畴.通常, 称两个因素以上的试验为多因素试验. 正交试验设计是以概率论和数理统计为基础, 科学地安排多因素试验的一类实用性很强的数学方法, 它是数理统计学中一个很大的分支. 它所研究的主要内容是, 如何利用“正交表”进行科学地安排与分析多因素试验以减少试验的次数. 其主要优点是能在很多实验方案中挑选出代表性较强的试验方案, 并通过对少数试验方案之试验结果的分析, 推断出最优方案, 得到比试验结果本身给出的还要多得多的有关多因素之信息. 对试验结果的分析, 通常采用两种方法: 一种是直观分析法(也称极差分析法), 另一种是方差分析法.表6.1 正交表L(27)表6.2 正交表L 4二、正交表正交表是一种特殊的表格, 这里只介绍它的记号、特点及使用方法. 表L 8(27)与L 9(34)即是两张常用的正交表. L 8(27)与L 9(34)是正交表的记号, 其具体含义为:L 是正交表代号; 8或9表示该正交表的行数, 即需要做的试验次数; 2或3表示水平数; 7或4表示正交表的纵列数, 即最多可安排的因素的个数.正交表L 8(27)与L 9(34具有如下的性质:(1) 整齐可比性: 表中任一列所含各种水平的个数都相同;(2) 均衡搭配性: 表中任两列所有各种可能的数对出现的次数都相同. 凡具有上述两种性质的表, 都称为正交表.三、正交试验设计正交试验设计, 包括选表、表头设计以及利用所选定的正交表安排试验方案, 并对试验结果进行统计分析, 确定较优或最优试验方案的一种科学方法. 具体地说, 正交试验设计能明确地回答如下几个方面的问题:(1) 因素的主次, 即各因素对所考察指标影响的大小顺序;(2) 因素与指标的关系, 即每个因素的各水平变化时, 指标是怎样变化的; (3) 什么是最优试验方案或最优工艺条件; (4) 进一步试验的方向.第二节 正交试验的直观分析一、直观分析(无交互作用)例1(合成氨最佳工艺条件试验) 根据已有的经验, 决定在合成氨试验中选取的因素与水平如表6.3所示. 假定各因素之间无交互作用, 试验的目前是提高产量. 要求进行试验设计并对试验的结果进行分析.解: 为了避免试验产生系统误差,因素的各水平哪一个定为1水平、2水平、3水平, 应按“随机化”的方法确定. 1.选表与表头设计 本例是一个三水平的试验, 因此要选用L n (3t )型正交表. 由于有3个因素, 且不考虑因素之间的交互作用, 所以选一张3≥t 的表, 而L 9(34)是是满足条件3≥t 的最小L n (3t )型表, 故选用正交表L 9(34)安排试验. 由于不考虑各因素之间的交互作用,只需将各因素分别填写在所选表的上方与列号对应的位置上, 一个因素占有一列, 不同的因素占有不同的列, 就得到所谓的表头设计, 如表6.4所示.注意: 未放置因素的列, 称为空白列或空列. 空白列在正交设计的方差分析中也称为误差列, 它有着重要的作用, 一般要求至少有一个空白列.2.确定试验方案完成了表头设计以后, 只要将表中各列的数字“1”、“2”、“3”分别看成该列所填因素在各个试验中的水平数, 而正交表的每一行就是一个试验方案. 于是, 本例得到9个试验方案.3.按规定的试验方案做试验并记录试验结果按正交表的各试验号中规定的水平组合进行试验, 并记录其结果得到表 6.5. 注意: 必须严格按照规定的方案完成每一号试验; 为了保证具有相同的随机性, 试验往往不按照表上试验号的顺序进行, 而是采取抽签的方法决定试验的顺序.4.计算极差, 确定因素的主次顺序 记K ij =第j 列上水平号为i 的各试验结果之和;k ij = K ij /s, 其中s 为第j 列上水平号i 出现的次数, 即k ij 表示第j 列的表6.3 例1的因素水平表因素取水平i时进行试验所取得的试验结果的平均值;R j=max i{ K ij }-min i{ K ij }, R j称为第j列的极差或所在因素的极差, 也可定义r j=max i{ k ij }-min i{ k ij }为第j列的极差或所在因素的极差.对于本例, 我们有:K11=y1+ y2+ y3=1.72+1.82+1.80=5.34, k11= K11/3=1.780,K21=y4+ y5+ y6=1.92+1.83+1.98=5.73, k21= K21/3=1.910,K31=y7+ y8+ y9=1.59+1.60+1.81=5.00, k31= K31/3=1.667,R1=max i{ K i1 }-min i{ K i1}=5.73-5.00=0.73;其它的K ij , k ij与R j类似地可以得到, 见表6.5.表6.5例1的试验方案及试验结果分析一般地, 各列的极差是不相等的, 这说明各因素的水平改变对试验结果的影响是不相同的. 极差越大, 说明这个因素的水平改变对试验结果的影响也越大. 因此, 极差最大的那一列因素就是水平改变对试验结果影响最大的因素, 也就是主要的因素. 由于有R1 >R2 >R3 >R4, 因此本例的因素主次顺序为:主→次A B C注意: 有时空白列的极差比所有其他因素的极差还要大, 这说明因素之间可能存在有不可忽视的交互作用, 或者忽略了对试验结果有重要影响的其它因素, 或者试验误差太大, 需要具体问题具体分析.5.最优方案的确定挑选因素的优水平与所要求的指标有关. 若指标越大越好, 则应该选取使指标最大的水平, 即各列K1j、K2j和K3j(或k1j、k2j和k3j)中最大的那个水平; 反之, 若指标越小越好, 则应取使指标小的那个水平. 对于本例, 试验的指标是提高合成氨的产量, 指标越大越好, 所以应该挑选每个因素的K1j、K2j、K3j之中最大的那个水平. 由于K2A>K1A>K3A K3B>K2B>K1B K2C>K1C>K3C故得最优方案为: A 2B 3C 2. 即反应温度为490(ºC )、反应压力为300个大气压以及使用乙种催化剂时, 生产方案是最优的.注意: 实际确定最优方案时, 还应区分因素的主次. 对于主要因素, 一定要按有利于指标的要求选取最好的水平, 而对于不重要的因素则可以根据有利于提高效率、降低消耗等要求来考虑因素水平的选取.本例确定的最优方案A 2B 3C 2, 并不包含在正交表里已做过的9个试验方案之中, 这正体现了正交试验设计的优越性. 那么, 它是不是真正的最优方案呢? 我们可以作进一步的理论计算来论证.6.最优方案的工程平均由于任何试验结果总是带有误差, 对某一试验方案来说, 我们关心的是这个试验方案之试验结果的平均值, 最优试验方案试验结果的平均值就称为“最优工程平均”. 为此, 我们先来讨论“效应”的问题:设μ为试验总体的理论总均值, ij μ为因素j 的第i 个水平所对应试验总体的理论均值, 定义a i =iA μ-μ为因素A 的第i 个水平的效应. 由于μ与iA μ均为未知, 此时可用样本均值来进行估计, 因而定义i aˆ=k iA -y 称i aˆ为因素A 的第i 水平的效应. 不难验证∑i a ˆ=0,即同一个因素(或同一列) 的各水平效应之和为0.本例中, 因素A 的各水平的效应分别为:1ˆa=k 1A -y =1.78-1.786=-0.006, 2ˆa=k 2A -y =0.124, 3ˆa = k 3A -y =-0.119. 它们的含义是: 因素A 取A 1水平会使产量平均降低0.006t, 因素A 取A 2水平会使产量平均增加0.124t, 因素A 取A 3水平会使产量平均降低0.119t. 同样可得:1ˆb = k 1B -y =-0.043, 2ˆb = k 2B -y =-0.036, 3ˆb = k 3B -y =0.077; 1ˆc= k 1C -y =-0.019, 2ˆc = k 2C -y =0.064, 3ˆc = k 3C -y =-0.046. 综合起来, 在不考虑交互作用的情况下, 可用迭加的方法求得某一试验方案试验结果的平均值—称为该试验方案的工程平均, 它等于总平均y 加上该试验方案各因素所取水平的效应之和. 某一方案的工程平均, 实质上就是该试验方案试验结果真值的无偏点估计. 对本例, 最优方案A 2B 3C 2的工程平均为y ˆ=2.051.7.对比验证试验最优方案在正式作为生产方案实施之前还需要进行对比验证试验: 将最优方案A 2B 3C 2与按正交表之规定做过的9个方案中产量最高的第6号方案A 2B 3C 1作对比试验. 若方案A 2B 3C 2比第6号试验产量更高, 通常认为A 2B 3C 2就是真正的最优方案; 否则, 就取第6号试验方案A 2B 3C 1作为最优方案. 后一种情况发生, 一般来说可能是没有考虑交互作用, 或者是试验误差较大引起的, 需要作进一步的研究, 可能有提高产量的潜力.8.作出因素水平-指标变化的趋势图 二、正交试验设计原理的解释由于正交表的整齐可比性与均衡搭配性, 使得用正交表安排的试验具有均衡分散性与整齐可比性, 所以它能大大地减少试验次数, 甚至比简单地比较全面试验的结果有可能提供更多更有用的信息.图6.1 例1的因素水平-指标变化趋势图三、直观分析(有交互作用)在此情况下, 对多因素正交试验的表头设计必须借助两列间的交互作用表, 许多正交表的后面都附有相应的交互作用表. 表6.6即是正交表L 8(27)的交互作用表.用正交表安排有交互作用的试验时, 通常将交互作用看作一个新的因素, 它在正交表上的占有列, 称为交互作用列. 为了避免“混杂”现象, 交互作用列应该通过杳交互作用表来确定. 从表6.6可以确定任何两列的交互作用列.例2 工件的渗碳层深度要求为1±0.25mm, 试验与考察的水平如表 6.7所示,还要考察交互作用A ×B 与B ×C. 试验的目的是确定这4个因素及两个交互作用对渗碳指标影响的重要性主次顺序, 并找到最优的生产方案(注意, 渗碳层深度越接近1越好).解: 1.选表与表头设计这是一个4因素2水平试验, 加上考虑交互因素A ×B 与B ×C, 因此所选的2水平正交表至少要有6列, 满足这种条件的2水平正交表中以L 8(27)为最小, 因此选用正交表L 8(27)安排试验.将因素A 、B 分别放在正交表的1、2两列上, 查L 8B 占用第三列, 因此第3列不能安排其它因素, 否则就会产生混杂现象; 现将因素C 入放在第4列, 再查L 8(27)的交互作用表得交互作用B ×C 占用第6列, 因素D 可安排在第5列或第7列上. 现将因素D 安排在第5列, 从而得到如表6.8的表头设计.2.明确试验方案, 依照试验方案进行试验并记录试验结果由此得到表 6.9. 注意, 交互作用所在列和空白列对确定试验方案不起任何作用, 因为那些列的数字“1”、“2”不代表任何实际水平.73. 计算极差, 确定因素的主次仿例1, 可得因素的主次顺序如表6.9所示. 4.确定最优方案交互因素A ×B 是影响试验结果最重要的因素, 但是交互因素A ×B 没有实际的水平, 故不能按K 13与K 23大小来确定, 而应该按A 与B 搭配的好坏来确定. 表6.10是因素A 与B 的水平搭配表, 也称之为二元表. 由于指标y 越小越好, 可知A 与B 的最优搭配为A 1B 2; 类似地, 可以得到B 与C 的最优搭配为B 2C 2.由于D 的最优水平为D 1, 从而得到最优方案为A 1B 2C 2D 1, 而不考虑交互作用的最优方案为A 1B 2C 1D 1, 两方案的不同之处在于因素C 的水平取法. 不般来说, 次要因素应服从于主要因素, 因此我们认为方案A 1B 2C 2D 1是最优的.第三节 正交试验的方差分析极差分析法的优点是, 方法简单、直观、计算量较小, 便于普及和推广. 但是, 极差分析法不能估计试验过程中以及结果测定中必然存在的误差大小, 不能真正区分某因素各水平所对应试验结果的差异, 究竟是由于水平的改变引起的还是由于试验误差引起的; 再者, 极差分析法得到的结论不够精确, 而且当水平数超过3时, 极差分析方法不便于使用.一、方差分析(无交互作用)表6.10 例2的因素A 与B 的水平搭配表。
第六章 正交试验设计
(3)常用正交表的分类
凡是标准表,水平数都相等(水平数只能取素数或素数 幂,完全由拉丁方而来)。因此,有7水平,9水平标准 表,没有6水平,8水平标准表。 利用标准表可以考察交互效应。
(4)正交表的基本性质
正交性
1)任何l列中各水平都出现,出现次数相等。 2)任意2列间不同水平所有可能组合都出现,出现次数相等。
重复试验的方差分析与无重复试验的方差分析基本情况相 同
(1)计算K1j, K2j,· · ·,时,是各号试验下的数据之和;
代表性。
任意2列间所合组合全部出现,任意两因素间都是全面试验。 综合可比性。
任2列间所有可能组合出现次数相等,使任一因素各水平试验条 件相同。
除标准表外,还有混合型正交表,但进行正交设计 时,一般查用现成的正交表。 并非任意给定的参数都可以构造出正交表,好多问 题还未解决。
第三节 正交试验设计的基本步骤
单 因 素 轮 换 法
试验结果缺乏足够证据 各因素参加试验的几率不等 无法考察因素间存在交互作用 若没有重复,无法估计试验误差
全 面 试 验
33=27,若要设置重复,则加大了试验次数
正 交 拉 丁 方
试验点分布均匀 各因素参加试验的几率相等
第二节 正交表
(1)正交表——正交拉丁方的自然推广
主要
方法,具有很高的效率。
(4)全面试验只有在因素、水平都不多的情形之下才能实施。 如6个因素,每因素5个水平,全面试验就需要56=15625 组合,若要估计试验误差则还要增加重点试验,一般不 可能做到。 (5)当因素较多时,既要考虑合理的试验处理及重复次数, 又希望得出较全面的结论,需要用科学方法进行安排。
第五节 正交试验设计的方差分析
正交试验设计(方差分析)
而第4列是空列,极差为0.34,这是由随机误差产生的,又 因为因素A的极差0.36与空列的极差0.34接近,所以可粗略 地认为因素A对指标影响不显著
由此可以根据极差的大小顺序排出因素的主次:
主
次
B、C、A
由因素的主次可以看出后区牵伸(因素B)对指标影响 最主要,其次是后区隔距(因素C),罗拉加压影响最小.
C
1.6 3.9 4.0 0.53 1.30 1.33 0.80
误差列
各数据说明
2.9
其中:
3.8 2.8 0.97 1.27 0.93 0.34
K ( j) i
为第j列的第i水 平数据之和
k( j) i 为其平均值
R( j)
为第j列的极差
9
T xi i 1
=9.5
返回
2. 分据知,第2列和第3列的极差较大, 这反映了当因素B、C的水平波动时,指标波动较大,说明因 素B、C对指标影响较大;
上一张 下一张 主 页 退 出
6.5.1 正交试验结果的方差分析
方差分析基本思想是将数据的总变异分解成因 素引起的变异和误差引起的变异两部分,构造F统 计量,作F检验,即可判断因素作用是否显著。
正交试验结果的方差分 析思想、步骤同前!!
方差分析的基本步骤与格式
设: 用正交表Ln(rm)来安排试验 试验结果为yi(i=1,2,…n)
方差分析时,在进行表头设计时一般要求留有空列,即误差 列
误差的离差平方和为所有空列所对应离差平方和之和 :
SSe SS空列
(2)计算自由度
第6讲(5)
正交试验设计 (方差分析)
第6章正交试验设计
M
S
e
S
S
e
d
f
e
(4)计算F值
各均方除以误差的均方,例如:
FA
MSA MSe
或
FA
MSA
M
S
e
FAB
MSAB MSe
或
FAB
MSAB MSe
(5)显著性检验
例如: 若 FAF(dfA,dfe,)则因素A对试验结果有显著影响 若 F A BF (dfA B,dfe),则交互作用A×B对试验结果有 显著影响
4
液
1.5
试验号
1 2 3 4 5 6 7 8 9 K1 K2 K3 k1 k2 k3 极差R 因素主→次 优方案
因素
A
B
C
1
1 1(1)
1
2 2(2)
1
3 3(2)
2
1 2(2)
2
2 3(2)
2
3 1(1)
3
1 3(2)
3
2 1(1)
3
3 2(2)
9.0 2.5
-4.6
8.2 9.1
29.5
7.7 13.3 3.0 0.8
6.2.2 多指标正交试验设计及其结果的直观分析
两种分析方法: 综合平衡法 综合评分法
(1)综合平衡法
先对每个指标分别进行单指标的直观分析 对各指标的分析结果进行综合比较和分析,得出较优方案
②例
三个指标 : 提取物得率 总黄酮含量 葛根素含量
三个指标都是越大越好
对三个指标分别进行直观分析: ➢ 提取物得率:
C2 (y2+ y4)/2 =(0.448+0.516)/2=0.482
6第六章-正交试验设计1
取三因素三水平,通常有两种试验方法:
2024/9/11
试验设计与数据处理
3
(1)全面实验法:
A1B1C1 A2B1C1 A3B1C1
A1B1C2 A2B1C2 A3B1C2
A1B1C3 A2B1C3 A3B1C3
A1B2C1 A2B2C1 A3B2C1
B3
A1B2C2 A2B2C2 A3B2C2
A1B2C3 A2B2C3 A3B2C3
试验设计与数据处理
5
(2)简单比较法
变化一个因素而固定其它因素,如首
先固定B.C于B1、C1,使A变化之,
则:
A1
B1C1
A2
A3(好结果)
如果得出结果A3最好,则固定A于 A3,C还是C1,使B变化,则:
A3C1
B1 B2(好结果)
B3Βιβλιοθήκη 得出结果B2最好,则固定B于B2,A
于A2,使C变化,则:
优方案是通过统计分析得出的, 还需要进行试验 验证, 以保证有方案与实际一致, 否则还需要进行 新的正交试验。
2024/9/11
试验设计与数据处理
25
6.4 正交试验设计结果的直观分析法
6.4.1 单指标正交试验设计及结果的直观分析 6.4.2 多指标正交试验设计及结果的直观分析 6.4.3 有交互作用的正交试验设计及其结果的直观
2024/9/11
试验设计与数据处理
2
这里,对因素A、B.C在试验范围内分别选取三个水 平
A:A1=80℃、A2=85℃、A3=90℃ B:B1=90Min、B2=120Min、B3=150Min C:C1=5%、C2=6%、C3=7%
正交试验设计中,因素可以定量的,也可以使定性 的。而定量因素各水平间的距离可以相等也可以 不等。
正交设计试验资料的方差分析
数据整理
将收集到的数据整理成 表格形式,便于后续分 析。
数据筛选
对异常值进行筛选和处 理,确保数据质量。
正交设计试验资料的方差分析过程
确定试验因素和水平
明确试验因素和各因素的水平, 为后续分析提供基础。
计算各因素的效应值
根据试验结果,计算各因素的效 应值。
计算误差平方和
根据效应值和水平,计算误差平 方和。
跨学科融合
标准化与规范化
结合其他学科的理论和方法,拓展正交设 计试验的应用领域,推动多学科交叉融合 发展。
制定和完善正交设计试验的标准和规范, 提高试验的可靠性和可比性。
正交设计试验资料方差分析的实际应用价值
科学研究
在科学研究领域,正交设计 试验资料方差分析可用于探 索和验证科学假设,揭示现 象背后的机制和规律。
正交试验设计的基本原理
1 2
正交性原理
正交试验设计基于正交性原理,即每个因素在试 验中出现的次数相同,且各次出现的概率相等。
均匀分散原理
正交试验设计通过均匀分散原理,确保每个水平 在试验中都有均衡的分布,从而减少结果的偏差。
3
代表性原理
正交试验设计通过代表性原理,选取具有代表性 的样本点进行试验,以反映整体情况。
正交设计试验资料的方差 分析
• 正交设计试验概述 • 方差分析基础 • 正交设计试验资料的方差分析方法 • 实例分析 • 总结与展望
01
正交设计试验概述
正交试验设计的基本概念
正交试验设计是一种统计技术,用于 在多因素、多水平条件下进行试验, 以最小化试验次数,同时最大化信息 收集。
它利用正交表来安排试验,确保每个 因素的每个水平都被等可能地选取, 从而得到全面而均衡的试验结果。
正交实验设计与方差分析2024
引言概述正交实验设计与方差分析是一种常用于实验设计和数据分析的统计方法。
这种方法能够帮助研究人员系统地设计实验、收集数据,并通过方差分析对数据进行统计分析。
正交实验设计适用于多因素实验设计,能够探究多个因素对结果变量的影响,并确定各个因素对结果变量的相对重要性。
方差分析则是用来比较不同组别之间的均值差异是否显著,并推断这些差异是否由于随机因素引起。
正文内容1.正交实验设计的基本原理1.1.因素和水平1.2.正交实验设计的完备性和平衡性1.3.主效应和交互效应的概念1.4.正交表和正交实验设计的选择1.5.正交实验设计的优点和局限性2.正交实验设计的建立步骤2.1.确定要研究的因素和水平2.2.选择适当的正交表2.3.构建试验方案2.4.进行实验和数据收集2.5.数据分析和结果解释3.方差分析的基本原理3.1.单因素方差分析3.2.多因素方差分析3.3.方差分析中的假设检验3.4.方差分析的效应量和效应大小3.5.方差分析结果的解释和报告4.正交实验设计与方差分析的应用领域4.1.医学研究4.2.工程设计4.3.农业实验4.4.社会科学研究4.5.生产过程优化5.正交实验设计与方差分析的案例分析5.1.一个药物疗效评价的正交实验设计案例5.2.一个工程设计的正交实验设计案例5.3.一个农业实验的正交实验设计案例5.4.一个社会科学研究的正交实验设计案例5.5.一个生产过程优化的正交实验设计案例总结正交实验设计与方差分析是一种重要的统计方法,在实验设计和数据分析中具有广泛的应用。
通过正交实验设计,研究人员能够系统地探究多个因素对结果变量的影响,并确定各个因素的相对重要性。
方差分析则用于比较不同组别之间的均值差异,并推断这些差异是否显著。
正交实验设计与方差分析能够帮助研究人员有效地设计实验、收集数据并进行统计分析,为科学研究和应用提供有力支持。
在不同领域,如医学研究、工程设计、农业实验、社会科学研究和生产过程优化等方面都有广泛的应用。
《试验设计与数据处理》讲稿_第6章_正交试验设计
第6章正交试验设计主要内容:一、概述二、正交试验设计结果的直观分析法三、正交试验设计结果的方差分析法正交试验法:在优选区内利用正交表科学地安排试验点,通过试验结果的数据分析,缩小优选范围,或者得到较优点的多因素试验方法。
6.1 概述引例—多因素的试验设计问题•指标—收率•因素—(1)原料A的用量 (2)原料B的用量(3)液固比C (4)反应温度D(5)反应压力E (6)催化剂的用量F(7)反应时间G (8)搅拌强度H•水平—8个因素各取3个水平•进行全面搭配的试验次数为: 38=6561 次•科学问题:能否只做其中一小部分试验,通过数据分析来达到全面试验的效果呢?6.1.1 正交表(一)正交表的代号及含义常用正交表的形式为:L(r m)n式中,L ──正交表的符号;n ──要做的试验次数;r ──因素的水平数;m ── 最多允许安排的因素个数。
(27)完全试验次数:128如:L8L(313)完全试验次数:1594323(二)正交表的形式(1)等水平正交表:指各个因素的水平数都相等的正交表。
如L8(27),L27(313)(2)混合水平正交表:指试验中各因素的水平数不相等的正交表如L8(41×24),L24(3×4×24)(三)正交表的特点(1)每一列中,不同的数字出现的次数相等,即对任何一个因素,不同水平的试验次数是一样的。
(2)任意两列中,同一横行的两个数字构成有序数对,每种数对出现的次数是相同,即任何两个因素之间都是交叉分组的全面试验。
(三)正交试验设计的分类6.1.2 正交试验设计的优点①能在所有试验方案中均匀地挑选出代表性强的少数试验方案。
②通过对这些少数试验方案的结果进行统计分析,可以推出较优的方案,而且所得到的较优方案往往不包含在这些少数试验方案中。
③对试验结果作进一步的分析,可以得到试验结果之外的更多信息。
例如,各试验因素对试验结果影响的重要程度、各因素对试验结果的影响趋势等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 方差分析与正交试验设计在生产实践和科学研究中,经常要分析各种因素对试验指标是否有显著的影响。
例如,工业生产中,需要研究各种不同的配料方案对生产出的产品的质量有无显著差异,从中筛选出较好的原料配方;农业生产中,为了提高农作物的产量,需要考察不同的种子、不同数量的肥料对农作物产量的影响,并从中确定最适宜该地区种植的农作物品种和施肥数量。
要解决诸如上述问题,一方面需要设计一个试验,使其充分反映各因素的作用,并力求试验次数尽可能少,以便节省各种资源和成本;另一方面就是要对试验结果数据进行合理的分析,以便确定各因素对试验指标的影响程度。
§6.1 单因素方差分析仅考虑一个因素A 对试验指标有无显著影响,可以让A 取r 个水平:r A A A ,,,21 ,在水平i A 下进行i n 次试验,称为单因素试验,试验结果观测数据ij x 列于下表:并设在水平i A 下的数据i in i i x x x ,,21来自总体),(~2i i N X ,),,2,1(r i 。
检验如下假设:r H 210:, r H ,,,:211 不全相等 检验统计量为),1(~)/()1/(r n r F r n S r S F e A其中21211)()(x x n x x S iri i ri n j i A i,称为组间差平方和。
211)(i ri n j ije x xS i,称为组内差平方和。
这里 ri i n n 1,in j ij i i x n x 11, r i n j ij ix n x 111。
对于给定的显著性水平)05.001.0(或 ,如果),1(r n r F F ,则拒绝0H ,即认为因素A 对试验指标有显著影响。
实际计算时,可事先对原始数据作如下处理:ba x x ij ij再进行计算,不会影响F 值的大小。
例1试分析三种不同的菌型对小白鼠的平均存活日数影响是否显著? 解:30,11,9,10,3321 n n n n r 16.6,27.7,22.7,4321 x x x x 43.70)()(21211x x n x xS i ri i r i n j iA i,74.137)(211i ri n j ije x xS i49.5)27,2(90.601.0 F F ,说明三种不同菌型的伤寒病菌对小白鼠的平均存活日数的影响高度显著。
§6.2 双因素方差分析同时考察两个因素A 和B 对试验指标有无显著影响,可以让A 取r 个水平:r A A A ,,,21 ,让B 取s 个水平:s B B B ,,,21 ,在各种水平配合),(j i B A 下进行试验,称为双因素试验。
一、无交互作用的双因素方差分析在每一种水平配合),(j i B A 下作一次试验,称为无交互作用的双因素试验,试验结果观测数据ij x 列于下表:并设在水平配合),(j i B A 下的数据ij x 来自总体),(~2 ij ij N X ,),,2,1;,,2,1(s j r i 。
检验如下假设:••• r A H 210:, •••r A H ,,,:211 不全相等 r B H ••• 210:, r B H ••• ,,,:211 不全相等 分别用如下检验统计量))1)(1(,1(~)1)(1/()1/(s r r F s r S r S F e A A))1)(1(,1(~)1)(1/()1/(s r s F s r S s S F e B B其中21211)()(x x s x xS i ri r i sj i A• •,称为A 的组间差平方和。
21211)()(x x r x xS j sj ri s j jB• • ,称为B 的组间差平方和。
211)(x x x xS j i ri sj ije•• ,称为组内差平方和。
这里 • s j ij i x s x 11, • ri ij j x r x 11, r i s j ij x rs x 111。
对于给定的显著性水平)05.001.0(或 ,如果))1)(1(,1( s r r F F A ,则拒绝A H 0,即认为因素A 对试验指标有显著影响;如果))1)(1(,1( s r s F F B ,则拒绝B H 0,即认为因素B 对试验指标有显著影响。
实际计算时,可事先对原始数据作如下处理:ba x x ij ij再进行计算,不会影响B A F F ,值的大小。
例1 为了解三种不同配比的饲料对仔猪生长影响的差异,对3种不同品种的仔猪各选3头进行试验,分别测得其一段时间体重增加量,如下表所示(A 代表饲料,B 代表品种):解:所有数据减去50后计算结果如下:3,3 s r33.2,3,66.0321 •••x x x 2,3,7,2321 •••x x x x 33.3,150,66.8 e B A S S S94.6)4,2(20.505.0 F F A ,说明不同饲料对仔猪的生长无显著影响。
0.18)4,2(0.9001.0 F F B ,说明品种的差异对仔猪生长的影响高度显著。
二、有交互作用的双因素方差分析在每一种水平配合),(j i B A 下重复作)2( m m 次试验,称为有交互作用的双因素试验,试验结果观测数据ijk x 列于下表:并设在水平配合),(j i B A 下的数据ijm ij ij x x x ,,,21 来自总体),(~2 ij ij N X ,),,2,1;,,2,1(s j r i 。
检验如下假设:••• r A H 210:, •••r A H ,,,:211 不全相等 r B H ••• 210:, r B H ••• ,,,:211 不全相等 ij AB H :0全相等, ij AB H :1不全相等 分别用如下检验统计量))1(,1(~)1(/)1/(m rs r F m rs S r S F e A A))1(,1(~)1(/)1/(m rs s F m rs S s S F e B B))1(),1)(1((~)1(/)1)(1/(m rs s r F m rs S s r S F e AB AB其中212111)()(x x m s x x S i ri r i s j i mk A• •,称为A 的组间差平方和。
212111)()(x x rm x x S j sj ri sj j mk B• •,称为B 的组间差平方和。
2111)(x x x x S j i ri sj ij mk AB••211)(x x x x m j i r i sj ij •• ,称为B A 的组间差平方和。
2111)(ij ri sj ijk mk e x x S ,称为组内差平方和。
这里 • s j ijk m k i x sm x 111, • r i ijk m k j x rm x 111, mk ijk ij x m x 11, r i s j ijk mk x rsm x 1111。
对于给定的显著性水平)05.001.0(或 ,如果))1(,1( m rs r F F A ,则拒绝A H 0,即认为因素A 对试验指标有显著影响;如果))1(,1( m rs s F F B ,则拒绝B H 0,即认为因素B 对试验指标有显著影响;如果))1(),1)(1(( m rs s r F F AB ,则拒绝AB H 0,即认为因素A 与因素B 之间的交互效应对试验指标有显著影响。
实际计算时,可事先对原始数据作如下处理:ba x x ijk ijk再进行计算,不会影响AB B A F F F ,,值的大小。
例2 考察合成纤维弹性影响因素为拉伸倍数A 与收缩率B 。
A 与B 各取4个水平,每个水平配合下做2次试验,结果数据见下表:试分析因素、因素对合成纤维弹性的影响是否显著?以及因素与因素之间的交互效应对合成纤维弹性的影响是否显著? 解: 2,4,4 m s r50.21,20.80,66.69,86.8 e AB B A S S S S24.3)16,3(95.205.0 F F A ,说明拉伸倍数A 对合成纤维弹性无显著影响。
29.5)16,3(22.2301.0 F F B ,说明收缩率B 对合成纤维弹性的影响高度显著。
78.3)16,9(91.801.0 F F AB ,说明因素A 与因素B 之间的交互效应对合成纤维弹性的影响高度显著。
§6.3 正交试验设计前面介绍了单因素与双因素试验的方差分析,但是在实际问题中遇到的因素往往超过两个,需要考察各个因素对试验结果是否有显著影响。
从理论上讲可以导出多因素的方差分析法,但是一来公式会变得很复杂,二来总试验次数也要明显增多。
例如,考虑7个因素的试验,每个因素有6个水平,若在每一种组合水平上都做一次试验,需要做27993667次试验,这是根本不可能的! 为了减少试验次数,希望在所有组合水平中挑选一部分出来,在这些组合水平上做试验,即局部地进行试验。
正交试验设计是利用一套现成的规格化的表—正交表,科学地安排试验和分析试验结果的一种数理统计方法,该方法的主要优点是能在很多试验条件中选出代表性强的少数试验方案,同时通过对这少数试验方案的结果进行分析,从中找出最优方案。
正交表1944年起源于美国。
第二次世界大战后在日本开发了使用正交表进行试验设计的技术体系,并在日本全国进行大力普及推广、应用,取得了显著的经济效益。
实践证明,正交设计是促进生产率提高的一种有效手段,目前已经广泛应用于科学研究、产品设计、工艺改革等技术领域以及经营、计划等管理领域。
一、正交表正交表记为)(mn r L ,表示至多安排m 个因素,每个因素有r 种水平,共作n 次试验的正交表。
下面就是两个常用的正交表)3(49L ,)2(78L 。
)3(49L )2(78LL —正交表符号;n —试验次数(正交表的行数); r —水平数;m —因素个数(正交表的列数)。
从上面两个正交表容易看出它们具有如下性质:(1)表中任何一列所含不同的数字出现的次数相同。
如表)3(49L 每一列有三个不同的数字“1”、“2”、“3”,它们各出现3次。
(2)将表中任意两列同一行的两个数字看成有序数对,每种数对出现的次数相同。
如表)3(49L 的有序数对为(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)共9个,它们各出现一次。
以上性质说明正交表中各因素的水平搭配均衡,并可大大减少试验次数。
二、无交互作用的正交设计及其结果的直观分析 1、如何用正交表安排试验 下面用一个实例来说明。
例1 某化工厂进行合成氨试验,需要设计寻找最优生产条件的试验方案。