第六章--方差分析与正交试验设计讲解学习
正交试验设计方差分析
6
表2.实验方案及实验结果的直观分析
列号 实验号
1 A wH2SO4 (%) 1 B mCuSO4· 5H2O(g) 1 C mZn (g) 1 空白列 2 10min内H2的 产率 32.62
2
3 4
2
3 1
1
1 2
2
3 3
1
3 1
40.40
41.07 34.97
5
6 7 8 9
2
3 1 2 3
此,因素水平变化所引起的波动,即因素A的偏差平方和SA应为:
SA=∑(yi-y总)2= (34.74-39.08)2+(38.71-39.08)2+(43.78-39.08)2
=123.37 上述计算结果我们可以通过S总=SA+ Se式来检验SA和 Se 计算正确与否。
(4)自由度和平均偏差平方和的计算 为了消除个数不同对实验指标所产生的影响,
S总 ( yi y总 )2
i 1
n
由表3知:
y总=1/9(32.62+34.97+36.62+40.40+…+44.53)=39.08
则:S总=(32.62-39.08)2+(34.97-39.08)2+…+(44.5339.08)2=151.08 S总反映了实验数据总的波动情况,如果硫酸质量分
i 1
i
即除以(n-1),就得到平均偏差平方和。
平均偏差平方和 nS 1
为什么不除以n而要除以(n-1)呢?这是因为n个 数(y1, y2, y3, ……yn)之间并非彼此毫无关系,它们满 足的关系是: 1 n y yi n i 1 即n个数之和的均值为一定值,因此,n个数中 只有(n-1)个可“自由”变动,所以,求平均偏差平 方和时除以(n-1),数学上将这个(n-1)称为S的自由 度。
6 第6章 正交试验设计
②例:用乙醇溶液提取葛根中有效成分试验,为了提高葛根 用乙醇溶液提取葛根中有效成分试验, 中有效成分提取率,对提取工艺进行优化试验, 中有效成分提取率,对提取工艺进行优化试验,需要考虑以 下三个指标: 下三个指标: 提取物得率 总黄酮含量 葛根素含量 三个指标都是越大越好,根据前期探索性试验, 三个指标都是越大越好,根据前期探索性试验,选取三个 因素和3个水平不考虑交互作用进行正交试验 个水平不考虑交互作用进行正交试验, 因素和 个水平不考虑交互作用进行正交试验,得到因素 水平表和试验结果表和结果分析表。 水平表和试验结果表和结果分析表。
①选表 应将交互作用看成因素 因素2水平选表 按5因素 水平选表:L8(27) 因素 水平选表: ②表头设计 交互作用应该占有相应的列——交互作用列 交互作用应该占有相应的列——交互作用列 交互作用列是不能随意安排 表头设计两种方法: 表头设计两种方法: 查交互作用表 查表头设计表
③明确试验方案、进行试验、得到试验结果 明确试验方案、进行试验、
④例:玉米淀粉改性制备高取代度的三乙酸淀粉酯的试验中, 玉米淀粉改性制备高取代度的三乙酸淀粉酯的试验中, 需要考察两个指标,即取代度和酯化率,都是越大越好, 需要考察两个指标,即取代度和酯化率,都是越大越好,试 验因素水平表,方案结果表。进行直观分析。 验因素水平表,方案结果表。进行直观分析。
两个指标:取代度、酯化率 两个指标:取代度、 两个指标重要程度不同 综合分数=取代度隶属度× +酯化率隶属度× 综合分数=取代度隶属度×0.4+酯化率隶属度× 0.6
A1 B1 B2 25 30
A2 35 15 B1 B2
A1 25 30
A2 35 40
A和B有交互作用
A和B无交互作用
(2)有交互作用的正交试验设计及其结果的直观分析 ) 例:用石墨炉原子吸收分光光度法测定食品中的铅,为了提 用石墨炉原子吸收分光光度法测定食品中的铅, 高测定灵敏度,希望吸光度大。为了提高吸光度, 高测定灵敏度,希望吸光度大。为了提高吸光度,对A 灰化温度/℃)、B(原子化温度/℃ (灰化温度 ℃)、 (原子化温度 ℃)和C(灯电流 (灯电流/mA) ) 三个因素进行考察,并考虑交互作用A× 、 × , 三个因素进行考察,并考虑交互作用 ×B、A×C,试进 正交试验找出最优水平 找出最优水平。 行正交试验找出最优水平。 3因素 水平 因素2水平 因素 交互作用:A×B、A×C 交互作用: × 、 × 指标: 指标:吸光度 ,越大越好
第6章正交试验设计
第6章正交试验设计正交试验设计是一种科学的方法,用于研究多个因素和水平对一个特定实验结果的影响。
这种方法在很多领域都有广泛的应用,包括工程、医学、社会科学和生物科学等。
下面将详细介绍正交试验设计的基本概念、方法和应用。
一、基本概念正交试验设计是一种基于正交性原理的试验设计方法。
正交性原理是指在一组因素中,任意两个因素的不同水平之间都没有相关性。
这意味着每个因素的不同水平都可以独立地影响实验结果,而不会与其他因素的水平产生交互作用。
在正交试验设计中,通常将实验条件或因素设定为不同的水平,并将这些水平组合成一个正交表。
正交表是一种表格,其中每一行代表一个因素的不同水平组合,每一列代表一个因素的独立水平。
通过使用正交表,可以方便地安排多个因素的试验,并有效地分析实验结果。
二、方法1.确定因素和水平在正交试验设计中,首先需要确定要研究的因素和每个因素的水平。
因素是指可能影响实验结果的变量,而水平是指每个因素的不同取值。
在确定因素和水平时,需要考虑实验的目的、现有条件和实际应用等因素。
2.制定正交表根据确定的因素和水平,可以制定一个正交表。
正交表的行数代表实验次数,列数代表因素的数量,而每个单元格则代表一个具体的实验条件或结果。
通常,正交表可以分为标准型和非标准型两大类。
标准型正交表适用于均匀分布在各个因素的水平上,而非标准型正交表则适用于不均匀分布或某些特定条件下的实验设计。
3.实施试验按照正交表中的安排进行试验,记录每次实验的条件和结果。
在实施试验时,需要注意控制实验条件的一致性,以避免误差和干扰因素的影响。
4.分析结果通过对实验结果进行分析,可以得出每个因素对实验结果的影响程度和各因素之间的交互作用。
常用的分析方法包括极差分析、方差分析、回归分析和主成分分析等。
通过分析结果,可以得出最佳的实验条件组合,为实际应用提供指导。
三、应用正交试验设计在许多领域都有广泛的应用,例如:1.工程领域:在机械制造、电子产品制造和化工生产等领域中,经常需要研究多个因素对产品性能的影响。
正交设计与方差分析
正交设计适用于多因素、多水平的试验安排,而方差分析 适用于检验数据间的差异和因素显著性。
04
正交设计与方差分析的实例
正交设计实例
实验设计
正交设计是一种实验设计方法, 通过选择合适的正交表,安排多 因素多水平的实验,以最小实验 次数获得尽可能多的信息。
特点
正交设计具有均衡分散、整齐可 比的特点,能够快速有效地找到 最优方案。
THANKS
感谢观看
复合正交设计
适用于多个因素,每个因素有多个水平的实验。
混合水平正交设计
适用于某些因素水平较多,而其他因素水平较少 的实验。
02
方差分析简介
方差分析的定义
• 方差分析(ANOVA)是一种统计分析方法,用于比较两 个或多个组之间的平均值差异是否显著。它通过分析数据 的变异来源,将总变异分解为组间变异和组内变异,从而 评估不同组之间的差异是否具有统计意义。
适用范围有限
正交设计主要适用于多因素、多水平的实验设计,对于其他类型 的实验可能不太适用。
对实验条件要求较高
正交设计要求实验条件相同,对于实验条件不易控制的情况可能不 太适用。
对实验结果分析要求较高
正交设计需要对实验结果进行复杂的统计分析,对于数据分析能力 要求较高。
正交设计与方差分析的发展趋势
多元化
正交设计与方差分析在未来的应用前景
科学研究
正交设计与方差分析在科学研究领域的应用将会越来越广泛,特别是在生物、化学、物理 等领域。
工业生产
工业生产中需要进行大量的实验研究和数据分析,正交设计与方差分析可以为工业生产提 供有效的实验设计和数据分析方法。
数据分析
正交设计与方差分析作为一种统计分析方法,在数据分析领域的应用将会越来越广泛。
正交试验设计中的方差分析
目的
通过方差分析,可以确定不同组之间 的平均值差异是否由随机误差引起, 还是由处理因素或自变量引起。
方差分析的数学模型
数学模型
方差分析使用数学模型来描述数据之间的关系,特别是不同组之间的平均值差异。模型通常包括组间差异和组内 差异两部分。
医学研究
通过正交试验设计中的方差分析,研究不同治疗方案、药物剂量等因素对疾病治疗效果的影响,为临床 治疗提供科学依据。
方差分析的局限性
04
方差分析对数据的要求
独立性
数据必须是相互独立的,不存 在相互关联或依赖关系。
正态性
数据应符合正态分布,才能保 证统计推断的准确性。
同方差性
各组数据的方差应相等,否则 可能导致误判。
制定试验方案
根据正交表设计试验方案,确定每个因素的每个 水平。
实施试验
按照试验方案进行试验,记录每个试验的结果。
方差分析
利用方差分析法对试验结果进行分析,确定各因 素对试验结果的影响程度和显著性。
优化方案
根据方差分析结果,优化试验方案,进行下一步试验。
方差分析的基本原理
02
方差分析的定义与目的
定义
拉丁方设计方差分
析
适用于需要控制试验条件的试验, 通过拉丁方设计平衡试验条件和 试验误差。
正交试验设计中的方差分析步骤
确定试验因素和水平
根据研究目的和实际情况确定试验因 素和水平。
制定正交表
根据试验因素和水平选择合适的正交 表。
安排试验
按照正交表进行试验,记录试验数据。
方差分析
对试验数据进行方差分析,包括自由 度、离均平方和、均方、F值等计算。
正交试验设计中的方差分析
那么正交试验的方差分析可以从以下几步进行:
1.计算差方和(离差平方和): 包括以下几部分:
1)各因素差方和:
正交试验都是多因素多水平的试验,因此有必要对各因素的 差方和进行计算。 各因素差方和等于它的各水平均值k1A,k2A,…,kmA之间偏差平 方和。 以因素A为例,它在正交表中的某列,用xij表示A在第i个水 平的第j次试验结果,则;
即:fA×B=fA×fB 试验误差的自由度fe=fT-f因 。
3.计算平均差方和(均方): 在计算各因素的差方和时,按照前面的讲述,它是各水平的 偏差方的和,其大小与水平数有关,故此还不能确切的反映 各因素的情况。为了消除水平数的影响,可以计算其平均差 方和:
因素的平均差方和=因素差方和 =Q因 因素的自由度 f因
试验误差的差方和是所有试验结果在不同水平下的指标值与该 水平下的均值之间的差的平方和。它是由随机误差引起的,故 叫误差的差方和。
Qe QT ( QA QB QN )
2.计算自由度:
试验的总自由度: fT n 1
各因素自由度: f因 m 1
如果有交互作用,则交互作用的自由度为两因素自由度之积:
一.几个数据处理中常用的数理统计名词:
首先对几个数理统计名词进行回顾
1. 平均值 x
就是所有数据的和除以数据的个数。
x
1 n
n i 1
xi
1 n
x1
x2
xn
总体平均值:
1 n
n
xi
i 1
n
总体:数理统计学中指的是研究对象的某一特性值的全体; 样本:从总体中随机抽出的一组测量值。
2.极差 R: 就是一组数据中的最大值减去最小值得到的差值。 3.差方和Q: 测量值对平均值的偏差的平方和,就叫~。也叫离差平方和。
第6章正交试验
第六章 正交试验设计试验设计是数理统计中一个很庞大的分支, 其内容十分丰富, 本章只介绍正交试验设计(简称正交设计或正交试验). 正交试验设计是利用“正交表”进行科学地安排与分析多因素试验的方法, 其主要优点是能在很多实验方案中挑选出代表性较强的试验方案, 并通过对少数试验方案之试验结果的分析, 推断出最优方案, 得到比试验结果本身给出的还要多得多的有关多因素之信息. 在正交试验中, 对试验结果的分析, 通常采用直观分析法(也称极差分析法)和方差分析法.第一节 引 言一、正交试验设计的背景引例 为了提高维尼纶耐水性能, 需要分析维尼纶生产的最后一道工序—醛化过程. 醛化过程的好坏用一个叫缩醛化度的指标来衡量, 缩醛化度越高, 纤维的耐水性能越好. 但影响缩醛化度的因素很多, 如反应时间、反应温度、甲醛浓度、硫酸浓度、芒硝浓度等. 这些因素除芒硝浓度取三个水平外, 其余四个因素都各取七个水平. 这样多的因素和水平, 若全面试验需做3×74=7203次试验, 约用五年时间, 这实际上是行不通的.面对上述试验问题, 我们很希望只选做其中一部分有代表性的试验而又能较好地反应全面醛配可能出现的各种情况, 以便从中挑选出较好的试验方案, 这正是正交试验设计所研究的范畴.通常, 称两个因素以上的试验为多因素试验. 正交试验设计是以概率论和数理统计为基础, 科学地安排多因素试验的一类实用性很强的数学方法, 它是数理统计学中一个很大的分支. 它所研究的主要内容是, 如何利用“正交表”进行科学地安排与分析多因素试验以减少试验的次数. 其主要优点是能在很多实验方案中挑选出代表性较强的试验方案, 并通过对少数试验方案之试验结果的分析, 推断出最优方案, 得到比试验结果本身给出的还要多得多的有关多因素之信息. 对试验结果的分析, 通常采用两种方法: 一种是直观分析法(也称极差分析法), 另一种是方差分析法.表6.1 正交表L(27)表6.2 正交表L 4二、正交表正交表是一种特殊的表格, 这里只介绍它的记号、特点及使用方法. 表L 8(27)与L 9(34)即是两张常用的正交表. L 8(27)与L 9(34)是正交表的记号, 其具体含义为:L 是正交表代号; 8或9表示该正交表的行数, 即需要做的试验次数; 2或3表示水平数; 7或4表示正交表的纵列数, 即最多可安排的因素的个数.正交表L 8(27)与L 9(34具有如下的性质:(1) 整齐可比性: 表中任一列所含各种水平的个数都相同;(2) 均衡搭配性: 表中任两列所有各种可能的数对出现的次数都相同. 凡具有上述两种性质的表, 都称为正交表.三、正交试验设计正交试验设计, 包括选表、表头设计以及利用所选定的正交表安排试验方案, 并对试验结果进行统计分析, 确定较优或最优试验方案的一种科学方法. 具体地说, 正交试验设计能明确地回答如下几个方面的问题:(1) 因素的主次, 即各因素对所考察指标影响的大小顺序;(2) 因素与指标的关系, 即每个因素的各水平变化时, 指标是怎样变化的; (3) 什么是最优试验方案或最优工艺条件; (4) 进一步试验的方向.第二节 正交试验的直观分析一、直观分析(无交互作用)例1(合成氨最佳工艺条件试验) 根据已有的经验, 决定在合成氨试验中选取的因素与水平如表6.3所示. 假定各因素之间无交互作用, 试验的目前是提高产量. 要求进行试验设计并对试验的结果进行分析.解: 为了避免试验产生系统误差,因素的各水平哪一个定为1水平、2水平、3水平, 应按“随机化”的方法确定. 1.选表与表头设计 本例是一个三水平的试验, 因此要选用L n (3t )型正交表. 由于有3个因素, 且不考虑因素之间的交互作用, 所以选一张3≥t 的表, 而L 9(34)是是满足条件3≥t 的最小L n (3t )型表, 故选用正交表L 9(34)安排试验. 由于不考虑各因素之间的交互作用,只需将各因素分别填写在所选表的上方与列号对应的位置上, 一个因素占有一列, 不同的因素占有不同的列, 就得到所谓的表头设计, 如表6.4所示.注意: 未放置因素的列, 称为空白列或空列. 空白列在正交设计的方差分析中也称为误差列, 它有着重要的作用, 一般要求至少有一个空白列.2.确定试验方案完成了表头设计以后, 只要将表中各列的数字“1”、“2”、“3”分别看成该列所填因素在各个试验中的水平数, 而正交表的每一行就是一个试验方案. 于是, 本例得到9个试验方案.3.按规定的试验方案做试验并记录试验结果按正交表的各试验号中规定的水平组合进行试验, 并记录其结果得到表 6.5. 注意: 必须严格按照规定的方案完成每一号试验; 为了保证具有相同的随机性, 试验往往不按照表上试验号的顺序进行, 而是采取抽签的方法决定试验的顺序.4.计算极差, 确定因素的主次顺序 记K ij =第j 列上水平号为i 的各试验结果之和;k ij = K ij /s, 其中s 为第j 列上水平号i 出现的次数, 即k ij 表示第j 列的表6.3 例1的因素水平表因素取水平i时进行试验所取得的试验结果的平均值;R j=max i{ K ij }-min i{ K ij }, R j称为第j列的极差或所在因素的极差, 也可定义r j=max i{ k ij }-min i{ k ij }为第j列的极差或所在因素的极差.对于本例, 我们有:K11=y1+ y2+ y3=1.72+1.82+1.80=5.34, k11= K11/3=1.780,K21=y4+ y5+ y6=1.92+1.83+1.98=5.73, k21= K21/3=1.910,K31=y7+ y8+ y9=1.59+1.60+1.81=5.00, k31= K31/3=1.667,R1=max i{ K i1 }-min i{ K i1}=5.73-5.00=0.73;其它的K ij , k ij与R j类似地可以得到, 见表6.5.表6.5例1的试验方案及试验结果分析一般地, 各列的极差是不相等的, 这说明各因素的水平改变对试验结果的影响是不相同的. 极差越大, 说明这个因素的水平改变对试验结果的影响也越大. 因此, 极差最大的那一列因素就是水平改变对试验结果影响最大的因素, 也就是主要的因素. 由于有R1 >R2 >R3 >R4, 因此本例的因素主次顺序为:主→次A B C注意: 有时空白列的极差比所有其他因素的极差还要大, 这说明因素之间可能存在有不可忽视的交互作用, 或者忽略了对试验结果有重要影响的其它因素, 或者试验误差太大, 需要具体问题具体分析.5.最优方案的确定挑选因素的优水平与所要求的指标有关. 若指标越大越好, 则应该选取使指标最大的水平, 即各列K1j、K2j和K3j(或k1j、k2j和k3j)中最大的那个水平; 反之, 若指标越小越好, 则应取使指标小的那个水平. 对于本例, 试验的指标是提高合成氨的产量, 指标越大越好, 所以应该挑选每个因素的K1j、K2j、K3j之中最大的那个水平. 由于K2A>K1A>K3A K3B>K2B>K1B K2C>K1C>K3C故得最优方案为: A 2B 3C 2. 即反应温度为490(ºC )、反应压力为300个大气压以及使用乙种催化剂时, 生产方案是最优的.注意: 实际确定最优方案时, 还应区分因素的主次. 对于主要因素, 一定要按有利于指标的要求选取最好的水平, 而对于不重要的因素则可以根据有利于提高效率、降低消耗等要求来考虑因素水平的选取.本例确定的最优方案A 2B 3C 2, 并不包含在正交表里已做过的9个试验方案之中, 这正体现了正交试验设计的优越性. 那么, 它是不是真正的最优方案呢? 我们可以作进一步的理论计算来论证.6.最优方案的工程平均由于任何试验结果总是带有误差, 对某一试验方案来说, 我们关心的是这个试验方案之试验结果的平均值, 最优试验方案试验结果的平均值就称为“最优工程平均”. 为此, 我们先来讨论“效应”的问题:设μ为试验总体的理论总均值, ij μ为因素j 的第i 个水平所对应试验总体的理论均值, 定义a i =iA μ-μ为因素A 的第i 个水平的效应. 由于μ与iA μ均为未知, 此时可用样本均值来进行估计, 因而定义i aˆ=k iA -y 称i aˆ为因素A 的第i 水平的效应. 不难验证∑i a ˆ=0,即同一个因素(或同一列) 的各水平效应之和为0.本例中, 因素A 的各水平的效应分别为:1ˆa=k 1A -y =1.78-1.786=-0.006, 2ˆa=k 2A -y =0.124, 3ˆa = k 3A -y =-0.119. 它们的含义是: 因素A 取A 1水平会使产量平均降低0.006t, 因素A 取A 2水平会使产量平均增加0.124t, 因素A 取A 3水平会使产量平均降低0.119t. 同样可得:1ˆb = k 1B -y =-0.043, 2ˆb = k 2B -y =-0.036, 3ˆb = k 3B -y =0.077; 1ˆc= k 1C -y =-0.019, 2ˆc = k 2C -y =0.064, 3ˆc = k 3C -y =-0.046. 综合起来, 在不考虑交互作用的情况下, 可用迭加的方法求得某一试验方案试验结果的平均值—称为该试验方案的工程平均, 它等于总平均y 加上该试验方案各因素所取水平的效应之和. 某一方案的工程平均, 实质上就是该试验方案试验结果真值的无偏点估计. 对本例, 最优方案A 2B 3C 2的工程平均为y ˆ=2.051.7.对比验证试验最优方案在正式作为生产方案实施之前还需要进行对比验证试验: 将最优方案A 2B 3C 2与按正交表之规定做过的9个方案中产量最高的第6号方案A 2B 3C 1作对比试验. 若方案A 2B 3C 2比第6号试验产量更高, 通常认为A 2B 3C 2就是真正的最优方案; 否则, 就取第6号试验方案A 2B 3C 1作为最优方案. 后一种情况发生, 一般来说可能是没有考虑交互作用, 或者是试验误差较大引起的, 需要作进一步的研究, 可能有提高产量的潜力.8.作出因素水平-指标变化的趋势图 二、正交试验设计原理的解释由于正交表的整齐可比性与均衡搭配性, 使得用正交表安排的试验具有均衡分散性与整齐可比性, 所以它能大大地减少试验次数, 甚至比简单地比较全面试验的结果有可能提供更多更有用的信息.图6.1 例1的因素水平-指标变化趋势图三、直观分析(有交互作用)在此情况下, 对多因素正交试验的表头设计必须借助两列间的交互作用表, 许多正交表的后面都附有相应的交互作用表. 表6.6即是正交表L 8(27)的交互作用表.用正交表安排有交互作用的试验时, 通常将交互作用看作一个新的因素, 它在正交表上的占有列, 称为交互作用列. 为了避免“混杂”现象, 交互作用列应该通过杳交互作用表来确定. 从表6.6可以确定任何两列的交互作用列.例2 工件的渗碳层深度要求为1±0.25mm, 试验与考察的水平如表 6.7所示,还要考察交互作用A ×B 与B ×C. 试验的目的是确定这4个因素及两个交互作用对渗碳指标影响的重要性主次顺序, 并找到最优的生产方案(注意, 渗碳层深度越接近1越好).解: 1.选表与表头设计这是一个4因素2水平试验, 加上考虑交互因素A ×B 与B ×C, 因此所选的2水平正交表至少要有6列, 满足这种条件的2水平正交表中以L 8(27)为最小, 因此选用正交表L 8(27)安排试验.将因素A 、B 分别放在正交表的1、2两列上, 查L 8B 占用第三列, 因此第3列不能安排其它因素, 否则就会产生混杂现象; 现将因素C 入放在第4列, 再查L 8(27)的交互作用表得交互作用B ×C 占用第6列, 因素D 可安排在第5列或第7列上. 现将因素D 安排在第5列, 从而得到如表6.8的表头设计.2.明确试验方案, 依照试验方案进行试验并记录试验结果由此得到表 6.9. 注意, 交互作用所在列和空白列对确定试验方案不起任何作用, 因为那些列的数字“1”、“2”不代表任何实际水平.73. 计算极差, 确定因素的主次仿例1, 可得因素的主次顺序如表6.9所示. 4.确定最优方案交互因素A ×B 是影响试验结果最重要的因素, 但是交互因素A ×B 没有实际的水平, 故不能按K 13与K 23大小来确定, 而应该按A 与B 搭配的好坏来确定. 表6.10是因素A 与B 的水平搭配表, 也称之为二元表. 由于指标y 越小越好, 可知A 与B 的最优搭配为A 1B 2; 类似地, 可以得到B 与C 的最优搭配为B 2C 2.由于D 的最优水平为D 1, 从而得到最优方案为A 1B 2C 2D 1, 而不考虑交互作用的最优方案为A 1B 2C 1D 1, 两方案的不同之处在于因素C 的水平取法. 不般来说, 次要因素应服从于主要因素, 因此我们认为方案A 1B 2C 2D 1是最优的.第三节 正交试验的方差分析极差分析法的优点是, 方法简单、直观、计算量较小, 便于普及和推广. 但是, 极差分析法不能估计试验过程中以及结果测定中必然存在的误差大小, 不能真正区分某因素各水平所对应试验结果的差异, 究竟是由于水平的改变引起的还是由于试验误差引起的; 再者, 极差分析法得到的结论不够精确, 而且当水平数超过3时, 极差分析方法不便于使用.一、方差分析(无交互作用)表6.10 例2的因素A 与B 的水平搭配表。
第六章 正交试验设计
(3)常用正交表的分类
凡是标准表,水平数都相等(水平数只能取素数或素数 幂,完全由拉丁方而来)。因此,有7水平,9水平标准 表,没有6水平,8水平标准表。 利用标准表可以考察交互效应。
(4)正交表的基本性质
正交性
1)任何l列中各水平都出现,出现次数相等。 2)任意2列间不同水平所有可能组合都出现,出现次数相等。
重复试验的方差分析与无重复试验的方差分析基本情况相 同
(1)计算K1j, K2j,· · ·,时,是各号试验下的数据之和;
代表性。
任意2列间所合组合全部出现,任意两因素间都是全面试验。 综合可比性。
任2列间所有可能组合出现次数相等,使任一因素各水平试验条 件相同。
除标准表外,还有混合型正交表,但进行正交设计 时,一般查用现成的正交表。 并非任意给定的参数都可以构造出正交表,好多问 题还未解决。
第三节 正交试验设计的基本步骤
单 因 素 轮 换 法
试验结果缺乏足够证据 各因素参加试验的几率不等 无法考察因素间存在交互作用 若没有重复,无法估计试验误差
全 面 试 验
33=27,若要设置重复,则加大了试验次数
正 交 拉 丁 方
试验点分布均匀 各因素参加试验的几率相等
第二节 正交表
(1)正交表——正交拉丁方的自然推广
主要
方法,具有很高的效率。
(4)全面试验只有在因素、水平都不多的情形之下才能实施。 如6个因素,每因素5个水平,全面试验就需要56=15625 组合,若要估计试验误差则还要增加重点试验,一般不 可能做到。 (5)当因素较多时,既要考虑合理的试验处理及重复次数, 又希望得出较全面的结论,需要用科学方法进行安排。
第五节 正交试验设计的方差分析
第6章-正交试验设计结果的方差分析ppt课件
Se Se SA
fe fe fA
V
e
S
e
f e
.
(4)计算F值
• 各均方除以误差的均方,例如:
FA
VA Ve或FA来自VAVe
FAB
V A B Ve
或
FAB
V A B
V
e
.
(5)显著性检验 • 例如: – 若FAF(fA, fe) ,则因素A对试验结果有显著 影响 – 若 FABF(fAB,fe) ,则交互作用A×B对试 验结果有显著影响
.
(6)列方差分析表
.
6.2 二水平正交试验的方差分析
• 正交表中任一列对应的离差平方和:
例6-1
Sj
1 n(K1j
K2j )2
.
6.2.2 三水平正交试验的方差分析
• m=3,所以任一列的离差平方和:
Sj 1 r(K 1 2 jK 2 2jK 3 2j)1 nT2
例6-3 注意: ➢ 交互作用的方差分析 ➢ 有交互作用时,优方案的确定
• 方差分析的基本步骤如下:
➢ (1)计算离差平方和 ➢ (2)计算自由度 ➢ (3)计算平均离差平方和(均方) ➢ (4)计算F 值 ➢ (5)显著性检验
.
(1)计算离差平方和
①总偏差平方和
S Ti n 1(x i x )2i n 1x i2 1 n (i n 1x i)2 Q T 1 n T 2
S S S AB ( AB) 1 ( AB) 2
.
④试验误差的离差平方和
• 方差分析时,在进行表头设计时一般要求留有空 列,即误差列
• 误差的离差平方和为所有空列所对应离差平方和 之和 :
Se S空列
第6章 正交试验设计
正交试验设计的基本原理
正交设计就是从选优区全面试验点(水平组合) 中挑选出有代表性的部分试验点(水平组合)来进行 试验。图中标有试验号的九个“(·)”,就是利用正
交表L9(34)从27个试验点中挑选出来的 9个试验点。即
:
(1)A1B1C1
(4)A1B2C2
(2)A2B1C2
(5)A2B2C3
(3)A3B1C3
33=27,4 因素3水平的全面试验水平组合数为34=81 ,
5因素3水平的全面试验水平组合数为35=243,这在科
学试验中是有可能做不到的。
全面试验:可以分析各因素的效应 ,交互作用, 也可选出最优水平组合。但全面试验包含的水平组合 数较多,工作量大 ,在有些情况下无法完成 。
正交试验设计的基本特点是:用部分试验来代
之间的搭配是均匀的。
根据以上特性,我们用正交表安排的试验,具有
均衡分散和整齐可比的特点。
所谓均衡分散,是指用正交表挑选出来的各因素 水平组合在全部水平组合中的分布是均匀的 。 在立 方体中 ,任一平面内都包含 3 个“(·)”, 任一 直线上都包含1个“(·)” ,因此 ,这些点代表性 强 ,能够较好地反映全面试验的情况。
因素A,C水平搭配表水平搭配表 A1 A2
C1 (y1+ y3)/2 (y5+ y7)/2 =(0.484+0.532)/2=0.5 =(0.472+0.554)/2=0.513 08 C2 (y2+ y4)/2 (y6+ y8)/2 =(0.448+0.516)/2=0.4 =(0.480+0.552)/2=0.516 82
奶稳定性的影响。每个因素设置3个水平进行试验 。 A因素是增稠剂用量,设A1、A2、A3 3个水平;B因 素是pH值,设B1、B2、B3 3个水平;C因素为杀菌温度 ,设C1、C2、C3 3个水平。这是一个3因素3水平的试验 ,各因素的水平之间全部可能组合有27种 。
第6章 正交试验设计
常见的混合型正交表有:
L8 (41 24 )
L12 (31 24 )
L12 (61 24 )
L16 (41 212 ) L16 (42 29 ) L16 (43 26 ) L16 (44 23 )
分析因素与试验指标之间的关系,即当因素变化时,试验 指标是如何变化的。找出指标随因素变化的规律和趋势, 为进一步试验指明方向;
了解各因素之间的交互作用情况; 估计试验误差的大小。
(6)进行验证试验,作进一步分析
优方案是通过统计分析得出的,还需要进行试验验证,以 保证有方案与实际一致,否则还需要进行新的正交试验。
第6章 正交试验设计
Orthogonal Experimental Design
6.1 概念 6.2 正交试验设计结果的直观分析法 6.3 正交试验设计结果的方差分析法
2019年5月14日
6.1 概述
正交试验设计简称正交设计,它是利用正交表科学 地安排与分析多因素试验的方法,是最常用的试验设计 方法之一。
(2) 不做重复试验无法估计误差。 (3)无法区分因素的主次。 例如选六个因素,每个因素选五个水平时,全面试验的 数目是56 =15625次。 1978年,七机部由于导弹设计的要求,提出了一个五因 素的试验,希望每个因素的水平数要多于10,此时靠全 面试验法是无法完成的。
(2)简单比较法:
(4)按规定的方案做试验,得出试验结果 注意 : 按照规定的方案完成每一号试验 试验次序可随机决定 试验条件要严格控制
二、数据处理 ——极差法 通过试验结果分析,欲达到如下目的: ①找出指标随因素变化的规律。 ②找出因素的主次顺序。 ③找出最佳试验方案。 ④确定下一步试验的方向.
《试验设计与数据处理》讲稿_第6章_正交试验设计
第6章正交试验设计主要内容:一、概述二、正交试验设计结果的直观分析法三、正交试验设计结果的方差分析法正交试验法:在优选区内利用正交表科学地安排试验点,通过试验结果的数据分析,缩小优选范围,或者得到较优点的多因素试验方法。
6.1 概述引例—多因素的试验设计问题•指标—收率•因素—(1)原料A的用量 (2)原料B的用量(3)液固比C (4)反应温度D(5)反应压力E (6)催化剂的用量F(7)反应时间G (8)搅拌强度H•水平—8个因素各取3个水平•进行全面搭配的试验次数为: 38=6561 次•科学问题:能否只做其中一小部分试验,通过数据分析来达到全面试验的效果呢?6.1.1 正交表(一)正交表的代号及含义常用正交表的形式为:L(r m)n式中,L ──正交表的符号;n ──要做的试验次数;r ──因素的水平数;m ── 最多允许安排的因素个数。
(27)完全试验次数:128如:L8L(313)完全试验次数:1594323(二)正交表的形式(1)等水平正交表:指各个因素的水平数都相等的正交表。
如L8(27),L27(313)(2)混合水平正交表:指试验中各因素的水平数不相等的正交表如L8(41×24),L24(3×4×24)(三)正交表的特点(1)每一列中,不同的数字出现的次数相等,即对任何一个因素,不同水平的试验次数是一样的。
(2)任意两列中,同一横行的两个数字构成有序数对,每种数对出现的次数是相同,即任何两个因素之间都是交叉分组的全面试验。
(三)正交试验设计的分类6.1.2 正交试验设计的优点①能在所有试验方案中均匀地挑选出代表性强的少数试验方案。
②通过对这些少数试验方案的结果进行统计分析,可以推出较优的方案,而且所得到的较优方案往往不包含在这些少数试验方案中。
③对试验结果作进一步的分析,可以得到试验结果之外的更多信息。
例如,各试验因素对试验结果影响的重要程度、各因素对试验结果的影响趋势等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 方差分析与正交试验设计在生产实践和科学研究中,经常要分析各种因素对试验指标是否有显著的影响。
例如,工业生产中,需要研究各种不同的配料方案对生产出的产品的质量有无显著差异,从中筛选出较好的原料配方;农业生产中,为了提高农作物的产量,需要考察不同的种子、不同数量的肥料对农作物产量的影响,并从中确定最适宜该地区种植的农作物品种和施肥数量。
要解决诸如上述问题,一方面需要设计一个试验,使其充分反映各因素的作用,并力求试验次数尽可能少,以便节省各种资源和成本;另一方面就是要对试验结果数据进行合理的分析,以便确定各因素对试验指标的影响程度。
§6.1 单因素方差分析仅考虑一个因素A 对试验指标有无显著影响,可以让A 取r 个水平:r A A A ,,,21 ,在水平i A 下进行i n 次试验,称为单因素试验,试验结果观测数据ij x 列于下表:并设在水平i A 下的数据i in i i x x x ,,21来自总体),(~2i i N X ,),,2,1(r i 。
检验如下假设:r H 210:, r H ,,,:211 不全相等 检验统计量为),1(~)/()1/(r n r F r n S r S F e A其中21211)()(x x n x x S iri i ri n j i A i,称为组间差平方和。
211)(i ri n j ije x xS i,称为组内差平方和。
这里 ri i n n 1,in j ij i i x n x 11, r i n j ij ix n x 111。
对于给定的显著性水平)05.001.0(或 ,如果),1(r n r F F ,则拒绝0H ,即认为因素A 对试验指标有显著影响。
实际计算时,可事先对原始数据作如下处理:ba x x ij ij再进行计算,不会影响F 值的大小。
例1试分析三种不同的菌型对小白鼠的平均存活日数影响是否显著? 解:30,11,9,10,3321 n n n n r 16.6,27.7,22.7,4321 x x x x 43.70)()(21211x x n x xS i ri i r i n j iA i,74.137)(211i ri n j ije x xS i49.5)27,2(90.601.0 F F ,说明三种不同菌型的伤寒病菌对小白鼠的平均存活日数的影响高度显著。
§6.2 双因素方差分析同时考察两个因素A 和B 对试验指标有无显著影响,可以让A 取r 个水平:r A A A ,,,21 ,让B 取s 个水平:s B B B ,,,21 ,在各种水平配合),(j i B A 下进行试验,称为双因素试验。
一、无交互作用的双因素方差分析在每一种水平配合),(j i B A 下作一次试验,称为无交互作用的双因素试验,试验结果观测数据ij x 列于下表:并设在水平配合),(j i B A 下的数据ij x 来自总体),(~2 ij ij N X ,),,2,1;,,2,1(s j r i 。
检验如下假设:••• r A H 210:, •••r A H ,,,:211 不全相等 r B H ••• 210:, r B H ••• ,,,:211 不全相等 分别用如下检验统计量))1)(1(,1(~)1)(1/()1/(s r r F s r S r S F e A A))1)(1(,1(~)1)(1/()1/(s r s F s r S s S F e B B其中21211)()(x x s x xS i ri r i sj i A• •,称为A 的组间差平方和。
21211)()(x x r x xS j sj ri s j jB• • ,称为B 的组间差平方和。
211)(x x x xS j i ri sj ije•• ,称为组内差平方和。
这里 • s j ij i x s x 11, • ri ij j x r x 11, r i s j ij x rs x 111。
对于给定的显著性水平)05.001.0(或 ,如果))1)(1(,1( s r r F F A ,则拒绝A H 0,即认为因素A 对试验指标有显著影响;如果))1)(1(,1( s r s F F B ,则拒绝B H 0,即认为因素B 对试验指标有显著影响。
实际计算时,可事先对原始数据作如下处理:ba x x ij ij再进行计算,不会影响B A F F ,值的大小。
例1 为了解三种不同配比的饲料对仔猪生长影响的差异,对3种不同品种的仔猪各选3头进行试验,分别测得其一段时间体重增加量,如下表所示(A 代表饲料,B 代表品种):解:所有数据减去50后计算结果如下:3,3 s r33.2,3,66.0321 •••x x x 2,3,7,2321 •••x x x x 33.3,150,66.8 e B A S S S94.6)4,2(20.505.0 F F A ,说明不同饲料对仔猪的生长无显著影响。
0.18)4,2(0.9001.0 F F B ,说明品种的差异对仔猪生长的影响高度显著。
二、有交互作用的双因素方差分析在每一种水平配合),(j i B A 下重复作)2( m m 次试验,称为有交互作用的双因素试验,试验结果观测数据ijk x 列于下表:并设在水平配合),(j i B A 下的数据ijm ij ij x x x ,,,21 来自总体),(~2 ij ij N X ,),,2,1;,,2,1(s j r i 。
检验如下假设:••• r A H 210:, •••r A H ,,,:211 不全相等 r B H ••• 210:, r B H ••• ,,,:211 不全相等 ij AB H :0全相等, ij AB H :1不全相等 分别用如下检验统计量))1(,1(~)1(/)1/(m rs r F m rs S r S F e A A))1(,1(~)1(/)1/(m rs s F m rs S s S F e B B))1(),1)(1((~)1(/)1)(1/(m rs s r F m rs S s r S F e AB AB其中212111)()(x x m s x x S i ri r i s j i mk A• •,称为A 的组间差平方和。
212111)()(x x rm x x S j sj ri sj j mk B• •,称为B 的组间差平方和。
2111)(x x x x S j i ri sj ij mk AB••211)(x x x x m j i r i sj ij •• ,称为B A 的组间差平方和。
2111)(ij ri sj ijk mk e x x S ,称为组内差平方和。
这里 • s j ijk m k i x sm x 111, • r i ijk m k j x rm x 111, mk ijk ij x m x 11, r i s j ijk mk x rsm x 1111。
对于给定的显著性水平)05.001.0(或 ,如果))1(,1( m rs r F F A ,则拒绝A H 0,即认为因素A 对试验指标有显著影响;如果))1(,1( m rs s F F B ,则拒绝B H 0,即认为因素B 对试验指标有显著影响;如果))1(),1)(1(( m rs s r F F AB ,则拒绝AB H 0,即认为因素A 与因素B 之间的交互效应对试验指标有显著影响。
实际计算时,可事先对原始数据作如下处理:ba x x ijk ijk再进行计算,不会影响AB B A F F F ,,值的大小。
例2 考察合成纤维弹性影响因素为拉伸倍数A 与收缩率B 。
A 与B 各取4个水平,每个水平配合下做2次试验,结果数据见下表:试分析因素、因素对合成纤维弹性的影响是否显著?以及因素与因素之间的交互效应对合成纤维弹性的影响是否显著? 解: 2,4,4 m s r50.21,20.80,66.69,86.8 e AB B A S S S S24.3)16,3(95.205.0 F F A ,说明拉伸倍数A 对合成纤维弹性无显著影响。
29.5)16,3(22.2301.0 F F B ,说明收缩率B 对合成纤维弹性的影响高度显著。
78.3)16,9(91.801.0 F F AB ,说明因素A 与因素B 之间的交互效应对合成纤维弹性的影响高度显著。
§6.3 正交试验设计前面介绍了单因素与双因素试验的方差分析,但是在实际问题中遇到的因素往往超过两个,需要考察各个因素对试验结果是否有显著影响。
从理论上讲可以导出多因素的方差分析法,但是一来公式会变得很复杂,二来总试验次数也要明显增多。
例如,考虑7个因素的试验,每个因素有6个水平,若在每一种组合水平上都做一次试验,需要做27993667次试验,这是根本不可能的! 为了减少试验次数,希望在所有组合水平中挑选一部分出来,在这些组合水平上做试验,即局部地进行试验。
正交试验设计是利用一套现成的规格化的表—正交表,科学地安排试验和分析试验结果的一种数理统计方法,该方法的主要优点是能在很多试验条件中选出代表性强的少数试验方案,同时通过对这少数试验方案的结果进行分析,从中找出最优方案。
正交表1944年起源于美国。
第二次世界大战后在日本开发了使用正交表进行试验设计的技术体系,并在日本全国进行大力普及推广、应用,取得了显著的经济效益。
实践证明,正交设计是促进生产率提高的一种有效手段,目前已经广泛应用于科学研究、产品设计、工艺改革等技术领域以及经营、计划等管理领域。
一、正交表正交表记为)(mn r L ,表示至多安排m 个因素,每个因素有r 种水平,共作n 次试验的正交表。
下面就是两个常用的正交表)3(49L ,)2(78L 。
)3(49L )2(78LL —正交表符号;n —试验次数(正交表的行数); r —水平数;m —因素个数(正交表的列数)。
从上面两个正交表容易看出它们具有如下性质:(1)表中任何一列所含不同的数字出现的次数相同。
如表)3(49L 每一列有三个不同的数字“1”、“2”、“3”,它们各出现3次。
(2)将表中任意两列同一行的两个数字看成有序数对,每种数对出现的次数相同。
如表)3(49L 的有序数对为(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)共9个,它们各出现一次。
以上性质说明正交表中各因素的水平搭配均衡,并可大大减少试验次数。
二、无交互作用的正交设计及其结果的直观分析 1、如何用正交表安排试验 下面用一个实例来说明。
例1 某化工厂进行合成氨试验,需要设计寻找最优生产条件的试验方案。