全因子试验设计
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、全因子试验设计概述 D M A I C
1、全因子试验设计的特点
• 当因子水平超过2时,由于试验次数随因子个数的增
长呈指数速度增长,因而通常只做2水平的全因子试验记为: 试验。
• 2 k是整个全因子试验的记号,而不仅仅是试验次数。
当然,也恰好是k个因子的2水平的全因子试验所需要
三、全因子试验设计的分析
1、选定拟合模型
第二要点是分析评估回顾的总效果
C、对于预测结果的整体预测 R2 1 SSE
另一个统计量是R-Sq(预测)。
SST
将SSE换成PRESS,可以得到预测的R2简记为R-Sq(预测)。
R-Sq(预测)通常比R2(R-Sq)小一些,小得不多说明数据 中有特殊地位的点不多。
7-2 全因子试验设计
主要内容
DMA I C
全因子试验设计概述 全因子试验设计基本思想 全因子试验设计的步骤 全因子试验设计分析的步骤
一、全因子试验设计概述 D M A I C
1、全因子试验设计的特点
全因子试验设计:所有因子的所有水平的所有组合都至 少进行一次试验的设计。
全因子试验设计所需试验总次数较多,但它的优点是可 以估计出所有的主效应和所有的各阶交互效应。所以 在因子数不太多,而且确实需要考察较多的交互作用 时,常选用全因子设计。
ST Sotal SST
当自变量个不 数管 增自 加变 时量 ,R 是 2都否 会显 增著 加, 。R 为 a2dj 此 Ra2dj1SSSS//E T (n(n 1 p)),n为观测值p总 为个 回数 归, 方程的总项
三、全因子试验设计的分析
1、选定拟合模型
第二要点是分析评估回归的总效果
A、两个确定系数R2及R
三、全因子试验设计的分析
1、选定拟合模型
第一要点是分析评估回归的显著性 对于方差分析表的分析: B、失拟现象 H0:无失拟 H1:有失拟 如果失拟项的P值大于0.05,则无法拒绝原假设。即可判定模 型无失拟现象。如P小于0.05,说明模型漏掉了重要项。
三、全因子试验设计的分析
1、选定拟合模型
第一要点是分析评估回归的显著性 对于方差分析表的分析: C、弯曲项 H0:无弯曲 H1:有弯曲 如果弯曲项的P值大于0.05,则无法拒绝原假设。即可判定模 型无弯曲现象。如P小于0.05,说明模型应该补充二次项。
的最少试验次数。
• 当因子数不超过5个时,全因子试验比较合适。
一、全因子试验设计概述
2、试验目的
全因子试验设计可兼有筛选因子和建立回归方程 两方面目的。
一、全因子试验设计概述
3、正交试验的概念
30年代,由于农业试验的需要,Fisher在试验设计和 统计分析方面做出了一系列先驱工作,从此试验设计 成为统计科学的一个分支。 60年代,日本统计学家田口玄一将试验设计中应用最 广的正交设计表格化 。
一、全因子试验设计概述
5、代码化及其计算
例:假定温度低水平为820度,高水平为860度,则:
真实值 代码值
低水平 820 -1
中心值 840 0
高水平 860 1
中心值M=(低+高)/2 半间距D=(高-低)/2=20 代码值=(真实值-中心值M)/半间距D 真实值=中心值M+代码值×半间距D
在本例中,代码值=(真实值-840)/20,真实值=840+20×代码值
常用的方法是在“中心点”处重复3次或4次试验,进行完全相同 条件下的重复,因而可以估计出试验误差即随机误差,增加了对于 响应变量可能存在弯曲趋势估计的能力。 安排因子2水平加中心点,可构成较好的全因子试验设计。
一、全因子试验设计概述
5、代码化及其计算
代码化,就是将因子所取的低水平设定的代码取值为-1, 高水平设定的代码取值为+1,中心水平定为0。 将自变量代码化后的好处:
+1
270
2
-1(700) +1(1250)
-1
230
3
+1(720) -1(1200)
-1
220
4
-1(700)
-1(1200)
+1
200
M+
490
500
470
M-
430
420
450
m+
245
m-
215
效应
30
250
235
210
225
40
10
一、全因子试验设计计划
4、试验的安排及中心点的选取
试验设计中考虑到三个基本原则: 重复试验:将一个试验条件都重复2次或更多次,可以对 试验误差估计得更准确,但却大大增加试验次数。
二、全因子试验计划
二、全因子试验计划
得到标准顺序的试验设计表格。如果选中“随机化运 行顺序”,则可以得到随机化试验设计表格。
三、全因子试验设计的分析
拟合选定模型 进行残差诊断
模型要改进
吗?
Y
N
对选定模型进行分 析解释
目标是否已 经达到?
Y 进行验证试验
N 进行下批试验
三、全因子试验设计的分析
一、全因子试验设计概述
3、正交试验:主效应和交互效应的计算得到简化。
例 在合成氨生产中,考虑两个因子,每个因子取2水平。A:温度, 低水平:7000C;高水平:7200C。B:压力,低水平:1200帕; 高水平:1250帕。以产量y为响应变量(单位:kg),列表如下:
编号
A温度
B压力
AB
产量
1
+1(720) +1(1250)
(1)代码化后的回归方程中,自变量及交互作用项的各系数可以 直接比较,系数绝对值大者之效应比系数绝对值小者之效应更重要、 更显著。 (2)代码化后的回归方程内各项系数的估计量间是不相关的。 (3)在自变量代码化后,回归方程中的常数项(或称截距)有了 具体的物理意义。将全部自变量以“0”代入回归方程得到的响应变 量预测值就是截距值。截距值就是全部试验结果的平均值,也是全 部试验范围中心点上的预测值。
1034955035050350全因子试验设计实例494对选定模型进行分析解释1输出各因子的主效应图交互效应图40035030075706560557065602422207570656055压力距离角度中心点类型强度主效应图数据平均值全因子试验设计实例706560242220907560907560压力间距350中心400压力点类型6065中心70间距点类型抗拉强度交互作用图数据平均值504对选定模型进行分析解释2输出等值线图响应曲面图压力4003803603403203007068666462606060707080809090强度强度距离压力的等值线图70656072843009635060400强度距离压力强度距离压力的曲面图全因子试验设计实例514对选定模型进行分析解释3实现最优化
三、全因子试验设计的分析
1、选定拟合模型
第二要点是分析评估回顾的总效果 C、对于预测结果的整体预测 主要有两个统计量:PRESS和R-Sq(预测)。 PRESS是预测的误差平方和,与SSE很相似,但对于第i个 观测值的预测值所使用的回归方程不是用全部观测值来获 得的,而是将第i个观测值删除后拟合的回归方程,求其 残差。即对所有观测值轮番删除一个,计算残差平方和。 PRESS通常比SSE要大一些,但如果大得不多,说明数据 点中有特殊地位的点不多,或影响不大。用此作为回归方 程的预测结果比较可信。
R预 2 测1
PRESS SST
三、全因子试验设计的分析
1、选定拟合模型
第三要点是分析评估各项效应的显著性 在结果输出的最开始部分就是各回归系数(代码化后) 的统计检验。这里列出了各项的效应、回归系数及P值。 一般情况下,如果P值大于0.05,说明对应项不显著,在 修改模型时应该删除。需要注意的是,如果一个高阶项 是显著的,则此高阶项所包含的低阶项也必须被包含在 模型中。
三、全因子试验设计的分析
2、残差诊断
残差诊断应包含四个步骤:
(1)在“四合一”图的右下角图中,观察残差对于以观测值顺 序为横轴的散点图。重点考察在此散点图中,各点是否随机地在 水平轴上下无规则地波动着。 (2)在“四合一”图的右上角图中,观察残差对于以响应变量 拟合预测值为横轴的散点图,重点考察此散点图中,残差是否保 持等方差性,即是否有“漏斗型”或“喇叭型”。 (3)在“四合一”图的左上角正态概率图(或左下角直方图) 中,观察残差的正态性检验图,看残差是否服从正态分布。 (4)观察残差对于以各自变量为横轴的散点图,重点考察此散 点图中是否有弯曲趋势。
三、全因子试验设计的分析
1、选定拟合模型
第二要点是分析评估回归的总效果
A、两个确定系数R2及R
2 adj
拟合的总效果可以用确定系数R2及R
2 adj
(调整的确定系数)
来确定。
回归分析中 公 平 式 S方 tSo : ta 和 lSM S分 o d解 eSl E Srror R2SM Sode1lSSE
三、全因子试验设计的分析
1、选定拟合模型
第三要点是分析评估各项效应的显著性 对于各项效应的显著性,计算机还输出一些辅助图形帮助 我们判断有关结论。最重要的就是Pareto效应图、正态效 应图。 Pareto图是将各效应t检验的t值作为纵坐标,按照绝对值 大小排列起来,给出t的临界值,绝对值超过临界值的效 应将被选中。
三、全因子试验设计的分析
1、选定拟合模型
第三要点是分析评估各项效应的显著性
将各因子的效应按从小到大(正负号考虑在内)排成序列,将 这些效应点标在正态概率图上,就是正态效应图。 假定少数因子效应显著(效应稀疏原则),挑选位于中间的一 些点拟合一条直线,则远离直线的点效应显著,正效应在直线的 右(上)方,负效应在直线的左(下)方。
A、总效果 H0:模型无效 H1:模型有效
主效应和2因子交互作用中至少有一项P<0.05,可判定模型总体有 效。如果上述两项的P值都大于0.05,说明模型总体无效。 (1)试验误差太大。如果试验误差是由于测量系统造成的,则应 对测量系统进行改进。 (2)试验中漏掉了重要因子。 (3)模型本身有问题。如模型存在失拟现象,或数据本身有较强 的弯曲性。
2 adj
当自变量个数增加时,不管增加的这个自变量是否显著, R2都会增加一 些,因而在评价这个自变量是否该加入回归方程时, R2就没有价值了;
R2adj是扣除了回归方程中所受到的包含项数的影响的相关系数,因而可
以更准确地反映模型的好坏。
因为通常p>1; 所以通常R2adj比R2稍小。
在实际应用中,要判断两个模型的优劣可以从二者的接近程度来判断,
一、全因子试验设计概述
3、正交试验的概念
例 在提高合成氨纯度(%)的工艺研究中,发现因子A(温度)、 因子B(压力)、因子C(反应时间)三个因子对Y有重要影响。每 个因子设定高低两水平,考察这三个因子哪些因子的主效应和交互 效应显著。取值如下: 因子A(温度),低水平:460度,高水平:500度 因子B(压力),低水平:250大气压,高水平:270大气压 因子C(时间),低水平:20分钟,高水平:30分钟 按全因子试验设计安排试验计划,得到下图正交表:
一、全因子试验设计概述
3、正交表的特点可概括为:均衡分散、整齐可比。
A
B
C
1
-1
-1
-1
2
1
-1
-1
3
-1
1
-1
4
1
1
-1
5
-1
-1
1
6
1
-1
1
7
-1
1
1
8
1
1
1
(1)每一列中正负号出现次数各占一半,即在试验中,每个 因子取低水平、高水平的次数相同。
(2)任意两列中,++、+-、-+、--四种搭配出现的次数相等。 即两列的乘积和为0,也就是代数上所说的“正交”。
1、选定拟合模型
选定拟合模型的主要任务是根据整个试验的 目的,选定一个数学模型。 通常可以选定“全模型”,即包含全部因子 的主效应及全部因子的二阶交互效应。 如果某些主效应和二阶交互效应不显著,则 应改进模型,删除不显著的项。
三、全因子试验设计的分析
1、选定拟合模型
第一要点是分析评估回归的显著性 对于方差分析表的分析:
回顾:试验设计的步骤
1、计划阶段 (1)阐述目标 (2)选择响应变量 (3)选择因子及水平 (4)选择试验计划 2、实施阶段
严格按计划矩阵的安排进行试验。记录响应变量和试 验过程中的所有状况,包括环境(气温、室温、湿度、 电压等)、材料、操作员等。 3、分析阶段
按照所应用设计类型相适应的分析方法进行分析。 4、验证阶段
二者之差越小说明模型越好。
三、全因子试验设计的分析
1、选定拟合模型
第二要点是分析评估回顾的总效果 B、对于s的分析 所有观测值与理论值之间都存在误差,总假定这个误差服从以 0为均值、方差为σ2的正态分布 ,可以认为s值是σ的无偏估 计。比较两个模型的优劣最关键的指标就可以选择s。哪个模 型的s值小,哪个模型好。
进行验证试验。
二、全因子试验计划
阐述目标 选择响应变量 选择因子及水平 选择试验计划 实施试验计划 分析试验结果
拟合选定模型 进行残差诊断
模型要改进 吗?
Y
N
对选定模型进行分 析解释
目标是否已 经达到?
Y 进行验证试验
N 进行下批试验
二、全因子试验计划
例:在压力成型塑胶板生产中,经过因子的初步筛选后,最后得知, 影响成型塑胶板强度的因子有三个:成型压力(pressure)、压膜 间距(distance)及压力角(angle)。我们要判断哪些因子的主 效应及哪些交互效应是显著的,哪种生产条件下可以获得最大的成 型塑胶板强度(strength)。 A:成型压力,低水平:300Pa;高水平:400Pa B:压膜间距,低水平:60mm;高水平:70mm C:压力角,低水平:20度;高水平:24度 准备做全因子试验并安排4个中心点(即23+4)的试验,如何安排 试验计划? (DOE_塑胶板.mtw)