在响应曲面方法中三类中心复合设计的比较研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CCC、CCI和CCF异同点的比较和总结
•
各个设计的析因部分都是 2k 个顶点或者这些析因点的一部分,用于估计一阶项 和交互作用项,对于5~ 6个因子,CCD设计的因子部分必须是一个具有最小分辨 率为V级的分式析因设计;但各个设计点的位置不同. 轴向点用于估计二阶响应曲面模型的纯平方项.轴向距离依赖于操作域和定义 域,它决定着设计的旋转性,影响到设计外推的稳健性和参数的估计精度, 同时 优化点的位置随设计域的不同而不同.对于球形域CCC,2~ 6个因子时推荐使用 α = 1. 4~2. 8,上界为α = k,对于立方域,α = 1. 0. 中心点用于提供一致精度和纯误差的估计.在不同形状的设计域中,中心点所起 ˆX NVary 的作用显著不同,在球形设计中,为了达到 的合理分布中心点是必需的, ˆX NVary 但在CCF,仅2个中心点就可得到 的合理稳定性.球形设计对中心点的数目 是敏感的,而CCF对中心点的数目是稳健的,增加中心点或者重复外部点是为了 得到纯的估计.
2 2
•
•
• •
在模型的拟合程度方面这三种设计同样有效,但在模型的估计精度、方差的稳 定性和一致精度以及模型外推的稳健性方面都不同. 对于CCC和CCI,每个试验变量有五个水平,CCF仅需要三个水平,这使得它成为 CCD最简单的类型,同时也是最不易于受到实验误差来源影响而失效的设计,但 它是不可旋转的,这是它的一个缺点.与CCF相比,CCC的预测误差精度一性好而 且改进了平方(曲性)效应的估计.然而,给定一个合理的试验误差,这些优势可能 不能补偿每个变量五个水平所增加的复杂性.从方差角度来看,如果设计域是球 形的, CCD最有效的设计是用α = k以及3~ 5个中心点.近于可旋转性时其旋转性 上的损失并不大,有时设计更可取。
2
2
设计的评价、比较和应用选择
• •
在RSM设计进行评价比较时,应该根据以下三个方面的标准来衡量: 首先是Box and Wilson(1951)在其文章中引入了复合设计的概念从而能够有效地 估计二阶模型的平方项,利用预测方差在其设计域上的分布来评价一个设计,得 出了旋转性这一特性. 预测方差应具有稳定性这一特点,因为很多设计在其设计边界上的方差是不稳 定的,从而得出了一致精度的概念. RSM设计对模型不符合规格限(Model Misspecification)的稳健性概念,不仅由于 模型不符合规格限所造成的偏移应该考虑,即使是中等程度的不符合,使用者也 必须在设计选择中认真考虑.
•
CCDs很灵活,其设计类型可以应用于不同的操作域和设计域.
经典的RSM模型
•
经典的RSM模型是建立在方差一致性假设基础之上,首先是拟合一阶模型,运用 脊分析,找到优化域,再拟合二阶响应曲面模型:
y 0 i xi ij xi x j x
i 1 i j i 1 2 ii i
•
从设计域及其复杂性上比较
• •
考虑设计的复杂性: 在应用CCC时,延伸所定义的变量界限得到轴向点,这就需要操作过程中的每个 变量具有五个水平(对于CCI同样)。相反,对于CCF,仅需要每个变量的三个水平, 使之成为一个更简单的设计.实验者应该充分重视由于设计水平的增加而增加 的复杂性,即使一个重新装配过程的成本不高且不费时间,但这会引起更多的实 误差变异来源。根据经验,在应用实验设计时,最常见的失效原因是由于无法预 期的较大的实验误差所引起的,因此选择误差来源少的设计是有道理的,因为在 多数情况下,可旋转性设计的优势不能够补偿所增加的复杂性和相关的风险.
• •
从设计域及其复杂性上比较
•
为了成功地运行任一安排的试验,操作域必须包括设计域.这意味着过程必须能 够在设计域上具有可操作性,因此,正确的选择CCDs的第一步就是将设计域与操 作域相比较. 如果实验者能够充分推测出优化目标存在于所研究的变量区域内,一般采用球 形域. 在许多实际情况下,当过程不能够在设计域的一个或者多个边界点上操作时,设 计域与操作域相同,这时设计域是个立方体.如果过程不能在区域的一个或者多 个立方体的顶点上操作,那么CCF是不合适的,这就留给实验者两个选择:减少变 量的区域产生一个新的CF,或者产生一个CCI.由于将轴向点放在变量范围的上 下界,析因点就落在了设计空间的内部,CCI限制了由变量所定义的区域的真实 设计空间.
以三因子为例
• •
经典的CCDs包括: 析因部分:一个立方体的2k顶点或者这些析因点的一部分(图1中立方体各个顶 点)。
•
•
带有参数α的2k个轴向点(图1中各个“星”点),这些点实际上扩展了设计区域, 提供了对二阶响应曲面模型纯平方项 ii 的估计.
一系列中心点(图1中位于各个图形中心的点).
CCC、CCI和CCF简介
间中优化值的位置,而一个合理稳定的
•
ቤተ መጻሕፍቲ ባይዱ
ˆ X 的质量。 测值 y
2
分布就保证了未来响应预
旋转性
•
一个可旋转的设计就是与中心点距离相同的任意两点的 测方差的一致性.
ˆX NVary
2
相等,即预
•
•
当实验者在实验之前不知道设计域内优化点的位置时,旋转性使得设计目标清 晰.
在CCDs中,通过恰当地选择α可满足旋转性要求, = 4 F 就得到旋转性,F是2k析因 ˆ X 在整个 设计点的数目(k是所研究变量的数目)。旋转性本身虽然不能保证 y 设计域上的稳定性,但它对设计参数的选择提供了指导原则,像对轴向距离α和 中心点数目nc 的选择。
•
案例分析
• • •
从设计点的预测误差来看,CCC、CCI的轴向点和析因点性能相似;CCF轴向点要 显著地好于析因设计点,这说明球形设计的一致精度比立方域要好。 对于被CCI排除但仍然在CCF的操作域之内的各个顶点而言,意味着预测误差增 加了27%(36. 1575435 /28. 3826518 -1)。 从中心点的预测方差来看,CCF具有最高的精度,误差小,这说明CCF设计对中心 点的数目是稳健的.
ˆ X ,这两类误差实际上就是损失函数标准. 对于某一特定的拟合值 y
实验设计的选择应该基于两类误差:方差误差和偏倚误差,这样设计的实验才能 够保证RSM设计不仅达到预测方差在设计域上分布的稳健性,而且达到了对模 型不适合情况下的稳健性,这也显著地提高了设计的外推能力.
案例分析
• •
三个设计所拟合的模型都是显著的(p< 0. 05),即模型是充分代表了真实函数的, 没有偏倚误差。 从调整的可决系数 R 看出,而且三个设计所达到的拟合程度基本一致.
从设计的稳健性方面进行比较
• • • •
稳健性是指实验设计对规格限不符合的稳健性,从误差的角度看就是同时考虑 ˆ 和系统误差即偏倚. 了模型的两类误差:随机误差即前面所述的 Var y 当偏倚存在于拟合之中时,拟合模型就不可能很好地代表真实模型,拟合不良检 验应该是显著的.仅用方差作为标准,实际上是假定模型是正确的.
•
k
k
此模型包含1+ 2k+ k(k -1) /2个参数,因此必须至少有1+ 2k+ k(k -1) /2个不同的设 计点,而且至少每个设计变量是三个水平的.
主要的概念
• •
操作域(Operability Region):在安全性允许的条件下,加工设备和生产过程的加工 操作范围所定义的研究变量的上下界限的几何区域。 设计域(Region of Interest):由设计变量的各个水平集合的上下界限所定义的几 何区域,在此区域内,真实的函数关系能够由一个多项式模型很好地近似,每个试 验各自的设计域或相同或不同,但都在操作域之内。
• •
从设计域及其复杂性上比较
• •
考虑轴向距离α与设计域和操作域的关系: 设计域经常表示出α的值,α一般取1. 0到 k ,在α取值上这三个设计是不同的,如 果是球形域CCC,α的上界就是k;在CCI中,α的上界就是1;在立方域CCF,α= 1. 0是恰 当的选择。因此α的选择依赖于操作域和设计域. 各设计中轴向点相对于因子点的位置:CCC、CCI使所有设计点(不包括中心点) 与中心等距,这些设计点就形成了一个圆;CCF将轴向点放在立方体的表面中心, 析因点在立方体的顶点,因而它是不可旋转的。将α设为k就将一个可旋转CCD 转换为一个球形CCD,在球形CCD中,所有的设计点都在同一个几何球体上,这些 设计不是准确地可旋转的,但它们是近似旋转的。
选择CCDs的指导原则
•
基于可利用的资源和因子集合的限制来选择经典CCDs,选择由经典设计所推荐 的轴向距离和中心点的数目.只要优化点靠近设计空间的中心,设计的选择就不 是关键的;如果优化点位于设计域之外靠近轴向点时,一致精度和可旋转性就尤 其关键.当在CCC和CCF之间决策时,实验者必须知道是否CCC具有一致的预测误 差,并且设计域的延伸是否充分地弥补由于附加了每个变量两个水平所增加的 操作过程的复杂性.
•
所有设计变量均以编码单位来表示,从设计矩阵的中心点到因子的高低水平的 距离是± 1,轴向点或者“星”点到中心的距离是±α. = k 时轴向点一般在球 体上,α = 1. 0时轴向点在立方面上. 轴向点在立方体的外面,比因子的高低水平± 1更高或更低,这种设计称之为外 切中心复合设计(CCC).对于CCC设计,每个因子有五个水平:±α,0,± 1. 当受到条件的制约时,可减少因子集合的范围,使得轴向点落在每个因子的设计 域内部,即将±α的值设在因子设计域的最大和最小界限上,这样得到的设计称 之为嵌套(内接)中心复合设计CCI. CCI具有CCC的所有特性,CCI也是每个因子有 五个水平:±0.7,0,±1. 当五个水平难以满足或者受到条件的制约时,就将轴向点放在设计空间每个面 的中心上,称之为面心复合设计CCF.CCF仅需要每个因子三个水平:± 1,0。
• •
•
轴向距离和中心点数目的作用
•
CCDs的优点来自于其灵活性和作为序贯试验设计的有用性,灵活性来自于对轴 向距离α和中心点数目 nc 的选择。其中α的选择涉及到设计的旋转性、模型不 符合规格限的稳健性、参数估计对外推的稳健性等方面。旋转特性与中心点 的数目无关,仅依赖于α的值。
•
• •
中心点数目的选择控制了RSM的某些特性:
中心点的加入不改变正交性的特点,但却不再是一个方差优化条件,也就是说,在 每个试验点上,回归系数的方差不再最小; 在某些情况下,中心点的数目使得设计具有“一致精度”(Uniform Precision),一 致精度保证了在所定义的单位距离的区域内所预测的优化值具有相同的方差。 中心点数目是CCDs的关键成分 ,其正确选择是达到一致精度的决定因素。因为 ˆX NVary 中心点个数决定着 的大小,这两者成反比关系,因而球形设计需要3 -5个中 ˆX NVary 心点以避免 的严重失衡。
2
•
从均方误差(RMSE)来看,CCI最小,CCC最大,这是由于预测误差的大小是随着设 计点与设计域之外的距离呈几何增长的缘故,而在这三种设计中,CCC的设计域 最大;相对于CCC而言,CCI和CCF对预测响应的外推的稳健性要好,由此说明轴向 距离的选择(设计域)极大地影响了设计外推的稳健性. 从模型系数的估计精度可看出,CCC的估计精度最高,尤其是平方效应的估 计,CCI最差,CCI明显地不如CCC有效,这表明设计空间对模型参数的估计精度有 影响.而从优化点的坐标值可推断出,设计域同时极大地影响着优化点的位置.
评价CCDs的一个重要指标-预测方差
•
对于一个二阶设计,在设计域上拥有一个
ˆX NVary NX m X X X
m
2 • (N表示样本量,X是设计变量的矩阵)的合理稳定的分布是重要的。
•
因为一开始设计者并不知道设计空间的准确范围或者预测方向以及在设计空
ˆX NVary
响应曲面方法(RSM)
基于中心复合设计(Central Composite Designs, CCDs)
CCDs得以最广泛应用的原因
• •
CCDs的序贯本质,它自然地将因子点划分为两个子集,第一个子集估计线性和两 因子交互效应,第二个子集估计曲性效应. CCDs很有效,以最少的试验循环提供了关于实验变量和实验误差的诸多信息.