扩张配对设计的最优构造

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

扩张配对设计的最优构造
马海南; 陈雪平
【期刊名称】《《高校应用数学学报A辑》》
【年(卷),期】2019(034)004
【总页数】7页(P402-408)
【关键词】试验设计; 响应曲面设计; D-效率; 正交表
【作者】马海南; 陈雪平
【作者单位】浙江工业职业技术学院人文社科部浙江绍兴 312000; 江苏理工学院统计系江苏常州 213001; 南开大学统计研究院天津 300071
【正文语种】中文
【中图分类】O212.6
§1 引言
响应曲面试验设计法是由英国统计学家G.Box和Wilson[1]于1951年提出来的,伴随着第二次工业革命的发展,其迅速在工业,军事,高精度材料研发等领域得到广泛应用[2-4].该方法通过构造响应曲面以确定最优条件或寻找最优区域,是一种结合数学,统计和计算机科学的交叉.目前响应曲面法主要包括一阶响应曲面设计,二阶响应曲面设计和基于多元正交多项式的响应曲面设计.对于k个定量因子x1,···,xk,建立如下的二阶模型[2-3]
其中β0,βi,βii,βij分别是常数项,线性项,平方项和交叉乘积项系数,†为误差项.早期在响应曲面分析中采用的试验设计方法主要为中心组合设计,随后又提出了各种改进的二阶响应曲面设计,包括Box-Behnken设计[5],SCD设计[6],配对扩张设计(APD)设计[7],及最近提出的OACD设计[8]等.关于响应曲面设计的详细内容,可以参见文[2-3].
在不同的中心组合设计中,寻求基于模型(1)的各种最优设计是一个重要的研究工作.比如D最优,E最优,A最优等等,每一类最优设计也都对应着一定的准则,总体目标都是为了提高估计的各种精度或者稳健性等.Xu等在文[8]提出了一种基于二水平正交设计和三水平正交设计的组合设计(OACD),Zhou和Xu在文[9]进一步证明了OACD设计的D最优性,比如在相同试验次数和相同强度的二水平正交设计时,OACD设计相比普通中心组合设计具有更高的D-效率.Zhang等在文[10]中讨论了三阶模型下OACD设计的优良性.对于配对扩张设计,Moris在文[7]中利用极小极大距离首先探讨了APD设计相对于传统中心组合设计在统计性质,设计投影性质和试验次数上的优良性,Fang和Mukerjee在文[11]研究了APD设计的参数设置问题,指出当APD设计中配对点的参数值α=1时D-效率相对较高,Ahmad等在文[12]中研究了带有缺失数据时最优APD设计的参数选择问题.最近,Chen等[13]利用极小极大准则探讨了带有缺失数据时OACD设计的参数选择问题.
本文将在文[11]的基础下进一步讨论不同APD设计的D-效率问题,包括一般APD 设计对应信息矩阵行列式的上下界,并给出一种达到上界的最优APD设计的构造方法.全文安排如下,§2主要介绍扩展配对设计以及在证明过程中所需要的若干引理,§3给出主要结果和几个例子,§4是结束语.
§2 扩张配对设计
APD设计[7]是一种接近饱和的试验设计.它设计的主要目标是用尽可能少的试验次数来估计一个二阶模型,主要是由三部分组成的:第一部分是一个二水平正交表(其中
的元素记为1,−1),行数记为n1,第二部分是由正交表的任意两行取平均值得到的,即对于每一配对点(xs,xt),1≤s≤t≤n1,都会增加一个对应的试验点,
所以第二个部分共有n2=次试验,第三部分是在中心点处的试验,记试验次数为n0.于是一个APD设计的总试验次数为n=n0+n1+n2.表1是一个有41次试验的APD设计,其中n0=5,n1=8,n2=28,n=41,即第一部分(试验号1-8)是一个8行的正交表,第二部分(试验号9-36)是第一部分的正交表中任意两行的平均,有28次试验.根据文[11],为了获得最高的D-效率,取α=1.比如第9次试验点即为第1个试验点和第2个试验点的平均,第36个试验点即为第7个试验点和第8个试验点的平均.第三部分(试验号37-41)是由5次原点处的试验构成.
表1 一个41次试验的APD设计,k=6试验号 1 2 3 4 5 6 1-1 1 -1 2-1 1 1 0 -1 1 3-1 -1 1 0 1 -1 4 1-1 -1 0 1 1 1 1 1 5-1 1 -1 -1 1 1 6 1-1 1 -1 -1 1 7-1 1 -1 -1 8-1 -1 -1 -1 -1 -1 1 1 9 0-1 -1 0 0 0.....................36 0 0 1 0 1 1 37 0 0 0 0 0 0.....................41 0 0 0 0 0 0
模型(1)可以写成矩阵形式,Y=XTβ+†,于是,信息矩阵M(d)=XTX/n的性质决定了参数估量量的好坏,其中D优良性是较常见的一种.D最优设计目的在于最大化信息矩阵的行列式|M(d)|,以提高估计精度.任一设计d在模型下都对应一个信息矩阵的行列式,记n行,k列的APD设计中,相应行列式最大的设计为ξ,相应的行列式记为
|M(ξ)|,则一个设计d的相对D-效率[2,3]定义为
其中p=(k+1)(k+2)/2,下面先给出有关矩阵行列式的若干引理,在第3节将借助这些行列式性质来讨论APD设计中的D-效率.其中引理2.1可以参加一般矩阵理论,引理2.2可以参见文[9].
引理2.1 令则有
其中,Ik为k阶单位矩阵,1k为元素全为1的k×1阶列向量,Jk为元素全为1的k阶方阵,c0,c为常数,diag(b1,···,bk)为对角线元素为b1,···,bk的对角矩阵. 引理2.2 假定两个非负定n×n阶矩阵A和B有如下分解,
其中A1和B1是两个m×m阶矩阵,则|A+B|≥|A2|·|A1+B1|.
§3 最优扩张配对设计
构造各类D最优设计是试验设计研究领域的重要内容之一.文[11]给出了在α=1时APD设计将对应最大的行列式,本节进一步在[11]的基础上探讨该类APD设计行列式的上下界,并给出一种达到上界的最优设计的构造方法.一个n1行,强度为2的,含有k个二水平列的正交表(orthogonal array)常记为OA(n1,2k,2).
定理3.1 (1)令d是一个基于正交表OA(n1,2k,2)的扩展配对设计,那么相应信息矩阵的行列式具有下界:
(2)对于基于正交表OA(n1,2k,2)的扩展配对设计,那么相应信息矩阵的行列式具有上界:
证 (1)任给一个APD设计d,令Xi=(1ni,Qi,Li,Bi),其中Qi,Li,Bi分别是二次项,线性项,交叉乘积项,i=1,2.由于APD设计d的二水平部分d1是一个正交表OA(n1,2k,2),于是有以及
容易证明如果APD设计的二水平部分是一个强度为3的正交表OA(n1,2k,3),则有=0.进一步地,如果二水平部分是一个强度为4的正交表OA(n1,2k,4),则有=0.对于二水平部分的任意两列,所有行可以被分成个组,其中每个组含有四个这样的有序对
数对,(1,1),(1,−1),(−1,1),(−1,−1).因此,对于二水平部分的任意两列,所有行元素可以分成个组,其中每组都含有如下四个有序配对,(1,1),(1,−1),(−1,1),(−1,−1).于是,对于一个配对扩张设计,包含如下有序配对:个有序对
和个有序对
于是,对于设计的扩张部分,X2=(1n2,Q2,L2,B2),有0,和
其中n2=令
由(5)和(6)可得
于是由引理2.2有
又由引理2.1,有
综上可得,
上式即为基于配对扩张设计的信息矩阵的行列式下界(3).
(2)容易发现矩阵bIq+B'1B1的每个对角元为n1+b,于是由式子(8)和Fischer不等式,有
上式即为信息矩阵行列式的上界(4).
注1 定理3.1给出了行列式的上界,由此可以给出设计的相对D-效率为
当设计的相对D-效率达到1时,则其一定是D最优APD设计.
注2 在定理3.1的配对扩张设计d中,若二水平部分是一个强度为4的正交表
OA(n1,2k,4),则有.容易验证,该设计在模型下的信息矩阵具有
上式表明相应设计的D-效率已达到最高,即Deff(d)=1.强度4的正交设计中,其二阶交互作用都是纯净的[14],但是试验次数显著增大.在文[9]中构造D最优OACD 设计时,同样得到了类似的结果,即当三水平正交表为强度4时(OA(n1,3k,4)),信息矩阵行列式达到上界,此时D-效率达到最高.
注3 下面对定理3.1中行列式|X'X|上下界的性质作补充说明.首先,由定理3.1中可知,该上界(4)和下界(3)的差为
其中,n1是二水平设计的试验次数,即n1≥4,显然该上下界的差值随着试验次数n1的增加而变大.
注4 在二阶模型下,设计的一般D效率定义为
其中p=(k+1)(k+2)/2.于是根据定理3.1,可以计算一般D效率的上下界,即为
表2给出了一些具体参数(试验次数,设计因子数)下的D效率上下界,从表中可以发现,一般D效率的最大值不再是1,其上下界之间有一定的差距,一般在0.1∼0.2之间,该上下界有效地体现了配对扩张设计的一般D效率值.
表2 部分参数下配对扩张设计的一般D效率上下界参数 Dlow Dupp n1=4 k=2 0 0.56 k=3 0 0.53 n1=8 k=3 0.32 0.44 k=4 0.27 0.43 k=5 0.25 0.41 k=6 0.23 0.41 k=7 0.21 0.40 n1=16 k=4 0.31 0.39 k=5 0.29 0.37 k=6 0.27 0.36 k=7
0.26 0.35 k=8 0.25 0.35 k=9 0.24 0.34 k=10 0.24 0.34 k=11 0.23 0.34 k=12 0.23 0.33 k=13 0.23 0.33 k=14 0.22 0.33 k=15 0.22 0.33
§4 结束语
研究各类设计的优良性及其构造是试验设计理论中比较困难的问题[2,3],本文给出了配对扩张设计(Augmented Pairs Designs)对应信息矩阵行列式的上下界,在此基础上讨论了相应的D最优设计,并给出了一种D最优配对扩张设计的构造方法.可以发现,此时配对扩张设计的试验次数较大,这对于D最优配对扩张设计的应用带来了不便,探讨试验次数较少的,交互作用混杂度[15]较小的近似最优配对扩张设计可以成为后面研究的课题.
致谢作者衷心感谢审稿人提出的宝贵建议.
参考文献:
【相关文献】
[1] Box G E P,Wilson K B.On the experimental attainment of optimum conditions[J].J Roy Statist Soc,Ser B,1951,13:1-45.
[2] Box G E P,Draper N R.Response Surfaces,Mixtures,and Ridge Analyses,2nd
edition[M].New York:Wiley,2007.
[3] Myers R H,Montgomery D C,Anderson-Cook C M.Response Surface
Methodology:Process and Product Optimization Using Designed Experiments,3rd
edition[M].New York:Wiley,2009.
[4] Gilmour S.Response surface designs for experiments in
bioprocessing[J].Biometrics,2006,62:323-331.
[5] Box G E P,Behnken D W.Some new three level designs for the study of quantitative variables[J].Technometrics,1960,2:455-475.
[6] Draper N R,Lin D K J.Small response-surface designs[J].Technometrics,1990,32:187-194.
[7] Morris M D.A class of three-level experimental designs for response surface modeling[J].Technometrics,2000,42:11-121.
[8] Xu Hongquan,Jaynes J,Ding bining two-level and three-level orthogonal arrays for factor screening and response surface exploration[J].Statistica
Sinica,2014,24:269-289.
[9] Zhou Yongdao,Xu posite designs based on orthogonal arrays and definitive screening designs[J].Journal of the American Statistical Association,2017,112:1675-1683.
[10]Zhang Xueru,Qi Zhongfeng,Zhou Yongdao,et al.Orthogonal-array Composite Design for the Third-Order Models[J].Commun Statist Theor Meth,2018,14:3488-3507.
[11]Fang Kaitai,Mukerjee R.Optimal selection of augmented pairs designs for response surface modeling[J].Technometrics,2004,2:147-152.
[12]Ahmad T,Akhtar M,Gilmour S G.Multilevel augmented pairs second-order response surface designs and their robustness to missing data[J].Commun Statist Theor
Meth,2012,41:437-452.
[13]Chen Xueping,Guo Bing,Liu Minqian.Robustness of orthogonal-array based composite designs to missing data[J].J Statist Plann Infer,2018,194:15-24.
[14] 马海南,陈雪平.直积表中的纯净两因子交互作用[J].高校应用数学学报,2013,28(3):287-291.
[15]Chen Xueping,Lin Jinguan,Chen Xuanqing,et al,Matrix image method for ranking nonregular fractional factorial designs[J].Acta Math Appl Sinica,2018,4:742-751.。

相关文档
最新文档