回归正交试验设计

合集下载

第七章 回归正交试验设计

第七章  回归正交试验设计
因素进行考察,并考虑交互作用x1x2、 x1x3。已知x1=300~700 ℃, x2=1800~2400℃,x3=8~10mA。试通过回归正交试验确定吸光度与三
个因素之间的函数关系。
因素水平编码表
自然变量xj 规范变量zj 1 -1 0 △j x1 700 300 500 200 x2 2400 1800 2100 300 x3 10 8 9 1
7.1.2一次回归方程的建立
设总的试验次数为N,其中原正交表所规定的二水平试验次数为 mc,零水平试验次数为m0,即有: N 建立回归方程
m
mc m0
ˆ a b j x j bkj xk x j,k 1,2,, m 1( j k ) y
j 1 k j
其系数的计算公式如下:
将被剔除变量的偏回归平方和、自由度并入到剩余平方和与自由度中,
然后再进行相关的方差分析计算。具体例子见书P126~129例8-1。
7.1 一次回归正交试验设计及结果分析
14
用石墨炉原子吸收分光光度计法测定食品中的铅,为提高吸光度,
对x1(灰化温度/℃)、x2(原子化温度/℃)和x3(灯电流/mA)三个
F0.05(1,6)=5.99 F0.01(1,6)=13.74
可见因素z2对指标影响高度显著,所建的回归方程高度显著:
y 0.50475 0.03375z2
7.1 一次回归正交试验设计及结果分析
N 1 SST Lyy ( yi y ) 2 yi2 ( yi ) 2 N i 1 i 1 i 1 N N
7.1 一次回归正交试验设计及结果分析
10
②一次项zj偏回归平方和
SS j m b ,j= 1 , 2, ,m

第七章-回归正交试验设计

第七章-回归正交试验设计

例7-1:用石墨炉原子吸收分光光度计测定食品中 的铅,为提高测定灵敏度,希望吸光度(y)大。为 提高吸光度,讨论了x1(灰化温度/℃), x2(原子化 温度/℃)和 x3 (灯电流/mA)三个因素对吸光度的影 响,并考虑交互作用x1x2 , x1x3 。已知x1= 300~700℃, x2=1800~2400℃,x3=8~10mA。 试通过回归正交试验确定吸光度与三个因素之间
指标(y)与m个试验因素x1,x2,…,xm之间的一次回归
方程:
m
yˆ a bj x j
bkjxk x j , k 1,2,..., m 1( j k)
j 1
k j
例:m=3时,一次回归方程: y=a+b1x1+b2x2+b3x3+b12x1x2+b13x1x3+b23x2x3
➢ 其中x1,x2,x3表示3个因素;x1x2,x1x3,x2x3表示交互作用 ➢ 若不考虑交互作用,为三元一次线形回归方程:
➢ 根据偏回归系数的正负,得到各因素对试验指标 的影响方向
(4)方差分析
SST
n i 1
yi2
1( n n i1
yi )2
2.049044
4.0382 8
0.010864
SS1 mcb12 8 0.009752 0.000761
SS2 mcb22 8 0.033752 0.009113
0.010741
SSe SST SSR 0.010864 0.010741 0.000123
(4)方差分析
dfT=n-1=8-1=7 df1=df2=df3=1 df12=df13=1 dfR=df1+df2+df3+df12+df13=1+1+1+1+1=5 dfe=dfT-dfR=7-5=2 MS1=SS1/df1=0.000761 MS2=SS2/df2=0.009113 MS3=SS3/df3=0.000265 MS12=SS12/df12=0.000181 MS13=SS13/df13=0.000421 MSR=SSR/dfR=0.010741/5=0.002148 MSe=SSe/dfe=0.000123/2=0.000062 F1=MS1/MSe=0.000761/0.000062=12.27 F2=MS2/MSe=0.009113/0.000062=146.98 F3=MS3/MSe=0.000265/0.000062=4.27 F12=MS12/MSe=0.000181/0.000062=2.92 F13=MS13/MSe=0.000421/0.000062=6.79 FR=MSR/MSe=0.002148/0.000062=34.65

EXCEL和SPSS在回归分析、正交试验设计和判别分析中的应用

EXCEL和SPSS在回归分析、正交试验设计和判别分析中的应用

2) 将分组变量和自变量放入格子的列表里,如图所示,上面的是分组变量,选 择”分类”,下面的是自变量,我们看到这里有个自变量: 舒张压和胆固醇。
3) 点击分组变量文本框, 然后点击定义范围按钮, 由于我们的数据是两分类的, 分别为 1 和 2,设置如下图:
4) 点击统计量按钮,将 Box’s M 和 fisher 项打勾。如下图,点击继续回到判别分 析主界面。点击确定,即可出现分析结果。
能力评分(1-100) ;X2:病人年龄;X3:由诊断到进入研究时间(月) ;X4:肿 瘤类型 (“0”表示鳞癌、 “1”表示小型细胞癌、 “2”表示腺癌、 “3”表示大型细胞癌) ; X5: 两种化疗方法 (“1”表示常规、 “0”表示实验新法) ; Y: 病人的生存时间 (“0”: 表示生存时间短,即生存时间小于 200 天;“1”:表示生存时间长,即生存时间 大于或等于 200 天。 )根据上述分析流程对数据进行分析。
W1=8.294X1+8.055X2-72.740 W2=6.930X1+6.287X2-49.231 若有个样本的舒张压和胆固醇分别为:13.33(X1)和 5.96(X2),带入上述两个判别 式可知 W1=85.82682,W2=80.61642,W1>W2 属于分类 1。
习题:1991 年全国各省市区城镇平均消费情况如 data.xls 的 Sheet7 所示,是判 别以下上海和西藏的归属类,数据见 sheet8。
系的。图 c 中的 Coefficients 为回归方程的系数,因此,回归结果为 y= — 285.0094+1.5598x1+03145x2, 在使用面积不变的情况下, 地产估价每增加 1 万元, 房产销售的平均价格就会提高 1.5598 万元;在房地产估价不变的条件下,使用 面积每增加 1 平方米, 房产销售的平均价格就会提高 0.3145 元; 图 a 中 Adjusted R Square 为调整复测定系数,本例中约为 0.71,它表示两个变量 x1,x2 对导致结 果 y 的贡献,也就是说还有导致结果 y 的原因中有 29%是由除了 x1,x2 以外的因 素造成的。 习题:在黄芪提取工艺的研究中,选择了前煮时间、煎煮次数和加水量进行考 察,实验数据见 data.xls 的 Sheet3,试对实验数据进行多元线性回归,对结果进 行讨论。

一次回归正交设计、二次回归正交设计、二次回归旋转设计说明

一次回归正交设计、二次回归正交设计、二次回归旋转设计说明

一次回归正交设计、二次回归正交设计、二次回归旋转设计说

一次回归正交设计是一种广泛应用于实验设计中的设计方式,该设计最基本的特点是每一个自变量只考虑一次。

这种设计方法可以通过排列组合的方式得到各种不同的设计方案,使得实验者可以通过设计来达到用最少的实验次数获取尽可能多的信息的目的。

一次回归正交设计在实验设计中被广泛使用,尤其在化学制药、工业生产等领域得到了广泛运用。

二次回归正交设计是一种基于一次回归正交设计的设计方式,这种设计方式可以进一步增加实验信息的获取。

在二次回归正交设计中,依然按照一次正交设计的方式来设计实验,但是在每个单独的自变量上,提高对其的测量次数,使得对这些自变量的测量更加准确。

同时,在某些需要深入探究的因素上,可以通过将这些因素的实验次数进一步提高,来获取相关信息。

二次回归旋转设计是一种在二次回归正交设计的基础上发展而来的设计方式。

在二次回归旋转设计中,实验者可以通过旋转矩阵来达到实验变量间的协方差为0的目的。

这样可以在保证基本信息获取的同时,增加获取高阶信息的可能性。

旋转设计特别适合于需要同时考虑多个变量的实验设计,可以使各个变量之间更加独立,减少不必要的干扰。

总的来说,在实验设计领域中,三种设计方法各自有着各自的优势。

对于需要更精准的信息获取的实验,应该选择更高阶的设计方法,在更基础的实验中则可以选择更为简单的设计方法。

另外,在选择设计方法的过程中,还应该根据实验具体情况灵活选择,使得实验设计更加科学合理。

正交试验设计

正交试验设计

正交试验设计
正交试验设计(Orthogonal experimental design)是一种常用于科学实验设计的方法。

它是统计学中一种重要的试验设计方法,通过选择合适的正交表将试验因素进行组合,以达到最大程度地减少误差和提高效率的目的。

正交实验设计最常见的类型是正交数组设计(Orthogonal array design),通过正交表将试验因素的各个水平进行组合,以实
现均匀分布和互不干扰的目的。

这种设计方法可以帮助确定影响结果的主要因素,找出最优的处理条件,并提高试验的可信度和重复性。

正交试验设计的特点之一是可以通过相对较少的实验次数得出准确的结果。

它通过最小化不相关的因素,使试验结果更易于解释和分析,并避免重复实验浪费资源和时间。

正交试验设计还可以通过分析试验结果和误差分布,确定主要影响因素的重要性和交互作用的效应。

通过建立数学模型和进行回归分析,可以进一步优化试验结果,并提高产品的质量和效率。

正交试验设计广泛应用于工程、制造、化学、医药等领域。

它可以帮助确定最佳工艺参数、产品配方、药物剂量等,并优化生产过程、提高产品质量和效率。

它还可以用于新产品开发、工艺改进、质量控制等方面。

正交试验设计的成功关键一是正确选择试验因素和水平,确保
能够覆盖全部可能的条件。

另外,正确解读试验结果、分析影响因素的相对重要性和相互作用也是至关重要的。

总之,正交试验设计是一种有效的实验设计方法,可以在较短的时间内得出准确的结果,并提供优化产品和工艺的参考依据。

它具有广泛的应用前景,并在工程和科学研究中发挥着重要的作用。

第七章 回归正交设计

第七章 回归正交设计

y 26. 9 28. 3 28. 7 28. 9 29. 6 30. 0 30. 4
y2 723. 61 800. 89 823. 69 835. 21 876. 16 900. 00 924. 16
l iy

k
2
(k ) yk
14.8 28 0. 5286 7.823 1
y 202 .8
输出结果:
The SAS System 16:19 Monday, August 12, 2006 5 The ORTHOREG Procedure Dependent Variable: y Source DF Sum of Squares Mean Square F Value Pr > F 0.0083
2 z (1 ) ˆ 0 . 4762 y 4 12 z 140 2 15 . 961 0 . 8357 z 0 . 011905 z .
SAS操作
求指标对因素的多项式回归可以由SAS轻松地完成: 当自变量(因素)等间距取值时, 变换公式 新变量(可看成水平序号)=(原变量-左端点)/步长+1
方差来源 平方和 自由 度
1 1 p 1
平均平 方和
b1 l 1 y b2l 2y b p l py
F
显 著 性
b1l 1 y 一次 1 (x ) b l 2 2y 一次 2 (x ) Sr 回归 p次 p ( x ) b p l py
0. 035 8. 314
1 1 4 1 1
2 6
447 . 03 10 .86 7 . 71 7 . 49
**
(*)
残差 Se 总和 lyy

正交回归设计(2)

正交回归设计(2)

2.检验一次方程的合适性 为了了解是否存在因子间的交互作用,是否有因子的高次效 应,在中心点进行了m=5次试验,结果为: 40.3,40.5,40.7,40.2,40.6 5 其平均值为 y 0 40.46 ,偏差平方和为 S0 ( y0i y0 ) 2 0.172 , i 1 其自由度=4。 采用方法1中的检验统计量t作检验。 ˆ 0 40.425, y 0 40.46 , 现在 y
最后再将编码式
2 206 .23 14 .338 x 2 21 .818 x12 35.868 x 2
x1
F 250 A 3.5 ,x2 109 1.74
代入,即可得y关于F,A的二次回归方程: ˆ 86.5547 1.0497 F 0.0018 F 2 82.9291 A 11.8470 A 2 y 为延长寿命,可以将回归方程对F与A分别求导,并令 其为零以解出最佳水平组合为F=291.58,A=3.50,在该水 平组合下,平均寿命的估计是211.6。
2 2
0 0 0 0

0 0
这里mc=4,2p=4,则n=mc+2p+m0=8+m0,再记
h 4 2 2
f 4 2 4
那么
n 0 0 X X 0 h h 0 0 h 0 0 h 0 0 0 0 0 0 0 0 0 h 0 0 0 f mc h 0 0 0 mc f
1 1 1 1 1 1 1 1 1 X 1 1 0 1 0 1 0 1 0 1 1 1 1 0 0 1 1 1 1 0 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 2 2 0 0

正交试验设计及结果分析

正交试验设计及结果分析

正交试验设计及结果分析正交试验设计(Orthogonal design)是一种组织实验研究的方法,通过在有限的试验条件下,系统地研究多个影响因素及其之间的相互作用,以得出客观科学的结论。

本文将介绍正交试验设计的基本原理、优势以及结果分析的方法。

正交试验设计的基本原理是通过对因素和水平的选择进行系统设计,使实验的观测结果具有统计意义,并能准确地区分不同因素对结果的影响。

正交试验设计的特点是因素之间相互独立,通过合理的分配和排列,能够明确地检验各个因素的主效应、交互效应以及误差效应。

正交试验设计的主要目的是全面、有效地获取实验结果,以便进行相应的数据分析和参数估计。

正交试验设计的优势在于可以在较小的试验规模和资源成本的情况下,获得较精确的试验结果。

由于因素之间相互独立,可以通过较少的试验次数得到充分的信息,从而快速筛选出有意义和重要的因素及其相应的水平。

同时,正交试验设计还能在实验中考虑因素之间的交互作用,从而更准确地预测实际情况下的因素效应。

进行正交试验设计时,首先需要确定所研究问题的因素和水平。

然后,根据所选因素和水平的数量确定试验矩阵的大小和形状。

通常采用正交设计表的方法对试验矩阵进行构造,以保证各个因素和水平的均衡和合理分布。

在实验过程中,根据设计要求,进行不同因素和水平的试验组合,记录并整理实验数据。

对正交试验设计的结果进行分析时,需要根据研究目的选择适当的统计方法。

主要包括方差分析、回归分析、均方差分解等方法。

通常可以采用多因素方差分析(ANOVA)方法,评估各个因素和水平对结果的影响程度,并检验各个因素的显著性。

此外,还可以进行主效应和交互效应的分析,了解各个因素之间的相互作用情况。

通过分析结果,可以确定主要因素和水平,为后续实验和优化提供参考。

总之,正交试验设计是一种有效的设计和分析方法,能够在较小的试验规模和资源成本下,获取较精确的实验结果。

通过合理选择因素和水平,并进行系统的设计和分析,能够全面地了解各个因素对结果的影响,为实际问题的解决提供科学依据。

回归正交试验设计

回归正交试验设计

z
2
20 10
,x3
z3 0.2 0.1
通过上述变换后,编码空间为中心在原点的立方体,其边
长为2。 在后面我们将会看到,在编码时,有时立方体的边长可以
大于2。
2020/7/18
试验设计与数据处理
20
今后称x (x1, x2 ,, xp ) 的可能取值的空间为编码空间。我们可以 先在编码空间中寻找一个点x0使E(y)满足质量要求,然后通过 编码式寻找到z0。
y b0
bjzj
b
jj
z
2 j
bij zi z j
j
j
i j
为y关于 z1, z2 ,, z p 的多项式回归方程。
2020/7/18
试验设计与数据处理
5
在实际中常用的是如下的一次与二次回归方程(也称一阶 与二阶模型):
yˆ b0 bj z j
j
yˆ b0
bjzj
b jj
著性之前,先对y 的期望是否是 x1, x2 ,, x p的线性函数进行检
验,这种检验称为失拟检验,它要检验如下假设:
H0: Ey 0 1x1 p x p
H1: Ey 0 1x1 p xp 当在 (xi1, xi2 ,, xip )上有重复试验或观察时,将数据记为
(xi1 ,
xi2 ,,
2020/7/18
试验设计与数据处理
21
§7.2 一次回归正交设计 7.2.1 一次回归正交设计
建立一次回归方程的回归设计方法有多种,这里介绍一种常
用的方法,它是利用二水平正交表来安排试验的设计方法。 其主要步骤如下: 1.确定因子水平的变化范围
设影响指标y的因子有p个 z1, z2 ,, z p ,希望通过试验建立y

正交试验设计方法详细步骤

正交试验设计方法详细步骤

正交试验设计方法详细步骤正交试验设计方法(Orthogonal experimental design)是一种常用的实验设计方法。

它通过对各因素进行全面的、系统的、经济的检测和试验,确定各因素对结果的影响程度,并找出最优的因素组合,以达到降低产品变异性、提高产品质量和生产效率的目的。

本文将详细介绍正交试验设计方法的步骤。

一、确定试验因素和水平在进行正交试验设计之前,首先需要确定试验因素及其各水平。

试验因素是影响实验结果的各个变量,例如温度、压力、时间等。

每个试验因素可以有多个水平,比如低水平和高水平。

在确定试验因素和水平时,需要考虑实际情况和试验的目的。

二、确定正交表确定试验因素和水平后,需要选择合适的正交表来设计试验。

正交表是用于安排试验的一种工具,可以保证各个试验因素在设计中被充分考虑。

常用的正交表有L9、L12、L16等。

选择正交表时需要考虑试验因素的数量和水平个数,以及实验所能容忍的误差。

三、设计试验方案设计试验方案时,需要根据所选正交表,将试验因素和水平组合起来,形成实验方案。

确保每个水平都得到了充分的考虑和试验。

在设计试验方案时,需注意避免水平间的过大差异,以防止试验结果受到干预。

四、进行实验根据设计好的试验方案,开始进行实验。

在实验过程中,需要准确记录每个因素水平对应的结果数据,以便后续分析和处理。

五、数据分析和处理实验数据收集完毕后,需要对数据进行分析和处理。

常用的数据分析方法包括方差分析、回归分析等。

通过数据分析,可以得到各个因素对结果的影响程度,找出主要影响因素,并确定最优的因素组合。

六、优化因素组合根据数据分析结果,可以进一步优化试验因素的组合。

通过确定最优的因素组合,可以提高产品的质量和效率,降低产品的变异性。

七、验证实验结果在优化因素组合之后,需要进行验证实验,以验证优化结果的有效性和可行性。

验证实验的目的是确保所得到的最优组合在不同条件下仍然有效。

八、总结和应用最后,根据实验结果和验证结果,总结正交试验设计的步骤和方法,并将其应用到实际生产和工程中。

第5章 回归正交试验设计

第5章 回归正交试验设计
本例中,零水平试验次数m0=3,进行失拟行检验。
第一节 一次回归正交试验设计
(4)失拟性检验
本例中,零水平试验次数m0=3,进行失拟行检验。
FLf

SSLf / dfLf SSe1 / dfe1

0.0963/ 5 0.00667/ 2

5.775

F0.1(5,2)

9.29
表明失拟不显著,回归模型与实际情况拟合得很好。
第一节 一次回归正交试验设计
4 回归方程及偏回归系数的方差分析 4.1 无零水平试验 4.1.2 计算自由度
第一节 一次回归正交试验设计
4 回归方程及偏回归系数的方差分析 4.1 无零水平试验 4.1.3 计算均方
MSj

SS j df j
MSkj

SSkj dfkj
j k,k 1,2,...,(m 1)
n i 1
yi

y
n
z ji yi
bj

i 1
mc
n
(zk z j )i yi
bkj i1 mc
j k,k 1,2,...,(m 1)
第一节 一次回归正交试验设计
3 一次回归方程的建立 通过计算得到回归系数之后,可以直接根据它们绝对值的大
小来判断各因素和交互作用的相对重要性,而不用转换成标准 回归系数。
n
z ji 0
i 1
n
z ji zki 0 ( j k )
i 1
这些特点说明了转换之后的正交表同样具有正交性。
第一节 一次回归正交试验设计
2.4 试验方案的确定
确定试验方案时,将规范变量zj安排在一次回归正交编码表 相应的列中,即进行表头设计。

3-回归正交组合试验设计

3-回归正交组合试验设计

试验号
1 2 3 4 5 6 7 8 9 … N
3.2 一次回归正交设计及统计分析
表3-2 3元一次回归正交设计试验方案
1 x1 (Z1)
1 (17)
1 (17)
1 (17)
2 x2 ( Z2 )
1 (22.6)
1 (22.6)
-1 (9.4)
4 x3 ( Z3 )
1 (45.7)
-1 (24.3)
x1m1x1m
x2 m1 x2 m
xNm1xNm
3.2 一次回归正交设计及统计分析
记: Y=(y1,y2,…,yN)′ β=[β0,β1, β2,… , βm , β12 , β13 , …, β(m-1)m]′ ε=(ε1,ε2,…,εN )′
则(3-4)的矩阵形式为:
Y = X β +ε
… 0 (12)
x2 ( Z2 )
1 (22.6) 1 (22.6) -1 (9.4) -1 (9.4) 1 (22.6) 1 (22.6) -1 (9.4) -1 (9.4) 0 (16)
… 0 (16)
x3 ( Z3 )
1 (45.7) -1 (24.3) 1 (45.7) -1 (24.3) 1 (45.7) -1 (24.3) 1 (45.7) -1 (24.3)
③ 原正交表经过上述代换,其交互作用列可以直接从表中相应 几列对应元素相乘而得到。因此原正交表的交互作用列表也就不用 了,这一点较原正交表使用更为方便。
④ 在具体进行设计时,首先将各因素分别安排在所选正交表相应 列上,然后将每个因素的各个水平填入相应的编码值中,就得到了 一次回归正交设计方案。
3.2 一次回归正交设计及统计分析
3 回归正交组合试验设计

第四节 二次回归正交设计

第四节  二次回归正交设计

第四节二次回归正交设计在应用一次回归正交设计时,如果经过假设检验,发现一次回归方程不合适,就需要用二次或更高次回归方程描述。

通常情况下,使用二次回归一般即可满足要求。

一、二次回归正交试验的组合设计方法二次回归设计就是采用二次多项式作为回归方程。

当变量数为P 时,二次回归模型的一般形式为(3-3-18) 在二次回归模型中,共有q个待估计参数因此,要建立有p个变量的二次回归方程,试验次数应大于q。

而且为了估计未知参数,每个变量所取得的水平不应小于3。

在三水平上做p个变量的全因素试验,试验次数为3p。

当p=4时,三水平的全因素试验次数数量是81次,比p=4时的二次回归系数要多4倍以上,以致剩余度过大。

为了有效地减少不必要的试验次数,提出一种组合设计法。

这种方法是在因素空间中选择几类具有不同特点的点,把它们适当组合成为一个试验计划,此计划应尽量减少试验次数,并且有正交性。

以p=2为例,在有两个变量x1,x2场合下,组合设计由以下9个试验点组成(见表3-3-13):表3-3-13这9个试验点在平面图上的位置如图3-3-2所示。

图3-3-2当p=3,即有三个变量时,组合设计由15个试验点组成,见表2-14。

这15个试验点在空间的位置,如图3-3-3所示。

表3-3-14一般地,p个变量的组合设计由下列三类试验点组成:第一类点为二水平(-1和1)全因素试验的试验点,这类试验点共有2p个,如果采用1/2或1/4 实施法,则为2p-1或2p-2个试验点。

第二类点为分布在p个坐标轴上的星号点,这类试验点共有2p个,它们与中心点的距离为,称为星号臂。

是待定系数,可根据不同的要求确定值。

第三类试验点为中心点,即各变量都取零水平的试验点。

在中心点上的试验可以只做一次,也可以重复做若干次。

若以N0表示第一类试验点个数,以m0表示第三类试验点个数,则p个变量的组合设计试验点数N为:N=N0+2p+m0用组合设计安排的试验计划有一系列优点:首先,它的试验点比三水平的全因素试验少得多,但仍保持足够的剩余度。

一次回归正交设计、二次回归正交设计、二次回归旋转设计说明

一次回归正交设计、二次回归正交设计、二次回归旋转设计说明

一次回归正交设计某产品的产量与时间、温度、压力和溶液浓度有关。

实际生产中,时间控制在30~40min,温度控制在50~600C,压力控制在2*105~6*105Pa,溶液浓度控制在20%~40%,考察Z1~Z2的一级交互作用。

因素编码Z j(x j) Z1/min Z2/o C Z3/*105Pa Z4/%下水平Z1j(-1)30 50 2 20上水平Z2j(+1)40 60 6 40零水平Z0j(0)35 55 4 30变化间距 5 5 2 10编码公式X1=(Z1-35)/5 X2=(Z2-55)/5X3=(Z3-4)/2 X4=(Z4-30)/1选择L8(27)正交表因素x1,x1,x3,x4依次安排在第1、2、4、7列,交互项安排在第3列。

试验号X0 X1(Z1) X2(Z2) X3(Z3) X4(Z4) X1X2 Yi1 1 1 1 1 1 1 9.72 1 1 1 -1 -1 1 4.63 1 1 -1 1 -1 -1 10.04 1 1 -1 -1 1 -1 11.05 1 -1 1 1 -1 -1 9.06 1 -1 1 -1 1 -1 10.07 1 -1 -1 1 1 1 7.38 1 -1 -1 -1 -1 1 2.49 1 0 0 0 0 0 7.910 1 0 0 0 0 0 8.111 1 0 0 0 0 0 7.4 Bj=∑xjy 87.4 6.6 2.6 8.0 12.0 -16.0aj=∑xj2 11 8 8 8 8 8bj = Bj7.945 0.825 0.325 1.000 1.500 -2.00/aj393 5.445 0.845 8.000 18.000 32.000Qj =Bj2 /aj可建立如下的回归方程。

Y=7.945+0.825x1+0.325x2+x3+1.5x4-2x1x2显著性检验:1、回归系数检验回归关系的方差分析表变异来源SS平方和Df自由度MS均方F显著水平x1 5.4451 5.44576.250.01 x20.84510.84511.830.05 x38.00018.000112.040.01 x4 18.000118.000252.100.01 x1x2 32.000132.000448.180.01 回归64.29 5 12.858180.080.01 剩余0.357 5 0.0714失拟0.097 3 0.0323 0.25 <1 误差e 0.2620.13总和64.64710经F检验不显著的因素或交互作用直接从回归方程中剔掉,不必再重新进行回归分析。

回归正交试验设计

回归正交试验设计

规范变量z 规范变量 j 上星号臂γ 上星号臂 上水平1 上水平 零水平0 零水平 下水平-1 下水平- 下星号臂- 下星号臂-γ 变化间距 变化间距 j
②确定合适的二次回归正交组合设计 参考表8-22 参考表
正交表的选用 因素数m 因素数 2 3 4(1/2实施) ( 实施 实施) 4 5(1/2实施) ( 实施 实施) 5 选用正交表 L4(23) L8(27) L8(27) L16(215) L16(215) L32(231) 表头设计 1,2列 , 列 1,2,4列 , , 列 1,2,4,7列 , , , 列 1,2,4,8列 , , , 列 1,2,4,8,15列 , , , , 列 1,2,4,8,16列 , , , , 列 mc 22= 4 23= 8
(3)回归方程的建立 ) m0=0,n=mc=8 , = 计算表 计算各回归系数 写出y与规范变量 写出 与规范变量zj的回归方程 与规范变量 根据偏回归系数绝对值大小, 根据偏回归系数绝对值大小,确定因素和交互作用主次 根据偏回归系数正负, 根据偏回归系数正负,得到各因素对试验指标的影响方向 (4)方差分析 ) 与自然变量x (5)回归方程的回代:得到试验指标 与自然变量 j的回归 )回归方程的回代:得到试验指标y与自然变量 方程
1 m0 SSe1 = ∑ ( y0i y 0 ) 2 = ∑ y0i2 (∑ y0i ) 2 m0 i =1 i =1 i =1
m0
m0
重复试验误差的自由度: 重复试验误差的自由度: ②回归方程失拟部分: 回归方程失拟部分: 失拟平方和 :
df e1 = m0 1
SS Lf = SST SS R SS e1 = SS e SS e1
回归平方和 : SS R = ∑ SS 一次项 + ∑ SS 交互项 残差平方和 :
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

回归正交试验设计一、概述(1)回归分析与正交试验设计的主要优缺点回归分析的主要优点是可以由试验数据求出经验公式,用于描述自变量与因变量之间的函数关系。

它的主要缺点是毫不关心试验数据如何取得,这样,不仅盲目地增加了试验次数,而且试验数据还往往不能提供充分的信息。

因此,有些工作者将经典的回归分析方法描述成:“这是撒大网,捉小鱼,有时还捉不到鱼”。

所以说,回归分析只是被动地处理试验数据,并且回归系数之间存在相关关系,若从回归方程中剔除某个不显著因素时,需重新计算回归系数,耗费大量的时间。

正交试验设计的主要优点是科学地安排试验过程,用最少的试验次数获得最全面的试验信息,并对试验结果进行科学分析(如方差分析),从而得到最佳试验条件,但是它的主要缺点是试验结果无法用一个经验公式来表达,从而不便于考察试验条件改变后,试验指标将作如何变化。

(2)回归正交试验设计回归正交试验设计,实际上就是将线性回归分析与正交试验设计两者有机地结合起来而发展出的一种试验设计方法,它利用正交试验设计法的“正交性”特点,有计划、有目的、科学合理地在正交表上安排试验,并将试验结果用一个明确的函数表达式即回归方程来表示,从而达到既减少试验次数、又能迅速地建立经验公式的目的。

根据回归模型的次数,回归正交试验设计又分为一次回归试验设计和二次回归试验设计。

二、一次回归正交试验设计(一)一次回归正交试验设计的概念一次回归设计研究的是一个因素z (或多个因素z 1,z 2,……)与试验指标y 之间的线性关系。

当只研究一个因素时,其线性回归模型:y =β0+β1z +e (1)其回归方程为:z y ∧∧∧+=10ββ (2)式中∧0β、∧1β称为回归系数,e 是随机误差,是一组相互独立、且服从正态分布N(0,σ2)的随机变量。

可以证明,∧0β、∧1β和∧y 是β0、β1和y 的无偏估计,即E(∧0β)=β0,E(∧1β)=β1,E(∧y )=y一次回归正交试验设计是通过编码公式x =f(z) −− 即变量变换,将式(2)变为:x b b y 10+=∧(3)且使试验方案具有正交性,即使得编码因素X的各水平之和为零:∑==mi ix1(4)式中m 是因素x 的水平数。

在回归分析中,回归系数的计算公式为:x b y b 10-=xxxy l l b =1 (5)式中:∑==Ni i y Ny 11, ∑==Ni ixN x 11∑∑∑===-=-=Ni Ni Ni i i i xxx N x x x l 112122)(1)((6)∑∑∑∑====-=--=N i Ni Ni iN i i i i i i xyyx N y x y y x x l 11111))((式中:xx l —— x 偏差平方和;xy l —— x 偏差与y 偏差的乘积之和N—— 试验总数因此,在一次回归正交试验设计中,由于试验方案具有正交性,则有:y b =0∑∑===N i i Ni ii x yx b 1211 (7)(∑∑===⇒=m i Ni i i x x 11,00 ∵正交表各水平的出现次数相同!)显然,回归正交试验设计大大简化了计算,同时,编码因素x 的水平数一般不大于3,使试验方案制定的目的性明确,便于安排试验,可减少试验次数。

(二)回归正交试验设计的一般步骤1、确定因素的变化范围,对因素水平进行编码如前所述,回归正交试验设计的基本点是,利用正交试验设计安排试验,运用回归分析方法处理数据,从而减少试验次数,迅速得到回归方程。

而连接这两种方法的“桥梁”是对因素的水平进行编码。

试验前,每个因素各水平的取值,必须满足编码的要求,数据处理时才能大大简化计算。

因此,编码是回归正交试验设计的关键环节,也是回归正交试验设计与一般的正交试验设计的主要区别。

所谓因素的水平编码,就是对因素水平的取值作适当的线性变换,构造因素水平与“编码”的一一对应关系,编码后,使因素各水平变换成最简单的整数字码,如-1,+1;-1,0,+1;等等。

通过编码使计算大大简化。

欲研究p 个因素z 1,z 2, …, z p 与指标y 的数量关系,须先要确定它们的变化范围。

对因素z j ,用z 1j 和z 2j 分别表示其变化的下界值与上界值,即因素z j 的变化区间为[z 1j ,z 2j ]。

若试验在z 1j 和z 2j 上进行,则分别称z 1j 和z 2j 为因素的下水平(用-1表示)和上水平(用+1表示),并称它们的算术平均值:)(2121j j oj z z z += (8)为因素的基准水平或零水平(用O 表示),而称它们差值的一半:)(2112j j j z z -=∆ (9)为因素的变化区间。

为使具有正交性,须对因素z j 作线性变换,即令:jjj j z z x ∆-=0 (10)将式(8)和式(9)代入式(10),得: jj j j j j z z z z z x 1221)(2-+-=或者1)(2122+--=jj j j j z z z z x(11)显然,当z j =z 1j 时,x j =x 1j =-1;当z j =z oj 时,x j =x oj =0; 当z j =z 2j 时,x j =x 2j =+1.于是,因素的水平值z j 与编码x j ,建立了一一对应的关系。

通常,因素的水平编码多在表格上进行,如表1所示。

表1 因素水平编码表通过编码,y对变量z1,z2,…,z p的回归问题就转化为y对变量x1, x2, …, x p的回归回题。

因此,可以在以x1, x2, …, x p为坐标轴的编码空间选择试验点,进行试验设计与回归分析。

这时,回归系数的计算变得十分简单[见式(7)]。

2、选择合适的正交表一次回归正交试验设计,一般选L n(m k)型等水平正交表,如L4(23)、L8(27)、L12(211)、L9(34)、L27(313)等二水平或三水平正交表。

为符合对因素进行编码的需要,对2k型(二水平)正交表,将表中的1、2分别用-1、+1代换;对3k型(三水平)正交表,将表中的1、2、3分别用-1、0、+1代换;对4k型(四水平)正交表,将表中的1、2、3、4分别用-2、-1、+1、+2代换;等等。

经过变换后,正交表中的-1、+1、-2、+2等既表示因素水平,又表示因素水平变化的数量大小。

同时,交互作用列可直接由表中相应元素列的对应水平相乘得到,故原交互作用列表失去作用。

显然,变换前后的两种正交表之间并无本质差别,故仍用原符号L4(23)、L8(27)等表示。

变换后的二水平正交表L4(23), 如表2所示。

表2 L4(23)3、回归系数的计算设p 个变量x 1, x 2,…, x p 与y 之间存在线性相关关系,y =0β + 1βx 1 +2βx 2 + … +p βx p + e (12)式中随机误差e 相互独立,且e ~ N(0,2σ)。

若用正交试验法做N 次试验,则有i ip p i i i e x x x y +++++=ββββ 22110 (13)(i=1,2,…,N ) 其结构矩阵为:⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=Np N N p p x x x x x xx x x X ...1......1 (12)12222111211(14)对于L n (2k )型二水平正交表,上式中的x ij 均为 +1或 -1(i=1,2, …,N;j=1,2, …,p )。

因为回归正交试验设计满足正交性要求,故矩阵Ⅹ中除常数列(即第1列)外,任何一列元素之和为零;任两列对应元素的乘积之和为零;任一列的平方和为N ,即:⎪⎪⎪⎭⎪⎪⎪⎬⎫==≠====∑∑∑===),...,2,1(,),,...,2,1,(,0),...,2,1(,01211p j N x j i p j i x x p j x Nk kj Nk kj ki Nk kj(15)信息矩阵(即系数矩阵)为A = X ’X = ⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡∑∑∑===N NNN x x xN Nk kp Nk k Nk k 12122121(16) 相关矩阵为:C = A -1 = ⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡N N N 111(17)由上可见,因为回归正交试验设计具有正交性特点,所以信息矩阵和相关矩阵都是对角矩阵,这使计算工作量大大减少。

常数项矩阵为:⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡=⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛==∑∑∑∑====p N k k kp N k k k N k k k N k k B B B B y x y x y x y Y X B 210112111' (18) 于是参数β的最小二乘估计b=A 1-B ,即b 0=,110y yNN B Nk k==∑=()p j y x N N B b Nk k kj jj ,...,2,1,11===∑= (19) ∴ 回归方程为:p p x x x y ∧∧∧∧∧++++=ββββ (22210)=p p x b x b x b b ++++...22110 (j j b =∧β) (20)用式(10)将式(20)复原成原变量z 1,z 2,p z , 的回归方程:pp p p p p z b z b z b b z z b z z b z z b b y '22'11'0'020*********......++++=⎪⎪⎭⎫⎝⎛∆+++⎪⎪⎭⎫⎝⎛∆-+⎪⎪⎭⎫ ⎝⎛∆-+=∧(21)式中:⎪⎪⎭⎫ ⎝⎛∆++∆+∆-=p pp z b z b z b b b 0022201110'... (22) ),...,2,1(,'p j b b jj j=∆=回归系数∧0β,∧1β,∧2β,∧p β...,可列表计算,如表3所示。

表中的2j j j j b N B b Q ==为变量x j 的偏回归平方和,回归系数b j 的绝对值大小反映了x j 作用的大小。

一般把b j 与零相差不大的因子剔除,归入误差项,而不必重新计算系数与方差检验。

经正交试验设计后,回归系数之间的相关性消除了。

这是因为相关矩阵C 是对角矩阵,从回归方程中剔除某一变量时,其余回归系数不变。

表3 一次回归正交试验设计计算表4、回归方程和回归系数的显著性检验(1) 回归方程的显著性检验总偏差平方和(S T )及其自由度(f T ):S T =∑∑∑===-=-=-Nk Nk kNk kk N B y y N y y y 112021222)( ,(23)f T = N -1回归平方和(S Q =S 回)及其自由度(f Q =f 回)S Q =∑=Pj j Q 1(24)pfQ=剩余平方和(S e=S剩)及其自由度(f e=f剩):S e = S T -S Qf e = N-p-1 (25) 对回归方程(20)的显著性检验,采用F检验,即用统计量)1(--==pNSpSfSfSFeeQQ剩回(26)对给定显著性水平α, 若)1,(-->pNpFFα则认为在显著性水平α下回归方程显著。

相关文档
最新文档