一次回归正交设计、二次回归正交设计、二次回归旋转设计
第七章 回归正交试验设计
个因素之间的函数关系。
因素水平编码表
自然变量xj 规范变量zj 1 -1 0 △j x1 700 300 500 200 x2 2400 1800 2100 300 x3 10 8 9 1
7.1.2一次回归方程的建立
设总的试验次数为N,其中原正交表所规定的二水平试验次数为 mc,零水平试验次数为m0,即有: N 建立回归方程
m
mc m0
ˆ a b j x j bkj xk x j,k 1,2,, m 1( j k ) y
j 1 k j
其系数的计算公式如下:
将被剔除变量的偏回归平方和、自由度并入到剩余平方和与自由度中,
然后再进行相关的方差分析计算。具体例子见书P126~129例8-1。
7.1 一次回归正交试验设计及结果分析
14
用石墨炉原子吸收分光光度计法测定食品中的铅,为提高吸光度,
对x1(灰化温度/℃)、x2(原子化温度/℃)和x3(灯电流/mA)三个
F0.05(1,6)=5.99 F0.01(1,6)=13.74
可见因素z2对指标影响高度显著,所建的回归方程高度显著:
y 0.50475 0.03375z2
7.1 一次回归正交试验设计及结果分析
N 1 SST Lyy ( yi y ) 2 yi2 ( yi ) 2 N i 1 i 1 i 1 N N
7.1 一次回归正交试验设计及结果分析
10
②一次项zj偏回归平方和
SS j m b ,j= 1 , 2, ,m
一次回归正交设计
第五讲回归设计及统计分析设目标性状y与z1、z2……z m等因素有关,我们可以应用回归分析的方法建立y与诸因素的回归方程,以此对y进行预测和控制,或筛选y的最优指标。
z1、z2……z m构成一个因子空间,每一组z1、z2……z m值对应一个y值。
如何在因子空间中选择最适当的试验点,以最少的试验点寻求y的最优区域,这就要将回归分析与正交设计结合起来应用,称为回归正交设计。
按回归模型的次数,回归正交设计又分为一次回归正交设计和二次回归正交设计。
一、一次回归正交设计一次回归正交设计主要是应用2水平正交表进行设计,其设计和分析步骤如下。
1.确定试验因素的变化范围例如研究m 个栽培因素z 1、z 2……z m 与作物产量y 的数量关系,首先需确定各个栽培因素的变化范围。
设因素z j 的变化区间为(z 1j ,z 2j ),则z 1j 和z 2j 分别为因素z j 的下水平和上水平。
那么1202j jj z z z +=为因素z j 的零水平.212jjj z z ∆=-为因素z j 的变化区间。
2。
对各因素的水平编码编码就是对各个因素的取值作如下线性变换:0j jj jz z x =∆-式中x j 为编码值。
如:10121121212jjj jj j j jjz zz z z x z z =∆-+--==-0000j jj jz z x =∆-=20122221212jjj jj j j jjz zz z z x z z =∆+--==-这样就建立了z j 与x j 的一一对应关系: 下水平 z 1j x 1j (-1)零水平z0j x0j (0 )上水平z0j x0j (+1)通过上面的编码可知,当z j在区间(z1j,z2j)变化时,它的编码值x j就在区间(-1,+1)内变化。
多个因素的编码工作可在因素水平编码表(表1)上进行。
表1 因素水平编码表z j因素Z1Z2……Z m下水平Z11Z12 (1)零水平Z01Z02 0上水平Z21Z22 (2)变化间距△j△1△2……△m对因素的水平进行编码后,y对z1、z2……z m的回归问题就转化为对x1、x2……x m的回归问题。
一次回归正交设计、二次回归正交设计、二次回归旋转设计说明
一次回归正交设计某产品的产量与时间、温度、压力和溶液浓度有关。
实际生产中,时间控制在30~40min,温度控制在50~600C,压力控制在2*105~6*105Pa,溶液浓度控制在20%~40%,考察Z1~Z2的一级交互作用。
因素编码Z j(x j) Z1/min Z2/o C Z3/*105Pa Z4/%下水平Z1j(-1)30 50 2 20上水平Z2j(+1)40 60 6 40零水平Z0j(0)35 55 4 30变化间距 5 5 2 10编码公式X1=(Z1-35)/5 X2=(Z2-55)/5X3=(Z3-4)/2 X4=(Z4-30)/1选择L8(27)正交表因素x1,x1,x3,x4依次安排在第1、2、4、7列,交互项安排在第3列。
试验号X0 X1(Z1) X2(Z2) X3(Z3) X4(Z4) X1X2 Yi1 1 1 1 1 1 1 9.72 1 1 1 -1 -1 1 4.63 1 1 -1 1 -1 -1 10.04 1 1 -1 -1 1 -1 11.05 1 -1 1 1 -1 -1 9.06 1 -1 1 -1 1 -1 10.07 1 -1 -1 1 1 1 7.38 1 -1 -1 -1 -1 1 2.49 1 0 0 0 0 0 7.910 1 0 0 0 0 0 8.111 1 0 0 0 0 0 7.4 Bj=∑xjy 87.4 6.6 2.6 8.0 12.0 -16.0aj=∑xj2 11 8 8 8 8 8bj = Bj7.945 0.825 0.325 1.000 1.500 -2.00/aj393 5.445 0.845 8.000 18.000 32.000Qj =Bj2 /aj可建立如下的回归方程。
Y=7.945+0.825x1+0.325x2+x3+1.5x4-2x1x2显著性检验:1、回归系数检验回归关系的方差分析表变异来源SS平方和Df自由度MS均方F显著水平x1 5.4451 5.44576.250.01 x20.84510.84511.830.05 x38.00018.000112.040.01 x4 18.000118.000252.100.01 x1x2 32.000132.000448.180.01 回归64.29 5 12.858180.080.01 剩余0.357 5 0.0714失拟0.097 3 0.0323 0.25 <1 误差e 0.2620.13总和64.64710经F检验不显著的因素或交互作用直接从回归方程中剔掉,不必再重新进行回归分析。
第8章回归正交试验设计
②二次项的中心化 对二次项的每个编码进行中心化处理 :
(二次项编码)-(二次项编码算术平均值)
z ji
'
z
j
2 i
1 n
n i 1
z
j
2 i
二元二次回归正交组合设计编码表
试验号
z1
1
1
z2
z1 z2
z12
1
1
1
2
1
-1
-1
1
3
-1
1
-1
1
4
-1
-1
1
1
5
1
0
0
1
6
-1
0
0
1
7
0
1
0
0
8
0
-1
0
1.414
1.483
3 1.147 1.353
1.471
1.547
4 1.210 1.414
1.525
1.607
5 1.267 1.471
1.575
1.664
6 1.320 1.525
1.623
1.719
7 1.369 1.575
1.668
1.771
8 1.414 1.623
1.711
1.820
9 1.457 1.668
bkj
i 1 n
(zk z j )i2
i 1
二次项偏回归系数bjj :
n
(
z
' ji
)
yi
b jj
i 1 n
(
z
' ji
)
2
i 1
⑤回归方程显著性检验
第六章 §6 二次回归的旋转设计
五,k>2 实现旋转设计借助于组合设计思想
1.中心组合思想
(1)m c 个点布置在半径 R c = k的球面上 (2 )2k个点布置在半径 R = r的球面上,通常位于 (3)m 0 个点布置在因子区域的 中心
n = m c + 2k + m 0 坐标轴上,称 r为星号臂
2. k = 2 D = 1 1 1 1 r r 0 0 0 0 1 1 1 1 0 0 r r 0 0
§6 二次回归的旋转设计
一,问题
y = β 0 + ∑ βi x i + ∑ βij x i x j + ∑ β ii x i2 + ε
i i< j i
要寻找旋转设计 D, X′X满足旋转性条件 0 第 (0,)元素为 n x 2 = λ 2 n i = 1, , k ∑ ji j ∑ x 4 = 3∑ x 2 1 x 2 2 = 3λ 4 n i1 ≠ i 2 ji ji ji j j k λ4 ≠ 2 λ2 k + 2
∑x
j j
ji
= ∑ x ji1 x ji 2 = ∑ x x ji 2 = 0
2 ji1 j j
x 2 = 4 + 2r 2 ∑ ji x21x2 2 = 4 ∑ ji ji
j
x 4 = 4 + 2r 4 ∑ ji
j
为满足旋转性条件
∑x
j
4 ji
= 3∑ x x
2 ji1 j
2 ji 2
∴ 4 + 2 r 4 = 12 r =
2
3.k ≥ 3
∑x
j j
ji
= ∑ x ji1 x ji 2 = ∑ x 2 1 x ji 2 = 0 ji
4、高级实验设计—回归的旋转设计(Regressional Rotary Design)
x
i,j =1,2„P;
待定参数
以上为 P 元二次回归旋转设计的旋转性条件。
此外,为了使旋转设计成为可能,还必须使信
息矩阵 A 不退化,为此,必须有不等式:
4 p 2 2 P 2
上式为 P 元二次回归的非退化条件。 已证明,只要使 N 个试验点不在同一个球面上, 就能满足非退化条件。或者说只要使 N 个试验点至少 分布于两个半径不等的球面上,就有可能获得旋转设
P 2 2 ˆ D y P 2 4 PN
4 1 2 P 1 4 P 1 4 1 2 2 4 P 2 4 4
(4.11) 由式(4.11)经研究表明,只有采用恰当的方法 确定 4 ,才能满足通用性的要求。如何确定 4 ?对 4 有什么要求呢?总的来说,它必须使上式中 i处的
ˆ 的 二次旋转组合设计具有同一球面预测值 y
方差相等的优点,但回归统计数的计算较繁琐,
若使它获得正交性就能简化计算手续。
在二次旋转组合计划中,一次项和交互项的 回归系数 bj ,bij 仍保持正交,但 b0 与 bjj 之间,
以及 bii 与 bjj 之间都存在相关,即不具正交性,
它们之间的相关矩分别为:
计方案。
为了获得 P 元二次旋转设计方案,就要求既要
满足非退化条件式,又要满足旋转性条件式。
如何才能满足这两方面的条件呢?这主要借助
于组合设计来实现,因为组合设计中 N 个试验点:
N mc m m0
分布在三个半径不相等的球面上:
mc 个点分布在半径为 P 的球面上; c m 个点分布在半径为 的球面上; m0 个点分布在半径为 0 0 的球面上;
第九章 回归的旋转设计
因此,采用组合设计选取的试验点,完全能够满足非退化条件式(13- 30) ,即信息矩阵 A 不会退化。此外,采用组合设计,其信息矩阵 A 的 元素中 2 xi x j xi x j 0 x j
m 的球面上; 的球面上; mγ个点分布在半 m0个点分布在半径 0 的球面上;
§1 旋转设计的基本原理
综上所述,为了获得 m 元二次旋转设计方案,就要求既要满足旋转性 条件式 (13-29) ,又要满足非退化条件式 (13-30) 。满足条件式 (13-29)是旋转设计的必要条件,满足非退化条件式 (13-30)是使旋 转性成为可能的充分条件。两者结合起来才能使旋转性设计得以实现。 实际操作上主要借助于组合设计来实现。因为组合设计中 N 个试验点 N = mc+mγ +m0 ,分布在3个半径不相等的球面上。即
5(全实施) 5(1/2全实施) 6(1/2全实施) 6(1/4全实施) 7(1/2全实施) 7(1/4全实施) 8(1/2全实施) 8(1/4全实施) 8(1/8全实施)
16
32 16 32 16 64 32 128 64 32
8
10 10 12 12 14 14 16 16 16
12
17 10 15 8 22 13 33 20 11
§1 旋转设计的基本原理
这里应该解决的是二次回归正交的旋转性问题。下面以试验设计中常用的 三元二次回归方程来讨论这个问题。 在3个变量情况下,二次回归模型为:
y x x x x x
3 3 2 j j 1 j j i j ij i j j 1 ij
x x x
13 23
x x x x
11 21
一次回归正交设计、二次回归正交设计、二次回归旋转设计说明
一次回归正交设计、二次回归正交设计、二次回归旋转设计说
明
一次回归正交设计是一种广泛应用于实验设计中的设计方式,该设计最基本的特点是每一个自变量只考虑一次。
这种设计方法可以通过排列组合的方式得到各种不同的设计方案,使得实验者可以通过设计来达到用最少的实验次数获取尽可能多的信息的目的。
一次回归正交设计在实验设计中被广泛使用,尤其在化学制药、工业生产等领域得到了广泛运用。
二次回归正交设计是一种基于一次回归正交设计的设计方式,这种设计方式可以进一步增加实验信息的获取。
在二次回归正交设计中,依然按照一次正交设计的方式来设计实验,但是在每个单独的自变量上,提高对其的测量次数,使得对这些自变量的测量更加准确。
同时,在某些需要深入探究的因素上,可以通过将这些因素的实验次数进一步提高,来获取相关信息。
二次回归旋转设计是一种在二次回归正交设计的基础上发展而来的设计方式。
在二次回归旋转设计中,实验者可以通过旋转矩阵来达到实验变量间的协方差为0的目的。
这样可以在保证基本信息获取的同时,增加获取高阶信息的可能性。
旋转设计特别适合于需要同时考虑多个变量的实验设计,可以使各个变量之间更加独立,减少不必要的干扰。
总的来说,在实验设计领域中,三种设计方法各自有着各自的优势。
对于需要更精准的信息获取的实验,应该选择更高阶的设计方法,在更基础的实验中则可以选择更为简单的设计方法。
另外,在选择设计方法的过程中,还应该根据实验具体情况灵活选择,使得实验设计更加科学合理。
第5讲(2) 正交回归设计
n mc 2 p m0 2 2 2 2 3 11
h mc 2 2 2 1.148 6.636
2 2 2
则
2 2 xj x 2 h / n x 6 . 636 / 11 x j j j 0.603
j 1,2
(5.4.16)
其中指数如上所述,n是试验次数,a a1 a2 a p , a 是待 定参数,下标a 必为偶数,且 0 1 。
特例:对d=1,2的旋转性条件具体化。 (1) d=1的情况:在一次回归旋转设计,此时A中满足
0 a1 a2 a都是偶数或零这些条件的,应有
5.写出二次回归方程并求最佳条件 我们可以写出在0.10水平上各系数都显著的回归方程为:
35.868x2 ˆ 171.45 14.338x2 21.818x1 y
再将(5.4.16)代入,即可得y关于x1,x2的二次回归方程:
2 ˆ 171.45 14.338 x2 21.818( x12 0.603) 35.868( x2 y 0.603)
2.试验计划与试验结果 本例的试验计划见表5.4.5,在试验随机化后所得试验结果 列在该表的最右边一列。 表5.4.5 试验计划与试验结果
3.参数估计 为求出y关于x1 , x2 的二次回归方程,首先将 x12 与 x22 列中心化, 即令 x x h / n 。在本例中:
j 2 j
§5.5 二次回归旋转设计
5.5.1 旋转性条件与非退化条件
回归正交设计的最大优点是试验次数较少,计算简便, 又消除了回归系数间的相关性。但是其缺点是预测值的方 差依赖于试验点在因子空间中的位置。由于误差的干扰, 试验者不能根据预测值直接寻找最优区域。若能使二次设 计具有旋转性,即能使与试验中心距离相等的点上预测值 的方差相等,那就有助于克服上述缺点。所以试验者常常 希望牺牲部分的正交性而获得旋转性,特别在计算机软件 发展的今天,计算的不便之处可以交由计算机帮助处理。
三元二次正交回归旋转通用设计
三元二次正交回归旋转通用设计在统计学和机器学习领域中,回归分析是一种重要的建模方法,用于探究自变量与因变量之间的关系。
而正交回归是一种特殊的回归方法,它可以解决自变量之间共线性的问题,提高模型的稳定性和可解释性。
本文将介绍三元二次正交回归旋转通用设计方法,以及其在实际应用中的意义和优势。
一、三元二次正交回归在传统的回归分析中,如果自变量之间存在较强的相关性,会导致模型的方差变大,降低模型的预测能力。
而正交回归通过将自变量进行正交化处理,消除它们之间的相关性,从而提高模型的稳定性。
在三元二次正交回归中,通常会将自变量进行二次展开,以更好地捕捉自变量之间的非线性关系。
二、回归旋转回归旋转是一种将原始自变量进行旋转变换的技术,旨在提高模型的解释能力和预测准确性。
通过回归旋转,可以将原始的自变量空间转换为一个新的正交空间,从而使模型更容易解释和理解。
在三元二次正交回归中,回归旋转可以进一步优化模型的设计,提高模型的拟合效果和泛化能力。
三、通用设计三元二次正交回归旋转通用设计是一种灵活而有效的建模方法,适用于各种类型的数据分析和预测问题。
通过将正交回归和回归旋转相结合,可以充分挖掘数据中隐藏的非线性关系,提高模型的拟合效果和预测准确性。
同时,通用设计的特点使得模型具有较强的适应能力,可以应用于不同领域和不同类型的数据集。
四、应用意义三元二次正交回归旋转通用设计在实际应用中具有重要的意义和应用价值。
首先,它可以帮助研究人员更好地理解数据中的复杂关系,揭示隐藏在数据背后的规律和模式。
其次,通过建立高效稳健的模型,可以为决策者提供可靠的决策支持,帮助他们更好地制定策略和规划。
最后,三元二次正交回归旋转通用设计还可以为学术研究和工程实践提供有力的工具和方法,推动科学技术的发展和创新。
三元二次正交回归旋转通用设计是一种强大而灵活的建模方法,具有广泛的应用前景和深远的意义。
通过合理运用这一方法,可以更好地理解和利用数据,为决策和创新提供有力支持,推动社会经济的持续发展。
第5章 回归正交试验设计
第一节 一次回归正交试验设计
(4)失拟性检验
本例中,零水平试验次数m0=3,进行失拟行检验。
FLf
SSLf / dfLf SSe1 / dfe1
0.0963/ 5 0.00667/ 2
5.775
F0.1(5,2)
9.29
表明失拟不显著,回归模型与实际情况拟合得很好。
第一节 一次回归正交试验设计
4 回归方程及偏回归系数的方差分析 4.1 无零水平试验 4.1.2 计算自由度
第一节 一次回归正交试验设计
4 回归方程及偏回归系数的方差分析 4.1 无零水平试验 4.1.3 计算均方
MSj
SS j df j
MSkj
SSkj dfkj
j k,k 1,2,...,(m 1)
n i 1
yi
y
n
z ji yi
bj
i 1
mc
n
(zk z j )i yi
bkj i1 mc
j k,k 1,2,...,(m 1)
第一节 一次回归正交试验设计
3 一次回归方程的建立 通过计算得到回归系数之后,可以直接根据它们绝对值的大
小来判断各因素和交互作用的相对重要性,而不用转换成标准 回归系数。
n
z ji 0
i 1
n
z ji zki 0 ( j k )
i 1
这些特点说明了转换之后的正交表同样具有正交性。
第一节 一次回归正交试验设计
2.4 试验方案的确定
确定试验方案时,将规范变量zj安排在一次回归正交编码表 相应的列中,即进行表头设计。
3-回归正交组合试验设计
试验号
1 2 3 4 5 6 7 8 9 … N
3.2 一次回归正交设计及统计分析
表3-2 3元一次回归正交设计试验方案
1 x1 (Z1)
1 (17)
1 (17)
1 (17)
2 x2 ( Z2 )
1 (22.6)
1 (22.6)
-1 (9.4)
4 x3 ( Z3 )
1 (45.7)
-1 (24.3)
x1m1x1m
x2 m1 x2 m
xNm1xNm
3.2 一次回归正交设计及统计分析
记: Y=(y1,y2,…,yN)′ β=[β0,β1, β2,… , βm , β12 , β13 , …, β(m-1)m]′ ε=(ε1,ε2,…,εN )′
则(3-4)的矩阵形式为:
Y = X β +ε
… 0 (12)
x2 ( Z2 )
1 (22.6) 1 (22.6) -1 (9.4) -1 (9.4) 1 (22.6) 1 (22.6) -1 (9.4) -1 (9.4) 0 (16)
… 0 (16)
x3 ( Z3 )
1 (45.7) -1 (24.3) 1 (45.7) -1 (24.3) 1 (45.7) -1 (24.3) 1 (45.7) -1 (24.3)
③ 原正交表经过上述代换,其交互作用列可以直接从表中相应 几列对应元素相乘而得到。因此原正交表的交互作用列表也就不用 了,这一点较原正交表使用更为方便。
④ 在具体进行设计时,首先将各因素分别安排在所选正交表相应 列上,然后将每个因素的各个水平填入相应的编码值中,就得到了 一次回归正交设计方案。
3.2 一次回归正交设计及统计分析
3 回归正交组合试验设计
一次回归正交设计、二次回归正交设计、二次回归旋转设计说明
一次回归正交设计某产品的产量与时间、温度、压力和溶液浓度有关。
实际生产中,时间控制在30~40min,温度控制在50~600C,压力控制在2*105~6*105Pa,溶液浓度控制在20%~40%,考察Z1~Z2的一级交互作用。
因素编码Z j(x j) Z1/min Z2/o C Z3/*105Pa Z4/%下水平Z1j(-1)30 50 2 20上水平Z2j(+1)40 60 6 40零水平Z0j(0)35 55 4 30变化间距 5 5 2 10编码公式X1=(Z1-35)/5 X2=(Z2-55)/5X3=(Z3-4)/2 X4=(Z4-30)/1选择L8(27)正交表因素x1,x1,x3,x4依次安排在第1、2、4、7列,交互项安排在第3列。
试验号X0 X1(Z1) X2(Z2) X3(Z3) X4(Z4) X1X2 Yi1 1 1 1 1 1 1 9.72 1 1 1 -1 -1 1 4.63 1 1 -1 1 -1 -1 10.04 1 1 -1 -1 1 -1 11.05 1 -1 1 1 -1 -1 9.06 1 -1 1 -1 1 -1 10.07 1 -1 -1 1 1 1 7.38 1 -1 -1 -1 -1 1 2.49 1 0 0 0 0 0 7.910 1 0 0 0 0 0 8.111 1 0 0 0 0 0 7.4 Bj=∑xjy 87.4 6.6 2.6 8.0 12.0 -16.0aj=∑xj2 11 8 8 8 8 8bj = Bj7.945 0.825 0.325 1.000 1.500 -2.00/aj393 5.445 0.845 8.000 18.000 32.000Qj =Bj2 /aj可建立如下的回归方程。
Y=7.945+0.825x1+0.325x2+x3+1.5x4-2x1x2显著性检验:1、回归系数检验回归关系的方差分析表变异来源SS平方和Df自由度MS均方F显著水平x1 5.4451 5.44576.250.01 x20.84510.84511.830.05 x38.00018.000112.040.01 x4 18.000118.000252.100.01 x1x2 32.000132.000448.180.01 回归64.29 5 12.858180.080.01 剩余0.357 5 0.0714失拟0.097 3 0.0323 0.25 <1 误差e 0.2620.13总和64.64710经F检验不显著的因素或交互作用直接从回归方程中剔掉,不必再重新进行回归分析。
第十讲(2) 旋转D最优设计
ˆ b0 b j x j bij xi x j y
j 1 i j
p
p
是否存在试验点个数为m=(p+1)(p+2)/2的饱和D—最优 计划?已证明,对p7不存在饱和D—最优计划。 当p=2,3时,饱和D—最优计划列于下表,同时还列 出了p=2时的7点和8点非饱和D—最优计划。
20
试验计划及试验结果
试验号 x1(N) x2 (P) 1 -1 (0) -1 (0) 2 1 (32) -1 (0) 3 -1 (0) 1 (16) 4 -0.1315 (13.9) -0.1315 (6.93) 5 1 (32) 0.3945 (11.13) 6 0.3945 (22.32) 1 (16)
6
第九章 回归的D—最优设计
§9.1 D—最优设计的基本概念
正交设计减少了试验次数,使分析简化。旋转设计 使同一球面上预测值的方差相等,排除了部分误差干 扰。如何比较试验计划的好坏?能否建立一定意义下 的最优试验计划?从五十年代起人们先后提出了很多 比较试验设计好坏的标准,如G—优良性,E—优良性 和D—优良性等,仅介绍D—最优设计。 D—最优设计是从对模型参数 的估计好坏评价的。
15.50 17.54 17.18 Y= 18.30 17.68 18.70
回归系数 b=(XX)-1XY=(18.473, 0.624, 0.444, -0.396, -1.423, -0.086
ˆ 18.473 0.624x1 0.444x2 0.396x1x2 1.423x 0.086x y
17
§9.3 最优设计的统计分析
本节讨论在因子空间-1≤xj≤1, j=1,2,…,p上的二次饱和 D—最优设计(如p=2,3)及较优设计(如p=4,5等)的统计 分析。因此,试验设计的方法与编码同一次回归正交 设计。当然,试验后的设计(结构)矩阵不同。另外, 由于最优设计一般不具有正交性,所以,回归系数的 计算应采用一般多元线性回归(第二章)的方法。应 注意的是,这里回归系数的个数是k=C2p+2,而不是p+1。 下面通过具体实例,说明设计与分析方法。
三元二次正交回归旋转通用设计
三元二次正交回归旋转通用设计创作说明在工程领域,每个设计必须经过多次修正来优化其性能。
而三元二次正交回归旋转通用设计便是一种方法,可有效减少这些周期,提高工程效率。
本文将从三元二次正交、正交回归设计、正交设计旋转、通用设计四个方面详细地介绍该方法。
一、三元二次正交三元二次正交是指当设计需要涉及三个变量时,采用三元二次正交设计方法来减少试验次数。
首先将每个变量设为正交系列,进行阶段试验。
然后根据结果分析、确定关键的变量和因素组合,再进行二次设计试验。
二、正交回归设计正交回归设计是一种常用的试验设计方法。
首先将所研究的变量进行正交分组,然后设计正交表,并根据表中的结果确定主要的变量和因素组合。
接着利用回归方法,对组合进行分析和优化。
三、正交设计旋转正交设计旋转是正交试验设计的一种应用,可以对正交表的后续设计进行优化。
在这种方法中,先采用和正交表相同的原始设计方案,然后对因素进行旋转。
旋转后,可以得到一组新的因素组合,也就是新的试验设计方案。
如此重复,直到得出最好的设计方案为止。
四、通用设计在实际工程应用中,可能涉及到多个设计平台。
由于每个平台需要的设计方案都不相同,因此需要一种通用设计方法。
通用设计方法建立在正交设计和正交设计旋转的基础之上。
利用正交试验设计中的随机因素、响应曲面和偏差方案,可以创建一种通用的实验计划,以应用于不同的平台和工程项目。
综上所述,三元二次正交回归旋转通用设计方法是一种高效的工程设计方法,可大幅缩短设计周期、提高工程效率。
对于需要应用多个平台的工程项目来说,这种设计方法更是一种不可少的工具。
第十二章 回归设计
n
ˆ i y) 2 ST S E S R ( y
4.失拟检验 当在某些点有重复试验数据的话,可以在检验回归方程显 著性之前,先对y 的期望是否是 x1 , x2 ,, x 的线性函数进行检 p 验,这种检验称为失拟检验,它要检验如下假设: H0: Ey 0 1 x1 p x p H1: Ey 0 1x1 p x p 当在 ( xi1 , xi 2 ,, xip )上有重复试验或观察时,将数据记为 其中至少有一个 mi 2 ,记 N m 。此时残差平方和可进一 步分解为组内平方和与组间平方和,其中组内平方和就是误 差平方和,记为 S e,组间平方和称为失拟平方和,记为 S Lf , 即:
y 0 j z j jj z 2 j ij zi z j
j j i j
(7.1.1)
这里各 0 , j , jj , ij , 为未知参数,也称为回归系数,通 常需要通过收集到的数据对它们进行估计。 若用 b0 , b j , b jj , bij , 表示相应的估计,则称
假定回归模型为:
yi 0 1 xi1 p xip i,i 1,2,, n 2 各 i iid ~ N (0, ) (7.1.5)
记随机变量的观察向量为
0 1 p
y1 y Y 2 y n
当H0j为真时,有 Fj ~ F (1, f E ) 。 给定的显著性水平 ,当 Fj F1 (1, f E ) 时拒绝假设H0j,即认 为 j 显著不为零,否则可以将对应的变量从回归方程中删除。 注:当有不显著的系数时,一般情况下一次只能删除一个F 值最小的变量,重新计算回归系数,再重新检验。通常要到余 下的系数都显著时为止。
试验设计复习
某品种对比试验采用阶梯式排列,参试品种 11 个,重复三次,试验结果如下,分析之。
A 1 2 3 总 理论 CK B 8.5 8.0 6.4 C 7.7 8.8 7.2 CK 11.4 12.0 9.6 33 10.9 1 1 D 7.1 5.8 5.7 E 7.4 7.6 6.1 CK 11.6 12.6 9.9 F 4.2 5.7 4.6 G 6.7 6.4 5.0 CK 12.0 10.5 8.4 H 5.7 4.8 6.7 I CK J
SST X ij C 39.2 2 29 2 19.52 23688.3 1277.66
SS A X i2 / n (206.4 2 186.6 2 140.4 2 ) / 6 497.88
i
i
j
SSr=SST-SSA=778.78 变异来源 处理 机误 总计 自由度 4 25 29 平方和 497.88 778.78 1277.66 均方 124.47 31.15 F 4.0
何为主处理、 副处理?在裂区设计中它们有那些排列方式?其试验精度有何不同?如何来 安排? ①主处理: 指在裂区设计中, 先把每一重复划分为若干个主区, 这些安排在主区内的处理, 即为主处理。 ②副处理:指在裂区设计中,先把每一重复划分为若干主区,然后在每一主区内再划分为 若干副区,这些安排在副区内的处理,即副处理。 ③排列方式:主处理与副处理均为随机区组排列 主处理排列为随机区组,副处理为拉丁方 主处理排列为拉丁方,副处理为随机区组 主处理和副处理均为拉丁方 ④副处理的试验精确性要求更高,而主处理的试验精确性要求较高。 ⑤进行裂区试验时,由于主区内的各个副区靠的痕迹,局部控制好,所以副处理间的比 较用随机区组设计来的精确;对主区而言,分散较远,因而主处理间的比较不如随机区 组设计精确,故要将更高精确性要求作为副处理,而将对精确要求较低的因子作为主处 理。 裂区设计与完全随机区组设计的联系与区别是什么。 裂区设计:先把每一重复划分为若干主区,并将试验的主处理安排在这些主区,然后在 每一主区内再划分若干副区,安排副处理,如果有必要可以在裂区之下再划分裂区,安 排第三种处理。 完全随机区组设计:把整个试验分为若干个单元,并使每个单元内部环境基本一致,然 后把所有处理全部安排到没一个单元中去,加以试验比较,不同单元之间则允许有环境 条件的差异存在。 联系:①都遵守试验设计的 6 条原则 ②引入了局部控制的思想,允许区组的差异,区组内保持一致。 ③都适用于多个因子的试验设计 区别:①完全随机区组的多因子之间重要性没有主次之分,而裂区设计的因子可以有主 次之分。 ②裂区设计处理的排列方式可以是多种的,而完全随机区组设计是随机排列的 ③完全随机区组设计在考虑因子时,需要全部分析考虑,而裂区区组设计可以在 后期从裂区的形式扩展添加。 ④完全随机区组在方差分析时,不同分析统计,机误只有一个,而裂区设计在方 差分析时,分主区和副区两部分进行分区,有多个机误。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一次回归正交设计某产品的产量与时间、温度、压力和溶液浓度有关。
实际生产中,时间控制在30~40min,温度控制在50~600C,压力控制在2*105~6*105Pa,溶液浓度控制在20%~40%,考察Z1~Z2的一级交互作用。
因素编码Z j (xj) Z1/min Z2/o C Z3/*105Pa Z4/%下水平Z1j(-1)30 50 2 20上水平Z2j(+1)40 60 6 40零水平Z0j(0)35 55 4 30 变化间距 5 5 2 10编码公式X1=(Z1-35)/5 X2=(Z2-55)/5 X3=(Z3-4)/2 X4=(Z4-30)/10选择L8(27)正交表因素x1,x1,x3,x4依次安排在第1、2、4、7列,交互项安排在第3列。
试验号X0 X1(Z1) X2(Z2) X3(Z3) X4(Z4) X1X2 Yi1 1 1 1 1 1 1 9.72 1 1 1 -1 -1 1 4.63 1 1 -1 1 -1 -1 10.04 1 1 -1 -1 1 -1 11.05 1 -1 1 1 -1 -1 9.06 1 -1 1 -1 1 -1 10.07 1 -1 -1 1 1 1 7.38 1 -1 -1 -1 -1 1 2.49 1 0 0 0 0 0 7.910 1 0 0 0 0 0 8.111 1 0 0 0 0 0 7.4 Bj=∑xjy87.4 6.6 2.6 8.0 12.0 -16.0aj=∑xj211 8 8 8 8 8bj = Bj/aj7.945 0.825 0.325 1.000 1.500 -2.00Qj = Bj2/aj393 5.445 0.845 8.000 18.000 32.000可建立如下的回归方程。
Y=7.945+0.825x1+0.325x2+x3+1.5x4-2x1x2显著性检验:1、回归系数检验回归关系的方差分析表变异来源SS 平方和 Df 自由度 MS 均方 F 显著水平x 1 5.445 1 5.445 76.25 0.01x 2 0.845 1 0.845 11.83 0.05x 3 8.000 1 8.000 112.04 0.01x4 18.000 1 18.000 252.10 0.01x1x2 32.000 1 32.000 448.18 0.01回归 64.29 5 12.858 180.08 0.01 剩余 0.357 5 0.0714 失拟0.09730.03230.25<1误差e 0.26 2 0.13总和 64.647 10经F 检验不显著的因素或交互作用直接从回归方程中剔掉,不必再重新进行回归分析。
2、回归方程的检验 进行此项检验时,通常对F 值小于等于1的项不进行检验,直接从回归方程中剔除,对经检验而α>0.25的项,根据实际需要决定是否剔除。
3、失拟检验Lf Lf Lf Lf e e e MS SS df F MS SS df ==由回归系数的检验,回归方程的检验,失拟检验可以得出,产量 y 与各因素之间的总回归关系达到显著,回归方程拟合效果较好。
回归方程的变换将各因素的编码公式代入,得Y=-162.05+4.57z1+2.87z2+0.50z3+0.15z4-0.08z1z2二次回归正交设计某食品加香试验,3个因素,即 Z1(香精用量)、 Z2(着香时间) 、 Z2(着香温度)(1) 确定γ值、 mc 及 m0 。
根据本试验目的和要求,确定 mc= 2 m = 2 3= 8 , m0 =1 ,查表得γ=1.215。
(2)确定因素的上、下水平,变化间距以及对因子进行编码编码Z1/(mL/kg物料)Z2 / h Z3/ ℃+γ182448+ 116.9422.645.70121635- 17.069.424.3-γ6822Δi 4.94 6.610.7计算各因素的零水平:Z01 =(18+6)/2=12 (mL/kg)Z02 =(24+8)/2=16 (h)Z03 =(48+22)/2=35 (℃)计算各因素的变化间距:Δ01 =(18-12)/1.215=4.94 (mL/kg)Δ02 =(24-16)/1.215=6.6 (h)Δ03 =(48-35)/1.215=10.7 (℃)(3)列出试验设计及试验方案试验号试验设计实施方案x0x1x2香精用量/(mL/kg)着香时间/h着香温度/ ℃111116.9422.645.7 211-116.9422.624.3 31-1116.949.445.7 41-1-116.949.424.35-1117.0622.645.7 6-11-17.0622.624.3 7-1-117.069.445.7 8-1-1-17.069.424.3 9 1.21500181635 10-1.2150061635 110 1.2150122435 120-1.215012835 1300 1.215121648 1400-1.215121622 150********试验结果的统计分析建立回归方程试验号 0x1x 2x 3x 21x x 31x x 32x x 1x ' 2x ' 3x ' 结果(y ) 1 11 1 1 1 1 1 0.27 0.27 0.27 2.322 1 1 1 -1 1 -1 -1 0.27 0.27 0.27 1.253 1 1 -1 1 -1 1 -1 0.27 0.27 0.27 1.934 1 1 -1 -1 -1 -1 1 0.27 0.27 0.27 2.135 1 -1 1 1 -1 -1 1 0.27 0.27 0.27 5.856 1 -1 1 -1 -1 1 -1 0.27 0.27 0.27 0.17 7 1 -1 -1 1 1 -1 -1 0.27 0.27 0.27 0.808 1 -1 -1 -1 1 1 1 0.27 0.27 0.27 0.569 1 1.215 0 0 0 0 0 0.746 -0.73 -0.73 1.60 10 1 -1.215 0 0 0 0 0 0.746 -0.73 -0.73 0.56 11 1 0 1.215 0 0 0 0 -0.73 0.746 -0.73 5.54 12 1 0 -1.215 0 0 0 0 -0.73 0.746 -0.73 3.89 13 1 0 0 1.215 0 0 0 -0.73 -0.73 0.746 3.57 14 1 0 0 -1.215 0 0 0 -0.73 -0.73 0.746 2.52 151 0 0 0 0 0 0 -0.73 -0.73 -0.73 5.80∑=2j j x a15 10.9525 10.9525 10.9525 8 8 84.36074.36074.3607∑2y=51.8443∑=y x j j β37.37 2.6336 7.2948 9.1858 -6.27-6.175.59-10.2019 0.5286 -4.3721y SS =58.7432j j j a B b = 0b0.2405 0.6660 0.8387 -0.7838 -0.7713 0.6988 -2.3395 0.1212-1.0093R SS =55.2032j j j a B Q 2=0.6333 4.8586 7.7040 4.9141 4.7586 3.9060 23.8676 0.0641 4.4422r SS =3.5401231213222231234.90910.24050.66600.83870.78380.77130.6988 2.33950.1212 1.0093y x x x x x x x x x x x x =+++--+-+-()2011137.3710.9525 2.33950.1212 1.0093 4.90911515maj jj j b y x b N N ==-•=--+-=∑∑∑回归关系的显著性测验。
变异来源平方和(SS)自由度(df)均方(MS)F显著程度x10.6332710.63327<1nsx2 4.858561 4.85856 6.8624*0.05(6.61) x37.7040017.7040010.8814*0.05(6.61) x1x2 4.914101 4.9141010.3994*0.05(6.61) x1x3 4.758611 4.75861 6.9409*0.05(6.61) x2x3 3.906011 3.90601 5.51700.10(4.06) x1223.86763123.8676333.7116**0.01(16.30) x220.0640710.06407<1nsx32 4.442201 4.44220 6.27430.10(4.06)回归55.203209 6.133698.6635*0.05(4.77)剩余 3.5399850.70799总变异58.7431714方差分析表明,总回归达到显著水平,说明本食品的加香试验与所选因素之间存在显著的回归关系,试验设计方案是正确的,选用二次正交回归组合设计也是恰当的。
除 x1 和 x22 以外,其余各项因子基本达到显著或极显著,说明香料用量、着香时间、着香温度与这一食品的加香有显著或极显著关系。
本试验设计的因素、水平选择是成功的。
在这种回归正交试验中,第一次方差分析往往因为误差(剩余)自由度偏小而影响了检验的精确度。
并且由于回归正交试验计划具有的正交性,保证了试验因素的列与列之间没有互作(即没有相关性)存在,因此我们可以将未达到0.25以上显著水平的因素(或者互作)剔除,将其平方和和自由度并入误差(剩余)项,进行第二次方差分析,以提高检验的精确度。
第二次方差分析结果见下表:变异来源平方和(SS)自由度(df)均方(MS)F显著程度x2 4.858561 4.858568.0263*0.05(5.59)x37.7040017.7040012.7269**0.01(12.20)x1x2 4.914101 4.914108.1180*0.05x 1x 3 4.75861 1 4.75861 7.8612*0.05(5.59) x 2x 3 3.90601 1 3.90601 6.4527*0.05(5.59) x 12 23.86763 1 23.86763 39.4290**0.01(12.20)x 32 4.44220 1 4.44220 7.3385*0.05(5.59) 回归 54.24265 7 7.74895 12.8012**0.01(6.99)剩余 4.23732 7 0.60533总变异58.47997 14第二次方差分析表明,总回归及各项因素均达到显著或极显著水平,说明这一食品加香与试验因素之间存在极显著的回归关系,其优化的回归方程为:本试验由于 m0=1,故不能进行失拟检验,这是试验的一个缺陷。