一次回归正交设计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五讲 回归设计及统计分析
设目标性状y与z1、z2……zm等因素有关,我们可以应用回归分析的方法建立y与诸因素的回归方程,以此对y进行预测和控制,或筛选y的最优指标。z1、z2……zm构成一个因子空间,每一组z1、z2……zm值对应一个y值。如何在因子空间中选择最适当的试验点,以最少的试验点寻求y的最优区域,这就要将回归分析与正交设计结合起来应用,称为回归正交设计。按回归模型的次数,回归正交设计又分为一次回归正交设计和二次回归正交设计。
为因素zj的零水平。
为因素zj的变化区间。
2.对各因素的水平编码
编码就是对各个因素的取值作如下线性变换:
式中xj为编码值。如:
这样就建立了zj与xj的一一对应关系:
下水平z1jx1j(-1)
零水平z0jx0j(0 )
上水平z0jx0j(+1)
通过上面的编码可知,当zj在区间(z1j,z2j)变化时,它的编码值xj就在区间(-1,+1)内变化。
用二水平正交表设计的这种试验具有正交性。若以 表示在第 试验中第j个变量的编码值,于是在试验计划中有
任一列的和
任两列的内积
具有以上两个性质的设计为正交设计。
4.建立回归方程
对于3因素试验,若考虑因素间的交互作用,则回归方程为
例如用L8(27)正交表设计该试验,那么它的结构矩阵为
信息矩阵(系数矩阵)为
一、一次回归正交设计
一次回归正交设计主要是应用2水平正交表进行设计,其设计和分析步骤如下。
1.确定试验因素的变化范围
例如研究m个栽培因素z1、z2……zm与作物产量y的数量关系,首先需确定各个栽培因素的变化范围。设因素zj的变化区间为(z1j,z2j),则z1j和z2j分别为因素zj的下水平和上水平。那么
1
-1
1
-1
-1
y2
3
1
1
-1
1
-1
1
-1
y3
4
1
1
-1
-1
-1
-1
1
y4
5
1
-1
1
1
-1
-1
1
y5
6
1
-1
1
-1
-1
1
-1
y6
7
1
-1
-1
1
1
-1
-1
y7
8
1
-1
-1
-1
1
1
1
y8
Bj
8
8
8
8
8
8
8
B0/8
B1/8
B2/8
B3/8
B12/8
B13/8
B23/8
--
从以上计算可看出,各变量的偏回归平方和 ,与偏回归系数bj的平方成正比。bj的绝对值越大,Qj也越大。这就意味着,在利用正交表所得到的回归方程中,每一个回归系数bj的绝对值大小,反映了对应变量xj对y作用的大小。这是因为经过无量纲编码后,所以变量的取值都是1和-1,它们在所研究的区域内取值是平等的,且不受单位的影响,因此所求回归系数bj直接反映了因素zj作用的大小,回归系数的符号反映因素作用的性质。在要求不太高的情况下,一次回归正交设计可省略方差分析,直接把回归系数与零相差不大的因素从回归方程中剔除,不需重新计算其它回归系数,剔除因素对结果的影响可并入试验误差。但对精度要求较高的试验,应继续进行回归关系的显著性测验。
相关矩阵为
常数项矩阵为
为试验结果,于是可算出回归系数矩阵
那么各类回归系数即由下式算出
回归系数的具体计算可在正交表上进行(表3).表中bj为各回归系数,Qj为偏回归平方和。从而建立回归方程。
表33因素一次回归正交设计计算表
试验号
x0
x1
x2
x3
x1x2
x1x3
x2x3
试验结果
1
1
1
1
1
1
1
1
y1
2
1
1
表2常用二水平正交表L4(23)
试验号
x1
x3
x3
1
1
1
1
2
1
-1
-1
3
-1
1
-1
4
-1
-1
1
L8(27)
试验号
x1
x2
x3
x1x2
x1x3
x2x3
x1x2x3
1
1
1
1
1
1
1
1
2
1
1
-1
1
-1
-1
-1
3
1
-1
1Hale Waihona Puke Baidu
-1
1
-1
-1
4
1
-1
-1
-1
-1
1
1
5
-1
1
1
-1
-1
1
-1
6
-1
1
-1
-1
1
-1
1
7
-1
3.选择合适的二水平正交表
常用的二水平正交表有L4(23)、L8(27)、L12(211)、L16(215)等。选用哪一种二水平正交表要依据因素个数及需要研究的交互作用而定。正交表确定以后,把表中的“2”改为“-1”。这样正交表中的“+1”“-1”既表示因素的不同水平,也表示xj的取值。表2列举了经代换后的几张常用二水平正交表。
-1
1
1
-1
-1
1
8
-1
-1
-1
1
1
1
-1
L12(211)
试验号
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
x11
1
1
1
1
1
1
1
1
1
1
1
1
2
1
1
1
1
1
-1
-1
-1
-1
-1
-1
3
1
1
-1
-1
-1
1
1
1
-1
-1
-1
4
1
-1
1
-1
-1
1
-1
-1
1
1
-1
5
1
-1
-1
1
-1
-1
1
-1
1
-1
1
6
1
-1
-1
-1
1
-1
-1
1
-1
1
1
7
-1
1
-1
-1
1
1
-1
-1
1
-1
1
8
-1
1
-1
1
-1
-1
-1
1
1
1
-1
9
-1
1
1
-1
-1
-1
1
-1
-1
1
1
10
-1
-1
-1
1
1
1
1
-1
-1
1
-1
11
-1
-1
1
-1
1
-1
1
1
1
-1
-1
12
-1
-1
1
1
-1
1
-1
1
-1
-1
1
如设计一个3因素试验,可选用L8(27)正交表,表中x1、x2、x3分别代表z1、z2、z3的编码值。若因素间有互作存在,在回归中可用非线性项x1x2、x1x3、x2x3等表示。每种交互作用占改造后二水平正交表的1列,该列的取值可由某两列上元素对应相乘得到。如表2L8(27)中x1x2列的元素是由x1与x2列上的对应元素相乘而得。
多个因素的编码工作可在因素水平编码表(表1)上进行。
表1因素水平编码表
zj
因素
Z1
Z2
……
Zm
下水平
Z11
Z12
……
Z1m
零水平
Z01
Z02
……
Z0m
上水平
Z21
Z22
……
Z2m
变化间距△j
△1
△2
……
△m
对因素的水平进行编码后,y对z1、z2……zm的回归问题就转化为对x1、x2……xm的回归问题。在z1、z2……zm因子空间选择试验点的问题就转化为x1、x2……xm为坐标轴的编码空间选择试验点。在二次回归设计中也要进行因素的编码工作。
5.回归方程及回归系数的显著性测验
一次回归正交设计的方差分析如表4。
表4一次回归正交设计的方差分析表
变异来源
自由度
平方和
均方
F值
回归
离回归
总
x1
1
xm
1
x1x2
1
xm-1xm
1
对回归方程的显著性假设测验可通过表4中的F测验进行。但这种测验只是说明m个变量对试验结果的影响是显著的,而在研究区域内回归方程与实测值的拟合情况,即采用一次回归模型是不是最合适,从以上测验中没有得到这方面的信息。为了了解回归方程的拟合情况,需在零水平( )安排一些重复试验,如在安排p次重复试验所得试验结果为 ,其平均数为 ,则
设目标性状y与z1、z2……zm等因素有关,我们可以应用回归分析的方法建立y与诸因素的回归方程,以此对y进行预测和控制,或筛选y的最优指标。z1、z2……zm构成一个因子空间,每一组z1、z2……zm值对应一个y值。如何在因子空间中选择最适当的试验点,以最少的试验点寻求y的最优区域,这就要将回归分析与正交设计结合起来应用,称为回归正交设计。按回归模型的次数,回归正交设计又分为一次回归正交设计和二次回归正交设计。
为因素zj的零水平。
为因素zj的变化区间。
2.对各因素的水平编码
编码就是对各个因素的取值作如下线性变换:
式中xj为编码值。如:
这样就建立了zj与xj的一一对应关系:
下水平z1jx1j(-1)
零水平z0jx0j(0 )
上水平z0jx0j(+1)
通过上面的编码可知,当zj在区间(z1j,z2j)变化时,它的编码值xj就在区间(-1,+1)内变化。
用二水平正交表设计的这种试验具有正交性。若以 表示在第 试验中第j个变量的编码值,于是在试验计划中有
任一列的和
任两列的内积
具有以上两个性质的设计为正交设计。
4.建立回归方程
对于3因素试验,若考虑因素间的交互作用,则回归方程为
例如用L8(27)正交表设计该试验,那么它的结构矩阵为
信息矩阵(系数矩阵)为
一、一次回归正交设计
一次回归正交设计主要是应用2水平正交表进行设计,其设计和分析步骤如下。
1.确定试验因素的变化范围
例如研究m个栽培因素z1、z2……zm与作物产量y的数量关系,首先需确定各个栽培因素的变化范围。设因素zj的变化区间为(z1j,z2j),则z1j和z2j分别为因素zj的下水平和上水平。那么
1
-1
1
-1
-1
y2
3
1
1
-1
1
-1
1
-1
y3
4
1
1
-1
-1
-1
-1
1
y4
5
1
-1
1
1
-1
-1
1
y5
6
1
-1
1
-1
-1
1
-1
y6
7
1
-1
-1
1
1
-1
-1
y7
8
1
-1
-1
-1
1
1
1
y8
Bj
8
8
8
8
8
8
8
B0/8
B1/8
B2/8
B3/8
B12/8
B13/8
B23/8
--
从以上计算可看出,各变量的偏回归平方和 ,与偏回归系数bj的平方成正比。bj的绝对值越大,Qj也越大。这就意味着,在利用正交表所得到的回归方程中,每一个回归系数bj的绝对值大小,反映了对应变量xj对y作用的大小。这是因为经过无量纲编码后,所以变量的取值都是1和-1,它们在所研究的区域内取值是平等的,且不受单位的影响,因此所求回归系数bj直接反映了因素zj作用的大小,回归系数的符号反映因素作用的性质。在要求不太高的情况下,一次回归正交设计可省略方差分析,直接把回归系数与零相差不大的因素从回归方程中剔除,不需重新计算其它回归系数,剔除因素对结果的影响可并入试验误差。但对精度要求较高的试验,应继续进行回归关系的显著性测验。
相关矩阵为
常数项矩阵为
为试验结果,于是可算出回归系数矩阵
那么各类回归系数即由下式算出
回归系数的具体计算可在正交表上进行(表3).表中bj为各回归系数,Qj为偏回归平方和。从而建立回归方程。
表33因素一次回归正交设计计算表
试验号
x0
x1
x2
x3
x1x2
x1x3
x2x3
试验结果
1
1
1
1
1
1
1
1
y1
2
1
1
表2常用二水平正交表L4(23)
试验号
x1
x3
x3
1
1
1
1
2
1
-1
-1
3
-1
1
-1
4
-1
-1
1
L8(27)
试验号
x1
x2
x3
x1x2
x1x3
x2x3
x1x2x3
1
1
1
1
1
1
1
1
2
1
1
-1
1
-1
-1
-1
3
1
-1
1Hale Waihona Puke Baidu
-1
1
-1
-1
4
1
-1
-1
-1
-1
1
1
5
-1
1
1
-1
-1
1
-1
6
-1
1
-1
-1
1
-1
1
7
-1
3.选择合适的二水平正交表
常用的二水平正交表有L4(23)、L8(27)、L12(211)、L16(215)等。选用哪一种二水平正交表要依据因素个数及需要研究的交互作用而定。正交表确定以后,把表中的“2”改为“-1”。这样正交表中的“+1”“-1”既表示因素的不同水平,也表示xj的取值。表2列举了经代换后的几张常用二水平正交表。
-1
1
1
-1
-1
1
8
-1
-1
-1
1
1
1
-1
L12(211)
试验号
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
x11
1
1
1
1
1
1
1
1
1
1
1
1
2
1
1
1
1
1
-1
-1
-1
-1
-1
-1
3
1
1
-1
-1
-1
1
1
1
-1
-1
-1
4
1
-1
1
-1
-1
1
-1
-1
1
1
-1
5
1
-1
-1
1
-1
-1
1
-1
1
-1
1
6
1
-1
-1
-1
1
-1
-1
1
-1
1
1
7
-1
1
-1
-1
1
1
-1
-1
1
-1
1
8
-1
1
-1
1
-1
-1
-1
1
1
1
-1
9
-1
1
1
-1
-1
-1
1
-1
-1
1
1
10
-1
-1
-1
1
1
1
1
-1
-1
1
-1
11
-1
-1
1
-1
1
-1
1
1
1
-1
-1
12
-1
-1
1
1
-1
1
-1
1
-1
-1
1
如设计一个3因素试验,可选用L8(27)正交表,表中x1、x2、x3分别代表z1、z2、z3的编码值。若因素间有互作存在,在回归中可用非线性项x1x2、x1x3、x2x3等表示。每种交互作用占改造后二水平正交表的1列,该列的取值可由某两列上元素对应相乘得到。如表2L8(27)中x1x2列的元素是由x1与x2列上的对应元素相乘而得。
多个因素的编码工作可在因素水平编码表(表1)上进行。
表1因素水平编码表
zj
因素
Z1
Z2
……
Zm
下水平
Z11
Z12
……
Z1m
零水平
Z01
Z02
……
Z0m
上水平
Z21
Z22
……
Z2m
变化间距△j
△1
△2
……
△m
对因素的水平进行编码后,y对z1、z2……zm的回归问题就转化为对x1、x2……xm的回归问题。在z1、z2……zm因子空间选择试验点的问题就转化为x1、x2……xm为坐标轴的编码空间选择试验点。在二次回归设计中也要进行因素的编码工作。
5.回归方程及回归系数的显著性测验
一次回归正交设计的方差分析如表4。
表4一次回归正交设计的方差分析表
变异来源
自由度
平方和
均方
F值
回归
离回归
总
x1
1
xm
1
x1x2
1
xm-1xm
1
对回归方程的显著性假设测验可通过表4中的F测验进行。但这种测验只是说明m个变量对试验结果的影响是显著的,而在研究区域内回归方程与实测值的拟合情况,即采用一次回归模型是不是最合适,从以上测验中没有得到这方面的信息。为了了解回归方程的拟合情况,需在零水平( )安排一些重复试验,如在安排p次重复试验所得试验结果为 ,其平均数为 ,则