最优回归设计1

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三、最优回归试验设计与分析回归方程的显著性检 验
• 1、总平方和(SST):SST=∑ (∑yi)2,总自由度= 试验次数一1即dfT=N-1。 • 2、回归平方和(SSr)与回归自由度(dfr),回归 平方和等于各偏回归系数之和,即 SSr=Q1+Q2+…+QP,回归自由度dfr=2p+p(p-1)/2。 • 3、剩余平方和(SSs)与剩余自由度(dfs)。剩余 平方和等于总平方和与回归平方和之差 SSs=SST—SSr,剩余自由度dfs=N-1-2p+p(p— 1)/2。
二次正交旋转组合设计 步骤
• • • • • • 确定参与试验的因素,选定处理水平。 计算各因素的变化区间,并对处理水平编码。 确定星号臂(γ)及其相应的取值。 列出因素水平的编码表。 查合适的设计表,并列出试验方案。 按照设计安排试验。
二、最优回归试验设计与分析回归系数的计算
• 在线性回归方程分析中已介绍过,回归系数 b=(X’X)-1(X’Y),其中(X’X)-1为设计的相关矩阵, (X’Y)为常系数矩阵B。 • 但在旋转组合设计的情况下,由于设计具有正交 性,因此计算更为方便。回归系数的计算及显著 性检验方法如下:
• 4、误差平方和(SSe)与误差自由度(dfe)。首先, 中心点指标的均值等于中心点指标之和除以中心 点的试验次数,即 。由此,误差平方和等于中 心点各个指标值分别减去中心点指标均值 ,并 且将差值分别平方后全部相加,即SSe= ,并有误 差自由度=中心点次数一1,即dfe=m0一1。误差 平方和(SSe)完全是由试验误差引起的,可对它进 行各项显著性检验。 • 5、失拟平方和(SSLF)与失拟自由度(dfLF)。失拟 平方和等于剩余与误差平方和之差SSLF=SSs—SSe, 失拟自由度dfLF=dfs一dfe。
wk.baidu.com
五、二次正交旋转及二次通用组合统计分析概述
• 二次正交旋转及二次通用组合试验统计分析,除两 种试验方案的零水平不同外,其它均相同,因此其 统计分析过程在此一并介绍。 • 根据试验设计方案及试验结果,估计二次多项式 回归方程中各个回归系数。检验各个系数的显著性, 回归方程失拟项的F检验。以及二次回归模型的F检 验。只有当失拟项不显著,且二次回归模型的F检验 显著时,说明回归方程在α水准上显著,试验数据 与所采用的二次数学模型基本上是符合的。二次回 归方程与实际情况拟合得较好,可以用来优化、预 报,反之则不能。
• 第5步,查合适的设计表,并列出试验方案。 • 比如,有:zl、z2、z3这三个因素,其水平编码 后。以变量xl、x2、x3表示。其二次回归的正交旋 转组合设计由以下三部分组成: • mc部分——2p型全因子试验或其部分实施的试 验次数。这些试验点代表二水平全因子试验或部 分因子试验的次数(2p或2p-1,2p-2等)。可从相应的 二水平正交表获得。 • mr部分——星号点的试验次数。这是分布在xl、 x2、x3轴上的星号点。其试验点数为参试因素个 数的2倍(2p)。 • m0部分——中心点试验次数。在xl、x2、x3各变 量都取零水平时所需的试验次数。 • 以上三个部分组成的总试验次数N=mc+2p+m0。 • 在二次正交旋转组合设计中,中心点试验的重 复次数m0可从二次正交旋转组合设计的参数表77中获得。
1 1 1 1 1 1 1 1 -1 -1 -1 -1 -1 -1 -1 -1 -2.000 2.000 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 1 1 1 -1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 0 0 -2.000 2.000 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1、计算常数项矩阵B的分量,即各列的Bj值。Bj由相应列中的编码 值、星号臂值和中心化处理后的平方项的数值分别与指标值相乘以 后再相加而得。即Bj= x y
ij i i
2、计算各列的dj值。dj是相应列上各个数值(包括编码值、星号臂 值与平方项中心化的值)的平方之和dj= x
2 ij i
3、求各列的回归系数bj值,算法为bj=Bj/dj。在列出的回归方程 中,回归系数的绝对值反映对应变量砷在试验过程中作用的大小。 回归系数的正负号反映这个作用的趋势即正影响或负影响。
• 第3步,确定星号臂(γ)及其相应的取值。根 据二次组合设计旋转性的要求。确定组合 设计中的一个参数即星号臂γ在二次旋转组 合设计中,全实施时,γ=2p/4;在半实施时, γ=2(p-1)/4。对于星号点γ的水平取值,可以通 过下列公式计算: • 上星号(+γ)处的因素水平值=因素的上水 平+(星号臂值-1)×变化区间 • 下星号(-γ)处的因素水平值=因素的下水 平-(星号臂值-1)×变化区间 • 即(+γ)处水平值=Z2j+(γ-1)Δj,(-γ)处水平值 =Z1j-(r-1)Δj。
二次正交回归组合设计
• 包括二次正交旋转、二次通用组合和二次正交回 归组合的设计; • 是正交试验与回归试验结合的试验设计; • 是建立在回归模型基础之上的目前常用实用的设 计方法. • 试验设计时仅需要确定参与试验的因素,选定处 理的零水平,并计算好各因素的变化区间。系统 将自动对处理水平编码,计算星号臂γ的值。
1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 0 0 0 0 -2.000 2.000 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 0 0 0 0 0 0 -2.000 2.000 0 0 0 0 0 0 0 0 0 0 0 0
• 第4步,列出因素水平的编码表。通过前几 步骤,已经对因素的水平进行了编码,即 把有量纲的自然变量z1,z2,…,zp的回归问 题转化成了对无量纲规范变量xl,x2,…,xp 的回归问题。经过这种量纲一的编码变换, 所有变量的取值都是+1和-1,它们在所研究 的区域内都是平等的。由此,所求得的回 归系数可以直接反映该因素作用的大小, 而不受因素的单位和取值的影响。在此基 础上,可以列出因素水平的编码表。
16 23 36 36
1.414 1.682 2.000 2.000
6 10 15 21
• 第6步,按照设计安排试验。在二次正交旋转 组合设计中,常数项x0列均为1。互作x1x2, x1x3,x2x3等列是由对应变量相应的编码值自 乘而得的,平方项 等列是经过中心化计算而 得的,但这些参数都不参与实验过程,只作结 果分析之用。 • 对于xl、x2、x3而言,编码号既表示因素水平 的不同状态,又表示因素水平变化的大小。其 中,+1表示上水平,-1表示下水平,0表示零 水平值。星号臂γ水平的取值已从第3步求得。 • 将各因素的上水平、下水平、零水平与上星号 臂、下星号臂分别对号入座,代入设计表中的 xl、x2、x3等列,即得试验方案。
• 第2步,计算各因素的变化区间,并对处理水 平编码。将第j因素的变化区间以Δj表示,那 么 。然后对每个因素哥的处理水平进行编码, 即对每个因素的取值进行线性变换。因素zj与 规范变量xj变换的对应关系是xj=(zj-z0j)/Δj。上 水平z2j的编码值为+l,下水平z1j的编码值为-1。 零水平z0j的编码值为0。 • 这样,就将有量纲的自然变量zj(j=1,2,…, p)变成量纲一的规范变量xj(j=1,2,…,p),其 变化区间(z1j,z2j)变为(-1,1)。以下的工作,都 是以规范变量x1,x2,…,xp为基础进行的。
一般的正交试验设计,像方差分析一样,主要 用于析因试验结果的分析,为建立定量的数学模型, 本章将介绍正交回归试验设计及其分析技术。 这类技术既能分析各处理因子的影响,又能建 立定量的数学模型,因此是更高级的试验设计技 术。,常用的是2—5个因子的二次正交旋转组合设 计及二次通用旋转组合设计模型,可自动完成试验 方案的生成和试验数据的处理。 后者包括回归模型的显著性检验、失拟性检验、 回归系数的显著性检验、模型的仿真寻优以及模型 中各个因子效应的分析。
如一个4因子的二次正交旋转设计试验, 内容是探讨马铃薯产量与播种期(x1)、播种量 (x2)、培土时间(x3)和尿素用量(x4)这四个因素 之间的定量关系。 试验数据的编辑定义格式如下图(注意: 一定要按本系统所给的编码顺序对号入座):
No.
c1
c2
c3
c4
产量
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
表7-7 二次正交旋转组合设计参数 如变量p=3,mc=23=8,星号臂γ =l.682,中心点m0=9, 试验总次数为N=mc+2p+m0=8+2×3+9=23。
m 参试因子数(p) c mr m0 N γ 系数个数
2 3 4 5(1/2实施)
4 8 16 16
4 6 8 10
8 9 12 10
最优回归试验设计与分析
• 一、最优回归试验设计与分析概述
• 二、最优回归试验设计与分析回归系数的 计算
• 三、最优回归试验设计与分析回归方程的 显著性检验 • 四、二次正交回归组合设计
• 五、二次正交旋转及二次通用组合统计分 析
最优回归试验设计与分析概述
• 在多处理情形下,从理论上讲我们可以将取因子方 差分析的模型和方法推广到多因子方差分析中,而 实践中,做多个园子的完全试验会有许多实际的困 难,因为完全试验所要求的试验次数太多。乃至无 法实现。例如,假定要考虑5个三水平因子,则完 全试验(重复数为1)要求做32=243次试验:假如再加 一个四水平因子,则完全试验(同样重复数为1)要作 972次试验。如果要能够分析全部交互效应,同时 还能够做平方和分解,则试验次数还需要加倍!显 然,如此大的试验次数在现实工作中几乎是无法实 施的。解决这个困难的技术之一是采取正交试验设 计进行试验。
简单说来,当设计某项试验时,若使试验点到试验中 心的距离相等和同球面上各点回归预测值的方差相等,这 样的设计就是旋转设计(rotational designs)。 回归旋转设计具有两个突出的特点:第一,它牺牲部 分正交性而获得旋转性,并基本保留回归正交设计试验次 数较少、计算简便以及部分消除回归系数之间的相关性等 优点。第二,它有助于克服在回归正交设计中二次回归预 测值萝的方差依赖于试验点在因子空间中的位置这个缺点, 即它能有效地克服二次回归正交设计由于无旋转性,能根 据预测值直接寻求最优区域的缺点。 旋转设计常借助于组合设计的思想。旋转组合设计有 二次通用旋转组合设计和二次正交旋转组合设计,下面分 别给予介绍, 最优回归试验设计包括一般正交试验设计、正交回归 、正交旋转组合设计及均匀设计的试验设计。
四、二次正交回归组合设计概述
• 在DPS数据处理平台支持下,进行二次正交回归组合试 验(包括二次正交旋转、二次通用组合和二次正交回归 组合)的设计仅需要确定参与试验的因素,选定处理的 零水平,并计算好各因素的变化区间。系统将自动对处 理水平编码,计算星号臂γ的值。下面以二次正交旋转 组台设计为例,介绍其试验设计基本原理, • 二次正交旋转组合设计 • 第1步是确定参与试验的因素,选定处理水平。设某项 试验考察p个因素,分别以z1、z2、zp表示,每个处理因 素分上下两个水平。若将第j个因素的上水平以z2j表示, 下水平以z1j表示(j=1,2,…,p),那么各个处理的零水 平(z0j)为z0j=(zo1+zo2)/2
• 6、对失拟项作F检验:F1=(SSLF/dfLF)/(SSe/dfe)。 当F1>Fα(dfLF,dfe)时,说明失拟项在α水准上是 显著的。这时,失拟平方和SSLF中含有不可忽 略的其它因素对结果造成影响,需进一步考察 原因,改变二次回归模型。当F1< Fα(dfLF,dfe) 时,说明失拟项不显著,可进一步用统计量F2 对二次回归模型进行检验。 • 7、用统计量F2对回归方程作F检验F2=(SSr/ dfr)/(SSs/dfs)。当F2>Fα(dfr,dfs)时,说明回归 方程在α水准上显著,试验数据与所采用的二 次数学模型基本上是符合的。二次回归方程与 实际情况拟台得较好,可以用来预报。否则不 显著。
相关文档
最新文档