均匀设计(版本3)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
^ 2 m T
(8 10) (8 11)
l 1
bl xl
2 (T Cm )
在这种情况下,为了求得二次项和交互作用项,就不能 选用试验次数等于因素数的均匀设计表,二必须选用试 验次数大于或等于回归方程系数总数的U表了
§9-2 应用举例
利用均匀设计表来安排试验的步骤:
• (1)根据试验的目的,选择合适的因素和相应的水平。 • (2)选择适合该试验的均匀设计表,然后根据该表的使 用表从中选出列号,将因素分别安排到这些列号上,并将 这些因素的水平按所在列的指示分别对号,则试验就安排 好了
x3 2.0 L12 1.4 L33 7.0
_
y 0.3683 L1 y 0.2404 L2 y 0.5640 L3 y 0.5245
_
L22 252.0 L23 10.5
由于Lij L ji,故不必全部列出,将它们代入方程组中 可以解得 b1 0.037, b2 0.00343, b3 0.077 从而 a 0.3683 0.037 2.2 0.00343 19 0.077 2.0 0.201
3 3 6 2 5 1 4
4 6 5 4 3 2 1
每个均匀设计表都附有一个使用表,它指示我们如何从设计表 中选用适当的列,以及由这些列所组成的试验方案的均匀度。 下表是U6(64)的使用表。它告诉我们,若有两个因素,应选用1, 3两列来安排试验;若有三个因素,应选用1,2,3三列,…, 最后1列D表示刻划均匀度的偏差(discrepancy),偏差值越小, 表示均匀度越好。
• 二、均匀设计表
均匀设计表符号表示的意义
因素数
U7(76)
均匀表的代号 因素的水平数 试验次数
图9-1 两因素均匀设计布点图
如U6(64)表示要做次6试验,每个因素有6个水平, 该表有4列。
U6(64)
试验号
列号
1 2 3 4 5 6
1 1 2 3 4 5 6
2 2 4 6 1 3 5
^
(8 1)
令xik 代表因素xi 在第k次试验时取的值,yk 表示响应值 (8 2) (8 3) (8 4) (8 5)
Lyy yk y i 1
N _
2
xi xi
i 1
_
N
i 1, 2, m
1 N y yk N i 1 回归方程组系数由下列正规方程组决定:
1978年,七机部由于导弹设计的要求,提出了一个五因 素的试验,希望每个因素的水平数要多于10,而试验总数 又不超过50,显然优选法和正交设计都不能用,方开泰与 王元经过几个月的共同研究,提出了一个新的试验设计, 即所谓“均匀设计”,将这一方法用于导弹设计,取得了 成效
均匀设计法愈正交设计法的不同:
U7(76)使用表
因素数 2 3 4 5 6 1 1 1 1 1 3 2 2 2 2 3 3 3 3 6 4 4 6 5 6 列号
U7(76)共有6列,现在有3个因素,根据其使用表,应 该取1,2,3列安排试验。
制备阿魏酸的试验方案U7(73)和结果
No. 1 配比 (A) 1.0(1) 吡啶量 (B) 13(2) 反应时 间(C) 1.5(3) 收率 (Y) 0.330
2
3
1.4(2)
1.8(3)
19(4)
25(6)
3.0(6)
1.0(2)
0.336
0.294
4
5
2.2(4)
2.6(5)
10(1)
16(3)
2.5(5)
0.5(1)
0.476
0.209
6
7
3.0(6)
3.4(7)
22(5)
28(7)
2.0(4)
3.5(7)
0.451
0.482
根据试验方案进行试验,其收率(Y)列于表的最后 一列,其中以第7号试验为最好,其工艺条件为配 比3.4,吡啶量28ml,反应时间3.5h。
•
•
t0=0.204,t1=0.96,t2=-0.67,t3=2.77
这表明三个因素中以X3(反应时间)对得率(Y)影 响最大,配比次之,吡啶量最小。 • 这些t 值都是随机变量,它们遵从tn-m-1分布。 若取 α=0.05 ,这时n=7,m=3, tn-m-1= 的临界值t3(0.05)=3.18。t 值大于该值的因素表示对方程有显著贡献,否则表示不显 著。今 均小于(0.05)=3.18 ,说明回归方程(2.18)的三个 变量至少有一个不起显著作用.于是我们将贡献最小的X2 删去,重新建立Y和X1及X3的线性回归方程,得
在阿魏酸的合成工艺考察中,为了提高产量,选 取了原料配比(A)、吡啶量(B)和反应时间(C)三个 因素,它们各取了7个水平如下:
原料配比(A):1.0,1.4,1.8,2.2,2.6,3.0,3.4 吡啶量(B)(ml):10,13,16,19,22,25,28 反应时间(C)(h):0.5,1.0,1.5,2.0,2.5,3.0,3.5
_
(8 6)
L11b1 L1M bm L1 y L21b1 L2 m bm L2 y L b L b L mm m my m1 1 N _ _ b0 y bi yi i 1
(8-7)
当各因素与响应值关系是非线性关系时,或存在因素 的交互作用时,可采用多项式回归分析的方法 例如各因素与响应值均为二次关系时的回归方程为: y=b0 bi xi bij xi x j bii xi 2
Y 0.169 0.0251X 1 0.0742 X 3
2 0.065262 , 三个t值分别为t0 2.12, t1 0.79, t3 2.91,
这时这三个t值遵从含四个自由度的t分布,临界值为 t4 (0.05) 2.78, 从而X1应从方程中剔除,然后对Y和X 3 建立回归方程 Y 0.2141 0.079 X 3 (8 13) 这里t3 3.34 t5 (0.05) 2.57, 0.063。因此,回归方 程(8-13)并非真正的最终模型,而是在线性框架下的 最终产物。 上述的分析只发现X3对Y有显著作用,其它两个因素均 没有显著作用,该结论与实际经验不吻合,因此猜想用 线性模型不一定符合实际。
均匀设计表任两列组成的试验方案一般并不等价
例如用U6(64)的1,3 和1,4列分别画图,得到下面的图 (a)和图 (b)。我们看到,(a)的点散布比较均匀,而(b)的 点散布并不均匀。均匀设计表的这一性质和正交表有很大 的不同,因此,每个均匀设计表必须有一个附加的使用表。
• 三、试验结果分析
将一个新变量引进回归模型,这时相应的F统计量必须大于Fin 将一个变量从回归模型中剔除,这时相应的F统计量必须小于Fout 将回归模型内的一个变量和回归模型外的一个变量交换位置。
设先用后退法来选变量.所谓后退法,就是开始将 所有的变量全部采用,然后逐步剔除对方程没有 显著贡献的变量,直到方程中所有的变量都有显 著贡献为止。 仍考虑线性模型,开始三个因素全部进入方程, 得(2.12).统计软件包通常还会提供每个变量的t值, t值越大(按绝对值计)表示该因素越重要.对本 例有
7个水平,需要安排7次试验,根据因素和水平,我们可以 选用U7(76)完成该试验。
U7(76)
列号
试验号
1 2 3 4 5 6 7
1 1 2 3 4 5 6 7
2 2 4 6 1 3 5 7
3 3 6 2 5 1 4 7
4 4 5 4 3 2 1 7
5 5 3 1 6 4 2 7
6 6 5 4 3 2 1 7
• 均匀设计的结果没有整齐可比性,分析结果 不能采用一般的方差分析方法,通常要用回归分 析或逐步回归分析的方法:
y b0 b1 x1 b2 x2 bm xm y在第k次试验的结果。
_ _ Lij xik x i xik x j i, j 1, 2,, m k 1 N _ _ Liy xik x i yk y i 1, 2,, m K 1 n
U6(64)的使用表
s
2 3 4
列
1 1 1 3 2 2
号
3 3 4
D
0.1ቤተ መጻሕፍቲ ባይዱ75 0.2656 0.2990
•
均匀设计有其独特的布(试验)点方式:
每个因素的每个水平做一次且仅做一次试验 任两个因素的试验点点在平面的格子点上,每行每列有且 仅有一个试验点
以上两个性质反映了均匀设计试验安排的“均衡性”,即对各 因素,每个因素的每个水平一视同仁。
我们可用线性回归模型来拟合上表的试验数据
解:这时n=7,组观测值为(0.330,1.0,13,1.5),(0.336, 7 1.4, 19,3.0) (0.482,3.4,29,3.5),它们的均值Lij 为:
x1 2.2 L11 4.48
_
x2 19 L12 16.8
_
i 1 i 1 j 1 i 1 m T m 2 (T Cm )
(8 9)
其中xi x j反映了因素间的交互效应,xi 2反映因素的二次项效应 ,通过变量代换(8-9)式可化为多元线性方程求 解。
即令 方程(8 9)化为
x1 xi x j (i 1, 2, m; j 1) y b0
均方
0.016257
F
3.29
0.004946
当 0.05时F表的临界值 Fm,n m1 ( ) F3,3 (0.05) 9.28 F 3.29 回归方程不可信。
• 现在用逐步回归分析的方法来筛选变量:
•
逐步回归是回归分析中的一种筛选变量的技术.开始它 将贡献最大的一个变量选入回归方程,并且预先确定两个 阈值Fin和Fout,用于决定变量能否入选或剔除.逐步回归在 每一步有三种可能的功能:
于是进一步考虑二次回归模型 Y 0 i X i ii X i2 ij X i X j
i 1 i 1 i j m m
(8 14)
这时方程中有9项(不算 0)。利用逐步回归技术求得回 归方程如下: Y 0.06232 0.251X 3 0.06 X 32 0.0235 X 1 X 3 其响应的 0.0217, R 2 97.77。 因素X3和交互作用X 1 X 3对Y有显著的影响 (8 15)
均匀设计法不再考虑“数据整齐可比”性,只考虑试验点 在试验范围内充分“均衡分散”
均匀设计属于近年发展起来的“伪蒙特卡罗方法”的 范筹。将经典的确定的单变量问题的计算方法推广后 用于多变量问题的计算时,计算量往往跟变量个数有 关,即使电脑再进步很多,这种方法仍无法实际应用, 乌拉母(S.Ulam)与冯诺依曼(J.von Neumann)在40 年代提出蒙特卡罗方法,即统计模拟方法,这个方法 的大意是将一个分析问题化为一个有同样解答的概率 问题,然后用统计模拟的方法来处理后面这个问题, 这样使一些困难的分析问题反而得到了解决,例如多 重定积分的近似计算。蒙特卡罗方法的关键是找一组 随机数作为统计模拟之用,所以这一方法的精度在于 随机数的均匀性与独立性。
第六章 均匀设计法
§6-1 基本原理
• 一、引言
• 正交试验设计利用:
均衡分散:试验点在试验范围内排列规律整齐 整齐可比:试验点在试验范围内散布均匀 可以进行部分试验而得到基本上反映全面情况的试验 结果,但是,当试验中因素数或水平数比较大时,正交试 验的次数也会很大。如5因素5水平,用正交表需要安排55 =25次试验。这时,可以选用均匀设计法,仅用5次试验 就可能得到能满足需要的结果
的估计 0.07, 于是回归方程为: Y 0.201 0.037 X 1 0.00343 X 2 0.0077 X 3
方差分析表
方差来源
回归 误差 总和 自由度
3 3 6
(8 12)
进一步对它做方差分析,其方差分析表如下:
平方和
0.048770 0.014838 0.063608
(8 10) (8 11)
l 1
bl xl
2 (T Cm )
在这种情况下,为了求得二次项和交互作用项,就不能 选用试验次数等于因素数的均匀设计表,二必须选用试 验次数大于或等于回归方程系数总数的U表了
§9-2 应用举例
利用均匀设计表来安排试验的步骤:
• (1)根据试验的目的,选择合适的因素和相应的水平。 • (2)选择适合该试验的均匀设计表,然后根据该表的使 用表从中选出列号,将因素分别安排到这些列号上,并将 这些因素的水平按所在列的指示分别对号,则试验就安排 好了
x3 2.0 L12 1.4 L33 7.0
_
y 0.3683 L1 y 0.2404 L2 y 0.5640 L3 y 0.5245
_
L22 252.0 L23 10.5
由于Lij L ji,故不必全部列出,将它们代入方程组中 可以解得 b1 0.037, b2 0.00343, b3 0.077 从而 a 0.3683 0.037 2.2 0.00343 19 0.077 2.0 0.201
3 3 6 2 5 1 4
4 6 5 4 3 2 1
每个均匀设计表都附有一个使用表,它指示我们如何从设计表 中选用适当的列,以及由这些列所组成的试验方案的均匀度。 下表是U6(64)的使用表。它告诉我们,若有两个因素,应选用1, 3两列来安排试验;若有三个因素,应选用1,2,3三列,…, 最后1列D表示刻划均匀度的偏差(discrepancy),偏差值越小, 表示均匀度越好。
• 二、均匀设计表
均匀设计表符号表示的意义
因素数
U7(76)
均匀表的代号 因素的水平数 试验次数
图9-1 两因素均匀设计布点图
如U6(64)表示要做次6试验,每个因素有6个水平, 该表有4列。
U6(64)
试验号
列号
1 2 3 4 5 6
1 1 2 3 4 5 6
2 2 4 6 1 3 5
^
(8 1)
令xik 代表因素xi 在第k次试验时取的值,yk 表示响应值 (8 2) (8 3) (8 4) (8 5)
Lyy yk y i 1
N _
2
xi xi
i 1
_
N
i 1, 2, m
1 N y yk N i 1 回归方程组系数由下列正规方程组决定:
1978年,七机部由于导弹设计的要求,提出了一个五因 素的试验,希望每个因素的水平数要多于10,而试验总数 又不超过50,显然优选法和正交设计都不能用,方开泰与 王元经过几个月的共同研究,提出了一个新的试验设计, 即所谓“均匀设计”,将这一方法用于导弹设计,取得了 成效
均匀设计法愈正交设计法的不同:
U7(76)使用表
因素数 2 3 4 5 6 1 1 1 1 1 3 2 2 2 2 3 3 3 3 6 4 4 6 5 6 列号
U7(76)共有6列,现在有3个因素,根据其使用表,应 该取1,2,3列安排试验。
制备阿魏酸的试验方案U7(73)和结果
No. 1 配比 (A) 1.0(1) 吡啶量 (B) 13(2) 反应时 间(C) 1.5(3) 收率 (Y) 0.330
2
3
1.4(2)
1.8(3)
19(4)
25(6)
3.0(6)
1.0(2)
0.336
0.294
4
5
2.2(4)
2.6(5)
10(1)
16(3)
2.5(5)
0.5(1)
0.476
0.209
6
7
3.0(6)
3.4(7)
22(5)
28(7)
2.0(4)
3.5(7)
0.451
0.482
根据试验方案进行试验,其收率(Y)列于表的最后 一列,其中以第7号试验为最好,其工艺条件为配 比3.4,吡啶量28ml,反应时间3.5h。
•
•
t0=0.204,t1=0.96,t2=-0.67,t3=2.77
这表明三个因素中以X3(反应时间)对得率(Y)影 响最大,配比次之,吡啶量最小。 • 这些t 值都是随机变量,它们遵从tn-m-1分布。 若取 α=0.05 ,这时n=7,m=3, tn-m-1= 的临界值t3(0.05)=3.18。t 值大于该值的因素表示对方程有显著贡献,否则表示不显 著。今 均小于(0.05)=3.18 ,说明回归方程(2.18)的三个 变量至少有一个不起显著作用.于是我们将贡献最小的X2 删去,重新建立Y和X1及X3的线性回归方程,得
在阿魏酸的合成工艺考察中,为了提高产量,选 取了原料配比(A)、吡啶量(B)和反应时间(C)三个 因素,它们各取了7个水平如下:
原料配比(A):1.0,1.4,1.8,2.2,2.6,3.0,3.4 吡啶量(B)(ml):10,13,16,19,22,25,28 反应时间(C)(h):0.5,1.0,1.5,2.0,2.5,3.0,3.5
_
(8 6)
L11b1 L1M bm L1 y L21b1 L2 m bm L2 y L b L b L mm m my m1 1 N _ _ b0 y bi yi i 1
(8-7)
当各因素与响应值关系是非线性关系时,或存在因素 的交互作用时,可采用多项式回归分析的方法 例如各因素与响应值均为二次关系时的回归方程为: y=b0 bi xi bij xi x j bii xi 2
Y 0.169 0.0251X 1 0.0742 X 3
2 0.065262 , 三个t值分别为t0 2.12, t1 0.79, t3 2.91,
这时这三个t值遵从含四个自由度的t分布,临界值为 t4 (0.05) 2.78, 从而X1应从方程中剔除,然后对Y和X 3 建立回归方程 Y 0.2141 0.079 X 3 (8 13) 这里t3 3.34 t5 (0.05) 2.57, 0.063。因此,回归方 程(8-13)并非真正的最终模型,而是在线性框架下的 最终产物。 上述的分析只发现X3对Y有显著作用,其它两个因素均 没有显著作用,该结论与实际经验不吻合,因此猜想用 线性模型不一定符合实际。
均匀设计表任两列组成的试验方案一般并不等价
例如用U6(64)的1,3 和1,4列分别画图,得到下面的图 (a)和图 (b)。我们看到,(a)的点散布比较均匀,而(b)的 点散布并不均匀。均匀设计表的这一性质和正交表有很大 的不同,因此,每个均匀设计表必须有一个附加的使用表。
• 三、试验结果分析
将一个新变量引进回归模型,这时相应的F统计量必须大于Fin 将一个变量从回归模型中剔除,这时相应的F统计量必须小于Fout 将回归模型内的一个变量和回归模型外的一个变量交换位置。
设先用后退法来选变量.所谓后退法,就是开始将 所有的变量全部采用,然后逐步剔除对方程没有 显著贡献的变量,直到方程中所有的变量都有显 著贡献为止。 仍考虑线性模型,开始三个因素全部进入方程, 得(2.12).统计软件包通常还会提供每个变量的t值, t值越大(按绝对值计)表示该因素越重要.对本 例有
7个水平,需要安排7次试验,根据因素和水平,我们可以 选用U7(76)完成该试验。
U7(76)
列号
试验号
1 2 3 4 5 6 7
1 1 2 3 4 5 6 7
2 2 4 6 1 3 5 7
3 3 6 2 5 1 4 7
4 4 5 4 3 2 1 7
5 5 3 1 6 4 2 7
6 6 5 4 3 2 1 7
• 均匀设计的结果没有整齐可比性,分析结果 不能采用一般的方差分析方法,通常要用回归分 析或逐步回归分析的方法:
y b0 b1 x1 b2 x2 bm xm y在第k次试验的结果。
_ _ Lij xik x i xik x j i, j 1, 2,, m k 1 N _ _ Liy xik x i yk y i 1, 2,, m K 1 n
U6(64)的使用表
s
2 3 4
列
1 1 1 3 2 2
号
3 3 4
D
0.1ቤተ መጻሕፍቲ ባይዱ75 0.2656 0.2990
•
均匀设计有其独特的布(试验)点方式:
每个因素的每个水平做一次且仅做一次试验 任两个因素的试验点点在平面的格子点上,每行每列有且 仅有一个试验点
以上两个性质反映了均匀设计试验安排的“均衡性”,即对各 因素,每个因素的每个水平一视同仁。
我们可用线性回归模型来拟合上表的试验数据
解:这时n=7,组观测值为(0.330,1.0,13,1.5),(0.336, 7 1.4, 19,3.0) (0.482,3.4,29,3.5),它们的均值Lij 为:
x1 2.2 L11 4.48
_
x2 19 L12 16.8
_
i 1 i 1 j 1 i 1 m T m 2 (T Cm )
(8 9)
其中xi x j反映了因素间的交互效应,xi 2反映因素的二次项效应 ,通过变量代换(8-9)式可化为多元线性方程求 解。
即令 方程(8 9)化为
x1 xi x j (i 1, 2, m; j 1) y b0
均方
0.016257
F
3.29
0.004946
当 0.05时F表的临界值 Fm,n m1 ( ) F3,3 (0.05) 9.28 F 3.29 回归方程不可信。
• 现在用逐步回归分析的方法来筛选变量:
•
逐步回归是回归分析中的一种筛选变量的技术.开始它 将贡献最大的一个变量选入回归方程,并且预先确定两个 阈值Fin和Fout,用于决定变量能否入选或剔除.逐步回归在 每一步有三种可能的功能:
于是进一步考虑二次回归模型 Y 0 i X i ii X i2 ij X i X j
i 1 i 1 i j m m
(8 14)
这时方程中有9项(不算 0)。利用逐步回归技术求得回 归方程如下: Y 0.06232 0.251X 3 0.06 X 32 0.0235 X 1 X 3 其响应的 0.0217, R 2 97.77。 因素X3和交互作用X 1 X 3对Y有显著的影响 (8 15)
均匀设计法不再考虑“数据整齐可比”性,只考虑试验点 在试验范围内充分“均衡分散”
均匀设计属于近年发展起来的“伪蒙特卡罗方法”的 范筹。将经典的确定的单变量问题的计算方法推广后 用于多变量问题的计算时,计算量往往跟变量个数有 关,即使电脑再进步很多,这种方法仍无法实际应用, 乌拉母(S.Ulam)与冯诺依曼(J.von Neumann)在40 年代提出蒙特卡罗方法,即统计模拟方法,这个方法 的大意是将一个分析问题化为一个有同样解答的概率 问题,然后用统计模拟的方法来处理后面这个问题, 这样使一些困难的分析问题反而得到了解决,例如多 重定积分的近似计算。蒙特卡罗方法的关键是找一组 随机数作为统计模拟之用,所以这一方法的精度在于 随机数的均匀性与独立性。
第六章 均匀设计法
§6-1 基本原理
• 一、引言
• 正交试验设计利用:
均衡分散:试验点在试验范围内排列规律整齐 整齐可比:试验点在试验范围内散布均匀 可以进行部分试验而得到基本上反映全面情况的试验 结果,但是,当试验中因素数或水平数比较大时,正交试 验的次数也会很大。如5因素5水平,用正交表需要安排55 =25次试验。这时,可以选用均匀设计法,仅用5次试验 就可能得到能满足需要的结果
的估计 0.07, 于是回归方程为: Y 0.201 0.037 X 1 0.00343 X 2 0.0077 X 3
方差分析表
方差来源
回归 误差 总和 自由度
3 3 6
(8 12)
进一步对它做方差分析,其方差分析表如下:
平方和
0.048770 0.014838 0.063608