6均匀设计
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用spss软件,使用回归分析中变量筛选的方法,比如 “向后法”,得到推荐的模型为:
yˆ 0.2142 0.0792x3
这个结果与人们的经验不符。
2019/10/26
25
然后,我们尝试用二次回归模型来匹配这些数据:
y 0 1x1 2 x2 3x3 11x12 22 x22 33x32 12 x1x2 13x1x3 23x2 x3
3.均匀设计表任两列组成的试验方案一般并 不等价。
2019/10/26
16
6.2.3 使用均匀设计表
1.刻划均匀度用偏差D,越小,均匀度越好。 偏差D可对任一均匀设计表 U n或 中U任n* 意二列、任意三列、 …进行计算,从中选出使D达到最小的列作为使用列,从 而形成使用表。
如下表就是均匀设计表 U7的(76使) 用表,s表示因子数。
6
5
4
3
2
11 2 3 4 5 6
6.2.1
2019/10/26
均匀设计表任两列组成的试验方案一般不等价
15
均匀设计有其独特的布(试验)点方式:
1.每个因素的每个水平做且仅做一次试验。
2.任两个因素的试验点点在平面的格子点上, 每行每列有且仅有一个试验点。
此二性质反映了均匀设计试验安排的“均衡”, 即对各因素,每个因素的每个水平一视同仁。
2019/10/26
20
2.利用均匀设计表来安排试验的步骤:
(1)根据试验目的,选择合适的因素和相应的水平。 (2)选择适合该试验的均匀设计表,然后根据该表
的使用表从中选出列号,将因素分别安排到这些列 号上,并将这些因素的水平按所在列的指示分别对 号,试验就安排好了。
详见下例:
2019/10/26
21
阿魏酸是生产用于治疗心脑血管疾病及白细胞减少等 症药品的基本原料。在阿魏酸的合成工艺考察中,为 了提高产量,选取了原料配比(A)、催化剂量(B)和反 应时间(C)三个因素,它们各取了7个水平,具体如下:
原料配比(A):1.0,1.4,1.8,2.2,2.6,3.0,3.4
催化剂量(B)(ml):10,13,16,19,22,25,28
6.1.1 均匀设计概述
例6.1 为了研究环境污染对人体的危害,考察六种重金属Cd、 Cu、Zn、Ni、Cr、Pb对老鼠寿命的影响,考察老鼠体内某种 细胞的死亡率。将每一种重金属看成一个因素,每一因素取17 个水平。试验如何设计? 实验目标?试验指标?因素与水平? 如果采用正交设计,那么至少要进行172=289次试验。 能否减少试验次数?均匀设计便是针对这种情况提出的一种设 计方法。
则表的第k行、j列的数字=MOD(n,hj*k)——excel取余数函数; 故本例中第1列的数据就是1,2,…,9;
第2列的数据就是2k/n的余数。
……
具体操作时有均匀设计软件帮助
2019/10/26
13
2.另一类均匀设计表
U
* n
(q
m
)
对于n为合数的表,一般列数较少,不太适用。
譬如n=6时,n=?
第六章 均匀设计
(Uniform Design)
2019/10/26
1
回顾正交设计
一个问题:正交设计的适用条件 是什么? 最少试验次数=水平数2=q2
故正交设计要求:因素数目多、水平少。
遇到不适用的情况怎么办? 均匀设计
2019/10/26
2
第六章 均匀设计
§6.1 均匀设计表 §6.2 均匀设计的使用表 §6.3 均匀设计的数据分析 §6.4 均匀混料设计(了解)
2019/10/26
7
§6.1 均匀设计概述及均匀设计表
6.1.1 均匀设计概述
均匀设计是用均匀设计表安排试验,而用回归分析 进行数据分析的一种试验设计方法。
基本想法:使试验点在因素空间中具有较好的均匀 分散性。
均匀设计同正交设计一样,也是部分因素设计的重 要方法之一。
适用范围:试验因素多、因素取值范围大、因素水 平多(一般不少于5),而试验次数相对较少的情况。
23
§6.3 均匀设计数据分析
均匀设计的试验数据的处理通常采用回归分 析的方法,回归分析模型可采用线性回归模 型、二次回归模型或其它非线性回归模型, 可以通过逐步回归的方法筛选变量。
2019/10/26
24
6.3.1 用回归法拟合模型
对阿魏酸一例进行数据分析: 首先,考虑线性回归模型:
y 0 1x1 2 x2 3x3
与均匀设计几乎同期出现在西方流行的“拉丁 超立方体抽样”与均匀设计在本质上是一致的。
2019/10/26
5
王元
方开泰
中国科学院数学研究所 中国科学院院士
2019/10/26
中国科学院应用数学研究所 北京师范大学-香港浸会大学联合国际学院 美国数理统计科学院终身院士 美国统计学会终身院士
6
§6.1 均匀设计概述及均匀设计表
反应时间(C)(h):0.5,1.0,1.5,2.0,2.5,3.0,3.5
分析:
7个水平,需要安排7次试验,根据因素和水平,我们
可以选用7水平均匀设计表
完成该试验。
具体表的使用,应该根据偏差D来确定,应使U7 (74 ) , 实验方案列于下表。
2019/10/26
ቤተ መጻሕፍቲ ባይዱ22
2019/10/26
因为x1x3的回归系数是正的,而x1* = 3.4,从而有:
Yˆ(3.4, x3) 0.06232 0.3309x3 0.06x32
可通过求导数的办法求得,在x3* = 2.7575达到最大值 。 所以:在x1* = 3.4和 x3* = 2.7575处估计响应的最大值 为205191/1.08/256 % 。它比7个试验点的最好值48.2%还大。 28
均匀设计
因素的最大数
Un(qm)
试验次数、行数
2019/10/26
水平数
10
均匀设计表U7(76)
该表的每一列都是 1,2,3,4,5的,6,重7 新排列.
7行、7水平 末行全是7。
2019/10/26
11
该表的特点是:
(1)对任意的n都可以构造均匀设计表,并且行数n与水
平数q相同,因此试验次数少;
本例中有六种重金属可看作六个因素,每一因素取17个水 平,其水平值均依次为:(单位:ppm) 0.01,0.05,0.1,0.2,0.4,0.8,1,2,4,5,8,10,12, 14, 16,18,20
注意:水平必须按大小顺序排列
4.选择均匀设计表,利用使用表进行表头设计
2019/10/26
2019/10/26
3
2019/10/26 但仅均匀分散,不整齐可比,因此不能进行直观分4析。
前言
均匀设计(Uniform Design)是由中国数学家王元 和方开泰于1978年首次提出的,采用均匀设计表 来安排试验的方法,最初在我国导弹设计中应用 ,经过20多年的发展和推广,均匀设计已在我 国有较广泛的普及,并在医药、生物、化工、航 天、电子、军事工程等诸多领域中使用,取得了 显著的经济和社会效益。
1 p2
1
1 pk
(如n=9,由于9=32,所以列数为 9 1 1 6 列)。
3
2019/10/26
12
表的构造步骤
前提:给定试验次数n,如n=9;
1.确定第一行:由1…n之间与n互素(两者的最大公约数为1)的 整数构成。
故本例中第一行是:1,2,4,5,7,8 2.其余各行数据由第一行生成: 记第一行数据为h1,…,hr,
2019/10/26
8
6.1.2 均匀设计表Un(qm)
均匀设计表是均匀设计的基本工具,它是用华罗庚 提出的“数论”方法编制的。
1. 均匀设计表Un(qm) 均匀设计表用代号Un(qm)表示,U表示均匀设计 表,它有n行,m列,每列的水平数为q。
对照着正交设计表看均匀设计表
2019/10/26
9
均匀设计表
所布的点更 具代201表9/1性0/26
均匀设计表U76*((7666) )
U
* 6
(66
)
14
§6.2 均匀设计的使用表
§ 6.2.1 均匀设计表的使用
在用均匀设计表安排试验时,因为任意两列的均匀性是不同 的,用哪些列是有讲究的。
譬如用 U6*安(66排) 两个因子时,用1,3列与用1,6列的均匀性是 不同的,试验点在平面上的分布见图6.2.1。可见前者分布比 较均匀。
由于n=21×31,经计算6 1 1 1 1 2 ,所以列数只有2列。
2 3
因为均匀设计表U7(76)最后一行全是“7”组成的,故划去这
一行,相当于减少一个水平。所以建议用U7(76)划去最后一行
的方法得到,为区别起见,记为
U
* 6
(66
)
*表示均匀设 计表有更好 的均匀性,
F 43.88
p 0.006
26
具有
模型
R2 0.978, s 0.02174,
tx3 6.41, tx32 5.64, tx1x3 4.88.
yˆ 0.06232 0.25x3 0.06x32 0.0235x1x3
中的三项,在 5%的水平下都是显著的。
2019/10/26
可见,均匀设计表只用部分
若从中选出5列使用,就会使偏差D过大,故建议不使用。
把使用表中不出现的列剔去,并重新编号,可以得到 U7及(74 ) 其使用表。
2019/10/26
17
均匀设计表 U7 (74 ) 及其使用表
使用表说明:当安排2个因 子时,第1、3列是最佳的选择, 若安排4个因子,第1、2、3、 4是最佳选择。
讨论:
因素 x2 没有给响应Y予显著的贡献,可以 选x2为其中点,即x2 = 19 ml.
求出的x1* = 3.4 在边界上, 需扩大x1的试验上限。
故,在x1 = 3.4和 x3 = 2.7575的邻域,追加一些 试验是必要的。
在最后一步,一些优化算法是很有用的。 否则要用到求偏导数的办法得到x1和x3的最值。
说明:若实验次数n固定,当因素数目s增大 时,均匀设计表的偏差D也将随之增大,所以 在实际使用时,因素数目s一般等于试验次数 n的一半,即n=2s(或s=[n/2])。
2019/10/26
18
均匀设计表U7(74)与
U
* 7
(7
4
)
的使用表
来自于U8(84)去掉一行
由表上的D值可知,在表上加“*”的比不加“*”的均匀, 因此在实际中我们首先使用加“*”的均匀设计表——但此 种表可安排的因子较少。
27
6.3.2 寻找最佳的因素水平组合
Yˆ(x1*, x3*) max Yˆ(x1, x3 )
因为:Yˆ(x1, x3) 0.06232 0.25x3 0.06x32 0.0235x1x3
这里求取max的区域为:1 x1 3.4, 0.5 x3 3.5
使用“向前”的变量选择法,我们发现适宜的模型:
yˆ 0.06232 0.25x3 0.06x32 0.0235x1x3
来源
回归 误差 总和
2019/10/26
方差分析(ANOVA) 表
df SS
MS
3 0.062190 0.020730
3 0.014170 0.000472
6 0.063608
对于各因子不等水平的均匀设计,可以直接采用混合水平 均匀设计表,或者采用拟水平法设计。
2019/10/26
19
说明:新均匀设计表
由于基于CD2偏差和WD2偏差的均匀设计表具有更好的均 匀性,方开泰教授在2000年左右研制了2580多张新的均匀 设计表。
请参见方开泰教授的“均匀设计网站”: .hk/UniformDesign/查询。
2019/10/26
29
又例: 为了研究环境污染对人体的危害, 考察六种重金属Cd、Cu、Zn、Ni、Cr、 Pb对老鼠寿命的影响,为此考察老鼠体内 某种细胞的死亡率,为了了解误差,每一 水平组合重复三次。
2019/10/26
30
一、试验设计
1.明确试验目的:了解六种重金属Cd、Cu、Zn、Ni、 Cr、Pb对老鼠寿命的影响。 2.明确试验指标:老鼠体内某种细胞的死亡率。 3.确定因素与水平:因素都是定量的。水平可以是等间 隔的,也可以是不等间隔的。
(2)列数可按下面规则给出:
当n为素数时,列数最多等于n-1;
(如上面n=7,所以列数最多为n-1=6列);
当n是合数时,设
n
p l1 1
p l2 2
p lk k
,其中
p1 ,
p2 ,,
pk 为素
数,l1, l2 ,, lk 为正整数,那么列数为
n1
1 p1
1
yˆ 0.2142 0.0792x3
这个结果与人们的经验不符。
2019/10/26
25
然后,我们尝试用二次回归模型来匹配这些数据:
y 0 1x1 2 x2 3x3 11x12 22 x22 33x32 12 x1x2 13x1x3 23x2 x3
3.均匀设计表任两列组成的试验方案一般并 不等价。
2019/10/26
16
6.2.3 使用均匀设计表
1.刻划均匀度用偏差D,越小,均匀度越好。 偏差D可对任一均匀设计表 U n或 中U任n* 意二列、任意三列、 …进行计算,从中选出使D达到最小的列作为使用列,从 而形成使用表。
如下表就是均匀设计表 U7的(76使) 用表,s表示因子数。
6
5
4
3
2
11 2 3 4 5 6
6.2.1
2019/10/26
均匀设计表任两列组成的试验方案一般不等价
15
均匀设计有其独特的布(试验)点方式:
1.每个因素的每个水平做且仅做一次试验。
2.任两个因素的试验点点在平面的格子点上, 每行每列有且仅有一个试验点。
此二性质反映了均匀设计试验安排的“均衡”, 即对各因素,每个因素的每个水平一视同仁。
2019/10/26
20
2.利用均匀设计表来安排试验的步骤:
(1)根据试验目的,选择合适的因素和相应的水平。 (2)选择适合该试验的均匀设计表,然后根据该表
的使用表从中选出列号,将因素分别安排到这些列 号上,并将这些因素的水平按所在列的指示分别对 号,试验就安排好了。
详见下例:
2019/10/26
21
阿魏酸是生产用于治疗心脑血管疾病及白细胞减少等 症药品的基本原料。在阿魏酸的合成工艺考察中,为 了提高产量,选取了原料配比(A)、催化剂量(B)和反 应时间(C)三个因素,它们各取了7个水平,具体如下:
原料配比(A):1.0,1.4,1.8,2.2,2.6,3.0,3.4
催化剂量(B)(ml):10,13,16,19,22,25,28
6.1.1 均匀设计概述
例6.1 为了研究环境污染对人体的危害,考察六种重金属Cd、 Cu、Zn、Ni、Cr、Pb对老鼠寿命的影响,考察老鼠体内某种 细胞的死亡率。将每一种重金属看成一个因素,每一因素取17 个水平。试验如何设计? 实验目标?试验指标?因素与水平? 如果采用正交设计,那么至少要进行172=289次试验。 能否减少试验次数?均匀设计便是针对这种情况提出的一种设 计方法。
则表的第k行、j列的数字=MOD(n,hj*k)——excel取余数函数; 故本例中第1列的数据就是1,2,…,9;
第2列的数据就是2k/n的余数。
……
具体操作时有均匀设计软件帮助
2019/10/26
13
2.另一类均匀设计表
U
* n
(q
m
)
对于n为合数的表,一般列数较少,不太适用。
譬如n=6时,n=?
第六章 均匀设计
(Uniform Design)
2019/10/26
1
回顾正交设计
一个问题:正交设计的适用条件 是什么? 最少试验次数=水平数2=q2
故正交设计要求:因素数目多、水平少。
遇到不适用的情况怎么办? 均匀设计
2019/10/26
2
第六章 均匀设计
§6.1 均匀设计表 §6.2 均匀设计的使用表 §6.3 均匀设计的数据分析 §6.4 均匀混料设计(了解)
2019/10/26
7
§6.1 均匀设计概述及均匀设计表
6.1.1 均匀设计概述
均匀设计是用均匀设计表安排试验,而用回归分析 进行数据分析的一种试验设计方法。
基本想法:使试验点在因素空间中具有较好的均匀 分散性。
均匀设计同正交设计一样,也是部分因素设计的重 要方法之一。
适用范围:试验因素多、因素取值范围大、因素水 平多(一般不少于5),而试验次数相对较少的情况。
23
§6.3 均匀设计数据分析
均匀设计的试验数据的处理通常采用回归分 析的方法,回归分析模型可采用线性回归模 型、二次回归模型或其它非线性回归模型, 可以通过逐步回归的方法筛选变量。
2019/10/26
24
6.3.1 用回归法拟合模型
对阿魏酸一例进行数据分析: 首先,考虑线性回归模型:
y 0 1x1 2 x2 3x3
与均匀设计几乎同期出现在西方流行的“拉丁 超立方体抽样”与均匀设计在本质上是一致的。
2019/10/26
5
王元
方开泰
中国科学院数学研究所 中国科学院院士
2019/10/26
中国科学院应用数学研究所 北京师范大学-香港浸会大学联合国际学院 美国数理统计科学院终身院士 美国统计学会终身院士
6
§6.1 均匀设计概述及均匀设计表
反应时间(C)(h):0.5,1.0,1.5,2.0,2.5,3.0,3.5
分析:
7个水平,需要安排7次试验,根据因素和水平,我们
可以选用7水平均匀设计表
完成该试验。
具体表的使用,应该根据偏差D来确定,应使U7 (74 ) , 实验方案列于下表。
2019/10/26
ቤተ መጻሕፍቲ ባይዱ22
2019/10/26
因为x1x3的回归系数是正的,而x1* = 3.4,从而有:
Yˆ(3.4, x3) 0.06232 0.3309x3 0.06x32
可通过求导数的办法求得,在x3* = 2.7575达到最大值 。 所以:在x1* = 3.4和 x3* = 2.7575处估计响应的最大值 为205191/1.08/256 % 。它比7个试验点的最好值48.2%还大。 28
均匀设计
因素的最大数
Un(qm)
试验次数、行数
2019/10/26
水平数
10
均匀设计表U7(76)
该表的每一列都是 1,2,3,4,5的,6,重7 新排列.
7行、7水平 末行全是7。
2019/10/26
11
该表的特点是:
(1)对任意的n都可以构造均匀设计表,并且行数n与水
平数q相同,因此试验次数少;
本例中有六种重金属可看作六个因素,每一因素取17个水 平,其水平值均依次为:(单位:ppm) 0.01,0.05,0.1,0.2,0.4,0.8,1,2,4,5,8,10,12, 14, 16,18,20
注意:水平必须按大小顺序排列
4.选择均匀设计表,利用使用表进行表头设计
2019/10/26
2019/10/26
3
2019/10/26 但仅均匀分散,不整齐可比,因此不能进行直观分4析。
前言
均匀设计(Uniform Design)是由中国数学家王元 和方开泰于1978年首次提出的,采用均匀设计表 来安排试验的方法,最初在我国导弹设计中应用 ,经过20多年的发展和推广,均匀设计已在我 国有较广泛的普及,并在医药、生物、化工、航 天、电子、军事工程等诸多领域中使用,取得了 显著的经济和社会效益。
1 p2
1
1 pk
(如n=9,由于9=32,所以列数为 9 1 1 6 列)。
3
2019/10/26
12
表的构造步骤
前提:给定试验次数n,如n=9;
1.确定第一行:由1…n之间与n互素(两者的最大公约数为1)的 整数构成。
故本例中第一行是:1,2,4,5,7,8 2.其余各行数据由第一行生成: 记第一行数据为h1,…,hr,
2019/10/26
8
6.1.2 均匀设计表Un(qm)
均匀设计表是均匀设计的基本工具,它是用华罗庚 提出的“数论”方法编制的。
1. 均匀设计表Un(qm) 均匀设计表用代号Un(qm)表示,U表示均匀设计 表,它有n行,m列,每列的水平数为q。
对照着正交设计表看均匀设计表
2019/10/26
9
均匀设计表
所布的点更 具代201表9/1性0/26
均匀设计表U76*((7666) )
U
* 6
(66
)
14
§6.2 均匀设计的使用表
§ 6.2.1 均匀设计表的使用
在用均匀设计表安排试验时,因为任意两列的均匀性是不同 的,用哪些列是有讲究的。
譬如用 U6*安(66排) 两个因子时,用1,3列与用1,6列的均匀性是 不同的,试验点在平面上的分布见图6.2.1。可见前者分布比 较均匀。
由于n=21×31,经计算6 1 1 1 1 2 ,所以列数只有2列。
2 3
因为均匀设计表U7(76)最后一行全是“7”组成的,故划去这
一行,相当于减少一个水平。所以建议用U7(76)划去最后一行
的方法得到,为区别起见,记为
U
* 6
(66
)
*表示均匀设 计表有更好 的均匀性,
F 43.88
p 0.006
26
具有
模型
R2 0.978, s 0.02174,
tx3 6.41, tx32 5.64, tx1x3 4.88.
yˆ 0.06232 0.25x3 0.06x32 0.0235x1x3
中的三项,在 5%的水平下都是显著的。
2019/10/26
可见,均匀设计表只用部分
若从中选出5列使用,就会使偏差D过大,故建议不使用。
把使用表中不出现的列剔去,并重新编号,可以得到 U7及(74 ) 其使用表。
2019/10/26
17
均匀设计表 U7 (74 ) 及其使用表
使用表说明:当安排2个因 子时,第1、3列是最佳的选择, 若安排4个因子,第1、2、3、 4是最佳选择。
讨论:
因素 x2 没有给响应Y予显著的贡献,可以 选x2为其中点,即x2 = 19 ml.
求出的x1* = 3.4 在边界上, 需扩大x1的试验上限。
故,在x1 = 3.4和 x3 = 2.7575的邻域,追加一些 试验是必要的。
在最后一步,一些优化算法是很有用的。 否则要用到求偏导数的办法得到x1和x3的最值。
说明:若实验次数n固定,当因素数目s增大 时,均匀设计表的偏差D也将随之增大,所以 在实际使用时,因素数目s一般等于试验次数 n的一半,即n=2s(或s=[n/2])。
2019/10/26
18
均匀设计表U7(74)与
U
* 7
(7
4
)
的使用表
来自于U8(84)去掉一行
由表上的D值可知,在表上加“*”的比不加“*”的均匀, 因此在实际中我们首先使用加“*”的均匀设计表——但此 种表可安排的因子较少。
27
6.3.2 寻找最佳的因素水平组合
Yˆ(x1*, x3*) max Yˆ(x1, x3 )
因为:Yˆ(x1, x3) 0.06232 0.25x3 0.06x32 0.0235x1x3
这里求取max的区域为:1 x1 3.4, 0.5 x3 3.5
使用“向前”的变量选择法,我们发现适宜的模型:
yˆ 0.06232 0.25x3 0.06x32 0.0235x1x3
来源
回归 误差 总和
2019/10/26
方差分析(ANOVA) 表
df SS
MS
3 0.062190 0.020730
3 0.014170 0.000472
6 0.063608
对于各因子不等水平的均匀设计,可以直接采用混合水平 均匀设计表,或者采用拟水平法设计。
2019/10/26
19
说明:新均匀设计表
由于基于CD2偏差和WD2偏差的均匀设计表具有更好的均 匀性,方开泰教授在2000年左右研制了2580多张新的均匀 设计表。
请参见方开泰教授的“均匀设计网站”: .hk/UniformDesign/查询。
2019/10/26
29
又例: 为了研究环境污染对人体的危害, 考察六种重金属Cd、Cu、Zn、Ni、Cr、 Pb对老鼠寿命的影响,为此考察老鼠体内 某种细胞的死亡率,为了了解误差,每一 水平组合重复三次。
2019/10/26
30
一、试验设计
1.明确试验目的:了解六种重金属Cd、Cu、Zn、Ni、 Cr、Pb对老鼠寿命的影响。 2.明确试验指标:老鼠体内某种细胞的死亡率。 3.确定因素与水平:因素都是定量的。水平可以是等间 隔的,也可以是不等间隔的。
(2)列数可按下面规则给出:
当n为素数时,列数最多等于n-1;
(如上面n=7,所以列数最多为n-1=6列);
当n是合数时,设
n
p l1 1
p l2 2
p lk k
,其中
p1 ,
p2 ,,
pk 为素
数,l1, l2 ,, lk 为正整数,那么列数为
n1
1 p1
1