均匀设计与均匀设计表之欧阳家百创编
[物理]第七章 均匀设计
为点集{ x1 , x2 ,, xn }在[0,1]m中的偏差(D),或星偏差。
2018/11/28 11
偏差(D)的缺点 用(星)偏差来度量均匀性的缺点之一是不够灵敏, 有时明显不同的两个均匀设计会出现相同的偏差; 缺点之二是与原点有关,所有矩形都从原点开始。 为了克服上述偏差的缺点,人们有研究出很多其它的 偏差度量方法。 其它的偏差 CD2——中心化L2偏差 WD2——可卷的L2偏差 MD2——修正的L2偏差 SD2——对称化L2偏差 其中,用的最多的是CD2偏差和WD2偏差。后来方开泰 教授新研制的均匀设计表大都基于最小的CD2偏差。
1
1
2018/11/28
8
§7.2 均匀设计的使用表
7.2.1 均匀设计表的使用
在用均匀设计表安排试验时,因为任意两列的均匀性是不 同的,用哪些列是有讲究的。
* 譬如用 U 6 (66 ) 安排两个因子时,用1,3列与用1,6列的均匀 性是不同的,试验点在平面上的分布见图7.2.1。前者分布比 较均匀。
2018/11/28 12
7.2.3 使用均匀设计表
* 偏差D可对任一均匀设计表 U n 或 U n 中任意二列、任 意三列、…进行计算,从中选出使D达到最小的列作为使 用列,从而形成使用表。
如下表就是 U 7 (76 ) 的使用表,s表示因子数。 均匀设计表 U 7 (76 ) 的使用表
若从中选出5列使用,就会使偏差D过大,故建议不使 用,把使用表中不出现的列剔去,并重新编号,可以得到 U 7 (7 4 ) 及其使用表。
对于n为合数的表,一般列数较少,不太适用。 譬如n=6时,由于n=2×3,经计算 6 1 2 1 3 2 ,所 以列数只有2列。 因为均匀设计表U7(76)最后一行全是“7”组成的,故划 去这一行,相当于减少一个水平。所以建议用U7(76)划去
均匀设计法PPT课件
b x 数 的绝对值不能直接进行比较,必须将各回归系数标准化,按式(8-15)求出标准回
归系数 ,然后才能通过比i较
i
xi
y
y
b'i b'的绝对值来判断各因子影响的大小。
i
26
第26页/共44页
标准回归系数
bi' bi Lij / Lyy
(8―15)
标准回系数 与因子 所' 用单位无关,其绝对值越大,表示该因子对 值的影响越大。
j 1
。f u m
Qe QT U
第24页/共44页
(8―11)
(8-12) (8-13)
24
自由度
f e 从而n统计量m 1
给定显著性水平F,从附表2查U出
/
m
检验临界值
Qe /(n m 1)
F ( fu , fe )
,若 (8-14)
F
F F ( fu , f e )
我们可以在显著性水平下 ,认为所建立的回归方程是有显著意义的。反之,则
用的条件下,只需选用实验次数等于因子数的均匀设计表来安排实验就可以的。而 当要考虑因子高次项与因子之间的交互作用时,需用多项式回归来描述指标函数。 若研究的因子数因子数为 ,在回归方程中,一次项与二次项各
m
13
第13页/共44页
14
m 2m C C 有 项,交互效应项有 项,共有( )项2,因此至少要选用有( )次2实验的均匀设
U 5 (54 ) U 5 (54 ) 则U正表5好(的5每4第列)1安列排和一第个2列因;子若。有又3如个前因面子提,到则的将因子表安,排如在果第只1,安2,排4列2因;子若,有则4个可因由子,
的使用表查得应将这2个因子分别
第10章 均匀设计
S i g. .134 .409 .553 .069 .101 .474 .044 .010 .021
3.关联度分析
• 有时由于试验次数少,试验方案与试验结果难以 建立明确的回归方程,因而各因素试验结果的影 响也无从知道。
• 我们将灰色系统理论中的关联度分析用于均匀设 计的试验数据处理。在试验次数不多的情况下, 可较好地提示出各因素对试验结果影响的大小。
30
300
60
500
30
700
60
Байду номын сангаас
900
20
1100
50
1300
20
1500
50
1700
10
1900
40
2100
10
2300
40
原子化温度C
2700 2900 2500 2800 3000 2600 2900 2500 2700 3000 2600 2800
原子化时间 D 8 7 5 4 9 7 6 4 9 8 6 5
如果全面考察试验点则要343次试验,用 正交设计安排这样一个七水平试验,则 至少要做49次试验,而均匀设计仅用7次 试验就初步完成了考察工作。
例2:用石墨炉原子吸收测定钯,选取灰 化温度,灰化时间,原子化温度,原子化时 间四个因素进行考察,试验的考察指标是测 定物质的吸光度。因素的变化范围如下:
7
5
3
将各因素所对应的水平值填入表中,按试验表中每个试 验的条件安排试验,将所得结果填入表最右列。直观上 看,试验吸光度最高为0.048,如果对试验数据不进行 统计分析处理,可以认为最优试验方案就是第4号试验。
因素 试验号
1 2 3 4 5 6 7 8 9 10 11 12
均匀试验设计
1 2 3 4 5 6 7 8
U9(96)均匀设计表
1
1 2 3 4 5 6 7 8 9
列号
试验号
2
2 4 6 8 1 3 5 7 9
3
4 8 3 7 2 6 1 5 9
4
5 1 6 2 7 3 8 4 9
5
7 5 3 1 8 6 4 2 9
6
8 7 6 5 4 3 2 1 9
1 2 3 4 5 6 7 8 9
0.58 2.5
5(0.009) 7(0.26) 10(0.009) 3(0.14) 4(0.006) 10(0.20) 9(0.006) 6(0.23) 3(0.118) 2(0.26) 8(0.118) 9(0.17) 2(0.115) 5(0.20) 7(0.115) 1(0.23) 1(0.112) 8(0.14) 6(0.112) 4(0.17)
练习
1、进行3个因素,每个因素6个水平的多因素 多水平试验,试用均匀试验设计方法作出该研究 的试验设计。试验结果如何分析?
2、考察3因素、每因素各5个水平的试验效果, 请用正交试验方法作出该研究的试验设计。试验 结果如何分析? 3、比较5种饲料对肉兔生长的影响,试作出 该研究的试验设计。试验结果如何分析?
2
2 4 6 8 10 1 3 5 7 9 11
4
4 8 1 5 9 2 6 10 3 7 11
5
5 10 4 9 3 8 2 7 1 6 11
6
ቤተ መጻሕፍቲ ባይዱ6 1 7 2 8 3 9 4 10 5 11
7
7 3 10 6 2 9 5 1 8 4 11
8
8 5 2 10 7 4 1 9 6 3 11
第6讲 均匀设计
x1 2.2 L11 4.48
_
x2 19 L12 16.8
_
x3 2.0 L12 1.4 L33 7.0
_
y 0.3683 L1 y 0.2404 L2 y 0.5640 L3 y 0.5245
_
L22 252.0 L23 10.5
由于Lij L ji,故不必全部列出,将它们代入方程组中 可以解得 b1 0.037, b2 0.00343, b3 0.077 从而 a 0.3683 0.037 2.2 0.00343 19 0.077 2.0 0.201
将一个新变量引进回归模型,这时相应的F统计量必须大 于Fin 将一个变量从回归模型中剔除,这时相应的F统计量必须 小于Fout 将回归模型内的一个变量和回归模型外的一个变量交换位 置。
设先用后退法来选变量.所谓后退法,就是开始将 所有的变量全部采用,然后逐步剔除对方程没有 显著贡献的变量,直到方程中所有的变量都有显 著贡献为止。 仍考虑线性模型,开始三个因素全部进入方程, 得(6.12).统计软件包通常还会提供每个变量的t值, t值越大(按绝对值计)表示该因素越重要.对本 例有
第 6章
均匀设计
均匀设计(uniform design) : 一种只考虑试验点在试验范围内均匀散布的试验设 计方法 通过均匀表来安排试验 应用:试验因素变化范围较大,需要取较多水平时 例如:5因素31水平的试验: 正交设计试验次数≥312=961
均匀设计试验次数:31
6.1 均匀设计表
U7(76)使用表
因素数 2 3 4 5 6 1 1 1 1 1 3 2 2 2 2 3 3 3 3
均匀设计
7.1 均匀设计表
7.1.1 等水平均匀设计表
(1)记号: )记号: Un(rl)或 Un*(rl) 或 U——均匀表代号; 均匀表代号; 均匀表代号 n——均匀表横行数(需要做的试验次数); 均匀表横行数(需要做的试验次数); 均匀表横行数 r——因素水平数,与n相等; 因素水平数, 相等; 因素水平数 相等 l——均匀表纵列数; 均匀表纵列数; 均匀表纵列数 *——均匀性更好的表,优先选用Un*表 均匀性更好的表,优先选用 均匀性更好的表 表
试验号 1 2 3 4 5 6 7 8 9 10
A (1)1 (2)1 (3)2 (4)2 (5)3 (6)3 (7)4 (8)4 (9)5 (10)5
B (2)1 (4)2 (6)3 (8)4 (10)5 (1)1 (3)2 (5)3 (7)4 (9)5
C (5)1 (10)2 (4)1 (9)2 (3)1 (8)2 (2)1 (7)2 (1)1 (6)2
均匀设计( design) 均匀设计(uniform design) : 一种只考虑试验点在试验范围内均匀散布的 试验设计方法 通过均匀表来安排试验 应用:试验因素变化范围较大,需要取较多 应用:试验因素变化范围较大, 水平时 例如: 因素31水平的试验: 31水平的试验 例如:5因素31水平的试验: 正交设计试验次数≥ 正交设计试验次数≥312=961 均匀设计试验次数: 均匀设计试验次数:31
7.2 均匀Biblioteka 计基本步骤(1)明确试验目的,确定试验指标 )明确试验目的, (2)选因素 ) (3)确定因素的水平 ) 可以随机排列因素的水平序号 (4)选择均匀设计表 ) 根据试验的因素数和水平数来选择 参考使用表 首选U 表 首选 n*表
7.2
均匀设计基本步骤
均匀设计
Regression Residual Total
a. Predic tors: (Con stant), X 3 方 , X1X2, X4, X1, X2, X3 b. Dependent Variable: Y
Coefficientsa Standardi zed Coefficien ts Beta -2.146 -2.715 -4.106 .329 4.695 3.658
在淀粉接枝丙烯制备高吸水性树脂的试验中,为了提高树脂吸盐水的能力,考察 了丙烯酸用量X1,引发剂用量X2,丙烯酸中和度X3和甲醛用量X4四个因素,每个因素取 9个水平,如下表所示:
根据因素和水平,我们选取均匀设计表U9﹡(94)或U9﹡(95)。但由于它们的使 用表可以发现,均匀表U9﹡(94)最多只能安排3个因素,所以选用U9﹡(95)来安排 该实验。根据U9﹡(95)的使用表,将x1,x2,x3,x4,x5分别放在U9﹡(95)表的1, 2,3,4,5列,试验方案和试验结果如下表所示:
即丙烯酸用量>引发剂用量>丙烯酸中和度>甲醛用量。
例7-2 利用废弃塑料制备清漆的研究中,以提高警惕清漆漆膜的附着 力作为试验目的。结合专业知识,选定了以下四个因素,并确定了每 个因素的考察范围。 因素及水平见下表U10﹡(108):
Coefficientsa Standardi zed Coefficien ts Beta .368 .798 -.315 .333
t 5.896 -7.115 -6.483 -8.120 7.344 8.430 7.456
Sig. .010 .006 .007 .004 .005 .004 .005
a. Dependent Variable: Y
均匀设计法的结果分析方法及试验结果的评价ppt课件
8
烧伤病人 的治疗 通常是 取烧伤 病人的 健康皮 肤进行 自体移 植,但 对于大 面积烧 伤病人 来讲, 健康皮 肤很有 限,请 同学们 想一想 如何来 治疗该 病人
第六章 均匀设计法
➢一般的均匀设计表水平数为奇数 ➢当水平数为偶数时,用比它大1的奇数表划去最后 一行即可得到水平数为偶数的均匀设计表 ➢利用均匀设计表安排试验时,试验点是均匀的
很难找到正交设计和均匀设计具有相同的试验数 和相同的水平数。我们从如下三个角度来比较:
• 1.试验数相同时的偏差的比较
• 当因素s=2时,若用L8(27)安排试验,其偏差为0.4375;
若用均匀设计表
U
* 8
(8
8
)
,则偏差最好时要达0.1445。显
然试验数相同时均匀设计的均匀性要好得多。值得注
意的是,这种比较方法对正交设计是不公平的,因为
▪如U6(64)表示要做次6试验,每个因素有6个水平, 该表有4列。
U6(64)
列号 试验号
1
2
3
4
1
1
2
3
6
2
2
4
6
5
3
3
6
2
4
4
4
1
5
3
5
5
3
1
2
6
6
5
4
1
School of Microelectronics and Solid-State Electronics
13
烧伤病人 的治疗 通常是 取烧伤 病人的 健康皮 肤进行 自体移 植,但 对于大 面积烧 伤病人 来讲, 健康皮 肤很有 限,请 同学们 想一想 如何来 治疗该 病人
均匀实验设计
均匀试验设计均匀设计均匀设计(uniform design)是中国数学家方开泰和王元于1978年首先提出来的,它是一种只考虑试验点在试验范围内均匀散布的一种试验设计方法。
与正交试验设计类似、均匀设计也是通过一套精心设计的均匀表来安排试验的。
由于均匀设计只考虑试验点的“均匀散布”,而不考虑“整齐可比”,因而可以大大减少试验次数,这是它与正交设计的最大不同之处。
例如,在因素数为5,各因素水平数为31的试验中,若采用正交设计来安排试验,则至少要作312 =961次试验,这将令人望而生畏,难以实施,但是若采用均匀设计,则只需作31次试验。
可见,均匀设计在试验因素变化范围较大,需要取较多水平时,可以极大地减少试验次数。
经过20多年的发展和推广,均匀设计法已广泛应用于化工、医药、生物、食品、军事工程、电子、社会经济等诸多领域,并取得了显著的经济和社会效益。
1. 均匀设计表1.1 等水平均匀设计表均匀设计表,简称均匀表,是均匀设计的基础,与正交表类似,每一个均匀设计表都有一个代号,等水平均匀设计表可用U n ( r l)或U n* (r l)表示,其中,U为均匀表代号;n为均匀表横行数(需要做的试验次数);r为因素水平数,与n相等;l为均匀表纵列数。
代号U右上角加“*”和不加“*”代表两种不同的均匀设计表,通常加“*”的均匀设计表有更好的均匀性,应优先选用。
表1-1、表1-3分别为均匀表U7 (74)与U7* (74),可以看出,U7 ( 74)和U7*(74)都有7行4列,每个因素都有7个水平,但在选用时应首选U7*(74 )。
表1-1 U7 (74)表1-2 U7 (74)的使用表表1-3 U7* (74)表1-4 U7* (74)的使用表每个均匀设计表都附有一个使用表,根据使用表可将因素安排在适当的列中。
例如,表1-2是U7 ( 74)的使用表,由该表可知,两个因素时,应选用1,3两列来安排试验;当有三个因素时,应选用1,2,3三列,……。
均匀设计表
、第七章均匀设计表均匀设计表U n(q p)说明:n均匀设计表的试验方案数q列的水平数p均匀设计表的因子数均匀设计表根据水平数q和试验方案数n的关系分为两类,一类为水平数等于试验方案数的U n(n p)型均匀设计表,另一类为水平数小于试验方案数的U n(q p)型均匀设计表。
本附录的均匀设计表均来源于方开泰教授的均匀设计网站:在这里向方开泰教授对于均匀设计做出的卓越贡献表示崇高的敬意!本附录从中摘录了部分常用的基于中心化偏差的均匀设计表供供大家使用,主要包含以下内容:】U n(n p)型表:仅列出因子数不超过7,试验方案数不超过30的部分设计方案。
U n(q p)型表:仅列出水平数不超过6,试验方案数不超过30的部分设计方案。
均匀设计表在使用时,按照相应的因子数p、水平数q和试验方案数n选定之后,加上相应均匀设计表U n(q p)的第一列即可。
(一)U n(n p)型均匀设计表U5(5p)~U6(6p)·{U8(8p)U9(9p)U10(10p)U12(12p)U15(15p)U16(16p)*U18(18p)U20(20p)U24(24p)U25(25p)U27(27p)—U30(30p)(二)U n(q p)型均匀设计表·U9(3p)U12(3p)》U15(3p)U18(3p)"U21(3p)U24(3p)¥U8(4p)!U12(4p)U16(4p)U20(4p)U24(4p)U10(5p)U15(5p)U20(5p)U25(5p)U12(6p)U18(6p)U24(6p)U30(6p)。
《均匀设计法》课件
均匀设计法的应用领域
化学与制药
用于寻找最佳反应条件 和优化化学合成路径。
生物与医学
用于研究生物体内各种 因素之间的相互作用和
最佳条件。
工程与制造
用于优化产品设计、工 艺参数和制造流程。
经济与社会
用于研究市场、消费者 行为和社会现象等复杂 系统的最佳策略和条件
。
均匀设计法的优势与局限性
高效性
通过减少实验次数提高效率,降 低实验成本。
代表性
选择的实验点应具有代表 性,能够反映实验范围内 的各种情况和变化趋势。
可行性
实验设计方案应具有实际 可行性,考虑到实验条件 、资源、时间等因素的限 制。
均匀设计法的实施步骤
确定因素和水平
选择影响实验结果的主要因素 ,并确定每个因素的取值范围 和水平。
实施实验
按照实验设计表进行实验,记 录实验数据和结果。
需要保证实验条件的一致性和稳定性 ,以确保实验结果的准确性和可靠性 。
需要建立准确的数学模型来描述实验 结果,并对模型精度有较高要求。
02
均匀设计法的基本原理
BIG DATA EMPOWERS TO CREATE A NEW
ERA
均匀设计法的数学基础
线性代数
均匀设计法涉及到线性代数中的 矩阵和向量运算,用于描述实验 设计中的各种关系和约束条件。
均匀设计法与拉丁方设计的比较
拉丁方设计是一种用于排列试验的方阵,而均匀设计法更注重试验点在参数空间中的均匀分布。
均匀设计法在交叉学科领域的应用探索
均匀设计法在生物医学领域的应用
在生物医学研究中,通过均匀设计法可以更有效地设计和实施实验,以探究不同因素对 生物系统的影响。
均匀设计法在环境科学领域的应用
均匀设计
7.2.3 使用均匀设计表
* 偏差D可对任一均匀设计表 U n 或 U n 中任意二列、任 意三列、…进行计算,从中选出使D达到最小的列作为使 用列,从而形成使用表。
如下表就是 U 7 (76 ) 的使用表,s表示因子数。 均匀设计表 U 7 (76 ) 的使用表
若从中选出5列使用,就会使偏差D过大,故建议不使 用,把使用表中不出现的列剔去,并重新编号,可以得到 U 7 (7 4 ) 及其使用表。
i 2n ,i 1,2, , n
Un(n m)中n个试验点变换成C m=[0,1]m中的n个点。 考虑Un(n m)中n个试验点的均匀性等价于考虑在 [0,1]m中 的均匀性。
2019/1/11 10
(3)设
是[0,1]m中任一点,则
为多维矩形的体积,且 0 V ( x) 1 。 (4)记 nx 为n个点 x1 , x2 ,, xn 落在多维矩形的个数, 则 n x / n 表示有多少比例的点落在矩形中。 若此n个点在[0,1]m中均匀散布,则 n x / n 与该多维 矩形的体积 相差不大。 (5)设 x1 , x2 ,, xn 是[0,1]m中的n个点,则称
2019/1/11 1
王元
方开泰
中国科学院数学研究所 中国科学院院士
中国科学院应用数学研究所 北京师范大学- 香港浸会大学联合国际学院 美国数理统计科学院终身院士 美国统计学会终身院士
2
2019/1/11
§7.1 均匀设计表
7.1.1 均匀设计概述
例7.1 为了研究环境污染对人体的危害,考察六种重
金属Cd、Cu、Zn、Ni、Cr、Pb对老鼠寿命的影响,考察 老鼠体内某种细胞的死亡率。将每一种重金属看成一个
第07章 均匀设计
b2、b4小于0,表明试验指标随x2、x4的增加而减 小,确定优方案时,因素x2、x4的取值应取下限, 即引发剂用量取0.3%、甲醛用量取0.20ml;
优方案为:
丙烯酸用量取32ml、中和度取92%;引发剂用
量取0.3%、甲醛用量取0.20ml。
将上述优化值代入回归方程可得:
y=76.3
该结果好于第9号试验结果,但需要进行验证。
第3列 水平 x3/% 64.5 86.5 59.0 81.0 53.5 75.5 48.0 70.0 92.0 8 7 6 5 4 3 2 1 9
第5列 1.25 1.10 0.95 0.80 0.65 0.50 0.35 0.20 1.40
指标 34 42 40 45 55 59 60 61 63
(2)1
(4)2
(3)1
(6)2
3
4 5 6
(3)2
(4)2 (5)3 (6)3
(6)3
(1)1 (3)2 (5)3
(2)1
(5)2 (1)1 (4)2
改造要求:混合均匀表有较好的均
衡性,即两列表的任一列上,不同
水平出现次数是相同的,但出现次
数≥1
7.2
均匀设计基本步骤
第 7 章
均匀设计
均匀设计是指利用均匀设计表进行试验设计的
一种试验设计方法,它的设计原理是数论中的一致
分布理论,即只考虑试验点在试验范围内的均匀散 布;挑选试验代表点的出发点是“均匀分散”,而 不考虑“整齐可比”,它可保证试验点具有均匀分 布的统计特性,可使每个因素的每个水平做一次且 仅做一次试验,任两个因素的试验点在平面的格子 点上,每行每列有且仅有一个试验点。
试验点在积分范围内散布得十分均匀,并使分布点离被积函
均匀设计表及其使用表的构造
4、设计行和列
根据实验需求和因子水平,将各个因子的水平分配到表格的行和列中。例如, 如果有3个因子,每个因子有3个水平,那么可以设计一个3行3列的表格。
5、确定细胞数
根据均匀设计表的要求,每个因子每个水平的实验次数应该相同。因此,可以 根据因子数和每个因子的水平数计算出每个单元格应该出现的次数,进而确定 表格的大小。
参考内容
在复杂的商业交易和法律关系中,表见代理是一个重要且棘手的问题。表见代 理是指一方当事人虽然没有授权,但因其行为使得另一方有合理理由相信其有 代理权,因此该方当事人的代理行为有效。本次演示将深入探讨表见代理体系 构造,包括其定义、形成、特点、与相关概念的区别,以及在商业和法律中的 应用。
一、表见代理体系构造的概念
一、均匀设计表的构造
要构造一个均匀设计表,需要确定实验的因子和水平,以及选择合适的均匀设 计表类型。下面我们将从这几个方面具体介绍。
1、确定因子和水平
首先,需要明确实验中涉及的因子和每个因子的水平。因子是指实验中需要控 制或研究的变量,水平是指每个因子的取值。例如,在材料科学实验中,因子 可能是不同的成分比例、温度、压力等,而水平则可能是各种成分比例、不同 温度和压力条件等。
三、表见代理的特点
表见代理具有以下特点:
1、无权代理:表见代理的本质是无权代理,即代理人没有代理权或超越代理 权范围进行代理行为。
2、客观表象:表见代理的表象是代理人具有代理权的客观表象,如合同签署、 盖章、口头承诺等。
3、相对人信赖:表见代理的重要特点是相对人对代理人的信赖,这种信赖应 当是合理的。
表见代理体系构造是指将表见代理的原理、原则、规则等,通过一定的逻辑结 构和方法,运用到具体的商业和法律实践中,以解决相关问题。
均匀设计与均匀设计表之欧阳引擎创编
第一章试验设计和均匀设计欧阳引擎(2021.01.01)1.1试验设计在工农业生产和科学研究中,经常需要做试验,以求达到预期的目的。
例如在工农业生产中希望通过试验达到高质、优产、低消耗,特别是新产品试验,未知的东西很多,要通过试验来摸索工艺条件或配方。
如何做试验,其中大有学问。
试验设计得好,会事半功倍,反之会事倍功半,甚至劳而无功。
本世纪30年代,由于农业试验的需要,费歇尔(R.A.Fisher)在试验设计和统计分析方面做出了一系列先驱工作,从此试验设计成为统计科学的一个分支。
随后,F.Yates,R.C.Bose,O.Kempthome,W.G.Cochran,D.R.Cox和G.E.P.Box对试验设计都作出了杰出的贡献,使该分支在理论上日趋完善,在应用上日趋广泛。
60年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,在方法解说方面深入浅出为试验设计的更广泛使用作出了众所周知的贡献。
田口玄一的方法对我国试验设计的普及和广泛应用有巨大的影响,70年代我国许多统计学家深入工厂、科研单位,用通俗的方法介绍正交试验设计,帮助工程技术人员进行试验的安排和数据分析,获得了一大批优秀成果,出版了许多成果汇编,举办了不少成果展览会。
在广泛使用试验设计方法的洪流中,必然会出现一些新的问题,这些总是用原有的各种试验设计方法不能圆满地解决,特别是当试验的范围较大,试验因素需要考察较多等级(在试验设计中这些等级称之为水平)时,用正交试验及其它流行的试验方法要求做较多的试验,常使得试验者望而生畏。
许多实际问题要求一种新的试验方法,它能有效地处理多水平的试验,于是王元和方开泰于1978年提出了均匀设计(见文献「1-3」),该设计考虑如何将设计点均匀地散布在试验范围内,使得能用较少的试验点获得最多的信息。
10多年来,均匀设计在国内得到了广泛应用,并获得不少好的成果。
试验设计在工业生产和工程设计中能发挥重要的作用,例如:1)提高产量;2)减少质量的波动,提高产品质量水准;3)大大缩短新产品试验周期;4)降低成本;5)延长产品寿命。
0803-第三节均匀设计表的构造和运用
第三节均匀设计表的构造和运用本节介绍均匀设计表的构造和使用表的来源,其中均匀性度量偏差将起关键作用,我们将介绍偏差的定义,并给出正交设计与均匀设计各自偏差的比较,从中可以了解为什么均匀设计可以比正交设计节省试验次数,本节还介绍拟水平在均匀设计中的使用和有关表的构造,熟悉本节内容对于正确理解和使用均匀设计有很大帮助。
3.1均匀设计表的构造定义1每一个均匀设计表是一个方阵,设方阵有n行m列,每一行是{1,2,.・・,n}的一个置换(即1,2,,,n的重新排列),表的第一行是{1,2, ,,n}的一个子集,但不一定是真子集。
显然,第一章表4-6列举的U6 (64),6(74)和U;(74)都符合上述定义。
符合定义1的均匀设计表数量太多,本节仅介绍用好格子点法(good lattice point)构造的均匀设计表,其方法如下:1) 给定试验数n,寻找比n小的整数h,且使n和h的最大公约数为1。
符合这些条件的正整数组成一个向量h = (h 1,,,h m)。
2) 均匀设计表的第j列下法生成w =ih j [mod n](3.1)这里[mod n]表示同余运算,若jh i超过n,则用它减去n的一个适当倍数,使差落在[1,n]之中。
U ij可以递推来生成u ij+h j 若u ij+h j < n(3.2)U"j h j-n 若U ij+h j"T …,Z例如,当n= 9时,符合条件1)的h有1,2,4,5,7,8;而h=3或h=6时不符合条件1),因为最大公约数(3,9)=3,(6, 9)=3,均大于1.所以U9最多只可能有6列,又如当h^4时,用公式(3.2)来生成该列时其结果依次如下:U13 — 4,u?3 = 4,4=8,U33 = 8,4=12 = 3(mod9)u43= 3 4 = 7, u53= 7 4 = 11 = 2(mod 9)u63 = 2 4 = 6, u73 = 6 4 = 10 = 1 (mod 9)U83 = 1 4 = 5, U93 = 5 9其结果列于表16的第三列。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章试验设计和均匀设计欧阳家百(2021.03.07)1.1试验设计在工农业生产和科学研究中,经常需要做试验,以求达到预期的目的。
例如在工农业生产中希望通过试验达到高质、优产、低消耗,特别是新产品试验,未知的东西很多,要通过试验来摸索工艺条件或配方。
如何做试验,其中大有学问。
试验设计得好,会事半功倍,反之会事倍功半,甚至劳而无功。
本世纪30年代,由于农业试验的需要,费歇尔(R.A.Fisher)在试验设计和统计分析方面做出了一系列先驱工作,从此试验设计成为统计科学的一个分支。
随后,F.Yates,R.C.Bose,O.Kempthome,W.G.Cochran,D.R.Cox和G.E.P.Box对试验设计都作出了杰出的贡献,使该分支在理论上日趋完善,在应用上日趋广泛。
60年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,在方法解说方面深入浅出为试验设计的更广泛使用作出了众所周知的贡献。
田口玄一的方法对我国试验设计的普及和广泛应用有巨大的影响,70年代我国许多统计学家深入工厂、科研单位,用通俗的方法介绍正交试验设计,帮助工程技术人员进行试验的安排和数据分析,获得了一大批优秀成果,出版了许多成果汇编,举办了不少成果展览会。
在广泛使用试验设计方法的洪流中,必然会出现一些新的问题,这些总是用原有的各种试验设计方法不能圆满地解决,特别是当试验的范围较大,试验因素需要考察较多等级(在试验设计中这些等级称之为水平)时,用正交试验及其它流行的试验方法要求做较多的试验,常使得试验者望而生畏。
许多实际问题要求一种新的试验方法,它能有效地处理多水平的试验,于是王元和方开泰于1978年提出了均匀设计(见文献「1-3」),该设计考虑如何将设计点均匀地散布在试验范围内,使得能用较少的试验点获得最多的信息。
10多年来,均匀设计在国内得到了广泛应用,并获得不少好的成果。
试验设计在工业生产和工程设计中能发挥重要的作用,例如:1)提高产量;2)减少质量的波动,提高产品质量水准;3)大大缩短新产品试验周期;4)降低成本;5)延长产品寿命。
在自然科学中,有些规律开始尚未由人们所认识,通过试验设计可以获得其统计规律,在此基础上提出科学猜想,这些猜想促进了学科的发展,例如遗传学的许多发现都藉助于上述过程。
材料工业是工业中的栋梁,汽车拖拉机的制造离不开各种合金钢,钛合金的发明和发现使飞机制造工业产生飞跃。
超导的研究和超导材料的配方息息相关。
配方试验又称混料试验(Experiments with Mixtures),不仅出现于材料工业,而且在人们生活和其它工业中处处可见,例如在中药、饮料、混凝土的配方中。
由于在配方中各种材料的总和必须为100%,其试验设计必须考虑到这个约束条件,由于这个原因正交试验设计等方法不能直接用于配方设计。
针对配方设计的要求,Scheffé于1958年提出了单纯形格子点设计,随后于1963年他又提出了单纯形重心设计。
Cornell[27]对配方试验设计的各种方法作了详尽的介绍和讨论。
显然,均匀设计的思想也能用于配方试验,王元和方开泰[9]给出了配方均匀设计的设计方法和有关的讨论。
本书第五章将系统介绍配方试验设计和配方均匀设计。
不论是均匀设计或配方均匀设计,其数据分析都要藉助于回归分析,要用到线性回归模型、二次回归模型、非线性模型,,以及各种选择回归变量的方法(如前进法、后退法、逐步回归、最优回归子集等)。
有关回归分析的书籍成百上千,本书仅作梗概介绍。
读者很容易找到各种参考书籍获得更详细的介绍。
试验设计的方法很多,本书重点介绍均匀设计,这并不意味其它方法不重要,每种方法都有其优点,也有其局限性,根据实际情况选取合适的方法是应用统计的重要内容。
1.2试验的因素和水平在工业、农业、科学研究和军事科学的研究中,经常需要作各种试验,以研究各种因素之间的关系,找到最优的工艺条件或最好的配方。
让我们先看一个例子:例1 在一个化工生产过程中,考虑影响得率(产量)的三个因素:温度(A),时间(B)和加碱量(C)。
为了便于试验的安排,每个因素要根据以往的经验来选择一个试验范围,然后在试验范围内挑出几个有代表性的值来进行试验,这些值称做该因素的水平。
在该例中,我们选择的试验范围如下:温度:77.5℃~92.5℃时间: 75分~165分加碱量: 4.5%~7.5%然后在上述范围内,每个因素各选三个水平,组成如下的因素水平表:表1 因素水平表选择因素和水平关系到一个试验能否成功的关键,下列的注意事项和建议对使用试验设计的人员可能是有益的。
1.在一个生产过程中,有关的因素通常是很多的,例如在例1的化工生产工艺中,有催化剂的品种,催化剂用量,加碱时的速度,容器中的压力等。
但根据这次试验目的,除了温度(A),时间(B),和加碱量(C)各取三个水平外,其余因素是固定的,或者讲,他们只取一个水平。
为了方便,通常这些固定的因素在试验方案中并不称为因素,只有变化的因素才称为因素。
2.在一项试验中,如何从众多的有关因子中挑选出试验方案中的因素?我们建议课题的领导者应当要请有经验的工程师、技术员、工人共同讨论决定。
在一次试验中,因素不宜选得太多(如超过10个),那样可能会造成主次不分,丢了西瓜,拣了芝麻。
相反地,因素也不宜选得太少,(如只选定一、二个因素),这样可能会遗漏重要的因素,或遗漏因素间的交互作用,使试验的结果达不到预期的目的。
例如,有这样的故事,原计划试验方案中只有三个因素,而利用试验设计的方法,可以在不增加试验数目的前提下,再增加一个因素,既然不费事何乐而不为呢?试验的结果发现,最后添加的这个因素是最重要的,从而发现了历史上最好的工艺条件,正是“有心栽花花不成,无意插柳柳成荫。
”3.试验的范围应当尽可能大一点。
如果试验在试验室进行,试验范围大比较容易实现;如果试验直接在生产中进行,则试验范围不宜太大,以防产生过多次品,或产生危险。
试验范围太小的缺点是不易获得比已有条件有显著改善的结果。
历史上有些重大的发明和发现,是由于“事故”而获得的,也就是说试验的范围大大不同于有经验的范围。
4.若试验范围允许大一些,则每一因素的水平个数最好适当多一些。
5.水平的间隔大小和生产控制精度是密切相关的。
若在例1中温度的控制只能作到±3℃,且我们设定控制在85℃,于是在生产过程中温度将会在85°±3℃,即82—88℃波动。
不难看到,这时设定的三个水平80℃,85℃,90℃之间是太近了,应当加大,例如80℃,90℃,100℃。
如果温度控制的精度可达±1℃,则例1如设定的三个水平是合理的。
6.因素和水平的含意可以是广义的。
例如五种棉花用于织同一种布,要比较不同棉花影响布的质量的效应,这时“棉花品种”可设定为一个因素,五种棉花就是该因素下的五个水平。
1.3因素的主效应和因素间的交互效应根据试验的目的,要预先确定一项或多项试验指标,为简单计,本书仅讨论只有一项试验指标(记作Y)的情形。
如例如1的试验Y是得率。
在数理统计中,称试验指标为响应(response)为通俗起见,本书中就叫试验指标。
考察一个因素对试验指标的影响是试验的目的之一。
若在一项试验中,考察温度和得率Y之间的关系,并取温度五个水平,其相应Y值如下:我们看到,温度每增加10℃得率增加5%这5%就是温度的效应。
上述试验可以表成一个线性数学模型5,,1, =+=i Y i i αμ (1.1)其中i Y 为第i 次试验结果,μ为温度从50℃到90℃范围内Y 的平均值。
通常可以用五次试验的平均值来估计,记作μˆ,即 i α表示温度取第i 个水平时i Y 的值与之μ差。
不难发现,它们的估计值为这里51,,αα 称为温度在五个水平下的主效应,51ˆ,,ˆαα为它们的估计值。
由于试验中总存在一些偶然因素的干扰,如室温的变化,电压的波动,材料的不均匀性,这些偶然因素总称为随机误差。
由于试验误差的存在,不可能产生上例那么理想的情况。
其实际数据可能为这时数学模型为5,,1, =++=i Y i i i εαμ (1.2)这里i ε为第i 次试验的试验误差。
这时试验必须有重复才能估计出i α和i ε.实际上,当试验的水平和相应的Y 为连续变量时,其数学模型也可以用回归方程来表达,例如,用线性回归方程εβα++=X Y (1.3)其中X 表示温度,α和β是回归系数,ε为随机误差。
在第二章将介绍,α和β可以用最小二乘法由试验数据估出,由上述温度和得率的数据可得回归方程X Y46.080.7ˆ+= (1.4) 这里Yˆ为试验结果Y 的估计值。
利用方程(1.4)可以估出五次试验的结果如下:其中II Y Y -并可用它作回归诊断,更详细讨论请看第二章。
方程(1.4)中,X 的回归系数0.46有明确的实际含意,它表示温度每增加一度,其得率Y 平均增加0.46%,于是0.46反映了X 对Y 的效应,这里可以称为线性回归效应。
有一点是必须注意的,无论是模型(1.2)中的主效应{}i α,还是模型(1.3)中的线性回归效应β,都强烈地依赖于试验条件,尤其是X 的试验范围,也就是说,这两个模型只适用于X 的试验范围内。
否则,当X 为210°时,Yˆ的估值为104.4%,这是不可能的,因为得率总是小于100%的。
显然,模型(1.2)和(1.3)是最简单的情形,实际情况是多种多样的,例如X 和Y 之间可能有非线性回归关系,或其它相关关系。
这些将在以后讨论。
现在我们来介绍因素间交互作用的概念。
首先,设有两个因素A 和B 它们各取两个水平21,A A 和21,B B 。
这时共有四种不同的水平组合,其试验结果列于图1。
当1B B =时,1A 变到2A 使Y 增加30-10=20;类似地,当2B B =时,1A 变到2A 使Y 也增加40-20=20。
这就是说A 对Y 的影响与B 取什么水平无关。
类似地,当B 从1B 变到B时,Y增加20-10(或40-30=10),与A取的水平无关。
这2时,我们称A和B之间没有交互作用。
判断和之间有没有交互作用,选用图2的作图方法更为直观。
当图中的两条线平行时(或接近平行时),判断A和B之间没有交互作用.图3和图4给出了一个有交互作用的例子,它们的含意和作图方法与图和图2是一样的。
1交互作用在实际中是大量存在的,例如化学反应中催化剂的多少与其它成分的投入量通常是有交互作用的。
水中各种金属含量太多,对人体健康会造成危害,金属之间对人体的危害也存在交互作用(参见例5)。
当因素A,B 及其它们的试验指标Y都为连续变量时,可以建立Y和A;B之间的回归方程。
若回归方程为βα+γεAY(1.5)=B++时,A对Y的影响由回归系数β完全决定,不受B取哪个水平的影响;类似地,B对Y的影响由回归系数γ完全决定,不受A取哪个水平的影响;类似地,对的影响由回归系数完全决定,不受取哪个水平的影响。