第一章试验设计与试验数据分析初步

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章试验设计与试验数据分析初步

在科学实验与工农业生产中,经常要做实验。如何安排实验,使实验次数尽量少,而又能达到好的实验效果呢?这是经常会碰到的问题,解决这个问题有一门专门的学问,叫做“试验设计”。20世纪30年代,由于农业试验的需要,R.A.Fisher在试验设计和统计分析方面做出了一系列先驱工作,从此试验设计成为统计科学的一个分支。随后,F. Yates, R.C. Bose, O. Kempthome, W. G. Cochran, D. R. Cox和G. E. P. Box对试验设计都作出了杰出的贡献,使该分支在理论上日趋完善,在应用上日趋广泛。1960年代,日本统计学家田口玄一将试验设计中应用最广泛的正交设计表格化,在方法解说方面深入浅出为试验设计的更广泛普及与应用做出了巨大的贡献。

试验设计方法有很多种类。国内方面,60年代由华罗庚教授倡导与普及的“优选法”,即国外的斐波那契方法,与70年代我国的数理统计学者在工业部门中普及的“正交设计”法都是人们熟悉的试验设计法。70年代末期由方开泰教授和王元教授倡导和推广的均匀设计也是一种常用的试验设计方法。“优选法”是单变量的最优调试法,“正交设计”是基于拉丁方理论和群论的多因素试验设计方法,“均匀设计”则是基于数论方法的另一种多因素试验设计方法。

材料科学与材料工业中经常会出现各种试验设计问题,例如配方试验或称混料试验(Experiments with Mixtures),就是在材料科学中经常遇到的问题之一。在各种介绍试验设计方法的书籍中,通常都会辟出专门的章节来阐述配方试验设计的解决方案。

试验设计得好,会事半功倍,反之就会事倍功半了。好的试验设计方案可以大大减少试验次数,得到充分的信息,简化数据处理过程,节省人力、物力和时间。正确合理的试验设计,可以使试验结果的可靠性显著提高。试验设计还可以为迅速寻求参数的优化数值和选择最佳工艺方案指明方向。

1.1. 试验设计的概念及发展历史

1.1.1.试验设计的基本概念

➢指标:在试验设计中,人们把判断试验效果好坏所采用的标准称为试验指标,或简称为指标。

➢因素:或称为因子,有可能影响试验指标的条件,称作因素。通常情况下固定的因素在试验方案中并不称为因素,只有变化的因素才称为因素。

➢水平:或称为处理,能影响试验指标的因素,通常人为地给予控制、分组,在统计学上,统称其为因子的水平。

1.1.

2.试验设计的基本要求

➢进行不同处理的实验单元间,要有相同的系统

➢要有明确的试验目的、恰当的指标

➢要挑选因子,适当确定水平。使试验范围尽可能大一点,试验范围太小的缺点是不容易获得比已有条件有显著改善的结果。每一个因素的水平个数最好适当多一些,水平的间隔大小和生产控制精度是密切相关的。同时,因素和水平的含意可以是广义的

➢处理实验数据要能配上相应的数理统计方法,以达到预期的试验目的

1.1.3.因素的主效应和因素间的交互效应

各因素的水平所对应的目标值称为主效应,各个因素除了对目标值有独立的影响外,还可能共同对目标值产生作用,即交互作用。交互作用通常表现为因素的乘积对指标的影响,其系数为正称为正交互作用,其系数为负称为负交互作用。

1.1.4.试验设计方法的发展过程

➢全面试验法:将每一个因素的不同水平组合做同样数目的试验。一般说m个因子n个水平的全面试验需要做n m次试验。当因素的个数不多,每个因数的水平数也不多时,用全面试验的方法,并且通过数据分析可以获得较为丰富的结果,结论也比较精确。当因素较多,水平数较大时,全面试验要求的试验数目可能非常大,虽然最后能够早出最好的搭配方案,但费时费工,往往不可能实现,因此除了一些比较简单的情况外,一般不进行全面试验。

➢简单对比法:又称孤立因素法,是将因子中只变化一个,其余的固定,然后逐步地得到好的搭配的方法。`这种方法一般也能得到一定的效果,而且比全面试验的次数少,但也有缺点,就是对待各因子和水平不是均等的。并且先固定那些因子,后变化那些因子,都会影响试验结果,因此最后的结果是不是最好的,还不能充分肯定。

➢完全随机试验法:是一种最基本的试验设计,即各因素的水平完全随机分配

➢随机区试验法:在划分区间后,用随机数字表或抽签法来确定顺序的试验设计方案

➢拉丁方试验法:将一定数的文字排成正方形,每个文字在各行各列都出现一次而且只出现一次,这样的方格称为拉丁方。第一行与第一列相同的顺序排列的拉丁方称为标准型拉丁方。对于因子数多于3的实验,实验数将随着因子数的增加而快速地增加,采用拉丁方试验法,可以大大减少实验数。组成拉丁方区的必要条件是,在拉丁方区内行数等于列数等于水平数。拉丁方是供不存在交互作用的因子的实验设计用的。拉丁方设计的主要目的是研究单因素不同水平对实验结果的影响。

➢正交拉丁方法:两个或两个阶数相同的拉丁方之间呈正交关系而言的,正交拉丁方试验一般在5*5,7*7,8*8中进行。正交拉丁方的个数不超过拉丁方字母的个数减1,对于6*6的拉丁方,则不存在正交拉丁方法,拉丁方或正交拉丁方试验,可用随机法安排试验。

1.2.正交试验设计与结果分析

1.2.1. 正交试验设计

正交试验设计方法,就是利用数理统计学与正交性原理,从大量的试验点挑选适量的具有代表性、典型性的点,应用“正交表”合理安排试验的一种科学的试验设计方法。

统计学家将正交设计通过一系列表格来实现,这些表格叫做正交表,记为L t(m e),其中L表示正交表,t表示总共做9次试验,m表示每个因素都有m个水平,e表示表中有e列,最多可以安排e个因素。

常用的二水平正交表有L4(23),L8(27),L16(215),L32(231);三水平正交表有L9(34),L27(313);四水平正交表有L16(45);五水平正交表有L25(56)等。还有一批混合水平的表在实际中也十分有用,如L8(4*24),L12(23*31),L16(44*23),L16(43*26),L16(42*29),L16(41*212),L18(81*28),L18(21*37)等。

正交设计是利用数学上的正交性确定的设计方法,本质上具有“均匀分散、整齐可比”的特点。具体表现为:1,水平均匀性:每个因子和因子的每个水平都是均匀分配的;2,搭配的均匀性每个因子的各个水平出现的次数都是相同的,任何两个因子的搭配也都以相同的次数出现。

正交试验过程,就是在确定指标、因子和水平后,用正交表安排试验方案。它主要要求解决三个方面的问题:1,分析因子与指标的关系,即当因子变化时,指标是怎样变化。找出这种变化的规律,可以利用它能动地指导生产;2,分析因子影响指标的主次,即分析哪个因子是影响指标的主要因素,哪些是次要因素。找出主要影响因素常常是生产中关键问题之一;3,寻找好的生产工艺,即找到每个因子各取什么水平,会得到最好的指标。也就是选出最优方案,这是生产中最需要解决的问题。

用正交表安排试验的步骤:1,根据因子数和水平数以及试验条件的限制,选择合适的正交表;2,将各因子放到表头的各列中;3,将各因子的水平安排到相应的表格中;4,形成试验方案。

正交试验设计缺点在于它只适合于水平数不多的试验。通常情况每个因子有q个水平,用正交表安排试验,至少要作q2次试验,当q较多时,q2非常大,很多情况无法进行试验。正交试验设计只考虑全局平衡,只得到可能的优化方向。

1.2.2. 直观分析

利用正交表进行试验设计并分析结果一般有两种方法,即直观分析与方差分析。

直观分析就是通过计算将各个因子、水平对试验结果质量指标影响的大小,用图形表示出来,通过直观分析,综合比较,以确定最优化试验方案的方法。

直观分析的目的是:

✓因子与指标的变化规律,从k1,k2,k3与因子的关系图来考察

✓因子影响指标的主次顺序,从极差R来考察,R越大,影响越大

相关文档
最新文档