科学实验设计原则
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
科学实验设计原则
编辑词条分享
∙ 1 定义
∙ 2 原则
科学实验设计原则在实验设计中应遵守的法则相标准。
其基本原则有:(1)必须能够使实验再现,凡是不能重复的实验,不能算是成功的实验,偶然的结果,往往不能说明任何问题;(2)先进行整体实验,而后再进行分部实验,并按步骤排除各种可能性,这佯,就可以在初始阶段时就明确所考虑的假说是否正确.技术路线是否可取等等.因而使实验少走弯路;(3)做实验时,必须在技术上采取谨慎的态度,对于每个细节都必须高度重视,精益求情。
尽量孤立因素和固定条件。
对影响实验结果的可能因素,要做全面的认真考虑,然后,采取有效的方法、逐个地消除它,以便孤立和突出某一因素。
随着现代科技相理论上的发展.由过去一般都是强调在实验中只改变一个因素到现今同时试验几个变数。
使用适当的数学方法,使人们能够将几个变数包括在一个实验之中研究,这不仅能省时省力、减少费用.而且也能获得更多的资料;(4)估计所需用的器材是否齐备。
原则上讲,器材为实验服务,并且尽量采用先进的设备和技术手段。
但是,当方案中所需的器材确实无法解决时.应适当地修改设计方案。
实验设计法
编辑词条分享
∙ 1 实验设计法
∙ 2 正文
∙ 3 配图
∙ 4 相关连接
又称试验设计法,数理统计学的一个分支,研究如何制定实验方案,以提高实验效率,缩小随机误差的影响,并使实验结果能有效地进行统计分析的理论与方法。
其基本思想是英国统计学家R.A.费希尔提出的。
他在罗萨姆斯蒂德试验站任职时着重指出:在田间实验中,由于环境条件难于严格控制,实验数据必然受到偶然因素的影响,所以一开始就得承认存在误差。
这一思想是与传统的“精密科学实验”相对立的,在精密科学实验中,不是从承认误差不可避免出发,而是致力于严格控制实验条件,以探求科学规律。
田间试验的目的之一是寻求高产品种,而实验时的土地条件,如土质、排水等都不能严格控制,因此,“在严格控制的这样或那样条件下,品种A比品种B多收获若干斤”这类结论,实际意义就不大。
在现场进行的工业实验,医学上的药物疗效实验等,也有类似情形。
这表明,费希尔首创的实验设计原则,是针对工农业以及技术科学实验而设,而不是着眼于纯理论性的科学实验。
实验设计的基本思想,是减少偶然性因素的影响,使实验数据有一个合适的数学模型,以便使用方差分析的方法对数据进行分析。
费希尔于1923年与W.A.梅克齐合作发表了第一个实验设计的实例,1926年提出了实验设计的基本思想,1935年出版了他的名著《实验设计法》,其
中提出了实验设计应遵循三个原则:随机化,局部控制和重复。
随机化的目的是使实验结果尽量避免受到主客观系统性因素的影响而呈现偏倚性;局部控制是用划分区组的方法,使区组内部条件尽可能一致;重复是为了降低随机误差的影响,以保证实验结果的重现性。
费希尔最早提出的设计是随机区组法和拉丁方方法,两者都体现了上述原则。
区组设计指将υ个处理安排在b个区组内作实验的一种实验设计法。
所谓“处理”,是指诸如品种、工艺条件、种植方法等因素或措施。
例如,要比较三个品种的优劣,则每个品种是一个处理,共有三个处理;如试验中涉及三个品种和两种种植方法,则每个品种与每种种植方法搭配构成一个处理,一共有3×2=6个处理。
每个区组能容纳的处理个数称为该区组的大小,常以k表示。
若区组i的大小k j小于υ,则区组i容纳不了全部的处理,称这一类设计为不完全区组设计;当k j均不小于υ时,区组可以容纳全部处理,称这一类设计为完全区组设计。
设要比较8个不同的品种A,B,C,D,E,F,G,H,看哪一个品种产量比较高。
若一个区组是一长条地块,将这个地块分成8个小块种植全部8个品种,就得一个完全区组。
如共有4个这种区组,则8个品种在每个区组内的安排,要用随机化的方法,将区组内的小块编号,利用随机数或抽签方法,决定品种的位置。
图1就是一个具体的随机区组设计。
实验设计法
实验设计法
如果有8个区组,每个区组可以容纳8个处理,这时不用随机化而用拉丁方进行设计,也能消除区组内各小块位置不同的影响。
拉丁方是指将υ个拉丁字母(每个字母代表一个处理)排成υ行υ列的方阵,使得各个字母在各行各列出现一次且只一次。
称υ为拉丁方的阶数。
例如,图2是一个5阶拉丁方。
若把拉丁方的行看作区组,是一块田;把列也看作区组,是施肥量;那么拉丁方设计不但能消除行内各小块位置不同的影响,还能可以消除列内施肥量不同的影响。
不完全区组设计在实际中常常遇到。
一个区组可以是一块地、一辆汽车的四个轮胎或是车间的一个班组。
当处理的数目太大时,要将全部处理安排在一个区组内是有困难的,因为区组的规模太大,就不能保证区组内的均匀性。
费希尔的合作者F.耶茨提出:将全部处理分成若干组,每组形成一个区组,使区组大小缩小以保证区组内的均匀性。
由于各个区组不包含全部处理,这种设计叫不完全区组设计。
一般地,区组设计的狭义理解大都指不完全区组设计。
不完全区组设计主要有两类:一类是平衡不完全区组(BIB)设计,一类是部分平衡不完全区组(PBIB)设计。
设b)个区组大小相等,均为k,且k<υ,若能将υ个处理安排在b)个区组内,使每个处理出现的次数r(称为重复数)都相同,且每两个不同处理恰好在λ个区组内相遇(称λ为相遇数),则称这种安排为一个BIB设计。
若λ并不全一样,而是随着处理对的不同而分成若干类,则称这种情况为一个PBIB设计。
某些其他设计可以看成是 BIB设计或PBIB设计的一些特殊类型。
在BIB设计的参数υ,b),k,r和λ之间有如下的关系:。
这些条件对 BIB设计的存在是必要的,但不是充分的。
若υ=b),从而k=r,则称为对称BIB 设计。
若υ为偶数,则r-λ必须是一个完全平方数,否则,设计不存在。
例如由于r-λ=12-4=8不是完全平方数,不存在υ=b)=34,k=r=12,λ=4的对称BIB设计,尽管这些参数满足上述必要条件。
析因设计区组设计主要用于农业的单因素实验,而析因设计既能用于农业实验,又
能用于工业和其他技术科学实验,其目的是了解因素对某项指标的影响。
例如,某项产品质量受原料、加工温度、加工时间等因素的影响。
若原料
有三个产地:上海、天津和锦州,把产地作为一个因素,则它们是这个因素
的3个水平。
若可选的加工温度是80℃、90℃、100℃和105℃,加工时间
是5分钟和7分钟,则加工温度和加工时间这两个因素分别有4个水平和
2个水平。
问题是要了解在这些因素的不同水平组合之下,产品质量是否
有显著性差异,并进一步确定这样一种水平组合,使产品质量最好。
析因
设计就是将全部因素的水平组合起来做实验,使得既能估计各个因素的主
效应,又能估计因素之间的交互作用。
所谓主效应,是指同一因素各水平之间的差异;交互作用是指一个因素的效应因另一因素的水平的改变而起的变化。
前例中有3个因素,它们分别有3、4、2个水平,把它们组合起来共有3×4×2=24个水平组合,称为3×4×2型实验。
若这3个因素分别以A、B、C表示,则从这个实验可以算出3个主效应A、B、C;3个二因素交互作用A×B、A×C、B×C以及一个三因素交互作用A×B×C。
主效应和交互作用统称效应,三因素或更多因素的交互作用统称为高阶交互作用。
部分实施法随着因素个数和因素水平的增多,水平组合的数目急剧增加,例如,10
个3水平因素的实验总共有310=59049个水平组合,将近6万个实验要全部进行是不可能的。
1946年,英国统计学家D.J.芬尼在保证能估计全部主效应和少数一部分低阶交互作用的前提下,提出了部分实施法,即只挑选一部分水平组合做实验,忽略一部分低阶和全部高阶交互作用。
正交表是进行部分实施法最方便的一种工具。
正交表正交阵列的简称,是在拉丁方和正交拉丁方的基础上形成的。
它的形式和广泛应用同日本统计学家田口玄一的工作分不开,他的工作得到国际上的重视,在中国也有相当影响。
表是正交表的一个例子,这个表记作L8(27), 表示有8行7列,而每行都包含2
个水平,它可用来安排 2水平的实验。
按正交表安排并进行分析的实验称为正交实验。
正
交表有下述两个性质:一是任一列的每个水平出现的次数相同;二是任意两列的各种不同水平组合出现的次数相同。
在实际应用中,当把因素对应于正交表各列时,各行则表示应做实验的水平组合。
由于上述两个性质,任一因素的效应可不受其他因素干扰。
正交表的构作同组合数学有密切的关系,因此,有关正交表的一些理论性问题的探讨是纯粹数学的课题。
参考书目
R.A.Fisher,The Design of Experiments,Oliver & Boyd, London, 1935.
W.G.Cochran and G.M.Cox,Experimental Designs,2nd ed.,John Wiley & Sons,New York,1957.
田口玄一著:《実験計画法》,第3版、上册、下册,丸善株式会社,東京,1976、1977。
系统辨识实验设计
编辑词条分享
∙ 1 系统辨识实验设计
∙ 2 正文
∙ 3 配图
∙ 4 相关连接
准则和限制由参数估计理论得知:一切无偏估计量估计误差的协方差矩阵总是以费歇信息矩阵M的逆阵M-1为下界。
而有效性估计的估计误差协方差矩阵则达到了这个下界。
估计误差协方差矩阵是参数估计的精度标志。
在系统辨识中,费歇信息矩阵M的元素通过数学模型显式地或隐式地决定于系统的输入u i和采样间隔Δi等可控变量。
因此由信息矩阵M 产生的标量函数J=Φ(M),就可供作衡量不同实验所包含信息的一种量度或准则。
另外,在进行一项实验时,实验条件往往受到许多限制,例如:输入信号的类型、输入和输出的振幅或功率、允许持续进行实验的时间、最大和最小的采样速度、采样时间间隔(等间隔与不等间隔)等的限制。
综合最优实验设计当选定了一种实验信息的量度准则之后,在某些约束条件下对输入信号和采样间隔(也可以包括预采样滤波器)进行有约束的最优化计算,就可以得到在这个准则和约束条件下的综合最优实验设计。
一般地说,综合最优实验设计很复杂,只有当模型具有简单形式时,才能给出解析形式的条件,通常还要进行比较复杂的最优化计算才能得到
结果。
为了实用,常常采用次优设计。
单项最优实验设计除了综合设计外,也可以考虑单项的最优输入信号设计或单项的采样间隔设计,这相对来说要简单一些。
在实际应用中,通过计算机进行采样是等间隔的,因此最优输入信号的设计问题成为系统辨识实验设计中的主要内容。
输入信号因辨识的模型类的不同而异。
例如模型类属于频率响应,则单频正弦输入信号常比方波信号为好;如果模型是带有随机噪声的,则使用伪随机信号比一般的方波信号好。
输入信号的设计有时域和频域两种途径。
时域设计输入信号的时域设计是指设计结果为时域表示形式,即信号为时间t的函数。
设系统具有线性传递形式:y t=G1(z)u t+G2(ε)t,其中{u t}和{y t}分别为输入和输出序列,{εt}是数学期望为0、协方差为的高斯白噪声序列,G1和G2是传递函数,G2满足条件:
G2(∞)=1。
最优设计准则为关于输入信号u t的极小化目标函数J=-log det嚔,其中嚔=(1/N)M为平均信息矩阵, N为信号序列的长度,M为费歇信息矩阵。
为了不使输入信号平均功率过大,造成系统的过分激励,对输入信号应加上功率限制:。
在这个约束条件下,使目标函数J对于时域输入信号序列{u t}极小化,就能获得时域的最优输入信号{u t}。
这是一个标准的非线性最优控制问题,原则上通过最优化计算可以求解,当G1(z)呏1,
时为滑动平均模型。
这时问题有解析解,即满足正交性条件
的序列{u t}。
这意味着信号的样本自相关函数为一离散脉冲函数。
借助于阿达玛矩阵分析,对某些N可以实现这个设计。
例如,序列{u t}={- - + - + + + - - + - + +- - - - - - -},就是N=20时满足上述条件的最优输入信号。
当N很大时,白噪声序列和伪随机序列可以近似地满足上述正交性条件。
频域设计输入信号的频域设计结果是求出信号中应包含各种频率的成分及其振幅。
如果信号长度N允许足够大,输入信号{u t}可以用谱表示,对输入信号的功率限制为
,其中ξ(ω)是输入信号的功率谱,则频域设计过程是对目标函数
J=-log det嚔在上述功率约束条件下的优化过程。
业已证明,总可以用有穷多个不同振幅的单频正弦信号相加得到所要求的最优输入信号。
例如对于系统
,可以证明它的最优输入信号是一单频的正弦信号。
分析实验设计
编辑词条分享
∙ 1 分析实验设计
∙ 2 正文
∙ 3 配图
∙ 4 相关连接
在分析化学实验中,对最后测定值产生影响的因素(即各种实验条件)很多。
实验时对这些因素所取的水平不同(例如pH=4和pH=6是酸度的两个水平),会使测定值发生变动。
这种影响叫做因素的效应。
效应的大小只决定于一种因素的,称为这个因素的主效应。
通常都是将效应与不能消除的实验误差作比较,来判断该效应是不是显著。
一个有效的实验设计,应当能够做到以下几点:①给出主效应的一个无偏测量;②对主效应的变差提供一个无偏估计;③必要时,实验应提供有关各因素间可能存在的交互作用的信息;④应当使不能消除的实验误差尽可能小,并给出这个误差的估计。
单因素简单比较法即在固定其他因素的条件下,只改变一个因素的水平,作一批实
验,由实验结果确定该因素最好的水平。
后将该因素固定在这一最好水平上,再依次逐个地去研究其他因素的效应,最后将各因素的最好水平组合在一起,视为最优实验条件。
分析化学文献中通常还把在这些条件下的实验结果绘成曲线图,根据这些图选出最优条件。
单因素简单比较法需要做的实验次数较少,如果各因素之间不存在交互作用,这样选出的最优条件也是有效的。
但是采用这种方法,如不作重复实验,给不出实验误差的估计。
同样的实验次数,提供的信息不够丰富。
数理统计实验设计这种方法要解决的也是优选问题,它大体上可分为两大类:①采用已经制订好的实验设计用表来安排实验(这些表在一些统计用的表册或书中可以找到),做完一批实验,对数据进行统计处理,作出判断,再考虑作下一批实验。
②按照一定的优选程序作一个实验,计算比较一下效果;再按程序进行下一个实验;直到达到优选目的为止。
拉丁方设计如果只考虑各因素的主效应,不要求提供因素间交互作用的信息,那么采用拉丁方表来安排实验较好,这种方法称为拉丁方设计。
例如,要考察四种因素(每种因素各取三个水平)对分析结果有什么影响(效应),目的为求出因素-水平如何搭配能得最优的分析结果。
如果对各因素各水平的所有搭配进行全面试验,就要作n次实验,n=l f=34=81(l为水平数;f为因素数)。
如果按下述拉丁方表安排实验(表中A、B、C、D表示四种因素,1、2、3表示它们的不同水平):就把各因素各水平均衡地分散搭配起来,在每两个因素的各个水平之间,都相互搭配到了,没有遗漏,按表所示作9次实验,就能很好地代表81次实验。
这样做,代表性强,容易发现好条件,称为均衡分散性。
由于各因素的水平变化很有规律,在研究某一因素水平变化对实验结果的影响时,其他因素各水平出现的情况是完全相同的,这就保证了最大限度地排除了其他因素的干扰,突出了欲研究因素的效应。
通过比较因素在各水平时的效应平均值就可以确定因素主效应的大小,称为整齐可比性。
这种均衡分散、整齐可比的性质叫正交性,它使实验能提供比较丰富的信息,还能给出实验误差的估计。
分析实验设计
正交设计在拉丁方设计基础上发展起来的正交试验法,又叫正交设计,它是利用正交表L n(l f)来安排实验的方法。
L代表正交表,n是需要做的实验次数,l表示水平数,f是该表可能安排的最多的因素数。
正交表是拉丁方表的自然推广,一切正交表都具有均衡分散、整齐可比的正交性。
正交表中的实验次数并不一定是整数的平方,各因素的水平数有时也可不相同。
正交设计除了能对因素的主效应进行考察外,有时还能方便地考察各种因素之间的交互作用,并给出交互作用效应大小的估计。
正交设计通常不怕因素多,只要正交表能容纳,就可以尽可能多地安排欲考察的诸因素。
但是,正交表中的水平数通常较少。
水平数多的正交表,大都是实验次数多的大表,从而增加实验工作量和费用。
其次,正交设计主要还是用于考察各因素的主效应,通过一批实验,
优选出较好的因素-水平组合(即找出效果好的实验条件),还能在已经实验过的范围内,找出那些效应大的因素,帮助人们抓住对实验结果有显著影响的主要矛盾,为以后的考查指明方向。
虽然正交设计有时也可考察因素间的交互作用,但如想考察因素间的一切交互作用,那就必须采用大的正交表,实验次数就要大大增多。
均匀设计实验法采用均匀设计表U n(l f)来安排实验的方法,U代表均匀设计表,n、l、f的含义和正交表相同。
均匀设计表不具有均衡分散、整齐可比的正交性,它可以只通过很少次数的实验来考察水平数较多的若干因素,以获得较好的实验条件。
但由于缺乏正交性,在研究实验结果时不能采用方差分析法,通常采用直观比较法。
单纯形最优化方法即作一个实验,计算一次,再作一个实验,直到达到优选目的为止的一种程序。
所谓单纯形是一种几何图形,这些几何图形的每个顶点相当各个实验点,其坐标值就是与每个实验点相应的各个实验变量的值。
单纯形法开始是在一个初始单纯形顶点上作实验,按照一定的推移法则运动,不断产生新的单纯形,迫使单纯形不断地向最优的区域移动,并按预定的精度充分地接近最优点。
单纯形最优化方法有多种程序,其中基本单纯形法是通过单纯形中最坏响应点的反射来实现其运动的。
以双因素试验为例,单纯形为一个三角形,其初始单纯形的三个顶点,由两个因素的不同水平搭配组合而成。
做实验时,测得这三个实验点上的响应值,令效果最好的实验点为B,效果最坏的为W,效果次坏的为N。
放弃W点,由剩下的点算出形心点P c,求出W点相对于形心点P c的镜反射点R作为新的实验点,测其响应值。
让R点与前面留下的点构成新的单纯形,并由各顶点响应值的效果好坏,重新确定最好(B)、最坏(W)、次坏(N)点,继续反射。
这样每观测响应值一次,单纯形就推前一步,逐步向最优条件靠近,最后求得最优条件。
改进单纯形法就是在基本单纯形法的基础上增加了“扩张”和“压缩”两个功能,这两个功能不但能加速单纯形的前进,又能按预定的精度充分地接近最优点。
单纯形最优化法的优点在于各因素间的交互作用并不影响单纯形的推进运动。
如果在各实验点单独作一个分析实验来测响应值,并不太费时间。
将该法与计算机配合起来,效率更高。
均匀实验设计
开放分类:科学
编辑词条分享
∙ 1 等水平均匀设计的特点
∙ 2 均匀设计的基本步骤
∙ 3 参考资料
均与设计是中国数学家方开泰和王元于1978年首先提出来的,它是一种只考虑试验点在实验范围内均匀散布的一种实验设计方法。
由于均匀设计只考虑试验点的“均匀散布”而不考虑“整齐可比”,因而可以大大减少实验次数。
(1)每列不同数字都只出现一次,也就是说,每个因素在每个水平仅做一次;
(2)仍以两个因素的实验点点在平面的格子点上,每行每列有且仅有一个实验点,左图是均匀表U;
(3)均匀设计表任意两列组成的实验方案一般不等价;
(4)等水平均匀表的实验次数和水平数是一致的。
(1)明确实验目的,确定评价指标
(2)挑选因素,
(3)确定水平
(4)选均与设计表
(5)进行表头设计
(6)明确实验方案,进行实验。
(7)实验结果统计分析
分析方法有:a直观分析法;b回归分析法计算量很大,一般需借助计算机软件进行分析计算)。
实验设计
开放分类:心理学心理学术语数学术语社会科学
编辑词条分享
∙ 1 实验设计
∙ 2 正文
∙ 3 配图
∙ 4 相关连接
研究者在实验前根据研究目的拟定的实验计划及方法策略。
其主要内容是合理安排实验程序,并提出将如何对实验数据作统计分析、心理实验设计的主要步骤可归纳为:①根据研究目的提出假设;②拟定验证假设的方法、程序;③选择适当的处理、分析实验数据的统计方法。
功能及其评价实验设计的主要功能是对变量的控制,首先是在控制条件下有效地操纵或改变自变量,使因变量(即反应变量)的变化得到观察。
例如,研究两种教学方法对儿童学业成就的影响时,实验设计者应安排使其他条件尽量相同,如选择家庭和学校环境相似、学业基础相似,年龄相同的两组儿童,只控制使用两种不同的教学方法,然后考查二者对学习结果的影响。
良好的实验设计主要表现在合理安排实验程序,对无关变量进行有效的控制。
心理学实验中的无关变量,有些可以象理化实验那样通过一定的实验仪器及技术予以排除,但大部分难以排除,因而必须依靠实验设计平衡或抵消其影响。
这种控制方法称作实验控制法,常用的有几种:①消除或保持恒定法:主要利用实验室条件排除无关变量的干扰,对于不能排除的年龄、体重、实验环境、被试水平等变量,则设法使其保持恒定;②平衡法:即按随机原则将被试分为实验组与控制组,使无关变量对两组的影响均等;③抵消法:其目的在于控制由于实验顺序造成的影响,主要采用循环方式(只有两个实验处理时采用AB、BA法);
④纳入法:即把某种无关变量当作自变量处理,使实验从单因素变为多因素设计,然后对结果进行多元统计分析,从中找出每个自变量的单独作用及交互作用。
还有一些无关变量,虽。