因子方差分析的试验设计

因子方差分析的试验设计
因子方差分析的试验设计

试验设计

一、试验设计的基本概念与正交表

(一)试验设计

产品质量的好坏很大程度上是由设计所决定的,因此在新产品的开发设计阶段就要十分重视。当然设计的好产品要成为真正高质量的产品,在生产过程中还得有好的工艺参数,为此经常需要进行试验,从影响产品两的一些因素中去寻找好的原料搭配,好的工艺参数搭配等,这便是多因素(因子)的试验设计问题。

多因素试验遇到的最大困难时试验次数太多,让人无法忍受。如果有10个因子对产品质量有影响,每个因子取两个不同水平进行比较,那么就有210=1024个不同的试验条件需要比较,假定每个因子取三个不同水平比较的话,那么就有310=59049个不同的试验条件,要全部做试验在实际中是不大可能的,因此我们只能从中选择一部分进行试验。选择哪些条件进行试验十分重要,这便是试验的设计。一个好的设计,可以通过少量试验获得较多的信息,达到试验的目的。试验设计的方法有许多,这里介绍的正交实验设计便是其中的一种常用方法,它利用“正交表”选择试验条件,并利用正交表的特点进行数据分析,找出最好的或最满意的试验条件。

(二)正交表

表2.3-1是一张典型的正交表L9(34),这里“L”是正交表的代号,“9”表示表的行数,在试验中表示用这张表安排试验的话,要做9个不同条件的试验,“4”表示表的列数,在试验中表示用这张表安排试验的话,最多可以安排4个因子,“3”表示表的主题只有3个不同的数字:1,2,3,在试验中它代表因子水平的编号,即用这张表安排试验时每个因子应取3个不同水平。

表2.3-1 L9(34)

正交表具有正交性,这是指它有如下两个特点:

(1)每列中每个数字重复次数相同。在表L9(34)中,每列有3个不同数字:1,2,3,每一个出现3次;

(2)将任意两列的同行数字堪称一个数对,那么一切可能数对重复次数相同。在表L9(34)中,任意两列有9中可能的数对:(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),每一对出现一次。

如果将试验条件堪称试验空间(一起可能试验条件组成的集合)中的一点,那么正交表的这两个特点使所选择的试验点在试验空间中的分布是均匀分散的,并将看到试验结果具有综合可比性,以为以后的统计分析带来了便利。

常用的正交表有两大类。若计一般的正交表为L n(q p),则:

一类正交表的行数n,列数p,水平数q间有如下关系:

n=q k,k=2,3,4,…,p=(n-1)/(q-1)(2.3-1)如二水平正交表L4(23),L8(27),L16(215),L32(231)等,三水平正交表L9(34),L27(313)等,四水平正交表L16(45)等,五水平正交表L25(56)等,这一类正交表不仅可考察各因子对试验指标的影响,有的还可考察因子间的交互作用的影响。

另一类正交表的行数,列数,水平数之间不满足(2.3-1)中的两个关系,往往只能考察各因子的影响,不能用这些正交表来考察因子间的交互作用。如二水平正交表L12(211),L20(219)等,三水平正交表L18(37),L36(313)等,混合水平正交表L18(2×37),L36(23×313)等。

附录2给出了常用的正交表。

二、无交互作用的政教实验设计与数据分析

下面通过一个例子来叙述利用正交表安排试验与进行数据分析的步骤。

【例2.3-1】磁鼓电机是彩色录像机磁鼓组建的关键部件之一,按质量要求其输出力矩大于0.0210N·m。某生产厂过去这项指标的合格率较低,从而希望通过试验找出好的条件,以提高磁鼓电机的输出力矩。

(一)试验的设计

在安排试验时,一般应考虑如下几步:

(1)明确试验目的,在本例中试验的目的是提高磁鼓电机的输出力矩。

(2)明确试验指标:试验指标用来判断试验条件的好坏,在本例中直接用输出力矩作为考察指标,该指标越大,表明试验条件越好。

(3)确定因子与水平:在实验前首先要分析影响指标的因子是什么,每个因子在试验中取哪些水平。在本例中,经分析影响输出力矩的可能影子有三个,它们是:

A:充磁量B:定位角度C:定子线圈匝数

根据各因子的可能取值范围,经专业人员分析研究,决定在本试验中采用的水平如表2.3-2所示。

表2.3-2 因子水平表

(4)选用合适的正交表,进行表头设计,列出试验计划:首先根据在试验中所考察的因子水平数选择具有该水平数的一类正交表,再根据因子的个数具体选定一张表。在本例中所考察的因子都是三水平的,因此选用三水平正交表,又由于现在只考察三个因子,所以选用L9(34)即可。

选定了正交表后吧因子放到正交表的列上去,成为表头设计。在不考虑交互作用的场合,可以把因子放在任意的列上,印个因子占一列。譬如在本例中将三个因子分别置于前三列,将它写成如下的表头设计形式:

有了表头设计便可写出试验计划,只要将置因子的列中的数字换成因子的相应水平即可,不放因子的列(称为空白列)就不予考虑。本例的试验计划可以这样的可以这样得到:

将第一列的1,2,3分别换成充磁量的三个水平900,1100,1300,将第二列的1,2,3分别换成定位角度的三个水平10,11,12,将第三列的1,2,3分别换成定子线圈匝数的三个水平70,80,90,测得试验计划(见表2.3-3)。表中第一号试验的条件是充磁量取900×10-4特,定位角度取10度,定子线圈取70匝。其他各号试验条件类似得到。

表2.3-3 试验计划与试验结果

由此可见,用正交表L9(34)安排试验共有9个不同的试验条件,它们是一起设计好的,而不是等一个试验结束后再决定下一个试验条件,因此称这样的设计为“整体设计”。

这里9个试验点在三维空间中分布在一个长方体上,见图2.3-1,从图中可见:从三个方向的任一方向做三个等距的垂直于坐标轴的平面,则在每一行上有一个点,每一列上也有一个点。因此这9个点在三维空间的分布使均匀分散的。

(二)进行试验和记录试验结果

有了试验计划后就可以按其进行试验,并将试验结果记录在对应的试验条件后面,对于【例2.3-1】的问题,为计算和分析方便起见,表2.3-3中的y值是实测的104倍。

为了避免实现某些考虑不周而产生系统误差美因茨试验的次序最好要随机化,这可以用抽签的方式决定,譬如用9张同样的纸,分别写上1~9,经混乱后依次取出,如果依次摸到:3,5,2,9,1,6,4,7,8,那么就先做第3号试验,再做第5号试验,……,最后做第8号试验。

此外,在试验中还应尽量避免因操作人员的不同,仪器设备的不同等引起的系统误差,尽可能使试验中除所考察的因子外的其他因素固定,再不能避免的场合可以增加一个“区组

因子”。譬如试验由三个人进行,则可以把“人”也看成一个因子,三个人便是三个水平,将其放在正交表的空白列上,那么该列的1,2,3对应的试验分别由第一、第二、第三个人去做,这样就避免了因人员变动所造成的系统误差。

(三)数据分析

在【例2.3-1】中考虑了三个三水平因子,其所有不同的试验条件共有27个,现在仅做了其中的9个。试验的目的是想找出那些因子对指标是有明显影响的,各个因子的什么样的水平组合可以使指标达到最大。这可以利用正交表的特点进行数据分析。仍然结合【例2.3-1】进行叙述。

表2.3-4 【例2.3-1】直观分析计算表

1.数据的直观分析

(1)寻找最好的试验条件

首先我们来看第一列,该列中的1,2,3分别表示因子A 的三个水平,按水平号将数据分为三组:“1”对应{y 1,y 2,y 3},“2”对应{y 4,y 5,y 6},“3” 对应{y 7,y 8,y 9}。

“1”对应的三个试验都采用因子A 的一水平进行试验,但因子B 的三个水平各参加了一次试验,因子C 的三个水平也各参加了一次试验。这三个试验结果的和与平均值分别为:

1853/,555180215160113211===++=++=T T y y y T

同理可得T 2=594,T 2=198,T 3=502,T 3=167.3

由以上可知,T 1,T 2,T 3之间的差异只反映了A 的三个水平间的差异,因为这三组试验条件除了因子A 的水平有差异外,因子B 与C 之间的条件是一致的,所以可以通过比较这三个平均值的大小看出因子A 的水平的好坏。从这三个数据可知因子A 的二水平最好,因为其指标均值最大。这种方法比较称为“综合比较”。以上计算都列在表2.3-4的下方。

同理可看到第二列与第三列,按其中的1,2,3分别将数据分成三组,计算各自的数据和与平均,它们也都列在表2.3-4的下方。由此可知,因子B 取二水平较好,因子C 取三水平较好。

综上可知使指标达到最大的条件是A 2B 2C 3,即充磁量取1100×104特,定位角度取11度,定子线圈取90匝可以使输出力矩达到最大。

(2)各因子对指标影响程度大小的分析

这可从各个因子试验结果的极差来看,这里指的一个因子的极差是该因子不同水平对应的试验结果的均值的最大值与最小值的差,因为该值大的话,则改变这一因子的水平会对指标造成较大的变化,所以该因子对指标的影响大,反之,影响就小。

在本例中因子A 的极差为:

R A =198-167.3=30.7

对因子B 、C 可同样计算,它们被置于表2.3-4的最下面一行。从三个因子的极差可知因子B 的影响最大,其次是因子A ,而因子C 的影响最小。

(3)各因子不同水平对指标的影响图

为直观起见,可以将每个因子不同水平下试验结果的均值画成一张图,【例2.3-1】的图见图2.3-2,从图上可以明显看出每一因子的最好水平A 2,B 2,C 3,也可以看出各个因子对指标影响的大小,R B >R A >R C 。

图2.3-2因子个水平对输出力矩的影响

2.数据的方差分析

在数据的直观分析中是通过极差的大小来评价各个因子对指标影响的大小,那么极差要小到什么程度可以认为该因子水平变化对指标值已经没有显著的差别了呢?为了回答这一问题,需要对数据进行方差分析。

在方差分析中,我们假定每一试验是独立进行的,每一试验条件下的试验指标服从正态分布,这些分布的均值与试验条件有关,可能不等,但它们的方差是相等的。

(1)平方和分解

为进行方差分析,从试验结果出发。由于试验条件的不同与试验中存在误差,因此各试验结果不同,我们可以用总(离差)平方和S T 去描述数据的总波动:

∑=-=n

i i T y y S 1

2)( (2.3-2)

其中n 是试验次数,y 是试验结果的总平均,若计∑==

n

i i

y

T 1

,则y =T /n 。

造成数据波动的原因可能是因子所取的水平不同,也可能是试验误差,当然也可能两者都有。为此要把由各个原因造成的波动分别用数量来表示。

先来看由于因子A 的水平不同所引起的数据波动度量。仍用T 1、T 2、T 3表示其三个水平下的试验结果平均,用y 表示试验结果的总平均。我们考虑T 1、T 2、T 3与y 的(离差)平方和,计为S A :

∑=-=n

i i A y T S 1

2)(3 (2.3-3)

这里乘以3是因为每一水平重复进行了三次试验。S A 除了误差外只反映因子A 的水平间的差异,即由于因子A 的水平不同所引起的试验结果的波动。因此称其为因子A 的(离差)平方和。由于这里的T 1、T 2、T 3是第一列的3个数字分别对应的试验结果的平均值,因此(2.3-3)式也可以看成是第1列的平方和,计为S 1。因为因子A 置于第1列,故S A =S 1。

同理可以计算其他各列的平方和。

由于因子B 、C 分别置于第2、3列,故有S B =S 2,S C =S 3。

第四列上没有置因子,称为空白列。S 4仅仅反映了由误差造成的数据波动,称它为误差平方和,计为S e ,即:

S e = S 4

用代数法可以证明,在L 9(34)中总平方和与各列平方和间有如下关系:

S T =S 1+S 2+S 3+S 4

对于一般的正交表来讲,只要其行数n 、列数p 与水平数q 满足(2.3-1)式,则有:

S T =S 1+S 2+…+S p (2.3-4)

称(2.3-4)为平方和的分解式。

(2)F 比

与方差分析类似,称(离差)平方和与自由度的比为均方与误差的均方进行比较,当F

=MS 因/MS e >F 1-ɑ(f 因,f e )时,认为在显著性水平ɑ上因子是显著的,其中MS 因,f 因分别

是因子的均方与自由度,MS e ,f e 分别是误差的均方与自由度。

为此需要给出因子与误差的自由度。同方差分析中所述,一个因子的自由度是其水平数—1,在正交设计中因子是置于正交表的列上,为叙述方便,也成正交表一列的自由度为其水平数—1,即q —1,因子的自由度与所在列的自由度应该相等。而误差平方和为正交表上空白列的平方和相加而得,其自由度为正交表上空白列的自由度相加。总平方和的自由度是试验次数—1。当正交表中行数n 、列数p 与水平数q 满足(2.3-1)式时,对平方和有关系式(2.3-4),同样,对自由度也有相应关系式:

f T =f 1+f 2+…+f p

这里f T =n —1,也成它为正交表的自由度。

(3)计算

通常也用列表的方法计算各列平方和(见表2.3-5)。 通过代数运算,可以用下式计算一列平方和与总平方和:

n T q n T S q

i i 212/-

=∑=,n T y S q

i i T 21

2

-=∑= (2.3-5) 表2.3-5 【例2.3-1】的方差分析计算表

利用(2.3-4)式可以验证平方和计算是否正确。

对于F比的计算通常列成一张方差分析表(见表2.3-6)。

表2.3-6 【例2.3-1】的方差分析表

由于F A大于F0.90(2,2)=9.0,F B大于F0.95(2,2)=19.0,因此因子A与B分别在显著性水平0.10与0.05上是显著的,而因子C不显著。

(4)最佳条件的选择

对显著因子应该选择其最好的水平,因为其水平变化会造成指标的显著不同,而对不显著因子可以任意选择水平,实际中常可根据降低成本、操作方便等来考虑其水平的选择。

在【例2.3-1】中因子A与B是显著的,所以要选择其最好的水平,按前所述,应取A2B2;对因子C可以选择任意水平,譬如为了节约材料可选C1。将此最佳条件计为A2B2或A2B2C,由于C不显著,故可不写,若写的话,无下标,表示可根据节省时间、节约消耗等实际情况取三个水平中的某一个。

3. 因子的贡献率分析

当试验指标不服从正态分布时,进行方差分析的依据就不够充足,此时可以通过比较各因子的“贡献率”来衡量因子作用的大小。

由于S因中除了因子的效应外,还包含误差,从而称S因—f因MS e为因子的纯(离差)平方和,称因子的纯平方和与S T的比为因子的贡献率。而称f T MS e/S T为误差的贡献率。在【例2.3-1】中因子与误差的贡献率如表2.3-7所示。

表2.3-7 【例2.3-1】因子与误差的贡献率

从表中可知,因子B最重要,它的水平变化引起的数据波动在总平方和中占了72.80%,其次是因子A,而因子C的水平变化引起的数据波动还不及误差引起的数据波动的贡献率大,所以因子C可以认为不重要。

(四)验证试验

在【例2.3-1】中找到的最佳条件是A2B2,即试验中的第5号试验,其试验结果确为9次试验中指标最高的。但在实际问题中分析所得的最佳条件不一定在试验中出现,为此通常需要进行验证试验,譬如选择条件A2B2C1,该条件就不在所进行的9次试验中,它是否真的符合要求?所以在实际中验证试验是不可少的,即使分析所得的最佳条件在试验中出现,也需要通过验证试验看起是否稳定。

例如在【例2.3-1】中对条件A2B2C1进行了三次试验,结果分别为233,240,220,其平均值231看来该条件是满意的。

方差分析和试验设计

6方差分析与试验设计 在研究一个或多个分类型自变量与一个数值型因变量之间的关系时,方差分析就是其中主要方法之一。检验多个总体均值是否相等的统计方法。 所要检验的对象称为因素。因素的不同表现称为水平。每个因子水平下得到的样本数据称为观测值。 随机误差:在同一行业(同一总体)下,样本的各观测值是不同的。抽样随机性造成。 系统误差:在不同一行业(不同一总体)下,样本的各观测值也是不同的。抽样随机性和行业本身造成的。 组内误差:衡量因素在同一行业(同一总体)下样本数据的误差。只包含随机误差。 组间误差:衡量因素在不同一行业(不同一总体)下样本数据的误差。包含随机误差、系统误差。 方差分析的三大假设: 每个总体服从正态分布; 每个总体的方差必须相同; 观测值是独立的; 单因素方差分析(F分布) 数据结构:表示第i个水平(总体)的第j个的观测值。(i列j行)分析步骤: 1提出假设。自变量对因变量没有显著影响 不完全相等自变量对因变量有显著影响 2构造检验的统计量 计算因素各水平的均值(各水平样本均值) 计算全部观测值的总均值(总体均值) 计算误差平方和: 总误差平方和SST:全部观测值与总平均值得误差平方和。 水平项误差平方和SSA:各组平均值与总平均值得误差平方和。组间平方和。 误差项平方和SSE:各样本数据与其组平均值误差的平方和。组内平方和。 SST=SSA+SSE

A B C D E F G 1 误差来源 平方和自由度均方F 值P 值 F 临界值2SS df MS 3组间(因素 来源)SSA k-1MSA MSA/MSE 4组内(误差)SSE n-k MSE 5 总和 SST n-1 计算统计量 各平方和除以它们对应的自由度,这一结果称为均方。 SST 的自由度为(n-1),其中n 为全部观测值的个数。 SSA 的自由度为(k-1),其中k 为因素水平的个数。(组数-1) SSE 的自由度为(n-k )。 SSA 的均方(组间均方)为 SSE 的均方(组内均方)为 3统计决策 在给定的显著性水平α下,查表得临界值 若,有显著影响; 若,无显著影响; 4方差分析表

方差分析与试验设计

第10章 方差分析与试验设计 三、选择题 1. C 2. B 3. A 4. B 5. C 1.方差分析的主要目的是判断 ( )。 A. 各总体是否存在方差 B. 各样本数据之间是否有显著差异 C. 分类型自变量对数值型因变量的影响是否显著 D. 分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是 ( )。 A. 组间平方和除以组内平方和 B. 组间均方除以组内均方 C. 组间平方除以总平方和 D. 组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为 ( )。 A. 随机误差 B. 非随机误差 C. 系统误差 D. 非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为 ( )。 A. 组内误差 B. 组间误差 C. 组内平方 D. 组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 6. A 7. D 8. D 9. A 10.A 6.组内误差是衡量某一水平下样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 7.在下面的假定中,哪一个不属于方差分析中的假定 ( )。 A. 每个总体都服从正态分布 B. 各总体的方差相等 C. 观测值是独立的 D. 各总体的方差等于0 8.在方差分析中,所提出的原假设是210:μμ=H = ···=k μ,备择假设是( ) A. ≠≠H 211:μμ···k μ≠ B. >>H 211:μμ···k μ> C. <

正交试验设计及其方差分析

第三节正交试验设计及其方差分析 在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验),多因素试验由于要考虑的因素较多,当每个因素的水平数较大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表——正交表,来安排试验,通过少量的试验,获得满意的试验结果. 1.正交试验设计的基本方法 正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表. 正交表是预先编制好的一种表格.比如表9-17即为正交表L4(23),其中字母L表示正交,它的3个数字有3种不同的含义: (1) L4(23)表的结构:有4行、3列,表中出现2个反映水平的数码1,2. 列数 ↓ L4 (23) ↑↑ 行数水平数 (2)L4(23)表的用法:做4次试验,最多可安排2水平的因素3个. 最多能安排的因素数 ↓ L4(23) ↑↑ 试验次数水平数 (3) L4(23)表的效率:3个2水平的因素.它的全面试验数为23=8次,使用正交表只需从8次试验中选出4次来做试验,效率是高的. L4(23) ↑↑ 实际试验数理论上的试验数 正交表的特点: (1)表中任一列,不同数字出现的次数相同.如正交表L4(23)中,数字1,2在每列中均出现2次. (2)表中任两列,其横向形成的有序数对出现的次数相同.如表L4(23)中任意两列,

第10章 方差分析与试验设计

第10章 方差分析与试验设计 三、选择题 1.方差分析的主要目的是判断 ( )。 A. 各总体是否存在方差 B. 各样本数据之间是否有显著差异 C. 分类型自变量对数值型因变量的影响是否显著 D. 分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是 ( )。 A. 组间平方和除以组内平方和 B. 组间均方除以组内均方 C. 组间平方除以总平方和 D. 组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为 ( )。 A. 随机误差 B. 非随机误差 C. 系统误差 D. 非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为 ( )。 A. 组内误差 B. 组间误差 C. 组内平方 D. 组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 6.组内误差是衡量某一水平下样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 7.在下面的假定中,哪一个不属于方差分析中的假定 ( )。 A. 每个总体都服从正态分布 B. 各总体的方差相等 C. 观测值是独立的 D. 各总体的方差等于0 8.在方差分析中,所提出的原假设是210:μμ=H = ···=k μ,备择假设是( ) A. ≠≠H 211:μμ···k μ≠ B. >>H 211:μμ···k μ> C. <

第八章常用试验设计的方差分析

第八章 常用试验设计的方差分析 8.1 多因素随机区组试验和单因素随机区组试验的分析方法有何异同?多因素随机区组试验处理项的自由度和平方和如何分解?怎样计算和测验因素效应和互作的显著性,正确地进行水平选优和组合选优? 8.2 裂区试验和多因素随机区组试验的统计分析方法有何异同?在裂区试验中误差E a 和E b 是如何计算的,各具什么意义?如何估计裂区试验中的缺区?裂区试验的线性模型是什么? 8.3 有一大豆试验,A 因素为品种,有A 1、A 2、A 3、A 4 4个水平,B 因素为播期,有B 1、B 2、B 3 3个水平,随机区组设计,重复3次,小区计产面积25平方米,其田间排列和产量(kg )如下图,试作分析。 区组Ⅰ 区组Ⅱ 区组Ⅲ [答案: e MS 0.31,F 测验:品种、播期极显著,品种×播期不显著] 8.4 有一小麦裂区试验,主区因素A ,分A1(深耕)、A2(浅)两水平,副区因素B ,分B1(多肥)、B2(少肥)两水平,重复3次,小区计产面积15平方米,其田间排列和产量(假设数字)如下图,试作分析。 区组Ⅰ 区组Ⅱ 区组Ⅲ [答案: a E MS =0.58, b E MS =2.50,F 测验:A 和B 皆显著,A ×B 不显著] 8.5 设若上题小麦耕深与施肥量试验为条区设计,田间排列和产量将相应如下图,试作分

析,并与裂区设计结果相比较)。 B 1 B 1B 2 B 2 B 2B 1 [答案: A E MS =0.58, B E MS =1.75, c E MS =3.25,F 测验A 、B 均显著,A ×B 不显著] 8.6 江苏省淮南地区夏大豆区域试验部分资料摘录如下: 试点 年份 区组 CK 19—15 31—15 4—1 21—16 试点1 1977年 Ⅰ 134 160 168 226 196 Ⅱ 146 180 156 170 190 Ⅲ 148 206 188 216 200 1978年 Ⅰ 220 264 280 212 168 Ⅱ 228 260 276 208 156 Ⅲ 208 220 300 260 148 试点2 1977年 Ⅰ 137 236 197 196 155 Ⅱ 173 207 178 192 179 Ⅲ 110 171 223 208 125 1978年 Ⅰ 179 201 150 195 186 Ⅱ 182 224 189 203 191 Ⅲ 207 262 187 210 183 各年各点均为随机区组设计,试分析此试验结果。 [答案: 2 =3.67,e MS =406.06,Fv=12.89,Fvs=1.88,Fvy=5.18,Fvsy=10.35] 8.7 在药物处理大豆种子试验中,使用了大中小三种类型种子,分别用五种浓度、两种处理时间进行试验处理,播种后45天对每种各取两个样本,每个样本取10株测定其干物重,求其平均数,结果如下表。试进行方差分析。 处理时间A 种子类型C 浓度B B 1(0×10-6) B 2(10×10-6) B 3(20×10-6) B 4(30×10-6) B 5(40×10-6) A 1(12小时) C 1(小粒) 7.0 12.8 22.0 21.3 24.4 6.5 11.4 21.8 20.3 23.2 C 2(中粒) 13.5 13.2 20.4 19.0 24.6 13.8 14.2 21.4 19.6 23.8 C 3(大粒) 10.7 12.4 22.6 21.3 24.5 10.3 13.2 21.8 22.4 24.2 A 2(24小时) C 1(小粒) 3.6 10.7 4.7 12.4 13.6 1.5 8.8 3.4 10.5 13.7

试验设计与数据分析

试验设计与数据分析

1.方差分析在科学研究中有何意义?如何进行平方和与自由度的分解?如何进行F检验和多重比较? (1)方差分析的意义 方差分析,又称变量分析,其实质是关于观察值变异原因的数量分析,是科学研究的重要工具。方差分析得最大公用在于:a. 它能将引起变异的多种因素的各自作用一一剖析出来,做出量的估计,进而辨明哪些因素起主要作用,哪些因素起次要作用。 b. 它能充分利用资料提供的信息将试验中由于偶然因素造成的随机误差无偏地估计出来,从而大大提高了对实验结果分析的精确性,为统计假设的可靠性提供了科学的理论依据。 (2)平方和及自由度的分解 方差分析之所以能将试验数据的总变异分解成各种因素所引起的相应变异,是根据总平方和与总自由度的可分解性而实现的。 (3)F检验和多重比较 ① F检验的目的在于,推断处理间的差异是否存在,检验某项变异原因的效应方差是否为零。实际进行F检验时,是将由试验资料算得

的F 值与根据df 1=df t (分子均方的自由度)、df 2=df e (分母均方的自由度)查附表4(F 值表)所得的临界F 值(F 0.05(df1,df2)和F 0.01(df1,df2))相比较做出统计判断。若F< F 0.05(df1,df2),即P>0.05,不能否定H 0,可认为各处理间差异不显著;若F 0.05(df1,df2)≤F <F 0.01(df1,df2),即0.01

利用SPSS 进行方差分析以及正交试验设计

实验设计与分析课程论文 题目利用SPSS 软件进行方差分析和正交试验设计 学院 专业 年级 学号 姓名 2012年6月29日

一、SPSS 简介 SPSS 是世界上最早的统计分析软件,1984年SPSS 总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS 微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS 的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。 SPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS 统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic 回归、Probit 回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS 也有专门的绘图系统,可以根据数据绘制各种图形。SPSS 的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL 及DBF 数据文件,现已推广到多种各种操作系统的计算机上,它和SAS 、BMDP 并称为国际上最有影响的三大统计软件。 SPSS 输出结果虽然漂亮,但不能为WORD 等常用文字处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。这可以说是SPSS 软件的缺陷。 二、方差分析 例如 某高原研究组将籍贯相同、年龄相同、身高体重接近的30名新战士随机分为三组,甲组为对照组,按常规训练,乙组为锻炼组,每天除常规训练外,接受中速长跑与健身操锻炼,丙组为药物组,除常规训练外,服用抗疲劳药物,一月后测定第一秒用力肺活量(L),结果见表。试比较三组第一秒用力肺活量有无差别。对照组为组一,锻炼组为组二,药物组为组三。 第一步:打开 SPSS 软件 表1 三组战士的第一秒用力肺活量(L) 对照组 锻炼组 药物组 合计 3.25 3.66 3.44 3.32 3.64 3.62 3.29 3.48 3.48 3.34 3.64 3.36 3.16 3.48 3.52 3.64 3.20 3.60 3.60 3.62 3.32 3.28 3.56 3.44 3.52 3.44 3.16 3.26 3.82 3.28

第六章--方差分析与正交试验设计讲解学习

第六章 方差分析与正交试验设计 在生产实践和科学研究中,经常要分析各种因素对试验指标是否有显著的影响。例如,工业生产中,需要研究各种不同的配料方案对生产出的产品的质量有无显著差异,从中筛选出较好的原料配方;农业生产中,为了提高农作物的产量,需要考察不同的种子、不同数量的肥料对农作物产量的影响,并从中确定最适宜该地区种植的农作物品种和施肥数量。 要解决诸如上述问题,一方面需要设计一个试验,使其充分反映各因素的作用,并力求试验次数尽可能少,以便节省各种资源和成本;另一方面就是要对试验结果数据进行合理的分析,以便确定各因素对试验指标的影响程度。 §6.1 单因素方差分析 仅考虑一个因素A 对试验指标有无显著影响,可以让A 取r 个水平:r A A A ,,,21 ,在水平i A 下进行i n 次试验,称为单因素试验,试验结果观测数据ij x 列于下表: 并设在水平i A 下的数据i in i i x x x ,,21来自总体),(~2 i i N X ,),,2,1(r i 。 检验如下假设: r H 210:, r H ,,,:211 不全相等 检验统计量为 ),1(~) /() 1/(r n r F r n S r S F e A 其中2 1 2 11)()(x x n x x S i r i i r i n j i A i ,称为组间差平方和。 211 )(i r i n j ij e x x S i ,称为组内差平方和。

这里 r i i n n 1 , i n j ij i i x n x 1 1 , r i n j ij i x n x 111。 对于给定的显著性水平)05.001.0(或 ,如果),1(r n r F F ,则拒绝0H ,即认为因素A 对试验指标有显著影响。 实际计算时,可事先对原始数据作如下处理: b a x x ij ij 再进行计算,不会影响F 值的大小。 例1 试分析三种不同的菌型对小白鼠的平均存活日数影响是否显著? 解:30,11,9,10,3321 n n n n r 16.6,27.7,22.7,4321 x x x x 43.70)()(21 2 11 x x n x x S i r i i r i n j i A i , 74.137)(211 i r i n j ij e x x S i 49.5)27,2(90.601.0 F F ,说明三种不同菌型的伤寒病菌对小白鼠的平均存活日数的影响高度显著。 §6.2 双因素方差分析 同时考察两个因素A 和B 对试验指标有无显著影响,可以让A 取r 个水平: r A A A ,,,21 ,让B 取s 个水平:s B B B ,,,21 ,在各种水平配合),(j i B A 下进行试验, 称为双因素试验。 一、无交互作用的双因素方差分析 在每一种水平配合),(j i B A 下作一次试验,称为无交互作用的双因素试验,试验结果观测数据ij x 列于下表:

第10章__方差分析与试验设计

第10章方差分析与试验设计 三、选择题 1.C 2.B 3.A 4.B 5.C 1.方差分析的主要目的是判断()。 A.各总体是否存在方差 B.各样本数据之间是否有显著差异 C.分类型自变量对数值型因变量的影响是否显著 D.分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是()。 A.组间平方和除以组内平方和B.组间均方除以组内均方 C.组间平方除以总平方和D.组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为()。 A.随机误差B.非随机误差C.系统误差D.非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为()。 A.组内误差B.组间误差C.组内平方D.组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它()。 A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,也包括系统误差 D.有时包括随机误差,有时包括系统误差 6.A 7.D8.D9.A10.A 6.组内误差是衡量某一水平下样本数据之间的误差,它()。 A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,也包括系统误差 D.有时包括随机误差,有时包括系统误差 7.在下面的假定中,哪一个不属于方差分析中的假定()。 A.每个总体都服从正态分布B.各总体的方差相等 C.观测值是独立的D.各总体的方差等于0 8.在方差分析中,所提出的原假设是0:=···= ,备择假设是() 12 k A.1:12···kB.1:12···k C. 1:···kD.1:1,2,···,k不全相等 12 9.单因素方差分析是指只涉及()。 A.一个分类型自变量B.一个数值型自变量 C.两个分类型自变量D.两个数值型因变量 10.双因素方差分析涉及()。 A.两个分类型自变量B.两个数值型自变量 C.两个分类型因变量D.两个数值型因变量 11.B12.C

方差分析与试验设计

课程名称统计学指导教师实验日期 院(系)专业班级实验地点 学生姓名学号同组人 实验项目名称方差分析与试验设计 一、实验目的 通过实验掌握方差分析基本原理,对单因素方差分析、双因素方差分析以及实验设计具有初步认识。 二、实验内容 城市道路交通管理部门为研究不同的路段和不同的时间段对行车时间的影响,让一名交通警察分别在3个路段和高峰期与非高峰期亲自驾车进行试验,通过实验共获得30个行车时间(单位:分钟)的数据。试分析路段、时段以及路段和时段的交互作用对行车时间的影响。(α=0.05) 三、实验步骤 1.在Excel中输入实验数据 2.点击【工具】→【数据分析】【方差分析:单因素分析】,单击【确定】 3.输入数据区域,单击【确定】 4.重复2.3. 5.选择【方差分析:可重复双因素分析】,单击【确定】 四、实验结果 1.路段: 方差分析:单因素方差分析 SUMMARY

2.时段: 方差分析:单因素方差分析 3.路段和时段的交互作用对行车时间的影响: 方差分析:可重复双因素分析 SUMMARY 28.1 32.4 总计 34.1 观测数 3 3 6 求和93.6 104.7 198.3

平均31.2 34.9 33.05 方差 1.39 2.83 5.795 38 观测数 3 3 6 求和82 94.9 176.9 平均27.33333 31.63333 29.48333 方差8.463333 12.62333 13.98167 32.4 观测数 3 3 6 求和69.1 81.6 150.7 平均23.03333 27.2 25.11667 方差 4.223333 3.61 8.341667 总计 观测数9 9 求和244.7 281.2 平均27.18889 31.24444 方差16.03611 15.96778 方差分 析 差异源SS df MS F P-value F crit 样本189.4533 2 94.72667 17.15027 0.000303 3.885294 列74.01389 1 74.01389 13.40022 0.003262 4.747225 交互0.297778 2 0.148889 0.026956 0.973463 3.885294 内部66.28 12 5.523333 总计330.045 17 五、实验分析 1. 路段对行车时间的影响 F=0.915773< F crit=3.31583,表明路段对行车时间的影响不显著。 2. 时段以对行车时间的影响 F=3.739213> F crit=2.392814,表明时段以对行车时间的影响显著。 3.路段和时段的交互作用对行车时间的影响 F=0.026956< F crit=3.885294,表明路段和时段的交互作用对行车时间的影响显著。

第9章 方差分析与试验设计

统计学 STATISTICS 警惕过多地假设检验。你对数据越苛求,数据会越多地向你供认,但在威逼下得到的供词,在科学询查的法庭上是不容许的。 Stephen M.Stigler

统计学 STATISTICS第9章方差分析与试验设计

STATISTICS SARS病毒灭活疫苗临床试验 ?2004年12月5日,科技部、卫生部、国家食品药品监督管 理局共同宣布:中国自主研制的SARS病毒灭活疫苗Ⅰ期临床试验圆满结束。经对36人的试验结果表明,36位受试者均未出现异常反应,其中24位接种疫苗的受试者全部产生了抗体,这表明我国自主研制的疫苗是安全有效的 ?2003年SARS疫情发生后,SARS疫苗的研制确定为重要 任务之一。科技部积极组织协调,形成了由北京科兴生物制品有限公司、中国疾病预防控制中心病毒病预防控制所和中国医学科学院实验动物研究所共同组成的疫苗研制项目课题组,研究人员包括北京科兴生物制品有限公司、中国医学科学院实验动物研究所、中国疾病预防控制中心病毒病预防控制所、中日友好医院等部门在内的100多位科研人员和医生

STATISTICS SARS病毒灭活疫苗临床试验 ?2004年1月19日,SARS病毒灭活疫苗获准进入Ⅰ期临床 研究,本次试验共选择36名年龄在21岁到40岁的健康人作为志愿者,男女各18人,在中日友好医院接受了SARS 疫苗临床研究。免疫接种分为16个单位和32个单位两种剂量,并设安慰剂对照组,各12人。这次SARS疫苗临床研究方案完全按照国际规范,采用知情同意、伦理审查、随机双盲等规范化操作 ?本次试验采用随机双盲的实验设计。受试者和参加临床试 验或临床评价的研究人员或疫苗研制方的工作人员均不知道也不能识别受试者接受了何种注射(疫苗或安慰剂)。在试验结束、完成数据清理、数据已达到可以接受水平,可由指定人员揭盲,打开密封的设盲信封,从而知道哪个受试者接种的是试验疫苗,哪个受试者接种的是安慰剂

试验设计案例方差分析

1、通过以下试验设计案例总结“正交试验设计的基本程序和步骤”。 案例:为了研究啤酒酵母最适合的自溶条件,选择3因素3水平正交试验。因素有温度℃(A)和pH(B),加酶量(C)3个,试验指标为蛋白质含量,试验指标越大越好。选用L9(34) 正交表,试验方案和结果如下表,试作方差分析,并找出啤酒酵母最适合的自溶条件。 4

1、明确试验目的,确定试验指标:找出啤酒酵母最适合的自溶条件,可用蛋白质含量作为本试验的试验指标。 2挑因素,选水平:影响啤酒酵母最适合的自溶条件的因素有温度、pH和加酶量3个,分别用A、B、C表示,并且每个因素都取3个水平,因此,此次选取3因素3水平正交试验。 3、选择合适的正交表:根据所选取的实验因素和实验水平数,决定该实验选取L9(34) 正交表。 4、进行表头设计(表1-1) 表1-1 由于此试验不考察因素之间的交互作用,所以采用不考察交互作用的方差分析法进行实验结果发差分析,并且此试验无重复试验,所以采用不考察交互作用的方差分析法中的无重复试验的方差分析。结果如表1-3

本例a=b=c=3,各因素每一水平的重复次数m=3,总处理次数为9次(n). ②平方和与自由度的分解。 平方和的分解: 矫正数 C=()2 i x n ∑=2T n =65.2/9=477.8596 总平方和 SS T =2i x ∑-C=6.252+4.972+…+8.952-C =530.89-477.8596=53.0304 A 因素平方和 SS A =2iA K m ∑-C=(15.762+18.572+31.252)/3-C =523.2617-477.8596=45.4021 B 因素平方和 SS B = 2iB K m ∑-C=(25.182+21.412+18.992)/3-C =484.3469-477.8596=6.4873 C 因素平方和 SS C = 2 iC K m ∑-C=(22.652+21.452+21.482)/3-C =478.1718-477.8596=0.3122 误差平方和 SS e = SS T -SS A -SS B -SS C =53.0304-45.4021-6.4873-0.3122=0.8288 对于空列也可用同样方法计算平方和: 空列平方和 SS D =2iD K m ∑-C=(20.742+21.872+22.972)/3-C =478.6884-477.8596=0.8288 自由度的分解: 总自由度 df T =n-1=9-1=8 A 因素 df A =a-1=3-1=2 B 因素 df B =b-1=3-1=2 C 因素 df C =c-1=3-1=2 误差 df e =df T -df A -df B -df C =8-2-2-2=2 显然,误差的自由度等于各空白列自由度之和,正交表中各列的自由度为该列的水平数减1。 ③F 测验。方差分析的结果见表1-4。由方差分析的结果可知,A 因素(温度)的F 值 显著,说明A 因素对蛋白质含量有显著的影响 表1-4 方差分析表 变异来源 SS df MS F F α

实验设计与方差分析

试验设计与方差分析 SPSS操作 一、试验设计与方差分析的关系 试验设计并不是一种统计方法,而是一组统计方法的统称,其主要用途在于分析自变量x的值与因变量y值之间的关系。此外,还用于降低背景变量对理解x值与y值之间关系时的影响。 试验设计使用的最主要的统计工具是方差分析,因此,许多教材将试验设计与方差分析设计为同一部分,使用共同的概念和术语。 其实方差分析并不仅仅在试验设计领域使用,也可以用来分析观察数据。 二、基本术语 例:影响某温室水果产量的主要因素有三个:施肥量、浇水量、温度。如果想通过控制三个因素的量,找出一个最优组合来提高产量,就是实验设计与方差分析问题。相关的术语有: 自变量(因子、因素、输入变量、过程变量):可以控制的、影响因变量的变量。本例为施肥量、浇水量、温度。 因变量(反应变量、输出变量):我们所关心的、承载试验结果的变量。本例为产量。 背景变量(噪声、噪声变量、潜伏变量):能观察但不可控的因子或因素,影响较小、达不到自变量水平。本例可能有测量误差等。 水平(设置):自变量的不同等级。水平数通常不多,连续型变量需离散化取值。如本例:施肥设1000克、1100克、1200克三个量,

浇水量设200千克、220千克两个量,温度设18度、20度、22度三个量。 处理:各因子按设定水平的一个组合。如本例:施肥1000克、浇水200千克、温度18度为一个处理。 试验单元:试验载体的最小单位。如本例的一个温室或由一个温室分割形成的房间。 主效应与交互效应:两因子及以上试验时,各因子可能对因变量有影响,因子间的相互作用也可能对因变量有影响。于是就有了上述概念。有时,交互效应比主效应更重要。如本例:施肥固定在1000克,浇水固定在200千克,18度、20度、22度三个温度条件下产量的差异,可以理解为温度的主效应;而同一温度条件下,不同的施肥量、浇水量造成的产量差异,就是交互效应。 三、试验设计的三个基本原则 第一,随机化。即采取机会均等的措施,将各种条件完全随机地配置在试验单元上。目的是要尽量消除试验因素之外的其他因素的干扰(平衡处理,不是减少误差,而是避免某种未知因素与系统因素相混淆)。极其重要。 第二,重复(复制)。即基本试验的重复,将一个处理施于两个或两个以上试验单元。重复的目的主要在于估计误差。没有对误差的估计就无法做出试验结论。同时,重复也有助于更准确地估计因子的效应。 第三,区组化。一组同质齐性的试验单元称为区组。即对试验单

相关文档
最新文档