正交试验设计的方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
若以S 表示A 若以S1表示A1水平下实验误差所引起的波动,其值应 +(34.97+(36.62为:S =(32.62为:S1=(32.62-34.74)2+(34.97-34.74)2+(36.62-34.74)2 =8.0870。同理可以求出A =8.0870。同理可以求出A2 、A3水平下实验误差所引 起的波动,其值分别为S =7.8389, 起的波动,其值分别为S2=7.8389,S3=11.7875 则,A 则,A因素的各个水平下总的偏差平方和应为: Se= S1+ S2+ S3=8.0870+7.8389+11.7875=27.71 (2) S总的计算 总的偏差平方和S 是指全部实验数据中,每个数据(y 总的偏差平方和S总是指全部实验数据中,每个数据(yi) 与总平均值(y 与总平均值(y总)之差的平方和,即:
第二:就因素A而言(因素B 第二:就因素A而言(因素B、C也类同),其中k1、k2、 也类同),其中k k3值之间的差异是如何产生的?是由于A因素水平不 值之间的差异是如何产生的?是由于A 同引起的呢?还是由于实验误差所造成的呢?还是 两者综合作用的结果?从直观分析角度是无法说清 楚的。 正是由于直观分析存在着上述的缺点,所以需 要采用方差分析的方法来弥补上述的不足。 1.单因素实验的方差分析 1.单因素实验的方差分析 为了便于讨论,我们仍以实验室制取H2的因素 为了便于讨论,我们仍以实验室制取H 之一------A因素(硫酸的质量分数) 之一------A因素(硫酸的质量分数)为例,来说明单个 因素的实验数据的方差分析方法。
二.方差分析中的一些基本概念 1.偏差平方和 1.偏差平方和 方差分析的关键是对偏差平方和的分解,因此, 充分理解这一概念是至关重要的。 所谓偏差平方和是指一组数据中,各个数(y 所谓偏差平方和是指一组数据中,各个数(y1, y2, y3……yn)与它们的算术平均数y之差的平方和。用符号 与它们的算术平均数y S来表示。即:
上述推论可通过以下简单换算予以证明。 若令X 若令Xi=yi-C (i=1, 2, ……n) 则
1n 1n X = ∑xi = ∑yi −C n i=1 n i=1 X = y −C
于是
S = ∑(xi − x)2 = ∑[(yi −C) −(y −C)]2 = ∑(yi − y)2
i=1 i=1 i=1
2 1 3 1 3 2 3 2 1
列号 实验号
K1 K2 K3 k1 k2 k3 R
A wH2SO4 (%) 104.21 116.12 131.35 34.78 38.70 43.78 9.05
B mCuSO4·5H2O(g) 114.09 117.25 120.34 38.03 39.08 40.11 2.08
三.正交试验设计的方差分析 现以实验室制取H 现以实验室制取H2为例,来说明正交设计的方 差分析的基本方法。若该实验所考察的因素、水平 如表1和表2 如表1和表2所示。
表1. 因素水平
因素 水平 一 二 三 A wH2SO4 (%) 20 25 30 B mCuSO4·5H2O(g) 0.4 0.5 0.6 C mZn (g) 4 5 6
表3.实验结果分析 参与wH2SO4某一水平的实验编号 w A1(20%) 1 4 7 A2 (25%) 2 5 8 平均值y A3 (30%) 3 6 9 10minH2产率 A1(20%) 32.62 34.97 36.62 34.74 A2 (25%) 40.40 36.53 39.19 38.71 A3 (30%) 41.07 45.75 44.53 43.78
4.因素的显著性判断 4.因素的显著性判断 设因素A 设因素A的F比为FA: 当FA >F0. 01 (n1, n2 )时,说明该因素水平的改变 对实验结果有很显著的影响,记作**。 对实验结果有很显著的影响,记作**。 当FA >F0. 05 (n1, n2 )时,说明该因素水平的改变 对实验结果有显著的影响,记作* 对实验结果有显著的影响,记作*。 当FA >F0. 10 (n1, n2 )时,说明该因素水平的改变 对实验结果有一定的影响,记作O 对实验结果有一定的影响,记作O。
为了弥补直观分析方法的不足,可采用方差分析 方法对实验结果进行计算分析。所谓方差分析就是将 方法对实验结果进行计算分析。所谓方差分析就是将 因素水平(或交互作用) 因素水平(或交互作用)的变化引起的实验结果间的差 异与误差的波动所引起的实验结果间的差异区分开来 的一种数学方法。 方差分析的中心要点是:把实验数据总的波动分 方差分析的中心要点是:把实验数据总的波动分 解成两部分,一部分反映因素水平变化引起的波动, 另一部分反映实验误差引起的波动。即把数据总的偏 差平方和(S 分解为因素的偏差平方和(S 差平方和(S总)分解为因素的偏差平方和(SA、SB、SC ……)与误差的偏差平方和(S ……)与误差的偏差平方和(Se),并计算它们的平均偏 差平方和(也称均方和,或均方) 差平方和(也称均方和,或均方),然后进行检验,最 后得出方差分析表。
在F分布表上横行(n1:1, 2, 3…)代表F比中分子的自 分布表上横行(n 3…)代表F 由度;竖行(n 由度;竖行(n2:1, 2, 3…)代表F比中分母的自由度;表 3…)代表F 中的数值即各种自由度情况下F 中的数值即各种自由度情况下F比的临界值。 例如,某因素A的偏差平方和的自由度f =1,误差 例如,某因素A的偏差平方和的自由度fA=1,误差 (e)的偏差平方和的自由度fe=8,查得F0.1(1,8)=3.64,这 (e)的偏差平方和的自由度f =8,查得F (1,8)=3.64,这 里0.1是信度。 0.1是信度。 在判断时(如判断因素A 在判断时(如判断因素A的水平的改变对实验结果 是否有显著影响),信度a 是否有显著影响),信度a是指我们对做出的判断有多大 的把握,若a=5%,那就是指当F 的把握,若a=5%,那就是指当FA>F0.05(fA, fe )时,大概 有95%的把握判断因素A的水平改变对实验结果有显著 95%的把握判断因素A 影响。对于不同的信度a,有不同的F 影响。对于不同的信度a,有不同的F分布表,常用的 有a=1%, a=5%, a=10%等。根据自由度的大小,可 a=1%, a=5%, a=10%等。根据自由度的大小,可 在各种信度的F表上查得F 在各种信度的F表上查得F比的临界值,分别记作 F0.01(n1, n2 ), F0.05(n1, n2 ), F0. 10 (n1, n2 )等。
若令:
G = ∑ yi
i =1
ቤተ መጻሕፍቲ ባይዱ
CT =
G2 n
n
则
S = ∑ yi 2 − CT
i =1
偏差平方和(S)反映了该组数据的分散或集中程度。 偏差平方和(S)反映了该组数据的分散或集中程度。 显然,S越大,该组数据越分散;反之,S 显然,S越大,该组数据越分散;反之,S越小,说明该 组数据越集中。 2.平均偏差平方和与自由度 2.平均偏差平方和与自由度 为了合理地比较由不同个数所组成的两组数据的分散或 集中的程度,通常采用平均偏差平方和(简称均方和) 集中的程度,通常采用平均偏差平方和(简称均方和)平 均偏差平方和的计算方法是:将n个数(y 均偏差平方和的计算方法是:将n个数(y1, y2, y3, ……yn) n 的偏差平方和 S = (y − y)2 除以平方项的个数减1, 除以平方项的个数减1
方差分析是把实验数据总的波动( 方差分析是把实验数据总的波动(即数据的总的偏差平方 和S总)分解成两部分:一部分反映因素水平变化引起的波动 (即因素的偏差平方和),对本例而言仅为S wH2SO4;另一部分 即因素的偏差平方和),对本例而言仅为S 反映实验误差引起的波动(即误差的偏差平方和S 反映实验误差引起的波动(即误差的偏差平方和Se)。即: (1) Se的计算
n
n
n
3. F比与F分布表 (1) F比
F比是指因素水平的改变引起的平均偏差平方和与误 S因素 差的平均偏差平方和的比值。即: (2) F分布表及其查阅方法
F比 = S
f因素
误差
f 误差
为了判断F 值的大小所表明的物理意义( 为了判断F比值的大小所表明的物理意义(即F比值多大 时,可以认为实验结果的差异主要是由因素水平的 改变所引起的;其值多小时,可以认为实验结果的 差异主要是由实验误差所引起的) 差异主要是由实验误差所引起的),这就需要有一个 标准来衡量F 标准来衡量F比值,此标准就是根据统计数学原理编 制的F分布表,F分布表列出了各种自由度情况下F 制的F分布表,F分布表列出了各种自由度情况下F比 的临界值。
正交试验设计的方差分析
一.方差分析的意义 前面我们介绍了正交设计方案及其结果的直 观分析, 该方法简单明了, 通俗易懂, 观分析 , 该方法简单明了 , 通俗易懂 , 计算工作 量少, 便于普及和推广 。 量少 , 便于普及和推广。 但直观分析方法不能把 实验中由于实验条件的改变而引起的数据波动同 实验误差引起的数据波动区分开来, 也就是说, 实验误差引起的数据波动区分开来 , 也就是说 , 不能区分因素各水平所对应的实验结果间的差异, 不能区分因素各水平所对应的实验结果间的差异 , 究竟是由于因素水平不同引起的, 究竟是由于因素水平不同引起的 , 还是由于实验 误差引起的。 误差引起的。
1 1 y = ( y1 + y2 + ...... yn ) = ∑ yi n n i=1
则
S =
n
n
∑
( y
i=1
i
− y)
2
为了计算方便,上式可简化为一种更常见的形式:
S = ∑ yi − 2∑ yi y + ∑ y = ∑ yi 2 − ny 2
2 2 i =1 n i =1 i =1 i =1 n n n n
表2.实验方案及实验结果的直观分析 2.实验方案及实验结果的直观分析
列号 实验号
1 2 3 4 5 6 7 8 9 A wH2SO4 (%) 1 2 3 1 2 3 1 2 3 B mCuSO4·5H2O(g) 1 1 1 2 2 2 3 3 3 C mZn (g) 1 2 3 3 1 2 2 3 1 空白列 10min内H2的 产率 32.62 40.40 41.07 34.97 36.53 45.75 36.62 39.19 44.53
C mZn (g) 122.77 115.23 113.68 40.92 38.41 37.89 3.03
空白列
10min内H2的 产率
119.9 117.56 114.22 39.96 39.18 38.07 1.89
最佳实验条 件是A3B3C1
上述正交试验设计所获得的数据,从直观分析的角度 来看,提供给我们如下有用的信息: 第一:从极差值的大小可以判断各个因素对实验指标 影响的主次关系,即: 主--------------------------------------------次 --------------------------------------------次 C[m C[mZn] B[m B[mCuSO4·5H2O] A[wH2SO4] A[w 但是,极差值仅仅反映了各因素影响实验指标的主次 关系,它不能告诉我们各个因素对实验指标影响的程 度。也就是说,它既不能指明这些因素中哪个是影响 实验指标的关键因素,也不能提供一个标准,用来考 察、判断各个因素的作用是否显著。
∑
i=1
i
即除以(n-1),就得到平均偏差平方和。 即除以(n-1),就得到平均偏差平方和。
S 平均偏差平方和 = n−1
为什么不除以n而要除以(n-1)呢?这是因为n 为什么不除以n而要除以(n-1)呢?这是因为n个 数(y1, y2, y3, ……yn)之间并非彼此毫无关系,它们满 足的关系是: 1 n y = ∑ yi n i =1 即n个数之和的均值为一定值,因此,n个数中 只有(n-1)个可“自由”变动,所以,求平均偏差平 (n-1)个 方和时除以(n-1),数学上将这个(n-1)称为S的自由 (n-1),数学上将这个(n-1)称为S 度。 当实验所测得的n个数(y1, y2, y3, ……yn)数值较 当实验所测得的 (y 大时,为了简化计算,可将每一个原始数据y 大时,为了简化计算,可将每一个原始数据yi(i=1, 2, 3……n)都减去同一个常数C,这并不影响偏差平方 ……n)都减去同一个常数C 和的计算结果,但计算的工作量却简化了许多。