实验优化设计 第4章 方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三个偏差平方和的自由度之间有如下的关系: vT= vA + ve
这也称自由度的可分解性。
13
若记总偏差相对平方和为VT,因素A相对偏差平方和 为VA,误差相对平方和为Ve,则它们分别为:
VT=ST / vT VA=SA / vA Ve=Se / ve VA、Ve可分别认为是因素A与误差e关于实验结果的平 均效应,并分别称它们为因素A均方差和误差均方差。 均方差也简称均方或方差。
B3
B4
A1
x11
x12
x13
x14
A2
x21
x22
x23
x24
A3
x31
x32
x33
x34
问题:催化剂、温度以及实验中的各种偶然因 素的综合中,各因素的影响程度相对大小如何? 谁对实验结果产生了显著的影响?
3
4.1.2 几个基本概念
(1) 因素
所谓因素,是指直接影响实验结果而需要进行考察的原因,也即影响 实验结果的实验条件。
ST=SA+Se
(2) 记总平方和ST的自由度为vT, 因素A偏差平方和的自由度为vA,误差平 方和Se的自由度为ve,则:
vT=ri-1=N-1 vA=a-1 ve=ri-a=N-a vT=vA + ve 4.3.3 偏差平方和的简化计算
ST=R-CT SA=QA-CT Se=R-QA
22
4.3.4 单因素方差分析表
18
注意到,F分布的分位数Fa (v因, ve) 总是大于或等于1 的,因此当某个因素的均方差小于误差均方差时,就可 以直接判定它为不显著的因素。
⑤列方差分析表。 各因素给总偏差平方和所做的贡献能—目了然,检验过 程及关键数据也简明清晰,这便于发现、检查计算过程中 的错误。
19
4.3 单因素方差分析
表4-6 合成物产量数据表
1
2
3
4
A1
74
69
73
67
A2
79
81
75
78
A3
82
85
80
79
试判断:在显著性水平α=0.05下触媒用量对合成物产出量有无显著影响?
23
解: 这是一个等重复数单因素方差分析问题。其中 a=3,r1=r2=r3=r4=r=4,N=ar=12 (1) 建立原假设 H0: m1=m2=m3 H1: m1,m2,m3不全相等 (2) 计算统计量FA 数据计算如表4-7。
单因素方差分析则是仅仅讨论一种实验条件对实验结果有无显著影响 的分析。
单因素方差分析对因素的水平数没有限制,可任意选择。 单因素方差分析对重复性有要求,即它要求有重复实验,至于重复次 数则可以任意选择。单因素实验重复数一般应在3次以上。
4.3.1 数据描述
20
4.3.2 平方和及自由度分解 (1) 记单因素实验的总偏差平方和为ST,因素A偏差平方和为SA,误 差e偏差平方和为Se, 则
分组 第一组 (一般疗法) 第二组 (一般+A药) 第三组 (一般+B药)
1
2
3
平均值
0.8
0.9
0.7
0.8
1.3
1.2
1.1
1.2
0.9
1.1
wenku.baidu.com
1.0
1.0
第四组 (一般+A药+B药) 2.1
2.2
2.0
2.1
这种因素之间的相互作用即为交互效应。如果交互效应存在,说明两个因素不 是相互独立的。
把因素A和B的交互作用记为A×B。这里的符号“×”是交互 的记号,不要理解为乘号。两个因素的交互作用好象是在这 两个因素的单独作用之外,另有一个“假想因素”在起作用。
4.2 方差分析的基本原理 4.2.1 固定效应模型的分析 (1) 问题的描述 以固定效应模型的单因素等重复实验为例,来说明方差 分析的基本原理。
8
表4-3 单因素等重复实验的典型数据
实验结果用线性统计模型来描述:
yij=m+ti+eij (i=1,2,…,a;j=1,2,…,r)
m是所有水平的共同参数,叫总均值,ti是第i个水平的唯一的一个参数, 叫做第i个水平的水平效应,eij是随机误差。
14
4.2.2 方差分析原理与程序
➢方差分析是利用实验观测值总偏差的可分解性,将不 同条件所引起的偏差与实验误差分解开来,按照一定的 规则进行比较,以确定条件偏差的影响程度及其相对大 小。 ➢应用方差分析可检验确定哪种因素对实验结果的影响 最为显著,以及估计影响程度
15
(1) 统计量的构造 F=VA / Ve 把它作为检验因素A是否作用显著的统计量。
25
4.4 双因素实验方差分析
4.4.1 双因素无重复实验的方差分析
(1) 双因素无重复实验 在双因素实验中有两个变动因素,记这两个变动因素为 A和B。 设因素A有a个不同水平:A1,A2,…,Aa;因素B有b 个不同水平:B1,B2,…,Bb,则因素A与因素B之间共 有ab种不同的水平搭配(组合)方式。 双因素实验要比单因素实验复杂得多,因为两个因素可 能存在着交互作用。 但双因素无重复实验,即便存在交互作用的影响,也不 能够对其进行分析,因为每一种实验条件下,只有一个实 验结果,这使得交互作用和实验误差混杂在一起,无法分 解开来,故对双因素无重复实验来说,交互作用只好与实 验误差合在一起当作误差考虑。
➢ 在原假设H0:m1=m2=…=ma=m成立的前提下,比值F 的分子、分母都是总体方差σ2的无偏估计量,故统计量 F应当“很接近于1”。 ➢如果因素A的均方差VA比误差均方差Ve大得很多,即F 值比“1”大得多,则与原假设H0相矛盾,这时,我们有 理由拒绝原假设成,即认为因素A的不同条件(水平) 形成均值不完全相等的a个正态总体。
方差来源 因素A 因素e 总和
平方和S SA Se ST
自由度v vA ve N-1
均方V VA Ve
F值 临界值 显著性
FA
Fα (vA, ve)
4.3.5 实例分析 [例4-4] 某厂进行合成反应实验,欲考察某种触媒用量对合成物产出量的影 响。现选取三种触媒用量A1, A2, A3,各做4次实验,实验数据见表4-6。
[例4-2] 某反应产物的收率受催化剂品种与反应温度的影响,现选取三种 催化剂(记做A1、A2、A3),四种不同的温度(记做B1、B2、B3、B4), 在催化剂与温度的12种不同的组合条件下,随机地进行实验。若记催化剂 为Ai和温度为Bj时的合成收率为xij,得表4-2所示的数据。
温度
催化剂
B1
B2
在实验中影响结果的原因是很多的,一般情况下把直接和必然的原因作为 实验需要考察的因素。至于人们的操作技巧、检测仪表的精度等,并不直接 影响实验结果,而是产生误差的原因,除特殊情况外,一般不把它列为因素。
4
(2) 水平与水平数 因素在实验中所取的具体数值或状态,称为该因素的水平。水平也叫位级。 若某因素记为A,则因素A的a个不同水平可分别记做:A1、A2、…、Aa。
17
(4) 方差分析的程序
①提出原假设H0和备择假设H1。 ②计算各因素偏差平方和、误差偏差平方和,以及各 偏差平方和的自由度。 计算统计量F。 ③查临界值。 先选定显著性水平a,查F分布的临界值表Fa (v因, ve)。 ④判断。 当某个因素的统计量F大于等于该因素检验临界值时, 则认为该因素作用显著,拒绝相应的原假设。否则,认 为该因素不显著。 显著性程度可用“*”号表示。一般情况下:对显著水 平a=0.05,仍判为不显著时,可记为“-”;对a=0.05 判为显著时,可记为“*”;对a=0.01判为显著时,可 记为“**”,此时,也称高度显著。
相对偏差平方和

偏差平方和 偏差平方和自由度
12
随机变数的自由度是由数据个数n及数据所受的线性约束方程个数m所决定 的。这n个数据的平方和的自度为n-m。
① 总平方和ST的自由度 vT =N-1 =ar-1
② 因素A偏差平方和SA的自由度 vA=a-1
③ 误差平方和Se的自由度 ve=N-a=ar-a=a(r-1)

31.5
36.6
34.2
34.8 34.30

34.9
36.8
36.3
35.8 35.95
最终实验结果之间的差异可能源于催化剂的改变,也可能源于实验误差。
问题:① 实验结果的差异是催化剂的变化所引起的, 还是实验中的偶然误差引起的?如何鉴别?② 不同催 化剂对产品收率的影响是否显著?如何检验?
2
再看下面的一个例子。
Ai称为因素A的第i种水平或第i种位级。 因素选定的不同取值的个数,称为该因素的水平数。
(3) 重复或重复数 在相同条件下进行2次及2次以上的实验,称重复实验或有重复实验。 重复是研究实验随机误差的基本手段。应在条件允许的情况下,尽可能
地采取重复实验,使样本容量足够地大,以保证实验与分析的可靠性。
5
(4) 因素的主效应和因素间的交互效应 某因素单独对实验结果所产生的影响或作用,称该因 素的主效应。
因素间的交互作用是指除了因素“孤立地”影响实验 结果之外,还存在因素间不同水平互相搭配,联合在一 起共同对实验结果产生影响。这是在科学实验中常常遇 到的问题。
6
[例4-3] 有A、B两种药物治疗缺铁性贫血,患者12例,分为4组。实验方案是: 第一组用一般疗法;第二组在一般疗法基础上加用A药;第三组在一般疗法基 础上加用B药,第四组在一般疗法基础上A、B两药同时使用。一个月后观察红 细胞增加数。要求分析两种药物的疗效,数据见表4-3。
(3) 判断 对α=0.05,查F分布分位数表得 F0.05(vA,ve)= F0.05(2,9)=4.26
方差来源 因素A 因素e 总和
表4-8 例4-4的方差分析表
平方和S 243.17
72.5 315.67
自由度v 2 9 11
均方V 121.58
8.06
F值
Fa
15.08 4.26
显著性 *
16
(2) 统计量F的分布 FA=VA / Ve ~ F(vA, ve) 这表明,统计量FA服从以其分子的自由度为第一自由度, 分母的自由度为第二自由度的F分布。
(3) 检验统计量 对于给定的检验显著性水平a,F Fa (F分布的a分数 位)的概率等于a,即 P [F≥Fa]=a 当一次检验中出现F≥Fa这一小概率事件时,有理由拒 绝原假设H0,即否定不同条件下的总体,其均值完全相同 的假设,认为因素的效应显著,不同条件下的总体均值有 明显的不同。 反之,若F≤Fa,则接受原假设H0,即认为不同条件下 的各总体,均值并没有明显地变化,因素效应与误差效应 相比,不够显著。
4 方差分析
4.1 引言 4.1.1 问题的提出
如何比较不同实验条件下的实验结果?
先看一个简单的例子。 [例4-1] 为了考察三种催化剂对某一化工产品收率的影响,在其它条件不 变的情况下,每种催化剂重复实验4次,所得收率的数据见表4-1所示。
催化剂
1
2
3
4
平均值

35.2
33.1
35.5
36.4 35.05
• 影响因素可分为可控因素和不可控因素。 • 实验温度、原料浓度等往往属于可控因素,它是实验研究的主要因素。 而大气温度、压强、湿度、风向等往往是不可控因素。
• 在判别介入的实验因素时,下列三种情况一般可以不作考察: • ①对实验指标的影响规律已经明确,或已知对实验考核指标没有影响 的因素; • ②实验时技术条件不具备,或测试技术不完善,测不出数值的因素; • ③虽能测出因素的值,但不具备控制手段,不能把因素控制在指定水 平上的因素。
ST=R-CT=71156-70840.33=315.67 SA=QA-CT=71083.5-70840.33=243.17 Se=R-QA=71156-71083.5=72.5 vT=N-1=11, vA=a-1=2, ve=N-a=9 VA=SA/ vA=243.17/2=121.58 Ve=Se/ ve=72.5/9=8.06 FA=VA/Ve=121.58/8.06=15.08
10
(2) 偏差的构造
用偏差平方和来构造各偏差,
11
由各偏差平方和的构造可以看出,利用偏差平方和作 为数据变异性的一个度量,直观看来,这是合理的。但在 同样的波动程度下,测定数据越多,计算出的偏差平方和 就越大。因此,仅用偏差平方和来反映数据的各种变异显 然是不够的,还应当考虑测定值个数对偏差平方和的贡献, 这便是相对偏差平方和。
9
我们的目标是要去检验各水平对实验有无影响并去估 计它们的影响程度。
检验假设: H0:m1=m2=…=ma H1:mi≠mj 至少有一对(i,j) 如果H0为真,则全体水平有公共均值m。 上述假设的一个等价假设是用水平效应ti表示,即 H0:t1=t2=…=ta=0 H1:ti≠0 至少有一个i
检验水平均值是否相等的恰当方法是方差分析。
相关文档
最新文档