2k因子设计
2K因子实验设计
ABC - + + - + - - +
I05_Page16
范例
一名流程工程师针对量产的流程进行研究。他设计了一个两水平 四因子的设计,因子分别为时间(A)、浓度(B)、压力(C)与温度 (D) 。因为他想要探讨所有可能的交互作用,所以想要进行一个 全因子实验设计;但是因为资源有限,所以他只足够做 Replicate=1的试验。
+1
-1
-1
为”-1” 。
-1
+1
-1
将第二个水平值设计定称为”
+1
+1
-1
高水平(High Level)”,并且编 码为”+1” 。
-1
-1
+1
三个因子的实验组合的顺序如右表 +1
-1
+1
所示。
-1
+1
+1
右表称为对比差异表(Table of Contrasts) 。
+1
+1
+1
I05_Page8
按下 话框。
钮回到主对
I05_Page20
步骤四_2:设计实验
选择
选项钮。
按下 话框。
钮回到主对
I05_Page21
步骤四_2:设计实验
选择
选项钮。
依序按下每个话框的 钮。
I05_Page22
步骤四_2:MINITAB工作窗体
I05_Page23
步骤六_1:分析全因子模型
开启 MINITAB资料表 MassProduction.mtw文件。 功能选单:Stat DOE Factorial Analyze Factorial
+1 -1 -1
45
-1 +1 -1
45
+1 +1 -1
49
另外本实验资料也已收录于 Exercise5-1.mtw工作窗体中。
2K因子实验设计(ppt文档)
Main Effects
4 140.250 140.250 35.062* *
2-Way Interactions 6 138.750 138.750 23.125* *
3-Way Interactions 4 8.750 8.750 2.187* *
4-Way Interactions 1 4.000 4.000 4.000 * *
选择合适的样本大小: 确定Replicate个数 功能菜单:StatPower and Sample Size2-Level Factorial Design
依实验特性设计实验的工作窗体 功能菜单:StatDOE FactorialCreate Factorial Design
步骤五:进行试验收集数据
2k全因子设计
2k Full Factorial Design
课程目的
以实例介绍 2-水平全因子设计 (Tow-level factorial designs) 操作练习 2K实验的设计及分析
I05_Page1
使用2k设计原因
1. 使用2K因子实验的目的:建立模型
y f (x1, x2,..., xk )
=47.25-44=3.25
42
低 (-1)
高 (+1)
水平(因子A)
I05_Page12
从对比差异表中计算主效应
将因变量乘以对应因子的符号 (-1 或 +1),然后相加求和, 并除以 n (各水平资料点的个数) 。
I05_Page13
交互作用的对比差异和计算
如何计算交互作用的对比差异:将两两因子(二因子交互作用)或 三个因子(三因子交互作用)相乘在一起。
I05_Page5
2K全因子实验
即广告时间由18时变为21时播放, 认知度平均增加1.5个百分点
2K全因子实验 -18-
Haier Six sigma GB Training-V3.0
最佳条件的导出
平均值
主效应图
80 75 70 65 60 55
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化数据分享
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化数据分享原文链接:/?p=25921假设调查人员有兴趣检查减肥干预方法的三个组成部分。
这三个组成部分是:•记录食物日记(是/否)•增加活动(是/否)•家访(是/否)调查员计划调查所有,实验条件的组合。
实验条件为•要执行因子设计,您需要为多个因子(变量)中的每一个选择固定数量的水平,然后以所有可能的组合运行实验。
•这些因素可以是定量的或定性的。
•定量变量的两个水平可以是两个不同的温度或两个不同的浓度。
•定性因素可能是两种类型的催化剂或某些实体的存在和不存在。
符号:- 因子数 (3) - 每个因子的水平数 (2) - 设计中有多少实验条件 ()因子实验可以涉及具有不同水平数量的因子。
测试:考虑一个设计。
•有多少因子?•每个因子有多少个水平?•多少实验条件?答案:(a) 有 2+2+1 = 5 个因数。
(b) 两个因素有4个水平,2个因素有3个水平,1个因素有2个水平。
(c) 有 288 个实验条件。
向下滑动查看答案▼方差分析和因子设计之间的区别在 ANOVA 中,目标是比较各个实验条件。
让我们考虑一下上面的食物日记研究。
我们可以通过比较食物日记设置为 NO(条件 1-4)的所有条件的平均值和食物日记设置为YES(条件5-8)的所有条件的平均值来估计食物日记的效果。
这也被称为食物日记的主效应,形容词主要是提醒这个平均值超过了其他因素的水平。
食物日记的主效应是:体育锻炼的主效应是:家访的主效应是:使用了所有实验对象,但重新排列以进行每次比较。
受试者被回收以测量不同的效应。
这是析因实验更有效的原因之一。
执行因子设计要执行因子设计:•为每个因子选择固定数量的水平。
•以所有可能的组合运行实验。
我们将讨论每个因子只有两个水平的设计。
因素可以是定量的或定性的。
两个水平的定量变量可以是两个不同的温度或浓度。
定量变量的两个级别可以是两种不同类型的催化剂或某些实体的存在/不存在。
2k因子实验设计简介
3
Advantages
优点
It can handle multiple factors multiple levels investigation at the same time. This is much quicker than OFAT (One Factor At a Time) type of hypothesis testing. 因子实验可以实现对多因子在多水平上的分析。这要比 传统上被称为OFAT (一次一个因子) 的假设检验技术快 得多。
15
Definition & Notation 定义 和标识
For the number of runs needed, just multiply 为计算出需要的运行次数,就进行乘积
e.g. 2 x 2 = 4 runs, 2 x 2 x 2 = 8 runs, 24 = 16 runs
20
32 54
38
24
2k 因子设计
Page7
主效果
在2K的实验设计DOE中:
一个因子的主效果是该因子在“高”水平时所有数据的 平均值减去该因子在“低”水平时所有数据的平均值 或: 主效果=因变量高-因变量低 对于我们的实验,温度的主效果为:
主效果是由于改变输入 水平而在输出方面的平均变 化。如左所示,主效果的计 算是将因子在高水平数据的 平均值减去因子在低水平数 据的平均值。
Notes:
在每一个模块中,我 们会逐步建立DOE方法, 对于所有的因子实验,请 遵循这个方法。
Page5
DOE方法(续)
9. 研究显著的交互作用(P-值<0.05)-首先从高阶入手
统计>DOE>因子>因子图 统计>方差分析>交互作用图
10. 研究显著的主效果(p-值<0.05)
统计>DOE>因子>因子图
用相同的方法计算交互作用的大小。
Â È Î ¶ ± Ê ¼ ä ¯ Â × Ó Â Î ¶ È *Ê ±ä ¼ -1 -1 -1 1 1 -1 -1 -1 -1 1 -1 -1 1 1 -1 1 -1 -1 1 1 1 -1 1 -1 -1 1 1 -1 1 1 1 1 13 11 1 3 4 4 4 4 3.25 2.75 0.25 0.75  ¶ Î È * ¯ × Ó ± Ê ä ¼ * ¯ × ห้องสมุดไป่ตู้ Î Â È ¶ *Ê ±ä ¼ * ¯ Ó × HRC 1 1 -1 43 -1 1 1 45 1 -1 1 45 -1 -1 -1 49 -1 -1 1 43 1 -1 -1 46 -1 1 -1 45 1 1 1 49 1 -1 -1 Ï ¼ º Æ 4 4 4 n 0.25 -0.25 -0.25 º ¼ Ï Æ /n
二因子试验设计
&Five
DOE Class 90a
4
部分階層設計之產生器(Generator)
ABC稱為此部份階層之產生器(Generator)。
&Five
DOE Class 90a
5
23-1設計之圖示
第一組之ABC皆為+號,其產生器為 I = ABC。 第二組之ABC皆為-號,其產生器為 I = -ABC。
AEA = 1/2(abc+a-b-c) = AEBC AEB = 1/2(abc+b-a-c) = AEAC AEC = 1/2(abc+c-a-b) = AEAB
&Five
DOE Class 90a
8
Alias 關係
計算A平均效應之公式與計算BC平均效應之公式相同; 亦即,當吾人利用上述之公式計算A之平均效應時,實 際上,乃是在做A+BC之平均效應計算。此種現象稱之 為Alias,以 lA A+BC 來表示。
&Five
Байду номын сангаасDOE Class 90a
6
23-1 Design (I=ABC)
在23-1 Design (I=ABC) 中共有4次實驗,4-1=3個自由 度,可被用來估算各因子之主作用。
&Five
DOE Class 90a
7
23-1 對比差異與平均效應
ContrastA = abc+a-b-c ContrastAB = abc+c-a-b ContrastB = abc+b-a-c ContrastAC = abc+b-a-c ContrastC = abc+c-a-b ContrastBC = abc+a-b-c
DOE分析步骤及2水平2因子实验设计讲座2
统计> DOE>因子>创建因子设计
用MINATAB进行演示
A:加热温度,低水平820 B:加热时间,低水平2 C:转换时间 ,低水平1.4 D:保温时间, 低水平50
高水平860(摄氏度) 高水平3(分钟) 高水平1.6(分钟)
高水平60(分钟)
精确地解释DOE
1、优分析 路径:数据>排序 目的:预测因子在什么情况下对Y可能的影响
精确地解释DOE
4)模型本身有高次项但没加上
5)主效果都不显著交互显著---弯曲、失拟、S等值有问题, 原因可能是交互影响掩盖了主效果或本身主效果不显著
6)残差图中----残差对拟合值有有“漏斗型:或“喇叭 型”将Y 进行娈换
或对自变量诊断图中有弯曲加是自变量或直接进行RSM
精确地解释DOE
5、模型优化检测
浓度 1
32 38
Consistence 2 浓度2
54
24
步骤2:确定因子与水平
第二步: 说明所关注因子与水平,建立一个 Minitab实验数据表,将每个响应变量的数值置于 一列内。每个输入与输出列于不同的列。
❖ Stat > DOE > Create Factorial Design
选择
选择 “2”
10 5
1
-15
-10
-5
0
St a nda rdize d Effe ct
复制分析
Mean of Yield
Main Effects Plot (data means) for Y ield
catalyzer 44
consistence
42
40
38
36
34
实验设计DOE全因子设计实验(2K设计)
1.3. 全因子设计、部分因子设计以及2K设计
红色:仅用作筛选设计,PB; 黄色:可选,但分辨度低于绿色; 绿色:优先使用。
8
1.4. 全因子设计
什么是全因子设计?
全因子实验设计是指所有因子及水平的所有组合都要至少要进行 一次试验。 将k个因子的二水平试验记作2 试验。 当k=4时,试验次数m= 24 =16次 当k=5时,试验次数m= 25 =32次 当k=7时,试验次数m= 27 =128次 ……
14
1.4. 全因子设计 - 2k设计 – 分析判定
在实施全因子设计和部分因子设计(又称析因设计)实验结果分析中,Minitan 给出回归分析和方差分析结论,生成供我们分析的信息 — 工程师要学会解释这些数 据并作出正确的决策。 包括6项分析指标:
➢ 总效果 [※ H1:模型有效 P<0.05 ] ➢ 弯曲 [※ H0:无弯曲 P>0.05 ] ➢ 失拟 [※ H0:无失拟 P>0.05 ] ➢ 拟合相关系数 R-Sq (调整)及 R-Sq(adj)(预测的)越接近1好; 二者之差越小越好 ➢ 标准差S分析 越小越好 ➢ 因子效应显著性 ✓ P 值判定 [ ※ H1: P<0.05 ] ✓ 图形判定 (正态效应图/帕累托效应图)、残差四合一图
系统自动生成水平代码值(-1 ,0, 1)
好处:有连续变量和无量纲特点,有利于统计 分析和建立回归方程
真实值 代码值
பைடு நூலகம்
低水平L 100 -1
中心值 150 0
高水平H 200 +1
中心值M = (L+H)/2 半间距D = (H - L)/2 真实值 = M + D*代码值
13
1.4. 全因子设计 - 2k设计 – 建模
实验设计DOE全因子设计实验(2K设计)培训课件讲义
子
次数
次数
数
1
2次
3次
2
4次
9次
3
8次
27次
4
16次
81次
5
32次
243次
6
64次
729次
7
128次
2187次
8
256次
……
9
512次
……
10
1024次
……
4水平试验 次数
4次 16次 64次 256次 1024次 …… …… …… …… ……
6
1.3. 全因子设计、部分因子设计以及2K设计
由于资源限制,如:成本/时间等,需要减少试验次数,对以下问题是否可行要做 出选择:
系统自动生成水平代码值(-1 ,0, 1)
好处:有连续变量和无量纲特点,有利于统计 分析和建立回归方程
真实值 代码值
低水平L 100 -1
中心值 150 0
高水平H 200 +1
中心值M = (L+H)/2 半间距D = (H - L)/2 真实值 = M + D*代码值
13
1.4. 全因子设计 - 2k设计 – 建模
14
1.4. 全因子设计 - 2k设计 – 分析判定
在实施全因子设计和部分因子设计(又称析因设计)实验结果分析中,Minitan 给出回归分析和方差分析结论,生成供我们分析的信息 — 工程师要学会解释这些数 据并作出正确的决策。 包括6项分析指标:
➢ 总效果 [※ H1:模型有效 P<0.05 ] ➢ 弯曲 [※ H0:无弯曲 P>0.05 ] ➢ 失拟 [※ H0:无失拟 P>0.05 ] ➢ 拟合相关系数 R-Sq (调整)及 R-Sq(adj)(预测的)越接近1好; 二者之差越小越好 ➢ 标准差S分析 越小越好 ➢ 因子效应显著性 ✓ P 值判定 [ ※ H1: P<0.05 ] ✓ 图形判定 (正态效应图/帕累托效应图)、残差四合一图
2^k析因设计
y X
其中
y1 1 x11 y 1 x 21 y 2 , X yn 1 xn1 x12 x1k 0 1 x22 x2k , 1 , 2 xn2 xnk k n
设计投影
• 由于B因子不显著而且所有与B有关的交互作用 也不可忽略。因此,可将B去掉,将一个单重 复24析因设计投影成一个两次重复23设计。
• 对数据进行方差分析,可以得到相同的结论。
• 如果有一个2k设计的单次重复,其中h(h<k)个 因子可被忽略,则原数据对应于留下的k-h个因 子,形成具有2h重复的两水平析因设计。
• 残差的正态概率图 • 显然,正态性有问题。
• 残差与推进速率预测值的关系图 • 显然,方差齐性有问题。
• 选择对数变换 y*=lny • 变换后效应估计量的正态概率图。 • 只有B、C、D起作用,需要说明。简化结构。
效应的平方和
• 用对照计算效应的平方和: SS=(对照)2/(8n)
例1 晶片蚀刻试验
• 单晶片等离子蚀刻过程。3个因子:A为电极间隙、 B为C2F6气体流速、C为RF功率。每个因子两个水平 。每个组合重复2次。实验结果见表。
模型评价指标
• R2=SS模型/SS总和 • R调整2=1-(SSE/dfE)(SS总和/DF总和)
4 一般性2k设计
• k个因子,每个因子2个水平 • 共k个主效应,Ck2个两因子交互作用,Ck3个三 因子交互作用,…,1个k因子交互作用。共2k1个效应。 • 处理组合符号表示: • 处理组合标准顺序:每出现一个新因子,则与 前面各项相乘得到新项。
一般步骤
1. 估计因子效应
试验设计与分析
32 设 计
3k 因子设 计
33 设 计 3k 设 计
2.3.1 32设计
3k 中最简单的因子设计是32设计,即有两个因子,每个因子有3个 水平。它的因子水平组合表示如图2.3.1所示。
图2.3.1 32 设计的因子水平组合
2.3.1 32设计
图2.3.1中共有32 =9个因子水平组合,组合之间有8个自由度,因子 A,B各有两个自由度,AB交互作用有4个自由度。如果每个组合做n次重 复试验,总和的自由度为n32-1,误差的自由度应为(n32-1)-8=32(n-1)。 A,B以及AB的平方和、总变差、误差平方和:
S ABC
a i 1
bc j1 k 1
y2 ijk n
y2
abcn
SA
SB
SC
1
(60)2 1052
582
1552
886.37 60848.48 68100.15
2
54
6379.41 7572.4112390.63
a i 1
b j 1
y2 ij
n
y2
abn
SA
SB
1 (5.392 2.292 3.422 ) 37.99 1.0684 3.9119
4
36
0.9641
SE ST SA SB SAB 7.76471.06843.9119 0.9614 1.8230
6
54
S BC
b j 1
c k 1
y2 jk an
y2
DOE分析步骤和2水平2因子实验设计的讲座2
8
太钢矿业公司六西格玛管理黑带培训教材
精确地解释DOE
4、判断模型是否需要改进 1)全部因子不显著---本身进入DOE的因子不正确、因子主
观性太强、因子本身没找全、因子筛选过简单、因子水平 范围太窄
2)遗漏了关键因子—重新进入DOE查找因子
3)没有对因子进行剥离---在各项效应系数分析中不显著的 主效应和交互效应应剥离,注意:如果一个高阶项显著则 此高阶项中所包含的低阶项也应被包含在模型中
9
太钢矿业公司六西格玛管理黑带培训教材
精确地解释DOE
4)模型本身有高次项但没加上
5)主效果都不显著交互显著---弯曲、失拟、S等值有问题, 原因可能是交互影响掩盖了主效果或本身主效果不显著
Menu: Stat>DOE>Factorial Plots
26
太钢矿业公司六西格玛管理黑带培训教材
步骤8:交互作用图
Mean
备注:
Interaction Plot (data means) for Yield
55 50
在有些实验中,我们发现对 catalyzer -1 1
45
于其他因子的不同水平,一
但 AB 交互作用是最大的因素, 然后才是压力和温度
图中无标识显示统计显著性
23
太钢矿业公司六西格玛管理黑带培训教材
步骤8:主效果图
Menu: Stat>DOE>Factorial Plots
24
太钢矿业公司六西格玛管理黑带培训教材
步骤8:主效果图
试验设计—2k设计
如:25设计中,共5个因子。因子A,B,C,D,E,
(对照)ABCD=(a-1)(b-1)(c-1)(d-1)(e+1)
4/23
一般的2k设计
计算各因子的对照后还可估计效果并计算对应的离差平 方和: 2 m (对照) C Cr y r 根据定义: (对照)C = SC = m r 1
n Cr2
2 k 个2因子交互作用
平方和 SA SB … SK SAB SAC … SJK SABC SABD SIJK
自由度 1 1 … 1 1 1 … 1 1 1 … 1 …
C
AB AC … JK
Ck3 个3因子交互作用
ABC ABD IJK …
Ckk 个k因子交互作用
ABC…K SABC…K 1
误差 E
因 素 组 合 l a b ab (1) (2) (3) 对 照
23设计效果计算代数符号表
效果 组合 l a b ab c ac bc abc I A B AB C AC BC ABC + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
F
83. 56 17.38 38.13 58.56 49.27 <1 <1
对于给定的α=0.01,查表F0.01(1,8)=11.26,FA, FC,FD, FAC,FAD,都大于11.26, A,C,D及AC,AD对试验影响显著, CD,ACD对试验影响不显著。
2k因子设计
2.1 因子设计的一般概念
复因子试验具有如下几个主要特点: (1)复因子试验可同时估计单因子作用及多因子之间 的相互作用。 (2)复因子试验扩大了试验研究的范围。由于复因子 试验可考虑多因子间各种水平组合,从而在较大试验范围 内选择出多因子不同水平的最佳组合处理。 (3)复因子试验由于增加各因子重复数,从而降低试 验误差而提高试验精度。 (4)复因子试验的主要缺点是:当因子数目增加时, 试验规模随之急剧增加。
试分析因子A,B和交互作用A×B对化学反应的影响。
解 由表2.2.1,求出 l=28+25+27=80, a=36+32+32=100, b=18+19+23=60, ab=31+30+29=90. 由此得 (对照) 90 100 60 80 50
A
(对照) B 90 60 100 80 30 (对照) AB 90 80 100 60 10
2.2 2k因子设计
假设试验中共有k个因子,每个因子都只有两 个水平。这种设计的安排总共有2k个不同的组合 ,若每种组合下取一个观察值,总观察值共有2k 个,因此叫2k因子设计。
对2k设计作如下假设: (1)因子是固定的 (2)设计是完全随机的 (3)一般都满足正态性 (4)反应近似于线性
2.2.1 22设计
2.1 因子设计的一般概念
分别画出这两种情况的图形:
2.1 因子设计的一般概念
第一种情况下,因子A、B之间 没有交互作用。 第二种情况下,因子A、B之间有 交互作用。交互作用是不能忽 视的,有时它比因子的作用还大, 因子设计方法是不会漏掉交互 作用的。 因此,因子设计是有效的设计方 法,特别是当交互作用存在的时 候。
2k和3k因子设计
• 即:135-115=20
主效应和交互效应
• 同理: 因子B的主效应=[(130+150)/2(100+120)/2]=30kg
主效应和交互效应
• 当B处于高水平时,因子A的效应为 150-130=20; 当B处于低水平时,因子A的效应为 120-100=20。
主效应和交互效应
水少
水多
A
B
肥少
100
120
肥多
130
150
主效应和交互效应
• A处于低水平的情况(不考虑因子B)得到 产量的平均值是(100+130)/2=115,
• A处于高水平的情况(不考虑因子B)得到 产量的平均值是(120+150)/2=135。
主效应和交互效应
• 产量由115提高到135完全是因子A的作 用。得到A的主效应为:
2k和3k因子设计
主讲人:周娟
2k和3k因子设计
适用场合: 因子的水平只有两个或Biblioteka 个; 可以考察全部的因子和交互作用
主效应和交互效应
• 在农田试验中,考虑两个因子,每个因 子皆有两个水平。
• A:浇水。低水平:水少;高水平:水多 • B:施肥。低水平:肥少;高水平:肥多 • 以产量Y为响应变量(单位:kg)
A(low) 15% B (low) 不用催化剂 A(high) 25% B (low) 不用催化剂
A(low) 15% B (high) 用催化剂
A(low) 25% B (high) 用催化剂
因子水平组合 观察值
和
i
1
2
3
Al
Bl
28
方差分析和2k因子、3k因子设计
均方:
MSA = SA/ (a-1); MSE = SE/ (n-a)
第一节:单因素试验的方差分析
方差分析:
在H0成立的条件下,取统计量 F = MSA/MSE ~ F (a - 1, n - a) 对于给出的α,查出Fα(a - 1, n - a)的值, 由样本计算出SA和SE, 从 而算出F值。从而有如下判断: 若F > Fα (a - 1, n - a),则拒绝H0; 若F < Fα(a - 1, n - a),则接受H0 为了方便计算,我们采用下面的简便计算公式: n n a xi xij 2, … … , a, x.. xij 记 i= 1,
MS AxB MS E
第二节:双因素试验的方差分析
有交互作用的方差分析(2): 简化公式
ST x
i 1 j 1 k 1 a b n 2 ijk 2 x... , abn
2 x... 1 a 2 SA xi.. , bn i 1 abn 2 x... 1 b 2 SB x. j . , an j 1 abn
第二节:双因素试验的方差分析
解:
设火箭的射程为: xij =μ+αi+βj+εij, i =1, 2, 3, 4, j = 1, 2, 3 原假设 HA0: α1=α2=α3=α4=0 HB0: β1=β2=β3=0 备择假设 HA1:αi=0, 至少一个i HB1:βj=0, 至少一个j 这里a=4, b=3, ab=12
a
i 1
a
i
0, B j 0
j 1
b
2
第二节:双因素试验的方差分析
对这个线性模型,我们检验如下的假设 HA0: α1 =α2 = … … =αa = 0 HA1: αi = 0 至少有一个i,
2k因子设计
因子B 因子A
因子B
B1
20 40
B2
30 52
因子A
B1
20 50
B2
40 12
A1 A2
A1 A2
试考察因子A,B的效果。
解:先考虑表2.1.1的情形: 因子A的主要效果可看成是在A的第一个水平 下的平均反应与在第二个水平下的平均反应之差, 记为A,即 A=(40+52)/2 – (20+30)/2=21 因子B的主要效果是 B=(30+52)/2 – (20+40)/2=11 再考虑表2.1.2的情况 因子A的主要效果是 A=(50+12)/2 – (20+40)/2=1 因子B的主要效果是 B=(40+12)/2 – (20+50)/2=-9
因子A、B和交互作用A×B的平均效果分别为(注意:n=3)
A 1 2 ×3 6 1 30 B × ( 对照 ) B 5 . 00 , 2 ×3 6 × ( 对照 ) A 50 8 . 33 ,
AB
1 2 ×3
× ( 对照 ) AB
10 6
1 . 67 .
2.1 因子设计的一般概念
分别画出这两种情况的图形:
2.1 因子设计的一般概念
第一种情况下,因子A、B之间 没有交互作用。 第二种情况下,因子A、B之间有 交互作用。交互作用是不能忽 视的,有时它比因子的作用还大, 因子设计方法是不会漏掉交互 作用的。 因此,因子设计是有效的设计方 法,特别是当交互作用存在的时 候。
2.2.1 22设计
假设在每一种水平组合下作n次重复观察,即取n个 观察值。为分析问题的方便, 引进下列记号: A表示因子A的效果,B表示因子B的效果,AB表示交 互作A×B的效果。a表示因子A在高水平、因子B在低 水平情况下观察值之和;b表示因子A在低水平,因子 B在高水平情况下观察值之和;ab表示因子A,B都在 高水平情况下观察值之和,l表示因子A,B都在低水 平情况下观察值之和。
2k因子实验设计简介
2k因子实验设计简介一、引言2k因子实验设计是一种常用的实验设计方法,用于研究多个影响因素对实验结果的影响。
其中的2表示每个因素有两个水平,k表示有k个因素。
本文将对2k因子实验设计进行简要介绍。
二、2k因子实验设计的基本思想2k因子实验设计的基本思想是通过系统地改变若干个因素的水平,观察实验结果的变化,从而分析各个因素对结果的影响,并确定最优的因素组合。
其中,每个因素的水平通常选取两个,即高水平和低水平。
通过对所有可能的因素组合进行实验,可以得到全面而准确的数据,从而进行因素分析和优化。
三、2k因子实验设计的步骤1. 确定影响因素:首先需要确定影响实验结果的各个因素,这些因素可以是实验条件、操作参数或其他相关变量。
2. 确定因素水平:确定每个因素的水平,通常选取两个水平,即高水平和低水平。
3. 构建试验设计表:根据因素个数确定试验设计表的大小,并按照2k因子实验设计的原则填写试验设计表。
试验设计表中的每一行代表一个试验,列代表各个因素及其水平。
4. 进行实验:根据试验设计表进行实验,记录各个因素水平下的实验结果。
5. 分析数据:对实验结果进行统计分析,包括方差分析、回归分析等,以确定各个因素对结果的影响程度。
6. 优化因素组合:根据分析结果确定最优的因素组合,以达到最佳的实验效果。
四、2k因子实验设计的优点1. 高效性:2k因子实验设计可以同时研究多个因素,通过少量试验即可获取全面的数据。
2. 灵活性:可以根据实际需求选择不同的因素和水平进行设计,适用于各种不同的实验场景。
3. 可靠性:通过统计分析方法,可以准确地评估各个因素对结果的影响程度,提高实验结果的可靠性。
4. 可解释性:2k因子实验设计的结果可以直观地展示各个因素对结果的影响,便于解释和理解。
五、2k因子实验设计的应用领域2k因子实验设计广泛应用于工程、制造、医药、化工等领域。
例如,在工程领域中,可以利用2k因子实验设计来研究各个因素对产品性能的影响,以优化产品设计;在医药领域中,可以利用2k因子实验设计来研究药物各个因素对治疗效果的影响,以优化药物配方。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当有必要研究多因子对一反应变量的综合效果时,因子设计(Factorial Design)大量且普遍地应用于多因子的实验。
一最重要的情况是k个因子且各有2水准的状况(2k, Level Factor),此设计的完整反复需要2⨯2⨯…⨯2= 2k个观测值,且称之为2k因子设计(2k Factorial Design)。
本章重点将聚于此设计,另整章假设(1) 因子是固定的,(2) 设计是完全随机的,与(3) 一般的常态假设是满足的。
2k设计在实验工作的初期阶段,即当似乎有很多因子要研究时,是特别有效。
它提供了在一次完整因子设计里可以研究k个因子的最小次数。
因此,此种设计是大量应用于因子筛选实验(Factor Screening Experiments)。
因为每个因子只有2个水准,假设反应在选定的因子水准范围里是近似线性的,在很多因子筛选实验中,刚开始研究过(制)程或系统时,此假设是合理的。
6-22k设计(The 2k Design)在2k系列中首先讨论2个因子(22),A与B,各有2水准,此称之为22因子设计,因子水准可称之为”低”与”高”。
如,有一反应浓度和触媒量对化学反应过(制)程合格率效果的研究,令反应浓度为因子A,且有兴趣的2水准为15%与20%;另触媒量为因子B,且高水平为2 lbs与低水准为1 lb,实验反复3次,资料如下,图6-1 22设计之处理组合设计中的4个处理组合通常以小写字母表示,由上图知,在处理组合中任何因子的高水平以对应小写字母表示;处理组合中任何因子的低水准以对应字母的不出现表示。
依传统,(1)表示2因子都是在低水准,这个记号在整个2k系统都适用。
在22因子设计中,定义一个因子的平均效果为该因子水准改变所带来的反应改变。
同时,符号(1)、a、b、ab表示在处理组合下n次反复的总和,则在B为低水准时A的效果为[a-(1)]/n与在B为高水平时A的效果为[ab-b]/n,将此两者取平均即为A的主效果(Main Effect):A = {[a-(1)] + [ab-b]}/2nA = [ab + a - b - (1)]/2n (6-1)同理,B的主效果,即在A为低水准时B的效果为[b-(1)]/n 与在A为高水平时B的效果为[ab-a]/n,将此两者取平均,则为B = {[b-(1)] + [ab-a]}/2nB = [ab + b - a - (1)]/2n (6-2)定义交互作用(Interaction Effect) AB为B在高水平时A 的效果与B在低水准时A的效果间的平均差异,AB = {[ab-b]-[a-(1)]}/2n= [ab+ (1) - a - b]/2n (6-3)亦可定义AB 为A 在高水平时B 的效果与A 在低水准时B 的效果间的平均差异,其结果与式(6-3)同。
A 、B 与AB 效果的公式可用另一种方法导出,A 的效果可由图6-1中右边两个处理组合的平均反应(+A y )与左边两个处理组合的平均反应(或-A y )之差,即A = +A y - -A y = (ab + a) /2n – ( b – (1)) /2n= [ab + a – b – (1)] /2n此结果与式(6-1)完全一样。
同理,B 与AB 之效果,B = +B y - -B y = (ab + b) /2n – ( a – (1)) /2n= [ab + b – a – (1)] /2n此结果与式(6-2)亦完全一样。
AB = (ab + (1)) /2n – (a + b) /2n= [ab + (1) - b – a] /2n此结果与式(6-3)亦完全一样。
利用图6-1之实验数据,可估计出平均效果为, A = (90 + 100 - 60 - 80)/ 2(3) = 8.33 B = (90 + 60 - 100 - 80)/ 2(3) = -5.00AB = (90 + 80 - 100 - 60)/ 2(3) = 1.67◎A(反应物浓度)的效果是正的,即表示增加A,由从低水准的15%到高水平的25%会增加合格率。
◎B(触媒)的效果是负的,此意味过(制)程中触媒量的增加会降低合格率。
◎交互作用的效果相较于两个主效果是相当小的。
在2k设计的实验中,检视因子效果的『大小』(Magnitude)与『方向』(Direction)来决定何变量是重要的。
另ANOVA 是用来确认此种解释的。
考虑A、B与AB的平方和,式(6-1)是一个对比(Contrast)用以估计A,即Contrast A = ab + a - b – (1) (6-4)通称此对比为A的『总效果(Total Effect)』。
同理,由式(6-2)与(6-3)亦可用对比来估计B与AB。
再者,此3个对比是正交的(Orthogonal)。
任何对比的平方和可依式(3-29),即,SS A =[ab + a - b – (1)]2/4n (6-5)SS B =[ab + b - a – (1)]2/4n (6-6) 与SS AB =[ab + (1) - b - a]2/4n (6-7)为A、B与AB的平方和。
利用图6-1的实验数据,由式(6-5)、(6-6)、与(6-7)得,SS A =[ab + a - b – (1)]2/4n= (50)2/4(3) = 208.33 SS B =[ab + b - a – (1)]2/4n= (-30)2/4(3) = 75.00 (6-8)与 SS AB =[ab + (1) - b - a]2/4n= (10)2/4(3) = 8.33 而总平方和是以一般方式求得,即, SS T = n4y y 221i 21j 31k 2ijk ∙∙∙===-∑∑∑(6-9)= 9398.00 – 9075.00 = 323.00SS E = SS T – SS A – SS B – SS AB(6-10)= 323.00 – 208.33 – 75.00 – 8.33 = 31.34依上表(ANOV A),由P-值知,主效果均为统计上显着及因子间无交互作用。
依(1)、a、b、ab的顺序写下处理组合,称此为标准顺序(Standard Order, or Yates’ Order, for Dr. Frank Yates),亦可用以估计效果的对比系数为,如下表,注意,估计交互作用效果的对比系数正好是两个主效果系数的乘积。
对比系数永远均为+1或-1,如下表的『正负号表』(Table of Plus and Minus Signs)可用来决定每个处理组合的正确符号,上表中,”行”的标题为主效果A、B、交互作用AB、与I,I 代表整个实验的总和或平均,且对应到I 的”行”中均为正号。
而”列”表示处理组合。
欲估计任何效果的对比,只需将表中对应的符号乘以对应的处理组合后加总即可。
如,估计A,则对此为-(1)+a-b+ab,其结果与式(6-1)同。
回归模式(The Regression Model)对2k因子设计,用回归模式来表示实验结果,其回归模式为,y = β0 + β1x1+ β2x2 + ε其中,x1代表反应物浓度的『编码变量』(Coded Variable) (反应物浓度-Reactant Conc entration)、x2代表触媒量的编码变量(触媒量- Catalyst)、与β均为回归系数。
『原变量』(Natural Variables)与编码变量之间的关系为,x1 = [Conc-(Conc low+Conc high)/2]/ (Conc high-Conc low)/2与x2=[Catalyst-(Catalyst low+ Catalyst high)/2]/(Catalyst high- Catalyst low)/2 当原变量只有2水准时,则编码为-1或+1,x1 = [Conc-(15+25)/2]/ (25-15)/2 = (Conc-20)/5如果浓度是在高水平(Conc = 25%),即x1 = +1;如果浓度是在低水准(Conc = 15%),即x1 = -1。
再者,x2 = [Catalyst -(1+2)/2]/ (2-1)/2 = (Catalyst -1.5)/0.5 如果触媒量是在高水平(Catalyst = 2 lbs),即x2 = +1;如果触媒量是在低水准(Catalyst = 1 lb),即x2 = -1。
则配适后的回归模式为,yˆ = 27.5+(8.33/2)x 1 + (-5.00/2)x 2 其中,截距是12个观测值的总平均,与回归系数1ˆβ与2ˆβ为所对应的因子效果估计值的一半,回归系数正好是效果估计值一半的理由是回归系数度量的是x 的单位改变对y 平均的效果,而效果估计值是基于两个单位(从-1到+1)的改变,证明后续。
残差与模式适当性(Residuals and Model Adequacy)回归模式可以用来得到设计中4个点的y 值的预测值或配适值(The Predicted or Fitted Value),而残差即是观测值与配适值的差。
如,当反应物的浓度在低水准(x 1 = -1)与触媒量在低水准(x 2 = -1)时,则预测之格合率为,yˆ = 27.5+(8.33/2)x 1 + (-5.00/2)x 2 yˆ = 27.5+(8.33/2)(-1) + (-5.00/2)(-1) = 25.835 在此处理组合下有3个观测值,其残差为 e 1 = 28 - 25.835 = 2.165 e 2 = 25 - 25.835 = -0.835e 3 = 27 - 25.835 = 1.165同理可得其它的预测值与残差。
当反应物的浓度在高水平(x1 = +1)与触媒量在低水准(x2 = -1)时,则预测之格合率为,yˆ= 27.5+(8.33/2)x1 + (-5.00/2)x2yˆ= 27.5+(8.33/2)(+1)+ (-5.00/2)(-1) = 34.165在此处理组合下有3个观测值,其残差为e4 = 36 – 34.165= 1.835e5 = 32 –34.165 = -2.165e6= 32 – 34.165 = -2.165当反应物的浓度在低水准(x1 = -1)与触媒量在高水平(x2 = +1)时,则预测之格合率为,yˆ= 27.5+(8.33/2)x1 + (-5.00/2)x2yˆ= 27.5+(8.33)/2)(-1)+ (-5.00/2)(+1) = 20.835在此处理组合下有3个观测值,其残差为e7 = 18 – 20.835= -2.835e8 = 19 –20.835 = -1.835e9= 23 – 20.835 = 2.165当反应物的浓度在高水平(x1 = +1)与触媒量在高水平(x2 = +1)时,则预测之格合率为,yˆ= 27.5+(8.33/2)x1 + (-5.00/2)x2yˆ= 27.5+(8.33/2)(+1)+ (-5.00/2)(+1) = 29.165 在此处理组合下有3个观测值,其残差为e10 = 31 – 29.165= 1.835e11 = 30 –29.165 = 0.835e12= 29 – 29.165 = -0.165图6-2 化学过程实验之残差图反应曲线(The Response Surface)回归模式yˆ= 27.5+(8.33/2)x1 + (-5.00/2)x2可以用来产生反应曲面图。