单因素试验
单因素实验设计报告
单因素实验设计报告:因素实验报告设计单因素实验设计举例正交实验单因素实验设计方案篇一:实验报告单因素方差分析5.1、实验步骤: 1(建立数据文件。
定义2个变量:PWK和DCGJSL,分别表示排污口和大肠杆菌数量。
2. 选择菜单“分析?比较均值?单因素”,弹出“单因素方差分析”对话框。
在对话框左侧的变量列表中,选择变量“DCGJSL”进入“因变量”列表框,选择变量“PWK”进入“因子”列表框。
3(单击“确定”按钮,得到输出结果。
结果解读:由以上结果可以看到,观测变量大肠杆菌数量的总离差平方和为460.438;如果仅考虑“排污口”单个因素的影响,则大肠杆菌数量总变差中,排污口可解释的变差为308.188,抽样误差引起的变差为152.250,它们的方差(平均变差)分别为102.729和12.688,相除所得的F统计量的观测值为8.097,对应的概率P值为0.003。
在显著性水平α为0.05的情况下。
由于概率P值小于显著性水平α,则应拒绝零假设,认为不同的排污口对大肠杆菌数量产生了显著影响,它对大肠杆菌数量的影响效应不全为0。
因此,可判断各个排污口的大肠杆菌数量是有差别的。
5.2、实验步骤: 1(建立数据文件。
定义2个变量:Branch和Turnover,分别表示分店和日营业额。
将Branch的值定义为1=第一分店,2=第二分店,3=第三分店,4=第四分店,5=第五分店。
2. 选择菜单“分析?比较均值?单因素”,弹出“单因素方差分析”对话框。
在对话框左侧的变量列表中,选择变量“Turnover”进入“因变量”列表框,选择变量“Branch”进入“因子”列表框。
3(单击“确定”按钮,得到输出结果。
结果解读:由以上结果可以看到,观测变量日营业额的总离差平方和为1187668.733;如果仅考虑“分店”单个因素的影响,则日营业额总变差中,分店可解释的变差为366120.900,抽样误差引起的变差为821547.833,它们的方差(平均变差)分别为91530.225和14937.233,相除所得的F统计量的观测值为6.128,对应的概率P 值近似为0。
单因素实验设计
单因素实验设计单因素实验设计是指在实验中只有一个研究因素,即研究者只分析一个因素对效应指标的作用,但单因素实验设计并不是意味着该实验中只有一个因素与效应指标有关联。
单因素实验设计的主要目标之一就是如何控制混杂因素对研究结果的影响。
常用的控制混杂因素的方法有完全随机设计、随机区组设计和拉丁方设计等。
一、完全随机设计1.概念与特点又称单因素设计或成组设计,是医学科研中最常用的一种研究设计方法,它是将同质的受试对象随机地分配到各处理组进行实验观察,或从不同总体中随机抽样进行对比研究。
该设计适用面广,不受组数的限制,且各组的样本含量可以相等,也可以不相等,但在总体样本量不变的情况下,各组样本量相同时的设计效率最高。
例如:为了研究煤矿粉尘作业环境对尘肺的影响,将18只大鼠随机分到甲、乙、丙3组,每组6只,分别在地面办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重(g),通过评价不同环境下大鼠全肺平均湿重推断煤矿粉尘对作用尘肺的影响,具体的随机分组可以如下实施:第一步:将18只大鼠编号:1,2,3, (18)第二步:可任意设置种子数,但应作为实验档案记录保存(本例设置spss11.0软件的种子数为200);第三步:用计算机软件一次产生18个随机数,每个随意数对应一只老鼠(本例用spss11.0软件采用均匀分布最大值为18时产成的18个随机数);第四步:最小的6个随机数对应编号的大鼠为甲组,排序后的第7个至第12个随机数随因编号为乙组,最大的6个随机数对应编号的大鼠为丙组(结果见表1)。
表1 分配结果编号 1 2 3 4 5 6 7 8 93.75 8.75 16.29 11.12 5.49 3.98 13.64 16.71 1.69随机数组别甲乙丙乙乙甲丙丙甲编号10 11 12 13 14 15 16 17 1813.62 16.36 2.12 4.74 11.54 3.98 0.13 17.35 16.38 随机数组别丙丙甲乙乙甲甲丙丙2.随机数的产生方法(1)随机数字表:如附表13(马斌荣,医学统计学,第4版),这是一个由0~9十个数字组成60行25列的数字表。
单因素试验的方差分析——概率论与数理统计(李长青版)
其次, 同一品种下数据表现出来的差异称为试验(随
机)误差, 这是由客观条件的偶然干扰造成, 与因素(品种) 无直接联系.
方差分析正是分析两类误差的有效工具.
本问题只考虑品种一种因素,故是单因素试验,即只有
一个因子,记为 A, 5个不同的品种就是该因子的5个不同 的水平,分别记为 A1 , A2 , A3 , A4 , A5 , 由于同一品种在不 同的田块上的亩产量不同,故可以认为一个品种的亩产 量 就是一个母体,在方差分析中,总是假定各母体相互独 立地服从同方差的正态分布,即第 j 个品种的亩产量是 一个随机变量,它服从正态分布:
nj
ns , 称为总平均,
它是从 s 个总体中抽得的样本的样本均值.
用样本值 xij 与总平均
x 之间的偏差平方和来反映
种子品种代 号 (水平)
重复试验序号及作物实测产量 1 128 125 148 2 126 137 132 3 139 125 139 4 130 117 125 5 142 106 151 133 122 139
A1 A2
A3
这里试验的指标是作物产量, 作物是因素, 三种种 子品种代表三个不同的水平. 首先,形成数据差异的直接原因是种子的不同品 种.因此, 每个品种下产量的均值差异检验是我们的主 要任务.这种由因素(种子品种)造成的差异称为条件(系 统)误差.
H 0 : 1 2 s 0, H1 : 1 , 2 , , s 不全为零.
(二) 离差平方和分解 引入记号
nj
1 xj nj
s
x
i 1
ij
( j 1, 2,
, s) 水平Aj下的样本均值,
称为组内平均(或列平均)
25.单因素试验的方差分析
数学模型
j 与 2 均未知.
14
需要解决的问题
1.检验假设
H0 : 12 s , H1 : 1, 2 , , s不全相等.
2.估计未知参数1, 2 , , s , 2.
15
数学模型的等价形式
s
记n nj ,
j 1
1 n
s j 1
njj.
总平均
水平Aj的效 应, 表示水平 Aj下的总体 平均值与总 平均的差异.
i 1 nj
( Xij X• j )2
i 1
2
~ 2(nj 1).
23
又由于各 Xij 独立, 所以由 2 分布的可加性知
S E
2
~ 2
s
(nj
j 1
1),
即
S
E2~
2
(n
s),
s
其中n nj .
j1
根据 2 分布的性质可以得到,
SE 的自由度为n s; E(SE ) (n s) 2.
铝合金板的厚度
机器Ⅱ 0.257 0.253
机器Ⅲ 0.258 0.264
0.255 0.254
0.259 0.267
0.261
0.262
4
试验指标: 薄板的厚度 因素: 机器
水平:不同的三台机器是因素的三个不同的水平. 假定除机器这一因素外, 其他条件相同,
属于单因素试验. 试验目的: 考察各台机器所生产的薄板的厚度有 无显著的差异. 即考察机器这一因素对厚度有无 显著的影响. 结论: 如果厚度有显著差异, 表明机器这一因素对厚度的影响是显著的.
H0 : 1 23 ,
H1 : 1, 2 , 3不全相等.
进一步假设各总体均为正态变量, 且各总体的
单因素试验方差分析(试验数据处理)
SST ( X ij X ) 2
j 1 i 1
r nj
r
nj
SSA ( X j X ) 2
j 1 i 1
n j ( X j X )2
j 1
s
SSA反映了在每个水平下的样本均值与样本总均 值的差异,它是由因子A 取不同水平引起的,所以, 称SA是因子A的效应(组间)平方和.
单因素试验——在一项试验中只有一个因素改变.
多因素试验——在一项试验中有多个因素在改变.
例1 下表列出了随机选取的、用于计算器的四种 类型的电路的响应时间(以毫秒计). 表1 电路的响应时间 类型Ⅰ 类型Ⅱ 类型Ⅲ 类型Ⅳ 19 20 16 18 22 21 15 22 20 33 18 19 18 27 26 试验指标:电路的响应时间 因素:电路类型 水平: 四种电路类型为因素的四个不同的水平 单因素试验 试验目的:考察电路类型这一因素对响应时间有无 显著的影响.(从哪些值来看是否有影响呢?)
F值 31.10
显著性
934.73
2
6
467.36
**
组内 总和
90.17
1024.89
15.03
8
不同的饲料对猪的体重有非常显著的影响。
三、单因素试验方差分析的简化计算
由于方差分析的计算量比较大,所以引入一种离 差平方和的简单算法:
令
Ti —Ai 水平时,ni个试验值之和 Qi —Ai 水平时,ni个试验值的平方和 T—n个试验值之和 Q—n个试验值的平方和
r
列平均X i Ti ni
(组内平均值)
X1
X2
...
r i 1
Xr
n n i 其中诸 ni 可以不一样,
单因素试验.
整个试验的均值
r 1 r 令 ni i , (其中 n ni )称为一般平均值。 n i 1 i 1
i i , 称为因素A的第 i 个水平 Ai 的效应。
显然有:
n n n n 0
i 1 i i i 1 i i i 1 i i
r
r
r
则线性统计模型变成
X ij i ij , j 1, 2,...ni , i 1, 2,...r
于是检验假设: H : ... 0 1 2 r
等价于检验假设: H0 : 1 2 ... r 0
若H0成立,则
可控因素——在影响试验结果的众多因素中,可人为 控制的因素。
水平——可控因素所处的各种各种不同的状态。每个 水平又称为试验的一个处理。 单因素试验——如果在一项试验中只有一个因素改变, 其它的可控因素不变,则该类试验称为 单因素试验。
引例
例1 (灯丝的配料方案优选)某灯泡厂用四种配料方案制成的灯 丝生产了四批灯泡,在每批灯泡中作随机抽样,测量其使用寿 命(单位:小时),数据如下: 灯泡 寿命 灯丝 甲 乙 丙
引
言
在工农业生产和科研活动中,我们经常遇到这
样的问题:影响产品产量、质量的因素很多,例如
影响农作物的单位面积产量有品种、施肥种类、施
肥量等许多因素。我们要了解这些因素中哪些因素
对产量有显著影响,就要先做试验,然后对测试结
果进行分析,作出判断。方差分析就是分析测试结
果的一种方法。
基 本 概 念
试验指标——试验结果。
2. X1 , X 2 ,... X r 相互独立,从而各子样也相互独立。
第9.1节 单因素试验的方差分析——概率论与数理统计(李长青版)
ES A ( s 1) 2 n j 2 j
j 1
s
由此得
Se 2 E , ns
1 s SA 2 2 E n j j s 1 s 1 j 1
在 H0 为真时, 即 1 2 s 0 时, 有
S A ( s 1) 将 从而在 H0 不真时, 比值 S ( n s ) 有偏大的趋势, 其 e
S A ( s 1) . 记为 F, 即 F Se (n s )
则 F 可以作为检验 H0 的统
计量. 将 Se 写成如下分项相加的形式
Se ( xi1 x1 ) 2 ( xi 2 x2 ) 2 ( xis xs ) 2
的 影响.
种子品种代 号 (水平) 重复试验序号及作物实测产量
1 128 125 148 2 126 137 132 3 139 125 139 4 130 117 125 5 142 106 151 133 122 139
A1 A2
A3
这里试验的指标是作物产量, 作物是因素, 三种种 子品种代表三个不同的水平. 首先,形成数据差异的直接原因是种子的不同品 种.因此, 每个品种下产量的均值差异检验是我们的主 要任务.这种由因素(种子品种)造成的差异称为条件(系
s nj
从而有
Se ( ij j ) ,
2 j 1 i 1
s
nj
S A n j ( j j ) 2
j 1
s
由此知, Se 反映了误差的波动, 称其为误差的偏差 平方和(或称为组内平方和), 它集中反映了试验中与因 素及其水平无关的全部随机误差. 在 H0 为真时, SA 反 映误差的波动, 在 H0 不真时, SA 反映因子A 的不同水
单因素实验设计
单因素试验设计是指只有一个因素(或仅考查一个因素)对试验指标构成影响的试验。
单因素试验设计要求对试验水平进行布局和优化,是一种水平试验设计。
单因素试验设计方法可分为两类:同时试验设计和序贯试验设计。
同时试验设计就是一次给出全部试验水平,一次完成全部试验并得到最佳试验结果,如穷举试验设计。
序贯试验设计要求分批进行试验,后批试验需根据前批试验结果进一步优化后序贯进行,直到获取最佳试验结果,如平分试验设计、黄金分割试验设计。
一、试验范围与试验精度(一)试验范围试验范围指试验水平的范围。
试验设计时需预先确定试验范围,一般采用两种方法:○1经验估计。
可凭经验估计试验范围,并在试验过程中作调整。
○2预先试验。
要求在较大范围内进行探索,通过试验逐步缩小范围。
(二)试验间隔与试验精度试验间隔是指试验水平的间距,试验精度是指试验结果逼近最佳水平的程度。
显然,试验间隔与试验精度是一对矛盾,试验间隔越大,试验精度越低。
在保证试验精度的条件下,试验水平变化而引起的试验结果变动必须显著地超过试验误差。
(三)试验顺序在确定试验顺序时,往往习惯于按照试验水平高低依次做试验。
这样,随着试验的进行,有些因素会发生缓慢变化甚至影响试验结果。
因此,正确的做法是采用随机化方法来确定试验顺序。
在试验工作量较少或者试验准确度要求较低时,也可以采用按水平高低或者选取中间试验点的方法来进行试验排序。
需强调指出,以上不仅对单因素试验设计,而且对所有试验设计方法都适用。
二、单因素试验设计(一)平分试验设计平分试验设计就是平分试验范围,把其中间点作为新试验点,然后不断缩小试验范围直到找到最佳条件。
当试验结果呈单向变化时,也就是说最佳试验点只可能在试验中间点的一侧,可采用平分试验设计。
该方法简便易行,但要注意单向性特征。
(二)穷举试验设计与均分试验设计穷举试验设计是将所有可能的试验点在一批试验中全部进行试验。
均分试验设计是根据试验精度要求,均分整个试验范围以获得所有试验点。
方差分析
方差分析专题单因素试验的方差分析(一)单因素试验在科学试验和生产实践中,影响一事物的因素往往是很多的。
例如,在化工生产中,有原料成分、原料剂量、催化剂、反应温度、压力、溶液浓度、反应时间、机器设备及操作人员的水平等因素。
每一因素的改变都有可能影响产品的数量和质量。
有些因素影响较大,有些较小。
为了使生产过程得以稳定,保证优质、高产,就有必要找出对产品质量有显着影响的那些因素。
为此,我们需进行试验。
方差分析就是根据试验的结果进行分析,鉴别各个有关因素对试验结果影响的有效方法。
在试验中,我们将要考察的指标称为试验指标。
影响试验指标的条件称为因素。
因素可分为两类,一类是人们可以控制的(可控因素);一类是人们不能控制的。
例如,反应温度、原料剂量、溶液浓度等是可以控制的,而测量误差、气象条件等一般是难以控制的。
以下我们所说的因素都是指可控因素。
因素所处的状态,称为该因素的水平(见下述各例)。
如果在一项试验中只有一个因素在改变称为单因素试验,如果多于一个因素在改变称为多因素试验。
例1设有三台机器,用来生产规格相同的铝合金薄板。
取样,测量薄板的厚度精确至千分之一厘米。
得结果如表9.1所示。
表9.1铝合金板的厚度这里,试验的指标是薄板的厚度。
机器为因素,不同的三台机器就是这个因素的三个不同的水平。
我们假定除机器这一因素外,材料的规格、操作人员的水平等其它条件都相同。
这是单因素试验。
试验的目的是为了考察各台机器所生产的薄板的厚度有无显着的差异。
即考察机器这一因素对厚度有无显着的影响。
例2下面列出了随机选取的、用于计算器的四种类型的电路的响应时间(以毫秒计)。
表9.2电路的响应时间这里,试验的指标是电路的响应时间。
电路类型为因素,这一因素有4个水平。
这是一个单因素试验。
试验的目的是为了考察各种类型电路的响应时间有无显着差异。
即考察电路类型这一因素对响应时间有无显着的影响。
例3一火箭使用了四种燃料,三种推进器作射程试验。
试验设计与数据分析课件-3单因素试验设计与分析
方差分析表
变异来源 自由度(df) 平方和(SS) 均方(MS) F值 F0.05 F0.01
区组间
2
27.56
第三部分 单因素试验设计与分析
1 基本概念 2 完全随机设计的方差分析 3 随机完全区组设计 4 平衡不完全区组设计
1
1 基本概念
第三部分 单因素试验设计与分析
单因素试验(single-factor experiment):是 指整个试验中只变更、比较一个试验因素的不
同水平,其他作为试验条件的因素均严格控制 一致的试验类型
✓平衡不完全区组设计(balanced incomplete block design)
3
1 基本概念
第三部分 单因素试验设计与分析
单因子试验设计的统计分析方法:方差分析 (analysis of variance,简记ANOVA)
✓方差分析因子或水平间差异显著与否的判断用F或P 检验
➢方差检验达显著的前提下,必须作水平/因素之间的多重比较。 多重比较常用的方法
5.29
杂交组合内(误差) 16
27.69 1.73
总变异
19
277.77
9
2 完全随机设计的方差分析
☺ 应用表3-2数据进行方差分析
组合Fl l 2
3(CK) 4
2.89 5.07 6.23 12.29
4.88 3.52 3.94 13.68
单株产量 3.03 2.57 2.66 1.09 4.26 3.22 10.48 11.07
✓区组平方和 SSt =
=(32.22+ 37.12 +…+ 34.12)/3 – 3 220.17 =34.08
✓误差平方和 SSe = SST - SST - SSt = 84.61 – 27.56 – 34.08 = 22.97
第八章单因素试验结果的统计分析[实践]
第八章单因素试验结果的统计分析•单因素试验指仅研究一个供试因素若干处理间的效应是否有显著差异的试验.•按试验设计的类型单因素试验可分为:•顺序排列试验•单因素完全随机试验•单因素随机区组试验•拉丁方试验第一节对比和间比试验的统计分析(自学)第二节完全随机试验设计的统计分析完全随机设计:是所有的处理和重复小区在整个试验空间完全随机排列的设计方法。
只满足试验设计三项基本原则中的重复和随机排列两项原则。
•如:k = 5,n = 3的完全随机排列示意图主要优点:对各处理的重复次数没有限制,可以相等也可以不相等不足之处:没有遵循局部控制原则,所以要求试验地较为均匀一致,不存在有明显方向性的肥力差异,一般不用于田间试验。
•根据每一处理的重复次数或重复的设计方法不同, 又分为:①组内观察值数目相等;②组内观察值数目不等的完全随机试验;③组内又可分为亚组的完全随机试验一、组内观察值数目相等的完全随机试验设计的统计分析组内观察值数目相等的完全随机试验是各处理重复次数相等的试验。
设有k个处理,每处理均有n个重复观察值,共设kn个观察值;其资料的数据结构模式类型见第7章表7.1。
其试验结果的方差分析方法列于表8.1。
表7.1 k个处理每处理n个重复观察值的完全随机试验数据符号表表7.1 nk个观察值的单向分组资料模式表8.1 组内观察值数目相等的完全随机试验的方差分析•〔例8.1〕研究6种棉花种子包衣剂对棉花生长的影响,设TW1为对照。
采用盆栽试验,各种子包衣剂处理播种5盆,完全随机设计。
出苗一定时期后测定棉花苗高(cm),其结果如下。
试检验各种子包衣剂与对照的棉花平均苗高差异显著性及各种子包衣剂棉花平均苗高间的差异显著性。
表8.2 6种棉花种子包衣剂的棉花苗高结果(cm)•解:已知:处理数k=6,重复次数n=5,共有kn=6×5=30个观察值。
•1、自由度及平方和的分解•总自由度df T = nk– 1 =6 × 5 – 1 =30 – 1 =29•处理自由度df t = k– 1 =6 – 1 =6 – 1 =5•误差自由度df e = df T–df t =29 – 5 =24或df e = n(k– 1) =6 ×( 5 – 1) =24 – 1 =23•矫正数总平方和SS T =Σx2-C=22.92+22.32+……+23.72-C=45.763处理平方和误差平方和SS e=SS T-SS t=45.763-44.463=1.3002、F 检验和列方差分析表统计假设H O:μ1= μ2=…= μ6;H A:μi不“全相等”(即至少有一个不等号)将上述计算的各项自由度、平方和、均方结果,按变异来源列出方差分析表(表8.5)。
单因素试验分解
这里的关键是“同时”两字.若 r 较大,要同时检验 Cr2 个假设,问题就复杂起来了。
4.多重比较——方法
• 考察因子 A 的 r 个水平,每个水平下重复数均为
mi.假设诸试验数据
yij ~ N (i , 2 ) , i 1,2,, r, j 1,2,...,m .
2.单因素试验举例——随机化
• 这里一次测试就是一次试验,试验次序要随机化。
因子 A 的水平 试验编号
1 8 13 19 2 9 14 20 3 10 15 21 4 11 16 22 5 12 17 23 18 24 6 7
A1
A2
A3
A4
•把试验结果“对号入坐”,填写试验结果。
因子 A 的水平 数据(毫克) 样本均值 Nhomakorabea1
2
3
4
5
6
7
8
1600 1610 1650 1680 1700 1720 1800 1580 1640 1640 1700 1750 1460 1550 1600 1620 1640 1740 1660 1820
丁
1510 1520 1530 1570 1680 1600
2.单因素试验举例——分析
水平——可控因素所处的各种各种不同的状态。每个 水平又称为试验的一个处理。 目的——考察某一个因素对试验结果的影响。
2.单因素试验举例
例 (灯丝的配料方案优选)某灯泡厂用四种配料方 案制成的灯丝生产了四批灯泡,在每批灯泡中作随机 抽样,测量其使用寿命(单位:小时),数据如下: 灯泡 寿命 灯丝 甲 乙 丙
试验设计与分析及参数优化
单因素实验
对每个棉花含量水平进行五次试验,于是得到 了抗拉强度观测值表。我们知道该实验是单因 素五个水平重复五次的实验。从表中以及散点 图中,得知,
第一:棉花含量影响抗拉强度
第二:含30%左右的棉花强度能使成品布的抗 拉强度达到最大值
可是我们想要检验的是5个水平的棉花百分率 的平均强度之间的差别,会检验五个均值都相
word
(七)方差分析的非参数方法 当正态性假定不能认为是合理的情况下,实验者 希望有不依赖于正态性假定的检验法来代替方差 分析的F检验法,运用Kruskal-Wallis检验法可以 解决这一问题,首先将观察值 按y升ij 序排列,然 后将每一观察值用它的秩(名次) 来代替, 最小的观察值的秩是1,如果有相同的观Ri察j 值用 平均秩表示。
算出
F统计量的值
第三:查临界值
第四:判断
第五:列方差分析表
变差来源 处理之间 误差 总和
平方和 SS处理
SSE SST
自由度
a-1 N-a N-1
均方
F0
MS处理
MSE
F0
MS处理 MSE
单因素试验的随机效应模型的a个水平是 在总体
随机选取的,平方和的分解式还是一致的,
关检意于验 义各的处理水HH平10 ::效应tt22 的 0差0 异的假设是没有
单因素实验
一、方差分析引例
产品开发工程师考虑能使一种新的合成纤 维的抗拉强度增加的方案,这种纤维织出 的布是用来缝制男士衬衫的,从以前的经 验得知,抗拉强度受到棉花在纤维中所占 的百分率的影响,开始,他预测增加棉花 含量会增大强度,他还知道,如果成品布 须具有他所希望的质量特性的话,棉花含 量应该在10%到40%之间,工程师决定检 验棉花百分率为五个水平的样本,水平是 15%,20%,25%,30%,35%。同时,还
试验设计与数据处理
2、复因素试验
研究两个以上不同因素效应的试验,叫做复因素试 验或多因素试验。复因素试验克服了单因素试验的 缺点,其结果能较全面的说明问题。
但随着试验因素的增多,往往容易使试验过于复杂 庞大,反而会降低试验的精确性。处理数目与试验 种类、排列方法、要求的精确程度有关,应以较少 的处理解决较多问题,因此。复因素试验一般以24个试验因素较好。
中心点处的 m0 次重复,使试验误差较为准确估计成为可能,从而使 对方程与系数的检验有了可靠依据。
中心组合设计方案
中心组合设计中的试验点由三部分组成:
(1)将编码值-1与1看成每个因子的两个水平,采 用二水平正交表安排试验,可以是全因子试验,也可
以是其1/2实施,1/4实施等。记其试验次数为mc,则 mc = 2 p ,或 2 p1 (1/2实施)、2p2 (1/4实施)等。
5、回归设计
(1) 回归正交试验设计 a、一次回归正交试验设计 b、二次回归正交试验设计
(2) 回归旋转设计 a、二次回归正交旋转组合 设计 b、二次通用旋转组合设计
1.完全方案
复因素试验研究的因素较多,完全方案是其 最简单的一种设计,设计的原理就是每个试 验因素的每个水平都要相互碰到,所有因素 处于完全平等的地位。设计时首先确定要研 究的因素及每个试验因素的水平,然后再将 所有试验因素的各个水平组合起来,每一个 组合就是一个处理。设 A、B、C、……代表 试验因素,A1、A2,、……B1、 B2,……; C1、C2,……代表相应试验因素的不同水平 。
3.正交试验设计
对于单因素或两因素试验,因其因素少 , 试验的设计 、实施与分析都比较简单 。但
在实际工作中 ,常常需要同时考察 3个或3
个以上的试验因素 ,若进行全面试验 ,则 试验的规模将很大 ,往往因试验条件的限 制而难于实施 。正交试验设计就是安排多 因素试验 、寻求最优水平组合 的一种高效 率试验设计方法。
单因素试验的方差分析
j
μ 各个随机误差 ε ij 相互独立, 1 , μ 2 , , μ s 和 σ
未知.
单因素试验表 部分总体 样 本 A1 A2 … As
X11
X21
· · ·
X12 …
X22 … Xn22 … T.2 …
X 2
· · ·
X1s
X2s
· · ·
…
Xn11 样本和T.j 样本均值 X j T.1
是 σ 的无偏估计
.
结合定理(1)(2)(3),有
F S A /( s 1 ) S E /( n s ) ~ F ( s 1, n s )
ST ,SA ,SE 的计算方法
n
j
记 T j 化简得
i1
X
ij
, T
j1 i1
s
2
s
n
j
X
ij
T
j1
s
j
j1 i1
s
n
j
(X
ij
X
j )
2
说明:
SE 表示在每个水平下的样本值与该水平下的样本 均值的差异,它是由随机误差引起的,所以,称SE是 误差(组内)平方和.
平方和分解公式:
ST S A S E
证明:S
i1
s
n
j
(X
ij
X)
2
( X
j1 i1
2
都是未知参数。
在水平Aj下进行nj次独立试验,得样本
X 1 j, X
2 j
, ,X
nj j
,
则
记
X
ij
第五篇-单因素实验设计及实验因素水平确定方法
因素
噪声因素是试验过程中可使试验结果发生偏差,且无法对 其进行控制的因子。它具有以下特征:
1、使试验结果偏离目标。 2、无法或很难人为控制。 当试验中存在噪声因素时,有两种方法可以进行改善。
1、首先确认此因素对指标Y的影响程度,如影响大,则须对其 进行中和(即直接控制或降低其对Y的影响)。
2、通过重复精确试验来确定可控因素的最佳水平,当可控因素 的水平足够好时,即可得到可靠的设计(对噪声因素不敏感)。
实用文档
实用文档
可控因素 噪声因素
实用文档
水平的选取
(1)水平有两种:量的变化(数量因素)和质的变化(质 量因素)。 (2)数量因素水平水平范围要足够宽,否则就可出现缩小 甚至抵削变量影响,同时也看不出因素间交互作用对输出 的影响。 (3)水平设置也不可过宽,否则同样可能缩小此因素的影 响,或将其它因素的影响掩盖掉。过宽还可能超出允许操 作范围,造成意外损失。一般要求3个以上。 (4)依据:专业知识、以往的研究结论、经验教训;最重 要的是在阅读文献基础上结合自身实际情况选择。
数,即在试验范围内只有一个最优点 d,其效 果f(d)最好,比 d 大或小的点都差,且距最优 点 d 越远的试验效果越差。
实用文档
3 黄金分割法(0.618法)
• 设x1 和x2 是因素范围[a,b]内的任意两个试点,C 点为问题的最优点,并把两个试点中效果较好的点称
由 为好点,把效果较差的点称为差点。则:最优点与好 来 点必在差点同侧,因而我们把因素范围被差点所分成
x3=大+小-第一点=1382+2000-1618=1764克 • 第四步 比较在上次留下的好点,即第(1)处和第(3)
处的试验结果,看那个点好,然后就去掉效果差的那个 试验点以外的那部分范围,留下包含好点在内的那部分 范围作为新的试验范围,……如此反复,直到得到较好的 试验结果为止。
单因素试验
•
• • •
下面通过实例,说明黄金分割法设计实验的具体步骤。 例 1: 目前,合成乙苯主要采用乙烯与苯烷基化的方法。为了因地 制宜,对于没有石油乙烯的地区,我们开发了乙醇和苯在分子筛催化下 一步合成乙苯的新工艺: C6H6+C2H5OH—→C6H5C2H5+H2O 筛选了多种组成的催化剂,其中效果较好的一种催化剂的最佳反应温 度,就是用黄金分割法通过实验找出的。 初步实验找出,反应温度范围在 340-420℃之间。在苯与乙醇的摩 尔比为 5:1,重量空速为 11.25h-1 的条件下,苯的转化率 XB 是: 340℃ 420℃ 10.98% 15.13%
三、单因素优化实验设计方法
1、均分法 2、对分法
3、黄金分割法(0.618法)
4、分数法
1.均分法
• 1) 作法
x:实验点
a<x<b
• 2) 优点:只要把实验放在等分点上,实验点安排简单。 n次实验可同时做,节约时间,也可一个接一个做,灵活 性强。
• 3)缺点:实验次数较多,代价较大,不经济.
2.对分法(中间取点)
Fn 1 Fn 1 令 Fn 1 , 2 Fn1 (即按分数序列的规律选
择实验点位置) ,比较 f (1 ) 及 f (2 ) ,然后舍掉 不包括最优点的一段,在缩短了搜索范围后继 续找点,比较实验结果,当搜索区间小于给定 精度值时,整个过程结束。 因为选择的 是一个分数,所以这种方法 又称为分数法。
20 40 50 55 60
3. 0.618法(黄金分割法)的构思
• 设指标函数是一个单峰函数,即在某区 间内只有一极大点,为最佳实验点 黄金分割法(gold cut method),将第一个试验点 1 d安排在试验范围内的0.618 处(距左端点a),即 d=a+(b-a)×0.618,得到试 验结果f(d);再在d的对称点 a c d b c,即c=a+(b-a) ×0.382,得到 试验结果f(c),比较f(d)和 a e f(c) d f(c),如果f(c)大,就就去掉 (d,b)段,然后在留下的(a,d) • 用以上的方法做下去,直到 达到要求为止。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 同时考虑如下 Cr2 个假设的检验问题,
H
ij 0
: i
j ,i
j, i,
j
1,2,
,r .
•
样本均值
yi
应是
i
的很好估计,若
H
ij 0
为真,
yi y j
不应过大,过大就应拒绝
H
ij 0
.
5.效应模型
在单因子试验中,对水平 A1, A2 , , Ar 的选择方式有二种: •r 个水平 A1, A2 , , Ar 是特定的,如四个玉米品种,现要
3.单因素试验的方差分析
设 A 表示欲考察的因素,它的 r个不同水平,对应
的作指若标干视次作重复r 试个验总:体nX1,1n, X2 ,2.,....n.Xr .r(. 每可个等水重平复下也,可我不们等
重复),同一水平的
的一个样本:X i1, X i2 ,
ni 个结果,就是这个总体
...X ini .
0
H
1:
2 a
0
若拒绝
H
0
,就意味着
2 a
>0,从而认定
A
的随机效应存
在显著差异,
2 a
愈大,此种差异就愈大。
在方差分析中,总平方和的分解和检验的统计量都
与固定效应完全一样,只是各平方和的含义略有差别。
谢谢! 请老师和同学们指正!
如今我们选用不平衡设计,即A1, A2, A3, A4分别制作
了7,5,6,6个样品,共有24个样品等待测试。
2.单因素试验举例——随机化
• 这里一次测试就是一次试验,试验次序要随机化。
因子 A 的水平
试验编号
A1
1234567
A2
8 9 10 11 12
A3
13 14 15 16 17 18
A4
H1:诸ai不全为0
这一对假设与原先一对假设是等价的.
H 0 : 1 2 ... r H1 : 诸i 不全相等
例 在绿茶中叶酸含量的例子中,已有:
r=4, m1 =7, m2 =5, m3 =6, m4 =6,n=24, y1 8.27,y2 7.50,y3 5.82,y4 6.35
y 7.02
其四个水平效应的估计值分别为 aˆ1 8.27 7.02 1.25
aˆ2 7.50 7.02 0.48
aˆ3 5.82 7.02 1.20
aˆ4 6.35 7.02 0.67
其中两个是正效应,两个是负效应。
5.效应模型——随机效应模型
随机效应模型的数据结构式
yij
试验设计与分析及参数优化
单因素试验
One-factor experimental design
主要内容
1.基本概念 2.单因素试验举例分析 3.单因素试验的方差分析方差分析 4.多重比较 5.效应模型
1.基本概念
概念——单因素试验顾名思义,是指在试验过程中只 有一个被研究的因素,或者说研究者只是针对一个因 素对考察指标的作用影响,需要强调的一点是,单因 素试验并不是说该试验的影响因素只有一个。
比较其优劣.
•r 个水平 A1, A2 , , Ar 是从众多水平中随机选出来的,如
绿茶的产地有很多,现随机从市场上购买四种绿茶作叶酸含量 的测定与比较.
如何从统计模型区别这二种不同的单因子试验呢?效应模 型因此需要而产生,它可分为两类:
• 固定效应模型 • 随机效应模型
5.效应模型
在单因子试验中,对水平 A1, A2 , , Ar 的选择方式有二种: •r 个水平 A1, A2 , , Ar 是特定的,如四个玉米品种,现要
6.35
2. 单因子试验——一般概述
在一个试验中只考察一个因子A及其r个水平A1,A2,… ,Ar.
在水平Ai下重复mi次试验,总试验次数n= m1+m2 +…+ mr. 记yij是第i个水平下的第j次重复试验的结果,这里 i ——水平号,j ——重复号.
经过随机化后,所得的n个试验结果列于表2.2.1.
2.单因素试验——三项基本假定
自正1.态正总态体性:N (在i水,平i2 ) 的A一i下个的样数本据,yi1i,=y1i2,2,……,,ry。imi是来
2.方差齐性:r个正态总体的方差相等,即:
2 1
2 2
2 r
2。
3.随机性:所有数据yij都相互独立。
图2.2.1 单因子试验所涉及的多个正态总体
灯泡的使用寿命——试验指标 灯丝的配料方案——试验因素(唯一的一个) 四种配料方案(甲乙丙丁)——四个水平 因此,本例是一个四水平的单因素试验。 用X1,X2,X3,X4分别表示四种灯泡的使用寿命,即为 四个总体。假设X1,X2,X3,X4相互独立,且服从方差 相同的正态分布,即Xi~N(i,2)(i=1,2,3,4) 本例问题归结为检验假设 H0:1= 2= 3= 4 是否成立
由于同一水平下重复试验的个体差异是随机误差,所以设:
X ij i ij , j 1, 2,...ni , i 1, 2,...r 线性统计模型
其中 为试验误差,相互独立且服从正态分布 ij 即 ij ~ N 0, 2
4.多重比较
在确认因子 A 的 r 个水平均值间有显著差异的情况下, 进一步要问:哪些水平均值间确有显著差异,这就要进行多 重比较。同时比较任意两个水平间有无显著差异的问题称为 多重比较。
它表示水平 Ai 的均值中除去总均值后特有的贡献,称 ai 为水 平 Ai 的效应.
5.效应模型——固定效应模型
r
水平 Ai 的效应 ai 可正可负,且有约束 ai 0 .
这样一来,数据结构可改写为:
i 1
yij ai ij,i 1,2, , r,j 1,2, , mi ,
其中
• 是因子 A 的全部水平下指标的总均值,它是待估
19 20 21 22 23 24
•把试验结果“对号入坐”,填写试验结果。
因子 A 的水平
数据(毫克)
样本均值
A1
7.9 6.2 6.6 8.6 8.9 10.1 9.6 8.27
A2
5.7 7.5 9.8 6.1 8.4
7.50
A3
6.4 7.1 7.9 4.5 5.0 4.0
5.82
A4
6.8 7.5 5.0 5.3 6.1 7.4
则:Var( yij
)
2 a
2
其中
2 a
和
2
称为
yij
的两个方差分量,故随机效应模
型又称为方差分量模型.
5.效应模型——随机效应模型的方差分析
随机效应模型中的检验假设:因子 A 的一切可能的
效应是否相等,等价于检验随机效应的方差
2 a
是否为
0,只有方差为 0 的随机变量才为常数。即:
H
0:
2 a
2.单因素试验举例
例: 茶是一种大众饮品,它含有叶酸(一种维生素B),
今要研究各地的绿茶中叶酸的含量是否有显著差异?
问题中,绿茶是一个因子,用A表示。 选定四个产地的绿茶,记为A1, A2, A3, A4,它是因子A
的四个水平。为测定试验误差,需要重复
各水平重复数相等的设计称为平衡设计. 各水平重复数不等的设计称为不平衡设计.
水平——可控因素所处的各种各种不同的状态。每个 水平又称为试验的一个处理。
目的——考察某一个因素对试验结果的影响。
2.单因素试验举例
例 (灯丝的配料方案优选)某灯泡厂用四种配料方 案制成的灯丝生产了四批灯泡,在每批灯泡中作随机 抽样,测量其使用寿命(单位:小时),数据如下:
灯泡
寿命
1 2 3 4 5 678
灯丝
甲 1600 1610 1650 1680 1700 1720 1800
乙 1580 1640 1640 1700 1750
丙 1460 1550 1600 1620 1640 1740 1660 1820
丁 1510 1520 1530 1570 1680 1600
2.单因素试验举例——分析
设因子 A 有 r 个特定水平 A1, A2 , , Ar ,在水平 Ai 下重复进 行 mi 次试验,由三项基本假定可得 yij ~ N (i , 2 ) .这时数据 yij 有如下结构:
yij i ij,i 1,2, , r,j 1,2, , mi .
若记 为总平均值
则 ai i , i 1,2, , r ,
ai
ห้องสมุดไป่ตู้
,
ij
i 1, 2,L , r,j 1, 2,L , mi
其中
• 是因子 A 的全部水平指标的总均值;
• ai 是第 i 个水平的随机效应.一般假定 a1, a2 , , ar 是
来自某正态分布
N
(0,
2 a
)
的一个随机样本;
• ij ~ N (0, 2 ) 是随机误差;
•诸 ai 与诸 ij 是相互独立的随机变量.
表2.2.1 单因子试验的数据
因子 A 的水平
A1 A2
Ar
数据
y11 y12 y1m1 y21 y22 y2m2
yr1 yr 2 yrmr
和
T1 y11 y12 y1m1
均值
y1 T1 / m1
T2 y21 y22 y2m2
y2 T2 / m2
…
…
Tr yr1 yr 2 yrmr yr Tr / mr
比较其优劣.
•r 个水平 A1, A2 , , Ar 是从众多水平中随机选出来的,如
绿茶的产地有很多,现随机从市场上购买四种绿茶作叶酸含量 的测定与比较.
如何从统计模型区别这二种不同的单因子试验呢?效应模 型因此需要而产生,它可分为两类: