5-0实验设计与单因子实验设计及分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

随机化
随机化是指试验材料的分配,人员安排和各试验点的试验次 序都要随机确定。 随机化的好处: 能使各试验结果相互独立; 可使不可控因子的影响“抵消”部分,不至于积累成灾; 可使试验误差得到准确的估计。 随机化的方法: 用随机数表进行; 设计一个试验:把试验号放入袋中,再按抽得到的次序进行 试验。
总平方和的分解公式
单因子试验共有 n m1 m2 mr 个数据,其总平均值为
1 r mi 1 r 1 y yij mi yi , yi n i 1 j 1 n i 1 mi
r mi
y
j 1
mi
ij

这 n 个数据的波动可用总偏差平方和 S T 表示:
Q ( y1 y ) 2 ( y 2 y ) 2 ( y k y ) 2 ( y j y ) 2
j 1
称为 k 个数据的偏差平方和,有时简称为平方和,它是一个重要的 统计量。 •偏差平方和 Q 常用来度量若干个数据集中与分散(即波动)的程度. •Q 中的 k 个偏差 y1 y,y2 y, ,yk y 间有一个恒等式:
因子
因子,影响试验结果的因素,常用A,B,C等表示。 水平,因子所处的状态。常用A1,A2,B1,B2等表示。
可控因子:对其水平可作审慎改变的因子。
如,反应温度,反应时间,原料产地,原料配比等。 不可控因子,又称噪声因子或误差因子:在实际操作中不能控制其水
平的因子。或难以控制其水平的因子。或要花费昂贵才能控制其水平
第五章 实验设计与分析
• 第一节 实验设计概要 • 第二节 单因子试验的设计与分析
第一节 实验设计概要
• • • • 什么是试验? 几个名词的解释 基本原则 试验设计一般指南
1.什么是试验?
目的在于回答一个或几个经过精心构思的问题的实践活动称
为试验,又称实验.
例:精心构思的问题有 为提高发酵产品产量和质量而寻找最佳工艺参数. 为开发新产品而寻找性能稳定和成本低廉的设计方案. 为控制生产过程而寻找描述过程的数学模型. 为证明一种新药对某种疾病是否在统计学意义上确有疗效.
2 ~ N ( , ) 由此可知:y ij i
y ij 是因子A的第i个水平下第j次试验结果;
2 N ( 0 , )的随机变量. 它们是相互独立同分布
i 的最小二乘估计
y i的 (yij ) 由于 E i,诸 i 最小二乘法是使所有的偏差 ij r m i 平方和 2 Q ( y ) ij i
2 T 2 ST yij , f T n 1, n i 1 j 1 T12 T22 Tr2 T 2 SA , f A r 1 , m1 m2 mr n r mi
S e Q1 Q2 Qr,
的因子。或试验人员尚未意识到对试验结果会有影响的因子。 如:环境的温度与湿度、机器的老化、电源电压的波动等。
用黑箱模型来描述试验过程
试验误差
• 测量值y与真值μ之间的偏差ε= y – μ称为试验误差,简称误差. y = μ + ε. • 误差以不可预测的方式出现,ε是一个随机变量. • 由于诸多噪声因子对试验过程的影响,只要它们都被限制在一 定范围内,误差ε可认为服从正态分布N(0,σ2). • 标准差σ是度量随机误差大小的统计尺度. • σ小,误差就小,这说明试验组织实施得很好,控制得很好. • σ大,误差就大,这说明噪声因子干扰过大,要努力改进试验 实施. • σ过大,可能会使误差淹没由可控因子水平变化而产生的影响. 致使试验失败.
试验设计的一般指南
1. 对试验目的清楚(目的是什么?)、理解 (为什么要这样做); 2. 选好指标,确定测量指标的仪器或量具; 3. 选好可控因子及其水平; 4. 选择试验设计方案; 5. 按计划完成试验,记录试验结果; 6. 统计分析; 7. 验证试验,写出试验报告。
第二节 单因子试验的设计与分析
试验设计
• 试验设计是在明确所要考察的(可控)因子 及其水平后对试验所作的总体安排. • 尽量减少试验误差. • 尽量减少试验次数.
常用的试验设计方法
• 区组设计
• 回归设计 • 正交试验设计 • 均匀设计
3.基本原则
• 重复 • 随机化 • 区组
重复
重复是指一个试验点在相同条件下进行若干次重复试验. 设在某试验点上进行n 次重复试验,试验结果记为 y1,y2,…,yn. 重复有两个作用: 提供试验标准差σ的估计 提供指标均值μ的更为精确的估计 重复试验次数愈多,上述二项估计愈可信,但试验成 本也随着增加,故试验设计要求根据实际情况在两者之 间取得平衡。


2
( y ij y i ) mi ( y i y ) 2 .
i 1 j 1 i 1
总平方和的分解公式
其中第一个平方和
2 ( y y ) ij i i 1 j 1 r mi
称 为 组 内 平 方 和 S内 , 又 称 为 误 差 平 方 和 S e , 其 自 由 度 f e n r .第二个平方和
单因子试验的一般概述
在一个试验中只考察一个因子A及其r个水平A1,A2,… ,Ar. 在水平Ai下重复mi次试验,总试验次数n= m1+m2 +…+ mr. 记yij是第i个水平下的第j次重复试验的结果,这里 i ——水平号,j ——重复号. 经过随机化后,所得的n个试验结果列于表5.2.1. 表5.2.1 2, f T n 1 .
i 1 j 1
对 S T 中每一项插入 yi 二项,利用代数运算,可把 S T 分解为 如下两个平方和
r mi i 1 j 1 r mi
S T ( y ij y i ) ( y i y )
2 r
图5.2.2 单因子试验所涉及的多个正态总体
单因子试验的统计模型:
单因子试验的三项基本假定用到试验数据yij上去, 可得到如下统计模型: y , i 1 , 2 , , r , j 1 , 2 , , m i ji i j i

其中
i是因子A的第i个水平的均值,是待估参数; ij 是因子A的第i个水平下第j次试验误差,
ˆ ˆ ˆ ˆ 8 . 27 , 7 . 50 , 5 . 82 , 6 . 35
1 2 3 4
即第一个产地绿茶的叶酸含量平均值为8.27,其它绿茶亦可类 似解答.
偏差平方和及其自由度
在统计学中,把 k 个数据 y1 , y 2 ,, y k 对其均值 y 的偏差的平 方和: k
•把试验结果“对号入坐”,填写试验结果.
因子 A 的水平 数据(毫克) 7.9 5.7 6.4 6.8 6.2 7.5 7.1 7.5 6.6 9.8 7.9 5.0 8.6 6.1 4.5 5.3 8.9 8.4 5.0 6.1 4.0 7.4 10.1 9.6 样本均值 8.27 7.50 5.82 6.35
A1
A2
A3
A4
10 9 8 7 6 5 4
A1
A2
A3
A4
图5.2.1 四个产地绿茶叶酸含量的打点图(dotplot) 图上○表示叶酸含量,–线表示样本均值。下面是一些直观的结论: •图中每种绿茶的叶酸含量有高有低.
•从样本均值看,A1与A2的叶酸含量偏高一些.
•从样本极差看, A1,A2 ,A3 的极差接近, A4的略小一点。
下有 7 个数据,其和是 T1 57.9 ,则其偏差平方和:
2 57 . 9 Q1 7.9 2 6.2 2 6.6 2 8.6 2 8.9 2 10.12 9.6 2 7 12.88.
其自由度 f1 7 1 6 .类似地,可算得另外三个平方和:
Q2 11.30,f 2 4 Q3 12.03,f 3 5 Q4 5.61 ,f 4 5

y r Tr / mr
Ar
单因子试验的三项基本假定
A1.正态性。在水平Ai下的数据yi1, yi2,…, yimi是来 自正态总体 N(i ,i2) 的一个样本,i=1,2…,r. A2.方差齐性。r个正态总体的方差相等,即 2 2 2 2 .(Λ,λ) 1 2 r A3.随机性。所有数据yij都相互独立.
因子 A 的水平
A1
y11
y21
数据
y12 y1m1
y22 y2m2

T1 y11 y12 y1m1
均值
y1 T1 / m1
A2

T2 y21 y22 y2m2
y 2 T2 / m2

yr1 yr 2 yrmr

Tr yr1 yr 2 yrmr
i 1 j 1
达到最小,用微分法立即可得诸 i 的最小二乘估计是: . 1 ˆ y y y ... y ) , i 1 , 2 , , r i i ( i 1 i 2 im i m i
它是第i个水平下mi次重复试验的平均值.譬如,在例5.1.1中, 由表5.1.2可得 .
(y
j 1 k
k
j
y) 0 .
故 Q 中独立的偏差只有 k-1 个.记 f=k-1,并称 f 为 Q 的自由度. •Q 的简化计算公式为
2 Q y2 T k , T y1 y 2 ... y k . j j 1
例 5.2.2
在表 5.1.2 上所列茶叶的叶酸含量数据中, 水平 A1
2.1 单因子试验 2.2 单因子方差分析 2.3 多重比较
例5.2.1: 比较各种茶叶中的叶酸含量。
现选定绿茶,这是一个因子,用A表示。
又选定四个产地的绿茶,记为A1, A2, A3, A4,它是 因子A的四个水平。 为测定试验误差,需要重复。 • 各水平重复数相等的设计称为平衡设计. • 各水平重复数不等的设计称为不平衡设计. 如今我们选用不平衡设计,即A1, A2, A3, A4分别制 作了7,5,6,6个样品,共有24个样品等待测试。
试验的目的的差异会影响试验的设计与分析.
2.几个名词的解释
指标,用于衡量试验结果好坏的特征值。又称响应变量。
定量指标:用测量结果表示的指标,(用测量仪器)如菌
丝体干重、发酵液温度、抗生素产量。 定性指标:用等级评分等表示的指标。(组织专家评判组/ 自然人群感官评定组等)如酸奶的酸甜度、风味,色泽。 测量数据比定性数据含有更多信息,故在试验中要尽量选 用定量指标,不得以场合选用定性指标。
随机化
• 一次测试就是一次试验. 试验次序要随机化,为此把这24次 试验按序编号.
因子 A 的水平 试验编号
1 8 13 19 2 9 14 20 3 10 15 21 4 11 16 22 5 12 17 23 18 24 6 7
A 1
A2
A3
A4
• 在1到24个试验号中一个接一个地随机抽取,得到如下序列 9,13,2,20,18,10,5,7,14,1,6,15,23,…
2 m ( y y ) . i i i 1 r
称为组间平方和 S间 ,又称为因子 A 的平方和 S A ,其自由度
f A r 1.
总平方和分解公式: S T = S e + S A , f T f e f A 注意:这些都是代数恒等式.

各平方和的计算
记 Ti 为水平下数据之和, T T1 T2 Tr 为总和.各 平方和简化计算公式如下:
单因子方差分析
单因子方差分析问题就是在方差相等情况下对多个 正态均值是否彼此相等的一个假设检验问题.所涉及的 一对假设如下:
H 0 : 1 2 ... r , H1 : 诸i 不全相等.
简称因子 A 显著. 否则称因子 A 不显著. 上是显著的, 寻找检验上述一对假设的关键在于总平方和的分解 公式. 若在显著性水平 上拒绝 H 0 ,则称因子 A 在水平
相关文档
最新文档