实验优化设计第4章方差分析
方差分析的实验报告
方差分析的实验报告方差分析的实验报告引言:方差分析是一种常用的统计方法,用于比较两个或多个组之间的均值差异是否显著。
在本次实验中,我们将运用方差分析来研究三种不同肥料对植物生长的影响。
通过对不同处理组的生长情况进行观察和数据分析,我们旨在探究不同肥料对植物生长的影响是否存在显著差异。
实验设计与方法:本实验采用了完全随机设计,共设置了四个处理组,分别为对照组和三个不同肥料处理组。
每个处理组设置了十个重复样本。
实验的主要步骤如下:1. 准备工作:选取相同品种的植物作为实验材料,并确保它们具有相似的生长状态和健康状况。
同时,为了消除外界因素的干扰,我们将植物放置在相同的环境条件下。
2. 分组处理:将植物随机分为四组,其中一组作为对照组,不施加任何肥料,另外三组分别施加三种不同的肥料。
3. 数据收集:在实验开始后的每个固定时间点,我们测量每个植物的生长指标,如株高、叶片数、根长等,并记录下来。
这些数据将用于后续的方差分析。
数据分析与结果:在实验结束后,我们对收集到的数据进行了方差分析。
通过计算各组的平均值、方差和标准差,我们得到了以下结果:1. 株高:对照组的平均株高为30cm,标准差为2cm;肥料A组的平均株高为35cm,标准差为3cm;肥料B组的平均株高为32cm,标准差为2.5cm;肥料C组的平均株高为33cm,标准差为2.8cm。
方差分析结果显示,不同处理组之间的株高差异是显著的(F=4.56, p<0.05)。
2. 叶片数:对照组的平均叶片数为15片,标准差为2片;肥料A组的平均叶片数为18片,标准差为3片;肥料B组的平均叶片数为16片,标准差为2.5片;肥料C组的平均叶片数为17片,标准差为2.8片。
方差分析结果显示,不同处理组之间的叶片数差异是显著的(F=3.21, p<0.05)。
3. 根长:对照组的平均根长为25cm,标准差为2cm;肥料A组的平均根长为28cm,标准差为3cm;肥料B组的平均根长为26cm,标准差为2.5cm;肥料C组的平均根长为27cm,标准差为2.8cm。
第四章方差分析修改 ppt课件
21
第二节 完全随机设计资料的方差分析
变异程度除了与离均差平方和的大小有关外, 还与其自由度有关,将各部分离均差平方和除 以相应自由度,其比值称为均方差,简称均方 (mean square,MS)。
MS组间
SS组间
组间
MS组内
SS组内
组内
22
第二节 完全随机设计资料的方差分析
组间均方与组内均方的比值称为F 统计量
3.组内变异 在同一处理组中,虽然每个受 试对象接受的处理相同,但测量值各不相同, 各组内Xij大小各不相同,与本组的样本均数 也不相同,这种变异称为组内变异(误差)。 组内变异可用组内各测量值Xij与其所在组的
均数的差值的平方和表示,记为SS组内, 表示
随机误差(含个体差异和测量误差)的影响。 又称误差变异
F
MS组间 MS组内
组 组 内 间 变 变 处 异 异 误 理 误 差差
1 组间 2 组内
23
第二节 完全随机设计资料的方差分析
F 值(Fisher)接近于l,就没有理由拒绝H0; 反之,F 值越大,拒绝H0的理由越充分。数 理统计的理论证明,当H0成立时,F 统计量 服从F 分布。F 分布有两个自由度, 分子自
8
第二节 完全随机设计资料的方差分析
一、完全随机设计
编号
1 2 3 4 5 6 7 … 59 60
随机数 26 08 73 37 32 04 05 … 06 79
序号
17 9 44 24 20 2 4 … 6 50
分组结果 甲 甲 丙 乙 甲 甲 甲 … 甲 丙
9
表9-1 2型糖尿病患者治疗4周后餐后2小时血糖下降值(mmol/L)
26
【优化试验设计】优化设计(方差分析)2016
• 总偏差平方和S及其自由度还满足下列关系:
a
S S j S j S j S j
j 1
c因
c交
c空
a
f f f j f j f j
j 1
c因
c交
c空
• 总偏差平方和等于正交表所有列偏差平方和之和,等于所有 试验因素、试验考察交互作用和空列偏差平方和之和;其自 由度等于各列自由度之和,等于试验因素、试验考察交互作 用和空列的自由度之和。
差,则有:
(n 1)S 2
2
~
2 (n 1)
25
F分布:
设 U ~ 2 (n1) ,V ~ 2 (n2 ) ,且U、V独立,则称随机变量:
F U / n1 V / n2
服从自由度为(n1,n2)的F分布,记为F~F(n1,n2)。
F临界值是根据统计数学原理而编制的F分布表(Fα(f1, f2)),对 于不同的 α值,设计了不同的F分布表
P[FA F ( f A , fe )] 1
如果 FA F ( f A , fe ) ,就可以拒绝接受原假设,并认为在显著
水平 下,因素 A的水平变动对试验指标有显著的影响,而作
这一结论的置信度为1- ,犯错误的几率为 。
常用的F表有α=0.01、0.05、0.10、0.25几种, α称为置信度
S j
a b
b
( y jk
k 1
y)2
其中:y jk
y jk a
b
ab 2 b [ k 1 ( y jk
2
y
2yy
jk )]
a b 2
2
b
实验设计及数据分析-方差分析
实验设计及数据分析-方差分析实验设计及数据分析方差分析一、方差分析的基本原理方差分析的核心思想是将观测值的总变异分解为不同来源的变异,然后通过比较不同来源变异的大小来判断因素对观测结果的影响是否显著。
总变异可以分解为组间变异和组内变异。
组间变异反映了不同组之间的差异,组内变异则反映了组内个体之间的随机误差。
如果组间变异显著大于组内变异,就说明不同组之间的均值存在显著差异,即所研究的因素对观测结果有显著影响。
二、实验设计要点1、确定研究因素和水平首先要明确研究的因素,以及每个因素的不同水平。
例如,研究不同肥料对作物产量的影响,肥料种类就是因素,不同的肥料品牌或配方就是水平。
2、选择合适的实验对象实验对象应具有代表性和随机性,以减少偏差。
3、控制无关变量在实验过程中,要尽量控制其他可能影响结果的无关变量,以确保结果的准确性。
4、确定样本量样本量的大小会影响统计检验的效力,一般来说,样本量越大,结果越可靠,但也要考虑实际操作的可行性和成本。
5、随机分组将实验对象随机分配到不同的组中,以保证各组之间的初始条件相似。
三、方差分析的类型1、单因素方差分析只考虑一个因素对观测结果的影响。
2、双因素方差分析同时考虑两个因素对观测结果的交互作用。
3、多因素方差分析涉及两个以上因素的情况。
四、数据分析步骤1、提出假设零假设(H0):不同组之间的均值没有显著差异。
备择假设(H1):不同组之间的均值存在显著差异。
2、计算统计量根据实验数据,计算出组间平方和、组内平方和、总平方和等,进而得到 F 统计量。
3、确定显著性水平通常选择 005 或 001 作为显著性水平。
4、查找临界值根据自由度和显著性水平,在 F 分布表中查找临界值。
5、做出决策如果计算得到的 F 统计量大于临界值,拒绝零假设,认为不同组之间的均值存在显著差异;否则,接受零假设。
五、结果解读1、查看 ANOVA 表ANOVA 表中会给出各项变异的来源、自由度、平方和、均方和 F 值等信息。
方差分析
方差分析
▲方差分析的基本思想(思路) ▲试验结果变化原因的分析分解 ▲平方和分解和自由度分解 ▲ F测验
▲多重比较
▲方差分析的基本思想
方差是平方和除以自由度的商。 所谓方差分析(analysis of variance) ,是关于多个样本平均 数的假设测验方法,是将总变异剖分为各个变异来源的相应 部分,从而发现各变异原因在总变异中相对个独立样本,分别求得其均方 s12 和 s22,将 s12 和 s22 的比值定义为F:
2 2 F(1, 2 ) s1 s2
此F值具有s12 的自由度 v1 和 s22 的自由度 v2。 所谓F分布,就是在给定的 v1 和 v2 下按上述方法从正 态总体中进行一系列抽样,就可得到一系列的F 值而作成 一个分布。 F分布下一定区间的概率可从已制成的统计表查出。
表3.3 资料1LSR值的计算(新复极差测验)
p 2 SSR0.05 3.08 SSR0.01 4.32 LSR0.05 4.40 LSR0.01 6.18
3
4
3.23
3.33
4.55
4.68
4.62
4.76
6.51
6.69
当p=2时,
yD yB =6(cm) yB y A =5(cm)
5%水平显著; 5%水平显著;
y A yC =4(cm)
当p=3时,
不显著。
1%水平上显著; 1%水平上显著。 1%水平上显著。
yD y A =11(cm)
yB yC =9(cm)
当p=4时,
yD yC =15(cm)
结论:资料1的4个处理的苗高,除处理A与C差异不显
著外,其余处理间均达显著差异。
实验设计方法课后习题答案4-6章
▪ 习题4.1不能用正交表78(2)L ,因为会产生混杂。
需选用正交表1516(2)L 。
表头设计如下:▪ 说明:也可有其他不同的表头设计(试验方案)。
▪ 习题4.2 由于1AB C D A B A C B C f f f f f f f ⨯⨯⨯=======, 7f =总,故可选用正交表78(2)L ,且不会产生混杂。
表头设计如下:根据直观分析结果,因素的主次顺序为:AXB AXC C B BXC A D A 与B 的二元表,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,A 与C 的二元表,▪根据A与B的二元表,A1 B2的效果最好;▪根据A与C的二元表,A1 C2的效果最好;▪从直观分析结果可以得到,D1效果最好;▪故最优生产条件为:A1 B2 C2 D1▪(3)方差分析由于没有误差列,故不能对各因素进行显著性检验。
但是,我们选择离差平方和最小的因素D所在的列作为误差列,对各因素进行显著性检验,得到结果如下:因素的主次顺序与直观分析的一样,从显著性来看,只有AXB显著,其他的因素或交互作用都不显著。
▪习题4.3其中A ×B 的离差平方和349.85222.29632.148A B SS SS SS ⨯=+=+=A ×B 的自由度,,,,,,344A B f f f ⨯=+=32.14841.973 5.14024.446A B F ⨯==<故A ×B 不显著。
B ×C 的离差平方和81134.7417.6342.371B C SS SS SS ⨯=+=+=B ×C 的自由度,,,,,,8114B C f f f ⨯=+=42.3714 2.601 5.14024.446B CF ⨯==<故B ×C 不显著。
▪ 因素的主次顺序(根据极差大小或F 值大小) A D F BXC AXB B E C ▪ 最优工艺条件的确定:可以根据直观分析结果选择每个因素的最优水平,得到最优工艺条件为:,,,,,,,,,,,,,,,A1,D1,F1,E0,B0,C0,,.,,,,,,,,,,也可以计算各因素的水平效应 根据水平效应来确定,具体如下: 对于因素A ,,,,115221319ˆ9.148927927A K T a=-=-= 224251319ˆ 1.630927927A K T a =-=-=-333721319ˆ7.519927927A K T a =-=-=-故A 的第1水平的效应最大。
方差分析实验报告
方差分析实验报告一、实验目的:1.学习和掌握方差分析的基本原理和方法。
2.通过实验数据的处理,在不同的水龄条件下,比较水体COD浓度之间的差异,从而分析水龄对COD浓度的影响。
二、实验原理:1.方差分析是一种用来比较不同处理组之间差异性的统计方法。
它可以将总体方差分解为由不同因素引起的组内变异和组间变异,从而确定组间差异是否显著。
2.实验中所用的单因素方差分析是一种简单的方差分析方法,用于比较各组间的均值差异。
三、实验方法:1.实验设计:选取三个不同的水龄条件(10天、20天、30天)进行实验。
2.实验过程:分别采集三个水龄条件下的水样,进行COD浓度的测定。
每组实验重复三次,共计九次测定。
四、实验数据:1.实验数据见附表一2.通过对实验数据的处理,得到各组的均值和方差。
五、数据处理:1.计算总平均数:将所有测定值相加,然后除以测定的总次数。
2.计算组间平均数:将每组测定值相加,然后除以每组测定的次数。
3.计算组内平均数:将每个水龄条件下的测定值相加,然后除以该水龄条件下的测定次数。
4.计算组间平方和和组内平方和。
5.计算组间均方和和组内均方和。
6.计算F值。
7.查找F分布表,确定显著性水平α下的F(α)值。
8.判断各组均值之间的差异是否显著。
六、结果分析:1.通过计算可得,总平均数为X,组间平均数为X1、X2、X3,组内平均数为X1、X2、X32.计算得到组间平方和为SSB,组内平方和为SSW,组间均方和为MSB,组内均方和为MSW。
3.计算得到F值为F=MSB/MSW。
4.查找F分布表,确定显著性水平α下的F(α)值。
若F>F(α),则拒绝原假设,即各组之间的均值差异显著。
5.若各组均值差异显著,则可以进一步比较各组均值之间的差异。
七、实验结论:1.经过方差分析得知,在水龄条件下,水体COD浓度之间存在显著差异。
2.进一步比较各组均值之间的差异,可以得到水龄越长,水体COD浓度越高的结论。
第4章 方差分析、正交试验设计
r r
i 2 ( X ij X i )( X i X ) 2[( X i X ) ( X ij X i )] 其中: 2 ( X ij X i )(X i X ) 21[(X i X )1( X ij X i )] 其中: i 1 j 1 i j
r i 1 j 1
i
j n 1 r ni n i 1 11r X X ij ni X i n i 1 j 1 n i 1
X rX 1 r n X 1 r n X ij i i
i 1
i 1 QT ( jX1ij X ) 2
r
i 1 j 1 r r
ni ni
i 1
j 1
r
i 1
j 1
i 1 i 1
E、
QE
2 [( X i X )(ni X i ni X i )] 0
i 1
i
Ar
QT QE QA
QA
r n r 于是,总离差平方和被分解为组内离差平方和与 ( X ij X i )2 ni ( X i X )2 从而: QT i 1 j 1 i 1 组间离差平方和之和。 QE ——反映了 ij 的作用 ②组内离差平方和 ②组内离差平方和QQE——反映了 的作用 ②组内离差平方和 E ——反映了 ij 的作用 ②组内离差平方和QEEE ——反映了ijij的作用 ②组内离差平方和 Q ——反映了 ij ij 的作用 r ②组内离差平方和 ③分解定理 QA 2 Q E——反映了的作用 QEn、 X ) ②组内离差平方和Q ——反映了 )] n ( ) ij 的作用 QEr ( X ij nn [( ) ( i n r r r rn 2 2 2 i 1 ( jXX X )) 2 ( X 1 n Q r ) QQQ ( X ij X 设 [( Yn ( 立 ( ij) ,ij ) 2 [( ( ( )] , ) ) ) (Q 2 (i ~ ( E 理 ( Q 定 E ((XijX:XiX)))2Y11r,Yn12,i相)互独)])]QiAr( N(( i )i ) 2 4.1.1 X i j [([( QT)ij( E i , Yjn (0 )1 , )] )] QE i 11j j11 ij X i i[( i ij ) ( i i )] 1 ij i i i) ③组间离差平方和1Qj 1 ——反映了 i 的作用. ii 1j11j 11 A i 1 j 1 i 2 2 Q A——反映了 Y 2 ~ 2 (n) , 又 若 ③组间离差平方和 是 r——反映了的作用. i ③组间离差平方和 QQ A——反映了 的作用. 1,2,n,于是,总离差平方和被分解为组内离差平方和 n , 于 Q ——反映了i 的作用. n ③组间离差平方和 r ③组间离差平方和 A A Q Y1 Y22 ③组间离差平方和 QA ——反映了i iri i的作用. 的作用. 2 rr rr nn Q ni ( X i 2X ) ni的作用.i ( )]2 i [( i ③组间离差平方和rrr A ——反映了 QA r ( X i X ) rn n QQ1 (( Xi i ) 2 i ( X i QiX 2 2, ni 1, n 的线性组合的 X 22 r i i QA rnQ21X X )Q2,nn1 ( X iX )是 Yr2 , Y )])] 2 ( Q A ( X X2) n ( X X ) 2 Y1 n r[([([( ( )] 其中 ) i 1 j Q 组间离差平方和之和。 nn ( ( )] 2 nj j 1 X i X ) i 1 1r ni ( Xi X ) 2 Q A r ii1 1( r [( i 1
第4章 方差分析(anova)实验设计和分析
第4章方差分析(ANOV A)实验设计和分析Catherine Potvin4.1生态学问题弄懂生态学问题需要将各种环境因子的影响分开,生态工作者用实验来解决这个问题。
不论在野外还是在控制环境条件下,可控实验都可以让生态工作者们只变化一个因子来检验其影响。
例如,生长箱能使生物体生长在完全相同的温度而不同的光周期的条件下,或相同的光强而不同温度条件下的实验成为可能。
在控制实验中,通常最希望的情况是环境‘背景’,即所有的影响因子, 不是自由地变化,而是精确地得到控制,这样就能够保证在改变目标变量时,观测的反应不会受到其它因素的影响。
因而控制环境条件, 例如使用生长箱和温室,成为植物生态学的一个常用的方法,如同动物生态学中使用的生长柜和水族槽一样。
本章第一部分,我要讲一下作为实验生态学基本工具的方差分析(ANOV A)。
本章重点放在实验设计上。
虽然人们一般认为生长箱会提供同一环境条件,但不论在一个生长箱内还是生长箱间都存在环境异质性(Lee和Rawlings 1982;Potvin等1990a),因而能够充分处理环境异质性的实验设计将在本章中述及。
尽管我的论述主要是以生长箱实验为基础,其原理在其它类型的控制或野外环境的实验研究中同样适用(第5,15和16章)。
我还要讨论错误实验设计的代价。
本章应视为实验设计的起步点,这个起步点就是要考虑各种影响因素。
实验者通常进行的实验比这里展开的要复杂。
但是一旦懂得了基本原理,讨论各种实验设计就相对简单一些。
更详细的论述请见Cochran & Cox(1957)和Winter(1991)。
4.2 统计问题:环境变化与统计分析正如Underwood(1997)建议的一样,生态实验设计的第一步是建立一个线性模型使研究者能够将感兴趣的变量(因素)独立出来。
由于实验设计支配误差项,建立线性模型取决于所研究的因子以及具体的实验设计。
在任何一个实验开始时,最基本的是要检验空间与时间变化的格局。
方差分析_精品文档
2021/5/27
44
2.2 组内观测次数相等的方差分析 K组处理中,每一处理皆有n个观测值,其方
差分析方法同前。
表5. 组内观测次数相等的单因素方差分析
2021/5/27
45
例2.测定东北、内蒙古、河北、安徽、贵 州五个地区冬季针矛的长度,每个地区
随机抽取4个样本,测定结果如表示,试 比较各地区针毛长度差异显著性。
27
其中平均数差数标准误计算公式:
s x1x2
s12s22 n1 n2
se2(n11n12)
当n1=n2时,sx1x2
2se2 n
s e 2 为处理内误差方差,n为每一处理观察次数。
2021/5/27
28
例1. 表1. 氨氮含量(ppm)
2021/5/27
29
根据例1, s 2se2 2*9.112.13
2021/5/27
9
1.4.1 平方和的分解 总平方和=处理间平方和+处理内平方和
SSTSSt SSe
k
S S T 1
n(x x )2x 2 ( x )2x 2 T 2
1
k n
k n
令 C T 2 ,
kn
SST x2C
SSt =
Ti2 C n
SSe SSTSSt
2021/5/27
10
2021/5/27
39
例如,分析不同施肥量是否给农作物产
量带来显著影响,考察地区差异是否影 响妇女的生育率,研究学历对工资收入 的影响等。这些问题都可以通过单因素 方差分析得到答案。
2021/5/27
40
• 单因素方差分析的第一步是明确观测变 量和控制变量。例如,上述问题中的观
实验优化设计——方差分析实例
方差分析实验数据摘自论文1.实验数据淬火温度和回火温度对4Cr5MoSiV1抗拉强度的影响回火温度℃淬火温度℃580 600 6201020 1655 1694 1276 1648 1690 1269 1662 1698 12831050 1779 1786 1359 1776 1782 1360 1782 1788 13571070 1831 1803 1399 1835 1810 1406 1827 1800 13922.单因素方差分析淬火温度为1020℃时方差分析:单因素方差分析SUMMARY组观测数求和平均方差列1 3 4965 1655 49列2 3 5082 1694 16列3 3 3828 1276 49方差分析差异源SS df MS F P-value F crit 组间319886 2 159943 4209.026 3.61E-10 5.143253 组内228 6 38总计320114 8淬火温度为1050时方差分析:单因素方差分析SUMMARY组观测数求和平均方差列1 3 5337 1779 9列2 3 5356 1785.333 9.333333列3 3 4076 1358.667 2.333333方差分析差异源SS df MS F P-value F crit组间358764.7 2 179382.3 26039.37 1.53E-12 5.143253组内41.33333 6 6.888889总计358806 8淬火温度为1070摄氏度时方差分析:单因素方差分析SUMMARY组观测数求和平均方差列1 3 5493 1831 16列2 3 5413 1804.333 26.33333列3 3 4197 1399 49方差分析差异源SS df MS F P-value F crit组间351630.2 2 175815.1 5774.949 1.4E-10 5.143253组内182.6667 6 30.44444总计351812.9 82.无重复双因素分析方差分析:无重复双因素分析SUMMARY 观测数求和平均方差行1 3 4625 1541.667 53314.33行2 3 4924 1641.333 59796.33行3 3 5033 1677.667 58437.33列1 3 5265 1755 8176列2 3 5283 1761 3439列3 3 4034 1344.667 3936.333方差分析差异源SS df MS F P-value F crit 行29749.56 2 14874.78 43.97208 0.001893 6.944272 列341742.9 2 170871.4 505.1217 1.56E-05 6.944272误差1353.111 4 338.2778总计372845.6 83.有重复双因素分析方差分析:可重复双因素分析SUMMARY580600620总计1020观测数 3 3 3 9求和4965 5082 3828 13875平均1655 1694 1276 1541.667方差49 16 49 40014.251050观测数 3 3 3 9求和5337 5356 4076 14769平均1779 1785.333 1358.667 1641方差9 9.333333 2.333333 44850.751070观测数 3 3 3 9求和5493 5413 4197 15103平均1831 1804.333 1399 1678.111方差16 26.33333 49 43976.61总计观测数9 9 9求和15795 15851 12101平均1755 1761.222 1344.556方差6150.5 2622.444 2973.778方差分析差异源SS df MS F样本89584.3 2 44792.15 1783.758 P-value F crit 列1026343 2 513171.7 20436.04 2.03E-21 3.554557 交互3937.481 4 984.3704 39.20059 6.21E-31 3.554557 内部452 18 25.11111 1.18E-08 2.927744总计112031726。
【优化试验设计】拟水平法方差分析
Se=S空+Se3
例:
钢片在镀锌前要用酸洗的方法除锈。为了提高除锈效率, 缩短酸洗时间,先安排酸洗试验。考察指标是酸洗时间。在除 锈效果达到要求的情况下,酸洗时间越短越好。要考虑的因素 及其水平如表:
取正交表L9(34),将因素C虚拟1个水平。据经验知,海鸥 牌比OP牌的效果好,故虚拟第2水平并安排在第1列。
③ 列出方差分析表
因素C显著,因素A、B不显著,因素主次顺 序为C-A-B。优组合为A1B1C3。
采用拟水平法时,所拟因素和水平一般以不超 过两个为宜。另外,正交表作拟水平改造后, 其交互作用反映的关系并不会改变。
方差分析表
方差来源 偏差平方和 自由度 方差
F值 α
A 100.7
2
50.35 5.6 0.1
A
B
C
1
100
8
15
2
120
12
20
3
140
25
(1)试验方案设计
A、C均为三水平,而因素B由于受试验条件的
限制,只能取二水平。可选L18(2×37)表安排试验, 但试验次数太多。若B取三水平,就可直接用L9(34) 表安排试验。为此虚拟一个水平,把因素B凑足三 个水平。根据试验的需要选取重点要考察的那个水 平进行虚拟另一水平。虚拟结果相当于把L9(34)表作 了改造。
B 46.7
1
46.7
5.2 0.25
C 287.4 误 差e 27.07
2
143.7 16.0 0.05
3
9.0
总 和 462.9
8
注: F0.01 (2,3)=30.82, F0.05 (2,3)=9.55, F0.1(2,3)=5.46 F0.01 (1,3)=34.12, F0.05 (1,3)=10.15, F0.1 (1,3)=5.54, F0.25 (1,3)=2.02
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(4) 因素的主效应和因素间的交互效应 某因素单独对实验结果所产生的影响或作用,称该因 素的主效应。
因素间的交互作用是指除了因素“孤立地”影响实验 结果之外,还存在因素间不同水平互相搭配,联合在一 起共同对实验结果产生影响。这是在科学实验中常常遇 到的问题。
6
[例4-3] 有A、B两种药物治疗缺铁性贫血,患者12例,分为4组。实验方案是: 第一组用一般疗法;第二组在一般疗法基础上加用A药;第三组在一般疗法基 础上加用B药,第四组在一般疗法基础上A、B两药同时使用。一个月后观察红 细胞增加数。要求分析两种药物的疗效,数据见表4-3。
相 对 偏 差 平 方 和 偏 差 偏 平 差 方 平 和 方 自 和 由 度
12
随机变数的自由度是由数据个数n及数据所受的线性约束方程个数m所决定 的。这n个数据的平方和的自度为n-m。
① 总平方和ST的自由度 vT =N-1 =ar-1
② 因素A偏差平方和SA的自由度 vA=a-1
③ 误差平方和Se的自由度 ve=N-a=ar-a=a(r-1)
分组 第一组 (一般疗法) 第二组 (一般+A药) 第三组 (一般+B药)
1
2
3
平均值
0.8
0.9
0.7
0.8
1.3
1.2
1.1
1.2
0.9
1.1
1.0
1.0
第四组 (一般+A药+B药) 2.1
2.2
2.0
2.1
这种因素之间的相互作用即为交互效应。如果交互效应存在,说明两个因素不 是相互独立的。
把因素A和B的交互作用记为A×B。这里的符号“×”是交互 的记号,不要理解为乘号。两个因素的交互作用好象是在这 两个因素的单独作用之外,另有一个“假想因素”在起作用。
• 影响因素可分为可控因素和不可控因素。 • 实验温度、原料浓度等往往属于可控因素,它是实验研究的主要因素。 而大气温度、压强、湿度、风向等往往是不可控因素。
• 在判别介入的实验因素时,下列三种情况一般可以不作考察: • ①对实验指标的影响规律已经明确,或已知对实验考核指标没有影响 的因素; • ②实验时技术条件不具备,或测试技术不完善,测不出数值的因素; • ③虽能测出因素的值,但不具备控制手段,不能把因素控制在指定水 平上的因素。
9
我们的目标是要去检验各水平对实验有无影响并去估 计它们的影响程度。
检验假设: H0:m1=m2=…=ma H1:mi≠mj 至少有一对(i,j) 如果H0为真,则全体水平有公共均值m。 上述假设的一个等价假设是用水平效应ti表示,即 H0:t1=t2=…=ta=0 H1:ti≠0 至少有一个i
检验水平均值是否相等的恰当方法是方差分析。
4 方差分析
4.1 引言 4.1.1 问题的提出
如何比较不同实验条件下的实验结果?
先看一个简单的例子。 [例4-1] 为了考察三种催化剂对某一化工产品收率的影响,在其它条件不 变的情况下,每种催化剂重复实验4次,所得收率的数据见表4-1所示。
催化剂
1
2
3
4
平均值
甲
35.2
33.1
35.5
36.4 35.05
三个偏差平方和的自由度之间有如下的关系: vT= vA + ve
这也称自由度的可分解性。
13
若记总偏差相对平方和为VT,因素A相对偏差平方和 为VA,误差相对平方和为Ve,则它们分别为:
VT=ST / vT VA=SA / vA Ve=Se / ve VA、Ve可分别认为是因素A与误差e关于实验结果的平 均效应,并分别称它们为因素A均方差和误差均方差。 均方差也简称均方或方差。
4.2 方差分析的基本原理 4.2.1 固定效应模型的分析 (1) 问题的描述 以固定效应模型的单因素等重复实验为例,来说明方差 分析的基本原理。
8
表4-3 单因素等重复实验的典型数据
实验结果用线性统计模型来描述:
yij=m+ti+eij (i=1,2,…,a;j=1,2,…,r)
m是所有水平的共同参数,叫总均值,ti是第i个水平的唯一的一个参数, 叫做第i个水平的水平效应,eij是随机误差。
Ai称为因素A的第i种水平或第i种位级。 因素选定的不同取值的个数,称为该因素的水平数。
(3) 重复或重复数 在相同条件下进行2次及2次以上的实验,称重复实验或有重复实验。 重复是研究实验随机误差的基本手段。应在条件允许的情况下,尽可能
地采取重ห้องสมุดไป่ตู้实验,使样本容量足够地大,以保证实验与分析的可靠性。
5
在实验中影响结果的原因是很多的,一般情况下把直接和必然的原因作为 实验需要考察的因素。至于人们的操作技巧、检测仪表的精度等,并不直接 影响实验结果,而是产生误差的原因,除特殊情况外,一般不把它列为因素。
4
(2) 水平与水平数 因素在实验中所取的具体数值或状态,称为该因素的水平。水平也叫位级。 若某因素记为A,则因素A的a个不同水平可分别记做:A1、A2、…、Aa。
[例4-2] 某反应产物的收率受催化剂品种与反应温度的影响,现选取三种 催化剂(记做A1、A2、A3),四种不同的温度(记做B1、B2、B3、B4), 在催化剂与温度的12种不同的组合条件下,随机地进行实验。若记催化剂 为Ai和温度为Bj时的合成收率为xij,得表4-2所示的数据。
温度
催化剂
B1
B2
乙
31.5
36.6
34.2
34.8 34.30
丙
34.9
36.8
36.3
35.8 35.95
最终实验结果之间的差异可能源于催化剂的改变,也可能源于实验误差。
问题:① 实验结果的差异是催化剂的变化所引起的, 还是实验中的偶然误差引起的?如何鉴别?② 不同催 化剂对产品收率的影响是否显著?如何检验?
2
再看下面的一个例子。
10
(2) 偏差的构造
用偏差平方和来构造各偏差,
11
由各偏差平方和的构造可以看出,利用偏差平方和作 为数据变异性的一个度量,直观看来,这是合理的。但在 同样的波动程度下,测定数据越多,计算出的偏差平方和 就越大。因此,仅用偏差平方和来反映数据的各种变异显 然是不够的,还应当考虑测定值个数对偏差平方和的贡献, 这便是相对偏差平方和。
B3
B4
A1
x11
x12
x13
x14
A2
x21
x22
x23
x24
A3
x31
x32
x33
x34
问题:催化剂、温度以及实验中的各种偶然因 素的综合中,各因素的影响程度相对大小如何? 谁对实验结果产生了显著的影响?
3
4.1.2 几个基本概念
(1) 因素
所谓因素,是指直接影响实验结果而需要进行考察的原因,也即影响 实验结果的实验条件。