第九章单因素方差分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因素水平(level of factor): 试验因素所处 的某种特定状态或数量等级称为因素水平, 简称水平。如研究3个品种奶牛产奶量的高低, 这3个品种就是奶牛品种这个试验因素的3个 水平。 试验处理(treatment): 事先设计好的实施 在实验单位上的具体项目就叫试验处理。如 进行饲料的比较试验时,实施在试验单位上 的具体项目就是具体饲喂哪一种饲料。
a n
… … … … … … … …
i yi1 yi2 … yij … yin yi. yi.
… … … … … … … …
a
处理间平均 数的差异是 由处理效应 引起的:
ya1 a ya2 … i 1 yaj … yan ya. ya.
( y
i.
y.. )
2
Yi.=∑yij y ..
处理内的变 异是由随机 误差引起:
dfT = na-1
dfA = a -1
dfe = dfT - dfA = na-1-(a-1) =na-a
总和 平均
yi
… Ta T=∑yij … ya y
例:生产某种纺织品,要求棉花纤维长度平均为30mm以上, 现有一棉花品种,以n=400进行抽查,测得其纤维平均长度为
30.2mm,标准差为2.5mm,
问该棉花品种的纤维长度是否符合纺织品的生产要求? 例:某鱼塘水中的含氧量,多年平均为4.5(mg/L),该鱼塘设10 个点采集水样,测定含氧量为: 4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26(mg/L)
况下的统计假设检验,或者说是平均数差异显著
性检验的一种引伸。
方差分析的 基本功能
对多组样本平均数差异 的显著性进行检验
例:某鱼场按常规方法所育鲢鱼一月龄的平均体长为7.25cm, 标准差为1.58cm,现采用一新方法进行育苗,一月龄时随机抽 取100尾进行测量,其平均体长为7.65cm,
问新育苗方法与常规方法有无显著差异?
缺 点
例如我们用t检验的方法检验4个样本平均数之间的差异显著性
6次都接受的概率(0.95)6=0.735 犯α 错误的概率=1-0.735=0.265 犯α 错误的概率明显增加
基本概念
试验指标(eyperimental indey): 为衡量试验 结果的好坏和处理效应的高低,在实验中具体 测定的性状或观测的项目称为试验指标。常用 的试验指标有:身高、体重、日增重、酶活性、 DNA含量等等。 试验因素( eyperimental factor): 试验中所 研究的影响试验指标的因素叫试验因素。当试 验中考察的因素只有一个时,称为单因素试验; 若同时研究两个或两个以上因素对试验指标的 影响时,则称为两因素或多因素试验。
试验处理: 具体的探讨哪一窝动物的出生重
试验单位: 一定窝数的动物 重复: 4个重复
方差分析的基本原理
一、方差分析的基本思想、目的和用途 二、数学模型
三、平方和与df的分解
四、统计假设的显著性检验 五、多重比较
六、方差分析应该具备的条件
方差是标准差的平方,是表示变异的量。 在一个多处理试验中,可以得出一系列不同的 观测值。
试检验该次抽样测定的水中含氧量与多年平均值有无显著差别。
用A、B、C、D 4种不同的配合饲料饲养30日 龄的小鸡,10天后计算平均日增重,得到下表的数 据,问4种饲料的效果是否相同? 饲料 日增重(g)
A
B C D
55
61 71 85
49
58 65 90
62
52 56 76
45
68 73 78
51
( y
i 1 j 1
ij
yi. )
2
3.1平方和的分解
( yij y.. )2 ( yij yi . ) ( yi . y.. )
i 1 j 1 a i 1 j 1 a n n
a
n
a
n
2
( yij yi . )2 2 ( yij yi . )( yi . y.. ) ( yi . y.. )2
二、数学模型
2.2随机效应模型(random effect model)
指各处理的效应值αi不是固定的数值,
而是由随机因素所引起的效应。 这里αi是一个随机变量,是从期望均值 为 0,方差为σ2 的标准正态总体中得到的随 机变量。
二、数学模型
美国的黑核桃品种对不同地理条件的适应情况
河 南 北 京 广 州 江 苏 新 疆
例:调查了5个不同小麦品系的株高结果列于表8-1
试验指标:株高
试验因素:品系
因素水平:5个
试验处理:具体的调查哪一种品系的株高 试验单位:一定面积的小麦 重复:5个重复
例:探讨不同窝的动物出生重是否存在差异,随机 选取4窝动物,每窝均有4只幼仔,结果见表8-2。
试验指标:
出生重
试验因素: 窝别
因素水平: 4个
试验包含4个处理
缺 点
t 检验: C42 = 6次
2.无统一的试验误差,误差估计的 精确性和检验的灵敏性低 t检验:C42 =6次
缺 点
x
n
需计算 6个标准误
误差估计不统一 误差估计精确性降低
3.推断的可靠性低,检验时犯α错误 概率大。
t检验: C42 =6次 6次检验 相互独立 H0的概率: 1-α =0.95
第九章 单因素方差分析
Chapter 9 One-Facter Analysis of Variance
方差分析的定义
方差分析(Analysis of variance,ANOVA)
又叫变量分析,是英国著名统计学家R . A . Fisher于20世纪提出的。它是用以检验两个或多 个均数间差异的假设检验方法。它是一类特定情
观 测 值 不 同 的 原 因
处理效应(treatment effect): 处理不同引起
试验误差:试验过程中偶然性
因素的干扰和测量误差所致。
1.1方差分析的基本思想
处 理 效 应
总 变 异
试 验 误 差
1.2方差分析的目的
确定各种原因在总变异中所占的重要程度。
处理效应
相差不大,说明试验处理对指标影 响不大。
1 a 2 ss A yi . c n i 1
处理内平方和:SSe = SST - SSA
3.2 自由度的分解
总自由度也可分解为处理间自由度和处理内自 由度:
dfT = dfA + dfe
总 df
处理间df
处理内 df
3.2 自由度的分解
处理 重复
1 2 … j … n 1 y11 y12 … y1j … y1n T1 y1 2 y21 y22 … y2j … y2n T2 y2 … … … … … … … … … i yi1 yi2 … yij … yin Ti … … … … … … … a ya1 ya2 … yaj … yan
a n a n
1 a 2 y..2 ss A n ( yi . y.. ) 2 yi . n i 1 na i 1
a
y..2 令矫正数C= na
,则(P148):
2 ij
ssT
y
i 1 j 1
a
n
c
( y y ) y2
2
( y )2 n
气候、水肥、土壤
无法人为控制
如果实验条件不能人为控制,那么这个样本对 所属总体作出推断就属于随机模型。
二、数学模型
随机模型
在随机模型中,水平确定之后其处理
所产生的效应并不是固定的,试验重 复时也很难得到相同的结果。 方差分析所得到的结论,可以推广到这 个因素的所有水平上。
二、数学模型
2.3 混合模型(miyed model) 指多因素试验中既有固定因素又有随 机因素时所用的模型。 在实际应用中,固定模型应用最多, 随机模型和混合模型相对较少
1 2 … j … n 总和 平均 1 y11 y12 … y1j … y1n y1. y1. 2 y21 y22 … y2j … y2n y2. y2. … … … … … … … … i … … … … … … … … a ya1 ya2 … yaj … yan ya. ya.
y.. yij
i 1 j 1 i 1 j 1 i 1 j 1
a
n
对于每个固定的 y
i.
a n
( y
i 1 j 1
a
n
ij
yi . )( yi . y.. ) ( yi . y.. ) ( yij yi . ) 0
i 1 j 1
因此
3.1平方和的分解
( yij y.. )2 n ( yi . y.. ) 2 ( yij yi . ) 2
方差是离均差平方和除以自由度的商
σ2 =
∑(y-μ)2
N
Hale Waihona Puke s2 =∑(y- y )2
n-1
方差分析的基本思想:引起观测值出现 变异分解为处理效应的变异和试验误差的变 异。
要把一个试验的总变异依据变异来源分
为相应的变异,首先要将总平方和和总df分
解为各个变异来源的的相应部分。
3.1平方和的分解
处理 重复 1 2 … j … n 总和 平均 1 y11 y12 … y1j … y1n y1. y1. 2 y21 y22 … y2j … y2n y2. y2.
相差较大,即处理效应比试验误差
试验误差
大得多,说明试验处理影响是很大
的,不可忽视。
1.3方差分析的用途
1. 用于多个样本平均数的比较
2. 分析多个因素间的交互作用 3. 回归方程的假设检验
4. 方差的同质性检验
二、数学模型
假定有a组观测数据,每组有n个观测值,则共有 a na个观测值。 n n
处理 重复
试验单位( eyperimental unit ): 在实验中 能接受不同试验处理的独立的试验载体叫试验 单位。一只小白鼠,一条鱼,一定面积的小麦 等都可以作为实验单位。
重复(repetition): 在实验中,将一个处理实 施在两个或两个以上的试验单位上,称为处理有 重复;一处理实施的试验单位数称为处理的重复 数。例如,用某种饲料喂4头猪,就说这个处理 (饲料)有4个重复。
2.1固定效应模型(fiyed effect model) 指各个处理的效应值αi是固定值,各 个的平均效应αi= μi - μ是一个常量,且 ∑αi=0。 实验因素的各水平是根据试验目的事 先主观选定的而不是随机选定的。
二、数学模型
不同离子对木聚糖酶活性的影响(mg/ml)
Na+ K+ Mn2+ Cu2+
(i=1,2,3…,a j=1,2,3…,n)
αi-处理效应 εij -试验误差
yij -是在第 i 次处理下的第 j 次观测值
要求εi j 是相互独立的,且服从标准正态 分N(0,σ2 )。
二、数学模型
根据的αi不同假定,可将数学模型分为 以下三种:
固定效应模 型
随机效应模 型
混合效应模 型
二、数学模型
70 59 69
t 检验可以判断两组数据平均数间的差异显著
性,而方差分析既可以判断两组又可以判断多组数
据平均数之间的差异显著性。
有人说,我们可以把多组数据化成n个两组数 据(化整为零),用n次t检验来完成这个多组数据 差异显著性的判断。
对多个处理进行平均数差异显著性检验时, 采用t检验法的缺点: 1.检验过程烦琐
0.00
0.25 0.50 0.75 1.00
0.00
0.40 0.60 0.80 1.00
0.00
0.06 0.12 0.18 0.24
0.00
0.40 0.80 1.20 1.60
1.25
1.20
0.30
2.00
二、数学模型
在固定模型中,除去随机误差之后的每个处理
所产生的效应是固定的,试验重复时会得到相 同的结果; 方差分析所得到的结论只适合于选定的那几个 水平,并不能将其结论扩展到未加考虑的其它 水平上。
i 1 j 1 i 1 i 1 j 1 a n a a n
总平方和 SST
处理间或组间平 方和SSA
处理内或组内 平方和 SSe
SST = SSA+ SSe
总平方和=处理间平方和 + 处理内平方和
y..2 2 ssT ( yij y.. ) 2 yij na i 1 j 1 i 1 j 1
yi . i 1 j 1 ij y
j 1 i. i.
…yi1 yi2 … yij … yin
yi. yi.
1 y.. 1 y.. y an y
n
Yi.=∑yij y ..
二、数学模型
用线性模型(linear model)来描述每一 观测值:
yij =μ + αi + εij
μ -总体平均数