One-WayANOVA单因素方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t x1 x2 2 MSe n
df an a
当差异显著时, x1 x2 t0.05
2 MSe n
LSD0.05
当差异不显著时,x1 x2 LSD0.05
多重比较- Duncan multiple range test
梯形列表法显示结果 *
**
多重比较的SPSS实现
例8.1:小麦株高与品系的关系研究-多重比较
F4,20,0.05=2.87,F4,20,0.01=4.43。F > F0.01, P<0.01。因此,上述5个小麦品系的株高差 异极显著。
随机效应模型
xij i ij
i 1, 2, , a
j
1,
2,
,
n
其布中,处其理方效 差应为αi为随2 机变量,服从μ=0的独立正态分 在随机效应模型中,对单个αi的检验是无意义。若假
(by RA Fisher)
单因素方差分析的数据形式
X因素的a个不同水平(处理)
每 个 处 理 下 n 个 重 复
n
xi xij ,
j 1
xi
1 n
xi ,
i 1, 2,, a
a n
x
xij ,
i 1 j1
x
1 an
x
方差分析原理
线性统计模型:
xij i ij
i 1, 2, , a
SST
i1 j1
xij x
2
a i 1
n j1
xi2j
x2 na
a
SSA n
i1
xi x
2
1 n
a i 1
xi2
x2 na
C x2 na
减少计算误差 利于编程
C称为校正项。误差平方和 SSe = SST-SSA
H0 :1 2 ... a 0; H A :i 0(至少有一i) 方差分析表
第八章 单因素方差分析
Chapter 8: One-factor Analysis of Variance
方差分析:从总体上判断多组数据平均数 (K≥3) 之间的差异是否显著
方差分析将全部数据看成是一个整体,分析构成变 量的变异原因,进而计算不同变异来源的总体方 差的估值。然后进行F测验,判断各样本的总体 平均数是否有显著差异。若差异显著,再对平均 数进行两两之间的比较。
n
i 0
i1
如有果一不个存α在i≠处0。理因效此应,,零各假αi设都为应:当等于0,否则至少 H0:α1=α2= … =αa=0
备择假设为:
HA:αi ≠ 0(至少有一个i)
固定效应模型
平方和与自由度的分解
an
2
an
2
xij x
xij xi xi x
i1 j1
i1 j1
Post Hoc Test
多重比较的SPSS实现
SPSS Duncan’s test output (1)
结果的解读:除品系1、2之间外,其它各品系间均 存在显著差异。
多重比较的SPSS实现
SPSS Duncan’s test output (2)
结果的解读:除品系1、2及3、5之间外,其它各品 系间均存在极显著差异。
设不存在处理效应,则αi的方差为零,即零假设为 :
H0
:
2
0
备择假设为:
HA
:
2
0
随机效应模型
单因素随机效应模型的方差分析表
随机效应与固定效应的方差分析的比较 ①程序相同; ②获得数据的方式不同;假设不同;均方期望不同; 适用范围不同。
方差分析应具备的条件
1、可加性(Addictivity):各处理效应与误 差效应是可加的。
a n
2
an
an
2
xij xi 2
xij xi xi x
xi x
i1 j1
i1 j1
i1 j1
an
a
n
xij xi xi x
xi x
xij xi 0
i1 j1
i1
j1
a
n
2
a
xij x n
a
xi x 2
n
2
xij xi
方差分析应具备的条件
3、方差齐性(Homogeneity):
方差分析中的误差项方差是将各处理的误差合并而获 得一个共同的误差方差,因此必须假定资料中有这 样一个共同的方差σ2存在(Bartlett检验法)
如果各处理的误差方差不齐,则在假设测验中处理效 应得不到正确的反映。
xij i ij , ij : (0, 2 )
j
1,
2,
,
n
模型中的xij是在第i次处理下的第j次观测值。μ是总
平均数。αi是对应于第i次处理的一个参数,称为 第i次处理效应(treatment effect)。εij是随机误差, 是服从N(0,σ2)的独立随机变量。
方差分析原理
固定因素:
①因素的a个水平是人为特意选择的。 ②方差分析所得结论只适用于所选定的a个水平。
单因素方差分析的SPSS实现
例8.1:小麦株高与品系的关系研究-单因素固定模型的方差分析
单因素方差分析的SPSS实现
SPSS one-way ANOVA output
株高
Between Groups Within Groups Total
Sum of Squares
131.740
15.580
147.320
如何进行多重比较?
逐对进行双样本的平均数差的t-检验? 增大了犯I型错误的概率,不可取
多重比较
多重比较方法:
最小显著差数(LSD)检验 Student-Newman-Keuls(SNK)q检验 Duncan 检验 Dunnett t检验 Tukey 检验 …
多重比较
最小显著差数法(Fisher’s Least significant difference test, LSD)
是t检验的变形,在变异和自由度的计算上 利用了整个样本信息,而不仅仅是所比较 两组的信息。 检验的敏感度最高,倾向于得出差异显著 的结论,在比较时仍然存在放大1型错误的 问题。
多重比较
最小显著差数法(LSD)
t x1 x2 , s x1 x2
s x1 x2
MSe
1 n1
1 n2
当 n1 时n2 ,
科学论文中多重比较实例
字母标记法显示结果
各平均数间,凡有一个相同标记字母的即为差异不显著,没有相 同标记字母的即为差异显著。字母大写表示极显著水平(α=0.01), 小写表示显著水平(α=0.05)
试用字母标记法表示如下多重比较的结果:
C
B
A
处理 1 2 3 4
均值 18.00 23.00 14.00 29.00
固定效应模型:处理固定因素所使用的模型。
随机因素:
①因素的a个水平是从水平总体中随机抽取的。 ②从随机因素的a个水平所得到的结论,可推广到该
因素的所有水平上。
随机效应模型:处理随机因素所使用的模型。
固定效应模型
xij i ij
i 1, 2, , a
j
1,
2,
,
n
其中αi是处理平均数与总平均数的离差,因这些离 差的正负值相抵,因此
均方(MSe)大小相当,F 值则接近1,各组均数间的差异没
有统计学意义;反之,如果存在处理效应,则处理变异不仅
包含随机误差,还有处理效应引起的变异
(
n
2 a
),此时F
值显著大于1,各组均数间的差异有统计学意义。故依据 F
值的大小可判断各组之间平均数有无显著差别。
固定效应模型
平方和的简易计算
a n
an
a
n
xij xi xi x
xi x
xij xi 0
i1 j1
i1
j1
处理项与随机误差项的交叉乘积和 = 0
SS SS SS 平方和
的分割
=
T 总平方和
+
A处理平方和
e误差平方和
方差分析应具备的条件
2、正态性(Normality):
ε: NID(0, σ2)应该是随机的、彼此独立的,服从正态 分布。 正态性不满足:但处理的误差趋向于处理平均数的 函数关系。例如,二项分布数据,平均数期望为φ ,方差期望为φ(1-φ)/n,方差与平均数有函数关系 。如果这种函数关系是已知的,则可对观察值进行 反正弦转换或对数转换、平方根值转换,从而使误 差转化成近似的正态分布。
Between Groups: 处理间 Within Groups: 处理内
AN OVA
df 4 20 24
Mean Square 32.935
.779
F 42.279
Sig. .000
F4,20=42.279,P≈0.000<0.01。因此,上述 5个小麦品系的株高差异极显著。
多重比较
当 对方 之差 间分 存析 在拒显绝著差H0异,,为须探对究各具处体理是平在均哪数些之组 间进行逐对比较,即多重比较(multiple comparison)— post-ANOVA analysis (Post Hoc test)。
i1 j1
i 1
i1 j1
固定效应模型
a
n
2
a
xij x n
a
xi x 2
n
2
xij xi
i1 j1
i 1
ຫໍສະໝຸດ Baidu
i1 j1
SS SS SS 平方和
的分割
=
T 总平方和
+
A处理平方和
e误差平方和
df 自由度
的分割
T
=
总自由度
an 1
df df A
+
处理自由度
e 误差自由度
a 1
an a
差异显著性(α=0.01) BC AB C A
结论:处理1、4,3、4,2、3之间差异极显著
MSA SSA /df A
处理均方
MSe SSe / dfe
误差均方
固定效应模型
单因素固定效应模型的方差分析表
处理效应对均方的贡献
固定效应模型
方差分析统计量:
Fdf A ,dfe
MS A MSe
若零假设成立,不存在处理效应,则组内变异和组间变异都
只反映随机误差( 2 )的大小,此时处理均方 ( MSA)和误差
第八章 单因素方差分析
Chapter 8: One-factor Analysis of Variance
(One-Way ANOVA)
当比较的平均值的数目K≥3时,不能直接应 用t测验或u测验的两两之间的假设测验方法
1、当有k个处理平均数时,将有 个CK2差数, 要对这诸多差数逐一进行检验,程序繁琐。 2、试验误差估计的精确度降低。 3、两两测验的方法会随着K的增加而大大增 加犯I型错误的概率。