One-WayANOVA单因素方差分析

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

t x1 x2 2 MSe n
df an a
当差异显著时， x1 x2 t0.05
2 MSe n
LSD0.05
当差异不显著时，x1 x2 LSD0.05
多重比较- Duncan multiple range test
梯形列表法显示结果 *
**
多重比较的SPSS实现
例8.1：小麦株高与品系的关系研究-多重比较
F4,20,0.05＝2.87，F4,20,0.01＝4.43。F > F0.01， P<0.01。因此，上述5个小麦品系的株高差异极显著。
随机效应模型
xij i ij
i 1, 2, , a
j
1,
2,
,
n
其布中，处其理方效差应为αi为随2 机变量，服从μ=0的独立正态分在随机效应模型中，对单个αi的检验是无意义。若假
(by RA Fisher)
单因素方差分析的数据形式
X因素的a个不同水平（处理）
每个处理下 n 个重复
n
xi xij ,
j 1
xi
1 n
xi ,
i 1, 2,, a
a n
x
xij ,
i 1 j1
x
1 an
x
方差分析原理
线性统计模型：
xij i ij
i 1, 2, , a
SST
i1 j1
xij x
2
a i 1
n j1
xi2j
x2 na
a
SSA n
i1
xi x
2
1 n
a i 1
xi2
x2 na
C x2 na
减少计算误差利于编程
C称为校正项。误差平方和 SSe ＝ SST－SSA
H0 :1 2 ... a 0; H A :i 0(至少有一i) 方差分析表
第八章单因素方差分析
Chapter 8: One-factor Analysis of Variance
方差分析：从总体上判断多组数据平均数（K≥3）之间的差异是否显著
方差分析将全部数据看成是一个整体，分析构成变量的变异原因，进而计算不同变异来源的总体方差的估值。然后进行F测验，判断各样本的总体平均数是否有显著差异。若差异显著，再对平均数进行两两之间的比较。
n
i 0
i1
如有果一不个存α在i≠处0。理因效此应，，零各假αi设都为应：当等于0，否则至少 H0：α1＝α2＝ … ＝αa＝0
备择假设为：
HA：αi ≠ 0（至少有一个i）
固定效应模型
平方和与自由度的分解
an
2
an
2
xij x
xij xi xi x
i1 j1
i1 j1
Post Hoc Test
多重比较的SPSS实现
SPSS Duncan’s test output (1)
结果的解读：除品系1、2之间外，其它各品系间均存在显著差异。
多重比较的SPSS实现
SPSS Duncan’s test output (2)
结果的解读：除品系1、2及3、5之间外，其它各品系间均存在极显著差异。
设不存在处理效应，则αi的方差为零，即零假设为：
H0
:
2
0
备择假设为：
HA
:
2
0
随机效应模型
单因素随机效应模型的方差分析表
随机效应与固定效应的方差分析的比较 ①程序相同； ②获得数据的方式不同；假设不同；均方期望不同；适用范围不同。
方差分析应具备的条件
1、可加性(Addictivity)：各处理效应与误差效应是可加的。
a n
2
an
an
2
xij xi 2
xij xi xi x
xi x
i1 j1
i1 j1
i1 j1
an
a
n
xij xi xi x
xi x
xij xi 0
i1 j1
i1
j1
a
n
2
a
xij x n
a
xi x 2
n
2
xij xi
方差分析应具备的条件
3、方差齐性(Homogeneity)：
方差分析中的误差项方差是将各处理的误差合并而获得一个共同的误差方差，因此必须假定资料中有这样一个共同的方差σ2存在(Bartlett检验法)
如果各处理的误差方差不齐，则在假设测验中处理效应得不到正确的反映。
xij i ij , ij : (0, 2 )
j
1,
2,
,
n
模型中的xij是在第i次处理下的第j次观测值。μ是总
平均数。αi是对应于第i次处理的一个参数，称为第i次处理效应(treatment effect)。εij是随机误差，是服从N(0，σ2)的独立随机变量。
方差分析原理
固定因素：
①因素的a个水平是人为特意选择的。 ②方差分析所得结论只适用于所选定的a个水平。
单因素方差分析的SPSS实现
例8.1：小麦株高与品系的关系研究-单因素固定模型的方差分析
单因素方差分析的SPSS实现
SPSS one-way ANOVA output
株高
Between Groups Within Groups Total
Sum of Squares
131.740
15.580
147.320
如何进行多重比较？
逐对进行双样本的平均数差的t-检验？增大了犯I型错误的概率，不可取
多重比较
多重比较方法：
最小显著差数（LSD）检验 Student-Newman-Keuls（SNK）q检验 Duncan 检验 Dunnett t检验 Tukey 检验 …
多重比较
最小显著差数法（Fisher’s Least significant difference test， LSD）
是t检验的变形，在变异和自由度的计算上利用了整个样本信息，而不仅仅是所比较两组的信息。检验的敏感度最高，倾向于得出差异显著的结论，在比较时仍然存在放大1型错误的问题。
多重比较
最小显著差数法（LSD）
t x1 x2 , s x1 x2
s x1 x2
MSe
1 n1
1 n2
当 n1 时n2 ，
科学论文中多重比较实例
字母标记法显示结果
各平均数间，凡有一个相同标记字母的即为差异不显著，没有相同标记字母的即为差异显著。字母大写表示极显著水平(α=0.01)，小写表示显著水平(α=0.05)
试用字母标记法表示如下多重比较的结果：
C
B
A
处理 1 2 3 4
均值 18.00 23.00 14.00 29.00
固定效应模型：处理固定因素所使用的模型。
随机因素：
①因素的a个水平是从水平总体中随机抽取的。 ②从随机因素的a个水平所得到的结论，可推广到该
因素的所有水平上。
随机效应模型：处理随机因素所使用的模型。
固定效应模型
xij i ij
i 1, 2, , a
j
1,
2,
,
n
其中αi是处理平均数与总平均数的离差，因这些离差的正负值相抵，因此
均方(MSe)大小相当，F 值则接近1，各组均数间的差异没
有统计学意义；反之，如果存在处理效应，则处理变异不仅
包含随机误差，还有处理效应引起的变异
(
n
2 a
)，此时F
值显著大于1，各组均数间的差异有统计学意义。故依据 F
值的大小可判断各组之间平均数有无显著差别。
固定效应模型
平方和的简易计算
a n
an
a
n
xij xi xi x
xi x
xij xi 0
i1 j1
i1
j1
处理项与随机误差项的交叉乘积和 = 0
SS SS SS 平方和
的分割
=
T 总平方和
+
A处理平方和
e误差平方和
方差分析应具备的条件
2、正态性(Normality)：
ε: NID(0, σ2)应该是随机的、彼此独立的,服从正态分布。正态性不满足：但处理的误差趋向于处理平均数的函数关系。例如，二项分布数据，平均数期望为φ ，方差期望为φ(1-φ)/n，方差与平均数有函数关系。如果这种函数关系是已知的，则可对观察值进行反正弦转换或对数转换、平方根值转换，从而使误差转化成近似的正态分布。
Between Groups: 处理间 Within Groups: 处理内
AN OVA
df 4 20 24
Mean Square 32.935
.779
F 42.279
Sig. .000
F4,20＝42.279，P≈0.000<0.01。因此，上述 5个小麦品系的株高差异极显著。
多重比较
当对方之差间分存析在拒显绝著差H0异，，为须探对究各具处体理是平在均哪数些之组间进行逐对比较，即多重比较（multiple comparison）— post-ANOVA analysis (Post Hoc test)。
i1 j1
i 1
i1 j1
固定效应模型
a
n
2
a
xij x n
a
xi x 2
n
2
xij xi
i1 j1
i 1
ຫໍສະໝຸດ Baidu
i1 j1
SS SS SS 平方和
的分割
=
T 总平方和
+
A处理平方和
e误差平方和
df 自由度
的分割
T
=
总自由度
an 1
df df A
+
处理自由度
e 误差自由度
a 1
an a
差异显著性（α=0.01) BC AB C A
结论：处理1、4，3、4，2、3之间差异极显著
MSA SSA /df A
处理均方
MSe SSe / dfe
误差均方
固定效应模型
单因素固定效应模型的方差分析表
处理效应对均方的贡献
固定效应模型
方差分析统计量：
Fdf A ,dfe
MS A MSe
若零假设成立，不存在处理效应，则组内变异和组间变异都
只反映随机误差( 2 )的大小，此时处理均方 ( MSA)和误差
第八章单因素方差分析
Chapter 8: One-factor Analysis of Variance
(One-Way ANOVA)
当比较的平均值的数目K≥3时，不能直接应用t测验或u测验的两两之间的假设测验方法
1、当有k个处理平均数时，将有个CK2差数，要对这诸多差数逐一进行检验，程序繁琐。 2、试验误差估计的精确度降低。 3、两两测验的方法会随着K的增加而大大增加犯I型错误的概率。