第八章 单因素方差分析(1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 xi xi n
1 x x an
x xij
i 1 j 1
a
n
注意:“ ”表示对一个下标的求 和。
2. 描述 xij 的数学模型
xij可表示成 xij i ij
其中,为全体试验值的总体平 均数,
i为第i个处理的效应,表示处 理i对试验结果产生的影响 。

„ „ „ „

a xa1 xa2 xa3

x11 X12 X13

x1j

x2j



xij


xaj

n 组总和 组平均数
x1n x1.
x2n x2.
„ „ „
xin xi.
„ „ „
Xan xa. x..
x1. x 2 .
xi.
xa.
x..
几个常用符合说明:
xi xij
j 1
n
A2 27 24 21 26
98
处理 A3 31 28 25 30
114
A4 32 33 33 28
126
A5 21 22 16 21
80
x 526
解:这是一个单因素实 验资料,处理数 a 5,重复数n 4。
平方和和自由度的计算 如下:
x 5262 校正数 C = 13833 .8 an 5 4
第八章 单因素方差分析 (One-factor ANOVA)
ANOVA: Analysis of Variance
如何进行关于两样本的 平均数差异的假设检验 ,如H0:1=2?
答:常采用第五章里讲 的t检验法。
现在,如何进行a 个样本的平均数差异的 假设检验( a 3)?
某人答:两两进行 t检验。
a
所以,自由度 df A a 1 处理的数目- 1
误差平方和SSe ( xij xi ) 2的自由度,记为 dfe
i 1 j 1 a n
i 1

计算该量时,需要 xij xi共an个量,
但受到a个条件的约束 ( xij xi ) 0 (i 1,2,, a)。
第一节 方差分析的基本原理和步骤
方差分析虽然有很多类型,但其基本原理与步 骤是相同的 本节结合单因素试验设计资料的方差分析介 绍其原理和步骤
1.单因素方差分析的典型数据及其符号
例如:5个小麦品系株高的调查资料
株号 I 1 2 3 4 5 组总和 xi 组平均数 xi
64.6 65.3
品 II
例一,有一水稻施肥的 盆栽试验,设置了 5个处理:A1和A2分别施用 两种不同工艺流程的氨 水,A3施碳酸氢氨, A4施尿素,A5不施氮肥。 每个处理各4盆,共有5 4=20盆,随机置于同一盆栽 场,其稻谷产量 如下表。试求各平方和 ,自由度和均方。
A1 24 产 30 量 28 26
合 计 108
64.5 65.3
系 IV
71.8 72.1
III
67.8 66.3
V 69.2
68.2
64.8
66.0 65.8 326.5 65.3
64.6
63.7 63.9 322.0 64.4
67.1
66.8 68.5 336.5 67.3
70.0
69.1 71.0 354.0 70.8
69.8
68.3 67.5 343.0 68.6
a
a
n
n ( xi x ) 2[(xi x ) ( xij xi )] ( xij xi ) 2
2 i 1 i 1 j 1 i 1 j 1
a
n
a
n
j 1
( xij xi ) 0
n

n ( xi x ) ( xij xi )
譬如,调查不同品种小麦的产量。产量数据之间的变异 可分解为由不同品种引起的变异和由随机误差引起的变 异。
方差分析的基本思路:
(1)将数据的总变异分解为不同处理引起的变异和随机 误差引起的变异
Baidu Nhomakorabea
(2)通过F检验,比较不同处理引起的变异和随机误 差引起的变异的相对大小:
• 如果不同处理引起的变异明显比随机误差引起 的变异大,则说明不同处理确实有显著差异 • 如果不同处理引起的变异明显不比随机误差引 起的变异大,则说明不同处理没有显著差异
证明: ( xij x )
i 1 j 1
n
2
[(xi x ) ( xij xi )]2
i 1 j 1
a
n
[(xi x ) 2 2( xi x )(xij xi ) ( xij xi ) 2 ]
i 1 j 1
如果MSA比MSe明显的大,就可以认为 各i 不可能全为 0。
E(MSe ) 2的证明:
a n SSe 1 2 E ( MSe ) E E [ ( x x ) ] ij i df an a i 1 j 1 e
a n 1 E[ ( i ij ( i i ))2 ] an a i 1 j 1
2 i 1 i 1 j 1
a
a
n
2
平方和的简易求法
SST xij C
2 i 1 j 1
a
n
1 2 SSA xi C n i 1
a
SSe SST SSA
x 其中,C , 称为校正数 an
2
4.自由度的确定及均方的计算
每个平方和都有一个自由度 自由度确定的经验规则:自由度是计算该平方和时可以 自由变化的量的数目
原因(3)检验统计量的精确性低
t 检验的统计量是 x1 x2
2 (n1 1) s12 (n2 1) s2 n1 n2 2
1 1 n n 2 1
这部分是对原始数据方 差 2的估计,它只用了两个 样本的数值。
但我们有a个样本,没有被全部同 时的利用来估计 2。 所以,我们认为对 2的估计有待改善。
2 总平方和 SST xij C 242+302++212-C 14326 13833 .8 402.2 i 1 j 1 a n
2
dfT an 1 19
1 a 2 1 处理平方和 SSA xi C [1082 982 1142 1262 802 ] C n i 1 4 14135 13833 .8 301.2 df A a 1 4
因此,两两 t检验的精确性有待提高 。
正确答案:
进行关于a(a 3)个样本平均数差异的假 设检验, 应使用一种更为合理的 统计分析方法-方差分 析。
方差分析的定义:将试验数据的总变异分解 成不同来源的变异,从而评定不同来源的 变异的相对重要性的一种统计方法。
数据间总变异=不同处理引起的变异+随机误差引起的变异
自由度的准确意义是对平方和进行归一化时需要的一个参数,是我 们构造假设检验所用统计量的一个组成部分
总平方和SST ( xij x ) 2的自由度,记为 dfT
i 1 j 1
a
n
计算该量时,需要 an个离均差xij x ,
每个离均差可以自由变 化,但受到 ( xij x ) 0这一条件的约束。
a n
所以,自由度 dfT an 1 资料中所有观测值的数 目- 1

i 1 j 1
处理平方和SSA n ( xi x ) 2的自由度,记为 df A
i 1
a
计算该量时,需要 xi x共a个量,
但受到 ( xi x ) 0这一条件的约束。
模型等同于:
xij i ij
总变异 不同处理引 起的变异 误差引起 的变异
方差分析的目的是分析 不同处理引起的变异是 否显著, 从而得出不同处理是否 有显著差异。
方差分析检验的假设为
H 0 : 1 2 a H A : 不是所有的 i都相等
即,
H 0 : 1 2 a 0 H A : 不是所有的 i都等于0
a 2时,H0只有一个,即 1=2
a 3时,H0有3个,即1=2,2=3,1=3
a 5时,H0有10个,即1=2,2=3, , 4=5
a 2时只作一次假设检验, H0被接受的概率为 1 =0.95
I 型错误( H0为真时,但却被我们否 定)= 1 -0.95 0.05
如果我们只研究这 a个不同处理,则有 i 0, 且每个 i是常数。
i 1 a
i i为第i个处理的平均数。
ij是xij的试验的随机误差(也 称为噪声)。
我们假定 ij相互独立且服从正态分 布N (0, 2 )。
固定效应模型
因此,方差分析假定 xij~N ( i , 2 ),这是方差分析的条件。
评论:这种方法是不行 的。
主要原因有三:
原因(1):检验的工作量大
a(a 1) 当有 a个样本平均数,两两组 合,就有 个平均数的差。 2
例如, a 10时,就有 10 9 =45个平均数的差。 2
换句话说,采用两两 t检验法,要进行 45次t检验,程序太繁琐。
原因(2):检验的I 型错误增大,从而检验 的可靠性低
误差均方MSe SSe 101 6.73 dfe 15
5.均方期望与统计量F
方差分析中所使用的统 计量是根据均方的期望 所构造的。
回顾一下:方差分析的 模型为
xij i ij ,
ij ~ N (0, 2 )
待检验的假设为 H 0:1= 2== a 0 H A : 至少有一个 i 不等于0
误差平方和 SSe SST SSA 402.2 301.2 101 dfe dfT dfA 19 4 15
所以,总均方 MST SST 402.2 21.17 dfT 19
SSA 301.2 处理均方MS A 75.30 df A 4
称为总平方和, 记为 SST
称为处理平方 和,记为 SSA
总平方和SST=处理平方和SSA+误差平方和SSe
2 即, ( x x ) n ( x x ) ( x x ) ij i ij i 2 i 1 j 1
a
a
n
2
a
a
n
i 1
i 1 j 1
3.平方和的分解及其计算 xij i ij
总变异
不同处理引 起的变异
随机误差引 起的变异
如何定量地衡 量这些变异?
2
( x
i 1 j 1
a
n
2
ij
x )
n ( xi x )
i 1
a
2
( x
i 1 j 1
a
n
ij
xi )
称为误差平方 和,记为 SSe
可以证明:E ( MSe ) 2 n a 2 E (MS A ) + i a 1 i 1
2
1 a 2 i , a 1 i 1 常称为处理效应
2
因此,通过比较 MSe与MS A的大小就可以反映出 i的大小。
如果MS A与MSe 相差不大,就可以认为 各i与0的差异不大;
j 1 n
所以,自由度 dfe an a dfT df A

各平方和除以相应的自 由度便得到总均方,处 理均方,和误差均方,
分别记为 MST , MS A , MSe , 即
SST MST dfT
SSA MS A df A
SSe MSe dfe
* 注意:MST MSA MSe
3 a 3时作3次检验, H0被接受的概率为( 1 ) =0.953=0.8574
I 型错误= 1 -0.8574 0.1426
10 a 5时作 10次检验, H0被接受的概率为( 1 ) =0.9510=0.5987
I 型错误= 1 -0.5987 0.4013
通过以上分析,随着 a的增大,检验的 I 型错误的概率 大大增大,这样的检验 是不可靠的。
x =1682
单因素:品种;
单因素的5个水平(也称处理):I, II, III, IV, V。 每个水平设置了5个重复
推广到一般情况,a个处理的单因素方差分析数据
重复数(j) 1 1 2 3
┇ j ┇
处理(组别) (i=1,2,...,a) 2 x21 x22 x23

„ „ „ „

i xi1 xi2 xi3
相关文档
最新文档