单因素试验的方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对给定的检验水平 ,由 P F F r 1 ,n r
得H0 的拒绝域为:FFr1,nr F 单侧检验
思考:为什么此处只做单侧检验?
2. X1,X2,...Xr 相互独立,从而各子样也相互独立。
由于同一水平下重复试验的个体差异是随机误差, 所以设:
X iji ij,j 1 ,2 ,...n i,i 1 ,2 ,...r线性统计模型
其中 i j 为试验误差,相互独立且服从正态分布
即
ij ~N0,2 .
整个试验的均值
令
本例问题归结为检验假设 H0:1= 2= 3= 4 是否成立
.
单因素试验的方差分析
设 A 表示欲考察的因素,它的 r 个不同水平,对
应的指标视作 r 个总体 X1, X2,...Xr. 每个水平下,我
们作若干次重复试验:n1, n2,...nr.(可等重复也可不
等重复),同一水平的 n
个结果,就是这个总体
灯泡
寿命
1 2 3 4 5 678
灯丝
甲 1600 1610 1650 1680 1700 1720 1800
乙 1580 1640 1640 1700 1750
丙 1460 1550 1600 1620 1640 1740 1660 1820
丁 1510 1520 1530 . 1570 1680 1600
...
... ... ... ...
ni
ni
列和Ti Xij j 1
X1n1 X2n2 ... T 1 T 2 ...
列平均Xi Ti ni X 1 X2 ...
(水平组内平均值)
Xrnr
r
T r 总 和 T i i1
Xr
X
1 n
r i1
ni X i
(总平均值)
r
n 其中诸 i 可以不. 一样,n n i i1
2r
2
XiX ni ii
i 1j 1
i 1
组间平方和(系
如果H0 成立,则SSA 较小。 统离差平方和)
反映的是各水平平均值偏离总平均值的偏离程度。
其中
1 r ni
ni1 j1
ij,
ni
i ij . j1
r ni
2 r ni
2
SSE
X ijXi
iji
i 1j 1
i 1j 1
等价于检验假设: H 0: 12 ...r0 .
若H0成立,则 X ij ij,j 1 ,2 ,...n i,i 1 ,2 ,...r
r
考察统计量 SST
ni
2
Xij X
总离差平方和
i1 j1
经恒等变形,可分解为: SSTSSASSE 见书P168
其中
r ni
S S A
.
引言
在工农业生产和科研活动中,我们经常遇到这样 的问题:影响产品产量、质量的因素很多,例如影 响农作物的单位面积产量有品种、施肥种类、施肥 量等许多因素。我们要了解这些因素中哪些因素对 产量有显著影响,就要先做试验,然后对测试结果 进行分析,作出判断。方差分析就是分析测试结果 的一种方法。
.
基本概念
例:五个水稻品种单位产量的观测值——P165
品种 重复
A 1 A 2 A 3 A 4 A 5
1 2 3
3
x ij
j1
xi
41 33 38 37 31
39 37 35 39 34
40 35 35 38 34
53
1 2 01 0 51 0 81 1 49 9 xij 546 i 1 j 1
53
将
SST
2
,
பைடு நூலகம்
SSA
2
,
SSE
2
的自由度分别记作 dfT,dfA,dfE
则 FSSA dfA~Fr1,nr
SSE dfE
(记 S S Ad fA M S A ,S S Ed fE M S E ,称作均方和)
.
则 FSSA dfA~Fr1,nr M S A
SSE dfE
M SE
(记 S S Ad fA M S A ,S S Ed fE M S E ,称作均方和)
1 ni r1nii ,(其中
r
n ni )称为一般平均值。
i1
i i , 称为因素A的第 i个水平 Ai的效应。
r
r
r
显然有: nii nii niin0
i 1
i 1
i 1
则线性统计模型变成
X i j i i j,j 1 ,2 ,...n i,i 1 ,2 ,...r
于是检验假设: H 0:12...r
4 0 3 5 3 6 3 8 3 3 xij 1536.4 i1 j1
纵向个体间的差异称为随机误差(组内差异),由试验造
成;横向个体间的差异称为系统误差(组间差异),由因素的
不同水平造成。
.
单因素试验的方差分析的数学模型
首先,我们作如下假设:
1 .X i~ Ni, 2,i 1 ,2 ,...r具有方差齐性。
试验指标——试验结果。
可控因素——在影响试验结果的众多因素中,可人为 控制的因素。
水平——可控因素所处的各种各种不同的状态。每个 水平又称为试验的一个处理。
单因素试验——如果在一项试验中只有一个因素改变, 其它的可控因素不变,则该类试验称为 单因素试验。
.
引例
例1 (灯丝的配料方案优选)某灯泡厂用四种配料方案制成的灯 丝生产了四批灯泡,在每批灯泡中作随机抽样,测量其使用寿 命(单位:小时),数据如下:
i
X
i
的一个样本:Xi1, Xi2,...Xini .
因此, Xi1,Xi2,...Xini 相互独立,且与 X i 同分布。
我们的目的是通过试验数据来判断因素 A 的不 同水平对试验指标是否有影响。
.
单因素试验资料表
水平
重复 试验结果 A 1 A 2 ... A r
1
X11 X21 ... Xr1
引例
灯泡的使用寿命——试验指标
灯丝的配料方案——试验因素(唯一的一个)
四种配料方案(甲乙丙丁)——四个水平
因此,本例是一个四水平的单因素试验。
用X1,X2,X3,X4分别表示四种灯泡的使用寿命,即为 四个总体。假设X1,X2,X3,X4相互独立,且服从方差 相同的正态分布,即Xi~N(i,2)(i=1,2,3,4)
组内平方和
反映的是重复试验种随机误差的大小。误差平方和
这里
1 r ni
ni1 j1
ij,
ni
i ij
j1
i 表示水平Ai的随机误差; 表示整个试验的随机误差
.
若假设 H 0:a 1a 2...a r0成立,则
Xij ~N,2 (各子样同分布)
由P106定理5.1可推得:
S S 2 T~2 n 1 ,S S 2 A ~2 r 1 ,S S 2 E ~2 n r