第八章协方差分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3、根据线性回归关系计算各肥料的矫正 平均单株产量 矫正平均单株产量计算公式如下:
yi yi be ( xi x) 其中:yi 为第i处理矫正单株平均产量;
yi 为第i处理实际单株平均产量;
xi 为第i处理实际平均起始干周; x 为全试验的平均数;
be 为误差回归系数。
产量将平均改变0.7359 kg。
对be进行显著性检验如下:
无效假设 H 0 : e 0, 回归平方和
备择假设 H A : e 0
SSeR
SPe 2 646.82 475.993 SSex 878.9
回归自由度
df eR 1
离回归平方和
SSer SSey SSeR 1951.000 475.993 1475.007
dft dfT dfe =k-1=4-1=3
2、对矫正单株产量进行方差分析 表9-4 矫正单株产量的方差分析表
变异来源 df SS MS F值
肥料间
肥料内 (误差) 总变异
3
35 38
2507.777
1475.007 3982.784
835.926
42.143
19.835**
F=19.835>F0.01(3,35),p<0.01,不同肥料 的矫正单株产量间存在极显著的差异,须进一 步进行多重比较。
如果那些不能很好地进行试验控制的因素 是可量测的,且又和试验结果之间存在直线回 归关系,就可利用这种直线回归关系将各处理 的观测值都矫正到初始条件相同时的结果,使 得处理间的比较能在相同基础上进行,而得出 正确结论。这一做法在统计上称为统计控制。 这时所进行的协方差分析是将回归分析和 方差分析结合起来的一种统计分析方法,这种 协方差分析称为回归模型的协方差分析。
yij be ( xij xm ) 或 若令 yij
yij e ( xij x ) yij
,则
(9-5)式或(9-8)式说明,在对观测值进行回归
进行方差分析就排出了xij不 矫正后, 对 yij
一致对yij的影响。
(二)计算变量x和y的各项自由度、平方和 与乘积和
y4 be ( x4 x) y4 54.5 0.7359 (24.0 23.675) 54.261
4、各肥料矫正单株平均产量间的多重比较 (1)t检验法
表9-2、 表9-1资料的自由度、平方和与乘积和 变异来源 df SSx 17.875 878.9 896.775 SSy SP
3 肥料间 肥料内(误差) 36 39 总变异
2610.9 73.85 1951.0 646.8 4561.9 720.65
乘积和计算如下
总乘积和
SP T xy ( x)( y ) nk
离回归自由度
df er =k (n 1) 1 4 (10 1) 1 35 SSe R 475.993 F 11.29 F0.01(1,35) 7.42 SSer / df 1475.000 / 35
故接受H A:e 0;即y与x有极显著的直线回归关 系。
y1 be ( x1 x) y1 75.5 0.7359 (24.6 23.675) 74.819
y2 be ( x2 x) y2 67.4 0.7359 (22.9 23.675) 67.970
y3 be ( x3 x) y3 55.8 0.7359 (23.2 23.675) 56.150
28 64 28 55 32 52
27 81 33 62 23 58
27 73 26 58 27 64
24 67 22 58 23 62
25 77 23 66 27 54
23 67 20 55 28 54
20 64 22 60 20 55
18 65 23 71 24 44
17 59 18 55 19 51
(五)对矫正后的单株产量作方差分析 1、求矫正后的单株产量的各项平方和及 自由度
统计学已证明,矫正单株产量的总平方和与自由 度,等于其相应变异项的离回归平方和与自由度,记 为SST’、dfT’:
2 SP SSTy SS Ry SSTy T SST SSTx
720.6502 4561.900 3982.784 896.775
F检验结果可以接受; 若x与y之间有显著的
回归关系,即x对y有显著影响, 则需对y矫正
后再进行的F检验,才能获得正确结论。
(四)计算回归系数并进行显著性检验 回归系数由误差项的统计数计算。
SPe 646.800 be 0.7359 SSex 878.900
be=0.7359表示起始干周改变1cm,单株
yij ym ti be ( xij xm ) eij yij ti ( ym be xm ) be xij eij yij be ( xij xm ) ym ti eij
(9-4) (9-5)
若将yij用样本统计量来表示,则有:
(9-6) (9-7) (9-8)
F
临界 F值
5.984 0.244 2610.9
总变异
39 896.775
16.059** F0.05= 2.86 1951.0 54.194 F0.01= 4.38 4561.9
F检验结果表明,4种肥料的供试梨树起 始干周差异不显著,单株产量差异极显著。 这里对y进行的F检验是在没有考虑x的 影响下进行的, 若x与y之间没有显著的回归 关系,即x对y没有显著影响,上面对y进行的
947 2562 (36 89 30 80 17 51) 10 4 720.650
肥料间乘积和
( xi )( yi ) 1 SPt xi yi n nk 1 947 2562 (246 755 229 674 232 588 240 545) 10 10 4 73.850
误差乘积和
SPe SPT SPt 720.650 73.850 646.800
(三)对x和y作方差分析
表9-3、起始干周x和单株产量y的方差分析表
变异 来源 肥料间 肥料内
(误差)
df SS 3 36 17.875 878.9
x变量 MS
24.414
y变量 F SS MS
870.3
ቤተ መጻሕፍቲ ባይዱ
ij
为 随 机 误 差 、相 互 独 立 、且 都 服 从
N(0,σ2)。
(9-3)式就是单因素完全随机设计试验资 料协方差分析的数学模型。 由(9-3)式移项可得
yij i ( y e x ) e xij ij yij e ( xij x ) y i ij
(二)估计协方差分量
在协方差分析中,根据均积MP与期望均 积EMP间的关系,可获得不同变异来源的协 方差分量估计值。 这种协方差分析称为相关模型的协方差 分析。
第二节 单因素完全随机设计试验资料 的协方差分析
【例9·1】 为研究A1、A2、A3、A4 4种不 同肥料(k=4)对梨树单株产量的影响, 选择 40株梨树作试验, 把40株梨树完全随机分为4 组,每组包含10株梨树(n=10),每组施用1种肥 料。各株梨树的起始干周(x,cm)和单株产量 (y, kg)列于表9—1, 试检验4种肥料的单 株产量是否有显著差异。
对于具有n对观测值的样本,x与y的样
本协方差COV(x, y)定义为双变量离均差
乘积和与自由度的商,即:
1 COV ( x, y ) ( x x )( y y ) n 1
(9-2)
样本协方差亦称为均积, 简记为MP, 是总体协方差的估计值。 方差 是用来度量单个变量 “ 自身变 异”大小的总体参数,方差越大,该变量的 变异越大; 协方差是用来度量两个变量之间 “协 同变异”大小的总体参数,即二个变量相互 影响大小的参数,协方差的绝对值越大,二 个变量相互影响越大。
第八章 协方差分析
第一节 协方差分析的意义 和作用
一、协方差分析的意义
协方差 是两个变量的协变异数 ,用 COV(x,y)表示。
对于一个具有N对(x,y)的有限总体, x与y的协方差定义为双变量离均差乘积和 的平均数,即:
1 COV ( x, y ) ( x x )( y y ) (9-1) N
二、协方差分析的作用
(一)对试验进行统计控制 要提高试验结果的正确性,必须严格控制试验 条件的均匀性,使各处理处于尽可能一致的试验条 件下,这一做法在统计上叫做试验控制。
但试验控制有时不一定能实施。例如,研究棉 花的蕾铃脱落率要求各处理的单株有相同蕾铃数, 研究不同肥料对梨树的单株产量的影响要求各株梨 树起始干周完全相同等,都不易达到。在这些情况 下,要消除起始条件不等对试验结果的影响,提高 试验结果分析的正确性,就应采用协方差分析。
(9-3)
其中
μx和μy和分别是x和y的总体平均数;
i
e
为第i个处理效应(固定效应);
为各组 y 依 x 的总体回归系数
e1 e2 ek 成立);
ei (i 1,2,, k )
的
加权平均数(假定
e ( xij x )
为由于 xij 偏离μx所引起的y的变异部分;
表9—1 梨树4种肥料比较试验的起始干周 (x,cm)与单株产量(y,kg)
肥 变 料 量 A1 A2 A3 A4
x1 j y1 j x2 j y2 j x3 j y3 j x4 j y4 j
观
测
值
总 和 246 755
平 均 24.6 75.5
36 30 26 23 26 30 20 19 20 16 89 80 74 80 85 68 73 68 80 58
对于仅涉及单个变量的试验资料,由于其 总变异仅为“自身变异”(如单因素完全随机 设计试验资料,“自身变异”是指由处理和随 机误差所引起的变异),因而可以用方差分析 法进行分析; 对于涉及两个变量的试验资料,由于每个 变量的总变异既包含了“自身变异”又包含了 “协同变异”(是指由另一个变量所引起的变 异),须采用协方差分析法来进行分析,才能 得到正确结论。
20 57 17 48 17 51
229 674 232 588 240 545 947
22.9 67.4 23.2 58.8 24.0 54.5 23.675
试验用4种肥料分别施10株梨树,各组
的单株产量 y 既包含了不同肥料所引起的
“自身变异”,也包含了不同的起始干周x
所引起的 “协同变异”,因此应采用协方
dfT dfTy dfRy 39 1 38
矫正单株产量的误差平方和与自由度,即 误差离回归平方和与自由度,记为SSe’、dfe’
SSer 1475.007 SSe
dfe dfer 35
矫正单株产量处理间平方和与自由度,记 为SSt’、dft’
SSe SSt SST =3982.784-1475.007=2507.777
其中,ym、xm、ti、be、eij 分别是 y、 x、 i、e、 ij的估计值
若令 Yij yij i 或 Yij yij ti ,则(9-4)式或(97)式说明,在观测值中剔除处理效应后,即误
差项,进行 Yij 与 xij 的线性回归分析,可求出e
的估计值be;
差分析法将“协同变异”从 y 的总变异中
剔除,获得y的“自身变异”,然后才能正
确地检验4种肥料平均单株产量是否有显著
差异。
(一)试验资料的数学模型
表9—1中观测值不仅具有肥料效应和随 机误差,而且还受到起始干周的影响。故单因 素完全随机设计试验资料观测值的数据结构式 为:
yij y i e ( xij x ) ij (i 1, 2,, k ; j 1, 2,, n)