协方差分析(三版)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

协方差分析的基本步骤
➢1.确定协变量(即未加以控制或难以控制 的因素)
➢2.检验条件是否满足 ➢3.建立因变量Y随协变量X变化的线性回归
关系 ➢4.利用回归关系把协变量X化为相等后再进
行各组Y的修正均数间比较的假设检验
完全随机设计资料的 协方差分析
表13-1 kn对观测值x、y的单向分组资料的 一般形式
• 例13-1 为研究某降血糖药物的有效性及其 合用盐酸二甲双胍片的有效性,选择收治 90名2型糖尿病患者,并采用随机对照试验 ,分为三个治疗组,第一组为该降糖药组 ,第二组为盐酸二甲双胍片组,第三组为 该降糖药+盐酸二甲双胍片组,每组30名患 者,治疗3个月,主要有效性指标为糖化血 红蛋白。测得每个患者入组前(X)和3个 月后(Y)的糖化血红蛋白含量(%), 试分析三种治疗降糖化血红蛋白的效果是 否不同。
估计误差
F (Y Yˆ )2 MS
总变异
35 508150.076 187349.144 75783.356
饲料间
2 383620.127 135607.964 48297.627
白鼠间 误差
11 87586.703 36638.307 19089.116 22 36943.246 15102.873 8399.613
三组大白鼠的进食量(X, g)与增重(Y, g)
区组
1 2 3 4 5 6 7 8 9 10 11 12
X
nj
j
(Y j )
A组
X1
Y1
256.9 27.0
271.6 41.7
210.2 25.0
300.1 52.0
262.2 14.5
304.4 48.8
272.4 48.0
248.2
9.5
242.8 37.0
(Y Yˆ)修2 正均数间
(Y
修正均数间
Yˆ)组2 内
MS修正均数间 MS组内
F
组内
组1
( X 0,Y 1 )
Y ( X 1,Y 1 )
(X2,Y2 )
ห้องสมุดไป่ตู้
(X0,Y2 )
组2
Y2 Y1 Y2 Y1
X1
X0
X2
二、应用条件
1.各组协变量X与因变量Y的关系是线性的, 即各样本回归系数b本身有统计学意义。
➢ 6、以修正均数及组内的估计误差平方和分别除以 相应的自由度得到修正均数及组内估计误差均方, 求F值
➢ 7、查F界值表得P值,做出统计推断
➢ 8、多重比较的q检验
例13-1
药物治疗是人为可控制的定性因素,称定性变量 初始糖化血红蛋白是难以控制的定量因素,称协变 量X 3月后的糖化血红蛋白是实验观察指标,称应变量Y
当有一个协变量时,称一元协方差分析; 当有两个或两个以上协变量时,称多元协方 差分析。
协方差分析是将线性回归与方差分析相结合
的一种分析方法。
把对反应变量Y有影响的因素X看作协变量,
建立Y对X的线性回归,利用回归关系把X值
化为相等,再进行各组Y的修正均数间比较。
修正均数是假设各协变量取值固定在其总
均数时的反应变量Y的均数。
8.5
6
9.9
8.5
8.2
7.1
9.8
7.5
7
10.6
8.3
8.8
7.8
10.1
8.3
8
10.4
8.1
10.0
7.9
10.3
8.2
...
...
...
...
...
...
...
25
9.4
7.6
10.3
9.6
10.0
7.4
26
9.2
8.0
9.8
8.1
10.3
8.2
27
10.5
8.8
10.5
9.9
9.9
7.6
表13-3 三组患者治疗前后的糖化血红蛋白含量(%)
第一组
第二组
第三组
X1
Y1
X2
Y2
X3
Y3
1
10.8
9.4
10.4
9.2
9.8
7.6
2
11.6
9.7
9.7
9.0
11.2
7.9
3
10.6
8.7
9.9
8.9
10.7
9.0
4
9.0
7.2
9.8
8.6
9.6
7.8
5
11.2
10.0
11.1
9.9
10.1
协方差分析步骤
1.H0:各总体糖化血红蛋白的修正均数相等 H1:各总体糖化血红蛋白的修正均数不全相等 α= 0.05
2.列表并计算初步结果
协方差分析计算表模式
离均差平方和及积和
估计误差
变异来源 ν
F
lXX
lXY
lYY
ν (Y Y )2 MS
总变异
组间变异
组内变异
修正均数
3.计算相应的校正数、总的、组间及组内的 离均差平方和、积和及自由度 (1)校正数 (2)总的离均差平方和、积和及自由度
2.各样本回归系数b间的差别无统计学意义, 即各回归直线平行。
3.各组残差呈正态分布。 4.各协变量均数间的差别不能太大,否则有
的修正均数在回归直线的外推延长线上。
➢要求:在进行协方差分析前,应先进行方 差齐性检验和回归系数的检验。
➢注意问题:如果不满足以上条件,建议进 行变量变换,符合上述条件后,再进行协方 差分析。
342.9 56.5
356.9 76.0
198.2
9.2
12
12
272.23 37.10
B组
X2
260.3 271.1 214.7 300.1 269.7 307.5 278.9 256.2 240.8 340.7 356.3 199.2
12
Y2
32.0 47.1 36.7 65.0 39.0 37.9 51.5 26.7 41.0 61.3 102.1 8.1
• 3、计算各处理组间的离均差平方和,积和及自由 度
• 4、列出协方差分析计算表填入上述结果,再由总 变异的及减去处理组相应各值,得到组内离均差平 方和及自由度
➢ 5、计算回归估计误差平方和 (Y Yˆ )2 及自由
度,其中总的及组内平方和分别按下式计算
(Y
Yˆ )2
lYY
l
2 XY
l XX
➢ 总的减去组内的平方和即为“修正均数”的平方 和
第十三章 协方差分析
协方差分析的意义
➢对试验进行统计控制 ➢对协方差组分进行估计
• 为了提高试验的精确性和准确性,对处理以外的一切条 件都需要采取有效措施严加控制,使它们在各处理间尽 量一致,这叫试验控制。但在有些情况下,即使作出很 大努力也难以使试验控制达到预期目的。
• 统计控制是试验控制的一种辅助手段。经过这种修 正,试验误差将减小,对试验处理效应估计更为准
12
274.62
45.70
C组
X3
544.7 481.2 418.9 556.6 394.5 426.6 416.1 549.9 580.5 608.3 559.6 371.9
12
Y3
160.3 96.1 114.6 134.8 76.3 72.8 99.4 133.7 147.0 165.8 169.8 54.3
4.修正均数的计算与假设检验
前面已得出 三组斜率相 同的结论, 故交互项不 需要再引入 到模型。
协变量假定均数
随机区组设计的协方差分析
例13-2 为研究A、B、C三种饲料对增加大白鼠体 重的影响,有人按随机区组设计将初始体重 相近的36只大白鼠分成12个区组,再将每个 区组的3只大白鼠随机分入A、B、C三种饲 料组,但在实验设计时未对大白鼠的进食量 加以限制。三组大白鼠的进食量(X)与所增 体重(Y)如下,问扣除进食量因素的影响后 ,三种饲料对增加大白鼠体重有无差别 ?
初始X与各组无交互作用可认为 各组回归直线平行,即初始X对糖化血 红蛋白的影响在各组间是相同的。 4.修正均数的计算与假设检验
考察三组的初始糖化血红蛋白是否相同?
SPSS软件计算
1.建立数据文件 2.绘制散点图与建立直线回归方程 3.回归直线平行性假定的检验
初始X与各组无交互作用可认为 各组回归直线平行,即初始X对糖化血 红蛋白的影响在各组间是相同的。
方法步骤
➢数据准备 ➢数据分布检验 ➢方差齐性检验 ➢电脑运算
具体步骤

1、计算各组
X j 、Yj
,平方和
X
2 j
、Y
2 j
,积和 X jYj
均数 X j Yj 及其合计项
• 2、利用合计项各数据计算校正数C1、C2、C3,以 及总变异的离均差平方和 lXX lYY ,积和 lXY 及自 由度
扣除区组的影响: 总变异-区组变异=处理变异+误差
1.H0:各总体增重的修正均数相等 H1:各总体增重的修正均数不全相等 =0.05
2.计算总的、饲料组间、大白鼠间、误差 项、饲料+误差项的 lXX、lYY、lXY与 自由度
随机区组设计资料的协方差分析
变异来源
离均差平方和及积和
lXX
lXY
lYY
A饲料
*
Y A 37.10 0.4088(272.23 346.42) 67.43
B饲料
*
Y B 45.70 0.4088(274.62 346.42) 75.05
C饲料
*
Y C 118.74 0.4088(492.40 346.42) 59.06
其实质是从Y的总离均差平方和 (Y Y)2 中
扣除协变量X对Y的回归平方和 (Y Y)2 ,
对残差平方和
(Y
Y)2
作进一步分解后再进
行方差分析。
Y
Y
(YY)
(Y Yˆ )
(Yˆ Y)
Y
X
残差平方和的分解
(Y Yˆ)总2 (Y Yˆ)修2 正均数间 (Y Yˆ)组2 内
总 修正均数间 组内
Y
* j
Yj
bc ( X
j
X)
7.修正均数间差别进行两两比较 – q 检验
*
*
Y A YB
q
S Y2 X n0
1
(a
组间l XX 1)组内l
XX
SPSS软件计算
1.建立数据文件 2.绘制散点图与建立直线回归方程 3.回归直线平行性假定的检验
初始X与各组无交互作用可认为 各组回归直线平行,即初始X对糖化血 红蛋白的影响在各组间是相同的。 4.修正均数的计算与假设检验
(3)组间离均差平方和、积和及自由度
4.计算总的、组内及修正均数的估计误差平方和、 自由度
5.列协方差分析表,查F界值表,P<0.01,拒 绝H0,接受H1,可以认为在扣除初始糖化血红蛋
白因素的影响后,三组患者的总体降糖均数有差 别。
6.计算公共回归系数bc及各组修正均数
bc
组 内l XY 组 内l XX
3.结论:
F=2.19<F0.05(2,21)=3.47 P>0.05 按=0.05水准不拒绝H0,还不能认为扣 除进食量因素的影响后,三种饲料对增 加大白鼠体重有差别。
4.计算公共回归系数与修正均数
bC
误 差l XY 误 差l XX
15102.873 36943.246
0.4088
*
Y j Y j bC ( X j X )
12
492.40 118.74
随机区组设计资料方差分析的变异分解
SS总 SS处理 SS区组 SS误差
总 处理 区组 误差
总变异=处理间变异+区组间变异+误差
随机区组设计资料协方差分析的变异 分解与此相同
反应变量Y (增重)均数
处理因素 (饲料)
协变量
区组
(进食量) (大白鼠)
扣除协变量影响: 用线性回归残差平方和表示
21 2225.36 105.97
饲料+误差 24 420563.373 150710.837 56697.240
23 2689.31
修正均数
2 463.95 231.98 2.19
总变异-白鼠间
(Y
Yˆ )2
l YY
l
2 XY
l XX
(Y Yˆ )2修正均数 (Y Yˆ )2饲料误差 (Y Yˆ )2误差
28
11.2
9.5
10.7
9.3
9.4
7.8
29
9.6
8.2
10.4
8.7
8.3
6.6
30
8.0
7.2
9.4
8.7
9.2
7.2
若不考虑初始糖化血红蛋白X对Y的影响
H0:μ1=μ2=μ3 H1:μ1、μ2、μ3不等或不全相等
α=0.05
结论:三种治疗组降糖化血红蛋白的效果不同。
如何在扣除或均衡这些不可控制因素的影 响后比较多组均数间的差别,应用协方差分 析。
确。若 y 的变异主要由x的不同造成(处理没有显著
效应),则各修正后的y 间将没有显著差异(但原y
间的差异可能是显著的)。若 y的变异除掉x不同的
影响外, 尚存在不同处理的显著效应,则可期望各
y间 将有显著差异 (但原y间差异可能是不显著的)。 此外,修正后的 y 和原y的大小次序也常不一致。
所以, 处理平均数的回归修正和修正平均数的显著 性检验,能够提高试验的准确性和精确性,从而更 真实地反映试验实际。这种将回归分析与方差分析 结合在一起,对试验数据进行分析的方法,叫做协 方差分析(analysis of covariance)。
数据输入原则:
一个变量占一列 一个观测对象占一行
SPSS软件计算
1.建立数据文件 2.绘制散点图与建立直线回归方程 3.回归直线平行性假定的检验
初始X与各组无交互作用可认为 各组回归直线平行,即初始X对糖化血 红蛋白的影响在各组间是相同的。 4.修正均数的计算与假设检验
SPSS软件计算
1.建立数据文件 2.绘制散点图与建立直线回归方程 3.回归直线平行性假定的检验
相关文档
最新文档