协方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
27
⑷对修正均数间的差别进行假设检验 ①两修正均数间的比较可用t检验或方差分析; ②多个修正均数间的比较可用方差分析。
F
SS修正 / 修正 SS残差 / 残差
28
SPSS操作步骤:
29
30
Tests of Between-Subjects Effects Dep endent Variable: 胆 固醇 Source Corrected Model Intercept 年龄 组别 Error Total Corrected Total Type III Sum of Squares 32.916a 4.440 14.301 4.405 31.126 980.940 64.042 df 2 1 1 1 23 26 25 Mean Square 16.458 4.440 14.301 4.405 1.353 F 12.161 3.281 10.567 3.255 Sig . .000 .083 .004 .084
37
协方差分析结果
38
表13-3 三种饲料喂养猪的初始重量与增重(单位:kg) 编号
1
2 3 4 5 6 7 A饲料 X1 Y1 B饲料 X2 Y2 X3 C饲料 Y3
15
13 11 12 12 16 14
85
83 65 76 80 91 84
17
16 18 18 21 22 19
97
90 100 95 103 106 99
2
3
在科研中,实验效应除了受到处理因 素的作用外,尚受到许多非处理因素的影 响。如在研究临床疗效时,疗效的好坏不 仅与治疗措施有关,还受病人的年龄、性 别、病情、心理、环境、社会等因素的影 响。
4
药物临床疗效研究
患者的状况(性别、年龄
混杂因 素
药物
疗效
病情
举 例
心 理 因 素
其他因 素
5
各组间的效应进行比较,必须保持组间的 影响因素(混杂因素的比例)相同,组间 才具有可比性。
协方差分析
1Leabharlann Baidu
研究体重与胆固醇水平的关系
正常组 (n1=13) 年龄(x1) 胆固醇(y1) 48 3.5 33 4.6 51 5.8 43 5.8 44 4.9 43 8.7 49 3.6 42 5.5 40 4.9 47 5.1 41 4.1 41 4.6 56 5.1 超重组(n2=13) 年龄(x2) 胆固醇(y2) 58 7.3 41 4.7 71 8.4 76 8.8 49 5.1 33 4.9 54 6.7 65 6.4 39 6.0 52 7.5 45 6.4 58 6.8 67 9.2
20
21
⑴是否需进行协方差分析。有无协变量(相关分 析)且协变量组间差异(t检验)有无统计学意义。
由于正常体重者和超重者平均年龄不一样(分 别为44.46和54.46),而且根据专业知识得知年龄 与血清胆固醇含量有关,年龄越大血清胆固醇含量 越高。因此不宜直接比较这两组人平均血清胆固醇 含量(分别是5.092,6.785)是否相同,而应以年 龄作为协变量,进行协方差分析。
C饲料
22 24 20 23 25 27
7 8
14 17
19 18
30 32
35
各组初始体重不同(F=32.668,P=0.000)
初始体重与增重有高度 相关,r=0.796,P=0.000
结论:需进行协方差分析
36
能否进行协方差分析?
各回归系数不 为零
各回归直线基 本平衡 结论:基本可以做协方差分析
总变异
组间变异 组内变异
23
2 21
2555.958
1317.583 1238.375 658.792 58.970 11.17 <0.01
34
考察三组猪的初始重量是否相同?
三种饲料喂养猪的初始重量(单位:kg)
A饲料
1 2 3 4 5 6 15 13 11 12 12 16
B饲料
17 16 18 18 21 22
18
协方差分析的基本方法(结合例1说明) 某医生欲了解成年人正常体重者与超 重者血清胆固醇含量是否不同,而胆固醇 含量与年龄有关,资料见表1。
19
研究体重与胆固醇水平的关系
正常组 (n1=13) 年龄(x1) 胆固醇(y1) 48 3.5 33 4.6 51 5.8 43 5.8 44 4.9 43 8.7 49 3.6 42 5.5 40 4.9 47 5.1 41 4.1 41 4.6 56 5.1 超重组(n2=13) 年龄(x2) 胆固醇(y2) 58 7.3 41 4.7 71 8.4 76 8.8 49 5.1 33 4.9 54 6.7 65 6.4 39 6.0 52 7.5 45 6.4 58 6.8 67 9.2
a. R Squared = .514 (Adjusted R Sq uared = .472)
组别 Dep endent V ariable: 胆 固 醇 组别 正常组 超重组 Mean 5.475a 6.402a Std. Error .343 .343 95% Confidence Interval Lower Bound Upper Bound 4.765 6.186 5.691 7.112
_ _
_
_
a y bx
(l xy )1 (l xy ) 2 组内的lxy bc 或bc 组内的l xx (l xx )1 (l xx ) 2 本例组内l xy 258.8923 , 组内的l xx 2749.2308 258.8923 则bc 0.09417 2749.2308
13
协方差分析的应用条件 ⑴各比较组协变量X与分析指标Y存在线性 关系(按直线回归分析方法进行判断)。 ⑵各比较组的总体回归系数βi相等,即各直 线平行(绘出回归直线,看是否平行)。
14
回归分析结果:
正常组没有回归关系(P=0.907)
15
两条回归直线不平行
结论:本资料 不宜做协方差 分析
16
不满足条件时的处理方法 X与Y不满足线性关系时,通常情况下是 对X或Y或两者作适当的变量变换,使之符 合线性关系。
年龄和胆固醇取对数后,仍不满足要求
17
协方差分析适用的资料 协方差分析可用于: 完全随机设计、配伍设计、拉丁方设计、析 因设计等资料; 协变量X可以仅有一个,称一元协方差分析; 协变量也可以有多个,称多元协方差分析。
如果: x1 x 2 或胆固醇含量与年龄无 直线关系,即:bc 0
' ˆ1 y
' ˆ2 y
y
1 y2
(两样本均数比较)
26
本例
y y ˆ1 ˆ 2 =(5.0923-6.7846)-0.09417
(46-54.4615)=-0.8955。 修正均数之差(0.8955)小于原均数之 差(1.6923),说明协变量对原均数确有影响。
饲料对猪的催肥效果是否相同?
32
研究三种饲料对猪的催肥效果
表13-3 三种饲料喂养猪的初始重量与增重(单位:kg) 编号
1
2 3 4 5 6 A饲料 B饲料 C饲料
X1 15
13 11 12 12 16
Y1 85
83 65 76 80 91
X2 17
16 18 18 21 22
Y2 97
90 100 95 103 106
24
⑶进行协方差分析。
为扣除年龄对胆固醇比较的影响,令X=X 求得修正的平均胆固醇值,即Y1,Y2。
' ˆ1 y ' ˆ2 y
y1 bc x x1 y2 bc x x2
25
两条回归线之差(两个修正均数之差):
' ˆ1 y
' ˆ2 y
y
1
y2 bc x1 x2
22
⑵能否做协方差分析。回归系数是否不为 零;两条回归直线是否平行 若胆固醇含量与年龄的线性关系在正 常组和超重组均成立且总体回归系数相等, 即β1≠0,β2≠0,β1=β2=βc,则两条 回归直线平行。回归方程分别是:
23
Y 1 Y1 b1 ( X 1 X 1 ) Y 2 Y2 b2 ( X 2 X 2 )
11
协方差分析的基本思想: y k 的假 在作两组或多组均数 y1,y 2 …, 设检验前,用线性回归分析方法找出协变 量X与各组Y之间的数量关系,求得在假定X 相等时修定均数 … ,然后用方 y, y2 y1 , k 差分析比较修正均数间的差别,这就是协 方差分析的基本思想。
12
协方差分析的应用条件 ⑴要求各组资料都来自正态总体,且各组的方 差相等;(t检验或方差分析的条件) ⑵各组的总体回归系数β i相等,且都不等于0 (回归方程检验)。 因此,应用协方差分析前,要对资料进行 方差齐性检验和回归系数的假设检验,只有满 足上述两个条件之后才能应用,否则不宜使用。
处理因素
T + S1
混杂因素
e + s1
(实验组)
-
T
S2
e
s2
(对照组)
(在设计阶段控制混杂因素的方法)
6
在混杂因素中,有些是难以完全控制的, 如停经天数,酒精消耗量,饲料的进食量; 有些是可以控制的,如年龄,动物的初始体 重。 可以控制的混杂因素:最好在设计阶段(也可 在分析阶段)进行控制。 难以控制的混杂因素:在分析阶段进行控制。
7
常见的实例
(1)比较正常妊娠妇女与患葡萄胎的妇女 血中胎盘生乳素(hpl)含量的差别,以了 解葡萄胎对胎盘功能的影响,这时停经天 数就是一个混杂因素,因为停经天数对hpl 有直接影响 。
8
常见的实例
(2)比较不同HbsAg携带率与肝硬化率的 关系时,酒精消耗量是混杂因素。 (3)比较两种药物治疗高血压的疗效,年 龄是一个混杂因素。 (4)研究不同饲料对动物增加体重的作用 时,动物的初始体重、进食量等因素。 (5)… …
X3 22
24 20 23 25 27
Y3 89
91 83 95 100 102
7 8
14 17
84 90
19 18
99 94
30 32
105 110
33
均值
13.750 81.750
18.625 98.000
25.375 96.875
完全随机设计类型的方差分析
方差分析表
变异来源 自由度 SS MS F P
a. Covariates appearing in the model are evaluated at the following values : 年 龄 = 49.46.
31
例2
为研究A、B、C三种饲料对猪的催肥效
果,用每种饲料喂养8头猪一段时间,测得每头
猪的初始重量(X)和增重(Y)。试分析三种
9
在分析阶段控制混杂因素的方法:
1、采用分层分析:如把年龄分组,再比较 同一年龄组的正常体重与超重组有无差别。 (适用:计量、计数资料)
2、率的标准化(适用:计数资料) 3、协方差分析(适用:计量资料) 4、多因素分析(适用:计量、计数资料)
10
协方差分析
将线性回归与方差分析结合起来,检 验两组或多组修正均数间有无差异的一种 统计方法,用于消除混杂因素对分析指标 的影响。 协变量:在进行协方差分析时,混杂因素 统称为协变量。
22
24 20 23 25 27 30
89
91 83 95 100 102 105
8
17
90
18
94
32
110
39
均值
13.750 81.750
18.625 98.000
25.375 96.875