协方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
18.4900
7.2900 12.2500 9.3636 16.4836 20.3401 21.7156 8.2944 13.2496 25.9081 280.6773
159.10
135.00 175.00 137.70 194.88 230.01 214.36 167.04 138.32 193.42 2882.54
2
709 31943 525.44 16
2
计算乙组(第二组) y以来自百度文库x和y的离均差积和
l y2 y2 y
2 2
( y2 ) n2
2
65.95 280.68 8.84 16 709 65.95 2882.54 16
2
l x 2 y 2 x2 y 2 39.87
为进一步了解研究各组所属总体回归 线的坡度是否相同,以及回归线的高度是 否相同,先检验各组的方差(估计误差的 均方)差别有无统计学意义。
MS甲组 0.5132 F 1.24 MS乙组 0.4153 查表, 双侧检验F临界值, F0.05(10, 24) 2.64, P 0.05
协方差分析计算表
变异来源 甲组 乙组 自由度 11 15 lxx 912.25 525.44 lxy -77.64 -39.87 lyy 11.74 8.84 1 -0.0851 -0.0759
估计误差
自由度 10 14 平方和 5.1322 5.8147 均方 0.5132 0.4153
组内
回归系数 公共 修正均数 总计 27 1640.43 -123.95 20.79 26 1437.69 -117.51 20.58 -0.0817
计算两组各自的直线回归方程和公共的回归方程
b1 b2 bT
l x1 y1 l x1 x1 l x2 y 2 l x2 x2 l xT yT l xT xT
77.64 0.0851 912.25 39.87 0.0759 525.44 117.51 0.0817 1437.69
组间 组内 自由度 1 26 LXX 202.74 1437.69 均方 202.74 55.2958 F 3.67 P >0.05
总计
27
自由度 1 26
1640.43
LYY 0.21 20.58 均方 0.21 0.7915 F 0.27 P >0.05
y的变异来源
组间 组内
总计
27
20.79
检验结果两组年龄均数差异无统计学意义(P>0.05),两 组肺活量均数差异也无统计学意义(P>0.05) 。
T
yT x1 y1 x2 y2 2280.01 2882.54 5162.55
2 y12 y2 198.89 280.68 479.57
计算合并的x,y的离均差平方和以及x与y的离均差积和
l xT xT l yT yT l xT yT
l xx
2
l xx
2
l xx
估计误差平方和分析表
估计误差
变异来源
自由度 10
平方和 5.1322
均方 0.5132
甲组
乙组
组内
14
24
5.8147
10.9469
0.4153
0.4561
回归系数
公共 修正均数 总计
1
25 1 26
0.0284
10.9753 0.4491 11.4244
0.0284
0.4390 0.4491
( x2 y 2 ) n2
计算两组合并的各相关数据:
n x y x y x
T T T
n1 n2
2 T 2 T
T
x x y y x x y y y x y x
1 2 1 2 2 1 2 2 2 1 2 2 T 1 1
2
y2
将数据代入后,计算各合计的相关项:
( xT ) 2 nT
1306 2 62556 1640.43 28 2 ( y ) T 2 l yT yT yT nT 113.34 2 479.57 20.79 28 xT . yT l xT yT xT yT nT 1306 113.34 5162.55 123.95 28
140.40
202.57 164.70 196.95 158.34 216.53
37
50 50 45 48 51 46 58 38 38
1369
2500 2500 2025 2304 2601 2116 3364 1444 1444 31943
4.30
2.70 3.50 3.06 4.06 4.51 4.66 2.88 3.64 5.09 65.95
若用直线回归的方法找出食量与所增体 重的关系,求得当食量都化为相等时 (即扣除食量的影响),各饲料组动物 所增体重的修正均数,然后再用方差分 析检验各修正均数间有无差别,这才比 较合理。 又如,比较各种职业人群的血压时, 也应把年龄化为相等,再作比较等等。
什么是协方差分析?
协方差分析是把线性回归与 方差分析结合起来,用于检验两 个或多个修正均数间有无差别的 方法,其目的是把与结果变量 (因变量)Y呈直线关系的自变量 X(协变量)化成相等后,检验两 个或多个修正均数间有无差别。
协方差分析手工计算数据格式
甲组年龄
x1 39 40 41 x12 1521 1600 1681 y1 4.62 5.29 5.52 y12 21.3444 27.9841 30.4704
甲组肺活量
x1*y1 180.18 211.60 226.32 x2 43 39 38
乙组年龄
x22 1849 1521 1444 y2 4.61 4.73 4.58
2
l xx l xy l xy l xy l xy
2
l xx
2
77.64 2 11.74 5.1322 912.25 39.87 2 8.84 5.8147 525.44 117.512 20.58 10.9753 1437.69 123.952 20.79 11.4244 1640.43
计算两组各自的直线回归方程和公共的回归方程
ˆ y b( x x )公式求回归方程 利用 y ˆ甲 3.95 0.0851( x 49.75) y ˆ甲 8.1837 0.0851x y ˆ乙 4.12 0.0759( x 44.31) y ˆ乙 7.4831 0.0759 x y ˆ公共 4.05 0.0817( x 46.64) y ˆ公共 7.8605 0.0817 x y
(一)完全随机设计资料的协方差分析
方法步骤:
•手工计算 •电脑运算
方法步骤
•数据准备
•数据分布检验
•方差齐性检验 •电脑运算
完全随机设计资料 协方差分析
例1、研究镉作业工人暴露于烟尘的 年数与肺活量的关系,按暴露年数 将工人分为两组,甲组暴露10年,乙 组暴露10年,两组年龄未经控制, 问该两组暴露于镉作业的工人肺活 量是否相同?
2
l x1 y1 x1 y1 77.64
( x1 y1 ) n1
计算乙组(第二组)x和y的均数及x的离均差平方和
x2 y2
x n2
2
709 44.31 16 65.95 4.12 16
2 2
y n2
2
l x2 x2 x
( x2 ) n2
x
2 T
yT
( xT ) nT
2
y x
2 T
( yT ) nT
T
2
T
x . y nT
T
xT
nT 1306 xT 46.64 28 113.34 yT 4.05 28
x
T
yT
y nT
T
计算合并的各离均差平方和及离均差积和:
2 l xT xT xT
计算估计误差平方和
ˆ) (y y 三组:
2 ˆ 甲组: ( y y ) l yy 2 ˆ 乙组: ( y y ) l yy 2 ˆ 公共: ( y y ) l yy 2 ˆ 总计: ( y y ) l yy 2
l yy
l xy
597
30613
47.39
198.890
2280.01
709
分析步骤
1、绘制原始资料散点图 2、计算组间变异 3、计算组间均方 4、计算F值
分组的年龄与肺活量散点图
6.0 5.5
5.0
4.5
4.0
3.5
分组
3.0 暴露<10年 2.5 30 40 50 60 70 暴露>=10年
肺活量
年龄
计算各相关数据:
5.12
3.89 4.62
26.2144
15.1321 21.3444
215.04
167.27 198.66
52
47 61 65 58 59
2704
2209 3721 4225 3364 3481
2.70
4.31 2.70 3.03 2.73 3.67
7.2900
18.5761 7.2900 9.1809 7.4529 13.4689
y n1
1
l x1x1 x
( x1 ) n1
2
597 30613 912.25 12
2
计算甲组(第一组)y以及x和y的离均差平方和积和
l y1 y1 y
2 1
( y1 ) n1
2
47.39 198.89 11.74 12 597 47.39 2280.01 12
24
1 25 1 26
10.9469
0.0284 10.9753 0.4491 11.4244
0.4561
0.0284 0.4390 0.4491
分别对两组的x与y的均数进 行统计学检验,以便对协方 差分析的结果作出较完善的 解释,分析结果见下表:
检验xi,间及yi间差别的方差分析表
x的变异来源
乙组肺活量
y22 21.2521 22.3729 20.9764 x2*y2 198.23 184.47 174.04
41
45 49
1681
2025 2401
3.71
4.02 5.09
13.7641
16.1604 25.9081
152.11
180.90 249.41
42
43 43
1764
1849 1849
x , x , y , y , x y
2 2 i i i i i
i
xi , yi , l xi xi , l yi yi , l xi yi
计算甲组(第一组)x,y的均数及x的离均差平方和
x1 y1
x n1
1
597 49.75 12 47.39 3.95 12
2 1
协方差分析及SPSS统计软件包应用
临床流行病学应用研究室 欧爱华
为什么要进行协方差分析
影响效应指标的因素不可控性
(未控制或难以控制) 组间基线的不均衡性等
例如:在营养研究中,不考虑动物食 量的差别,直接用方差分析来比较不 同饲料组动物的平均增重,来评价不 同饲料的营养价值是不恰当的。这是 因为动物体重的增加,除了与食物的 营养价值有关,还与各组动物的食量 有关,而动物的食量多少又未加以控 制。
协方差分析按设计不同分为:
1、完全随机设计的协方差分析 2、配伍组设计协方差分析 3、多元协方差分析 (多个协变量的协方差分析) 4 、拉丁方设计 5 、析因设计等
应用协方差分析的条件
理论上要求各组资料(样本)均来自方 差相同的正态总体,各观察变量相互独 立。 各总体存在回归关系且各总体直线回归 系数 i 相等,且都不为0。 各样本方差齐性。
n x y x y x
T T T
n1 n2 12 16 28 x1 x2 597 709 1306
2 1 2 2
2 T 2 T
x x 30613 31943 62556
y1 y2 47.39 65.95 113.34
注意问题: 如果不满足以上条件,建议进 行变量变换,符合上述条件后, 再进行协方差分析。
要求: 在进行协方差分析前,应 先进行方差齐性检验和回归系 数的检验。
协方差分析的基本步骤
确定协变量(即未加以控制或难以控制 的因素) 建立因变量Y随协变量X变化的线性回归 关系 利用回归关系把协变量X化为相等后再进 行各组Y的休整均数间比较的假设检验