研究生课件 13章协方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
奶 粉 组
Y X
704.0 690.2 517.1 576.6 566.0 650.0 590.3 610.5 570.6 550.7 6026.0 603.6
Y
171.0 170.0 113.0 126.0 121.0 150.0 155.0 145.0 130.5 125.0 1406.5 140.7
SS
总残差
2
SS
SS
修正
组内残差
总残差
N 2 ,
k 1
组内残差
N k 1
比较P169
SS
剩
SS
总
SS 回 l YY
l XY l XX
2
5.计算F值
MS SS 修正
修正
修正
SS 组内残差
MS
组内残差
组内残差
F
MS MS
修正
变异之间的关系:
SS组间 组间 MS组间
SS配伍间 配伍间 MS配伍间
• SS总= SS组内+ SS组间+ SS配伍间
总=
组内+ 组间+配伍间
方差分析的基本思想
• 总变异(total variation):SS总 ν总=(N−1)。
• 组内变异(variation within groups):SS组内
量影响的方差分析,即为协方差分析。
概念
1.协方差分析:是解决混杂因素影响的分析方
法,它是将线性回归与方差分析结合起来,检验2
个或多个修正均数间有无差别的假设检验方法。目
的把与Y有线性关系的协变量影响化为相等后,再
来比较修正均数间的差别。
2.修正均数:假定各组协变量相等时的均数。
3.协变量:又称混杂因素,处理因素以外影 响观察指标的变量
X3
22 24 20 23 25 27 30 32
Y3
89 91 83 95 100 102 105 110
X1
Y 1
X2
Y 2
Xk
Yk
表13-3 三种饲料喂猪的进初始重量与增重(单位公斤)
母 X
549.1 532.0 513.0 526.0 373.0 560.0 571.1 618.7 470.9 500.9 合计 5211.7 均数 521.2
单因素方差分析变异构成
个体变异 处理因素
组间变异
随机误差
• SS组间
总变异
SS 总
组内变异
SS组内
随机误差
个体变异
各种变异的表示方法
• SS总 • 总 • MS总 SS组内 组内 MS组内 SS组间 组间 MS组间
三者之间的关系: SS总= SS组内+ SS组间 总= 组内+ 组间
变异间的关系 • SS总 • 总 SS组内 组内 MS组内
直线回归的变异来源
(y y)
2
2
ˆ y) (y
2
ˆ) (y y
2
:反映了y的总变异程度,称为y的总平 方和,记为 SS 总 ; 2 :映了由于y与x间存在直线关系所引 ˆ ( y y ) 起的y的变异程度,称为回归平方和,记为 SS 回 ; 2 :反映了除y与x存在直线关系以外的 ˆ ( y y ) 原因,包括随机误差所引起的y的变异程度,称为离 回归平方和或剩余平方和,记为SS剩。
XY ( X )( Y ) / n
2.组间变异
( l
XX
j
X n
ij
)
2
i
i
C
( l YY
j
Y ij ) n
i
2
i
C
( l
XY
j
X
ij
)( n
j
Y ij ) C
i
i
3. 组内变异
l XX
l YY l XY
( l XX ) 总 ( l XX ) 组间
乳 组 Y
123.5 117.0 124.5 104.0 89.0 142.5 127.0 140.0 102.5 111.2 1081.2 108.12
奶 粉 组 X
704.0 690.2 517.1 576.6 566.0 650.0 590.3 610.5 570.6 550.7 6026.0 603.6
比较修正均数间的差别。
二 、协方差应用条件及其用途
1.协方差分析的应用条件
(1)各样本是来自于方差相同的正态总体的随机样本,即:
.
1
2 2 2
2 k
(2)各样本的X与Y呈直线回归关系,即: i
1
0
;且各组间回
归直线平行(组间差别无统计学显著性意义) ,即:
处理因素
不同蛋白质 进食量 窝别
线性
性别
出生体重
增长体重
线性
•
例如,在上述的营养研究中,若要比较不同
饲料组的动物增重有无差别,而动物的增重又与
进食量、初始体重有线性关系时,可先用直线回
归的方法,找出各组因变量(增重)与协变量
(进食量或动物体重)之间的数量关系,求得在
假定协变量相等时的修正均数,然后用方差分析
ν组内=N−k, 组内均方:MS组内=SS组内 /(N−k)。 • 组间变异(variation among groups):(SS组间 ν组 间=(k−1), 组间的均方:MS组间=SS组间 /(k−1)。
配对设计与前后测量设计的区别与联系
配对设计
两种处理作用于同一对的两个个体 可以对两个个体同时观测 两个个体的实验观测结果相互独立
• 表13-1 完全随机设计的协方差分析的资料模式
第1处理组 第2处理组 第k处理组
X
X11 X12 X1n1
Y
Y11 Y12 Y1n1
X
X21 X22 X2n2
Y
Y21 Y22 Y2n2
…
… … …
X
Xk1 Xk2 Xknk
Y
Yk1 Yk2 Yknk
X1
X1
Y 1
123.5 117.0 124.5 104.0 89.0 142.5 127.0 140.0 102.5 111.2 1081.2 108.12
组 内 残 差
修正均数
对照62页
基本公式有:
1.总变异
l XX l YY
X Y
2
2
Hale Waihona Puke Baidu
( X )
2
2
/ n
( Y )
/ n
l XY
第一节 协方差分析的基本思想和步骤
•
协方差分析(analysis of
covariance)是
把直线回归分析与方差分析结合起来的一种统计 分析方法,用来消除混杂因素对处理效应的影响,
提高分析结果的真实性。属多元统计方法范畴。
一 基本思想
1.各组间同质: 在多个样本均数比较的方
差分析中,我们要求除处理因素外,其他影响
重复测量设计与随机区组设计区别 重复测量设计
●处理因素在区组间(受试者)随机分配; ●区组内各时间点固定,不能随机分配;
区组内实验单位彼此不独立。
随机区组设计
●处理因素在区组内随机分配;
每个区组内实验单位彼此独立。
• 请设计一个实验: • 饮食(肉食者,素食者)与运动强度(轻、 中、重)对脉搏的影响(人群研究)。
第十三章 协方差分析
Analysis of covariance
新乡医学院公共卫生学系 田玉慧
讲课内容
第一节 协方差分析的基本思想与步 骤(重点) 第二节 完全随机设计资料的协方差 分析 第三节 随机区组设计资料的协方差 分析
复习方差内容
• • • • • 1.方差分析的基本思想 2.成组设计的多个样本均数比较 3.配伍组设计的多个样本均数比较 4.多个样本均数的两两比较 5.重复测量方差分析(与方差对应)
前后测量设计
一种处理作用于同一个体 同一个体两个不同时间的观测 两个不同时间观测结果常不相互独立
对差数用成对资料 t 检验推论两种处理 对差数用成对资料 t 检验推论该处理有 有无差别 无作用; 处理前后的相关与回归分析。
重复测量设计(单因素)
受试者血糖浓度(mmol/L) 放 受试者编号 0 1 2 3 4 5 6 7 8 5.32 5.32 5.94 5.49 5.71 6.27 5.88 5.32 45 5.32 5.26 5.88 5.43 5.49 6.27 5.77 5.15 90 4.98 4.93 5.43 5.32 5.43 5.66 5.43 5.04 135 4.65 4.70 5.04 5.04 4.93 5.26 4.93 4.48 置 时 间(分)
(y y)
SS
总
SS
回
SS
剩
F
SS SS
回 剩
/ /
回 剩
MS MS
回 剩
F
MS MS
组间 组内
SS
总
(Y Y )
2
2
Y
2
( Y ) n
2
SS 回 bl
XY
l XY l XX l xy l xx
2
SS
剩
SS
总
SS 回 l yy
( 重点)
离均差4种表达方式平方和
Y1
X2
X
2
Y 2
Y2
Xk
X
k
Yk
Yk
对于完全随机设计资料的协方差分析是把Y的残差平 方和分解为修正均数间和组内残差两部分 。
•
例13.1把20头雄性白鼠随机分2组,第一
组白鼠饲母乳,第二组白鼠饲奶粉,现将2组白 鼠9周内进食量(X,g)及所增体重(Y,g)列表如 下: • 问摄入不同饲料的白鼠所增体重的均数
( l YY ) 总 ( l YY ) 组间 ( l XY ) 总 ( l XY ) 组间
4.计算残差平方和及自由度
SS ( l YY ) 总 ( l XY ) 总 /( l XX ) 总
2
总残差
SS
组内残差
修正
( l YY ) 组内 ( l XY ) 组内 /( l XX ) 组内
有无不同?
表13-3 三种饲料喂猪的进初始重量与增重(单位公斤) A饲料组 B饲料组 C饲料组
X1
15 13 11 12 12 16 14 17 85 83 65 76 80 91 84 90
Y1
17 16 18 18 21 22 19 19
X2
Y2
97 90 100 95 103 106 99 94
方差分析(analysis
of variance, ANOVA)
• 应用范围 • 1.用于两个或两个以上样本均数的比较 • 2.分析两个或多个研究因素的交互作用 • 3.回归方程线性假设检验等。 • 应用条件 • 1.各样本是相互独立的随机样本; • 2.各样本来自正态分布总体 • 3.各总体方差齐。 • 如果不符合上述条件就要对资料进行 处理。
观察指标的因素应齐同,即各组间应有同质基
础。举例说明。
2.各组间不同质:但在医学科研中常遇到以
下情况:如在食品营养的动物实验中,各组动物
所增加的平均体重不仅与各种饲料的营养价值有 关,还与各组动物的初始体重、进食量有关。初 始体重、进食量都是影响观察指标的变量,亦称 混杂因素,在统计分析中又称协变量;考虑协变
三、协方差分析步骤
(一)变异的分解及其公式 协方差分析将因变量Y的残差分为两部分:修止均数 间的变异和组内残差。 修正均数指的是当混杂因素(初始体重、进食量等) 一致时,各处理组的因变量(如增重)的平均值。修正 均数间的变异是由处理因素(如本例的不同饲料)、个 体变异、随机误差造成的。 组内残差是由个体变异、随机误差造成的。
•根据原始资料绘散点图,观察各组散点图的分布是否呈直线 趋势(确定条件) • 由图13-l可见,两组资料基本呈直线趋势且斜率大体一致 (假设本例各处理组资料呈正态分布、方差齐)
2 k
在做协方差分析之前,须先进行方差齐性检验、正态性
检验和回归系数的假设检验。符合上述条件,或经变量变换后 符合上述条件,方可进行协方差分析;否则,不宜用此法。
2.协方差分析的用途 根据研究目的不
同,协方差分析可用于完全随机设计、配 伍组设计、拉丁方设计和析因设计的资料。 下面介绍完全随机设计和配伍组设计的协 方差分析的步骤。
Y
171.0 170.0 113.0 126.0 121.0 150.0 155.0 145.0 130.5 125.0 1406.5 140.7
协方差分析步骤:
• 一、判断协方差条件
• (一)正态性检验和方差齐性检验 • (二)要求各样本来自方差相等的正态总体 • (三)判断X和Y有无线性关系 • 要求总体回归系数不等于0。因回归系数与相关系 数检验等价,可进行相关系数假设检验代替
组内残差
第二节 完全随机设计的协方差分析
• 完全随机设计 :将受试对象随机分配到各 组,每组分别接受不同的处理后,进行 比较
推断各组的处理效果是否相同.
•设有k组双变量资料,欲比较k组因变量y有 无差别,而因变量Y又受自变量X的影响;若 满足协方差分析的要求,可选用完全随机设
计的协入差分析。其数据模式如表13-1。
如果修正均数的变异远远地大于组内残差的话,可
以认为处理因素有作用;如果修正均数的变异与组内残 差相差不大,则不能认为处理因素作用。
表2
两种饲料喂白鼠实验的进食量(x,g)及增重(y,g)资料
母 乳 组
X
549.1 532.0 513.0 526.0 373.0 560.0 571.1 618.7 470.9 500.9 合计 5211.7 均数 521.2