第十章协方差分析讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究几种配合饲料对猪的增重效果,希望试验 仔猪的初始重相同,因为仔猪的初始重不同,将 影响到猪的增重。但是,在实际试验中很难满足 试验仔猪初始重相同这一要求。
经研究发现:增重与初始重之间存在线性回归关 系。
• 这时可利用仔猪的初始重(记为x)与其增重 (记为y)的回归关系, 将仔猪增重都矫正为 初始重相同时的增重,于是初始重不同对 仔猪增重的影响就消除了。由于矫正后的 增重是应用统计方法将初始重控制一致而 得到的,故叫统计控制。统计控制是试验 控制的一种辅助手段。经过这种矫正,试 验误差将减小,对试验处理效应估计更为 准确。
2、协方差分析(适用:计量资料)
3、多因素分析(适用:计量、计数资料)
协方差分析(analysis of covariance,ANCOVA)
将线性回归与方差分析结合起来,检 验两组或多组修正均数间有无差异的一种 统计方法,用于消除混杂因素对分析指标 的影响。
协变量:在进行协方差分析时,混杂因素 统称为协变量。
n 1
是y的均方MSy,它是y的
方差
2 x
的无偏估计量;
(x x)( y y) 称为x与y的平均的离均差 n 1
的乘积和,简称均积,记为MPxy,即
(x x)( y y)
MPxy
n 1
xy
(
x)(
n
y)
n 1
(10-2)
与 均 积 相 应 的 总 体参 数 叫 协 方 差
(covariance),记为COV(x,y)或
若 y 的变异主要由x的不同造成(处理没有显著 效应),则各矫正后的 间y将 没有显著差异(但原y 间的差异可能是显著的)。
若 y的变异除掉x不同的影响外, 尚存在不同处 理的显著效应,则可期望y 各 间将y有显著差异 (但 原y间差异可能是不显著的)。此外,矫正后的 y和 原y的大小次序也常不一致。
因此,应用协方差分析前,要对资料进行 方差齐性检验和回归系数的假设检验(斜率同 质性检验),只有满足上述两个条件之后才能 应用,否则不宜使用。
协方差分析的应用条件
⑴各比较组协变量X与分析指标Y存在线性 关系(按直线回归分析方法进行判断)。 ⑵各比较组的总体回归系数βi相等,即各直 线平行(绘出回归直线,看是否平行)。
。统计学证明
xy
了,均积MPxy是总体协方差COV(x,y)的无偏估计
量,即 EMPxy= COV(x,y)。
于是,样本相关系数r可用均方MSx、MSy,均
积MPxy表示为:
r MPxy MS x MS y
(10-3)
相应的总体相关系数ρ可用x与y的总体标准
差 、x y,总体协方差COV(x,y)或 x表y 示如下:
协方差分析的基本思想: 在作两组或多组均数 y1,y2 …,yk的假
设检验前,用线性回归分析方法找出协变 量X与各组Y之间的数量关系,求得在假定X 相等时修定均数 y'1,y'2 ,y'k ,然后用方差 分析比较修正均数间的差别,这就是协方 差分析的基本思想。
协方差分析的应用条件
⑴要求各组资料都来自正态总体,且各组的方 差相等;(t检验或方差分析的条件) ⑵各组的总体回归系数βi相等,且都不等于0 (回归方程检验)。
(x x)( y y)
r
(x x)2 ( y y)2
若将公式右端的分子分母同除以自由度(n-1),
得
r
(x x)( y y) /(n 1)
பைடு நூலகம்
(
x
x
)
2
(n
1)
(
y
y)
2
(n
1)(10-1)
其中
(x x)2
n 1
是x的均方MSx,它是x的
方差 x2的无偏估计量;
(y y)2
处理因素
T + S1
混杂因素
-
S2
T
e + s1 (实验组)
s2 (对照组) e
(在设计阶段控制混杂因素的方法)
在混杂因素中,有些是难以完全控制的, 如,天气变化,饲料的进食量;有些是可以控 制的,如年龄,动物的初始体重。
可以控制的混杂因素:最好在设计阶段(也可 在分析阶段)进行控制。 难以控制的混杂因素:在分析阶段进行控制。
• 所以, 处理平均数的回归矫正和矫正平均 数的显著性检验,能够提高试验的准确性 和精确性,从而更真实地反映试验实际。 这种将回归分析与方差分析结合在一起, 对试验数据进行分析的方法,叫做协方差 分析(analysis of covariance)。
二、估计协方差组分
在第六章曾介绍过表示两个相关变量线性相 关性质与程度的相关系数的计算公式:
两条回归直线不平行
结论: 本资 料不 宜做 协方 差分 析
两条条回归直线基本平行
各回归系数不 为零
结论: 本资 料可 以做 协方 差分 析
不满足条件时的处理方法
X与Y不满足线性关系时,通常情况下是 对X或Y或两者作适当的变量变换,使之符 合线性关系。
协方差分析适用的资料
协方差分析可用于: 完全随机设计、随机区组设计、拉丁方设计、 析因设计等资料; 协变量X可以仅有一个,称一元协方差分析; 协变量也可以有多个,称多元协方差分析。
第十章 协方差分析
在科研中,实验效应除了受到处理因 素的作用外,尚受到许多非处理因素的影 响。如在研究临床疗效时,疗效的好坏不 仅与治疗措施有关,还受病人的年龄、性 别、病情、心理、环境、社会等因素的影 响。
药物临床疗效研究
混杂因
患者的状况(性别、年龄
素
药物
病情
疗效
举
例
心 理 因
其他因 素
素
各组间的效应进行比较,必须保持组间的 影响因素(混杂因素的比例)相同,组间 才具有可比性。
常见的实例
(1)比较不同施肥量对果树单株产量的影 响,果树起始干周是混杂因素。 (2)比较两种药物治疗高血压的疗效,年 龄是一个混杂因素。 (3)研究不同饲料对动物增加体重的作用 时,动物的初始体重、进食量等因素。 (4)… …
在分析阶段控制混杂因素的方法:
1、采用分层分析:如把年龄分组,再比较 同一年龄组的正常体重与超重组有无差别。 (适用:计量、计数资料)
协方差分析有二个意义 , 一是对试验进行统 计控制,二是对协方差组分进行估计,现分述 如下。
一、对试验进行统计控制
为了提高试验的精确性和准确性 ,对处理以 外的一切条件都需要采取有效措施严加控制, 使它们在各处理间尽量一致,这叫试验控制。
但在有些情况下,即使作出很大努力也难以使 试验控制达到预期目的。例如:
经研究发现:增重与初始重之间存在线性回归关 系。
• 这时可利用仔猪的初始重(记为x)与其增重 (记为y)的回归关系, 将仔猪增重都矫正为 初始重相同时的增重,于是初始重不同对 仔猪增重的影响就消除了。由于矫正后的 增重是应用统计方法将初始重控制一致而 得到的,故叫统计控制。统计控制是试验 控制的一种辅助手段。经过这种矫正,试 验误差将减小,对试验处理效应估计更为 准确。
2、协方差分析(适用:计量资料)
3、多因素分析(适用:计量、计数资料)
协方差分析(analysis of covariance,ANCOVA)
将线性回归与方差分析结合起来,检 验两组或多组修正均数间有无差异的一种 统计方法,用于消除混杂因素对分析指标 的影响。
协变量:在进行协方差分析时,混杂因素 统称为协变量。
n 1
是y的均方MSy,它是y的
方差
2 x
的无偏估计量;
(x x)( y y) 称为x与y的平均的离均差 n 1
的乘积和,简称均积,记为MPxy,即
(x x)( y y)
MPxy
n 1
xy
(
x)(
n
y)
n 1
(10-2)
与 均 积 相 应 的 总 体参 数 叫 协 方 差
(covariance),记为COV(x,y)或
若 y 的变异主要由x的不同造成(处理没有显著 效应),则各矫正后的 间y将 没有显著差异(但原y 间的差异可能是显著的)。
若 y的变异除掉x不同的影响外, 尚存在不同处 理的显著效应,则可期望y 各 间将y有显著差异 (但 原y间差异可能是不显著的)。此外,矫正后的 y和 原y的大小次序也常不一致。
因此,应用协方差分析前,要对资料进行 方差齐性检验和回归系数的假设检验(斜率同 质性检验),只有满足上述两个条件之后才能 应用,否则不宜使用。
协方差分析的应用条件
⑴各比较组协变量X与分析指标Y存在线性 关系(按直线回归分析方法进行判断)。 ⑵各比较组的总体回归系数βi相等,即各直 线平行(绘出回归直线,看是否平行)。
。统计学证明
xy
了,均积MPxy是总体协方差COV(x,y)的无偏估计
量,即 EMPxy= COV(x,y)。
于是,样本相关系数r可用均方MSx、MSy,均
积MPxy表示为:
r MPxy MS x MS y
(10-3)
相应的总体相关系数ρ可用x与y的总体标准
差 、x y,总体协方差COV(x,y)或 x表y 示如下:
协方差分析的基本思想: 在作两组或多组均数 y1,y2 …,yk的假
设检验前,用线性回归分析方法找出协变 量X与各组Y之间的数量关系,求得在假定X 相等时修定均数 y'1,y'2 ,y'k ,然后用方差 分析比较修正均数间的差别,这就是协方 差分析的基本思想。
协方差分析的应用条件
⑴要求各组资料都来自正态总体,且各组的方 差相等;(t检验或方差分析的条件) ⑵各组的总体回归系数βi相等,且都不等于0 (回归方程检验)。
(x x)( y y)
r
(x x)2 ( y y)2
若将公式右端的分子分母同除以自由度(n-1),
得
r
(x x)( y y) /(n 1)
பைடு நூலகம்
(
x
x
)
2
(n
1)
(
y
y)
2
(n
1)(10-1)
其中
(x x)2
n 1
是x的均方MSx,它是x的
方差 x2的无偏估计量;
(y y)2
处理因素
T + S1
混杂因素
-
S2
T
e + s1 (实验组)
s2 (对照组) e
(在设计阶段控制混杂因素的方法)
在混杂因素中,有些是难以完全控制的, 如,天气变化,饲料的进食量;有些是可以控 制的,如年龄,动物的初始体重。
可以控制的混杂因素:最好在设计阶段(也可 在分析阶段)进行控制。 难以控制的混杂因素:在分析阶段进行控制。
• 所以, 处理平均数的回归矫正和矫正平均 数的显著性检验,能够提高试验的准确性 和精确性,从而更真实地反映试验实际。 这种将回归分析与方差分析结合在一起, 对试验数据进行分析的方法,叫做协方差 分析(analysis of covariance)。
二、估计协方差组分
在第六章曾介绍过表示两个相关变量线性相 关性质与程度的相关系数的计算公式:
两条回归直线不平行
结论: 本资 料不 宜做 协方 差分 析
两条条回归直线基本平行
各回归系数不 为零
结论: 本资 料可 以做 协方 差分 析
不满足条件时的处理方法
X与Y不满足线性关系时,通常情况下是 对X或Y或两者作适当的变量变换,使之符 合线性关系。
协方差分析适用的资料
协方差分析可用于: 完全随机设计、随机区组设计、拉丁方设计、 析因设计等资料; 协变量X可以仅有一个,称一元协方差分析; 协变量也可以有多个,称多元协方差分析。
第十章 协方差分析
在科研中,实验效应除了受到处理因 素的作用外,尚受到许多非处理因素的影 响。如在研究临床疗效时,疗效的好坏不 仅与治疗措施有关,还受病人的年龄、性 别、病情、心理、环境、社会等因素的影 响。
药物临床疗效研究
混杂因
患者的状况(性别、年龄
素
药物
病情
疗效
举
例
心 理 因
其他因 素
素
各组间的效应进行比较,必须保持组间的 影响因素(混杂因素的比例)相同,组间 才具有可比性。
常见的实例
(1)比较不同施肥量对果树单株产量的影 响,果树起始干周是混杂因素。 (2)比较两种药物治疗高血压的疗效,年 龄是一个混杂因素。 (3)研究不同饲料对动物增加体重的作用 时,动物的初始体重、进食量等因素。 (4)… …
在分析阶段控制混杂因素的方法:
1、采用分层分析:如把年龄分组,再比较 同一年龄组的正常体重与超重组有无差别。 (适用:计量、计数资料)
协方差分析有二个意义 , 一是对试验进行统 计控制,二是对协方差组分进行估计,现分述 如下。
一、对试验进行统计控制
为了提高试验的精确性和准确性 ,对处理以 外的一切条件都需要采取有效措施严加控制, 使它们在各处理间尽量一致,这叫试验控制。
但在有些情况下,即使作出很大努力也难以使 试验控制达到预期目的。例如: