第七章 协方差分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有无差别的方法,其目的是把与结果变量(因变量)Y
呈直线关系的自变量X(协变量)化成相等后,检验两
个或多个修正均数间有无差别。
§7 协方差分析
协方差分析的意义
[例7-1 ]为研究镉作业工人暴露于烟尘的年数与肺活量 的关系,按暴露年数将工人分为两组,甲组暴露大于 或等于10年,乙组暴露小于10年,两组年龄未经控制, 问该两组暴露于镉作业的工人肺活量是否相同?
分析:试验用4种肥料分别施10株果树,各组的单株产量 y 既包含了不同肥料所引起的“自身变异”,也包含 了不同的起始干周x所引起的 “协同变异”,因此应 采用协方差分析法将“协同变异”从 y 的总变异中剔 除,获得y的“自身变异”,然后才能正确地检验4种 肥料平均单株产量是否有显著差异。
§7 协方差分析
§7 协方差分析
协方差分析的主要步骤
对x和y作方差分析
这里对y进行的F检验是在没有考虑x的影响下进行的, 若x 与y之间没有显著的回归关系,即x对y没有显著影响,对y进
行的F检验结果可以接受; 若x与y之间有显著的回 归关系,即x对y有显著影响, 则需对y矫正后再进行的F检验, 才能获得正确结论。
yij e (xij x ) y i ij
§7 协方差分析
协方差分析的主要步骤
确定协变量(即未加以控制或难以控制的因素) 建立因变量Y随协变量X变化的线性回归关系 利用回归关系把协变量X化为相等后再进行各组Y 的修正均数间比较的假设检验
§7 协方差分析
协方差分析的主要步骤
确定协变量(即未加以控制或难以控制的因素) 计算变量x和y的自由度、平方和与乘积和
§7 协方差分析
协方差分析的意义
协方差是用来度量两个变量之间 “协同变异”大小的 总体参数,即二个变量相互影响大小的参数,协方差 的绝对值越大,二个变量相互影响越大。
COV
(x,
y)
1 n 1
(x
x
)(
y
y
)
协方差分析(Analysis of Covariance)是把线性回归与
方差分析结合起来,用于检验两个或多个修正均数间
分析:两组肺活量y的差别既包含了暴露年数不同所引起 的“自身变异”,也包含了的年龄不同所引起的 “协同
变 异”,因此应采用协方差分析法将“协同变异”从 y 的
总变 异中剔除,获得y的“自身变异”,然后才能正确地检验
不 同的暴露年数下肺活量是否有显著差异。
§7 协方差分析
协方差分析的意义
[例7-2 ]为研究A1、A2、A3、A4 4种不同肥料(k=4) 对某果树单株产量的影响, 选择40株该果树作试验, 把40株果树完全随机分为4组,每组包含10株果树 (n=10),每组施用1种肥料。各株果树的起始干周 (x,cm)和单株产量(y, kg)数据如表所示, 试检验 4种肥料的单株产量是否有显著差异。
协方差分析的适用条件
各处理组样本来自正态总体 各样本是相互独立的随机样本 各处理组的总体方差相等 各组的回归系数相等且不为0
§7 协方差分析
协方差分析的数学模型(单因素为例) yij y i e (xij x ) ij
(i 1, 2, , k; j 1, 2, , n)
yij i (y ex ) e xij ij
若研究因素与协变量的交互作用无显著性,则 满足回归齐性的假定。
§7 协方差分析
协方差分析的SPSS软件应用
§7 协方差分析
协方差分析的主要步骤
计算回归系数并进行显著性检验
若y与x之间存在显著的直线回归关系,则需要对y进行校正
§7 协方差分析
协方差分析的主要步骤
对校正后的y进行方差分析
若校正后的y方差分析结果有显著性差异,则需要进行多重 比较。
§协方差分析
协方差分析前提条件的检验
各处理组样本来自正态总体 (正态性检验) 各样本是相互独立的随机样本 (独立性检验) 各处理组的总体方差相等 (方差齐性检验) 各组的回归系数相等 (回归齐性检验)
§7 协方差分析
协方差分析前提条件的检验
回归齐性检验方法(SPSS)
➢ 作图法 对两组X、Y分别作散点图,并拟和回归直线,观 察回归直线是否平行。若平行,则满足回归齐性 的假定。 此方法简单直观,但具有主观性。
§7 协方差分析
协方差分析前提条件的检验
回归齐性检验方法(SPSS) ➢ 检验研究因素和协变量的交互作用
§7 协方差分析
问题的提出
第五章介绍的方差分析属纯方差分析。为了提高试验结 果的精确性和准确性,它对处理以外的一切条件都采取 有效措施严加控制,使各处理处于尽可能一致的试验条 件下,这一做法在统计上叫做试验控制。
但在有些情况下,试验控制不一定能实施。如果那些不 能很好地进行试验控制的因素是可测的,且又和试验结 果之间存在直线回归关系,那么就可利用这种直线回归 关系将各处理的观测值都矫正到初始条件相同时的状态, 使得处理间的比较能在相同基础上进行。这一做法在统 计上称为统计控制。