多元回归分析与协方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

、…、k代表k个水平的取值,是不够合理的。因为这隐含着承认各等级之
间的间隔是相等的,其实质是假定该因素的各水平对因变量的影响作用几乎





比较妥当的做法是引入k-1个哑变量(Dummy Variables),每个哑变量
取 值 为 0 或 1 。 现 以 ABO 血 型 系 统 为 例 , 说 明 产 生 哑 变 量 的 具 体 法 。
(2) 配 伍 组 设 计 的 协 方 差 分 析 模 型 为 ∶
MODEL Y=X A B /
SS3;
(3)两因素析因设计的协方差分析模型为∶ MODEL Y=X A B A*B
/
SS3;
h
9
3.协方差分析的应用条件
理论上要求各组资料都来自方差相同的正态总体;各组的总体直线回归系数相等,且都不为0。因 此,严格地说,在对资料作协方差分析之前,应先对这两个前提条件作假设检验,若资料符合上述两个 条件,或经变量变换后符合上述条件,方可进行协方差分析。
h
1
1.多元线性回归模型
Y=β0+β1X1+β2X2+...+βpXm+ε
其 中 X1、X2、……Xm 为 m 个 自 变 量 ( 即 影 响 因 素 ) ; β0、β1、β2、
……βm 为 m + 1 个 总 体 回 归 参 数 ( 也 称 为 回 归 系 数 ) ; ε 为 随 机 误 差 。
有显著性影响的,故筛选变量是回归分析中不可回避的问题。然而,筛选
变量的方法很多,详见本章第3节,这里先介绍最常用的一种变量筛选法








模型中的变量从无到有,根据F统计量按SLENTRY的值(选变量进入方
程的显著性水平)决定该变量是否入选;当模型选入变量后,再根据F统计
量按SLSTAY的值(将方程中的变量剔除出去的显著性水平)剔除各不显著的
影响因素处在不同水平下,经过回归分析手段修正以后的因变量的总体均数
之间是否有显著性的差别,这就是协方差分析解决问题的基本思想。
h
8
2.协方差分析的模型
设定性的影响因素为A、B、C等,它们之间的交互作用为A*B、A*C等;
定量的影响因素为X或X1、X2、…;定量的观测结果(即因变量)为Y,则有∶
(1)单因素k水平设计的协方差分析模型为∶ MODEL Y=X A / SS3;
h
3
3.标准回归系数及其意义
因为各bi的值受各变量单位的影响。为便于比较,需要求出标准化
回归系数,消除仅由单位不同所带来的差别。
设∶与一般回归系数bi对应的标准化回归系数为Bi,则 Bi=biSXi/SY 式 中 的 SXi、SY 分 别 为 自 变 量 Xi 和 Y 的 标 准 差 。
一般认为标准化回归系数的绝对值越大,所对应的自变量对因变量的影响
当 某 人 为 A 型 血 时 , 令 X1=1、X2=X3=0; 当 某 人 为 B 型 血 时 , 令 X2=1、
X1=X3=0; 当 某 人 为 AB 型 血 时 , 令 X3=1、X1=X2=0; 当 某 人 为 O 型 血 时 , 令
X1=X2=X3=0。
h
5
5.变量筛选
研究者根据专业知识和经验所选定的全部自变量并非对因变量都是
第2章 多元线性回归分析
第 1 节
多元线性回归分析的概述
回归分析中所涉及的变量常分为自变量与因变量。 当因变量是非时间的 连续性变量(自变量可包括连续性的和离散性的)时,欲研究变量之间的依存 关系,多元线性回归分析是一个有力的研究工具。
但从科学性角度来说,回归问题也应从试验设计入手考虑。因为这样做 不仅可以减少回归分析中可能遇到的很多麻烦,而且,可用较少的试验次数取 得较多的信息。
题。
h
7
第3章 协方差分析










协方差分析是将回归分析与方差分析结合起来使用的一种分析法。在这种分
析中,先将定量的影响因素(即难以控制的因素)看作自变量,或称为协变量
,建立因变量随自变量变化的回归方程,这样就可以利用回归方程把因变量的
变化中受不易控制的定量因素的影响扣除掉,从而,能够较合理地比较定性的
当研究者通过试验获得了(X1,X2,…,Xm,Y)的n组样本值后, 运用最
小平方法便可求出上式中各总体回归参数的估计值b0、b1、b2、……bm,于是
, 多元线性回归模型变成了多元线性回归方程式。
Y=b0+b1X1+b2X2+...+bpXm
h
2
2.回归分析的任务
多元回归分析的任务就是用数理统计法估计出各回归参数的值及其标准误差;对各回归参数 和整个回归方程作假设检验;对各回归变量(即自变量)的作用大小作出评价;并利用已求得的 回归方程对因变量进行预测、对自变量进行控制等等。
也就越大。但是,当自变量彼此相关时,回归系数受模型中其他自变量的影
响,解释标准化回归系数时必须采取谨慎的态度。当然,更为妥善的办法是
通过回归诊断,了解哪些自变量之间有严重的多重共线性,从而,舍去其中
作用较小的变量, 使保留下来的所有自变量之间尽可能互相独立。
h
4
4.自变量为定性变量的数量化法
设某定性变量有k个水平(如ABO血型系统有4个水平),若分别用1、2
变量,依次类推。这样直到没有变量可入选,也没有变量可剔除或入选变
量就是刚剔除的变量,则停止逐步筛选过程。
h
6
6.回归Hale Waihona Puke Baidu断
自变量之间如果有较强的相关关系,就很难求得较为理想的回归方程;若个别观测点与多数观
测点偏离很远或因过失误差(如抄写或输入错误所致),它们也会对回归方程的质量产生极坏的影响。对
这两面的问题进行监测和分析的法,称为回归诊断。前者属于共线性诊断问题;后者属于异常点诊断问
h
10

看书上有关协方
差分析的实例!
h
11
相关文档
最新文档