多元线性回归的SPSS实现
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多元线性回归的SPSS实现
深大师范学院
版权所有,盗版必
概 要
1、多元线性回归的前提假设 2、衡量多元线性回归方程优劣的标准
各子对话框介绍
3、多元性回归的SPSS实现 常选按钮
结果分析
4、多元线性回归预测和区间估计
版权所有,盗版必
一、线性回归的前提假设及SPSS操作实现
线性趋势(Linear) 自变量与因变量的关系是线性的,否则不能采用线性回归,可通过
版权所有,盗版必
1、线性趋势(GraphsLegaly DialogsScatter/dotMatrix Scatter)(即散 点图判断)
当有多个自变量时
,可以通过散点图 矩阵同时绘制各变 量间的散点图,快 速发现多个变量间 的主要相关。
散点图矩阵
版权所有,盗版必
1、线性趋势(GraphsLegaly DialogsScatter/dotMatrix Scatter)(即散点图判断)
)
Di正组alo态Xg后性s,是YH指的is在t分o给g布r定a为m一
正态分布。
点此,才可给出 正态分布曲线图
版权所有,盗版
2、正态性( GraphsLegaly DialogsHistogram)
3、方差齐性(Analyze→Regression→Linear Regression:plot选项
版权所有,盗版
二、衡量多元线性回归模型优劣的标准
版权所有,盗
三、线性回归的SPSS实现
1、 SPSS中的回归分析操作(Analyze→Regression→Linear Regression) :各复选框基本知识介绍
因变量 框
自变量框 选取变量的方 法
版权所有,盗版
迫所有变量有顺序进入回归方程式。若研究者有 事先建立的假设,决定变量重要性层次则该适用 该法。
输 量 矩 协出 间 阵 方引 , 化输 准 的方 的 和 差入 决 。出 回 可自 的 相程 相 各 矩一 定每归信变描关各关变阵个系一系区量述系自系量。变数个数间、统数变数的量的非。因计等9后变标5变值。% 量及
1、 SPSS中的回归分析操作(Statistics介绍)
变异构成(Variance Proportion):回归模型中各项(包 括常数项)的变异被各主成分所解释的比例,如果某个 主成分对两个或多个自变量的贡献均较大(大于0.5), 说明这几个自变量间存在一定程度的共线性。
版权所有,盗版
多重共线性的识别
1、 SPSS中的回归分析操作(Statistics介绍)
版权所有,盗
1、线性趋势(GraphsLegaly DialogsScatter/dotMatrix Scatter)(即散点图判断)
4个变量两两 相交形成44 的矩阵。
由散点图可知题目类型与试题难度间 的线性条件不明显,因此可以不考虑 题目类型对试题难度的回归。
2、正态性(
GraphsLegaly
各
子
对
话 框
1、 SPSS中的回归分析操作(Statistics介绍)
奇三默 归异个默认 系值标判准认输 数别差输出相(之出项关默外判,的认)定输统值。系出计为 与量回, 数、调整判定系
如回归系数、回归系数 数、回归方程的
标准误、标准回百度文库系数 标准误、F 检验
、统计量和相应的相伴 分析表。
概率值、各自变量容忍
散点图判断。 独立性(Independent)
因变量的取值相互独立,没有自相关。也即是要求残差间相互独立 ,否则应采用自回归来分析。自变量多重共线性的判断。 正态性(Normal)
就自变量的任何一个线性组合,因变量均服从正态分布,即要求残 差服从正态。 方差齐性(Equal)
就自变量的任何一个线性组合,因变量的方差均相同,即要求残差 方差齐。
条件指针(Condiction Index,CI 值):等于最大的主成 分与当前主成分的比值的算术平方根。所以第一个主成 分相对应的条件指数总为1.同样,如果几个条件指数较 大(如30),则提示存在多重共线性。
版权所有,盗版
多重共线性的识别(Collinearity Diagnostics)
特征根(Eigenvalue):对模型中常数项及所有自变量计 算主成分,如果自变量间存在较强的线性相关关系,则 前面的几个主成分数值较大,而后面的几个主成分较小 ,甚至接近0。
逐步多元回归分析法(Stepwise):逐一 、重复筛查引入变量,直至获得最好模型。
向前进入法(Forward):对各变量拟合 其与因变量的模型,将p值最小的模型对应的自 变量首先选入方程。
向后进入法(Backward):对各变量拟合 其与因变量的模型,将p值最大的模型对版应权的所自有,盗版
1、 SPSS中的回归分析操作(Analyze→Regression→Linear Regression) :各复选框基本知识介绍
多重共线性的识别: 对自变量的考察。
版权所有,盗版
多重共线性的识别(Collinearity Diagnostics)
容忍度(Tolerance):等于1减去以该自变量为反应变量 Independent框中选入的其他自变量为自变量所得到的线 性回归模型的决定系数。容忍度越小,多重共线性越严 重。
方差膨胀因素(Variance Inflation Factor,VIF):容 忍度的倒数;VIF越大,多重共线性问题越大。
介绍)
选入ZPRED与ZRESID进入 X,Y两个变量框就可实现。
二、衡量多元线性回归模型优劣的标准
1、复相关系数R(Multiple Correlation Coefficient ):表示模型中所有自变量与因变量之间线性回归关系 的密切程度大小,取值范围为(0,1),R值越大越好。
2、决定系数R2(Determinate Coefficient):等于复相 关系数的平方。表示因变量的总变异中可由回归模型 中自变量解释的部分所占的比例。 R2越大越好。
版权所有,盗版
二、衡量多元线性回归模型优劣的标准
3、校正的决定系数R2adj(Adjusted R Square):当模型中 增加的变量没有统计学意义时,校正系数会减小,校正 系数越大,模型拟合的越好。
4、剩余标准差(Std.Error Of The Estimate):剩余标 准差越小,说明建立的模型效果越好。
深大师范学院
版权所有,盗版必
概 要
1、多元线性回归的前提假设 2、衡量多元线性回归方程优劣的标准
各子对话框介绍
3、多元性回归的SPSS实现 常选按钮
结果分析
4、多元线性回归预测和区间估计
版权所有,盗版必
一、线性回归的前提假设及SPSS操作实现
线性趋势(Linear) 自变量与因变量的关系是线性的,否则不能采用线性回归,可通过
版权所有,盗版必
1、线性趋势(GraphsLegaly DialogsScatter/dotMatrix Scatter)(即散 点图判断)
当有多个自变量时
,可以通过散点图 矩阵同时绘制各变 量间的散点图,快 速发现多个变量间 的主要相关。
散点图矩阵
版权所有,盗版必
1、线性趋势(GraphsLegaly DialogsScatter/dotMatrix Scatter)(即散点图判断)
)
Di正组alo态Xg后性s,是YH指的is在t分o给g布r定a为m一
正态分布。
点此,才可给出 正态分布曲线图
版权所有,盗版
2、正态性( GraphsLegaly DialogsHistogram)
3、方差齐性(Analyze→Regression→Linear Regression:plot选项
版权所有,盗版
二、衡量多元线性回归模型优劣的标准
版权所有,盗
三、线性回归的SPSS实现
1、 SPSS中的回归分析操作(Analyze→Regression→Linear Regression) :各复选框基本知识介绍
因变量 框
自变量框 选取变量的方 法
版权所有,盗版
迫所有变量有顺序进入回归方程式。若研究者有 事先建立的假设,决定变量重要性层次则该适用 该法。
输 量 矩 协出 间 阵 方引 , 化输 准 的方 的 和 差入 决 。出 回 可自 的 相程 相 各 矩一 定每归信变描关各关变阵个系一系区量述系自系量。变数个数间、统数变数的量的非。因计等9后变标5变值。% 量及
1、 SPSS中的回归分析操作(Statistics介绍)
变异构成(Variance Proportion):回归模型中各项(包 括常数项)的变异被各主成分所解释的比例,如果某个 主成分对两个或多个自变量的贡献均较大(大于0.5), 说明这几个自变量间存在一定程度的共线性。
版权所有,盗版
多重共线性的识别
1、 SPSS中的回归分析操作(Statistics介绍)
版权所有,盗
1、线性趋势(GraphsLegaly DialogsScatter/dotMatrix Scatter)(即散点图判断)
4个变量两两 相交形成44 的矩阵。
由散点图可知题目类型与试题难度间 的线性条件不明显,因此可以不考虑 题目类型对试题难度的回归。
2、正态性(
GraphsLegaly
各
子
对
话 框
1、 SPSS中的回归分析操作(Statistics介绍)
奇三默 归异个默认 系值标判准认输 数别差输出相(之出项关默外判,的认)定输统值。系出计为 与量回, 数、调整判定系
如回归系数、回归系数 数、回归方程的
标准误、标准回百度文库系数 标准误、F 检验
、统计量和相应的相伴 分析表。
概率值、各自变量容忍
散点图判断。 独立性(Independent)
因变量的取值相互独立,没有自相关。也即是要求残差间相互独立 ,否则应采用自回归来分析。自变量多重共线性的判断。 正态性(Normal)
就自变量的任何一个线性组合,因变量均服从正态分布,即要求残 差服从正态。 方差齐性(Equal)
就自变量的任何一个线性组合,因变量的方差均相同,即要求残差 方差齐。
条件指针(Condiction Index,CI 值):等于最大的主成 分与当前主成分的比值的算术平方根。所以第一个主成 分相对应的条件指数总为1.同样,如果几个条件指数较 大(如30),则提示存在多重共线性。
版权所有,盗版
多重共线性的识别(Collinearity Diagnostics)
特征根(Eigenvalue):对模型中常数项及所有自变量计 算主成分,如果自变量间存在较强的线性相关关系,则 前面的几个主成分数值较大,而后面的几个主成分较小 ,甚至接近0。
逐步多元回归分析法(Stepwise):逐一 、重复筛查引入变量,直至获得最好模型。
向前进入法(Forward):对各变量拟合 其与因变量的模型,将p值最小的模型对应的自 变量首先选入方程。
向后进入法(Backward):对各变量拟合 其与因变量的模型,将p值最大的模型对版应权的所自有,盗版
1、 SPSS中的回归分析操作(Analyze→Regression→Linear Regression) :各复选框基本知识介绍
多重共线性的识别: 对自变量的考察。
版权所有,盗版
多重共线性的识别(Collinearity Diagnostics)
容忍度(Tolerance):等于1减去以该自变量为反应变量 Independent框中选入的其他自变量为自变量所得到的线 性回归模型的决定系数。容忍度越小,多重共线性越严 重。
方差膨胀因素(Variance Inflation Factor,VIF):容 忍度的倒数;VIF越大,多重共线性问题越大。
介绍)
选入ZPRED与ZRESID进入 X,Y两个变量框就可实现。
二、衡量多元线性回归模型优劣的标准
1、复相关系数R(Multiple Correlation Coefficient ):表示模型中所有自变量与因变量之间线性回归关系 的密切程度大小,取值范围为(0,1),R值越大越好。
2、决定系数R2(Determinate Coefficient):等于复相 关系数的平方。表示因变量的总变异中可由回归模型 中自变量解释的部分所占的比例。 R2越大越好。
版权所有,盗版
二、衡量多元线性回归模型优劣的标准
3、校正的决定系数R2adj(Adjusted R Square):当模型中 增加的变量没有统计学意义时,校正系数会减小,校正 系数越大,模型拟合的越好。
4、剩余标准差(Std.Error Of The Estimate):剩余标 准差越小,说明建立的模型效果越好。