《SPSS操作回归分析》PPT课件
合集下载
第9章 SPSS的线性回归分析 PPT课件
2019/4/17 6
第9章 SPSS的线性回归分析
一元线性回归方程的检验
(一)拟和优度检验:
(3)统计量:判定系数
R2 ˆ ( y
n
i 1 i 1 – R2=SSR/SST=1-SSE/SST. – R2体现了回归方程所能解释的因变量变差的比例;1-R2则体 现了因变量总变差中,回归方程所无法解释的比例。 – R2越接近于1,则说明回归平方和占了因变量总变差平方和 的绝大部分比例,因变量的变差主要由自变量的不同取值造 成,回归方程对样本数据点拟合得好 – 在一元回归中R2=r2; 因此,从这个意义上讲,判定系数能够 比较好地反映回归直线对样本数据的代表程度和线性相关性。
( y
i 1 n
i
y)
2
1 y)2
( y ( y
i 1 n
n
i
ˆ )2 y y)2
i
i
2019/4/17
第9章 SPSS的线性回归分析
7
一元线性回归方程的检验
(二)回归方程的显著性检验:F检验
(1)目的:检验自变量与因变量之间的线性关系是否显著,是否可用 线性模型来表示. (2)H0: β =0 即:回归系数与0无显著差异 ˆi y )2 / k (y F ˆ i )2 /(n k 1) (3)利用F检验,构造F统计量: ( yi y
– F=平均的回归平方和/平均的剩余平方和~F(1,n-1-1) – 如果F值较大,则说明自变量造成的因变量的线性变动远大于随机因素 对因变量的影响,自变量于因变量之间的线性关系较显著 (4)计算F统计量的值和相伴概率p (5)判断 – p<=a:拒绝H0,即:回归系数与0有显著差异,自变量与因变量之间存在 显著的线性关系。反之,不能拒绝H0
第9章 SPSS的线性回归分析
一元线性回归方程的检验
(一)拟和优度检验:
(3)统计量:判定系数
R2 ˆ ( y
n
i 1 i 1 – R2=SSR/SST=1-SSE/SST. – R2体现了回归方程所能解释的因变量变差的比例;1-R2则体 现了因变量总变差中,回归方程所无法解释的比例。 – R2越接近于1,则说明回归平方和占了因变量总变差平方和 的绝大部分比例,因变量的变差主要由自变量的不同取值造 成,回归方程对样本数据点拟合得好 – 在一元回归中R2=r2; 因此,从这个意义上讲,判定系数能够 比较好地反映回归直线对样本数据的代表程度和线性相关性。
( y
i 1 n
i
y)
2
1 y)2
( y ( y
i 1 n
n
i
ˆ )2 y y)2
i
i
2019/4/17
第9章 SPSS的线性回归分析
7
一元线性回归方程的检验
(二)回归方程的显著性检验:F检验
(1)目的:检验自变量与因变量之间的线性关系是否显著,是否可用 线性模型来表示. (2)H0: β =0 即:回归系数与0无显著差异 ˆi y )2 / k (y F ˆ i )2 /(n k 1) (3)利用F检验,构造F统计量: ( yi y
– F=平均的回归平方和/平均的剩余平方和~F(1,n-1-1) – 如果F值较大,则说明自变量造成的因变量的线性变动远大于随机因素 对因变量的影响,自变量于因变量之间的线性关系较显著 (4)计算F统计量的值和相伴概率p (5)判断 – p<=a:拒绝H0,即:回归系数与0有显著差异,自变量与因变量之间存在 显著的线性关系。反之,不能拒绝H0
用SPSS做回归分析ppt课件
从而用以进行预测或控制,达到指导生产活动的目的。
例1、某医学研究所对30个不同年龄的人的血压(高 压)进行了测量,得到如下数据:
年龄 39 47 45 47 65 45 67 42 67 56 36 50 39 21 44 血压 144 120 138 145 162 142 170 124 158 154 136 142 120 120 116 年龄 64 56 59 34 42 48 45 17 20 19 53 63 29 25 69 血压 162 150 140 110 128 130 135 114 116 124 158 144 130 125 175
初步分析作图察看按statisticsregressionlinear顺序展开对话框将y作为因变量选入dependent框中然后将其他变量选入作为自变量选入independents框中method框中选择stepwise逐渐回归作为分析方式单击statistics按钮进展需求的选择单击continue前往回归模型的建立被引入与被剔除的变量回归方程模型编号引入回归方程的自变量称号从回归方程被剔除的自变量称号回归方程中引入或剔除自变量的根据结果分析由复相关系数r0982阐明该预告模型高度显著可用于该地域大春粮食产量的短期预告常用统计量方差分析表回归方程为
在最优的方程中,所有变量对因变量Y的影响都应 该是显著的,而所有对Y影响不显著的变量都不包含 在方程中。选择方法主要有:
•逐步筛选法(STEPWISE) (最常用) •向前引入法(FORWARD) •向后剔除法(BACKWARD)等
逐步回归的基本思想和步骤:
开始
对不在方程中的变 量考虑能否引入?
能 引入变量
X1 137. 0 148. 0 154. 0 157. 0 153. 0 151. 0 151. 0 154. 0 155. 0 155. 0 156. 0 155. 0 157. 0 156. 0 159. 0 164. 0 164. 0 156. 0
例1、某医学研究所对30个不同年龄的人的血压(高 压)进行了测量,得到如下数据:
年龄 39 47 45 47 65 45 67 42 67 56 36 50 39 21 44 血压 144 120 138 145 162 142 170 124 158 154 136 142 120 120 116 年龄 64 56 59 34 42 48 45 17 20 19 53 63 29 25 69 血压 162 150 140 110 128 130 135 114 116 124 158 144 130 125 175
初步分析作图察看按statisticsregressionlinear顺序展开对话框将y作为因变量选入dependent框中然后将其他变量选入作为自变量选入independents框中method框中选择stepwise逐渐回归作为分析方式单击statistics按钮进展需求的选择单击continue前往回归模型的建立被引入与被剔除的变量回归方程模型编号引入回归方程的自变量称号从回归方程被剔除的自变量称号回归方程中引入或剔除自变量的根据结果分析由复相关系数r0982阐明该预告模型高度显著可用于该地域大春粮食产量的短期预告常用统计量方差分析表回归方程为
在最优的方程中,所有变量对因变量Y的影响都应 该是显著的,而所有对Y影响不显著的变量都不包含 在方程中。选择方法主要有:
•逐步筛选法(STEPWISE) (最常用) •向前引入法(FORWARD) •向后剔除法(BACKWARD)等
逐步回归的基本思想和步骤:
开始
对不在方程中的变 量考虑能否引入?
能 引入变量
X1 137. 0 148. 0 154. 0 157. 0 153. 0 151. 0 151. 0 154. 0 155. 0 155. 0 156. 0 155. 0 157. 0 156. 0 159. 0 164. 0 164. 0 156. 0
Spss线性回归分析讲稿ppt课件
绘制各自变量与因变量之间的关系散点图,观
察其与因变量之间是否具有线性关系。然后,
将自变量进行组合,生成若干自变量的子集,再
针对每一个自变量的子集生成回归分析报告。
比较调整后的R2值,挑选最优的自变量子集,
生成回归分析模型。
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
①一元线性回归:y=a+bx (有一个自变量)
②多元线性回归:
(有两个或两个以上的自变量)
(2)按回归曲线的形态分
①线性(直线)回归
②非线性(曲线)回归
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
回归分析
(二)回归分析的主要内容
即销售量的95%以上的变动都可以被该模型所解释,拟和优度较高。
表3
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
一元线性回归分析
表4给出了回归模型的方差分析表,可以看到,F统计量为
734.627,对应的p值为0,所以,拒绝模型整体不显著的
图1
奖金-销售量表
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
一元线性回归
以奖金-销售量表图1做回归分析
2、绘制散点图
打开数据文件,选择【图形】-【旧对话框】-【散点/点状】
图2
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
察其与因变量之间是否具有线性关系。然后,
将自变量进行组合,生成若干自变量的子集,再
针对每一个自变量的子集生成回归分析报告。
比较调整后的R2值,挑选最优的自变量子集,
生成回归分析模型。
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
①一元线性回归:y=a+bx (有一个自变量)
②多元线性回归:
(有两个或两个以上的自变量)
(2)按回归曲线的形态分
①线性(直线)回归
②非线性(曲线)回归
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
回归分析
(二)回归分析的主要内容
即销售量的95%以上的变动都可以被该模型所解释,拟和优度较高。
表3
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
一元线性回归分析
表4给出了回归模型的方差分析表,可以看到,F统计量为
734.627,对应的p值为0,所以,拒绝模型整体不显著的
图1
奖金-销售量表
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
一元线性回归
以奖金-销售量表图1做回归分析
2、绘制散点图
打开数据文件,选择【图形】-【旧对话框】-【散点/点状】
图2
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
spss第五讲回归分析PPT课件
关于x的残差图 关于y的残差图 标准化残差图
2、用于判断误差的假定是否成立 3、检测有影响的观测值
34
残差图
(形态及判别)
残
差
0
残
残
差
差
0
0
x
(a)满意模式
x
(b)非常数方差
x
(c)模型不合适
35
二、检验正态性 标准化残差(standardized residual)
2. E(y0) 在1-置信水平下的置信区间为
yˆ0 t 2 (n 2)se
1
n
x0 x 2
n
xi x 2
i 1
式中:se为估计标准误差
29
个别值的预测区间
1. 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计区间,这一
区间称为预测区间(prediction interval) 2. y0在1-置信水平下的预测区间为
一、变差 1、因变量 y 的取值是不同的,y 取值的这种波动称为变
差。变差来源于两个方面
由于自变量 x 的取值不同造成的 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)
的影响
2、对一个具体的观测值来说,变差的大小可以通过该 实际观测值与其均值之差y y 来表示
16
误差分解图
y
(xi , yi )
32
一、检验方差齐性
残差(residual)
1、因变量的观测值与根据估计的回归方程求 出的预测值之差,用e表示
ei yi yˆi
2、反映了用估计的回归方程去预测而引起的 误差
3、可用于确定有关误差项的假定是否成立 4、用于检测有影响的观测值
2、用于判断误差的假定是否成立 3、检测有影响的观测值
34
残差图
(形态及判别)
残
差
0
残
残
差
差
0
0
x
(a)满意模式
x
(b)非常数方差
x
(c)模型不合适
35
二、检验正态性 标准化残差(standardized residual)
2. E(y0) 在1-置信水平下的置信区间为
yˆ0 t 2 (n 2)se
1
n
x0 x 2
n
xi x 2
i 1
式中:se为估计标准误差
29
个别值的预测区间
1. 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计区间,这一
区间称为预测区间(prediction interval) 2. y0在1-置信水平下的预测区间为
一、变差 1、因变量 y 的取值是不同的,y 取值的这种波动称为变
差。变差来源于两个方面
由于自变量 x 的取值不同造成的 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)
的影响
2、对一个具体的观测值来说,变差的大小可以通过该 实际观测值与其均值之差y y 来表示
16
误差分解图
y
(xi , yi )
32
一、检验方差齐性
残差(residual)
1、因变量的观测值与根据估计的回归方程求 出的预测值之差,用e表示
ei yi yˆi
2、反映了用估计的回归方程去预测而引起的 误差
3、可用于确定有关误差项的假定是否成立 4、用于检测有影响的观测值
《SPSS回归分析》ppt课件
.
-3.666
.002
从表中可知因变量与自变量的三次回归模型为: y=-166.430+0.029x-5.364E-7x2+5.022E-12x3
9.2 曲线估计
➢拟合效果图
从图形上看出其拟合效果非常好。
8.3 曲线估计
说明:
曲线估计是一个自变量与因变量的非线性回归过程,但 只能处理比较简单的模型。如果有多个自变量与因变量呈非 线性关系时,就需要用其他非线性模型对因变量进行拟合, SPSS 19中提供了“非线性”过程,由于涉及的模型很多,且 非线性回归分析中参数的估计通常是通过迭代方法获得的, 而且对初始值的设置也有较高的要求,如果初始值选择不合 适,即使指定的模型函数非常准确,也会导致迭代过程不收 敛,或者只得到一个局部最优值而不能得到整体最优值。
8.1 回归分析概述
(3)回归分析的一般步骤
第1步 确定回归方程中的因变量和自变量。 第2步 确定回归模型。 第3步 建立回归方程。 第4步 对回归方程进行各种检验。
➢拟合优度检验 ➢回归方程的显著性检验 ➢回归系数的显著性检验
第5步 利用回归方程进行预测。
主要内容
8.1 回归分析概述 8.2 线性回归分析 8.3 曲线估计 8.4 二元Logistic回归分析
8.3 曲线估计
(2) 统计原理
在曲线估计中,有很多的数学模型,选用哪一种形式的回 归方程才能最好地表示出一种曲线的关系往往不是一个简单的 问题,可以用数学方程来表示的各种曲线的数目几乎是没有限 量的。在可能的方程之间,以吻合度而论,也许存在着许多吻 合得同样好的曲线方程。因此,在对曲线的形式的选择上,对 采取什么形式需要有一定的理论,这些理论是由问题本质决定 的。
SPSS回归分析应用PPT课件
第49页/共379页
表7-1 强度与拉伸倍数的试验数据
序号 1 2 3 4 5 6 7 8 9 10 11 12
拉伸倍数 2.0 2.5 2.7 3.5 4.0 4.5 5.2 6.3 7.1 8.0 9.0 10.0
第50页/共379页
强度(kg/mm2) 1.6 2.4 2.5 2.7 3.5 4.2 5.0 6.4 6.5 7.3 8.0 8.1
第4页/共379页
• 在回归分析中,因变量y是随机变量, 自变量x可以是随机变量,也可以是非随机的 确定变量;而在相关分析中,变量x和变量y都 是随机变量。
• 相关分析是测定变量之间的关系密切 程度,所使用的工具是相关系数;而回归分析 则是侧重于考察变量之间的数量变化规律,并 通过一定的数学表达式来描述变量之间的关系, 进而确定一个或者几个变量的变化对另一个特 定变量的影响程度。
b. Dependent Variable: 财 政 收 入 ( 亿 元 )
第40页/共379页
(2)回归方程的显著性检验(F检验) 回归方程的显著性检验是对因变量与所有 自变量之间的线性关系是否显著的一种假设检 验。 回归方程的显著性检验一般采用F检验,利用 方差分析的方法进行。
第41页/共379页
第42页/共379页
5、回归方程的显著性检验 F检验:检验因变量和诸自变量之间是否存在显著的 线性关系。
检验的假设为:
对给定的显著性水平 ,查F分布表确定临界值。 ,拒绝原假设,说明回归方程显著。
第43页/共379页
变差来源 平方和 自由度
回归 残差 总和
方差
F统计量
第44页/共379页
(3)回归系数的显著性检验(t检验) 所谓回归系数的显著性检验,就是根据样 本估计的结果对总体回归系数的有关假设进行 检验。 之所以对回归系数进行显著性检验,是因 为回归方程的显著性检验只能检验所有回归系 数是否同时与零有显著性差异,它不能保证回 归方程中不包含不能较好解释说明因变量变化 的自变量。因此,可以通过回归系数显著性检 验对每个回归系数进行考察。
表7-1 强度与拉伸倍数的试验数据
序号 1 2 3 4 5 6 7 8 9 10 11 12
拉伸倍数 2.0 2.5 2.7 3.5 4.0 4.5 5.2 6.3 7.1 8.0 9.0 10.0
第50页/共379页
强度(kg/mm2) 1.6 2.4 2.5 2.7 3.5 4.2 5.0 6.4 6.5 7.3 8.0 8.1
第4页/共379页
• 在回归分析中,因变量y是随机变量, 自变量x可以是随机变量,也可以是非随机的 确定变量;而在相关分析中,变量x和变量y都 是随机变量。
• 相关分析是测定变量之间的关系密切 程度,所使用的工具是相关系数;而回归分析 则是侧重于考察变量之间的数量变化规律,并 通过一定的数学表达式来描述变量之间的关系, 进而确定一个或者几个变量的变化对另一个特 定变量的影响程度。
b. Dependent Variable: 财 政 收 入 ( 亿 元 )
第40页/共379页
(2)回归方程的显著性检验(F检验) 回归方程的显著性检验是对因变量与所有 自变量之间的线性关系是否显著的一种假设检 验。 回归方程的显著性检验一般采用F检验,利用 方差分析的方法进行。
第41页/共379页
第42页/共379页
5、回归方程的显著性检验 F检验:检验因变量和诸自变量之间是否存在显著的 线性关系。
检验的假设为:
对给定的显著性水平 ,查F分布表确定临界值。 ,拒绝原假设,说明回归方程显著。
第43页/共379页
变差来源 平方和 自由度
回归 残差 总和
方差
F统计量
第44页/共379页
(3)回归系数的显著性检验(t检验) 所谓回归系数的显著性检验,就是根据样 本估计的结果对总体回归系数的有关假设进行 检验。 之所以对回归系数进行显著性检验,是因 为回归方程的显著性检验只能检验所有回归系 数是否同时与零有显著性差异,它不能保证回 归方程中不包含不能较好解释说明因变量变化 的自变量。因此,可以通过回归系数显著性检 验对每个回归系数进行考察。
第章SPSS回归分析PPT课件
第八章 SPSS的回归分析
2020-01-10
1
8.1 SPSS在一元线性回归分析中的应用
8.1.1 一元线性回归的基本原理
1.方法概述
线性回归模型侧重考察变量之间的数量变化规律,并通过 线性表达式,即线性回归方程,来描述其关系,进而确定一 个或几个变量的变化对另一个变量的影响程度,为预测提供 科学依据。
2020-01-10
4
8.1.2 一元线性回归的SPSS操作详解
第一步:打开对话框
选择菜单栏中的【分析】→【回归】→【线性】命令, 弹出【线性回归】对话框,这是线性回归分析的主操作 窗口。
第二步:选择因变量
在【线性回归】对话框左侧的候选变量列表框中选择 一个变量,将其添加至【因变量】列表框中,即选择该 变量作为一元线性回归的因变量。
协方差矩阵:方差-协方差矩阵。
模型拟合度:模型拟合过程中进入、退出的变量的列表; 以及一些有关拟合优度的检验统计量,例如R、R2和调 整的R2、估计值的标准误及方差分析表。
R方变化:显示每个自变量进入方程后R2、F值和p值的 改
变情况。
描述性:显示自变量和因变量的有效数目、均值、标准
【预测值】为预测栏,用于选择输出回归模型的预测值。
未标准化(U):未标准化的预测值。
标准化(R):标准化的预测值。
调节(J):经调整的预测值。
均值预测值的S.E.(P):预测值的标准误差。
2020-01-10
12
【残差】为残差栏,包含以下选项。 未标准化(N):未标准化残差。 标准化(A):标准化残差。 学生化(S):学生化残差。 删除(L):剔除残差。 学生化已删除(E):学生化剔除残差。 【距离】为距离栏,包含以下选项。 Mahalanobis距离(H)。 Cook 距离(K)。 杠杆值(G)。
2020-01-10
1
8.1 SPSS在一元线性回归分析中的应用
8.1.1 一元线性回归的基本原理
1.方法概述
线性回归模型侧重考察变量之间的数量变化规律,并通过 线性表达式,即线性回归方程,来描述其关系,进而确定一 个或几个变量的变化对另一个变量的影响程度,为预测提供 科学依据。
2020-01-10
4
8.1.2 一元线性回归的SPSS操作详解
第一步:打开对话框
选择菜单栏中的【分析】→【回归】→【线性】命令, 弹出【线性回归】对话框,这是线性回归分析的主操作 窗口。
第二步:选择因变量
在【线性回归】对话框左侧的候选变量列表框中选择 一个变量,将其添加至【因变量】列表框中,即选择该 变量作为一元线性回归的因变量。
协方差矩阵:方差-协方差矩阵。
模型拟合度:模型拟合过程中进入、退出的变量的列表; 以及一些有关拟合优度的检验统计量,例如R、R2和调 整的R2、估计值的标准误及方差分析表。
R方变化:显示每个自变量进入方程后R2、F值和p值的 改
变情况。
描述性:显示自变量和因变量的有效数目、均值、标准
【预测值】为预测栏,用于选择输出回归模型的预测值。
未标准化(U):未标准化的预测值。
标准化(R):标准化的预测值。
调节(J):经调整的预测值。
均值预测值的S.E.(P):预测值的标准误差。
2020-01-10
12
【残差】为残差栏,包含以下选项。 未标准化(N):未标准化残差。 标准化(A):标准化残差。 学生化(S):学生化残差。 删除(L):剔除残差。 学生化已删除(E):学生化剔除残差。 【距离】为距离栏,包含以下选项。 Mahalanobis距离(H)。 Cook 距离(K)。 杠杆值(G)。
spss授课regression70页PPT
17
3.6
3.4
3.2
3.0
2.8
2.6
Y
2.4
肺 2.2
活
量
2.0 40
体重
(Y—Y)
50
∧
(Y—Y)
∧
(Y—Y)
60
18
SS 总=∑(Y-Y)2,为回归平方和,它 反映在Y的总变异中由于X与Y的直线关系 而使Y变异减小的部分,也就是在总平方和 中可以用X解释的部分。SSR越大 ,说明回 归效果越好 。SSE = ∑(Y-Y)2,为剩 余平方和,它反映X对Y的线性影响之外的 一切因素对Y的变异的作用,也就是在总平 方和中无法用X解释的部分。在散点图中, 各测点离回归直线越近,SSE也就越小,说 明直线回归的估计误差越小。
Sig. .03 5a
Coe fficientas
Unstandardized Coef ficients
Standardize d
Coef ficients
Model
B
Std. Error
1
(Constant) -3035.536 2168.674
Beta
X1
60.932
36.297
.464
X2
所有可能的子集回归:对k个自变量的线性回 归问题 ,所有可能的回归有2k个。从这2k个 回归中根据某种变量选择准则,选出一个或 几个“最优”的回归。但在k较大时,由于2k十 分巨大,因而限制了本方法的应用。
34
自变量模型的选择:从可能对因变量Y有影响 的一组自变量中,挑选出对Y有重要影响的变 量,剔除对Y影响不大的变量;或者按某种标 准 ,建立一个“最优”的回归方程 。SPSS中提 供了如下几种自变量选择:
3.6
3.4
3.2
3.0
2.8
2.6
Y
2.4
肺 2.2
活
量
2.0 40
体重
(Y—Y)
50
∧
(Y—Y)
∧
(Y—Y)
60
18
SS 总=∑(Y-Y)2,为回归平方和,它 反映在Y的总变异中由于X与Y的直线关系 而使Y变异减小的部分,也就是在总平方和 中可以用X解释的部分。SSR越大 ,说明回 归效果越好 。SSE = ∑(Y-Y)2,为剩 余平方和,它反映X对Y的线性影响之外的 一切因素对Y的变异的作用,也就是在总平 方和中无法用X解释的部分。在散点图中, 各测点离回归直线越近,SSE也就越小,说 明直线回归的估计误差越小。
Sig. .03 5a
Coe fficientas
Unstandardized Coef ficients
Standardize d
Coef ficients
Model
B
Std. Error
1
(Constant) -3035.536 2168.674
Beta
X1
60.932
36.297
.464
X2
所有可能的子集回归:对k个自变量的线性回 归问题 ,所有可能的回归有2k个。从这2k个 回归中根据某种变量选择准则,选出一个或 几个“最优”的回归。但在k较大时,由于2k十 分巨大,因而限制了本方法的应用。
34
自变量模型的选择:从可能对因变量Y有影响 的一组自变量中,挑选出对Y有重要影响的变 量,剔除对Y影响不大的变量;或者按某种标 准 ,建立一个“最优”的回归方程 。SPSS中提 供了如下几种自变量选择:
相关主题