SPSS软件的操作与应用第6讲 回归概念、回归系数

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

相 关
2
第6讲
回归分析
3
基本概念
4
一、“回归”起源
“回归”一词是英国生物学 家、统计学家高尔顿(F.Galton)在研 究父亲身高和其成年儿子身高关系时提 出的。 从大量父亲身高和其成年儿 子身高数据的散点图中,Galton发现 了一条贯穿其中的直线,它能描述父 亲身高和其成年儿子身高的关系,并 可以用于根据父亲身高预测其成年儿 子身高。
表3
Sum of Squares 82047704 15783976 97831680
ANOVAb df 1 18 19 Mean Square 82047703.55 876887.580 F 93.567 Sig . .000a
结果分析: (3) 方差分析表(表3) a. Predictors: (Constant), 房 评 价 产 估 值 b. Dependent Variable: 销 价 售 格 F检验统计量的观测值=93.567,伴随概率=0.000<0.05,拒绝零假设,说明自变 量x和因变量y之间线性关系显著,可以建立线性模型。 (4)模型系数表(表4) 常数项Constant=895.020,回归系数=1.351 ;回归系数的伴随概率=0.000,拒 绝零假设,说明自变量x和因变量y之间线性关系显著,可以建立线性模型。
13
三、线性回归的适用条件
• 线性趋势:即自变量与因变量的关系是线性的。 • 独立性:因变量Y的取值相互独立。反映在方程中即残差独立。 • 正态性:即自变量的任何一个线性组合,Y应该服从正态分布。反映 在方程中即残差Ei服从正态分布。 • 方差齐性:自变量的任何一个线性组合,Y的方差相同。
三、线性回归
表1
Model 1 Variables Entered/Removedb Variables Entered 房 评 产 a 估 价 值 Variables Removed . Method Enter
表2
Model 1 R .916a
Model Summary R Sq uare .839 Adjusted R Sq uare .830 Std. Error of the Estimate 936.42276
3. 线性回归方程的统计检验
通过样本数据建立的回归方程,不能立即用于对实际问题的分析和预 测,还需要进行各项统计检验。
回归方程的拟合优度检验 检验样本数据点聚集在回归线周围的密集程度,从而评价回归方程对样 本数据的代表程度。 拟合优度检验采用判定(决定)系数 R 2 (一元)和调整判定(决定)系数 R 2 (多元),来检验。其中R是自变量x和因变量y之间的相关系数。 R 2 和 R 2 取值范围是0~1,越接近1表示拟合优度越高,反之就越低。
4.

回归分析的基本过程
确定自变量、因变量 确定回归模型 估计模型中的参数(建立回归方程) 对回归模型进行各种检验 模型应用(利用回归方程预测)
8
二、回归的基本概念
回归分析可以解决的问题
确定因变量与若干个自变量之间联系的定量表达式,即回归方程或数学模型 通过控制可控变量的数值,借助数学模型来预测或控制因变量的取值和精度 进行因素分析,从影响因变量变化的自变量中区分出重要因素和次要因素
上节回顾 相关分析
描述变量之间的关系
二元变量分析 偏相关分析 距离相关分析
上节回顾
相关概念
相关分析就是描述两个或两个以上变量间关系密切程度的统计方 法,有效地揭示事物之间相关关系的强弱程度。
二元变量相关分析(散点图——直观;相关系数——精准) 偏相关分析(固定某些变量,研究其它变量之间的关系) 距离相关分析
16
三、线性回归
3. 线性回归方程的统计检验
回归系数的显著性检验 检验每个自变量与因变量之间的线性关系是否显著,能否保留在方程中
1.显著性检验H0假设是:回归系数与0无显著性差异。 2.检验t 统计量,SPSS自动计算统计量的观测值和对应的伴随概率。 3.如果伴随概率大于显著性水平ɑ= 0.05,接受H0假设,回归系数与0无显著 性差异。表明自变量x和因变量y之间线性关系不显著,回归方程无实际意义。 如果伴随概率小于显著性水平ɑ=0.05,拒绝H0假设,回归系数与0有显著性 差异。表明自变量x和因变量y之间有线性关系,回归方程有实际意义。
相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。

相 关 与 回 归
7
二、回归的基本概念
3. 回归分析的目的
根据已知的资料或数据,找出变量之间的关系表达式(找到回归线或回 归方程),用自变量的已知值去推测因变量的值或范围(进行预测),实际上 是研究因果关系。(例如: y 0 1 x )
Sig . .112 .000
a. Dependent Variable: 销 价 售 格
24
三、线性回归
5. SPSS操作及案例分析 结果分析:
结论: 根据上述分析结果,可以得到回归方程,用该方程来进行分析和预测实际问题, 结果较为准确。
y 895.02 1.351x
举例:
x y 实际销售值 y-实际销售值 2780 4648.02 4850 -201.98 3950 6227.52 6200 27.52 7283 10727.07 11650 -922.93
表4
Model 1 Coefficientsa Standardized Coefficients Beta .916
(Constant) 房 评 价 产 估 值
Unstandardized Coefficients B Std. Error 895.020 535.833 1.351 .140
t 1.670 9.673
5.
分类
根据变量之间相关关系的表现形式分为 线性回归分析:变量之间的相关关系是线性关系 非线性回归分析:变量之间的相关关系是非线性关系
根据影响因变量的自变量的多少分为 一元回归分析 多元回归分析
9
二、回归的基本概念
6. 回归分析的功能
实现回归分析的功能主要在“Analyze→Regression”命令菜单中, 主要分为: 线性回归分析 曲线估计分析 二维逻辑分析 多维逻辑分析 顺序分析 概率分析 非线性回归分析 加权估计分析 两阶最小二乘分析
1 0 i 0
17
三、线性回归
4. 线性回归方程的统计检验 残差分析 残差是指由回归方程计算所得的预测值与实际样本值之间的差距。 残差分析是回归方程检验的重要组成部分,如果回归方程能够较 好地反映变量之间的变化规律,那么残差中不包含明显的规律性和趋 势性。 残差分析的主要内容
(1)残差均值为0的正态性分析 对应的残差有正负,但总体上应服从以0为均值的正态分布。可以通过 绘制标准化(或学生化)残差的累计概率图来分析。 (2)残差的独立性分析 回归方程要求前期和后期的残差数值之间不存在相关关系,即不存在自 相关。可以通过绘制残差的序列图、计算残差的自相关系数和DW(DurbinWatson)检验来分析
19
三、线性回归的步骤
1.做出散点图,观察变量间的趋势; 2.构建回归模型进行回归分析 3.回归方程检验; 4.残差分析; 5.多重共线性问题的判断处理。
1.求相关系数矩阵,系数在0.9以上的将会存在共线性问题,0.8以上可能会 有问题; 2.容忍度(Tolerance):指标越小,共线性可能越严重。如果小于0.1,可 认为共线性严重。
5
一、“回归”起源
Galton通过上述研究发现儿子的平均身高一般总是介于其父亲与其种 族的平均高度之间,即儿子的身高在总体上有一种“回归”到其所属种族高 度的趋势,这种现象称为回归现象,贯穿数据的直线称为回归线。
回归概念产生以后,被广泛应用于各个领域之中,并成为研究随机变量 与一个或多个自变量之间变动关系的一种统计分析技术。
15
三、线性回归
3. 线性回归方程的统计检验
回归方程的显著性检验 检验因变量与所有的自变量之间的线性关系是否显著
Fra Baidu bibliotek
y 0 1 x
1 0 1.显著性检验H0假设是:回归系数与0无显著性差异。 1 2 ... n 0
2.检验采用F统计量,SPSS自动计算统计量的观测值和对应的伴随概率。 3.如果伴随概率大于显著性水平ɑ= 0.05,接受H0假设,回归系数与0无显著 性差异。表明自变量x和因变量y之间线性关系不显著,回归方程无实际意义。 如果伴随概率小于等于显著性水平ɑ=0.05,拒绝H0假设,回归系数与0有显 著性差异。表明自变量x和因变量y之间有线性关系,回归方程有实际意义。
a. All req uested variables entered. b. Dependent Variable: 销 价 售 格
a. Predictors: (Constant), 房 评 价 产 估 值
23
三、线性回归
5. SPSS操作及案例分析
Model 1 Reg ression Residual Total

10
线性回归
11
三、线性回归
1. 线性回归的概念
线性函数是变量之间存在的各种关系中最简单的形式,具有这种关系的 回归叫做线性回归。 线性回归根据自变量多少分为一元线性回归和多元线性回归
12
三、线性回归
2. 线性回归的模型
下面以一元线性回归为例,解析线性回归模型。 y x x ... x 0 1 1 2 2 n n
6
二、回归的基本概念
1. 回归分析的概念
回归分析就是研究一个或多个变量的变动对另一个变量的变动的影响程 度的方法。
2.
相关分析与回归分析的关系
相关分析是根据统计数据,通过计算分析变量之间关系的方向和紧密程 度,而不能说明变量之间相互关系的具体形式,无法从一个变量的变化 来推测另一个变量的变化情况。 回归分析能够确切说明变量之间相互关系的具体形式,可以通过一个相 关的数学表达式,从一个变量的变化来推测另一个变量的变化情况,使 估计和预测成为可能。
18
三、线性回归
4. 线性回归方程的统计检验
(3)异方差分析 无论变量的取值如何变化,对应的残差分析的方差都应相等(齐性),否 则认为出现了异方差现象,异方差会导致回归系数的显著性检验出现较大偏 差。可以通过: 绘制残差图和等级相关分析来分析。 (4)探测样本中的异常值 异常值对回归方程影响较大,可以利用残差分析探测样本中的异常值, 加以排除。 对于探测因变量y中的异常值方法:标准化残差、学生化残差和剔除残 差。 对于探测自变量x中的异常值方法:杠杆值、库克距离、标准化回归系 数和标准化预测值的变化。
三、线性回归
5. SPSS操作及案例分析
例一:一元线性回归分析 一家地产公司调查了某城市的房地产销售价格与 房产的评估价值的数据,请用一元线性回归分析,能 否用房产的评估价值来预测房地产销售的价格。
分析: 1.自变量:房产的评估价值;因变量:房地产销售价格 2.散点图分析 3.一元线性回归结果分析
21
三、线性回归
5. SPSS操作及案例分析
结果分析: 从建立的散点图来看,自变量x和因变量y之间存在一定的线性关系,而且相 关程度较高。
22
三、线性回归
5. SPSS操作及案例分析
结果分析: (1) 变量进入/移出表(表1) Enter表示选定变量全部进入模型 (2) 模型综述表(表2) 相关系数R=0.916、判定系数R2=0.839、调整判定系数R2=0.830,说明变量之间 相关程度高,回归方程的拟合优度高。
一元线性回归的数学模型为: y 0 1 x 多元线性回归数学模型 在数学模型中 0、1 分别称为回归常数和回归系数, 称为随机误差。 从数学模型可以看出因变量y的变化由两部分组成 自变量x的变化所引起的y的线性变化,即 y 0 1 x 其他随机因素引起的y的变化,即 如果随机误差的期望为0,那么数学模型可以转化为: y 0 1 x 称为一元线性回归方程 从几何意义上讲,一元线性回归方程是一条直线, 即回归线。 从一元线性回归方程可以看出,一元线性回归分析是在不考虑随机因素条件下 进行分析的,所以是在比较理想状态下的分析
相关文档
最新文档