spss第五讲回归分析 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

i1
bˆ0 bˆ1xi)2
0
Q
b1
b1bˆ1
bˆ 0
Fra Baidu bibliotek
第二部分线性回归
线性回归分为一元线性回归和多元线性回归。一、一元线性回归：
1、涉及一个自变量的回归
2、因变量y与自变量x之间为线性关系
被预测或被解释的变量称为因变量(dependent variable)，
用y表示
用来预测或用来解释因变量的一个或多个变量称为自变量
(independent variable)，用x表示
多元线性回归一般采用逐步回归方法-Stepwise。
.
(一) 一元线性回归模型
(linear regression model)
1、描述因变量 y 如何依赖于自变量 x 和误差项的方程称为回归模型
2、一元线性回归模型可表示为
y = b0 b1 x
Y是x 的线性函数
(部分)加上误差项
b0 和 b1 称为模
.
第一部分回归分析
什么是回归分析？
1、重点考察一个特定的变量(因变量)，而把其他变量(自变量)看作是影响这一变量的因素，并通过适当的数学模型将变量间的关系表达出来
2、利用样本数据建立模型的估计方程 3、对模型进行显著性检验 4、进而通过一个或几个自变量的取值来估
计或预测因变量的取值 .
回归分析的模型
3 、误差项满足条件
.
误差项满足条件
正态性。是一个服从正态分布的随机变量，且
期望值为0，即 ~N(0 , 2 ) 。对于一个给定的 x 值， y 的期望值为E(y)=b0+ b1x
方差齐性。对于所有的 x 值，的方差一个特定
的值，的方差也都等于 2 都相同。同样，一个特定的x 值， y 的方差也都等于2
3、因变量与自变量之间的关系用一个线性方程来表示
.
线性回归的过程
一元线性回归模型确定过程一、做散点图(Graphs ->Scatter->Simple)
目的是为了以便进行简单地观测（如： Salary与Salbegin的关系)。二、建立方程若散点图的趋势大概呈线性关系，可以建立线性方程，若不呈线性分布，可建立其它方程模型，并比较R2 (-->1)来确定一种最佳方程式（曲线估计）。
.
Karl Gauss的最小化图
y
(xn , yn)
(x2 , y2)
(x1 , y1)
ei = yi＾-yi
(xi , yi)
.
yˆ bˆ0 bˆ1x
x
参数的最小二乘估计
( bˆ 0和 bˆ 1 的计算公式)
根据最小二乘法，可得求解
bˆ
和
0
bˆ
1
的
公式如下：
Q
b0
b0bˆ0
n
2 (yi
（二）参数的最小二乘估计
德国科学家Karl Gauss(1777—1855)提出用最小化图中垂直方向的误差平方和来估计参数
使因变量的观察值与估计值之间的误差平方和
达到最小来求得bˆ0和 bˆ1的方法。即
n
n
(yi yˆ)2 (yi bˆ0 bˆ1xi )2 最小
i1
i1
注：用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小。
.
回归分析的过程
在回归过程中包括：
Liner：线性回归 Curve Estimation：曲线估计
Binary Logistic：二分变量逻辑回归 Multinomial Logistic：多分变量逻辑回归； Ordinal 序回归；Probit：概率单位回归； Nonlinear：非线性回归； Weight Estimation：加权估计； 2-Stage Least squares：二段最小平方法； Optimal Scaling 最优编码回归我们只讲前面2个简单的（一般. 教科书的讲法）
2. 用样本统计量 bˆ0和 bˆ1 代替回归方程中的未知参
数β0和β1 ，就得到了估计的回归方程
3. 一元线性回归中估计的回归方程为
yˆ bˆ0 bˆ1x
其中：bˆ0是估计的回归直线在 y 轴上的截距， b是ˆ1直线的斜
率，它表示对于一个给定的 x 的值，是yˆ y 的估计值，也
表示 x 每变动一个单位时， y 的.平均变动值
一、分类
按是否线性分：线性回归模型和非线性回归模型
按自变量个数分：简单的一元回归和多元回归
二、基本的步骤
利用SPSS得到模型关系式，是否是我们所要的？要看回归方程的显著性检验（F检验）
回归系数b的显著性检验(T检验)
拟合程度R2
(注：相关系数的平方，一元回归用R Square，多元回归
用Adjusted R Square)
r01.23
r02r03.2r13.2 1r023.2 1r32.2
r 0 i.1 2 L ( i 1 ) ( i 1 ) L p r 0 i.1 2 L ( i 1 1 ) ( i r 0 2 1 p ) . L 1 2 ( L p ( 1 p ) 1 ) r 0 1 p . 1 2 r L i 2 p ( .1 p 2 L 1 ) ( r i i p 1 .1 ) ( 2 i L 1 ( i ) L 1 ( ) ( p i 1 1 ) ) L ( p 1 )
独立性。独立性意味着对于一个特定的 x 值，
它所对应的ε与其他 x 值所对应的ε不相关；对于一
个特定的 x 值，它所对应的 y 值与其他 x 所对应的
y 值也不相关
.
估计的回归方程
(estimated regression equation)
1. 总体回归参数β0和β1是未知的，必须利用样本数据去估计
第五讲回归分析、线性回归和曲线估计
第一部分回归分析第二部分线性回归第三部分曲线估计
.
第一部分第十讲回顾在对其他变量的影响进行控制
的条件下，衡量多个变量中某两个变量之间的线性相关程度的指标称为偏相关系数。
.
偏相关分析的公式表达
r r01r02r12 01.2 1r022 1r122
型的参数
误差项是随机
变量
注：线性部分反映了由于x的变化而引起的y的变
化；误差项反映了除x和y之间的线性关系之
外的随机因素对y的影响，它是不能由x和y之间的线性关系所解释的变. 异性。
一元线性回归模型（基本假定）
1、因变量x与自变量y之间具有线性关系
2、在重复抽样中，自变量x的取值是固定的，即假定x是非随机的