回归分析方法及其应用实例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
回归分析方法及其应用实例
环境与规划学院
2012级地理科学
2014年11月
回归分析方法及其应用实例
摘要:回归分析方法,就是研究要素之间具体数量关系的一种强有力的工具,运用这种方法能够建立反应地理要素之间具体数量关系的数学模型,即回归模型。
本文首先给出回归分析方法的主要内容及解决问题的一般步骤,简单的介绍了回归分析建模的一般过程,进而引出了基本的一元线性回归分析方法的数学模型。其次,叙述了多元线性回归理论模型,列举了多元线性回归模型应遵从的假定条件,探讨了多元线性回归模型中未知参数的估计方法及其参数的检验问题。最后通过具体的案例来总结了多元回归分析的应用。
关键词:多元线性回归模型;模型检验;SPSS;实例应用。
引言:用回归分析建模的一般过程:(1)画散点图(2)设定模型(3)最小二乘估计模型中的参数并写出回归方程(4)拟合优度的测量(5)回归参数的显著性检验及其置信区间(6)残差分析(回归分析的前提假定)(7)预测(点、区间)
在利用回归分析解决问题时,首先要建立模型,即函数关系式,其自变量称为回归变量,因变量称为应变量或响应变量。如果模型中只含有一个回归变量,称为一元回归模型,否则称为多元回归模型(实际中所见到的大都是线性回归模型,非线性的一般可以化为线性的来处理)。
一、一元线性回归模型
有一元线性回归模型(统计模型)如下:Y t =β0+β1 x t + u t上
式表示变量y t和x t之间的真实关系。其中yt称被解释变量(因变量),xt称解释变量(自变量),ut称随机误差项,β0称常数项,β1称回归系数(通常未知)。上模型可以分为两部分。(1)回归函数部分,E(y t) =β0+ β1 x t,(2)随机部分,u t(包含了所有没有考虑在内的影响因素对因变量的影响,越小越好)
二、多元线性回归模型
2.1 当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元线性回归。
设可预测的随机变量为y,它受到k个非随机因素X1,X2,X3``````X k 和不可预测的随机因素ε的影响。多元线性回归数学模型为:
回归方程:
2.2假定条件:
与一元线性回归模型的基本假定相似,为保证得到最优估计量,多元线性回归模型应满足以下假定条件:(1)随机误差项t满足均值为零,其方差相同且为有限值。(2)随机误差项之间相互独立,无自相关。(3)解释变量X nj,j=1,2,3`````k之间线性无关,否则称解释变量之间存在多重共线性。(4)解释变量Xnj,,j=1,2,3`````k是确定性变量,与误差项彼此之间相互独立。(5)解释变量是非随机变量。(6)随机误差项服从正态分布。(7)回归模型是正确设计的。
2.3估计回归系数,确定回归方程
用最小二乘法估计偏回归系数β1β2β3β4,,,βk从而写出回归方程。
2.4方程的显著性检验
(1)对回归方程进行检验
对整个模型或方程进行检验通常用统计量F和拟合优度R2进行衡量。
F检验:对回归方程进行F检验,首先求出回归方程的F值,再查F分分布表,求出F a(p,n-p-1)若F>Fa(p,n-p-1),则认为回归方程是显著的。
R2检验:拟合优度检验是检验回归方程对散点拟合的程度,其值在0-1之间,越接近于1,表明模型的规律性越强,拟合程度越高。
(2)对回归系数进行检验
对于有多个变量的回归方程来说,要考虑每一个自变量X i对因变量y的影响程度问题,即对回归系数进行检验。对于检验后影响不显著的自变量,应该在回归方程式中予以剔除,剔除后重新进行回归,从而更准确地描述回归方程。通常用统计量t进行检验。
2.5利用方程预测
三、多元线性回归分析方法在实例中的应用
以河南省1990年农业数据为例用多元线性回归分析方法对
其进行回归分析:(SPSS)
(1)回归模型建立
Coefficients a
Model Unstandardized
Coefficients
Standardized
Coefficients
t Sig.
Collinearity
Statistics
B Std. Error Beta Tolerance VIF
1 (Constant) 5496.435 2193.885 2.505 .014
有效灌溉面积d万亩201.293 48.227 .276 4.174 .000 .412 2.430 农用化肥施用量d折
吨量
.023 .049 .023 .470 .639 .732 1.366 农村用电量d万千瓦
小时
-.125 .262 -.027 -.478 .634 .582 1.717 农用塑料薄膜使用量
d吨
6.825 3.768 .093 1.812 .073 .685 1.461
农业机械总动力d万
千瓦
55.451 118.707 .032 .467 .641 .395 2.535
年末实有耕地面积d
万亩
142.457 41.404 .328 3.441 .001 .197 5.073 农林牧副渔业劳动力
d万人
550.672 158.126 .335 3.483 .001 .194 5.165 a. Dependent Variable: 农业总产值d万元按1990年不变价格计算
由上表格可以写出多元回归方程:
y=5496.435+201.293x1+0.023x2-0.125x3+6.825x4+55.451x5+14 2.457x6+550.672x7
其中:Y——农业总产值. X1——有效灌溉面积。``````X6——年末实有耕地面积。X7——农林牧副渔业劳动力
在表中,Sig那一列的值,即t检验值> 0.1,即存在多重共线性,所以对其进行逐步分析。
(2)回归方程检验:
用SPSS软件对数据进行分析处理,得出如下分析检验结果。