多元线性回归分析实例及教程

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多元线性回归分析预测法概述

在市场的经济活动中,经常会遇到某一市场现象的开展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。例如,某一商品的销售量既与人口的增长变化有关,也与商品价格变化有关。这时采用一元回归分析预测法进展预测是难以奏效的,需要采用多元回归分析预测法。

多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进展预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。

[编辑]

多元线性回归的计算模型[1]

一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进展的回归分析就是多元性回归。

设y为因变量,为自变量,并且自变量与因变量之间为线性关系时,那么多元线性回归模型为:

其中,b

0为常数项,为回归系数,b1为固定时,x1每增加一

个单位对y的效应,即x

1对y的偏回归系数;同理b2为固定时,x2每增加一

个单位对y的效应,即,x

2对y的偏回归系数,等等。假如两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描绘为:

其中,b

0为常数项,为回归系数,b1为固定时,x2每增加

一个单位对y的效应,即x

2对y的偏回归系数,等等。假如两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描绘为:

y = b

0 + b1x1 + b2x2 + e

建立多元性回归模型时,为了保证回归模型具有优良的解释才能和预测效果,应首先注意自变量的选择,其准那么是:

(1)自变量对因变量必须有显著的影响,并呈亲密的线性相关;

(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;

(3)自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度;

(4)自变量应具有完好的统计数据,其预测值容易确定。

多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和()为最小的前提下,用最小二乘法求解参数。以二线性回归模型为例,求解回归参数的标准方程组为

解此方程可求得b

0,b1,b2的数值。亦可用以下矩阵法求得

[编辑]

多元线性回归模型的检验[1]

多元性回归模型与一元线性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进展必要的检验与评价,以决定模型是否可以应用。

1、拟合程度的测定。

与一元线性回归中可决系数r2相对应,多元线性回归中也有多重可决系数r2,它是在因变量的总变化中,由回归方程解释的变动(回归平方和)所占的比重,R2越大,回归方各对样本数据点拟合的程度越强,所有自变量与因变量的关系越亲密。计算公式为:

其中,

2.估计标准误差

估计标准误差,即因变量y的实际值与回归方程求出的估计值之间的标准误差,估计标准误差越小,回归方程拟合程度越程。

其中,k为多元线性回归方程中的自变量的个数。

3.回归方程的显著性检验

回归方程的显著性检验,即检验整个回归方程的显著性,或者说评价所有自变量与因变量的线性关系是否亲密。能常采用F检验,F统计量的计算公式为:

根据给定的显著程度a,自由度(k,n-k-1)查F分布表,得到相应的临界值F

a,假设F > F a,那

么回归方程具有显著意义,回归效果显著;F < F

a,那么回归方程无显著意义,回归效果不显著。

4.回归系数的显著性检验

在一元线性回归中,回归系数显著性检验(t检验)与回归方程的显著性检验(F检验)是等价的,但在多元线性回归中,这个等价不成立。t检验是分别检验回归模型中各个回归系数是否具有显

著性,以便使模型中只保存那些对因变量有显著影响的因素。检验时先计算统计量t

i;然后根据

给定的显著程度a,自由度n-k-1查t分布表,得临界值t

a或t a / 2,t > t− a或t a / 2,那么回归系数b i

与0有显著关异,反之,那么与0无显著差异。统计量t的计算公式为:

其中,C

ij是多元线性回归方程中求解回归系数矩阵的逆矩阵(x'x)− 1的主对角线上的第j个元

素。对二元线性回归而言,可用以下公式计算:

其中,

5.多重共线性判别

假设某个回归系数的t检验通不过,可能是这个系数相对应的自变量对因变量的影平不显著所致,此时,应从回归模型中剔除这个自变量,重新建立更为简单的回归模型或更换自变量。也可能是自变量之间有共线性所致,此时应设法降低共线性的影响。

多重共线性是指在多元线性回归方程中,自变量之彰有较强的线性关系,这种关系假设超过了因变量与自变量的线性关系,那么回归模型的稳定性受到破坏,回归系数估计不准确。需要指出的是,在多元回归模型中,多重共线性的难以防止的,只要多重共线性不太严重就行了。判别多元线性回归方程是否存在严惩的多重共线性,可分别计算每两个自变量之间的可决系数r2,假设r2 > R2或接近于R2,那么应设法降低多重线性的影响。亦可计算自变量间的相关系数矩阵的特征值的条件数k= λ

1/ λp(λ1为最大特征值,λp为最小特征值),k<100,那么不存在多重点共线性;假设100≤k≤1000,那么自变量间存在较强的多重共线性,假设k>1000,那么自变量间存在严重的多重共线性。降低多重共线性的方法主要是转换自变量的取值,如变绝对数为相对数或平均数,或者更换其他的自变量。

6.D.W检验

当回归模型是根据动态数据建立的,那么误差项e也是一个时间序列,假设误差序列诸项之间互相独立,那么误差序列各项之间没有相关关系,假设误差序列之间存在亲密的相关关系,那么建立的回归模型就不能表述自变量与因变量之间的真实变动关系。D.W检验就是误差序列的自相关检验。检验的方法与一元线性回归一样。

[编辑]

多元线性回归分析预测法案例分析

[编辑]

案例一:公路客货运输量多元线性回归预测方法讨论[2]

一、背景

公路客、货运输量的定量预测,近几年来在我国公路运输领域大面积广泛地开展起来,并有效的促进了公路运输经营决策的科学化和现代化。

关于公路客、货运输量的定量预测方法很多,本文主要介绍多元线性回归方法在公路客货运输量预测中的详细操作。根据笔者先后参加的部、省、市的科研课题的理论,证明了多元线性回归方法是对公路客、货运输量预测的一种置信度较高的有效方法。

二、多元线性回归预测

线性回归分析法是以相关性原理为根底的.相关性原理是预测学中的根本原理之一。由于公路客、货运输量受社会经济有关因素的综合影响。所以,多元线性回归预测首先是建立公路客、

相关文档
最新文档