第三章 多元线性回归模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章多元线性回归模型

前一章讲的简单线性回归模型,主要讨论的是一个应变量和一个解释变量之间的线性关系。而在实际的经济问题中,一个经济变量往往同多个经济变量相联系。比如,我们前面一直在举的例子:说消费支出与收入有关,而在实际生活中,消费支出同时又会与家庭的财富总量有关,还可能会与所处的年龄段、性别、所受教育程度等因素有关。所以,我们有必要将一个解释变量的情况推广到多个解释变量。利用多元回归方法进行分析/

第一节多元线性回归模型及古典假定

一、多元线性回归模型

1、多元线性回归模型的一般形式:

总体回归方程:E(Y│X1,X2,…Xk)=β0+β1X1+β2X2+β3X3+…+βkXk

Y=β0+β1X1+β2X2+β3X3+…+βkXk+µ

样本回归方程:Y=β0+β1X1+β2X2+β3X3+…+βkXk

Y=β0+β1X1+β2X2+β3X3+…+βkXk+e

2、回归系数的经济意义:

简单线性回归中的回归系数的经济意义:如 Y=50.78+0.86X 系数代表每增加一元收入,消费支出要增加0.86元

多元线性回归中的回归系数的经济意义:由于多个解释变量会同时对应变量的变动发挥作用,因此,如果我们要考察其中某个解释变量对应变量的影响,就必须使其他解释变量保持不变来进行分析.所以,模型中的单个回归系数βj就表示当控制其他解释变量不变的条件下,第j个解释变量的单位变动对应变量均值的影响.

多元线性回归模型中这样的回归系数,称为偏回归系数。

与简单线性回归分析一样,多元线性回归分析要解决的主要问题仍是:根据观测样本估计模型中的各个参数;对估计的参数及回归方程进行统计检验;利用回归模型进行预测和经济分析。

二、模型的古典假定

在回归分析中,为了使所作出的估计具有较好的统计性质,我们对模型中的随机扰动项和解释变量作出一些假定。

多元线性回归模型的假定条件有:

假定1:零均值假定: 即假定随机扰动项彻底均值为零E(μi)= 0

假定2:同方差假定: μi 的方差为某个相同的常数Var(μi)=σ2

假定3:无自相关假定: 随机扰动项μi的逐次值互不相关

Cov(μi , μj )=0 (i≠j)

假定4:随机扰动项μi与解释变量Xi 不相关。

Cov(μi ,Xi )=0

假定5:正态性假定,即假定μi服从均值为零、方差为σ2的正态分布u~ N (0, σ2)

假定6:无多重共线性假定:即假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性无关。(这是多元线性回归模型与简单线性回归模型基本假定的区别)

多元线性回归模型参数所采用的最小二乘法估计思路以及估计的性质都与简单线性回归模型参数的估计是类似的,由于采用了矩阵,计算过程比较复杂,我们就省略了,因为实际操作过程中,这部分可以由软件代劳了。

第二节多元线性回归模型的检验

一、拟合优度检验

在简单线性回归模型中,我们用可决系数r2来衡量估计模型对观测值的拟合程度。在多元线性回归模型中,我们也需要讨论所估计的模型对观测值的拟合程度。

1、多重可决系数

R2=ESS/TSS=1—RSS/TSS

大小意义

在应用过程中,人们发现R2的大小对于解释变量的数目容易作出灵敏的反映。也就是说,随着模型中解释变量的增多,多重可决系数的值往往会变大,从而增加模型的解释功能。这给人们一个错觉:要使模型拟合得好,就必须增加解释变量。

但是,在样本容量一定的情况下,增加解释变量必定使得待估计参数的个数增加,从而损失自由度(n—k—1)(回忆我们说的区间估计,置信区间,随着自由度的减小,临界值增大,置信区间增大,估计的精度降低)

而且,在实际应用中,有时所增加的解释变量并非必要,违背了我们尽可能采用最简单形式的原则。

因此,在比较应变量相同而解释变量个数不同的两个模型的拟合程度时,不能简单地比较多重可决系数。

为此,人们引入了修正可决系数:R2=1—RSS/(n-k-1)/TSS/(n-1)

修正的思路就是用平方和的自由度,消除可决系数对解释变量个数的依赖度。

多重可决系数与修正可决系数的关系是:

修正可决系数的性质:

(1)若K≥1,则R2≤R2

(2)修正可决系数可能出现负值。如n=10,k=2,R2=0.1时,R2=—0.157.显然,负的拟合优度没有任何意义,在这种情况下,我们取R2=0

(3)在实际应用中,我们往往希望所建模型的R2和R2越大越好,但它们越大,只说明列入模型中的解释变量对应变量联合影响程度越大,并不能说明模型中各个解释变量对应变量的影响程度显著.

二、回归参数的显著性检验(t检验)

目的:在与检验当其他解释变量不变时,该回归系数对应的解释变量是否对应变量有显著影响。检验方法与简单线性回归模型的检验基本相同。

三、回归方程的显著性检验(F检验)

与简单线性回归方程一样,方程的显著性检验,目的是判断模型中的多个解释变量同应变量之间是否存在显著的线性关系。即对回归系数进行整体检验。

四、简单线性回归模型中的T检验与F检验的关系与多元线性回归方程中的有和区别:

简单线性回归模型中的T检验与F检验结果是一致的;

多元线性回归方程中的T检验与F检验的结果有可能不一致。

多元线性回归模型的预测与简单线性回归模型是类似的,同样包括对应变量均值和个别值的预测,其中又分点预测和区间预测。

相关文档
最新文档