第二章 多元线性回归

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章多元线性回归

§2.1 基本概述

一、回归的任务

多元线性回归(MLR)(multiple linear regression)是分析一个随机变量与多个变量之间线性关系的统计方法。

回归(Regression)起源于19世纪生物学家F·高尔顿进行的遗传学研究。其核心是“普通最小平方法”(Ordinary Least Squares)OLS。

多元回归将所研究的变量分为:

确定自变量和因变量的关系是回归分析的主要任务:

(1)根据实测数据求解某一模型的各个参数;

(2)评价回归模型是否较好地拟合实例数据;

(3)利用模型进行预测。

需要注意的是:

(1) 因变量必须是间距测度等级以上的变量(有时也包含定性变量。见《应用回归分析》)

(也称为连续变量)。自变量可以是任意等级的变量。

(2)既使模型正确通过检验,也不能确定X、Y之间的因果关系,而只能确认

存在着统计关系。

[例] 不同地区的人均食品支出与人均收入的关系(图2–1);汽车重量与每加仑燃料行驶英里值的关系;(图2–2)。

图2–1

图2–2

二、一元线性回归的回顾

1. 模型

i i i x Y εββ++=10 (2.1)

当获得n 组样本观测值(x 1 , y 1),(x 2 , y 2),…(x n ,y n )的数据时,如果符合2.1式,则有

n i X Y i

i

i

,,2,11

=++=ε

ββ (2.2)

2.1式称为理论回归模型;2.2式称为样本回归模型。有时不加以区分地将两者称为一元线性回归模型。

通过n 组观测值,用OLS 法对10,ββ进行估计,得1

0ˆ,ˆββ,则称

为Y 关于X 的一元线性方程。

其中: 1β 回归系数,说明X 与Y 之间的变化关系。

2.普通最小二乘法估计的统计性质(OLSE Estimation ) (1)残差:i

i i

Y Y e ˆ-=,用来说明拟合效果,可以看作误差项εi 的估计值。 ⎪⎩⎪⎨⎧==∑∑00

i

i i e x e 因为 )(ˆˆX X Y Y

-+=β,所以 0)(ˆ)()ˆ(=---=-=∑

∑∑∑X X Y Y Y Y e β 但∑=n

i i e 1

||很麻烦,经常用∑2i e 来说明。

(2)∑

=-min )ˆ(2Y Y (3)Y

ˆ的平均值等于Y 的平均值∑=Y n

Y ˆ1 (4)X 与e 相互独立

∑=-=0))((1

),(i i i i e X X n

e x Cov

(5)Y

ˆ与e 相互独立 0))(ˆ(1),ˆ(=-=∑i

i i e Y Y n

e Y Cov (6)直线通过n 个散点的重心(Y X ,)点

3.模型的假设条件(assumption )

(1) 高斯假设条件 (C.F.Gauss )德国数学家 ①零均值性

0)E(=i ε;n i ,2,1=

即在自变量取一定估计i X 的条件下,其总体各误差项的条件平均值为0。 ②等方差性 (为一常数)

n i i i ,,2,1,

)V ar()D(2 ===σεε ③误差项之间相互独立,(即不相关)

n j i j i j i 2,1,,

;

0),Cov(=≠=εε

④误差项与自变量之间相互独立性。

0),Cov(=i i X ε

上述假设称为标准古典假设条件。符合条件的回归模型称为普通线性回归模型(general linear regression model )。

如果仅为点估计则由OLSE 计算的Y ˆ,ˆ,ˆ1

0ββ分别是10,ββ和Y 的无偏估计量; 如果需要进行区间估计,需要以下假设: (2)正态误差假定

同时,

另外,还可推出

即 22)(σ=e

S E 是无偏估计量 且

)1(~)ˆ(22

2

---∑

p n Y Y χσ

其中:e S :估计标准误差

其中:X

0 是给定值。

§2.2 多元线性回归模型

一、多元线性回归方程及其假设

设模型为:

将n 组独立观察的样本数据

),,,,(2

1

ip

i i i

x x x y n i ,,2,1 =

代入方程:

i

ip

p

i i i

e x b x b x b b y +++++= 2

2

1

1

根据OLS ,使∑=min )(2i e 。求p ββ,,0 的估计值 p b b ,,0 ,

可得回归方程:

称为多元线性回归方程。

上述模型用矩阵形式来表示,即:

εx βy +=

其中:

121⨯⎥⎥⎥⎥

⎦⎤

⎢⎢⎢⎢⎣⎡=n n y y y y )

1(212

1

12

11

111+⨯⎥⎥

⎥⎥⎦

⎢⎢⎢⎣⎡=p n np

p p n n ij

x x x x

x

x x

x x

相关文档
最新文档