多元线性回归模型及其假设条件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§5.1 多元线性回归模型及其假设条件 1.多元线性回归模型 多元线性回归模型:
εi pi p i
i
i
x b x
b x b b y +++++=Λ22
11
,
n i ,,2,1Λ=
2.多元线性回归模型的方程组形式 3.多元线性回归模型的矩阵形式
4.回归模型必须满足如下的假设条件:
第一、有正确的期望函数。即在线性回归模型中没有遗漏任何重要的解释变量,也没有包含任何多余的解释变量。
第二、被解释变量等于期望函数与随机干扰项之和。
第三、随机干扰项独立于期望函数。即回归模型中的所有解释变量X
j
与随机干扰项u 不
相关。
第四、解释变量矩阵X 是非随机矩阵,且其秩为列满秩的,即:n k k X rank 〈=,)(。式中k 是解释变量的个数,n 为观测次数。 第五、随机干扰项服从正态分布。
第六、随机干扰项的期望值为零。()0=u E 第七、随机干扰项具有方差齐性。
()σ
σ2
2
=u i
(常数)
第八、随机干扰项相互独立,即无序列相关。()()u u u u j
i
j
i
,cov ,=σ=0
§5.2 多元回归模型参数的估计
建立回归模型的基本任务是:求出参数b
b b p
,,,,1
Λσ的估计值,并进行统计检验。
残差:
y
y e i
i
i ˆ-
=
;残差平方和:Q=
()∑
-∑==y
y e
i i n
i i
ˆ2
1
2
矩阵求解:X=⎥⎥⎥⎥⎥
⎦⎤⎢⎢⎢⎢⎢⎣
⎡x x
x
x x x x x x pn n
n
p p Λ
ΛΛ
ΛΛ21222
12
121
11
111,⎥⎥⎥⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎢⎢⎢⎣⎡=b b b b p B ˆˆˆˆ210ˆΛ,⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎣⎡=-y y y y n n Y 121Λ,()Y
B X X X τ
τ
1
ˆ-=
1
ˆ2
--=
p n Q
σ
要通过四个检验:经济意义检验、统计检验、计量经济学检验、模型预测检验。
§5.4 多元线性回归模型的检验 一、R 2
检验
1.
R 2
检验定义
R 2
检验又称复相关系数检验法。是通过复相关系数检验一组自变量x
x x m
,,,2
1
Λ与因变量
y 之间的线性相关程度的方法。
复相关系数与复可决系数检验中的“复”是相对于一元函数而言。 复相关系数:自变量在两个以上,检验线性关系密切程度的指标,记为R
x x x p
y Λ21,
,通常
用R 表示。
复可决系数:复相关系数的平方R 2。
在实际应用中,判别线性关系密切程度都是用R 2检验,所以复可决系数R 2是模型拟合优度指标,R 2越接近于1,模型拟合越好。0≤R 2≤1。
()()
∑-∑--=
y y y y i i i R 2
2ˆ1
2.复相关系数检验法的步骤 1)计算复相关系数;
2)根据回归模型的自由度n-m 和给定的显著性水平α值,查相关系数临界值表; 3)判别。
3.调整可决系数
m
n n R
R
--⎪
⎭⎫
⎝
⎛-
-=1
1122
R 2
是一个随自变量个数增加而递增的函数,所以,当对两个具有不同自变量个数但性质相
同的回归模型进行比较时,不能只用R 2
作为评价回归模型优劣的标准,还必须考虑回归模
型所包含的自变量个数的影响。
R
2
消除了自变量个数不同的影响,可以用于不同自变量个数间模型的比较。
4.
R 2
检验的目的
检验模型对原始数据的拟合程度,或对原始数据信息的解释程度。
二、F 检验 1.检验目的
通过F 统计量检验假设
0:2
1
==
==β
β
βm
H Λ是否成立的方法。回归方程的显著性检
验是检验所有系数是否同时为0, 2.F 统计量
()()()()
∑-∑---=
m n m F y
y y y i i i ˆˆ2
21 ,m-1是回归变差
()∑-y y
i ˆ2
的自由度,n-m 是剩余变差
()∑-y
y i i ˆ2
的自由度。 F 服从自由度为()m n m --,1的F 分布。 3.回归效果不显著的原因 1)影响y 的因素除了一组自变量
x
x x m
,,,2
1
Λ之外,还有其他不可忽略的因素。
2)y 与一组自变量x
x x m
,,,2
1
Λ之间的关系不是线性的。 3)y 与一组自变量x
x x m
,,,2
1
Λ之间无关。
4.解决办法
分析原因另选自变量或改变模型的形式。
三、t 检验 1.检验目的
回归系数的显著性检验是检验某个系数是否为0。 2.T 统计量 统计假设H 0:
0=b i ;统计量:c
S b
t ii
y
i i ˆ=
,
m
n Q
S
y
-=
,c
ii
是矩阵()
X X '-1
的第
I 个对角元素。t i 是一个自由度为n-m 的t 分布变量;统计检验判别:t t i
α≥。否定假设,
系数
0≠b i
。否则,接受假设0=b i
。
四、DW 检验
1.序列相关的概念及对回归模型的影响
序列相关是指数列的前后期相关。若时差为一期的序列相关,称为一节自相关。 回归模型假设随机误差项之间不存在序列相关或自相关,即
u
i
和
u
j
互不相关,
j i u u j
i
≠=⎪⎭⎫
⎝
⎛,0,cov 。若回归模型不满足这一假设,则称回归模型存在自相关。
当模型中存在序列自相关时,使用OLS 方法估计参数,将产生下列严重后果: (1)估计标准误差S 可能严重低估σ的真实值。 (2)样本方差
S j
2
β
可能严重低估⎪⎭
⎫
⎝⎛βi
D 的真实值。 (3)估计回归系数
β
ˆj
可能歪曲
β
i
的真实值。
(4)通常的F 检验和t 检验将不再有效。