第一部分2经典线性回归模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 经典线性回归模型
一、线性回归模型的概念
1、一元线性回归模型 (1)总体回归模型
总体回归模型:12i i i Y X u ββ=++,(|)0E u X = 总体回归方程:12(|)E Y X X ββ=+
说明:确定性部分——Y 对于给定X 的期望值
随机部分——代表了排除在模型以外的所有因素对Y 的影响。它是期望为0的,具有一定分布的随机变量。
研究的目标:
①确定总体回归方程的参数
②随机扰动项的分布(想想看,为什么?)2|(0,)X N μσ
(2)样本回归模型
问题:我们往往无法获得全体数据,无法准确的分析出总体回归参数。能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息?
画一条直线以尽好地拟合该散点图,由于样本取自总体,可以用该直线近似地代表总体回归线。该直线称为样本回归线。
样本回归模型:12ˆˆ i i i Y X e ββ=++ 样本回归方程:12ˆˆˆi i Y X ββ=+
(3)样本回归线与总体回归线的关系
2、多元线性回归模型
在许多实际问题中,我们所研究的因变量的变动可能不仅与一个解释变量有关。
122ββ...βu i i k ki i Y X X =++++
斜率 “β”的含义是其它变量不变的情况下,X j 改变一个单位对因变量所产生的影响
即对于n 组观测值,有
11221331112122233222
12233βββ...ββββ...β......
βββ...βK K K K n n n K Kn n
Y X X X u Y X X X u Y X X X u =+++++=+++++=+++++
定义:
12*1...n n Y Y Y Y ⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭ 21
12222*1...1...............1...K K n Kn n k X X X X X X X ⎡⎤⎢⎥⎢
⎥=⎢⎥⎢⎥⎣⎦ 1122
*1*1
,......n n K k u u u u ββββ⎛⎫
⎛⎫ ⎪
⎪ ⎪ ⎪ ⎪== ⎪ ⎪
⎪ ⎪⎝⎭ ⎪⎝⎭
多元线性回归模型的矩阵形式为(总体):Y =X β+μ,(|)E Y =X β
(样本)ˆY =X β
+e ,ˆˆY =X β
二、经典线性回归模型的统计假设 引言:为什么要做基本假定
①为了保证参数估计得以进行(或者有意义) ②为保证参数估计量具有良好的性质。
③对于随机扰动的分布作出假定,才可能确定所估计参数的分布性质,也才可能进行假设检验
(1)线性假定。总体模型为
122ββ...βu i i k ki i Y X X =++++
(2)严格外生性
即E(u t |X )=0, t=1,2,…,n; 含义:u t 与所有解释变量都不相关
注;如果E(u t |X)=c ,c 为某常熟,但不一定为0.当回归方程中有常数项时,可以将这个非零的期望c 并入常数项。
命题1:()0i E u =,扰动项的无条件期望为0
命题2,随机变量与扰动项正交。
(,)()()
()() 0jk i jk jk i i jk i jk i jk i jk i jk i Cov x u E x Ex u Eu Ex u Ex Eu E Ex u E Ex Eu Ex u =--=--+==
(3)球形假定 无自相关假设
cov( u i , u j |X i ,X j ) = 0,即E(u i u j |X i ,X j )=0, i≠j
含义:表明产生干扰的因素是完全随机的。此次干扰和彼此干扰互不相关,相互独立
同方差假设
2var(|),1,
,i i u X i N σ==,即:22(|)i i E u X σ=
含义:①所需估计的方差数简化为一个。
②可以推出,因变量可能取值的分散程度也是相同的。 ③每个观测的可信程度是一样的。
(2)(3)可以合并为:
2
0 ov(,|Xi,Xj)(|Xi,Xj) i j i j i j c u u E u u i j
σ≠⎧==⎨=⎩
假设(2),(3)说明随机项u 的方差-协方差矩阵为对角矩阵:
()112
2121122212212
2
122121221221var(|)|| ()
()()() ()n n
n n n n n n n n n n E I u u u u u u u u u u u u E E u u u E u u u u u u Eu E u u E u u E u u Eu E u u E u u E σ⨯⎡⎤==⎣⎦
⎡⎤⎡⎤
⎛⎫
⎢⎥⎢⎥ ⎪
⎢⎥
⎢⎥ ⎪⎡⎤==⎣⎦⎢⎥⎢⎥
⎪⎢⎥⎢⎥ ⎪⎢⎥⎢⎥⎝⎭⎣⎦⎣⎦
=''Ωu X uu X uu X =因为:22
222
2000000()n n n n I u u Eu σσ
σσ⨯⎡⎤⎡⎤
⎢⎥⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢
⎥⎢⎥⎢⎥⎣⎦
⎣
⎦
(4)各解释变量之间不存在严格的线性关系(即不存在“严格的多重共线性”) 即X 是满秩的。此时矩阵X ’X 也是满秩的,()rank K =,X X
所以行列式 '0X X ≠,保证了'1()X X - 可逆。是OLS 估计可以进行的前提。 含义:
①从直观含义来看。模型中的变量对于解释Y 提供了新的信息,不能由其他信息完全替代
②从参数的含义来看。保持其他信息不变时,如果存在严格多重共线,则无法做到