第二章:双变量线性回归分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三部分初计量经济(13周)经典单方程计量经济模型:一元线形回归模型
经典单方程计量经济模型:多元线形回归模型
经典单方程计量经济模型:放宽基本假定模型
第一章一元线性回归(双变量)
(1)回归分析的基本概念
(2)前提建设
(3)参数估计:
OLS的参数估计
ML的参数估计
(4)统计检验
(5)预测
(6)时间案例与操作
(7)思考与作业
§1 经典正态线性回归模型(CNLRM)
1、一个例子
注 x 表示收入,y 表示支出。
50100150
200
50
100150
200250300
X
Y
Y vs. X
50100
150
200
50
100150
200250300
X
Y 1
Y1 vs. X
条件分布:以X 取定值为条件的Y 的条件分布 条件概率:给定X 的Y 的概率,记为P(Y|X)。 例如,P(Y=55|X=80)=1/5;P (Y=150|X=260)=1/7。
条件期望(conditional Expectation ):给定X 的Y 的期望值,记为E(Y|X)。
例如,E(Y|X=80)=55×1/5+60×1/5+65×1/5+70×1/5+75×1/5=65
总体回归曲线(Popular Regression Curve )(总体回归曲线的几何意义):当解释变量给定值时因变量的条件期望值的轨迹。
总结
总体:
总体函数:
总体方程:
样本:
样本函数:
样本方程:
2、总体回归函数(PRF)
E(Y|X i)=f(X i)
当PRF的函数形式为线性函数,则有,
E(Y|X i)=β1+β2X i
其中β1和β2为未知而固定的参数,称为回归系数。β1和β2也分别称为截距和斜率系数。
上述方程也称为线性总体回归函数。
3、P RF的随机设定
将个别的Y I围绕其期望值的离差(Deviation)表述如下:
u i=Y i-E(Y|X i)
或Y i=E(Y|X i)+u i
其中u i是一个不可观测的可正可负的随机变量,称为随机扰动项或随机误差项。
4、“线性”的含义
“线性”可作两种解释:对变量为线性,对参数为线性。本课“线性”回归一词总是指对参数β为线性的一种回归(即参数只以它的1次方出现)。
模型对变量为线性?
模型对参数为线
性?
是不是
是LRM LRM
不是NLRM NLRM
注:LRM=线性回归模型;NLRM=非线性回归
模型。
看几个例子:
5、随机干扰项的意义(补充内容)
随机扰动项是从模型中省略下来的而又集体地影响着Y的全部变量
的替代物。显然的问题是:为什么不把这些变量明显地引进到模型中
来?换句话说,为什么不构造一个含有尽可能多个变量的复回归模型呢?理由是多方面的: (1) 理论的含糊性 (2) 数据的欠缺 (3) 核心变量与周边变量 (4) 内在随机性 (5) 替代变量 (6) 省略原则 (7) 错误的函数形式
总之把所有没有模型中没有包含,但有关的变量全部纳入干扰项之中。
6、 样本回归函数(S RF ) (1)样本回归函数
i
Y ˆ=1ˆβ+2ˆβi X 其中Y ˆ=E(Y|X i )的估计量;1ˆβ=1
β的估计量;2ˆβ=2β的估计量。 估计量(Estimator ):一个估计量又称统计量,是指一个规则、公式或方法,是用已知的样本所提供的信息去估计总体参数。在应用中,由估计量算出的数值称为估计值。 样本回归函数的随机形式为:
其中i u ˆ表示(样本)残差项(residual )。
(2)样本回归线的几何意义
7、经典线性回归模型(CLRM )的基本假定: 假定1:干扰项的均值为零。即,E(u i |X i )=0
假定2:同方差性或u i 的方差相等。即,Var(u i |X i )=σ2 假定3:各个干扰项无自相关。即,Cov(u i ,u j |X i ,X j )=0 假定4:u i 和X i 的协方差为零。即,Cov(u i ,X i )=E(u i X i )=0 假定5: 回归模型对参数而言是线性的 假定6:2~(,)i u N u σ
§2 估计问题(β和σ2
)
一、 普通最小二乘法 1、问题: PRF :Y i =β1+β2X i +u i
SRF :i Y =1ˆβ+2ˆβi X +i u ˆ=i Y ˆ+i u ˆ i u ˆ=i Y -i
Y ˆ=i Y -(1ˆβ+2ˆβi X )
minf(1ˆβ,2ˆβ)=min ∑i u ˆ2=min ∑[i Y -(1ˆβ+2ˆβi
X )]2 2、正规方程(Normal equation )
由1ˆβ∂∂f =0,以及2
ˆβ∂∂f
=0得到的方程组称为正规方程。即,
二、 β的估计 1、公式:
解上述正规方程组得到1ˆβ和2
ˆβ估计值:
其中X 和Y 是X 和Y 的样本均值。
定义离差:i x =i X -X ,i y =i Y -Y 。用小写字母表示对均值的离差。 2、对OLS 估计量的说明
(1)OLS 估计量可由观测值计算; (2) OLS 估计量是点估计量;
(3)一旦从样本数据得到OLS 估计值,就可画出样本回归线。
3、样本回归线的性质:
(1) 通过Y 和X 的样本均值:Y =1ˆβ+2
ˆβX ; (2) 估计的Y 的均值等于实际的Y 的均值:Y ˆ=Y ;
(3) 残差i u
ˆ的均值为零:E(i u ˆ)=0;