第二章:双变量线性回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三部分初计量经济(13周)经典单方程计量经济模型:一元线形回归模型

经典单方程计量经济模型:多元线形回归模型

经典单方程计量经济模型:放宽基本假定模型

第一章一元线性回归(双变量)

(1)回归分析的基本概念

(2)前提建设

(3)参数估计:

OLS的参数估计

ML的参数估计

(4)统计检验

(5)预测

(6)时间案例与操作

(7)思考与作业

§1 经典正态线性回归模型(CNLRM)

1、一个例子

注 x 表示收入,y 表示支出。

50100150

200

50

100150

200250300

X

Y

Y vs. X

50100

150

200

50

100150

200250300

X

Y 1

Y1 vs. X

条件分布:以X 取定值为条件的Y 的条件分布 条件概率:给定X 的Y 的概率,记为P(Y|X)。 例如,P(Y=55|X=80)=1/5;P (Y=150|X=260)=1/7。

条件期望(conditional Expectation ):给定X 的Y 的期望值,记为E(Y|X)。

例如,E(Y|X=80)=55×1/5+60×1/5+65×1/5+70×1/5+75×1/5=65

总体回归曲线(Popular Regression Curve )(总体回归曲线的几何意义):当解释变量给定值时因变量的条件期望值的轨迹。

总结

总体:

总体函数:

总体方程:

样本:

样本函数:

样本方程:

2、总体回归函数(PRF)

E(Y|X i)=f(X i)

当PRF的函数形式为线性函数,则有,

E(Y|X i)=β1+β2X i

其中β1和β2为未知而固定的参数,称为回归系数。β1和β2也分别称为截距和斜率系数。

上述方程也称为线性总体回归函数。

3、P RF的随机设定

将个别的Y I围绕其期望值的离差(Deviation)表述如下:

u i=Y i-E(Y|X i)

或Y i=E(Y|X i)+u i

其中u i是一个不可观测的可正可负的随机变量,称为随机扰动项或随机误差项。

4、“线性”的含义

“线性”可作两种解释:对变量为线性,对参数为线性。本课“线性”回归一词总是指对参数β为线性的一种回归(即参数只以它的1次方出现)。

模型对变量为线性?

模型对参数为线

性?

是不是

是LRM LRM

不是NLRM NLRM

注:LRM=线性回归模型;NLRM=非线性回归

模型。

看几个例子:

5、随机干扰项的意义(补充内容)

随机扰动项是从模型中省略下来的而又集体地影响着Y的全部变量

的替代物。显然的问题是:为什么不把这些变量明显地引进到模型中

来?换句话说,为什么不构造一个含有尽可能多个变量的复回归模型呢?理由是多方面的: (1) 理论的含糊性 (2) 数据的欠缺 (3) 核心变量与周边变量 (4) 内在随机性 (5) 替代变量 (6) 省略原则 (7) 错误的函数形式

总之把所有没有模型中没有包含,但有关的变量全部纳入干扰项之中。

6、 样本回归函数(S RF ) (1)样本回归函数

i

Y ˆ=1ˆβ+2ˆβi X 其中Y ˆ=E(Y|X i )的估计量;1ˆβ=1

β的估计量;2ˆβ=2β的估计量。 估计量(Estimator ):一个估计量又称统计量,是指一个规则、公式或方法,是用已知的样本所提供的信息去估计总体参数。在应用中,由估计量算出的数值称为估计值。 样本回归函数的随机形式为:

其中i u ˆ表示(样本)残差项(residual )。

(2)样本回归线的几何意义

7、经典线性回归模型(CLRM )的基本假定: 假定1:干扰项的均值为零。即,E(u i |X i )=0

假定2:同方差性或u i 的方差相等。即,Var(u i |X i )=σ2 假定3:各个干扰项无自相关。即,Cov(u i ,u j |X i ,X j )=0 假定4:u i 和X i 的协方差为零。即,Cov(u i ,X i )=E(u i X i )=0 假定5: 回归模型对参数而言是线性的 假定6:2~(,)i u N u σ

§2 估计问题(β和σ2

一、 普通最小二乘法 1、问题: PRF :Y i =β1+β2X i +u i

SRF :i Y =1ˆβ+2ˆβi X +i u ˆ=i Y ˆ+i u ˆ i u ˆ=i Y -i

Y ˆ=i Y -(1ˆβ+2ˆβi X )

minf(1ˆβ,2ˆβ)=min ∑i u ˆ2=min ∑[i Y -(1ˆβ+2ˆβi

X )]2 2、正规方程(Normal equation )

由1ˆβ∂∂f =0,以及2

ˆβ∂∂f

=0得到的方程组称为正规方程。即,

二、 β的估计 1、公式:

解上述正规方程组得到1ˆβ和2

ˆβ估计值:

其中X 和Y 是X 和Y 的样本均值。

定义离差:i x =i X -X ,i y =i Y -Y 。用小写字母表示对均值的离差。 2、对OLS 估计量的说明

(1)OLS 估计量可由观测值计算; (2) OLS 估计量是点估计量;

(3)一旦从样本数据得到OLS 估计值,就可画出样本回归线。

3、样本回归线的性质:

(1) 通过Y 和X 的样本均值:Y =1ˆβ+2

ˆβX ; (2) 估计的Y 的均值等于实际的Y 的均值:Y ˆ=Y ;

(3) 残差i u

ˆ的均值为零:E(i u ˆ)=0;

相关文档
最新文档