西华师范大学-计量经济学复习资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章导论
一、计量经济学的发展历史
1926年,计量经济学一词“Econometrics”最早由挪威经济学家弗里希(R.Frish)仿效生物计量学(Biometrics)提出,但人们一般认为1930年世界计量经济学会的成立及创办的刊物《Econometrics》于1933年的出版,标志着计量经济学的正式诞生。

计量经济学自诞生之日起,就显示出强大的生命力,经过40、50年代的大发展和60年代的扩张,已在经济学中占有极其重要的地位,是当今西方国家经济类专业三门核心课程(宏观、微观、计量)之一。

计量经济学的重要地位还可以从诺贝尔经济学奖获得者的数量中反映出来,自1969年设立诺贝尔经济学奖,首届获得者就是计量经济学的创始人弗里希和荷兰经济学家丁伯根,表彰他们开辟了用计量经济方法研究经济问题这一领域,之后,直接因为对计量经济学的发展作出贡献而获奖者达9人,因为在研究中应用计量经济方法而获奖者占获奖总数的三分之二。

2000年度,诺贝尔经济学奖获得者是詹姆斯.赫克曼和丹尼尔.麦克法登, 原因是他们在微观计量经济学领域的贡献。

2003年诺贝尔经济学奖授予美国计量经济学家罗伯特·恩格尔和英国计量经济学家克莱夫·格兰杰,以表彰他们分别用“随着时间变化的异方差性”和“协整理论”两种新方法分析经济时间序列,从而给经济学研究和经济发展带来巨大影响。

二、计量经济学的性质
计量经济学是以经济理论和经济数据的事实为依据,运用数学和统计学的方法,通过建立数学模型(计量经济模型)来研究经济数量关系和规律的一门经济学学科。

计量经济学(或经济计量学)是一门经济
学、统计学、数学的交叉学科,但归根到底是一门经济学。

三、计量经济学与其它学科的关系
四、计量经济学的作用四、计量经济学的作用
1、结构分析:分析变量之间的数量比例关系分析变量之间的数量比例关系。

例如:边际分析、弹性分析、乘数分析、比较静边际分析、弹性分析、乘数分析、比较静力学分析力学分析
2、政策评价(经济政策实验室):用模型对政策方案作模拟测算,对政策方案用模型对政策方案作模拟测算,对政策方案作评价作评价
3、预测:由预先测定的解释变量去预测应变量在样本由预先测定的解释变量去预测应变量在样本
以外的数据以外的数据
4、检验和发展经济理论(实证分析)、检验和发展经济理论(实证分析)。

五、计量经济模型建立的建立步骤:
六、计量经济学软件简介
1、Eviews(3.1、4.0、5.0、6.0)。

最新版本是Eviews6.0,流行版本Eviews3.1,由QMS公司推出,可以进行高级计量经济分析,如单位根检验、建立时间序列模型、误差修正模型、协整检验和分析、ARCH模型等。

2、SPSS(Statistical Package for the Social Science)-社会科学统计软件包是世界是着名的统计分析软件之一。

SPSS for Windows是一个组合式软件包,它集数据整理、分析功能于一身。

SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。

SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。

SPSS也有专门的绘图系统,可以根据数据绘制各种图形。

七、计量经济学的有关基本概念
(一)变量的分类
从变量的因果关系区分:
被解释变量(应变量)——要分析研究的变量
解释变量(自变量)—说明应变量变动主要原因的变量(非主要原因归随机项)
从变量的性质区分:
内生变量—其数值由模型所决定的变量,是模型求解的结果
外生变量—其数值由模型以外决定的变量
关系:
外生变量数值的变化能够影响内生变量的变化
内生变量却不能反过来影响外生变量
(二)参数及其估计准则
为什幺要确定参数估计准则?
●由于存在抽样波动,参数无法通过观测直接确定
●估计方法及所确定的估计式不一定完备,不一定能得到真实值
●要求参数估计值应尽可能地接近总体参数的真实值
估计准则——“尽可能地接近”的原则,理论计量经济学主要讨论参数估计式怎样符合一定的准则
1、无偏性
参数估计值∧
β的分布称为∧β的抽样分布,其密度函数记为)
(

β
f。

如果β
β=

)
(
E,则称

β是
参数β的无偏估计式,否则称∧β是有偏的。

其偏倚为β
β-



E
)(∧
βE
β
2、最小方差性
用不同的方法可以找到若干个不同的估计式其抽样分布具有最小方差的估计式最小方差准则,或称最佳性准则既是无偏的同时又具有最小方差的估计式, 称为最佳无偏估计式。

3、均方误差(MSE )
均方误差(简记作MSE )是参数估计值与参数真实值离差平方的期望: 2
*
*
)()(βββ-=E MSE 均方误差与方差的关系
需要在较小偏倚和较小方差之间进行权衡与折衷。

均方误差是方差与偏倚的平方之和。

4、渐近性质(大样本性质)
当样本容量较小时,有时很难找到最佳无偏估计式
一致性:当样本容量n 趋于无穷大时,如果估计式∧β概率收敛于总体参数的真实值,就称估计式∧
β为β的一致估计式,即:1)(lim =≤-∧
εββP 或ββ=∧

→n P lim (渐近无偏估计式是当样本容量变得足够大时其偏倚趋于零的估
计式)。

(三)计量经济学中应用的数据
数据的来源:各种经济统计数据、专门调查取得的数据、人工制造的数据
数据类型: 时间数列数据(同一空间、不同时间)、截面数据(同一时间、不同空间)、混合数据、虚拟变量数据(四)计量经济模型的建立
经济模型是对实际经济现象或过程的一种数学模拟
可利用来建立计量经济模型的关系:
行为关系
生产技术关系
制度关系
定义关系
计量经济模型的数学形式:
思考题:技术进步是内生还是外生?给出理由。

第二章 简单线性回归模型
第一节 回归分析与回归方程
一、回归分析与相关分析——都是研究变量间关系的方法,且回归分析是以相关分析为基础。

(一)相关关系
因果关系 相关分析
1、 相关关系 互为因果关系 随机性依存关系 概念 变量之间的关系 共变关系
函数关系 确定性依存关系 2、种类
正相关 一元相关 线性相关 负相关 多元相关 曲线相关 3、相关程度——测定两变量是否线性相关
总体相关系数:)
var()var()
,cov(y X Y X XY =ρ
计算公式 样本相关系数:∑∑∑----=
2
2
)
()
()
)((Y Y X X
Y Y X X r i
i
i i
XY
相关系数 值:0=r ,不存在线性关系;1=r 完全线性相关;
0<r <1不同程度线性相关(0~0.3微弱;0.3~0.5低度;0.5~0.8显着;0.8~1高度)
符号:r >0正相关;r <0负相关
相关系数举矩阵:在研究多个指标变量两两间的相关程度,为了方便起见,常将常常将两两之间的相关系数排成一个矩阵,这样的矩阵称为相关系数矩阵。

其中,ij r 表示第i 个和第j 个变量的相关系数,可以看出,相关系数矩阵是个对称矩阵。

(二)回归分析
一、一元线性回归总体(理论)模型
i i i X Y μββ++=21 或i i X X Y E 21)(ββ+=(称为回归/直线方程)
i Y 被解释变量,i X 解释变量21ββ,回归系数,i μ随机误差项,)(i X Y E 表示在给定X 的水平下的条件均值。

例如,收入与消费的关系
二、样本回归模型
对于样本容量为n 的一组样本n i Y X i i ⋯⋯=2,1),( i i i e X Y ++=∧

21ββ 称为样本回归模型,其中
)(21i i i i i X Y Y Y e ∧∧∧+-=-=ββ 称为残差,它是误差项的估计值,∧
∧21ββ,分别是21ββ,的估计值。

i i X Y ∧

+=21ββ 称为样本的回归方程。


i Y 为i Y 的预测值或估计值。

回归分析:已知一组样本数据n i Y X i i ⋯⋯=2,1),(,找到样本回归模型,并用它推断总体回归模型。

i i i e X Y ++=∧
∧21ββ i i i X Y μββ++=21,即用i i i i e μββ估计用估计,∧
三、随机误差项
① 忽略掉的影响因素造成的误差 ② 模型关系不准确造成的误差 ③ 变量观测值的计量误差 ④ 随机误差
四、线性回归模型的主要假设
① 误差项无偏性假设——残差项零均值
()0i E ε=,i=1,2,...n
② 残差项间相互独立——序列无关假设
cov(,)(,)0,,1,2,...,i j i j E i j n i j εεεε===≠
③ 残差项与i 无关——同方差假设 2var(),1,2,...i i n εσ==
④ 解释变量与残差项不相关——解释变量为非随机变量 cov(,)0,2,3,...,ji i X j n ε==
⑤ 误差项为服从正态分布的随机变量——正态性假设(白噪声假定) 2~(0,)i u N σ
第二节 参数的最小二乘估计
一元线性回归模型的建立:
i i i e X Y ++=∧

21ββ i i i X Y μββ++=21,即用i i i i e μββ估计用估计,∧
针对一元线性回归模型的OLS 准则:
所以有:
即:
整理方程
称之为正规方程
若记: 化简得:
进一步:
解方程组得:
或另外一种表示形式:
等价表示形式为: 称为最小二乘估计量
OLS 回归线的性质 1. 回归线过样本均值 2.

i Y 的均值等于i Y 的均值
3. 残差i e 的均值为零
4.
0),cov(=i i e Y
5. 解释变量i X 与残差i e 不相关 最小二乘法估计的性质
1. 线性性:参数估计量是Y 的线性函数
2. 无偏性:参数估计量的均值等于总体回归参数真值
3. 有效性(最小方差性):是指在所有线性、无偏估计量中,最小二乘估计量的方差最小。

(证明略)
结论:普通最小二乘估计量具有线性性、无偏性、最小方差性等优良性质,因此最小二乘估计量又称为“最佳线性无偏估计量”,即BLUE 估计量(the Best Linear Unbiased Estimators ),显然这些优良的性质依赖于模型的基本假设。

第三节 回归系数的区间估计及假设检验
一、∧
1β和∧
2β的概率分布
首先,由于解释变量 Xi 是确定性变量,随机误差项i μ是随机性变量,所以被解释变量i Y 是随机性变量,且其分布(特征)与i μ相同。

其次,∧
1β和∧
2β分别是i Y 的线性组合,因此∧
1β、∧
2β的概率分布取决于Y 。

在μ是正态分布的假设下,Y 是正态分布,因此∧
1β和∧
2β也是正太分布。

其分布特征(密度函数)由其均值和方差唯一决定。

因此:
∧1β和∧
2β的标准差分别为
二、随机误差项μ的方差2σ的估计。

在估计的参数∧1β和∧
2β的方差和标准差的表达式中,都含随机扰动项方差)var(2i μσ=。

2σ又称总体方差。

由于2
σ实际上是未知的,因此∧1β和∧
2β的方差和标准差实际上无法计算。

由于随机扰动项i μ不可观测,只能从i μ的估计——残差i e 出发,对总体方差2σ进行估计。

可以证明:总体方差2
σ的无偏估计量为2
22
-=
∑∧n e i
σ。

在总体方
差2
σ的无偏估计量∧2
σ求出后,估计参数∧1β和∧
2β的方差和标准差的估计量分别是:
三、参数估计的显着性检验
对一元线性回归模型i i X Y ∧

+=21ββ,变量i X 是否对i Y 有显着性影响,归结为建立假设:
:0:2120≠=ββH H
① 建立t 统计量)
(22


=
ββSe T ,在0H 成立的条件下,k k n t T ),(~-为参数个数。

选定显着性水平,
05.0=α,查t 分布表,得到t 统计量的临界值)(2
k n t -α,如果有)(2
k n t t ->α,则拒绝0H ,认为变量i X 对i Y 有显着性影响。

② 选取t 检验,计算t 统计量∑=∧
-=
n
i i
XY
X X
S t 1
2
2
)(β,即)
(.22


=
ββE S t
进一步计算:)]2()([
2
1
2
2
->-=∑=∧
n t X X
S P P n
i i
XY
αβ
若P 值小于0.05,则否定原假设,认为变量X 对Y 的影响显着。

若α≤P ,则拒绝0H 接受1H ,认为变量X 对Y 有影响; 若α<P ,则不拒绝0H ,尚不能认为变量X 对Y 有显着性影响。

四、参数的置信区间
由αββαβα-=⎪⎭

⎬⎫⎪⎩⎪⎨⎧-<-<--∧
∧1)()(22222k n t S k n t P
得到2β的置信区间为:∧

-+<<--∧

2
2
)()(2
222
2βαβαβββS k n t S k n t
五、决定系数——反映样本回归线对样本观测值的拟合程度
这里有几个概念
总偏差:Y Y i - 可解释偏差(回归偏差):Y Y i -∧
残差(随机偏差):∧
-i i Y Y
他们间的关系是:总偏差=可解释偏差+随机偏差 Y Y i -=Y Y i -∧
+∧
-i i Y Y
可解释偏差是由样本回归线决定的,残差是随机的。

该式仅反映了一个样本点的偏差分解情况,要从整体上反映样本回归线对所有样本观测值拟合得好坏,对上式求平方和:
从上图和上式可以看出,ESS 代表了总偏差中可以由解释变量(样本回归线)说明的偏差的部分,ESS 在TSS 中所占的比例越大,RSS 在TSS 中所占的比例越小,拟合程度越好。

可见:102
≤≤R ,当然,2R 越接近于1,拟合越好。

六、回归总体线性性的显着性检验(F 检验)
① 提出11:βH 待检假设:0:210==ββH ;11:βH 、2β不全为0
② 列出方差分析表:
可以证明:)2(~)()
1(~)(2222--=-=∑∑∧∧
n X Y Y RSS X Y Y ESS i i i ,则
)2,1(~2
1--n F n RSS
ESS
③ 选统计量2
)
(1)(2
12
2
---=-=
∑∑∧
n Y Y Y Y n RSS
ESS
F i i
i ,在0H 成立的条件下,)2,1(~-n F F
进一步计算:)]2,1([->=n F F P P α,若P 值小于0.05,则否定原假设,认为模型的整体线性性显着
④ 检验:给定显着性水平α,查F 表,得临界值)2,1(-n F α,并计算F 的值 若)2,1(->n F F α,则拒绝0H ,表明回归线性性显着; 若)2,1(-<n F F α ,则接受0H ,表面线性性不显着。

)(x f
P
0 F )2,1(-n F α x
七、计量经济对回归的规范表示
2R 放在回归方程的左侧,t 统计量放在括号中,列在相应参数估计值的下方。

参数估计结果要留有足够多的有效数字位数。

第三章 多元回归分析
第一节 多元线性回归模型及其假定
经济理论表明,对所要研究的被解释变量Y 有显着影响的解释变量有k-1个,它们是X2,X3,…,Xk ;同时Y 是X2, X3, …,Xk 的线性函数,又是参数的线性函数,则多元线性总体回归模型为:
u X X X Y k k +++++=ββββ (33221)
一般地,多元线性回归模型要满足六个条件: 1. 误差项无偏性假设——残差零均值 n i u E i ,...,2,1,0)(==
2. 残差项间相互独立——序列无关假设
k
i n k i u u E u u k i k i ≠=== ,...,2,1,0),(),cov(
3. 残差项与t 无关——同方差假设
2)var(σ=i u ,n i ,...,2,1=
4. 解释变量与残差项不相关——解释变量为非随机变量 n j u X i ji ,...,3,20),cov(==
5. 误差项为服从正态分布的随机变量——正态性假设 ),0(~2σN u i
6. 解释变量之间不存在严格的线性相关——无显着的多重共线性 相应地,多元线性回归总体回归模型为:
u X X X Y k k +++++=ββββ (33221)
总体回归方程为:ki k i i ki i i X X X X X X Y E ββββ++++=...),...,,(3322132 样本回归模型为:i ki k i i i e X X X Y +++++=∧



ββββ (33221)
样本回归方程为:n i X X X Y ki k i i i ,...,2,1...33221=++++=∧




ββββ 为了多元回归分析和计算更方便、更简洁,下面引入回归分析的矩阵表
多元线性回归模型可以写为: 总体回归模型为:U X Y
+=β
总体回归方程为:βX Y E =)( 样本回归模型为:e X Y +=∧
β 样本回归方程为:∧∧
=βX Y 模型的古典假设条件可以写为: 假设1. 零均值:0)(=U E
假设2、3 同方差、序列无关
假设4.X 为确定矩阵
假设5.U 服从多元正态分布:),0(~2n I N U σ 假设6.矩阵X 满秩:0`)(≠⇔<=X X n k X r
第二节 最小二乘估计
对多元线性回归模型的参数估计与分析,就是一元线性回归模型的参数估计与分析的线性推演——最小二乘准则、参数的BLUE 性质等。

总体回归模型为:U X Y
+=β
参数β反映了解释变量X 对被解释变量Y 的影响程度,如果已知样本观测数据(Xi , Yi )(i=1,2,……,n ),那幺如何得出参数的估计值呢? 最小二乘准则是:∑2min
t
e
β
由样本回归模型e X Y +=∧
β和样本回归方程∧

=βX Y 得到残差矩为: ∧

-=-=βX Y Y Y e 残差平方和为:


∧∧
∧+-=⎪⎭⎫
⎝⎛-⎪⎭⎫ ⎝⎛-==∑β
ββββX X Y X Y Y X Y X Y e e e t
````2```2
依据矩阵导数公式: ()A X AX A X AX =∂∂=∂∂`
)
(`; 有:
()0`2`2`=+-=∂∂∧

ββ
X X Y X e e
∵1
)`(0`-⇒≠X X X X 存在
∴参数矩阵β的估计值为()Y X X X ``1
-∧

相应地,多元线性回归的正规方程为:∧
=βX X Y X `` 代数展开为:
例3.2.1 详见课本P69所示
第三节 最小二乘估计量的性质
一、最小二乘估计量的特性
1.线性性——()U X X X U X X X X Y X X X `
)`()`()`(``1
1
1
---∧
+=+==βββ 2.无偏性——ββ=∧
)(E
3.最小方差性——1
2)`()cov(-∧
=X X u σβ 二、误差项的方差估计
残差的方差2
u σ估计为: k k
n e
e S ,`2
-=
为欲估计参数的个数。

参数估计量∧
β的方差估计量为1
2
)`()(cov -∧

=X X S β
注意:这些估计公式在显着性检验、预测的置信区间构造上不可或缺。

第四节 多元线性回归模型的统计检验
一、参数估计式的统计特征
如果只计算最小二乘估计∧
β,不需要对U 的分布形式提出要求,只要E(U)= 0即可。

若涉及模型的显着性检验问题、置信区间和预测问题时,就必须对误差项U 的分布形式作出规定。

中心极限定理表明:无论误差项U 服从什幺分布,只要样本容量n 足够大,就可近似按U 服从正态分布看待。

尽管实际经济分析中,难以满足正态分布的要求,但只要样本容量比较大,仍是近似地按照Y 和U 服从正态分布来讨论问题。

由古典假设条件5:U 服从多元正态分布 ),0(~2
n I N U σ
U X X X `
)`(1
-∧
+=ββ 故参数估计式的分布为:))`(,(~1
2
-∧
X X N u σββ
由于2
u σ是未知的,通常用k
n e e S -=
`2
估计2
u σ 二、多元线性回归模型的统计检验
类似于一元线性回归分析,多元线性回归分析也有单个解释变量的显着性检验(t 检验)、拟和优度检验(或相关分析)、线性显着性检验——F 检验等。

1、拟合优度检验——2R 检验
拟合优度检验是检验模型曲线对样本观测值的拟合程度。

检验的方法——决定系数2R 。

2R 的构造是利用总离差平方和的分解:总离差平方和= 回归平方和+ 残差平方和
RSS
ESS TSS e Y Y Y Y i
i
n
i i
∑∑∑
+-=-∧
=22
1
2
)()(
定义决定系数:
2R 有一个显着特点:如果各观测值Yt 不变,决定系数将随解释变量的数目增加而增大。

错觉:要使模型拟合得好,可以增加解释变量,但在样本容量n 一定的情况下,增加解释变量的个数k ,必定会使自由度减少,同时会使2
S 增大,从而会使置信区间过宽,这意味着预测精度的降低。

因此,不重要的变量不应该引入,不能依据2R 是否增大来决定是否引入解释变量,模型越简洁越好。

实际中,常使用对2R 进行调整后的2
R :
∵()
2
2
2
11R k n k R R -⎪⎭

⎝⎛---=
∴2
2R R ≤
所以修正的决定系数2
R 比一般的决定系数2R 更准确地反映了解释变量对被解释变量的影响程度,应用更为广泛。

但2
R 可能为负值,因此只适用于Y 与X1,X2,…,Xk 的整体相关程度比较高的情况。

1
1
2
-->
n k R 2、方程显着性检验——F 检验
方程的显着性检验,旨在对模型中被解释变量与解释变量之间的线性关系在整体上是否显着成立做出推断。

应用最普遍的检验方法是F 检验。

下面,我们利用方差分析技术,建立F 统计量来进行方程线性显着性的联合假设检验。

检验模型中被解释变量与解释变量之间的线性关系在整体上是否显着成立,意味着检验总体线性回归模型的参数是
否显着的不为0。

即对模型:
建立原假设:。

若原假设成立,表明模型线性关系不成立。

利用方差分析技术,考虑恒等式:TSS=ESS+RSS,即
对TSS 各个部分进行的研究称为方差分析。

为此,建立方差分析表如下:
由于i Y 服从正态分布,所以有:
构造统计量:
根据变量的样本观测值和参数估计值,计算F 统计量的数值;给定一个显着性水平a ,查F 分布表,得到一个临界值
),1(k n k F --α。

检验的准则是:
当),1(k n k F F -->α,则拒绝0...:320====k H βββ,表明模型线性关系显着成立; 当),1(k n k F F --<α,则接受0...:320====k H βββ,表明模型线性关系不成立。

F 检验与2R 检验的一致性:
方差分析和相关分析建立了关系,利用F 分布的临界值得到相关分析的临界值,用于判断2R 的显着性。

3、变量显着性检验——t 检验
对于多元线性回归模型,方程的总体线性关系是显着的,并不能说明每个解释变量对被解释变量的影响都是显着的,必须对每个解释变量进行显着性检验,以决定是否作为解释变量被保留在模型中。

如果某个变量对被解释变量的影响不显着,应该将它剔除,以建立更为简单的模型。

系数的显着性检验最常用的检验方法是t 检验。

要利用t 检验对某变量Xi 的显着性进行检验,首先建立原假设:k i H i ...3,2,0:0== β 若接受原假设,表明该变量是不显着的,需从模型中剔除该变量。

已知参数估计量β的方差估计为:
ii C 表示矩阵1
)`(-X X 主对角线上第i 个元素,则参数估计量∧
i β的方差为ii u i C 2
)var(σβ=∧
∵),(~2
ii u i i C N σββ∧
又2
σ未知,所以要用∧
2
σ估计
∴)(~k n t C t ii
i i --=


σββ
∴在零假设 0:0=i H β下构造统计量)(~k n t C t ii
i -=


σβ
根据变量的样本观测值和参数估计值,计算t 统计量的数值;给定一个显着性水平α,查t 分布表,得到一个临界值)(2
k n t -α。

检验的准则是:当)(2
k n t t ->α时,则拒绝 0:0=i H β,表明变量i X 对被解释变量有显着性影响;
当)(2
k n t t -<α 时,则接受
0:0=i H β,表明变量i X 对被解释变量影响不大,将它从模型中剔除掉。

第五节 预测
预测是建立在多元回归模型在预测期内仍然成立的基础上。

即预测的基本前提是由样本得到的统计规律在预测期内没有发生大的变化,模型的假设条件仍然成立。

即 已知预测期内X 的值: ),...,,,1(030200k X X X X = 由回归模型U X Y
+=β得000u X Y +=β,这里0Y 是要预测的数值。

同一元线性回归分析预测一样,要计算)(0Y E 和0Y 的置信区间,只要得到)var(0∧Y 和)var(00∧
-Y Y 的估计值即可。

)
(~`)`()()`)`(,(~`)`()var(0
1
0000102000
1020k n t X X X X S Y E Y X X X X X N Y X X X X S Y u --=-∧
-∧
-∧
σβ
给定置信度α-1后,)(0Y E 的置信区间为:0102
00`)`()()(X X X X S k n t Y Y E -∧
-±=α
同样有
)
(~`)`(1)
`)`(1()var(0
1
00
0010200k n t X X X X S Y Y X X X X S Y Y -+-+=--∧
-∧
给定置信度α-1后,0Y 的置信区间为:0102
00`)`(1)(X X X X S k n t Y Y -∧
+-±=α
多元线性回归分析的基本步骤:
(1)研究问题所涉及的背景与经济理论,选择适当的被解释变量Y 和解使变量X2,X3,…,Xk ,并收集数据,注意统计数据口径的一致性;
(2)在理论分析的基础上,建立总体回归模型:U X Y
+=β
(3)利用最小二乘法进行参数估计:
Y X X X `)`(1
-∧
=β (4)进行模型的检验:2R 检验、F 检验、t 检验和多重共线性检验;经济意义检验。

(5)模型的应用之一——预测(点预测和区间预测)。

第四章 多重共线性
一、多重共线性的含义
在线性回归模型Y X U β=+中,对X 的基本假设是:(),rank X k k n =<,即`0X X ≠亦即矩阵X 中各向量是线性无关的。

如果这一假设不满足,即()rank X k <或`0X X =,则称模型存在多重共线性。

多重共线性的表现有两种:
1.完全多重共线性:()rank X k <或`0X X =,亦即1(`)X X -不存在。

2.近似多重共线性:`0X X ≈,1
(`)X X -对角线元素较大(实际中多是这种情况)。

例:完全多重共线性
二、多重共线性造成的影响 1.完全多重共线性
由于这时1
(`)X X -不存在,所以直接导致参数向量β的最小二乘估计1
(`)X X XY β∧
-=也不存在,无法给出估计值。

2.近似多重共线性
1) 1
(`)X X -的对角线元素很大,由于21
cov()(`)u
X X βσ

-=,从而使β∧
的方差变大,即估计的精度很低。

2) 由于1(i
ii ii
t C i S C β
β∧∧
-=
是(X`X)的第个对角线元素)
,ii C 增大,从而t 值减小,使变量不显着。

3) 参数估计值即其方差对样本的敏感度增大,使回归模型可靠度降低。

产生多重共线性的背景:
1、许多经济变量在随时间的变化的过程中往往存在共同变化趋势。

2、截面数据从经济意义上存在密切的关联度。

3、采用滞后变量容易产生多重共线性。

4、模型设定的错误。

三、多重共线性的诊断 1.相关系数检验法
求出不同解释变量两两之间的相关系数,列成矩阵,形成相关系数矩阵,如果有相关系数达到0.8以上的,即可认为该两个解释变量之间存在多重共线性。

在TSP 软件中使用命令:COVA X1,X2,...,Xk ,即可得到相关系数矩阵。

2.条件数判断法
设`X X 的特征值为:1
1212,...,...,`n n n
k X X λλλλλλλλ≥≥≥=
且则称为方阵的条件数。

当0100k <<时,可认为模型不存在多重共线性;
当1001000k ≤<时,可认为模型存在较强多重共线性; 当1000k ≥时,可认为模型存在严重多重共线性。

利用SPSS 软件建模时,选择回归分析对话框中Statistics 子项中“Collinearity Diagnostic ”,在输出结果中就会显示`X X 的特征值。

3.方差扩大因子法
设1()(`),2ij j j C C X X R X k -==-为对其余个自变量的复相关系数,称
21
,2,3,...,1jj j
C j k R =
=-为j X 的方差扩大因子(Variance Inflation Factor ),简记为VIF 。

当110j VIF ≤≤时,认为j X 与其他自变量不存在多重共线性; 当10j VIF >时,认为j X 与其他自变量存在多重共线性。

在SPSS 软件中选中Statistics 子项中的“Collinearity Diagnostic ”,在输出结果中每个自变量后面就出现有VIF
的值。

四、处理多重共线性的方法 1、增加样本容量;
2、利用先验信息改变参数的约束形式
例如对于生产函数t t t Q AL K αβ
=,改变约束形式1αβ+=,即1,()t t t t t
t t
Q L
Q AL K A K K ααα-== 取对数得:ln()t
t t t Q L Ln A K K α⎛⎫=+ ⎪
⎝⎭
,按此方程估计,模型中就没有多重共线性。

3、差分法
设模型为12233...t t t t Y X X βββμ=++++ 则有112213311...t t t t Y X X βββμ----=++++
两式相减得12221333111()()...()()t t t t t t k kt kt t t Y Y X X X X X X βββμμ------=-+-+-+-
由于12221
11
................................t t t t t t kt kt kt t t t Y Y Y X X X X X X μμμ----∇=-∇=-∇=-∇=-
所以模型变形为2233...t t t k kt t Y X X X βββμ∇=∇+∇+∇+∇ 用次模型估计一般不会有多重共线性。

4、主分量法
5、误差修正模型 五、举例 85P 例2-3
消除多重共线性方法之二——逐步回归法
1、目的:寻找最有回归方程,使2
R 较大,F 显着,每个回归系数显着。

2、种类:
1) 逐个剔除法 2) 逐个引入法
3) 有进有出法(逐步回归法)
3、准则:一次只能引入或剔除一个自变量,直至模型中所有自变量都显着。

第五章 异方差性
模型违反五项基本假定之三——误差项的同方差性假定的情形,称为异方差性。

此时,OLS 估计量失去BLUE 优良性。

需要发展估计模型参数的补救方法。

本节内容:
1.异方差的定义及其产生的背景与后果 2.异方差性的检验
3.加权最小二乘法(WLS ) 4.异方差的处理
一、异方差的定义
异方差是相对于同方差而言的。

异方差在横截面数据中比时间序列数据更为常见。

同方差:在经典线性回归模型的基本假定 3中,随机扰动项t u 的对每一个样本点的方差是一个等于
2u σ的常数,即:2var()t t u σ==常数,t=1,2,...n
异方差:是指随机扰动项t u 随着解释变量Xt 的变化而变化,即22
var()t t u t u σσ==f(X ),t=1,2,...n 但t u 仍然服
从正态分布。

相关文档
最新文档