计量经济学讲义(1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计量经济学讲义(1)
第一章绪论
第一节什么是计量经济学
计量经济学含义
1.计量经济学是一个迅速发展的经济学分支,其目标是给出经济关系的经济内容。

2.计量经济学可以定义为实际经济现象的定量分析,这种分析根据的是适当推断方法联系在一起的理论和观测的即时发展。

计量经济学运用数理统计知识分析经济数据,对构建于数理经济学基础上的数学模型提供经验支持,并得出数量结果。

3.计量经济学是将经济理论、数学方法和统计推断等工具应用于经济现象分析的社会科学。

第二节计量经济学方法
1.2.1计量经济学方法的内容
计量经济学研究包括两个基本要素:经济理论和事实。

将经济理论与现实情况结合起来,用统计技术估计经济关系。

最可用的形式就是模型。

1.2.2计量经济分析步骤
1.陈述理论。

例如有关价格变动与需求量之间的关系的经济理论:在其他条件不变的情况下,一商品的价格上升(下降),则对该商品的需求量减少(增加)。

1.2.2建立计量经济模型
⑴需求函数的数学模型
例如线性函数模型。

如果需求量Q 与价格P 之间的关系式线性的,则数学上需求函数可以表示为
Q P αβ=+
(1.2.1)
αβ和称为该函数的参数。

等号左边的变量称为因变量或被解释变量,等号右边的变量称为
自变量或解释变量。

⑵计量经济模型
式(1.2.1)假定需求量Q 与价格P 之间的关系是一种确定关系,而现实的经济变量之间,极少有这种关系,更常见的是一种不确定性关系(见散点图),线性模型应该为
Q P αβε=++
(1.2.2)
ε是随机扰动项。

1.2.3收集数据
估计计量经济模型中的参数之前,必须得到适当的数据。

在经验分析中常用的数据有两种:时间序列数据(纵向数据)和横截面数据(横向数据)。

有时会同时出现前面的纵向数据和横向数据,称之为混合数据。

面板数据是混合数据的一种特殊类型。

1.2.4估计参数
如利用收集的数据估计出式(1.2.2)中的参数,得回归模型
76.05 3.88Q P =-
(1.2.3)
1.2.5假设检验
对回归模型以及模型中的系数进行检验。

1.2.6预测和政策分析
例如在回归模型(1.2.3)中,想预测价格P=4.5时的需求量Q 值时,则有
76.05 3.8876.05 3.88 4.558.59Q P =-=-?=
第二章线性回归分析
第一节线性回归概述
2.1.1回归模型简介
如果(随机)变量y 与12,,,p x x x 存在相关关系
12(,,
,)p y f x x x ε=+
(2.1.1)
其中y 是可观测的随机变量,12,,,p x x x 为一般变量,ε是不可观测的随机变量;y 称为因变量(被解释变量),12,,,p x x x 称为自变量(解释变量),ε称为随机误差。

设12(;,,,)t t t tp y x x x 是12(;,,,)p y x x x 的第t 个观测值(1,2, ,)t n =,即
12(,,
,)t t t tp t y f x x x ε=+
(1,2,
,)t n =
线性回归模型满足下列基本假定:1. (,)i Cov x ε=0
(1,2,
,)i p =; (,)i j Cov x x =0 (,1,2,
,)i j p =;
2. 2(0,)t N εσ,12,,,n εεε相互独立同分布;
3. n ≥p+1(或rkX ≧p+1)。

当f 为线性函数时,得线性回归模型的一般形式
01122p p y x x x ββββε=+++
++
(2.1.2)

01122(1,2,
,)t t t p tp t
y x x x t n ββββε=+++
++=
(2.1.2)
2.1.2一元线性回归模型
一般形式
01y x ββε
=++ (2.1.3)

01(1,2,
,)t t t
y x t n ββε=++=
(2.1.3)
第二节多元线性模型
2.2.1模型的基本形式
01122(1,2,
,)i i i p ip i
y x x x i n ββββε=+++
++=
(2.1.2)

1011121211201212222201122p p p p n n n p np n
y x x x y x x x y x x x ββββεββββεββββε=+++++??=+++++=+++
++
(2.1.2)可以用矩阵写成
Y XB ε
=+ (2.2.1)
其中
12n y y Y y ??
= ? ???
,
1112121222313231
2
(1)
111
1p p p n n np n p x x x x x x x x x X x x x ?+?? ? ? ?= ? ? ??
,
012p B ββββ?? ? ? ?= ? ? ?
, 123n εεεεε??
= ? ?
其中X 为设计矩阵,B 为待估计参数向量,ε为随机误差向
量。

2.2.2建模过程 1.参数估计
利用普通最小二乘法(OLS )可以得到B 的最小二乘点估计
0112()?p B X X X Y ββββ-?? ? ? ?''== ? ? ? ???
(2.2.2)
得到y 关于12,,,p x x x 的线性回归方程
01122
p p
y x x x ββββ=++++ 对于一元线性回归模型01(1,2,,)t t t y x t n ββε=++= (2.1.3)系数的最小二乘点估计为
1
2
()()
()
i i i
x x y y x x β--=-∑∑ , 01
y x ββ=- 2.模型检验平方和分解式。


01122
i i i p ip
y x x x ββββ=++++ 为y 与12,,,p x x x 的第i 个回归值(1,2,,)i n =,有平方和分解式
(当参数的估计是(2.2.2)时)
2
2
1
1
1
()()()n n n
i
i
i
i
i i i y y y
y y y ===-=-+-∑∑∑ (2.2.6)记为
SST SSR SSE =+
SST —总离差平方和,SSR —回归平方和,SSE —残差平方和
(1)回归方程检验(F 检验)
01122p p y x x x ββββε=+++
++
(2.1.2)
检验零假设H 0:120p βββ====
对立假设H 1:12p βββ、、、中至少有一个不为零,检验统计量
(1)
SSR p
F SSE n p =
-- (2.2.3)
当H 0成立时,F F (p ,n-p-1),给定显著性水平α,由F 分布表,可得临界值(,1)F F p n p αα=--,由此得到
拒绝域:(,)F α∞ 接受域:(0,)F α
在EViews 中,给出了拒绝零假设时犯第一类错误(弃真错误)的概率p ,若p 小于事先确定的显著性水平α
()p α<,则可拒绝
零假设,反之不能拒绝。

直接查看相伴概率即可确定F 检验结果。

F (3,4)分布显著性水平与临界值对应表
(2)回归系数检验(t 检验)检验零假设H 0:0(1,2,,)i i p β== 检验统计量
()
i
i t S ββ=
(1,2,
,)i p = (2.2.4)
其中?()i S B 是?i
B 的标准差。

当H 0成立时,?(1)?
()
i i t t n p S β
β=--。

()()
()
()i i i i i
i i i i E t E E E S S S βββββββββ-+-==+ ? ? ?
10?0()i i H E H S ββ??=?= ?? ?≠??
给定显著性水平α,由t 分布表,可得临界值2
2
(1)t t n p α
α
=--,
由此得到
拒绝域:(-∞,2
2
)(t t αα-?,)+∞
接受域:2
(t α-,2
)t α
如果每一个回归系数都通过t 检验,说明模型中的每一个自变量都是显著的。

未通过显著性检验的系数所对应的自变量,应结合实际情况考虑将其剔除,这是自变量选择的一种常用方法。

(3)D.W 检验(Durbin and Watson )
D.W 检验用于检验残差序列的自相关性,目的是检验假设2。

(样本)相关系数(,)i i x y ,(1,2,
,)i n =
()()xy x x y y r --=
理论相关系数
xy r =
X 的(样本)自相关系数
122
()()
i i n i i x x x x x x x
ρ
----==
∑∑(当0x =时)线性模型
y i =B 0+B 1x i1+B 2x i2+…+B p x ip +i ε 回归方程的第i 个回归值
01122
(1,2,
,)t t t p tp
y x x x t n ββββ=++++=
残差序列
i i i e y y
=- (i=1,2, …,n )或 ?t t t e y y
=-(1,2,,)t n =
2
2
22
1
112
2
1
1
221
1
()
(2).n
n
t
t t t t t t t n n t
t
t t e e
e
e e e DW e
e
---==--==-+-=
=
∑∑∑∑
12121
22
2(1)n
t t t n t
t e e
e
ρ-=-==-=-∑∑ (2.2.5)
易见0≦D.W ≦4。

提出假设H 0:残差序列无序列相关等价于H 0:0ρ= 判别准则:若0≦D.W ≦L d ,序列存在正相关;若U d ≦D.W ≦4-U d ,序列无自相关;若4-U d ≦D.W ≦4,序列存在负相关。

3.模型评价模型评价就是为了在多个模型之间择优。

模型中自变量多,似乎可以提高预测精度,但会增加模型的研制、使用和维护费用,因变量y 的预测值波动范围也会加大。

因此需要找到适当的评价方法和评价指标,在综合考虑模型的准确性和简洁性的前提下,
对模型的优劣给予客观的评价。

假设2. t ε~N(0,2σ) 12,,εε…,p ε相互独立同分布。

2
21?()?1
n
t
t
t y y
n p σ
=-=--∑是2σ的无偏估计量。

(1)样本决定系数2R 和修正决定系数2R 样本决定系数
2
2
12
1
()()
n
i
i n
i
i y
y SSR R SST
y y ==-==
-∑∑ (2.2.7)
0≦2R ≦1,当2R >0.8,认为模型的拟合优度比较高;0.5≦2
R ≦0.8,模型的拟合优度一般;2R ≦0.5,模型的拟合情况不好。

修正决定系数
2
22
()(1)1
11()(1)1
i
i i y y
n SSE n p R y y n p SST n ----=-
=-
----∑∑
111n SST SSR n p SST --??
=-
--?? ()21
111
n R n p -=-
--- (2.2.8)
其中n 是样本容量,p 是未知参数个数。

(2)对数似然值(Log Likelihood 简单记为L )
2?log 2log 222
n n n
L πσ
=--- (2.2.9)
其中2
2
1
()?1
n
t
t
t y y
n p σ
=-=
--∑是2σ的估计,n 是样本量。

L 取值越大越好。

(3)AIC准则(Akaike Information Criterion)
赤池信息准则
L p
22
=-+(2.2.10)AIC
n n
其中L是对数似然值,n是样本容量,p是被估计参数个数。

AIC 准则要求AIC取值越小越好。

(4)SC准则(Schwarz Criterion)
施瓦茨准则
L p n
2ln
SC
=-+(2.2.11)n n
其中L、n、p意义同(2.2.10)。

SC准则要求SC取值越小越好。

2.2.3 EViews的操作及实例
例2.1表2.1是1950—1987年间美国机动车汽油消费量和影响消费量的变量数值。

其中各变量表示:qmg—机动车汽油消费量(单位:千加仑);car—汽车保有量;pmg—机动汽油零售价格;pop—人口数;rgnp—按1982年美圆计算的gnp(单位:十亿美圆);pgnp—gnp指数(以1982年为100)。

以汽油量为因变量,其他变量为自变量,建立一个回归模型。

表2.1 1950—1987年间美国机动车汽油消费量数据
回归方程为
Qmg=68497350+1.59*car-10375410*pmg-462.29*pop-462.29*rgnp
(5.1056) ( 11.5265) ( -3.1005) ( -4.2772) ( -2.4134)
(0.0000) (0.0000) (0.0040) (0.0002) (0.0217)
-579453*pgnp
( -9.7782)
(0.0000)
调整决定系数2R =0.99,F =781.54(0.0000),D.W=0.8694 回
归方程下面第一排括号内数据是对应的回归系数t 检验统计量的值,第二排括号内数据是对应的回归系数t 检验统计量的相伴概率。

主要讲解内容
1.散点图;
2.Scat qmg 与car ;
3.相关系数矩阵;
4.两种建模方法;
5.预测结果的各种指标评价。

2.2.4模型预测
预测效果的好坏是是评价模型的标准之一。

下面依次介绍评价指标。

RMSE (均方根误差)定义为
RMSE=
(2.2.12)
MAE (平均绝对误差)定义为
MAE =1
1?n
i i i y y n =-∑ (2.2.13)
MAPE (平均绝对百分误差)定义为
MAPE =1?1100
n i i i i
y
y n y =-?∑ (2.2.14)
MAPE 的值低于10,则认为预测精度比较高。

Theil IC(Theil Inequality Coefficient) 希尔不等系数
Theil IC =
(2.2.15)
均方误差可以分解为
222
1
1??()()()2(1)n i i y y y y
i y y y r n σσσσ=-=-+-+-∑ (2.2.16)
其中?y 是预测值的均值,y 是实际值的均值,?y σ和y σ分别是预测
值和实际值的标准差,r 是它们的相关系数。

于是可以定义偏差率(Bias Proportion )、方差率(Variance Proportion )和协变率(Covariance Proportion )。

偏差率 BP=
22
1
()1?()n i i
i y y y y n =--∑ (2.2.17)
方差率 VP=
2
21
()
1?()y y n
i i i y y n σσ=--∑ (2.2.18)
协变率
CP=?21
2(1)1
()y y
n
i i i r y y n σσ=--∑=1-偏差率-方差率(2.2.19)
2.2.5有关补充问题
1.Chow 检验(包括Cho ws 断点检验和Cho ws 预测断点检验)Cho ws 断点(Breakpoint )检验基本思想:对两个子样单独拟合方程,检验两个拟合方程是否有显著性差异。

零假设H 0:两个子样拟合方程无显著差异检验统计量
11221122()()(2)
k
F n k εεεεεεεεεε'''--=
''+- (2.2.20)
其中εε'是全部样本拟合方程的残差平方和,i i εε'是第i (i=1,2)个子样的残差平方和,k 是方程中参数个数。

当H 0成立时
F ~F(k,n-2k)
EViews 软件中同时给出了对数似然比统计量LR ~2((1))m k χ- (当H 0成立时)其中m 是子样本个数。

Cho ws 预测断点检验
Cho ws 预测断点检验基本思想:先对包含前1T 个观察值的子样建立模型,然后用这个模型对后212()T T T n +=个观察值的因变量进行预测,若实际值与预测值有很大差异,就可以怀疑这两个子样估计关系的稳定性。

检验菜单操作
View/stability Tests/Chow Forecast Test 2.自变量选择
(1)对方程引入自变量时可以用Testadd 检验(略) (2)剔除变量时用T estdrop 检验统计量有 F LR
在例2.1中回归方程
qmg=68497350+1.59*car-10375410*pmg-462.29*pop-462.29*rgnp-579453*pgnp
name :eq01
检验零假设H 0:pgnp 对qmg 的影响不重要在主窗口命令行输入 eq01. Testdrop pgnp
第三节含定性变量的回归模型 2.3.1定性变量的概念变量类型
(1)名义尺度变量(定性变量)(2)有序尺度变量(定性变量)(3)数值尺度变量(定量变量)2.3.2名义变量的设立例如,职工工作量的回归模型
y i =B 0+B 1x i +B 2D i +i ε (2.3.1) 其中y i 和x i 分别是第i 个职工的工作量及工作时间,D i 为性别,且(虚拟变量)
1
0i man D woman
=?
不能建立这样的模型
012132i i i i i y x D D ββββε=++++
(2.3.2)
110i D ?=?


210i D ?=??女男
如果引入这样的两个虚拟变量,模型的最小二乘估计失效。

战时与平时,或有明显的季节指标都可以引入虚拟变量。

例2.2
第四节常见的问题及对策
经典的线性回归模型存在一些假设条件,若其中某一条(或几条)假设不成立,估计的参数值误差有可能变大,各种检验也会产生问题。

2.4.1多重共线性 1.多重共线性含义若有
1122x x λλ++…0p p x λ+= (2.4.1)
其中12,,,p λλλ不全为零,称12,,,p x x x 存在多重共线性。

多重共线性后果:参数估计标准误差变大,置信区间变宽,从而估计值的稳定性降低;系数t 检验不能通过的概率增大。

2
21?()?1
n
t
t
t y y
n p σ
=-=--∑
2.诊断方法
(1)自变量之间简相关单系数很高;
(2)回归系数符号与简单相关系数的符号相反;(3)主成分分析法;(4)方差扩大因子法
x j 的方差扩大因子 VIF j =211jj j
C R =
- (2.4.2)
其中jj C 为矩阵1(1)(1)()p p X X -+?+'中主对角线第j+1个元素,2
j R 是回归方

0112211j j j x
x x x αααα--=+++++…11??j j p p x x αα+++++ (*)的决定系数。

VIF j 越大,x j 与其余p-1个自变量的线性依赖程度越强,测自变量之间共线性越严重。


1
1()p
j j VIF VIF p ==∑
(2.4.3)
当10VIF ≥时,存在严重共线性。

VIF j 法(方差扩大因子法)
将(*)命名eqcar ,在主窗口命令行输入Scalar vifcar=1/(1-
eqcar.@R2)
同时工作表中产生#vifcar=(229.186)。

3.多重共线性处理方法(1)增大样本容量(2)剔除法(3)差分法将原模型01122t t t y x x βββ=+++…p tp t x βε++
(2.4.4)
变形为
1122t t t y x x ββ?=?+?+…p tp t x βε+?+?
(2.4.5)
其中算子
1t t t y y y -?=-, 1,tj tj t j x x x -?=-(1,2,j =…,p )
2.4.2异方差性
1.异方差性的含义及影响在回归模型中的随机误差项i ε,有
()()i j Var Var εε≠
()i j ≠ (2.4.6)
称i ε存在异方差性。

2.异方差性的诊断方法 (1)图示检验法
以因变量作横坐标,回归方程残差作纵坐标,根据做出的散点图直观地判断是否存在相关性,若存在相关性则存在异方差性。

点击菜单Quick/Graph ,在对话框中输入残差序列名、因变量名,击OK 后从Graph Type 中选Scatter Diagram 。

(2)戈里瑟(Gleser )检验
求变量y 对于x 1,x 2,…,x p 的回归方程,的残差序列e t ,以某个x j 为自变量,建立方程
01()j e f x ααε=++
(2.4.7)
表2.7 Gleser 检验的几种参考形式
由于j x 与()j f x 都要经过多次试验才能确定,这种方法在实际中可能很难实现。

(3)怀特(White )检验
把残差平方2e 作为因变量,原先的自变量和自变量的平方作为新的自变量建立线性回归模型(还可以加上任意的自变量的交叉项i j x x ),通过这个模型的拟合情况来检验是否有异方差。

检验零假设H 0:残差不存在异方差性
222
011223142512e x x x x x x αααααα=+++++
(2.4.8)
怀特检验统计量
m=n*R 2
~2()k χ (当H 0成立时) (2.4.9)其中n 是样本量,R 2
是(2.4.8)的决定系数,k=参数个数-1。

估计式(2.4.8)后,在结果输出窗口选路径View/Residual Tests/White Heteroskedasticity (cross terms) (若选no cross terms 则无交叉项 )
3.对例2.1进行不含交叉项的White 检验。

异方差的处理
⑴加权最小二乘法(WLS:Weighted Least Square )其基本思路:赋予残差的每个观察值不同权数,使模型的随机误差项具有同方差性。

若已知2()i i Var εσ=, WLS 的残差平方和变为
2011[()]n
i i i i Q w y x ββ==-+∑
(2.4.10) 2011
1
[()]n
i i i i
y x ββσ==-+∑
(2.4.11)
若已知一元线性回归模型i ε的方差与自变量的某种函数成。

相关文档
最新文档