计量经济学第五讲v
计量经济学第五讲---模型函数形式
Prob. 0.0000 0.0000 5.468946 0.086294 -9.94267 -9.84926 81786.04 0.000000
ˆ 5.317 0.0098t ln Y t
斜率0.0098表示,平均而言, se (0.000608 )(0.0000343 ) Y的年增长率为0.98%。
每提高1个百分点,平均而言,数学S.A.T分数将增加0.13 个百分点。根据定义,如果弹性的绝对值小于1,则称缺 乏弹性。因此,在该例中,数学S.A.T分数是缺乏弹性的。 另外,r2=0.9, 表明logX解释了变量logY的90%的变 动。
13
第5章
经济学的弹性:
以价格弹性为例: 价格弹性的准确定义是需求量变动的百分比除以价格变动的百分 比。 价格变动一个百分点,引起需求量变动超过一个百分点,则该物 品就富有价格需求弹性;需求变动量不到一个百分点,则缺乏价 格需求弹性;需求变动量等于一个百分点,则该物品拥有单位需 求价格弹性。
S.D. dependent var
Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
20.51101
2.260832 2.354245 23141.80 0.000000
S.E. of regression Sum squared resid Log likelihood
2642.152 134.6207
Mean dependent var S.D. dependent var
S.E. of regression
Sum squared resid Log likelihood Durbin-Watson stat
2024版计量经济学全册课件(完整)pptx
REPORTING
2024/1/28
23
EViews软件介绍及操作指南
EViews软件概述
EViews是一款功能强大的计量经济学 软件,提供数据处理、统计分析、模型
估计和预测等功能。
统计分析与检验
2024/1/28
详细讲解EViews中的统计分析工具, 包括描述性统计、假设检验、方差分
析等。
数据导入与预处理 介绍如何在EViews中导入数据,进行 数据清洗、转换和预处理等操作。
随着大数据时代的到来,机器学 习算法在数据挖掘、预测和分类 等方面展现出强大的能力,为计 量经济学提供了新的研究工具和 方法。
机器学习在计量经济 学中的应用领域
机器学习在计量经济学中的应用 领域广泛,如变量选择、模型选 择、非线性模型估计、高维数据 处理等。
机器学习在计量经济 学中的常用算法
机器学习在计量经济学中常用的 算法包括决策树、随机森林、支 持向量机(SVM)、神经网络等。 这些算法可以用于分类、回归、 聚类等任务,提高模型的预测精 度和解释力。
面板数据特点
同时具有时间序列和截面数据的特征,能够提供更多的信息、更多的变化、更少共 线性、更多的自由度和更高的估计效率。
2024/1/28
20
固定效应模型与随机效应模型
固定效应模型(Fixed Effects Model)
对于特定的个体而言,其截距项是固定的,不随时间变化而变化。
随机效应模型(Random Effects Mode…
经典线性回归模型
REPORTING
2024/1/28
7
一元线性回归模型
模型设定与参数估计
介绍一元线性回归模型的基本形式, 解释因变量、自变量和误差项的含义, 阐述最小二乘法(OLS)进行参数估 计的原理。
计量经济学第五章
Variables-Likelihood Ratio • 出现对话框时,写入删除变量名--OK • 对比删除前后的AIC与SC信息值,信息
值小的结论是应采纳的。
9
用Eviews的误设定检验3
• 第一,估计出简单(单纯)方程 • 第二,在命令窗口上写入genr v_hat=resid 或者 Procs/Generate Series中 v_hat=resid 发现 v_hat • 第三,估计出新的回归方程
无约束模型(U)
有约束模型(K) (general to simple)
计算统计量F
F=(RSSK-RSSu)/J RSSu/(n-k-1)
~F(J, n-k)
J 为表示约束条件数, K 为表示自变量数 或者 应估计的参数数, n 为表示样本数(obs)
4
2. LM检验(Lagrange Multiplier
多重共线性多出现在横截面资料上。
16
三、异方差性的检验及对策
Var(ℇi)≠Var(ℇj) (i≠j)时, ℇi中存在异方差性(Herteroskedasticity)。 即随机项中包含着对因变量的影响因素。 异方差性多发生在横截面资料上。
17
异方差性的检验
1.图示检验法 如模型为Yi=0+1X1i+2X2i+…+ℇi 时,
7
用Eviews的误设定检验1
• 首先估计出简单(单纯)方程 • View/Coefficient Tests/Omitted
Variables-Likelihood Ratio • 出现对话框时,写入新变量名 OK • 检验结果出现在上端,如果P值很小时, 拒
金融计量经济第五讲虚拟变量模型和Probit、Logit模型
第二节 虚拟被解释变量模型
• 问题1:对于商业银行,企业贷款可能出现违约,也就是说一家企 业贷款后有违约和不违约两种可能,如何甄别?(李萌,2005)
• 问题2:证券投资者在特定时期内的投资选择是买或不买,如何确 定这样的选择?(王冀宁等,2003)
• 问题3:上市公司出现经营问题,可能成为ST、PT,是什么原因导 致这样的结果?
6563.76 1597.98
16.904 16.9416 157.922
0
应用例题2:股息税削减对股价的影响
• 背景资料—2005年6月14日,财政部、税务总局发文,规定对个人投资者从
上市公司取得的股息红利所得,暂减按50%计入个应纳税所得额(红利税从 20%降为10%)。
• 利用事件分析法分析该政策对股价有无显著影响,即政策出台前后股票有无 异常收益。时间窗口为发布日及前后各二天。
E( yi ) P( yi 1) X i
• 但因为
i
1 X
Xi i
当yi 1,其概率为X i 当yi 0,其概率为1 X i
• 模型具有明显的异方差性,故而用模型(5.8)直接进行参数估计 是不合适的。
• 另外,由于要求
E( yi ) P( yi 1) Xi 1
亦
难以达到。
Di 0, 其它季度的数据
, i 2,3,4
• •
原 则模 引型 入若 虚为 拟变量后的y模t 型为:
xt
ut
yt xt 2 D2t 3 D3t 4 D4t ut (5.6)
• 回归模型可视为:
yˆt ˆ ˆxt
一季度
yˆt ˆ ˆxt ˆ2 二季度
yˆt ˆ ˆxt ˆ3 三季度
二、虚拟变量的设置原则
经济计量学第五讲 回归方程的函数形式
双曲函数模型的一个显著特征是,当X无限 增大时,Y将逐渐接近于B1(渐进值或极值)。可以
用双曲函数模型来描述平均成本曲线、恩格尔消
费曲线和菲利普斯曲线等领域的情况。
东北财经大学数量经济系
第六节 多项式回归模型
下述模型称为多项式回归模型:
Yi B1 B2 X i B3 X B4 X ui
Yi B1 B2 ln X i ui
B2的含义为:X的相对变化引起的Y的绝对量变 化量;即表示自变量的一个单位相对增量引起因变量 平均的绝对增量。
Y B2 (X / X )
东北财经大学数量经济系
第五节 双曲函数模型
下述模型称为双曲函数模型:
Yi B1 B2 1 Xi ui
2 i 3 i
多项式回归模型在生产与成本函数领域应用广
泛。在多项式回归模型中,等式右边虽然只有一个 解释变量,但却以不同的次幂出现,因此可以把它
们看做是多元回归模型中的不同解释变量。
东北财经大学数量经济系
我们通过观察散点图,认为需求量和价格之间是近似
的线性关系,因此建立两变量线性回归模型来研究需 求量和价格之间的关系。 若需求量和价格之间的关系不是线性关系而是指 数形式,则我们就需要建立下面的模型来描述需求量
和价格之间的关系,即:
Yi AX
东北财经大学数量经济系
B i
(1)
第一节 双对数模型(2)
东北财经大学数量经济系
第三节 多元对数线性回归模型(4)
例:根据墨西哥1955年到1974年的数据估计多元对 数模型的结果如下:
东北财经大学数量经济系
第四节 半对数模型(1)
下述模型称为半对数模型或对数—线性模型:
计量经济学讲义第五讲(共十讲)
第五讲 自相关高斯-马尔科夫假定五是:(,)0,i j i j C ovariance i j εεεεδ==≠如果该假定不成立,那么称模型的误差项是序列相关的。
由于序列相关主要针对于时间序列数据,因此,下面把i 改写为t ,样本容量N 改写为T 。
笔记:1、如果基于横截面数据的回归模型其误差项是相关的,则称为空间自相关。
但是要记住,除非观察顺序具有某种逻辑或者经济上的意义,否则,在横截面数据回归中,观察顺序是可以随意的,因此,也许在某种观测顺序下误差项呈现出一种模式的自相关但在另一种观测顺序下又呈现出另外一种模式的自相关。
然而,当我们处理时间序列时,观测服从时间上的一种自然顺序。
2、在经济变量时间序列回归模型中,误差项经常被称之为冲击(Shock )。
对经济系统的冲击经常具有持续性,从而这为误差项序列相关提供了现实依据。
一、 自相关的后果在证明高斯-马尔科夫定理时,我们仅仅在证明OLS 估计量的方差最小(在所有线性无偏估计量中)时用到了序列无关假定,而在证明线性、无偏性并没有用到该假定,因此违背无自相关性假定并不影响线性、无偏性,只影响方差最小性质。
在证明方差最小时,我们分了两步,其中第一步是计算OLS 估计量的方差。
对模型:t 01t t y x ββε=++有:12ˆ12222()()()()(())()()[()]t t t t t t t t tx x Variance x x x x Variance x x Variance x x x x βεδβεε-=+---==--∑∑∑∑∑∑在假定五:0,0t t j j εεδ+=≠下,有:122ˆ222()[()]ttt x x x x βεδδ-=-∑∑如果假定五不成立,那么正确的方差表达式应该是:12ˆ1221122()2()()[()]t t t jT T tt t t j t j t x x x x x x x x βεεεδδδ+--+==-+--=-∑∑∑∑所以, OLS 法下通常的系数估计量方差的表示是错误的。
计量经济学课件第5章
回归分析是通过样本所估计的参数来代替总体的 真实参数,或者说是用样本回归线代替总体回归线。
尽管从统计性质上已知,如果有足够多的重复抽 样,参数的估计值的期望(均值)就等于其总体的 参数真值,但在一次抽样中,估计值不一定就等于 该真值。
那么,在一次抽样中,参数的估计值与真值的差 异有多大,是否显著,这就需要进一步进行统计检 验。
单侧检验与双侧检验:P67。
5
只有将非预期结果作为原假设,才能控制拒绝原 假设事实上为真但偶然被拒绝的概率,即控制拒绝 原假设犯错误的概率。但反之不真,即在原假设为 假时,无法确切地知道将其错误地接受为真的概率。
即拒绝原假设,我们知道犯错误的概率,但接受 原假设,不知道犯错误的概率,所以最好说不拒绝 而不是接受。
由样本推断总体,可能会犯错误, 第一类错误:原假设H0符合实际情况,检验结果 将它否定了,称为弃真错误。 第二类错误:原假设H0不符合实际情况,检验结果 无法否定它。称为取伪错误。 例:P68,图5-1,图5-2。
8
5.1.3 假设检验的判定规则
判定规则:在检验一个假设时,首先计算样本统计量, 将样本统计值与预先选定的临界值比较,根据比较 结果决定是否拒绝原假设.即临界值将估计值的取 值范围分为两个区域,接受域和拒绝域,来决定是否 拒绝还是接受.
产生不正确推断时所面对的两类错误。
4
5.1.1 古典原假设和备选假设
原假设或者零假设(null hypothesis),待检验的 假设,用符号H0表示, 代表研究者的非预期取值. 例如,你预期参数是正值,则建立虚拟假设为:
H0: <=0 备选假设,对研究者预期取值的表述,用符号HA表示,
接上例,备选假设为: HA : >0
第五讲 多值、排序与计数模型 高级计量经济学及Stata应用课件
• 这些解释变量都只依赖于个体,而不依赖于方案 ,故应使用多项logit或多项probit回归。
2020/7/27
陈强 计量及Stata应用 (c) 2014
20
数据特征
• use nomocc2.dta, clear • sum
• 解释变量xij,既随个体i而变,也随方案j而变。
• 系数 β 表明,xij对随机效用Uij的作用不依赖于方 案j。比如,乘车时间依个体与方案而变,但乘车 时间太长所带来的负效用是一致的。
2020/7/27
陈强 计量及Stata应用 (c) 2014
9
条件Logit (续)
• 根据与多项Logit类似的推导,
2020/7/27
陈强 计量及Stata应用 (c) 2014
18
混合logit的Stata命令
• asclogit y x1 x2 x3,case(varname) alternatives(varname) casevars(varname) base(#) or
• “asclogit”表示“alternative-specific conditional logit”
• 如果假设 i1, ,iJ 服从J维正态分布,可
得“多项probit”(multinomial probit)模型
• 但多项Probit的计算涉及高维积分,不易计 算,较少使用。
2020/7/27
陈强 计量及Stata应用 (c) 2014
7
随方案而变的解释变量
• 多项Logit仅考虑不随方案而变的解释变量(比如, 个体收入),但有些解释变量既随个体,也随方案 而变。比如,在选择交通工具时,乘车时间既因 个体而异,也因交通工具而异。
计量经济学第5章PPT学习教案
量保持不变的情况下,Xj每变化1个单位时,Y 的均值E(Y)的变化;
或者说j给出了Xj的单位变化对Y均值的“直
接”或“净”(不含其他变量)影响。
第1页/共49页
2
总体回归模型n个随机方程的矩阵表达式为 Y Xβ μ
其中
1 X 11
X
1
X 12
1 X 1n
所以,
ˆ ~ N(, 2(X X )1)
第24页/共49页
以cii表示矩阵(X’X)-1 主对角线上的第i个元素,于是参数估 计量的 方差为 : 其中,2为随机误差项的总体 方差, 由于总 体未知 ,故方 差也不 可知。 因此, 在实际 计算时 ,用它 的估计 量代替:
ˆi ~ N (i , 2cii )
2Q
ˆˆ
2X X是一个正定矩阵
ˆ (X X ) XY 1
是使方程最小化的解。
第13页/共49页
14
知识点:正定矩阵
对于任意的非零向量c,令
a cX Xc
则
a cXXc vv
vi2
除非v中的每一个元素为0, 否则a为正的。但是,若v为0, 则
v Xc 0
这与X中的向量线性无关的假设是矛盾的,故X满秩,则必
n
第7页/共49页
8
回忆:由线性代数可知
如果一个矩阵没有逆矩阵,则被称 为奇异矩阵,如果有则为非奇异矩 阵(non-singular)
对于n阶方阵A,A是非奇异矩阵的 证明: 充要条件是A的行列式不等于0
当r且an仅k(当X X矩)阵 满ran秩k时(X,) 其k行1列式不 X X为(k等+1于)(零k+1)阶方阵,所以,X X为非奇异矩阵,可逆.
计量经济学课件-第五章
假定系数服从以下多项式分布
bj a0 a1 j ar jr j 1, 2, p
• 则:
b0 a0 b1 a0 a1
ar
b p
a0 a1 p
ar p r
• 如果 r 2
b0 a0 b1 a0 a1 a2
b0 b1 b2
b0
b0
b0
2
对原模型做Koyck变换
Yt b0 X t b0 X t 1 b0 2 X t 2
Ut
1
Yt 1 b0 X t 1 b0 X t 2 b0 2 X t 3
U t 1 2
Yt 1 b0 X t 1 b0 2 X t 2 b0 3 X t 3 U t 1
p
i 1
bt
i
称为长期(long-run)或均衡乘数(total
distributed-lag multiplier),表示X变动一个单位,由于
滞后效应而形成的对Y均值总影响的大小。
• (2)自回归分布滞后模型(autoregressive distributed-lag model)
模型中的解释变量仅包含X的当期值与被解释 变量Y的一个或多个滞后值
Yt a b0 X t b1Yt1 b2Yt2 bqYtq Ut
• 3、分布滞后模型的OLS估计 (1)估计中存在的问题: 无限分布滞后:样本有限,无法估计; 有限分布滞后: 没有先验准则确定滞后长度; 滞后期过长导致丧失过多自由度; 容易出现多重共线;
• (2)一般处理
各种方法的基本思想大致相同:都是通过对各滞后变 量加权,组成新变量从而有目的地减少滞后变量的数 目,以缓解多重共线性,保证自由度。
计量经济学1-5章(超详细完整版)
26
理论计量经济学和应用计量经济学
计量经济学根据研究对象和内容侧重面不同,
可以分为理论计量经济学和应用计量经济学。 理论计量经济学:是以介绍研究计量经济学的 理论与方法为主要内容,侧重于理论与方法的数学 证明与推导。
应用计量经济学:以建立与应用计量经济学模
型为主要内容,强调应用模型的经济学和经济统计
拉格纳·弗里希( R. Frish )
19
计量经济学是用数学语言 来表达经济理论,以便通 过统计方法来论述这些理 论的一门经济学分支。
计量经济学可定义为:根据
理论和观测的事实,运用合
适的推理方法使之联系起来 同时推导,对实际经济现象 进行的数量分析。
20
教科书中的一般表述: 统计学、经济
理论和数学
(1.1) (1.1)式为数理经济模型,该模型是不可以 估计的。要研究收入I 的变化对消费支出C的数量 影响程度,需要对(1.1)进行改造模型。
35
首先,明确(1.1)式的函数形式。例如, C a bI (1.2) 其中 a、 b 为未知的参数, 其次,在(1.2)式右端引入随机变量u,以
16
当前的计量理 论前沿问题
17
○ 计 量 经 济 学 在 中 国 的 发 展
我国计量经济学研究
和应用水平同世界前
沿的差距迅速缩小
2000年
我国计量经济学研 究和应用的普及阶 段
成立了“中国数量经济研
究会”,为创立我国的计
1984年 量经济学奠定了基础
1979年
18
二、什么是计量经济学?
用数学方法探讨经济学可以从好几个方面着手,但 任何一个方面都不能和计量经济学混为一谈。计量 经济学与经济统计学绝非一码事;它也不同于我们 所说的一般经济理论,尽管经济理论大部分具有一 定的数量特征;计量经济学也不应视为数学应用于 经济学的同义语。经验表明,统计学、经济理论和 数学这三者对于真正了解现代经济生活的数量关系 来说,都是必要的,但本身并非是充分条件。三者 结合起来,就是力量,这种结合便构成了计量经济 学。
经济学计量经济学第五章PPT课件
• 当a>0、0<b<1时,y 随着t 的增加而趋向于0
• 描述以几何极数递增或递减的现象
• 序列的观察值按指数规律变化
• 序列的逐期观察值按一定的增长率增长或衰减
• 参数估计方法 • 采用对数变换法将模型化为线性进行估计
29
第29页/共45页
修正指数型增长曲线模型
• 一般形式
y L ab •
•
~yi ˆ0 yi f xi , ˆ0 zi ˆ0 ˆ0
• 易平~y求方i 出和ˆ其式0参最数小zi 的ˆ0普 通ˆ最小二i 乘估计值
•
ˆ
,该估计值使得残差
2
ˆ1
n
S ˆ1
~yi ˆ0 zi ˆ0 ˆ1 2
i 1
17
第17页/共45页
Gauss-Newton迭代法(续2)
• 类别 • 多项式增长曲线模型 • 简单指数型增长曲线模型 • 修正指数型增长曲线模型 • Logistic增长曲线模型 • Gompertz增长曲线模型
27
第27页/共45页
多项式增长曲线模型
• 一般数学形式
•
y• t
yt:a第0t
期
的a1某t
个经a济2t指2
标
;t :时a间k t
k
• a0,a1,…,ak:模型参数
• 至此完成非线性模型的OLS估计
18
第18页/共45页
Gauss-Newton迭代法(续3)
• 步骤
• 给出参数估计值 近似值
的初值 ,将
ˆ
在 处展开泰勒级数,取一阶
ˆ0
f xi , ˆ
ˆ0
• 计算
和
的样本观z测i 值ˆ0
第五讲异方差和自相关精制课件
reg lny lnk lnl 检查是否具有异方差
精制课件
16
4。use nerlove,clear reg lntc lnq lnpl lnpf lnpk 检验是否具有异方差
对于经典计量模型,我们的基本假设有:
假设 对于解释变量的所有观测值,随机误差项
有相同的方差。
Var(i
)
E
(
2 i
)
2
i 1, 2,...n
Var(U ) E[U E(U )][U E(U )]' E(UU ')
E(μμ )
E
1
1
n
12 E
1 n
n
n
1
2 n
其二,可能的情况下对变量取自然对数。变量取对 数降低了变量的变化程度,因此有助于消除异方差。
精制课件
26
自相关
经典假设 随机误差项彼此之间不相关 Cov(i , j ) E(i j ) 0 i j i, j 1,2,, n • 如果存在自相关,则:
COV (ui,uj) 0
• 时间序列数往往存在着自相关,即:
精制课件
17
异方差的处理
1。使用“OLS+异方差稳健标准误”(robust standard error):这是最简单,也是目前比较 流行的方法。只要样本容量较大,即使在异方差 的情况下,只要使用稳健标准误,则所有参数估 计、假设检验均可照常进行。
sysuse nlsw88, clear
reg wage ttl_exp race age industry hours
计量经济学第五讲
第三章 回归模型的扩展利用回归分析的估计、检验理论可以建立一个较好的因果关系模型,但是数理统计方法主要适用于研究可控的自然现象,对于无法通过人为控制进行“实验”的社会经济现象,其适用性就受到一定限制。
因此,对于传统的回归分析方法,人们在理论、方法和应用上都有了许多发展。
本章主要讨论三个方面的“扩展”内容:(1)古典回归模型基本假定不成立时所产生的问题;(2)如何反映定性因素的影响;(3)如何反映滞后因素的影响,将静态模型转化成动态模型。
第一节 异方差性古典回归模型包含了若干基本假定,在这些基本假定成立的前提下,应用最小二乘法可以得到无偏、有效的参数估计量,而且可以构造F 检验、t 检验、系数的标准误差等统计量来评价模型的优劣。
但是许多经济现象并不一定都能满足这些假定,这必然会影响回归分析的估计和检验结果。
在古典回归模型的若干假定中间,是不容易成立的是同方差假定、非自相关假定和无多重共线性假定。
因此,在本章的前三节中我们将着重分析这三个假定,并且对每一个假定都依次讨论以下问题: (1)假定的含义及其违反的原因;(2)假定违反时将会产生什么不利影响; (3)如何检验假定是否成立; (4)假定违反时的处理方法。
一、异方差性及其产生的原因 对于线性回归模型i ki k i i i x b x b x b b y ε+++++= 22110同方差假定为:n i D i ,,2,1)(2==σε即对于不同的样本点,随机误差项的离散程度是相同的;如果出现:n i D i i ,,2,1)(2 =≠=常数σε则称模型出现了异方差性(Heteroskedasticity )例如,利用横截面资料建立居民储蓄函数时,对于低收入家庭,其满足基本消费支出之后的剩余收入已经不多,所以各个家庭之间的储蓄存款不会有太大差异;但对于高由入家庭,因受储蓄心理、消费习惯、家庭成员构成等因素的影响,各个家庭之间的储蓄存款可能会有很大差异,即随机误差项的方差会明显地大于低收入家庭。
完整的计量经济学 计量经济学第五章 线性回归的PPT课件
X 若采用变量关系 E () ( 0 0 ) ( 1 1 )X 1 0 (2 2 )X 2 3 X 3
Y 0 1 X 1 2 X 2
Y Y
或
D 1i
0,当 i是男性时 1,当 i是女性时
38
对于截面数据计量分析的例子
对于截面数据计量分析中,观测对象特征差异导致的规律 性扰动,也可以利用虚拟变量加以处理。
如观测对象的性别是一个影响因素,解决的办法就是在模 型中引进虚拟变量,即
D1,D2,D3和D4,
这个虚拟变量就能解决由于观测对象的性别因素所导 致的误差项均值非0问题。
非线性变量关系的残差序列图
e
i
8
(三)问题的处理和非线性回归
1、模型修正和变换 恢复模型的合理非线性形式 然后再变换成线性模型
9
泰勒级数展开法
2、泰勒级数展开法 假设一个非线性的变量关系为:
Y f X 1 , ,X K ;1 P
在 处对 B 0b 1,0 ,b P 0 β1, ,P 作泰勒级数展开:
第五章 线性回归的定式偏差
1
标题添加
点击此处输入相 关文本内容
标题添加
点击此处输入相 关文本内容
总体概述
点击此处输入 相关文本内容
点击此处输入 相关文本内容
2
线性回归的定式偏差
本章讨论变量关系非线性、存在异常值、 规律性扰动和解释变量缺落等导致的线性 回归模型前两条假设不成立的定式偏差, 包括它们对线性回归分析的影响、判断和 处理的方法等。
1 0 2 0
1 1 X 2 1 X
1 2
第五讲 自相关性
第5章 自相关性5.1 自相关性及其产生的原因5.1.1 什么是自相关性对于模型:t kt k t t t u x b x b x b b y +++++= 22110 (5.1.1)如果随机误差项的各期值之间存在着相关关系,即协方差0)())())(((),cov(≠=--=s t s s t t s t u u E u E u u E u E u u (s t ≠,k s t ,2,1,=)这时,称随机误差项之间存在自相关性或序列相关(Autocorrelation or serial correlation)。
随机误差项的自相关性可以有多种形式,其中最常见的类型是随机误差项之间存在一阶自相关性或一阶序列相关:0)(),cov(11≠=--t t t t u u E u u ,或者:)(1-=t t u f u 。
一阶自相关性可以表示为t t t v u u +⋅=-1ρ (5.1.2)其中ρ是t u 与1-t u 的一阶自相关系数,t v 是满足回归模型基本假定的随机误差项。
因为在大样本情况下,根据OLS 原理,ρ的OLS 估计式为:∑∑--=211ˆt t tuuu ρ(0)(=t u E )而t u 和1-t u 之间的相关系数r 为:∑∑∑--=2121t tt t uu u u r ≈ρˆ211=∑∑--t t tuu u (在大样本情况下,∑∑-≈212t t u u ) 因此,可以认为ρ是t u 与1-t u 的一阶自相关系数。
1≤ρ,1=ρ表示完全正自相关,t t t v u u +=-1;10〈〈ρ表示正自相关;0=ρ表示不存在自相关,t t v u =;01〈〈-ρ表示负自相关;1-=ρ表示完全负自相关,t t t v u u +-=-1。
自相关性的一般形式可以表示成:),,,(21p t t t t u u u f u ---= ,或者:t p t p t t t v u u u u ++++=---ρρρ 2211 (5.1.3)称之为p 阶自回归形式,或模型存在p 阶自相关。
计量经济学重点笔记第五讲
第五讲 自相关高斯-马尔科夫假定五是:(,)0,i j Cov i j εε=≠如果该假定不成立,那么称模型的误差项是序列相关的。
由于序列相关主要针对于时间序列数据,因此我们把脚标i 改写为t ,把样本容量N 改写为T 。
笔记:1、如果基于横截面数据的回归模型其误差项是相关的,则称为空间自相关。
但是要记住,除非观察顺序具有某种逻辑或者经济上的意义,否则,在横截面数据回归中,观察顺序是可以随意的,因此,也许在某种观测顺序下误差项呈现出一种模式的自相关但在另一种观测顺序下又呈现出另外一种模式的自相关。
然而,当我们处理时间序列时,观测服从时间上的一种自然顺序。
2、在时间序列模型中,误差项经常被称之为冲击(Shock)。
对经济系统的冲击经常具有持续性,从而这为误差项序列相关提供了现实依据。
一、 自相关的后果与仅仅违背同方差假定一样,仅仅违背序列无关假定并不影响OLS 估计量所具有的线性、无偏性、一致性等性质。
在误差项序列相关的情况下,OLS 估计法并没有利用这个信息,故OLS 估计量不是最有效的。
我们下面来推导在误差项序列相关情况下OLS 估计量的方差表达。
假定真实模型是:t 01t t y x ββε=++则12ˆ12222()()()()(())()()[()]t t t t t t t t tx x Var x x x x Var x x Var x x x x βεδβεε-=+---==--∑∑∑∑∑∑ 在假定五:0,0t t jj εεδ+=≠下,有:122ˆ222()[()]tt t x x x x βεδδ-=-∑∑但如果假定五不成立,那么正确的方差表达式应该是:12ˆ1221122()2()()[()]t t t j T T tt t t j t j t x x x x x x x x βεεεδδδ+--+==-+--=-∑∑∑∑所以, OLS 法下通常的系数估计量方差的表示是错误的,一般来说它小于真实的方差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五讲 自相关高斯-马尔科夫假定五是:(,)0,i j Cov i j εε=≠如果该假定不成立,那么称模型的误差项是序列相关的。
由于序列相关主要针对于时间序列数据,因此我们把脚标i 改写为t ,把样本容量N 改写为T 。
笔记:1、如果基于横截面数据的回归模型其误差项是相关的,则称为空间自相关。
但是要记住,除非观察顺序具有某种逻辑或者经济上的意义,否则,在横截面数据回归中,观察顺序是可以随意的,因此,也许在某种观测顺序下误差项呈现出一种模式的自相关但在另一种观测顺序下又呈现出另外一种模式的自相关。
然而,当我们处理时间序列时,观测服从时间上的一种自然顺序。
2、在时间序列模型中,误差项经常被称之为冲击(Shock)。
对经济系统的冲击经常具有持续性,从而这为误差项序列相关提供了现实依据。
一、 自相关的后果与仅仅违背同方差假定一样,仅仅违背序列无关假定并不影响OLS 估计量所具有的线性、无偏性、一致性等性质。
在误差项序列相关的情况下,OLS 估计法并没有利用这个信息,故OLS 估计量不是最有效的。
我们下面来推导在误差项序列相关情况下OLS 估计量的方差表达。
假定真实模型是:t 01t t y x ββε=++则12ˆ12222()()()()(())()()[()]t t t t t t t t t x x Var x x x x Var x x Var x x x x βεδβεε-=+---==--∑∑∑∑∑∑ 在假定五:0,0t t j j εεδ+=≠下,有:122ˆ222()[()]t t t x x x x βεδδ-=-∑∑ 但如果假定五不成立,那么正确的方差表达式应该是:12ˆ1221122()2()()[()]t t t j T T t t t t j t j t x x x x x x x x βεεεδδδ+--+==-+--=-∑∑∑∑所以, OLS 法下通常的系数估计量方差的表示是错误的,一般来说它小于真实的方差。
这是因为,对于经济数据来说,正的序列相关是最常见的,因此t t j εεδ+一般为正,而()()t t j x x x x +--一般也是正的。
因此,111()()t t j T T t t t j t j x x x x εεδ+--+==--∑∑一般是大于0的。
计量软件包默认状态下通过公式:1ˆ)(se β=来计算1ˆβ的标准误,其中用22ˆˆ2i N δε=-∑来估计误差项的方差。
利用这个公式的理由在于:在误差项同方差与序列无关假定下有:1ˆ)(sd β=,而22ˆˆ2i N δε=-∑是对2δ的无偏与一致估计估计。
显然,当同方差与序列无关假定中的任意一个不成立时,基于1ˆ)(se β=当序列无关假定被违背时,基于上述公式所计算的标准误很可能低估1ˆβ的真实的标准差(当序列无关假定被违背时,异方差稳健标准误也面临着低估问题,因为该稳健标准误同样是假定误差项序列无关)。
当然,依靠错误的标准误所进行的t 检验也是无效的。
标准的F 检验在序列相关情况下也是无效的。
笔记:1、如果误差项序列相关,即使其他高斯-马尔科夫假定成立,但2RSS/ δ并不服从卡方分布,而2RSS/ δ对于构造F 检验十分重要。
2、模型设定错误很可能是误差项呈现出序列相关性的一个原因。
例如,如果模型遗漏了解释变量,而这些被遗漏的变量是自相关的,则当这些被遗漏变量进入误差项后,误差项将呈现出自相关性。
在实践中,序列相关与异方差一样,也被认为是模型设定错误的信号。
如果产生自相关性的原因是模型设定有误,那么我们首先应该正确设定模型。
二、 发现自相关与异方差检验一样、我们是通过对残差的分析来检验序列无关假定是否被违背。
因此,序列无关检验同样隐含着一个前提,即残差是对误差的良好近似。
而高斯-马尔科夫假定中的假定一、二、三被违背将使得很多检验方法无效。
(一)图示法图一:正序列相关ˆt εˆt ε图二:负序列相关如果残差随着观测顺序的变化并不频繁地改变符号,见图一,则这是误差项序列正自相关的证据;如果残差随着观测顺序的变化频繁地改变符号,则这是误差项序列负自相关的证据,见图二。
笔记:1、与上述图形检验思路一样但更正规的一种检验方式是游程检验(runs test)。
首先记录残差的符号,例如:(++++++++++)(--)(+++++++)(-)(++++++)。
所谓游程是指具有同一符号的一个不间断历程。
在此例中,具有5个游程。
直观来看,如果游程太多,这意味着残差频繁地改变符号,而这是负自相关的证据;反之,如果游程太少,则是正自相关的证据。
我们是用残差来近似作为误差的观测值。
给定观测值的个数,利用Swed & Eisenhart所给出的一定显著水平下关于游程数的两个临界值,我们可以检验误差是独立的这个原假设。
详情可参见相关教科书。
2、在图一中,残差大约在三个位置改变了符号,你也许会问,这不是违背了正序列相关的判断吗?记住!我们发现的正序列相关是统计规律,而统计规律是大部分观测所具有的规律。
(二)Durbin-Watson检验DW检验用来检验误差项是否存在一阶自相关。
首先利用OLS残差ˆt 构造检验统计量:21221ˆˆ()ˆT t t t T t t DW εεε-==-=∑∑ 显然,2211122222211ˆˆˆˆˆˆ22(1)ˆˆT T T T t t t t t t t t t t T T t t t t DW εεεεεεεε---======+-=≈-∑∑∑∑∑∑,而2121ˆˆˆ/T T t t t t t εεε-==∑∑是残差(样本)一阶自相关系数ˆρ的近似,因此,ˆ2(1)DW ρ≈-。
笔记:按照定义,一阶样本自相关系数是:1111ˆˆˆˆ()()ˆT T T t t t t εεεερ----=∑∑∑ 而1221111ˆˆˆ011T T T t t t t t t T T T εεε-===≈≈=--∑∑∑。
应该注意,模型应该带有截距,以保证残差均值为0。
另外,≈≈故2121ˆˆˆ/ˆT T t t t t t εεερ-==≈∑∑。
注意,要使得ˆρ是对误差项一阶自相关系数的恰当近似,我们要求误差项是同方差的。
关于自相关系数所涉及到的一些假设可参见本章 “相关图分析”一节。
如果误差项没有一阶自相关,那么ˆρ应该接近于0,而DW 应该接近于2;如果误差项具有强烈的一阶正自相关关系,即ˆρ接近于1,而DW 应该接近于0;如果误差项具有强烈的一阶负自相关关系,即ˆρ接近于-1,而DW 应该接近于4。
不幸的是,在误差项的一阶自相关系数为零的原假设下,DW 的精确分布取决于解释变量矩阵X 。
然而,Durbin-Watson 证明,DW 的精确分布位于两个极限分布之间。
我们利用这两个极限分布就可以进行检验了。
在实践中,经济变量如果存在自相关,则一般是正自相关,因此,在进行DW 检验时,我们通常利用单侧(左侧)检验(很多教材所所提供的临界值表是针对单侧检验的)。
事实上,如果DW 值超过了4-d L ,这往往是模型错误设定的信号。
笔记:d U d L 4-d U 4-d L2经济变量一般正自相关是针对水平变量而言。
对于差分变量,负自相关在年度时间序列中也是常见的。
这是因为,差分表示变量的变化,如果经济变量在均衡位置上下波动,那么上一期涨幅较大往往意味着在本期将出现回落。
不过对于来自于资本市场的高频时间序列数据,由于冲量效应等原因,差分变量出现正自相关也是正常的。
在单侧检验下,给定显著水平,当l DW d ≤,我们认为误差项是一阶正自相关的;当u l d DW d <≤,则无法判断;当u d DW <,我们认为误差项不存在一阶自相关。
进行DW 检验应该注意的问题是:(1) 该检验用来判断误差项是否是一阶自相关的。
一阶自相关不存在并不一定意味着不存在高阶自相关。
(2)回归模型必须带有截距项以保证残差均值为零;(3)DW 统计量的分布除了取决于解释变量矩阵X 外还依赖于全套的经典线性模型假定。
因此,为了保证DW 检验的有效,其他相关假定的成立也是重要的。
笔记:DW 检验要求同方差假定成立,故在DW 检验之前有必要进行异方差检验。
但在第四讲中我们强调,序列相关检验应放在异方差检验之前。
由此可以看出,DW 检验在实际应用中面临着很大的限制。
幸运的是,有很多其他的序列相关检验方法并不要求同方差假定成立。
由于众多局限,DW 检验并不是现代计量经济学中主流的序列相关检验方法,尽管很多计量软件包在模型估计完成会自动给出DW 值。
(4)解释变量中不能含有滞后因变量。
考虑模型:121t t t t y a b x b y ε-=+++,当t ε与1t ε-相关时,t ε与1t y -是相关的,这违背了标准假定(标准假定是,要么解释变量非随机,要么随机但与误差项无关),此时由OLS 获得的残差并不是对误差良好的近似(此时估计量将是有偏的,且偏差不会随样本的增加而趋于零,即OLS 估计量不是一致估计量)。
事实上,OLS 估计将把误差项所包含的信息价值归功于解释变量,而相应的残差看起来再也不含有价值的信息,因此,此时DW 值经常接近于2,从而具有误导性1。
(5)没有缺失数据。
例如,完整样本是1978-2008年的年度数据,但是,由于某些原因,我们所掌握的样本没有1999年的观测值。
笔记:1 Durbin 针对此情况提出Durbin-h 统计量:/2(1DW h =-h 渐进服从标准正态分布。
由于不能保证21ˆ[()]1T se β<,故该检验具有局限性。
既然ˆ2(1)DW ρ≈-,为什么不基于2121ˆˆˆ/ˆT Tt t t t t εεερ-===∑∑直接进行检验呢?如果考虑回归:1ˆˆˆˆt t v ερε=-+,则 222121/211ˆˆˆˆ/ˆˆˆT T t t t T Tt t t t t t t t ρεεεεεε==-==--=≈∑∑∑∑针对上述回归,利用t 检验不是可以检验ˆρ的显著性吗?这里首先要指出的是,DW 统计量精确地服从DW 分布,尽管DW 分布比较复杂。
而在上述的t 检验中,t 统计量只是渐进服从t 分布(ˆρ是对ρ的一致估计,但不是无偏估计,参考更高级的教科书),换句话说,上述t 检验适用于大样本。
不过基于残差自回归的检验确实具有一定的优点,例如操作简单,并且还可以利用异方差稳健标准误。
但要记住,此时原模型同样不能含有滞后因变量,解释同DW 检验。
我们还可以进行推广,如进行回归:11ˆˆˆ...p t t p t t b b v εεε--=+++,以检验误差项是否具有高阶自回归性质。
(三)Portmanteau 检验定义t ε与t τε-的相关系数为:(,)()()t t t t Cov sd sd τττεεεερ--= 假定2()()0;()()t t t t E E sd sd ττεεεεδ--====(以后我们将知道,上述假定涉及到时间序列平稳性假定),则()()t t t E Var ττεεερ-=。