计量经济学第八讲
计量经济学第八讲

在 E(μi|X,D1,D2)=0的初始假定下,容易得到高中及以下、高中、大
3.6 含有虚拟变量的多元线性回归模型
二、虚拟变量的引入
1. 加法方式
还可以将多个虚拟变量引入模型中以考察多种“定性”因素的影
响。例如,在上述员工薪金的例子中,再引入学历的虚拟变量D2:
1, D2 0, 本科及以上学历 本科以下学历
Yi 0 1 X i 2 Di i
其中,Yi为员工的薪金; Xi为工龄; Di=1代表男性, Di=0代表女性。
3.6 含有虚拟变量的多元线性回归模型
二、虚拟变量的引入
虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘
法方式。
1. 加法方式 上述员工薪金模型中性别虚拟变量的引入采取了加法方式,即模
型中虚拟变量以相加的形式引入模型。
Yi 0 1 X i 2 Di i
其中,Yi为员工的薪金; Xi为工龄; Di=1代表男性, Di=0代表女性。
在该模型中,如果仍假定E(μi)=0,则女职工的平均薪金为
E Yi X , D 0 0 1 X i
男员工的平均薪金为
3.6 含有虚拟变量的多元线性回归模型
一、含有虚拟变量的模型
例如,反映文化程度的虚拟变量可取为
1, D 0, 本科类型和肯定类型取值为1;比 较类型和否定类型取值为0。同时含有一般解释变量与虚拟变量的模型 称为含有虚拟变量的模型。 一个以性别为虚拟变量来考察员工薪金的模型如下:
高中以下: E Yi X , D1 0, D2 0 0 1 X i 高中: E Yi X , D1 1, D2 0 0 2 1 X i 大学及以上:E Yi X , D1 1, D2 1 0 3 1 X i
计量经济学第八章

多元回归:
TSS y ' y nY 2
ˆ ESS ' X ' y nY 2 ˆ ˆ ˆ RSS u ' u y ' y ' X ' y
ˆ ( ' X ' y nY 2 ) /(k 1) F ˆ ( y ' y ' X ' y) /(n k )
回归方程:yt = 1 + 2x2t + 3x3t + 4x4t + ut 我们希望检验: 3+4 = 1: 约束回归 • yt = 1 + 2x2t + 3x3t + 4x4t + ut • s.t. 3+4 = 1
3+4 = 1 4 = 1- 3 yt = 1 + 2x2t + 3x3t + (1-3)x4t + ut 整理,得 (yt - x4t) = 1 + 2x2t + 3(x3t - x4t) + ut
( RUR RR ) / m F 2 (1 RUR ) /(n k )
16
在F-检验中确定约束个数
例 : H0: hypothesis 1 + 2 = 2 2 = 1 and 3 = -1 2 = 0, 3 = 0 and 4 = 0
约束个数m 1 2 3
不能用F-检验来检验非线性的假设, 如:H0: 2 3 = 2 or H0: 2 2 = 1
计量经济学
主讲人:薛明皋
2013年7月19日
1
第8章 多元回归分析:推断问题
§8-1 偏回归系数的假设检验 §8-2 总显著性检验 §8-3 回归系数相等的检验 §8-4 约束回归 §8-5 结构稳定性检验:邹至庄检验
计量经济学八章06.5(XS)

违反经典假设的线性回 时间序列分析:介绍了 归模型:探讨了当经典 时间序列数据的特性、 假设不满足时,如何对 平稳性检验、ARIMA模 线性回归模型进行修正, 型等内容,是计量经济 包括异方差性、自相关 学中处理时间序列数据 性、多重共线性等问题 的重要方法。 的处理方法。
面板数据分析:阐述了 面板数据的结构、特点 以及固定效应模型、随 机效应模型等面板数据 分析方法,为处理多维 数据提供了有效工具。
ARIMA模型法
自回归移动平均模型,是一种时间序列预测方法 ,可以消除自相关的影响并进行预测。
05
多重共线性问题探讨
多重共线性概念及产生原因
多重共线性概念
经济变量相关的共同趋势
多重共线性是指在多元线性回归模型中, 解释变量之间存在高度线性相关关系,导 致模型估计失真或难以准确估计的现象。
时间序列数据中,不同经济变量可能受共 同因素影响,表现出高度相关性。
数据具有趋势性,即数据可能呈现出长期上升或下降 的趋势。
时间序列数据特点与处理方法
01
数据具有季节性,即数据可能呈现出周期性变化,如季度、 月度等。
02
时间序列数据处理方法
03
缺失值处理:对于时间序列数据中的缺失值,可以采用插值 法、平均值法等方法进行处理。
时间序列数据特点与处理方法
异常值处理
对于时间序列数据中的异常值,可以采用标准差法、箱线图法等方法进行识别和处理。
02
计量经济学与经济 学的关系
计量经济学是经济学的一个分支, 旨在为经济学提供定量分析和实 证研究的工具和方法。
03
计量经济学的研究 对象
主要研究经济变量之间的关系, 以及经济政策对经济变量的影响。
章节概述与学习目标
计量经济学第八讲v

第八讲 平稳时间序列在严格意义上,随机过程{}t X 的平稳性是指这个过程的联合和条件概率分布随着时间t 的改变而保持不变。
在实践中,我们更关注弱意义上的平稳或者所谓的协方差平稳:2();();(,)t t t t j j E X Var X Cov X X μδδ+===显然20δδ=。
在本讲义中,平稳皆指协方差平稳。
当上述条件中的任意一个被违背时,则称{}t X 是非平稳的。
(一)平稳随机过程的例子 1、白噪声过程{}t ε:20()0;();(,)0,t t t t j j E Var Cov εεδεε+≠===笔记:假定t ε还服从正态分布,则{}t ε被称为高斯白噪声。
在正态分布下,独立与不相关是两个等价的概念,从而高斯白噪声{}t ε也属于严格白噪声。
对于严格白噪声过程,有:, (12)()()t t t t E E εεεε--=,。
因此,就预测t ε来说,,1t i i ε-≥没有任何信息价值。
当一个变量的当期及其过去值对预测变量未来值没有任何帮助时,我们常常称该变量是不可预测的。
2、AR(1)过程:011,11t t t y a a y a ε<-=++,{}t ε是白噪声过程为了验证上述过程满足平稳性条件,我们首先通过迭代得到:11110010t t ii t ii i t t y a a a y a ε---===++∑∑。
接下来注意到,111)0(t i i t t E y a a a y -==+∑,进一步假设数据生成过程发生了很久,即t 趋于无穷大,则01)1(t a E y a μ-==;其次也有11()()t i t ii t Var y Var a ε--==∑,当t 趋于无穷大时,21221()11()i t Var a a Var y εδ-=-=;最后,当t 趋于无穷大时,有:1211111111222 (12411112)1......(...)[()()][()()]s s t t s t s t t s t s t s t t s s s s sa a a a a E y y E a a a a a μμδδεεεεεεε+-----------++--+++++++++++===关于AR(p)过程的平稳性,见附录。
计量经济学课件第8章

( x 2 i )( x 3 i ) ( x 2 i x 3 i )
2 2
2
5
如果X3与X2存在完全共线性,即 X 3 i X 2 i
X
3i
则:
X (
2
2i
, x3i x 2 i y i x 2 i )( x 2 i ) ( y i x 2 i )( x 2 i )
2
( y i x 2 i )( x 3 i ) ( y i x 3 i )( x 2 i x 3 i )
2
( x 2 i )( x 3 i ) ( x 2 i x 3 i )
2 2
2
3
( y i x 3 i )( x 2 i ) ( y i x 2 i )( x 2 i x 3 i )
其中, r 为 X 和 X 的样本相关系数。
12
20
8.4
多重共线性的补救措施
8.4.1 什么也不做
理由一、如果t统计量仍然显著,参数的符号也和预期 的一致,则不用补救;
理由二、剔除变量有可能导致设定偏误,后果可能更 严重; 理由三、出于理论上的考虑,重新回归会导致设定误 差。多重共线性本质上由样本引起。 所以,什么也不做,除非是极其严重的多重共线性
性的变量的参数估计几乎不受影响。
如果目的是预测,则多重共线性不是问题,R2 值越高,预测越准。
15
8.2.2 关于多重共线性的后果的两 个例子P142-144
16
8.3 多重共线性的诊断
克曼塔(Kmenta)的忠告: 1、多重共线性是一个程度问题而不是有无的问题 2、多重共线性是一种样本现象也是一种理论现象。 给定方程的多重共线性的严重程度随样本的不同 而不同;对于给定的样本,依赖数据导向技术来判断 多重共线性的严重程度. 而解决多重共线性的策略则依赖于方程的理论基础, 即找到一组理论上相关并且统计上不存在多重共线 性的变量.
计量经济学讲义

计量经济学讲义浙江工商大学金融学院姚耀军目录第一讲 OLS的代数 (2)第二讲 OLS估计量 (17)第三讲假设检验 (33)第四讲异方差 (63)第五讲自相关 (82)第六讲多重共线 (107)第七讲虚拟变量 (122)第八讲时间序列初步:平稳性与单位根 (134)第九讲协整与误差修正模型 (158)第十讲 ARCH模型及其扩展 (165)第一讲 OLS 的代数一、 问题假定y 与x 具有近似的线性关系:01y x ββε=++,其中ε是随机误差项。
我们对01,ββ这两个参数的值一无所知。
我们的任务是利用样本去猜测01,ββ的取值。
现在,我们手中就有一个样本容量为N 的样本,其观测值是:1122(),(),...,()N N y x y x y x 。
问题是,如何利用该样本来猜测01,ββ的取值?一个简单的办法是,对这些观察值描图,获得一个横轴x ,纵轴y 的散点图。
既然y 与x 具有近似的线性关系,那么我们就在散点图中拟合一条直线:1ˆˆˆx yββ=+。
该直线是对y 与x 的真实关系的近似,而01ˆˆ,ββ分别是对01,ββ的猜测(估计)。
问题是,如何确定0ˆβ与1ˆβ,以使我们的猜测看起来是合理的呢?二、 O LS 的两种思考方法法一:12(,...,)N y y y '与12ˆˆˆ(,...,)N yy y '是N 维空间的两点,0ˆβ与1ˆβ的选择应该是这两点的距离最短。
这可以归结为求解一个数学问题:01012201ˆˆˆˆ,,11ˆˆˆ()()N Ni i i i i i Min y y Min y x ββββββ==-=--∑∑在这里ˆi i y y-定义了残差ˆi ε。
法二:给定i x ,看起来i y 与ˆi y 越近越好(最近距离是0)。
然而,当你选择拟合直线使得i y 与ˆi y是相当近的时候,j y 与ˆj y的距离也许变远了,因此,存在一个权衡。
一种简单的权衡方式是,给定12,,..,N x x x ,拟合直线的选择应该使1y 与2ˆy、2y 与2ˆy 、...、N y 与ˆN y 的距离的平均值是最小的。
计量经济学第八章

计量经济学夏凡第八章动态计量模型基础第一节分布滞后模型第二节单位根检验第三节协整与误差修正模型计量经济学夏凡引言⏹传统的时序模型●一般先从已知相关理论出发设定模型形式,再由样本数据估计模型中的参数⏹这种方法使建模过程对相关理论有很强的依赖性⏹动态计量经济学模型●20世纪70年代末,以英国计量经济学家Hendry为代表,将理论和数据信息有效结合,提出了动态计量经济学模型的理论与方法●为时序模型带来了重要的发展量经济学夏凡第一节分布滞后模型⏹几何分布滞后模型⏹多项式分布滞后模型⏹自回归分布滞后模型量经济学夏凡基本概念⏹分布滞后模型●⏹如果p是有限数,称为有限分布滞后模型⏹如果p是无限数,称为无限分布滞后模型npptxxxytptpttt,,2,111++=+++++=--εβββα计量经济学夏凡基本概念(续)⏹分布滞后模型的两个问题●由于存在滞后值,则要损失若干个自由度⏹如果滞后时期长,而样本较小,自由度损失就较大,有时甚至无法进行估计●通常一个变量的滞后变量之间共线性问题严重,影响估计量的精度⏹解决方法●对系数施加约束条件,减少待估参数的数目计量经济学夏凡几何分布滞后模型⏹几何分布滞后模型●又称Koyck滞后模型●反映变量的影响程度随滞后期的延长而按几何级数递减⏹经济变量间的因果关系,往往随着时间间隔的延伸而逐渐减弱●模型⏹●()1221ti ititttttxxxxyελβαεβλλββα++=+++++=∑∞=---1<λ计量经济学夏凡几何分布滞后模型(续1)⏹模型的第二种表达形式●⏹对(1)式取一期滞后,并两边同乘λ得●⏹(1)式减去(2)式得●⏹令,即可得到模型的第二种表达式●用y t-1代替了x的滞后变量⏹减小了多重共线性的程度()ttttuyxy+++-=-11λβλα()212211----++++=ttttxxyλεβλλβλαλ()111---++-=-tttttxyyλεεβλαλ1--=tttuλεε计量经济学夏凡几何分布滞后模型(续2)⏹模型的估计●模型中的随机扰动项通常存在一阶负相关关系⏹参数估计变得较复杂●可采用工具变量法和广义差分法相结合的估计方法计量经济学夏凡多项式分布滞后模型⏹多项式分布滞后模型●为解决几何分布滞后模型存在的问题,Almon提出了多项式分布滞后(PDL:Polynomial Distributed Lag)模型⏹用多项式表示滞后变量系数βi和滞后长度i的关系⏹一般,多项式阶数不超过3次计量经济学夏凡多项式分布滞后模型(续1)⏹对于模型●其解释变量之间存在多重共线性,不能采用OLS估计●将βi分解为⏹●其中,且●即将每个参数用一个多项式表示()()()()pqpipipi qqi<-++-+-+=ααααβ221pi,,2,1,0=()()Nkkpkpppp∈⎩⎨⎧-==-=1222/12/()30tpi ititxyεβα++=∑=-计量经济学夏凡多项式分布滞后模型(续2)⏹模型的估计●(3)式可改写为⏹●其中●则(4)式实际上比(3)式少了p-q个参数●可对模型施加约束条件⏹近端(near end)约束和远端(far end)约束⏹应用时,可同时指定上述两种约束,或其中之一,也可不含约束条件()4110tqtqtttzzzyμαααα+++++=()()qjxpizitjpijt,,1,0=-=-=∑计量经济学夏凡多项式分布滞后模型(续3)⏹PDL模型的确定因素●滞后期p、多项式次数q和约束条件⏹PDL模型的特点●优点⏹减少了待估参数,因此减小了多重共线性的程度⏹方程的变换并没有改变干扰项的形式,没有引入自相关问题,可用OLS直接估计变换后的方程●缺点⏹样本损失没有减少●只有(n-q)个观测值可用于估计计量经济学夏凡多项式分布滞后模型(续4)⏹操作命令●ls y x1 x2pdl(series_name,lags,order,options)⏹lags:代表滞后期p⏹order:表示多项式阶数q⏹options:指定约束类型,没有约束条件时缺省●1:近端约束●2:远端约束●3:同时采用近端和远端两种约束计量经济学夏凡多项式分布滞后模型(续5)⏹[例8-1]某水库1998年至2000年各旬的流量、降水量数据如下所示。
计量经济第八章

线性预测子
线性预测子是广义线性模型中自 变量与参数的线性组合,用于预 测响应变量的数学期望。
广义线性模型的参数估计
1 2 3
最大似然估计
最大似然估计是广义线性模型参数估计的常用方 法,通过最大化似然函数得到参数的估计值。
迭代加权最小二乘法
迭代加权最小二乘法是一种迭代算法,用于求解 广义线性模型的参数估计值,通过不断迭代更新 参数估计值直到收敛。
利用核函数对数据进行局部加权,得 到概率密度的估计,适用于任意形状 的数据分布。
局部加权回归
在回归分析中,通过给不同数据点赋 予不同的权重,使得模型更加关注于 局部数据的拟合效果,从而提高模型 的预测精度。
半参数方法的基本思想
结合参数和非参数方法的特点,既考 虑数据的总体分布,又充分利用数据 的局部信息。
因果推断的方法
因果推断的方法包括回归分析、倾向得分匹配、工具变量法等。
工具变量法和断点回归法
工具变量法
工具变量法是一种用于处理内生性问题的计量经济学方法。 它通过寻找一个与内生解释变量相关、但与误差项不相关的 工具变量,用工具变量替代内生解释变量进行回归分析,从 而得到一致的估计量。
断点回归法
断点回归法是一种非参数回归方法,适用于处理具有断点特 征的数据。它通过比较断点两侧的数据差异来推断因果关系 ,可以有效避免参数回归中可能存在的模型误设问题。
因果分析法
因果分析法是通过研究时间序列 与其他相关因素之间的因果关系, 建立相应的数学模型进行预测的 方法。常用的因果分析法包括回 归分析、计量经济模型等。
05 面板数据分析
CHAPTER
面板数据的基本概念
面板数据的定义
面板数据是指在时间序列上取多个截面,在这些截面上同时选取样 本观测值所构成的样本数据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八讲 平稳时间序列与单位根过程一、随机时间序列模型概述在严格意义上,随机过程{}t X 的平稳性是指这个过程的联合和条件概率分布随着时间t 的改变而保持不变。
在实践中,我们更关注弱意义上的平稳或者所谓的协方差平稳:2();();(,)t t t t j j E X Var X Cov X X μδδ+===显然20δδ=。
在本讲义中,平稳皆指协方差平稳。
当上述条件中的任意一个被违背时,则称{}t X 是非平稳的。
(一)平稳随机过程的例子1、白噪声过程{}t ε: 20()0;();(,)0,t t t t j j E Var Cov εεδεε+≠===2、AR(1)过程:011,11t t t y a a y a ε<-=++,{}t ε是白噪声过程为了验证上述过程满足平稳性条件,我们首先通过迭代得到:110110010t t i i t i i i t t y a a a y a ε---===++∑∑。
接下来注意到,10101)0(t i i t t E y a a a y -==+∑,进一步假设数据生成过程发生了很久,即t 趋于无穷大,则01)1(t a E y a μ-==;其次也有110()()t it ii t Var y Var a ε--==∑,当t 趋于无穷大时,21221()11()i t Var a a Var y εδ-=-=;最后,当t 趋于无穷大时,有:1211111111222 (124111121)......(...)[()()][()()]s s t t s t s t t s t s t s t t s s s s s a a a a a E y y E a a a a a μμδδεεεεεεε+-----------++--+++++++++++=== 关于AR(p)过程的平稳性,见附录。
3、MA(P)过程:11...p t t t p t y a a εεε--=+++,{}t ε是白噪声过程 显然,任意有限阶MA 过程都是平稳的。
练习:对于00():,1,t i t i i MA y βεβ∞-=∞==∑{}t ε是白噪声过程,请指出平稳性条件。
关于ARMA(p,q)过程的平稳性,见附录。
(二)非平稳随机过程的例子1、随机游走:1t t t y y ε-=+,其中{}t ε是白噪声过程注意到11210...ti t t t t t t i y y y y εεεε=---=+=++==+∑ ,故有:0()t E y y =、2()t t Var y δ=。
显然,随着时期的延伸其方差趋于无穷大,因此随机游走属于非平稳过程。
对于过程:1t t t y y με-=++,其中{}t ε是白噪声过程。
该过程被称为带漂移的随机游走。
显然这也是一个不平稳的数据生成过程。
笔记:1、有效市场理论认为股票价格应当是一个随机游走过程。
在随机游走模型中,{}t ε是白噪声过程,0(,)0,t t j j Cov εε+≠=,因此有效市场理论的含义也即是股票价格变动(1t t t p p ε--=)是不可预测的。
按照有效市场理论,股票价格能够及时吸纳消息,因此,如果下一时刻价格与现在价格确实存在差异,那么导致这个价格差异的消息就现在时刻来说是无法预测的,否则,现在价格将马上变动从而使价格差异消失。
2、在财富(预期未来现金流的贴现)给定的情况下,最优的消费计划是现在消费与下一期消费相等(饿一等饱一等显然不是最优)。
如果下一期消费与现在的消费确实存在差异,那么导致这个差异的原因(也许是飞来横财)在现在肯定是不知道的,否则现在的消费将作出调整,并做到现在消费与下一期消费相等。
按照上述逻辑,消费将是一个随机游走过程。
以上是Hall(1978)的消费随机游走理论。
2、单位根过程:1t t t y y ε-=+, {}t ε是平稳过程显然随机游走是单位根过程的特例。
另外,我们还可以在上述模型基础上增加截距项或者时间趋势项,如:00111t t t t t t y y y t y βεββε++--=+=++ 上述过程都属于单位根过程。
笔记:按照附加预期的菲利普斯曲线理论:通胀率=预期的通胀率-a (失业率-自然失业率)+供给冲击。
失业率与自然失业率的差异(即周期性失业率)与供给冲击一般是平稳的。
假定人们采取静态预期,即预期通胀率等于过去一年的实际通胀率,则通胀率=过去一年的通胀率+平稳性变量,故基于一些假定我们可以从理论上表明通胀率是一个单位根过程。
3、趋势平稳过程:01t t y t ββε=++, {}t ε是平稳过程 由于01)(t E y t ββ=+随时间的变化而变化,故该过程是不平稳的。
然而,对变量剔除时间趋势之后我们将得到一个平稳的过程。
因此,上述模型被称为趋势平稳过程。
趋势平稳过程在剔除时间趋势之后显示出平稳性。
而对过程:1t t t y y ε-=+,其中t ε平稳,故t t y ε∆=,即通过对变量取差分,我们可以得到一平稳序列,这样的过程被称为差分平稳过程。
只要我们在分析时注意纳入时间趋势变量,趋势平稳过程基本上不会对传统的计量分析构成威胁。
而单位根过程才是对传统计量分析的真正威胁。
事实上,在计量经济学文献中,非平稳过程常常被作为单位根过程的同义词。
二、为什么考察数据生成过程的平稳性十分重要?对于两个不平稳的变量,即使从理论上看两者毫无联系,但实证中我们常常会发现两者具有“显著”的相关关系,此即“伪相关”问题,在回归分析中这被称为“伪回归”。
另外,当变量含有单位根时,我们通常所利用的一系列统计检验,如t检验与F检验,经常会失效,因为t统计量或者F统计量此时很可能并不服从标准的t分布或者F分布。
三、如何基于样本数据判断过程的平稳性?(一)通过折线图粗略判断如果样本数据表现出均值回复的态势,那么可初步判断数据生成过程是平稳的(应该注意到,对于趋势平稳过程,其均值具有确定性的时间趋势)。
如果样本数据表现出持久偏离均值的态势,则初步判断数据生成过程是非平稳的。
(二)利用相关图如果样本自相关函数表现出拖尾性,而偏自相关函数表现出截尾性,我们可以初步判断数据生成过程是平稳的AR 过程;如果样本自相关函数表现出截尾性,而偏自相关函数表现出拖尾性,我们可以初步判断数据生成过程是MA 过程;如果样本自相关函数表现出拖尾性,而偏自相关函数也表现出拖尾性,我们可以初步判断数据生成过程是平稳的ARMA 过程。
(三)单位根检验考虑模型:1t t t y y ρε-=+ 其中t ε是白噪声。
模型可以被改写为:1t t t y y λε-∆=+其中1λρ=-。
单位根检验等价于检验λ是否为零。
该检验是一个单尾检验,我们不考虑ρ>1的情况。
因为该情况意味着时间序列是爆炸性。
该检验的假设体系是:1::0(1)0(1)H H λρλρ=⇔=<⇔< 与往常一样,我们利用t 统计量来进行检验。
然而,在原假设下,此时的t 统计量并不服从t 分布,而是服从DF 分布,为了强调这一点,一般把这里的t 统计量改称为τ统计量。
如果计算出的τ值小于临界值(临界值是一个负数),则在某个显著水平下拒绝原假设,反之则不拒绝原假设。
上述检验被称为DF 检验。
在DF 检验中,初始模型的误差项是白噪声,然而实际情况可能并不如此。
此时,应该重新建立模型,以保证误差项是白噪声。
新的检验模型是:11pii t t t i t y y y v λθ=+--∆=+∆∑ t i y -∆的引入就是为了使新的误差项是白噪声。
上述检验单位根的方法被称为扩展的DF 检验(ADF 检验)。
显然,DF 检验模型是ADF 检验模型的特例。
笔记:1、为什么引入众多t i y -∆项就可以达到使新的误差项是白噪声这个目的?考虑模型1t t t y y λε-∆=+,其中t ε序列相关。
假定t ε服从一个AR (1)过程:1t v t t ρεε=+-,其中t v 是白噪声。
当原假设为真(0λ=)时,有:11t t v v t t t y y ρρε+=+--∆=∆。
可以发现,新模型的误差项是白噪声;同时,新模型中的解释变量包含有原模型被解释变量(t y ∆)的一阶滞后(1t y -∆)。
推广:当t ε服从一个AR (p )过程时,通过引入t i y -∆(i=1,2…,p ),新模型的误差项将是白噪声。
但一个问题是,为什么要用AR (p )过程来表示误差项?这是因为,即使误差项服从ARMA 或者MA 过程,但它们都可以被表示成无限阶的AR 过程。
对于平稳过程而言,这个无限阶AR 过程中的(滞后变量前面)系数是收敛于零的。
因此,只要p 够大,那么AR (p )就是对无限阶AR 过程的良好近似。
2、如何确定p 值呢?此时,我们可以先选择一个较大的p 值,然后利用通常的t 检验来判断t p y -∆所对应估计系数的显著性,如果不显著,则确定最大的滞后数为p-1。
总而言之,最终所确定的p 值应该使t p y -∆所对应估计系数是显著的。
在实践中我们通常是利用一些信息准则来确定p 值。
例如,(1)SIC(Schwarz information criterion)准则:估计任意模型,记RSS 为残差平方和,K 为待估计参数个数,T 为样本容量,则log log(/)SIC TRSS T T K =∙+按照SIC 准则,p 值的确定应该使SIC 最小。
(2)AIC(Akaike information criterion)准则:2log(/)AIC RSS T T K =∙+按照AIC 准则,p 值的确定应该使AIC 最小。
(3)HQIC(Hannan-Quinn information criterion)准则:2log(log )log(/)HQIC T RSS T TK =∙+ 按照HQIC 准则,p 值的确定应该使HQIC 最小。
利用不同的信息准则可能得到的结果并不一致,Stock & Watson(Second Edition,p561) 建议利用AIC 准则确定p 值。
3、理解信息准则。
如果仅以残差平方和最小为模型设定的标准,那么纳入更多的解释变量就可以迎合这个标准。
然而,实这将付出代价——自由度降低。
因此,在设定模型时存在一个权衡,而SIC 与AIC 准则不过就是权衡的规则(事实上我们已经涉及到一个规则,即以调整的R 2最大为权衡的规则,回忆一下,该规则是否考虑了残差平方和与自由度这两个因素?)。
应该注意到,在SIC 中,K 与log /T T 相乘,而在AIC 中,K 与2/T 相乘。
一般来说,log /2/T T T >,因此,SIC 准则比AIC 准则更加重视自由度不足问题,于是根据SIC 准则一般会得到更加简约的模型。