计量经济学第八讲v

合集下载

计量经济学第八讲

计量经济学第八讲

在 E(μi|X,D1,D2)=0的初始假定下,容易得到高中及以下、高中、大
3.6 含有虚拟变量的多元线性回归模型
二、虚拟变量的引入
1. 加法方式
还可以将多个虚拟变量引入模型中以考察多种“定性”因素的影
响。例如,在上述员工薪金的例子中,再引入学历的虚拟变量D2:
1, D2 0, 本科及以上学历 本科以下学历
Yi 0 1 X i 2 Di i
其中,Yi为员工的薪金; Xi为工龄; Di=1代表男性, Di=0代表女性。
3.6 含有虚拟变量的多元线性回归模型
二、虚拟变量的引入
虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘
法方式。
1. 加法方式 上述员工薪金模型中性别虚拟变量的引入采取了加法方式,即模
型中虚拟变量以相加的形式引入模型。
Yi 0 1 X i 2 Di i
其中,Yi为员工的薪金; Xi为工龄; Di=1代表男性, Di=0代表女性。
在该模型中,如果仍假定E(μi)=0,则女职工的平均薪金为
E Yi X , D 0 0 1 X i
男员工的平均薪金为
3.6 含有虚拟变量的多元线性回归模型
一、含有虚拟变量的模型
例如,反映文化程度的虚拟变量可取为
1, D 0, 本科类型和肯定类型取值为1;比 较类型和否定类型取值为0。同时含有一般解释变量与虚拟变量的模型 称为含有虚拟变量的模型。 一个以性别为虚拟变量来考察员工薪金的模型如下:
高中以下: E Yi X , D1 0, D2 0 0 1 X i 高中: E Yi X , D1 1, D2 0 0 2 1 X i 大学及以上:E Yi X , D1 1, D2 1 0 3 1 X i

计量经济学第八章

计量经济学第八章

多元回归:
TSS y ' y nY 2
ˆ ESS ' X ' y nY 2 ˆ ˆ ˆ RSS u ' u y ' y ' X ' y
ˆ ( ' X ' y nY 2 ) /(k 1) F ˆ ( y ' y ' X ' y) /(n k )

回归方程:yt = 1 + 2x2t + 3x3t + 4x4t + ut 我们希望检验: 3+4 = 1: 约束回归 • yt = 1 + 2x2t + 3x3t + 4x4t + ut • s.t. 3+4 = 1

3+4 = 1 4 = 1- 3 yt = 1 + 2x2t + 3x3t + (1-3)x4t + ut 整理,得 (yt - x4t) = 1 + 2x2t + 3(x3t - x4t) + ut
( RUR RR ) / m F 2 (1 RUR ) /(n k )
16
在F-检验中确定约束个数

例 : H0: hypothesis 1 + 2 = 2 2 = 1 and 3 = -1 2 = 0, 3 = 0 and 4 = 0
约束个数m 1 2 3
不能用F-检验来检验非线性的假设, 如:H0: 2 3 = 2 or H0: 2 2 = 1
计量经济学
主讲人:薛明皋
2013年7月19日
1
第8章 多元回归分析:推断问题
§8-1 偏回归系数的假设检验 §8-2 总显著性检验 §8-3 回归系数相等的检验 §8-4 约束回归 §8-5 结构稳定性检验:邹至庄检验

计量经济学课件第8章

计量经济学课件第8章
2
( x 2 i )( x 3 i ) ( x 2 i x 3 i )
2 2
2
5
如果X3与X2存在完全共线性,即 X 3 i X 2 i
X
3i
则:
X (
2
2i
, x3i x 2 i y i x 2 i )( x 2 i ) ( y i x 2 i )( x 2 i )

2

( y i x 2 i )( x 3 i ) ( y i x 3 i )( x 2 i x 3 i )
2
( x 2 i )( x 3 i ) ( x 2 i x 3 i )
2 2
2


3

( y i x 3 i )( x 2 i ) ( y i x 2 i )( x 2 i x 3 i )
其中, r 为 X 和 X 的样本相关系数。
12
20
8.4
多重共线性的补救措施
8.4.1 什么也不做
理由一、如果t统计量仍然显著,参数的符号也和预期 的一致,则不用补救;
理由二、剔除变量有可能导致设定偏误,后果可能更 严重; 理由三、出于理论上的考虑,重新回归会导致设定误 差。多重共线性本质上由样本引起。 所以,什么也不做,除非是极其严重的多重共线性
性的变量的参数估计几乎不受影响。
如果目的是预测,则多重共线性不是问题,R2 值越高,预测越准。
15
8.2.2 关于多重共线性的后果的两 个例子P142-144
16
8.3 多重共线性的诊断

克曼塔(Kmenta)的忠告: 1、多重共线性是一个程度问题而不是有无的问题 2、多重共线性是一种样本现象也是一种理论现象。 给定方程的多重共线性的严重程度随样本的不同 而不同;对于给定的样本,依赖数据导向技术来判断 多重共线性的严重程度. 而解决多重共线性的策略则依赖于方程的理论基础, 即找到一组理论上相关并且统计上不存在多重共线 性的变量.

计量经济学第八章

计量经济学第八章

计量经济学夏凡第八章动态计量模型基础第一节分布滞后模型第二节单位根检验第三节协整与误差修正模型计量经济学夏凡引言⏹传统的时序模型●一般先从已知相关理论出发设定模型形式,再由样本数据估计模型中的参数⏹这种方法使建模过程对相关理论有很强的依赖性⏹动态计量经济学模型●20世纪70年代末,以英国计量经济学家Hendry为代表,将理论和数据信息有效结合,提出了动态计量经济学模型的理论与方法●为时序模型带来了重要的发展量经济学夏凡第一节分布滞后模型⏹几何分布滞后模型⏹多项式分布滞后模型⏹自回归分布滞后模型量经济学夏凡基本概念⏹分布滞后模型●⏹如果p是有限数,称为有限分布滞后模型⏹如果p是无限数,称为无限分布滞后模型npptxxxytptpttt,,2,111++=+++++=--εβββα计量经济学夏凡基本概念(续)⏹分布滞后模型的两个问题●由于存在滞后值,则要损失若干个自由度⏹如果滞后时期长,而样本较小,自由度损失就较大,有时甚至无法进行估计●通常一个变量的滞后变量之间共线性问题严重,影响估计量的精度⏹解决方法●对系数施加约束条件,减少待估参数的数目计量经济学夏凡几何分布滞后模型⏹几何分布滞后模型●又称Koyck滞后模型●反映变量的影响程度随滞后期的延长而按几何级数递减⏹经济变量间的因果关系,往往随着时间间隔的延伸而逐渐减弱●模型⏹●()1221ti ititttttxxxxyελβαεβλλββα++=+++++=∑∞=---1<λ计量经济学夏凡几何分布滞后模型(续1)⏹模型的第二种表达形式●⏹对(1)式取一期滞后,并两边同乘λ得●⏹(1)式减去(2)式得●⏹令,即可得到模型的第二种表达式●用y t-1代替了x的滞后变量⏹减小了多重共线性的程度()ttttuyxy+++-=-11λβλα()212211----++++=ttttxxyλεβλλβλαλ()111---++-=-tttttxyyλεεβλαλ1--=tttuλεε计量经济学夏凡几何分布滞后模型(续2)⏹模型的估计●模型中的随机扰动项通常存在一阶负相关关系⏹参数估计变得较复杂●可采用工具变量法和广义差分法相结合的估计方法计量经济学夏凡多项式分布滞后模型⏹多项式分布滞后模型●为解决几何分布滞后模型存在的问题,Almon提出了多项式分布滞后(PDL:Polynomial Distributed Lag)模型⏹用多项式表示滞后变量系数βi和滞后长度i的关系⏹一般,多项式阶数不超过3次计量经济学夏凡多项式分布滞后模型(续1)⏹对于模型●其解释变量之间存在多重共线性,不能采用OLS估计●将βi分解为⏹●其中,且●即将每个参数用一个多项式表示()()()()pqpipipi qqi<-++-+-+=ααααβ221pi,,2,1,0=()()Nkkpkpppp∈⎩⎨⎧-==-=1222/12/()30tpi ititxyεβα++=∑=-计量经济学夏凡多项式分布滞后模型(续2)⏹模型的估计●(3)式可改写为⏹●其中●则(4)式实际上比(3)式少了p-q个参数●可对模型施加约束条件⏹近端(near end)约束和远端(far end)约束⏹应用时,可同时指定上述两种约束,或其中之一,也可不含约束条件()4110tqtqtttzzzyμαααα+++++=()()qjxpizitjpijt,,1,0=-=-=∑计量经济学夏凡多项式分布滞后模型(续3)⏹PDL模型的确定因素●滞后期p、多项式次数q和约束条件⏹PDL模型的特点●优点⏹减少了待估参数,因此减小了多重共线性的程度⏹方程的变换并没有改变干扰项的形式,没有引入自相关问题,可用OLS直接估计变换后的方程●缺点⏹样本损失没有减少●只有(n-q)个观测值可用于估计计量经济学夏凡多项式分布滞后模型(续4)⏹操作命令●ls y x1 x2pdl(series_name,lags,order,options)⏹lags:代表滞后期p⏹order:表示多项式阶数q⏹options:指定约束类型,没有约束条件时缺省●1:近端约束●2:远端约束●3:同时采用近端和远端两种约束计量经济学夏凡多项式分布滞后模型(续5)⏹[例8-1]某水库1998年至2000年各旬的流量、降水量数据如下所示。

计量经济第八章

计量经济第八章

线性预测子
线性预测子是广义线性模型中自 变量与参数的线性组合,用于预 测响应变量的数学期望。
广义线性模型的参数估计
1 2 3
最大似然估计
最大似然估计是广义线性模型参数估计的常用方 法,通过最大化似然函数得到参数的估计值。
迭代加权最小二乘法
迭代加权最小二乘法是一种迭代算法,用于求解 广义线性模型的参数估计值,通过不断迭代更新 参数估计值直到收敛。
利用核函数对数据进行局部加权,得 到概率密度的估计,适用于任意形状 的数据分布。
局部加权回归
在回归分析中,通过给不同数据点赋 予不同的权重,使得模型更加关注于 局部数据的拟合效果,从而提高模型 的预测精度。
半参数方法的基本思想
结合参数和非参数方法的特点,既考 虑数据的总体分布,又充分利用数据 的局部信息。
因果推断的方法
因果推断的方法包括回归分析、倾向得分匹配、工具变量法等。
工具变量法和断点回归法
工具变量法
工具变量法是一种用于处理内生性问题的计量经济学方法。 它通过寻找一个与内生解释变量相关、但与误差项不相关的 工具变量,用工具变量替代内生解释变量进行回归分析,从 而得到一致的估计量。
断点回归法
断点回归法是一种非参数回归方法,适用于处理具有断点特 征的数据。它通过比较断点两侧的数据差异来推断因果关系 ,可以有效避免参数回归中可能存在的模型误设问题。
因果分析法
因果分析法是通过研究时间序列 与其他相关因素之间的因果关系, 建立相应的数学模型进行预测的 方法。常用的因果分析法包括回 归分析、计量经济模型等。
05 面板数据分析
CHAPTER
面板数据的基本概念
面板数据的定义
面板数据是指在时间序列上取多个截面,在这些截面上同时选取样 本观测值所构成的样本数据。

计量经济学第八章完整课件

计量经济学第八章完整课件

对于矩阵形式: Y=X+
采用工具变量法(假设X2与随机项相关,用工具 变量Z替代)得到的正规方程组为:
ZY ZXβ
参数估计量为:
β~ (ZX)1 ZY
其中
1 1
X
11
X 12
Z
Z1
Z2
X k1 X k 2
1
X
1n
Zn
X kn
称为工具变量矩阵
3、工具变量法估计量是一致估计量
工具变量法是GMM的一个特例。 6、要找到与随机扰动项不相关而又与随机解释 变量相关的工具变量并不是一件很容易的事
可以用Xt-1作为原解释变量Xt的工具变量。
五、案例——中国居民人均消费函数
例4.4.1 在例2.5.1的中国居民人均消费函数的估 计中,采用OLS估计了下面的模型:
CONSP 0 1GDPP
通常把这种过去时期的,具有滞后作用的变量 叫做滞后变量(Lagged Variable),含有滞后变量 的模型称为滞后变量模型。
滞后变量模型考虑了时间因素的作用,使静态 分析的问题有可能成为动态分析。含有滞后解释变 量的模型,又称动态模型(Dynamical Model)。
1、滞后效应与与产生滞后效应的原因
Cov( X 2i, i ) E(x2i i ) 0 Cov( X 2i, is ) E(x2i is ) 0
s0
3. 随机解释变量与随机误差项同期相关 (contemporaneously correlated)。
Cov( X 2i, i ) E(x2i i ) 0
二、实际经济问题中的随机解释变量问题
第一步,用OLS法进行X关于工具变量Z的回归:
Xˆ i ˆ0 ˆ1Zi

《计量经济学》第8章数据

《计量经济学》第8章数据

《计量经济学》各章数据第8章 滞后变量模型例8.2.1 已知某地区制造业部门1955-1974年期间的资本存量y 和销售额x 的统计资料如表8.2.1(单位:百万元)。

表8.2.1 某地区制造业部门资本存量和销售额资料设定有限分布滞后模型为t t t t t t u x b x b x b x b a y +++++=---3322110运用经验加权法,选择下列三组权数:递减滞后、A 型滞后、不变滞后①81,41,21,1;②41,32,21,41;③41,41,41,41 分别估计上述模型,并从中选择最佳的方程。

例8.2.2 表8.2.3给出了某企业产品1988-2007年的产量y 和销售量x 的资料。

试利用分布滞后模型建立产量关于销售量的回归模型。

表8.2.3 某企业产品1988-2007年产量和销售量资料例8.3.1 表8.3.1给出了1994-2005年某地区居民消费y 与可支配收入x 的调查数据。

假定本期消费不仅与本期收入有关,而且与以前各期收入有关,此时消费函数模型有如下形式t t t t t u x b x b x b a y +++++=-- 22110其中,t y 与t x 分别代表第t 期的消费和收入。

假定随机项t u 满足全部经典假定,试用库伊克模型估计这一消费模型。

表8.3.1 某地区居民消费与收入调查数据8.5 案例分析表8.5.1给出了某地区消费总额y(亿元)和货币收入总额x(亿元)的年度资料,试分析消费同收入的关系。

表8.5.1 某地区消费总额和货币收入总额年度资料思考与练习14.表1给出了某行业1975-1994年的库存额y 和销售额x 的资料。

试利用分布滞后模型:t t t t t t u x b x b x b x b a y +++++=---3322110建立库存函数(用2次有限多项式变换估计这个模型)。

表1 某行业1975-1994年库存额和销售额资料15.表2给出了美国1970-1987年间个人消费支出(C )与个人可支配收入(I )的数据(单位:10亿美元,1982年为基期)表2 美国1970-1987年个人消费支出与个人可支配收入数据t t t u I a a C ++=21 t t t t u C b I b b C +++=-1321请回答以下问题:(1)估计以上两模型;(2)估计边际消费倾向(MPC )17.表3给出了1970-1991年美国制造业固定厂房设备投资y 与销售额x 的相关数据(单位:亿元)。

计量经济学第八章完整课件

计量经济学第八章完整课件
多元线性回归分析
多元线性回归模型
多元线性回归模型是用来描述因变量和多个自 变量之间线性关系的模型。
模型的一般形式为:Y = β0 + β1X1 + β2X2 + ... + βpXp + ε
其中,Y是因变量,X1, X2, ..., Xp是自变量, β0, β1, ..., βp是模型的参数,ε是误差项。
回归分析的应用领域
经济学、金融学、社会学、生物学等。
回归分析的分类
1 2
一元线性回归分析
研究一个因变量与一个自变量之间的线性关系。
多元线性回归分析
研究一个因变量与多个自变量之间的线性关系。
3
非线性回归分析
研究因变量与自变量之间的非线性关系。
回归分析的步骤
确定研究问题
01
明确研究目的,确定因变量和自变量。
主成分分析
将多个高度相关的解释变量组合成少数几个主成分,用主成分代 替原始变量进行回归分析。
岭回归
通过在回归系数上加上一个小的正则项,解决多重共线性问题, 使估计的系数更加稳定。
THANKS
感谢观看
模型修正
对模型进行修正,以消除异方差性的影响。例如,可 以使用加权最小二乘法等方法对模型进行修正。
04
自相关性与处理
自相关性的定义
01
自相关性是指时间序列数据中,当前值与过去值之 间存在相关性。
02
在计量经济学中,自相关性是指一个随机误差项的 各期值之间存在相关性。
03
自相关性可能导致模型估计的不准确,因此需要对 其进行检验和处理。
相关性检验
通过计算解释变量之间的相关系数,判断是否存在 高度相关性。相关系数接近1或-1,表明存在多重 共线性。

计量经济学第8章

计量经济学第8章

6443.33 8631.94 1
最高收入户
7593.95 10962.1 0
8262.42 12083.79 1
表 回归结果
这表明1998年、1999年我国城镇居民消费函数并没有显著差 异。因此,可以将两年的样本数据合并成一个样本,估计城镇居 民的消费函数,结果如下:
回归结果
虚拟变量的特殊应用
0
1
0
1988.1
3929.8 25 0
0
0
1984.4
4270.6 12
1
0
0
1988.2
4126.2 26 0
0
1
1985.1
3044.1 13
0
0
0
1988.3
4015.1 27 0
1
0
1985.2
3078.8 14 0
0
1
1988.4
4904.2 28 1
0
0
由于受取暖用煤的影响,每年第四季度的销售量大大高于其
设根据同一总体两个样本估计的回归模型分别为
为“相异回归”(Dissimilar regressions)。 上述情况中,只有第(1)种情况模型结构是稳定的,其余情况都表明模 型结构不稳定。
3.分段回归
回归系数反映了奖金的提高程度。使用虚拟变量既能如实描述不同阶段 的经济关系,又未减少估计模型时的样本容量,保证了模型的估计精度。
后期变动一个单位对Y的影响,即x的滞后影响。 如果 b = bi 存在,i=0,1,2…,k
b 称为长期分布或总分布乘数。表示X 变动一个单
位时,由于滞后效应而形成的对Y值的总的影响。
分布滞后模型的参数估计
对分布滞后模型直接采用OLS不适宜 • 没有先验准则确定滞后期长度;

计量经济学第八讲

计量经济学第八讲

三、多重共线性的检验 (一) 相关系数检验利用相关系数可以分析解释变量之间的两两相关情况。

在EViews 软件中可以直接计算(解释)变量的相关系数矩阵: [命令方式]COR 解释变量名[菜单方式]将所有解释变量设置成一个数组,并在数组窗口中点击View\Correlations. (二) 辅助回归模型检验相关系数只能判断解释变量之间的两两相关情况,当模型的解释变量个数多于两下、并且呈现出较为复杂的相关关系时,可以通过每个解释变量对其他解释变量的辅助回归模型来检验多重共线性,即依次建立k 个辅助回归模型:k i x a x a x a x a a x kki i i i i,,1111111=++++++=++--ε如果,其中某些方程显著,则表明存在多重共线性,所对应的变量可以近似地用其他解释变量线性表示。

辅助回归模型检验不仅能检验多元回归模型的多重共线性,而且可以得到多重共线性的具体形式;如果再结合偏相关关系检验,还能进一步判定是哪些解释变量引起了多重共线性,这有助于分析如何消除多重共线性的影响。

(三) 方差膨胀因子检验对于多元线性回归模型,ib ˆ的方差可以表示成:iijiiijiVIF x x R x x b D ∙∑-=-∑-=22222)(11)()ˆ(σσ其中,i i x R 为2关于其他解释变量辅助回归模型的判定系数,i VIF 为方差膨胀因子。

随着多重共线性程度的增强,VIF 以及系数估计误差都在增大。

因此,可以用VIF 作为衡量多重共线性的一个指标;一般当10>VIF 时,(此时9.02>iR ),认为模型存在较严重的多重共线性。

另一个与VIF 等价的指标是“容许度”(Tolerance ),其定义为:iiiVIF R TOL /1)1(2=-=显然,10≤≤TOL ,当i x 与其他解释变量高度相关时,0→TOL 。

因此,一般当1.0<TOL 时,认为模型存在较严重的多重共线性。

中级计量经济学讲义_第八章古典线性回归的大样本理论

中级计量经济学讲义_第八章古典线性回归的大样本理论

第八章 古典线性回归的大样本理论迄今为止的讨论涉及了最小二乘估计量的有限样本性质。

根据非随机回归量和扰动项正态分布这两个假设,我们知道了最小二乘估计量的精确分布和一些检验统计量。

在本章中,我们去总结前一章关于最小二乘法的有限样本特性,然后我们重点讨论古典回归模型的大样本结果。

第一节 最小二乘法的有限样本特性 古典回归模型的基本假设是 Ⅰ.y=X β+ε。

Ⅱ.X 是秩为K 的n ×K 非随机矩阵。

Ⅲ.E[ε]=0。

Ⅳ.E[εε′]=σ2I 。

未知参数β和σ2的最小二乘估计量是y X X X b ''=-1)(和)(2K n ee s -'=通过分析εβX X X b ''+=-1)(并且Kn M s -'=εε2我们可得下列精确的有限样本结果:1. E[b]=β(最小二乘估计是无偏的)2. Var[b]=σ2(X ′X)-13. 任意函数r ′β的最小方差线性无偏估计量是r ′b 。

(这就是高斯—马尔科夫定理)4. E[s 2]=σ25. Cov[b,e]=0为了构造置信区间和检验假设,我们根据正态分布的假设],0[~.2I N V σε推导额外了的结果,即6. b 和e 在统计上是相互独立的。

相应的,b 和s 2无关并在统计上相互独立。

7. b 的精确分布依赖于X ,是])(,[12-'X X N σβ。

8. 22/)(σs K n -的分布是][2K n -χ。

s 2的均值是σ2,方差是2σ4/(n -K )。

9. 根据6至8结果,统计量))(][12-'-=-kk kk X X s b K n t β服从自由度为n -K 的t 分布。

10. 用于检验一组J 个线性约束R β=q 的检验统计量Jq Rb R X X Rs q Rb K n e e J q Rb R X X R q Rb )(])([)()/(/)(])([)(11211-'''-=-'-'''----- 服从自由度为J 和n -K 的F 分布。

计量经济学讲义第八讲(共十讲)

计量经济学讲义第八讲(共十讲)

第八讲 平稳时间序列与单位根过程一、随机时间序列模型概述在严格意义上,随机过程{}t X 的平稳性是指这个过程的联合和条件概率分布随着时间t 的改变而保持不变。

在实践中,我们更关注弱意义上的平稳或者所谓的协方差平稳:2();();(,)t t t t j j E X Var X Cov X X μδδ+===显然20δδ=。

在本讲义中,平稳皆指协方差平稳。

当上述条件中的任意一个被违背时,则称{}t X 是非平稳的。

(一)平稳随机过程的例子 1、白噪声过程{}t ε:20()0;();(,)0,t t t t j j E Var Cov εεδεε+≠===2、AR(1)过程:011,11t t t y a a y a ε<-=++,{}t ε是白噪声过程为了验证上述过程满足平稳性条件,我们首先通过迭代得到:1111010t t i it ii i t t y a a a y a ε---===++∑∑。

接下来注意到,111)0(t i i t t E y a a a y -==+∑,进一步假设数据生成过程发生了很久,即t 趋于无穷大,则01)1(t a E y aμ-==;其次也有110()()t it i i t Var y Var a ε--==∑,当t 趋于无穷大时,21221()11()i t Var a a Var y εδ-=-=;最后,当t 趋于无穷大时,有:1211111111222 (1241)11121......(...)[()()][()()]s s t t s t s t t s t s t s t t s s s s s a a a a a E y y E a a a a μμδδεεεεεεε+-----------++--+++++++++++=== 关于AR(p)过程的平稳性,见附录。

3、MA(P)过程:11...pt t t p t y a a εεε--=+++,{}t ε是白噪声过程显然,任意有限阶MA 过程都是平稳的。

计量经济学第八章ppt课件

计量经济学第八章ppt课件

1
xiE(i )
E(x
2 i
ห้องสมุดไป่ตู้
)
1
3、如果X与μ同期相关,得到的参数估计 量有偏且非一致。
证明见上述第2点。
四、工具变量法
1、工具变量的选取 • 模型中出现随机解释变量,且与μ相关,
不能应用OLS估计参数,可选用工具变 量法。 • 工具变量:在模型估计过程中被作为工
具使用,以替代模型中与μ相关的随机解 释变量。
zi i 1
zi xi zi xi
zii 1
zi i
zi xi
P
lim( ~1)
1
P lim
P lim
1 n 1
n
zi
i
zi
xi
• 工具变量的条件:
– 与所替代的随机解释变量高度相关; – 与μ不相关; – 与其它的解释变量不相关,以免出现多重共线性。
2、工具变量的应用
Yi 0 1Xi i
OLS
Yi n0 1 Xi
XiYi 0
Xi 1
X
2 i
ˆ1
x i yi
x
2 i
,ˆ 0
Y
ˆ1X
上述OLS计算实际上应用了:
E(ˆ1) 1 E(
xi
x
2 i
i
)
1
E(
kii )
尽管Xi与i同期无关,
但k
的分母中一定包含不同期的
i
X,
因异期相
关可知k
i与
相关,
i
故E(ˆ 1 )
1,是有偏的。
P nlim1
xii
x
2 i
1
Plin
1 n

计量经济学第8章

计量经济学第8章

PPT文档演模板
计量经济学第8章
• 在EViews软件中,生成D2数据的EViews命令是GENR D2= @SEAS(2) ,D3、D4类似。以时间t为解释变量(1982年1季度取t = 1,EViews命令是 :GENR T= @TREND(1981:1))的煤销售量(yt)模型回归结果如表所 示。
关系时,为研究四个季度对利润的季节性影响,引入三个虚拟变量(设
第1季度为基础类型):
PPT文档演模板
计量经济学第8章
• 例 用虚拟变量处理季节数据模型 • 中国1982-1988年市场用煤销售量(yt)季节数据(《中国统计年鉴》 1987,1989)见表
PPT文档演模板
计量经济学第8章
•年与季 度
虚拟变量的引入
• 虚拟变量在模型中可以作自变量,也可以作因变量。 • 虚拟变量的引入方式
– 加法方式 – 乘法方式 – 一般方式
• 虚拟变量模型应用举例
PPT文档演模板
计量经济学第8章
•1、加法方式
1 •D = 0
反常情况 •Y 正常情况
Y = b0 + b1 X + b2 D + u
•反常 •正常
•3、一般方式
1 •D = 0
反常情况 •Y 正常情况
Y=b0+b01D+b1 X+ b11D X+u
•反常 •正常
反常情况:
Y=(b0+b01)+(b1+b11) X+u
•b01
正常情况:
Y = b0 + b1 自变量之间的关系既是相加关系
•又是相乘关系,这种引入虚拟变量方式为一般方
•1988.3
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八讲 平稳时间序列在严格意义上,随机过程{}t X 的平稳性是指这个过程的联合和条件概率分布随着时间t 的改变而保持不变。

在实践中,我们更关注弱意义上的平稳或者所谓的协方差平稳:2();();(,)t t t t j j E X Var X Cov X X μδδ+===显然20δδ=。

在本讲义中,平稳皆指协方差平稳。

当上述条件中的任意一个被违背时,则称{}t X 是非平稳的。

(一)平稳随机过程的例子 1、白噪声过程{}t ε:20()0;();(,)0,t t t t j j E Var Cov εεδεε+≠===笔记:假定t ε还服从正态分布,则{}t ε被称为高斯白噪声。

在正态分布下,独立与不相关是两个等价的概念,从而高斯白噪声{}t ε也属于严格白噪声。

对于严格白噪声过程,有:, (12)()()t t t t E E εεεε--=,。

因此,就预测t ε来说,,1t i i ε-≥没有任何信息价值。

当一个变量的当期及其过去值对预测变量未来值没有任何帮助时,我们常常称该变量是不可预测的。

2、AR(1)过程:011,11t t t y a a y a ε<-=++,{}t ε是白噪声过程为了验证上述过程满足平稳性条件,我们首先通过迭代得到:11110010t t ii t ii i t t y a a a y a ε---===++∑∑。

接下来注意到,111)0(t i i t t E y a a a y -==+∑,进一步假设数据生成过程发生了很久,即t 趋于无穷大,则01)1(t a E y a μ-==;其次也有11()()t i t ii t Var y Var a ε--==∑,当t 趋于无穷大时,21221()11()i t Var a a Var y εδ-=-=;最后,当t 趋于无穷大时,有:1211111111222 (12411112)1......(...)[()()][()()]s s t t s t s t t s t s t s t t s s s s sa a a a a E y y E a a a a a μμδδεεεεεεε+-----------++--+++++++++++===关于AR(p)过程的平稳性,见附录。

下图是对一个平稳AR(1)过程的模拟。

1,(0,1)10.8t N ID t t ty y εε-+=+笔记:重新表述上述AR(1)过程:1011011()[()]11()()tt t t E y E yt tt t t t E y a a E y y a a y y a y εε--⎫⎪⇒--⎬⎪⎭--=+=++=+即1[]1t t t y a y μμε---=+,进而有:11[]()(1)()111)(t t t t t t t y y a y y a y μμμμεε=----=-----∆∆=++由于110a -<,因此有:11;11)0)0((t t y y t t tt if ifE y y E y y μμ--><--<>∆∆此即平稳AR(1)过程所具有的均值回复性(Mean reversion )。

3、MA(1)过程:11t t t y a μεε-=++,{}t ε是白噪声过程显然,任意有限阶MA 过程都是平稳的。

模型:111t t t t y y a μρεε+--=++,{}t ε是白噪声过程被称为ARMA(1,1)过程,关于ARMA(p,q)过程的平稳性,见附录。

(二)自相关函数、偏自相关函数与相关图 1、自相关函数定义t y 与t y τ-的相关系数为:(,)()()t t t t C ov y y sd y sd y τττρ--=假定2()()0;()()tt t tE y E y s d y s d y ττδ--====,则()()t t t E y y Var y ττρ-=。

按照时间序列平稳性假定,自相关系数是τ而不是t 的函数,τρ被称为自相关函数(ACF )。

样本自相关函数是:112ˆˆˆˆTt Tt tt t yyy τττρ=+=-=∑∑(显然,如果ˆt y对ˆt y τ-进行无截距回归,其斜率估计就是ˆτρ的一个近似值1)。

在原假设:0τρ=下,ˆ(0,1/)aN T τρ,因此,在95%的置信水平下,样本自相关函数将落在2±内,即“两倍的标准误差带内”。

2、偏自相关函数假定{}t y 的数据生成过程为()AR τ:1122...t t t t t y p y p y p y ττε---=+++,{}t ε是白噪声过程则p τ被称为{}t y 的τ阶偏自相关函数(PACF )。

利用OLS 法,得到p τ的估计ˆp τ:2112...ˆˆˆˆtt t t y y p y p p y ττ---=++在原假设:0p τ=下,ˆp(0,1/)aN T τ 。

笔记:t y 与t y τ-的自相关函数与偏自相关函数的区别在于,前者度量了两变量之间简单、常规的相关程度;而后者在度量相关程度1为了满足假定:()0tE y =,时间序列应该预先剔除均值。

时,首先剔除了121...t t t y y yτ----()、、对两者的影响。

思考题:样本一阶自相关系数与样本一阶偏自相关系数具有什么关系?这个关系能够推广到二阶及其以上的情况吗?3、各种过程下τρ与p τ的性质 (1)AR(1)过程的τρ与p τ假定{}t y 的数据生成过程是AR(1)模型:1t t t y yρε-=+其中1ρ<,22tεδδ=,,)0,1(t t i i C ov y ε-=≥。

1ρ<这个约束条件是{}t y 具有平稳性的充分条件。

对AR(1) 模型进行迭代,有:1221221)(...j j j t t j t j t t t j t j y y ρρερερερεε--+++++-+-=++++++把括号内表达整体上看成是一个误差项,则ττρρ=,当τ→∞时,0τρ→。

因此,自相关函数是拖尾的。

按照偏自相关函数的定义,显然有:1234,...0p p p p ρ=====。

我们称偏自相关系数从2τ=处开始截尾。

推广:当平稳序列其数据生成过程是()AR p 模型时,偏自相关函数从1p τ=+处开始截尾,而自相关函数具有拖尾性质。

(2)MA(1)过程的τρ与p τ假定{}t y 的数据生成过程是MA(1)模型:1tt ty v λε-=+其中1λ<,22t εδδ=,,)0,1(t t i i C ov y ε-=≥。

1λ<这个约束条件是MA(1)过程具有可逆性的充分条件。

把上式递推,有:11212...t tt t t t y v y v λελε+++++=+=+不难证明1232, (01)λρρρλ===+。

因此,自相关函数从2τ=处开始截尾。

为了考察偏自相关函数所具有的性质,对MA(1) 模型进行迭代,有:221212t t t t t t yyλεελλεε+++++=+=-+23112t t t t yy λλλεε+-+=-++2341122...t t t t t yy yλλλλεε+--+=-+-+ 因此,1(1)p τττλ+=-。

当τ→∞时,0p τ→,因此,偏自相关函数是拖尾的。

推广:当平稳序列其数据生成过程是()M A p 模型并且满足可逆性时,其自相关系数从1p τ=+处开始截尾,而偏自相关系数具有拖尾性质。

(3)ARMA(1,1)过程的τρ与p τ平稳序列其数据生成过程是ARMA(1,1)模型:11t t t t y yρλεε--=++则自相关函数与偏自相关函数皆是拖尾的。

该结论对ARMA(p,q)过程成立。

(4)总结4、相关图分析关于ˆτρ与ˆp τ的图形被称为相关图(Correlogram),见例图:上图中,虚线区域表示两倍的标准误差带。

显然,根据样本计算的一阶自相关函数及其一阶、二阶偏自相关函数都超出了两倍的标准误差带。

因此,我们可以得到结论:在5%显著水平下,拒绝一阶自相关函数数及其一阶、二阶偏自相关函数数为零的原假设。

根据Q统计值(参见第五讲的Portmanteau检验),我们也可以得到结论:在5%显著水平下,拒绝1210 ...0,m mρρρ≤====的原假设。

根据上图,我们还可以认为,一个AR(2)模型可以被用来描述数据生成过程。

因为上图表明,样本偏自相关函数从3τ=开始接近为零,而样本自相关函数展现出拖尾性质。

这些现象与数据生成过程是AR(2)模型时其偏自相关函数与自相关函数所具有的性质相一致(此时偏自相关函数将从3τ=开始为零,而自相关函数是拖尾的)。

(三)模型估计利用OLS 法就可以对AR(p)模型进行估计。

对MA(p)与ARMA(p,q)模型的估计比较棘手,其估计方法一般包括非线性最小二乘法(NLS)与极大似然估计(ML)两种。

如果假定误差项服从正态分布,则ML估计与NLS估计渐进等价。

对NLS与ML的详细介绍超出了本讲义的范围,但幸运的是,计量软件包EVIEWS 对这两种估计都提供了标准的程序。

附录:AR(p)过程的平稳性AR(1)过程:11,11t t t y a a y aε<-=++,{}t ε是白噪声过程通过反复迭代有:111110t t i i t ii i t t y a a a y a ε---===++∑∑。

AR(1)过程是一个一阶随机差分方程,而111110t t i i t ii i t t y a a a y a ε---===++∑∑就是该方程的解。

考察这个解的结构:111110t t i i t ii i t t y a a a y a ε---==↓↓↓=++∑∑特解中的 通解 特解中的确定性部分 随机性部分应该注意到,a 1是齐次差分方程11t t y a y -=的特征方程:1111,01t t or x a x a x --==-的解。

在t 趋于无穷的情况下,平稳性要求这个特征方程的解其绝对值小于1。

AR(p)过程:1pii t t t i y a a y ε=-=++∑,{}t ε是白噪声过程是一个p 阶随机差分方程。

其解也包括两部分:通解与特解,而特解又包括确定性与随机部分。

齐次差分方程1pii t t i y a y =-=∑的特征方程为:11,01ppiii i tt iiorx a xa x ==--==-∑∑其解是x 1,x 2,...,x p 。

则原随机差分方程的通解为:1pii t i A x =∑,其中A i 是待定的常数,它们依赖于初始条件。

在t 趋于无穷的情况下,平稳性要求上述特征方程的解其绝对值小于1。

相关文档
最新文档