计量经济学第八讲

合集下载

2024版计量经济学全册课件(完整)pptx

REPORTING
2024/1/28
23
EViews软件介绍及操作指南
EViews软件概述
EViews是一款功能强大的计量经济学软件，提供数据处理、统计分析、模型
估计和预测等功能。
统计分析与检验
2024/1/28
详细讲解EViews中的统计分析工具，包括描述性统计、假设检验、方差分
析等。
数据导入与预处理介绍如何在EViews中导入数据，进行数据清洗、转换和预处理等操作。
随着大数据时代的到来，机器学习算法在数据挖掘、预测和分类等方面展现出强大的能力，为计量经济学提供了新的研究工具和方法。
机器学习在计量经济学中的应用领域
机器学习在计量经济学中的应用领域广泛，如变量选择、模型选择、非线性模型估计、高维数据处理等。
机器学习在计量经济学中的常用算法
机器学习在计量经济学中常用的算法包括决策树、随机森林、支持向量机（SVM）、神经网络等。这些算法可以用于分类、回归、聚类等任务，提高模型的预测精度和解释力。
面板数据特点
同时具有时间序列和截面数据的特征，能够提供更多的信息、更多的变化、更少共线性、更多的自由度和更高的估计效率。
2024/1/28
20
固定效应模型与随机效应模型
固定效应模型（Fixed Effects Model）
对于特定的个体而言，其截距项是固定的，不随时间变化而变化。
随机效应模型（Random Effects Mode…
经典线性回归模型
REPORTING
2024/1/28
7
一元线性回归模型
模型设定与参数估计
介绍一元线性回归模型的基本形式，解释因变量、自变量和误差项的含义，阐述最小二乘法（OLS）进行参数估计的原理。

计量经济学第八讲

在 E(μi|X,D1,D2)=0的初始假定下，容易得到高中及以下、高中、大
3.6 含有虚拟变量的多元线性回归模型
二、虚拟变量的引入
1. 加法方式
还可以将多个虚拟变量引入模型中以考察多种“定性”因素的影
响。例如，在上述员工薪金的例子中，再引入学历的虚拟变量D2：
1, D2 0, 本科及以上学历本科以下学历
Yi 0 1 X i 2 Di i
其中，Yi为员工的薪金； Xi为工龄； Di=1代表男性， Di=0代表女性。
3.6 含有虚拟变量的多元线性回归模型
二、虚拟变量的引入
虚拟变量作为解释变量引入模型有两种基本方式：加法方式和乘
法方式。
1. 加法方式上述员工薪金模型中性别虚拟变量的引入采取了加法方式，即模
型中虚拟变量以相加的形式引入模型。
Yi 0 1 X i 2 Di i
其中，Yi为员工的薪金； Xi为工龄； Di=1代表男性， Di=0代表女性。
在该模型中，如果仍假定E(μi)=0，则女职工的平均薪金为
E Yi X , D 0 0 1 X i
男员工的平均薪金为
3.6 含有虚拟变量的多元线性回归模型
一、含有虚拟变量的模型
例如，反映文化程度的虚拟变量可取为
1, D 0, 本科类型和肯定类型取值为1；比较类型和否定类型取值为0。同时含有一般解释变量与虚拟变量的模型称为含有虚拟变量的模型。一个以性别为虚拟变量来考察员工薪金的模型如下：
高中以下： E Yi X , D1 0, D2 0 0 1 X i 高中： E Yi X , D1 1, D2 0 0 2 1 X i 大学及以上：E Yi X , D1 1, D2 1 0 3 1 X i

计量经济学第八章

多元回归：
TSS y ' y nY 2
ˆ ESS ' X ' y nY 2 ˆ ˆ ˆ RSS u ' u y ' y ' X ' y
ˆ ( ' X ' y nY 2 ) /(k 1) F ˆ ( y ' y ' X ' y) /(n k )

回归方程：yt = 1 + 2x2t + 3x3t + 4x4t + ut 我们希望检验： 3+4 = 1：约束回归 • yt = 1 + 2x2t + 3x3t + 4x4t + ut • s.t. 3+4 = 1

3+4 = 1 4 = 1- 3 yt = 1 + 2x2t + 3x3t + (1-3)x4t + ut 整理，得 (yt - x4t) = 1 + 2x2t + 3(x3t - x4t) + ut
( RUR RR ) / m F 2 (1 RUR ) /(n k )
16
在F-检验中确定约束个数

例 : H0: hypothesis 1 + 2 = 2 2 = 1 and 3 = -1 2 = 0, 3 = 0 and 4 = 0
约束个数m 1 2 3
不能用F-检验来检验非线性的假设，如：H0: 2 3 = 2 or H0: 2 2 = 1
计量经济学
主讲人：薛明皋
2013年7月19日
1
第8章多元回归分析:推断问题
§8-1 偏回归系数的假设检验 §8-2 总显著性检验 §8-3 回归系数相等的检验 §8-4 约束回归 §8-5 结构稳定性检验:邹至庄检验

计量经济学八章06.5(XS)

违反经典假设的线性回时间序列分析：介绍了归模型：探讨了当经典时间序列数据的特性、假设不满足时，如何对平稳性检验、ARIMA模线性回归模型进行修正，型等内容，是计量经济包括异方差性、自相关学中处理时间序列数据性、多重共线性等问题的重要方法。的处理方法。
面板数据分析：阐述了面板数据的结构、特点以及固定效应模型、随机效应模型等面板数据分析方法，为处理多维数据提供了有效工具。
ARIMA模型法
自回归移动平均模型，是一种时间序列预测方法，可以消除自相关的影响并进行预测。
05
多重共线性问题探讨
多重共线性概念及产生原因
多重共线性概念
经济变量相关的共同趋势
多重共线性是指在多元线性回归模型中，解释变量之间存在高度线性相关关系，导致模型估计失真或难以准确估计的现象。
时间序列数据中，不同经济变量可能受共同因素影响，表现出高度相关性。
数据具有趋势性，即数据可能呈现出长期上升或下降的趋势。
时间序列数据特点与处理方法
01
数据具有季节性，即数据可能呈现出周期性变化，如季度、月度等。
02
时间序列数据处理方法
03
缺失值处理：对于时间序列数据中的缺失值，可以采用插值法、平均值法等方法进行处理。
时间序列数据特点与处理方法
异常值处理
对于时间序列数据中的异常值，可以采用标准差法、箱线图法等方法进行识别和处理。
02
计量经济学与经济学的关系
计量经济学是经济学的一个分支，旨在为经济学提供定量分析和实证研究的工具和方法。
03
计量经济学的研究对象
主要研究经济变量之间的关系，以及经济政策对经济变量的影响。
章节概述与学习目标

计量经济学第八讲v

第八讲平稳时间序列在严格意义上，随机过程{}t X 的平稳性是指这个过程的联合和条件概率分布随着时间t 的改变而保持不变。

在实践中，我们更关注弱意义上的平稳或者所谓的协方差平稳：2();();(,)t t t t j j E X Var X Cov X X μδδ+===显然20δδ=。

在本讲义中，平稳皆指协方差平稳。

当上述条件中的任意一个被违背时，则称{}t X 是非平稳的。

（一）平稳随机过程的例子 1、白噪声过程{}t ε：20()0;();(,)0,t t t t j j E Var Cov εεδεε+≠===笔记：假定t ε还服从正态分布，则{}t ε被称为高斯白噪声。

在正态分布下，独立与不相关是两个等价的概念，从而高斯白噪声{}t ε也属于严格白噪声。

对于严格白噪声过程，有：, (12)()()t t t t E E εεεε--=,。

因此，就预测t ε来说，,1t i i ε-≥没有任何信息价值。

当一个变量的当期及其过去值对预测变量未来值没有任何帮助时，我们常常称该变量是不可预测的。

2、AR(1)过程：011,11t t t y a a y a ε<-=++，{}t ε是白噪声过程为了验证上述过程满足平稳性条件，我们首先通过迭代得到：11110010t t ii t ii i t t y a a a y a ε---===++∑∑。

接下来注意到，111)0(t i i t t E y a a a y -==+∑，进一步假设数据生成过程发生了很久，即t 趋于无穷大，则01)1(t a E y a μ-==；其次也有11()()t i t ii t Var y Var a ε--==∑，当t 趋于无穷大时，21221()11()i t Var a a Var y εδ-=-=；最后，当t 趋于无穷大时，有：1211111111222 (12411112)1......(...)[()()][()()]s s t t s t s t t s t s t s t t s s s s sa a a a a E y y E a a a a a μμδδεεεεεεε+-----------++--+++++++++++===关于AR(p)过程的平稳性，见附录。

计量经济学课件第8章

2
( x 2 i )( x 3 i ) ( x 2 i x 3 i )
2 2
2
5
如果X3与X2存在完全共线性，即 X 3 i X 2 i
X
3i
则：
X (
2
2i
, x3i x 2 i y i x 2 i )( x 2 i ) ( y i x 2 i )( x 2 i )

2

( y i x 2 i )( x 3 i ) ( y i x 3 i )( x 2 i x 3 i )
2
( x 2 i )( x 3 i ) ( x 2 i x 3 i )
2 2
2

3

( y i x 3 i )( x 2 i ) ( y i x 2 i )( x 2 i x 3 i )
其中， r 为 X 和 X 的样本相关系数。
12
20
8.4
多重共线性的补救措施
8.4.1 什么也不做
理由一、如果t统计量仍然显著，参数的符号也和预期的一致，则不用补救；
理由二、剔除变量有可能导致设定偏误，后果可能更严重；理由三、出于理论上的考虑，重新回归会导致设定误差。多重共线性本质上由样本引起。所以,什么也不做,除非是极其严重的多重共线性
性的变量的参数估计几乎不受影响。
如果目的是预测，则多重共线性不是问题，R2 值越高，预测越准。
15
8.2.2 关于多重共线性的后果的两个例子P142-144
16
8.3 多重共线性的诊断

克曼塔(Kmenta)的忠告： 1、多重共线性是一个程度问题而不是有无的问题 2、多重共线性是一种样本现象也是一种理论现象。给定方程的多重共线性的严重程度随样本的不同而不同;对于给定的样本,依赖数据导向技术来判断多重共线性的严重程度. 而解决多重共线性的策略则依赖于方程的理论基础, 即找到一组理论上相关并且统计上不存在多重共线性的变量.

计量经济学第八章

计量经济学夏凡第八章动态计量模型基础第一节分布滞后模型第二节单位根检验第三节协整与误差修正模型计量经济学夏凡引言⏹传统的时序模型●一般先从已知相关理论出发设定模型形式，再由样本数据估计模型中的参数⏹这种方法使建模过程对相关理论有很强的依赖性⏹动态计量经济学模型●20世纪70年代末，以英国计量经济学家Hendry为代表，将理论和数据信息有效结合，提出了动态计量经济学模型的理论与方法●为时序模型带来了重要的发展量经济学夏凡第一节分布滞后模型⏹几何分布滞后模型⏹多项式分布滞后模型⏹自回归分布滞后模型量经济学夏凡基本概念⏹分布滞后模型●⏹如果p是有限数，称为有限分布滞后模型⏹如果p是无限数，称为无限分布滞后模型npptxxxytptpttt,,2,111++=+++++=--εβββα计量经济学夏凡基本概念（续）⏹分布滞后模型的两个问题●由于存在滞后值，则要损失若干个自由度⏹如果滞后时期长，而样本较小，自由度损失就较大，有时甚至无法进行估计●通常一个变量的滞后变量之间共线性问题严重，影响估计量的精度⏹解决方法●对系数施加约束条件，减少待估参数的数目计量经济学夏凡几何分布滞后模型⏹几何分布滞后模型●又称Koyck滞后模型●反映变量的影响程度随滞后期的延长而按几何级数递减⏹经济变量间的因果关系，往往随着时间间隔的延伸而逐渐减弱●模型⏹●()1221ti ititttttxxxxyελβαεβλλββα++=+++++=∑∞=---1<λ计量经济学夏凡几何分布滞后模型（续1）⏹模型的第二种表达形式●⏹对(1)式取一期滞后，并两边同乘λ得●⏹(1)式减去(2)式得●⏹令，即可得到模型的第二种表达式●用y t-1代替了x的滞后变量⏹减小了多重共线性的程度()ttttuyxy+++-=-11λβλα()212211----++++=ttttxxyλεβλλβλαλ()111---++-=-tttttxyyλεεβλαλ1--=tttuλεε计量经济学夏凡几何分布滞后模型（续2）⏹模型的估计●模型中的随机扰动项通常存在一阶负相关关系⏹参数估计变得较复杂●可采用工具变量法和广义差分法相结合的估计方法计量经济学夏凡多项式分布滞后模型⏹多项式分布滞后模型●为解决几何分布滞后模型存在的问题，Almon提出了多项式分布滞后(PDL：Polynomial Distributed Lag)模型⏹用多项式表示滞后变量系数βi和滞后长度i的关系⏹一般，多项式阶数不超过3次计量经济学夏凡多项式分布滞后模型（续1）⏹对于模型●其解释变量之间存在多重共线性，不能采用OLS估计●将βi分解为⏹●其中，且●即将每个参数用一个多项式表示()()()()pqpipipi qqi<-++-+-+=ααααβ221pi,,2,1,0=()()Nkkpkpppp∈⎩⎨⎧-==-=1222/12/()30tpi ititxyεβα++=∑=-计量经济学夏凡多项式分布滞后模型（续2）⏹模型的估计●(3)式可改写为⏹●其中●则(4)式实际上比(3)式少了p-q个参数●可对模型施加约束条件⏹近端(near end)约束和远端(far end)约束⏹应用时，可同时指定上述两种约束，或其中之一，也可不含约束条件()4110tqtqtttzzzyμαααα+++++=()()qjxpizitjpijt,,1,0=-=-=∑计量经济学夏凡多项式分布滞后模型（续3）⏹PDL模型的确定因素●滞后期p、多项式次数q和约束条件⏹PDL模型的特点●优点⏹减少了待估参数，因此减小了多重共线性的程度⏹方程的变换并没有改变干扰项的形式，没有引入自相关问题，可用OLS直接估计变换后的方程●缺点⏹样本损失没有减少●只有(n-q)个观测值可用于估计计量经济学夏凡多项式分布滞后模型（续4）⏹操作命令●ls y x1 x2pdl(series_name,lags,order,options)⏹lags：代表滞后期p⏹order：表示多项式阶数q⏹options：指定约束类型，没有约束条件时缺省●1：近端约束●2：远端约束●3：同时采用近端和远端两种约束计量经济学夏凡多项式分布滞后模型（续5）⏹[例8-1]某水库1998年至2000年各旬的流量、降水量数据如下所示。

计量经济第八章

线性预测子
线性预测子是广义线性模型中自变量与参数的线性组合，用于预测响应变量的数学期望。
广义线性模型的参数估计
1 2 3
最大似然估计
最大似然估计是广义线性模型参数估计的常用方法，通过最大化似然函数得到参数的估计值。
迭代加权最小二乘法
迭代加权最小二乘法是一种迭代算法，用于求解广义线性模型的参数估计值，通过不断迭代更新参数估计值直到收敛。
利用核函数对数据进行局部加权，得到概率密度的估计，适用于任意形状的数据分布。
局部加权回归
在回归分析中，通过给不同数据点赋予不同的权重，使得模型更加关注于局部数据的拟合效果，从而提高模型的预测精度。
半参数方法的基本思想
结合参数和非参数方法的特点，既考虑数据的总体分布，又充分利用数据的局部信息。
因果推断的方法
因果推断的方法包括回归分析、倾向得分匹配、工具变量法等。
工具变量法和断点回归法
工具变量法
工具变量法是一种用于处理内生性问题的计量经济学方法。它通过寻找一个与内生解释变量相关、但与误差项不相关的工具变量，用工具变量替代内生解释变量进行回归分析，从而得到一致的估计量。
断点回归法
断点回归法是一种非参数回归方法，适用于处理具有断点特征的数据。它通过比较断点两侧的数据差异来推断因果关系，可以有效避免参数回归中可能存在的模型误设问题。
因果分析法
因果分析法是通过研究时间序列与其他相关因素之间的因果关系，建立相应的数学模型进行预测的方法。常用的因果分析法包括回归分析、计量经济模型等。
05 面板数据分析
CHAPTER
面板数据的基本概念
面板数据的定义
面板数据是指在时间序列上取多个截面，在这些截面上同时选取样本观测值所构成的样本数据。

计量经济学第八章完整课件

对于矩阵形式： Y=X+
采用工具变量法（假设X2与随机项相关，用工具变量Z替代）得到的正规方程组为：
ZY ZXβ
参数估计量为：
β~ (ZX)1 ZY
其中
1 1
X
11
X 12
Z
Z1
Z2
X k1 X k 2
1
X
1n
Zn
X kn
称为工具变量矩阵
3、工具变量法估计量是一致估计量
工具变量法是GMM的一个特例。 6、要找到与随机扰动项不相关而又与随机解释变量相关的工具变量并不是一件很容易的事
可以用Xt-1作为原解释变量Xt的工具变量。
五、案例——中国居民人均消费函数
例4.4.1 在例2.5.1的中国居民人均消费函数的估计中，采用OLS估计了下面的模型：
CONSP 0 1GDPP
通常把这种过去时期的，具有滞后作用的变量叫做滞后变量（Lagged Variable），含有滞后变量的模型称为滞后变量模型。
滞后变量模型考虑了时间因素的作用，使静态分析的问题有可能成为动态分析。含有滞后解释变量的模型，又称动态模型（Dynamical Model）。
1、滞后效应与与产生滞后效应的原因
Cov( X 2i, i ) E(x2i i ) 0 Cov( X 2i, is ) E(x2i is ) 0
s0
3. 随机解释变量与随机误差项同期相关 (contemporaneously correlated)。
Cov( X 2i, i ) E(x2i i ) 0
二、实际经济问题中的随机解释变量问题
第一步，用OLS法进行X关于工具变量Z的回归：
Xˆ i ˆ0 ˆ1Zi

计量经济学第八章完整课件

多元线性回归分析
多元线性回归模型
多元线性回归模型是用来描述因变量和多个自变量之间线性关系的模型。
模型的一般形式为：Y = β0 + β1X1 + β2X2 + ... + βpXp + ε
其中，Y是因变量，X1, X2, ..., Xp是自变量， β0, β1, ..., βp是模型的参数，ε是误差项。
回归分析的应用领域
经济学、金融学、社会学、生物学等。
回归分析的分类
1 2
一元线性回归分析
研究一个因变量与一个自变量之间的线性关系。
多元线性回归分析
研究一个因变量与多个自变量之间的线性关系。
3
非线性回归分析
研究因变量与自变量之间的非线性关系。
回归分析的步骤
确定研究问题
01
明确研究目的，确定因变量和自变量。
主成分分析
将多个高度相关的解释变量组合成少数几个主成分，用主成分代替原始变量进行回归分析。
岭回归
通过在回归系数上加上一个小的正则项，解决多重共线性问题，使估计的系数更加稳定。
THANKS
感谢观看
模型修正
对模型进行修正，以消除异方差性的影响。例如，可以使用加权最小二乘法等方法对模型进行修正。
04
自相关性与处理
自相关性的定义
01
自相关性是指时间序列数据中，当前值与过去值之间存在相关性。
02
在计量经济学中，自相关性是指一个随机误差项的各期值之间存在相关性。
03
自相关性可能导致模型估计的不准确，因此需要对其进行检验和处理。
相关性检验
通过计算解释变量之间的相关系数，判断是否存在高度相关性。相关系数接近1或-1，表明存在多重共线性。

计量经济学第8章

6443.33 8631.94 1
最高收入户
7593.95 10962.1 0
8262.42 12083.79 1
表回归结果
这表明1998年、1999年我国城镇居民消费函数并没有显著差异。因此，可以将两年的样本数据合并成一个样本，估计城镇居民的消费函数，结果如下:
回归结果
虚拟变量的特殊应用
0
1
0
1988.1
3929.8 25 0
0
0
1984.4
4270.6 12
1
0
0
1988.2
4126.2 26 0
0
1
1985.1
3044.1 13
0
0
0
1988.3
4015.1 27 0
1
0
1985.2
3078.8 14 0
0
1
1988.4
4904.2 28 1
0
0
由于受取暖用煤的影响，每年第四季度的销售量大大高于其
设根据同一总体两个样本估计的回归模型分别为
为“相异回归”(Dissimilar regressions)。上述情况中，只有第(1)种情况模型结构是稳定的，其余情况都表明模型结构不稳定。
3．分段回归
回归系数反映了奖金的提高程度。使用虚拟变量既能如实描述不同阶段的经济关系，又未减少估计模型时的样本容量，保证了模型的估计精度。
后期变动一个单位对Y的影响，即x的滞后影响。如果 b = bi 存在，i=0,1,2…,k
b 称为长期分布或总分布乘数。表示X 变动一个单
位时，由于滞后效应而形成的对Y值的总的影响。
分布滞后模型的参数估计
对分布滞后模型直接采用OLS不适宜 • 没有先验准则确定滞后期长度；

计量经济学第八讲

三、多重共线性的检验（一）相关系数检验利用相关系数可以分析解释变量之间的两两相关情况。

在EViews 软件中可以直接计算（解释）变量的相关系数矩阵： [命令方式]COR 解释变量名[菜单方式]将所有解释变量设置成一个数组，并在数组窗口中点击View\Correlations. （二）辅助回归模型检验相关系数只能判断解释变量之间的两两相关情况，当模型的解释变量个数多于两下、并且呈现出较为复杂的相关关系时，可以通过每个解释变量对其他解释变量的辅助回归模型来检验多重共线性，即依次建立k 个辅助回归模型：k i x a x a x a x a a x kki i i i i,,1111111=++++++=++--ε如果，其中某些方程显著，则表明存在多重共线性，所对应的变量可以近似地用其他解释变量线性表示。

辅助回归模型检验不仅能检验多元回归模型的多重共线性，而且可以得到多重共线性的具体形式；如果再结合偏相关关系检验，还能进一步判定是哪些解释变量引起了多重共线性，这有助于分析如何消除多重共线性的影响。

（三）方差膨胀因子检验对于多元线性回归模型，ib ˆ的方差可以表示成：iijiiijiVIF x x R x x b D ∙∑-=-∑-=22222)(11)()ˆ(σσ其中，i i x R 为2关于其他解释变量辅助回归模型的判定系数，i VIF 为方差膨胀因子。

随着多重共线性程度的增强，VIF 以及系数估计误差都在增大。

因此，可以用VIF 作为衡量多重共线性的一个指标；一般当10>VIF 时，（此时9.02>iR ），认为模型存在较严重的多重共线性。

另一个与VIF 等价的指标是“容许度”（Tolerance ），其定义为：iiiVIF R TOL /1)1(2=-=显然，10≤≤TOL ，当i x 与其他解释变量高度相关时，0→TOL 。

因此，一般当1.0<TOL 时，认为模型存在较严重的多重共线性。

中级计量经济学讲义_第八章古典线性回归的大样本理论

第八章古典线性回归的大样本理论迄今为止的讨论涉及了最小二乘估计量的有限样本性质。

根据非随机回归量和扰动项正态分布这两个假设，我们知道了最小二乘估计量的精确分布和一些检验统计量。

在本章中，我们去总结前一章关于最小二乘法的有限样本特性，然后我们重点讨论古典回归模型的大样本结果。

第一节最小二乘法的有限样本特性古典回归模型的基本假设是 Ⅰ.y=X β+ε。

Ⅱ.X 是秩为K 的n ×K 非随机矩阵。

Ⅲ.E[ε]=0。

Ⅳ.E[εε′]=σ2I 。

未知参数β和σ2的最小二乘估计量是y X X X b ''=-1)(和)(2K n ee s -'=通过分析εβX X X b ''+=-1)(并且Kn M s -'=εε2我们可得下列精确的有限样本结果：1. E[b]=β（最小二乘估计是无偏的）2. Var[b]=σ2(X ′X)-13. 任意函数r ′β的最小方差线性无偏估计量是r ′b 。

（这就是高斯—马尔科夫定理）4. E[s 2]=σ25. Cov[b,e]=0为了构造置信区间和检验假设，我们根据正态分布的假设],0[~.2I N V σε推导额外了的结果，即6. b 和e 在统计上是相互独立的。

相应的，b 和s 2无关并在统计上相互独立。

7. b 的精确分布依赖于X ，是])(,[12-'X X N σβ。

8. 22/)(σs K n -的分布是][2K n -χ。

s 2的均值是σ2，方差是2σ4/（n －K ）。

9. 根据6至8结果，统计量))(][12-'-=-kk kk X X s b K n t β服从自由度为n －K 的t 分布。

10. 用于检验一组J 个线性约束R β=q 的检验统计量Jq Rb R X X Rs q Rb K n e e J q Rb R X X R q Rb )(])([)()/(/)(])([)(11211-'''-=-'-'''----- 服从自由度为J 和n －K 的F 分布。

计量经济学讲义第八讲(共十讲)

第八讲平稳时间序列与单位根过程一、随机时间序列模型概述在严格意义上，随机过程{}t X 的平稳性是指这个过程的联合和条件概率分布随着时间t 的改变而保持不变。

在实践中，我们更关注弱意义上的平稳或者所谓的协方差平稳：2();();(,)t t t t j j E X Var X Cov X X μδδ+===显然20δδ=。

在本讲义中，平稳皆指协方差平稳。

当上述条件中的任意一个被违背时，则称{}t X 是非平稳的。

（一）平稳随机过程的例子 1、白噪声过程{}t ε：20()0;();(,)0,t t t t j j E Var Cov εεδεε+≠===2、AR(1)过程：011,11t t t y a a y a ε<-=++，{}t ε是白噪声过程为了验证上述过程满足平稳性条件，我们首先通过迭代得到：1111010t t i it ii i t t y a a a y a ε---===++∑∑。

接下来注意到，111)0(t i i t t E y a a a y -==+∑，进一步假设数据生成过程发生了很久，即t 趋于无穷大，则01)1(t a E y aμ-==；其次也有110()()t it i i t Var y Var a ε--==∑，当t 趋于无穷大时，21221()11()i t Var a a Var y εδ-=-=；最后，当t 趋于无穷大时，有：1211111111222 (1241)11121......(...)[()()][()()]s s t t s t s t t s t s t s t t s s s s s a a a a a E y y E a a a a μμδδεεεεεεε+-----------++--+++++++++++=== 关于AR(p)过程的平稳性，见附录。

3、MA(P)过程：11...pt t t p t y a a εεε--=+++，{}t ε是白噪声过程显然，任意有限阶MA 过程都是平稳的。

计量经济学第八章ppt课件

1
xiE(i )
E(x
2 i
ห้องสมุดไป่ตู้
)
1
3、如果X与μ同期相关，得到的参数估计量有偏且非一致。
证明见上述第2点。
四、工具变量法
1、工具变量的选取 • 模型中出现随机解释变量，且与μ相关，
不能应用OLS估计参数，可选用工具变量法。 • 工具变量：在模型估计过程中被作为工
具使用，以替代模型中与μ相关的随机解释变量。
zi i 1
zi xi zi xi
zii 1
zi i
zi xi
P
lim( ~1)
1
P lim
P lim
1 n 1
n
zi
i
zi
xi
• 工具变量的条件：
– 与所替代的随机解释变量高度相关； – 与μ不相关； – 与其它的解释变量不相关，以免出现多重共线性。
2、工具变量的应用
Yi 0 1Xi i
OLS
Yi n0 1 Xi
XiYi 0
Xi 1
X
2 i
ˆ1
x i yi
x
2 i
,ˆ 0
Y
ˆ1X
上述OLS计算实际上应用了:
E(ˆ1) 1 E(
xi
x
2 i
i
)
1
E(
kii )
尽管Xi与i同期无关，
但k
的分母中一定包含不同期的
i
X，
因异期相
关可知k
i与
相关，
i
故E(ˆ 1 )
1,是有偏的。
P nlim1
xii
x
2 i
1
Plin
1 n

计量经济学第8章

PPT文档演模板
计量经济学第8章
• 在EViews软件中，生成D2数据的EViews命令是GENR D2= @SEAS(2) ，D3、D4类似。以时间t为解释变量（1982年1季度取t = 1，EViews命令是：GENR T= @TREND(1981：1)）的煤销售量（yt）模型回归结果如表所示。
关系时，为研究四个季度对利润的季节性影响，引入三个虚拟变量(设
第1季度为基础类型)：
PPT文档演模板
计量经济学第8章
• 例用虚拟变量处理季节数据模型 • 中国1982-1988年市场用煤销售量（yt）季节数据（《中国统计年鉴》 1987，1989）见表
PPT文档演模板
计量经济学第8章
•年与季度
虚拟变量的引入
• 虚拟变量在模型中可以作自变量，也可以作因变量。 • 虚拟变量的引入方式
– 加法方式 – 乘法方式 – 一般方式
• 虚拟变量模型应用举例
PPT文档演模板
计量经济学第8章
•1、加法方式
1 •D = 0
反常情况 •Y 正常情况
Y = b0 + b1 X + b2 D + u
•反常 •正常
•3、一般方式
1 •D = 0
反常情况 •Y 正常情况
Y=b0+b01D+b1 X+ b11D X+u
•反常 •正常
反常情况:
Y=(b0+b01)+(b1+b11) X+u
•b01
正常情况:
Y = b0 + b1 自变量之间的关系既是相加关系
•又是相乘关系，这种引入虚拟变量方式为一般方
•1988.3

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

三、多重共线性的检验（一）相关系数检验利用相关系数可以分析解释变量之间的两两相关情况。

随着多重共线性程度的增强，VIF 以及系数估计误差都在增大。

因此，可以用VIF 作为衡量多重共线性的一个指标；一般当10>VIF 时，（此时9.02>iR ），认为模型存在较严重的多重共线性。

另一个与VIF 等价的指标是“容许度”（Tolerance ），其定义为：iiiVIF R TOL /1)1(2=-=显然，10≤≤TOL ，当i x 与其他解释变量高度相关时，0→TOL 。

因此，一般当1.0<TOL 时，认为模型存在较严重的多重共线性。

（四）特征值检验考察解释变量的样本数据矩阵⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=knnn k k x xxx x x x x x X 212221212111111 当模型存在完全多重共线性时，0||,1)(='+<X X k X rank ；而当模型存在严重的多重共线性时，0||≈'X X 。

根据矩阵知识，若121,,,+k λλλ 为矩阵1+'kX X 的个特征值，则有：0||121≈='+K X X λλλ这表明特征值)1,,2,1(+=k ii λ中至少有一个近似地等于零。

因此，可以利用X X '的特征值来检验模型的多重共线性。

实际计算时，先对样本数据做标准化处理，这样矩阵||X X '转化成解释变量的相关系数矩阵，特征值也减少到k 个。

利用特征值还可以构造两个用于检验多重共线性的指标：病态数(κCondition Number)和病态指数CI （Condition Index ）；其指标定义为：κ=最大特征值/最小特征值κ=CI这两个指标都反映了特征值的离散程度，数值越大，表明多重共线性越严重。

一般当κ)30(1000>>CI 或时，认为存在严重的多重共线性。

四、多重共线性的解决方法设定计量经济模型的时候，为了全面反映各方面因素的影响，总是在理论和实践认识的基础上，尽量选取被解释变量的所有影响因素。

这样在同时考虑多个影响因素的情况下，很可能产生多重共线性问题。

在处理多重共线性之前，首先应该明确以下两点：第一，多重共线性的主要后果是无法区分每个解释变量的单独影响，因此，如果建立模型的目的是进行预测，只要模型的拟合优度较高（即能正确反映所有解释变量的总影响），并且解释变量的相关类型在预测期内保持不变，则可以忽略多重共线性的问题。

但是，如果是应用模型进行结构分析或政策评价，即利用系数分析、比较各个解释变量的单独影响，则需要消除多重共线性的影响。

第二，引起多重共线性的原因是模型中存在相关的解释变量，所以消除多重共线性的根本方法只能是从模型中剔除这些变量。

但直接剔除变量可能会产生新的问题：（1）模型的经济意义不合理；例如，生产函数中资金与劳动者人数通常是高度相关的，但从中剔除任何一个要素都不太合适。

（2）如果剔除的是重要解释变量。

则这些变量的影响将反映在随机误差项中，使模型产生异方差性或自相关性。

（3）若剔除不当还会产生设定误差的问题，造成参数估计严重有偏。

因此，为了解决这一矛盾，剔除变量时应该全面、慎重考虑，根据解释变量的特点分别采用直接剔除和间接剔除两种方式。

（一）直接剔除次要或可替代的变量根据经济理论和实际经验设定计量经济模型时容易考虑过多的解释变量，其中有些可能是无显著影响的次要变量，还有一些变量的影响可以用模型中的其他变量来代替。

所以在估计模型之前，为避免多重共线性的影响，应该从模型中先剔除这些变量。

次要变量可以通过被解释变量与解释变量的相关系数检验、相关图分析等统计分析加以鉴别；利用辅助回归模型和特征值检验多重共线性时，又可以提供解释变量之间相互替代性的信息。

（二）间接剔除重要的解释变量对于有重要影响的解释变量，可以通过以下方式将其“间接剔除”： 1、利用附加信息例如，著名的Cobb_Douglas 生产函数中βαK AL Y =劳动投入量L 与资金投入量K 之间通常是高度相关的，如果已知附加信息： 1=+βα（规模报酬不变）则 βββ)(1LK AL K AL Y ==-或 β)(LK A L Y =记 L K k L Y y /,/==则C-D 生产函数可以表示成：βAk y =此时二元模型转化成一元模型，当然不存在多重共线性的问题，可以利用OLS 法估计βˆ,ˆA，进而得到βˆ1ˆ-=a 。

又如，设工业能源需求函数为：ε+++=2211x b x b a y其中，21,x x 分别为重、轻工业总产值，利用此模型不仅能反映工业经济增长对能源的需求情况，而且可以反映工业结构变化对能源需求的影响。

但是重、轻工业发展的共向性，很可能使模型产生多重共线性。

由于21,b b 分别是重、轻工业的单位能耗，如果根据历史统计资料测得重工业的单位能耗（平均来说）是轻工业单位能耗的)0(>λλ倍，即获得以下附加信息：21bb λ=则工业能源需求函数可以表示成：εελελ++=+++=+++=*22122212)(x b a x x b a x b x b a y其中，21*x x x+=λ，模型转化成一元模型，估计出2ˆ,ˆba 之后，又得到21ˆb b λ=，从而在消除多重共线性影响的情况下得到工业能源需求函数：2211ˆˆˆˆx b x b a y++=2、变换模型的形式对原设定的模型进行适当的变换，也可以消除或削弱原模型中解释变量之间的相关关系。

具体有三种变换方式，一是变换模型的函数形式，如将线性模型转换成双对数模型、半对数模型、多项式模型等；二是变换模型的变量形式，如引入差分变量、相对数变量等；三是改变变量的统计指标，如将生产过程中的资金投入量取成固定资金或流动资金（或两者之和），劳动投入量取成职工人数或工资总额，经济增长指标取成GDP 、GNP 、国民收入等。

再如，投资函数： ε+++=-121t ttY b Y b b I也可以变换成：ε+∆++=-tt tY a Y a a I 211即以收入和收入增长来解释投资的增长情况。

3、综合使用时序数据与横截面数据如果能同时获得变量的时序数据和横截面数据，则先利用某类数据估计出模型中的部分参数，再利用另一类数据估计模型的其余参数。

例如，设某类商品的需求函数为：ε+++=P b x b b y ln ln ln 21其中，y 为商品需求量，P x ,分别为居民收入和该商品价格，并且已知在时序样本数据中P x 与高度相关。

为此分以下二步完成：（1）收集最近一年该商品的销售量和居民收入的统计资料（横截面数据），由于商品价格在一年中的变化幅度不大，所以将需求函数取成：ε++=iix a a y ln ln 1利用横截面资料估计该模型，得到需求的收入弹性1a 。

（2）原需求函数中的1b 也是需求的收入弹性，所以11a b ≈（此时实际上假设历年的平均收入弹性与近期的收入弹性近似相等），将原模型变换成：ittP b b y ε++=ln 1*其中，tttx ay y ln ˆln 1*-=。

再利用历年商品销售量、居民收入和价格的统计资料（时序数据）估计模型，得到10ˆ,ˆb b ，从而在消除多重共线性影响的情况下，估计出需求函数：P b x b by ln ˆln ˆˆln 21++= 从上述三种方法的处理过程可以看出，最终还是通过减少模型中解释变量个数的方式（即剔除引起多重共线性的变量）来消除多重共线性的影响，但并不是直接剔除有重要影响的解释变量，模型中还是保留了这些变量的影响，所以称之为“间接剔除）。

（三）逐步回归建立计量经济模型的时候，一般是将解释变量全部引入模型，然后再根据统计检验和定性分析从中逐个剔除次要的或产生多重共线性的变量，选择变量是一个“由多到少”的过程。

而逐步回归选择变量时，却是一个“由少到多”的过程，即从所有解释变量中间先选择影响最为显著的变量建立模型，然后再将模型之外的变量逐个引入模型；每引入一个变量，就对模型中的所有变量进行一次显著性检验，并从中剔除不显著的变量，逐步引入——剔除——引入，直到模型之外所有变量均不显著时为止。

许多统计分析软件都有逐步回归程序，但根据计算机软件自动挑选的模型往往统计检验合理，经济意义并不理想。

因此，实际应用中一般是依据逐步回归的原理，结合主观分析来筛选变量。

具体步骤为：（1）利用相关系数从所有解释变量中选取相关性最强的变量建立一元回归模型。

（2）在一元回归模型中分别引入第二个变量，共建立1 k个二元回归模型（设共有k 个解释变量），从这些模型中再选取一个较优的模型。

选择时要求：模型中每个解释变量影响显著，参数符号正确，2R 值有所提高。

（3）在选取的二元回归模型中以同样方式引入第三个变量；如此下去，直到无法引入新的变量时为止。

[例5]服装需求函数。

根据理论和经验分析，影响居民服装需求的主要因素有：可支配收入X 、流动资产拥有量K 、服装类价格指数P1和总物价指数P0。

表3-4给出了有关统计资料。

表3-4 服装需求函数有关统计资料设服装需求函数为：ε+++++=K b P b P b X b a Y 432101（1）相关系数检验键入：COR Y X K P0 P1 输出的相关系数矩阵为：可见每个因素都与服装需求高度相关，而且解释变量之间也是高度相关的。