斯托克计量经济学课件 (9)
2024版计量经济学全册课件(完整)pptx
REPORTING
2024/1/28
23
EViews软件介绍及操作指南
EViews软件概述
EViews是一款功能强大的计量经济学 软件,提供数据处理、统计分析、模型
估计和预测等功能。
统计分析与检验
2024/1/28
详细讲解EViews中的统计分析工具, 包括描述性统计、假设检验、方差分
析等。
数据导入与预处理 介绍如何在EViews中导入数据,进行 数据清洗、转换和预处理等操作。
随着大数据时代的到来,机器学 习算法在数据挖掘、预测和分类 等方面展现出强大的能力,为计 量经济学提供了新的研究工具和 方法。
机器学习在计量经济 学中的应用领域
机器学习在计量经济学中的应用 领域广泛,如变量选择、模型选 择、非线性模型估计、高维数据 处理等。
机器学习在计量经济 学中的常用算法
机器学习在计量经济学中常用的 算法包括决策树、随机森林、支 持向量机(SVM)、神经网络等。 这些算法可以用于分类、回归、 聚类等任务,提高模型的预测精 度和解释力。
面板数据特点
同时具有时间序列和截面数据的特征,能够提供更多的信息、更多的变化、更少共 线性、更多的自由度和更高的估计效率。
2024/1/28
20
固定效应模型与随机效应模型
固定效应模型(Fixed Effects Model)
对于特定的个体而言,其截距项是固定的,不随时间变化而变化。
随机效应模型(Random Effects Mode…
经典线性回归模型
REPORTING
2024/1/28
7
一元线性回归模型
模型设定与参数估计
介绍一元线性回归模型的基本形式, 解释因变量、自变量和误差项的含义, 阐述最小二乘法(OLS)进行参数估 计的原理。
计量经济学-詹姆斯斯托克-复习ppt课件
此课件下载可自行编辑修改,此课件供参考! 部分内容来源于网络,如有侵权请与我联系删除!感谢你的观看!
如何准确地估计参数β
• 如何处理违反经典假设的情况?
– F检验,T检验,和R2检验;以及怎样的函数形 式;
– 异方差(定义、后果、如何检验处理) – 序列自相关(定义、后果、如何检验处理) – 遗漏重要相关变量(面板数据的处理)
如何准确地估计参数β
• 如何处理违经典假设的情况?
– 伪回归(*) – 解释变量非随机(*) – 离散自变量(虚拟变量的回归)
如何准确地估计参数遗漏重要相关变量面板数据的处理如何准确地估计参数离散因变量logit回归probit回归此课件下载可自行编辑修改此课件供参考
复习
回归
• Y=Xβ+U • 回归的本质 • 如何准确地估计参数β以及随机项的方差σ2;
如何准确地估计参数β
• 好的估计方法——最小二乘法; • 要满足一定的条件——高斯-马尔科夫条件; • 如何检验并处理违反经典假设的情况?
计量经济学课件PPT课件
非线性模型转换方法
多项式回归
通过引入自变量的高次项,将非线性关系转化为线性 关系进行处理。
变量变换
对自变量或因变量进行某种函数变换,以改善模型的 拟合效果。
非参数回归
不假定具体的函数形式,通过数据驱动的方式拟合非 线性关系。
实例分析:金融时间序列预测
数据准备
收集金融时间序列数据,如股票 价格、交易量等,并进行预处理。
模型选择依据
Hausman检验,LM检验等。
实例分析:经济增长收敛性问题研究
研究背景
探讨不同国家或地区间经济增长差异及其收 敛性。
模型构建
选择合适的面板数据模型,设定经济增长收 敛假设。
实证分析
收集相关数据,运用计量经济学软件进行回 归分析,检验收敛性假设是否成立。
结论与政策建议
根据实证结果得出结论,提出促进经济增长 收敛的政策建议。
机器学习算法与计量经济学模型结合
将机器学习算法与传统计量经济学模型相结合,形成更具解释性和预测能力的混合模型。
大数据背景下计量经济学挑战与机遇
01
大数据背景概述
数据量巨大、类型多样、处理速度快等 特点。
02
计量经济学面临的挑 战
数据质量、计算效率、模型可解释性等 问题。
03
计量经济学面临的机 遇
利用大数据技术挖掘更多信息,提高模 型预测精度和政策评估效果;同时推动 计量经济学理论和方法的发展创新。
Geary's C指数
与Moran's I指数类似,也是用于检验全局空间自相关。
LISA集聚图 用于检验局部空间自相关,可以直观展示空间集聚或异常 值区域。
空间滞后和空间误差模型选择
空间滞后模型(SLM)
计量经济学讲义第九讲(共十讲)
第九讲 协整与误差修正模型一、协整的定义假设时间序列12,,...,t t ktxx x 都属于d 阶单整序列I(d),即各时间序列在差分d 次后将变为平稳序列。
如果一非零的常数向量12)(,,...,k a a a '使得:1212(),0...t t kt k x x x I d b b d a a a -<≤+++则称12,,...,t t ktxx x 之间存在阶数为(d,b )的协整关系,i a 是协整参数。
经济变量的单整阶数往往不会超过2。
在实践中经常出现的情况是,12,,...,t t ktx x x 都是一阶单整的,因此,如果12,,...,t t ktxx x 协整,则:1212(0)...t t kt k x x x I a a a +++二、关于协整的经济学含义当很多变量都含有单位根时,除非有一种机制把这些变量联系在一起,否则这些变量会不受约束的各自漫游。
问题是存在这种机制吗?经济学理论经常表明变量间存在某种长期均衡关系。
如果情况确实如此,那么各变量对这种长期均衡关系的偏离不会持久。
因此,经济学理论所表明的长期均衡关系往往暗示了一种把各变量联系在一起的内在机制。
这种机制就是变量间的协整关系。
例一:期货价格是对未来现货价格的预期。
在理性预期假设下,期货价格不会系统性地偏离未来现货价格,因此,期货价格与未来现货价格是协整的。
例二:购买力平价理论认为,本国物价p 与外国物价p *之比决定了名义汇率的均衡值。
名义汇率不应该长期偏离其均衡值,因此,e 与p/p *是协整的。
例三:按照定义,名义利率=实际利率+预期通胀率。
在长期均衡中,按照理性预期假设,预期通胀率将等于通胀率;按照费雪假设(Fisher hypothesis ),实际利率等于自然利率。
假定自然利率为一常数,则名义利率与通胀率的长期均衡关系是名义利率=常数+通胀率。
因此,名义利率与通胀率是协整的。
三、协整检验(一)协整参数已知例如,如果(1),(1)tt x I y I ,现在假设两变量协整,且协整参数为θ。
计量经济学-詹姆斯斯托克-第9章-面板数据的处理ppt课件
35
.
FatalityRate v. BeerTax:
36
.
问题
在上述模型中,如果超过两期,即T>2, 怎么处理呢?
37
.
面板数据模型的一般理论
在模型的设定上,分为两大类: (一)“固定效应”模型; (二)“随机效应”模型;
38
.
(一) 固定效应的回归 Fixed Effects Regression
2
.
面板数据,简而言之是时间序列和截面数据的混合。 严格地讲是对一组个体(如居民、国家、公司等)连 续观察多期得到的资料。所以很多时候我们也称其为 “追踪资料”。近年来,由于面板数据资料的获得变 得相对容易,使其应用范围也不断扩大。
3
.
当描述截面数据时,我们用下标表示个体,如Yi表示 变量Y的第i个个体。当描述面板数据时,我们需要其 他符号同时表示个体和时期。为此我们采用双下标而 不是单下标,其中第一个下标i表示个体,第二个下 标t表示观测时间。
23
.
案例二:
啤酒税与交通死亡率
啤酒税与交通死亡率会是什么关系?
24
.
U.S. traffic death data for 1982:
$1982
较高的啤酒税,会导致更多的交通死亡吗?
25
.
U.S. traffic death data for 1988
较高的啤酒税,会导致更多的交通死亡吗?
16000
15000
14000
13000
INC
12000
11000
10000
9000
8000 10000
15000
20000
25000
计量经济学课件全完整版
自回归移动平均模型,适用于平 稳和非平稳时间序列的预测,通 过识别、估计和诊断模型参数来 实现预测。
05
面板数据分析方法及应用
面板数据基本概念及特点
面板数据定义
面板数据,也叫时间序列截面数据或混合数 据,是指在时间序列上取多个截面,在这些 截面上同时选取样本观测值所构成的样本数 据。
介绍空间滞后模型(SLM)、空间误差模型(SEM)等空间计量经济模型的建立与估 计方法,包括极大似然估计、广义矩估计等。
贝叶斯计量经济学原理及应用
01
02
贝叶斯统计推断基础
阐述贝叶斯统计推断的基本原理和方法, 包括先验分布、后验分布、贝叶斯因子 等概念。
贝叶斯计量经济模型 的建立与估计
介绍贝叶斯线性回归模型、贝叶斯时间 序列模型等贝叶斯计量经济模型的建立 与估计方法,包括马尔科夫链蒙特卡罗 (MCMC)模拟等。
模型假设
广义线性模型假设响应变量与解释变量之间存在一 种可通过链接函数转化的线性关系,而非线性模型 则不受此限制,可以拟合任意复杂的非线性关系。
模型诊断与检验
对于广义线性模型,常用的诊断方法包括残差分析、 拟合优度检验等;对于非线性模型,由于模型的复 杂性,诊断方法可能更加多样化,包括交叉验证、 可视化分析等。
与其他社会科学的关系 计量经济学也可以应用于其他社会科学领域,如 社会学、政治学等,对社会科学现象进行定量分 析。
计量经济学发展历史及现状
发展历史
计量经济学起源于20世纪初,随着计算机技术的发展和普及,计量经济学得到 了广泛的应用和发展。
现状
目前,计量经济学已经成为经济学领域的重要分支,广泛应用于宏观经济、微 观经济、金融、国际贸易等领域。同时,随着大数据和人工智能技术的发展, 计量经济学面临着新的机遇和挑战。
应用计量经济学第9章PPT课件
序列相关性
Slides by Niels-Hugo Blunch Washington and Lee University
纯序列相关性
• 纯序列相关性破坏了古典假设 IV,古典假设 IV保证了在正确设定 的方程中各误差项观测值之间没有相关性
• 最被广泛假设的序列相关性是一阶序列相关性,在一阶序列相关 性中,随机误差项的当期值是上一期值的函数:
929neweywest标准误当然并丌是所有修正纯序列相关性的方法都广义最小二乘法glsneweywest标准误通过修正标准误来修正序列相关性而丌改变估计的回归系数如果序列相关性仅仅影响标准误而丌影响估计系数的无偏性那么修正序列相关性时调整估计系数的标准误即可而没有必要调整系数本身的估计值如果紧急医疗系统采用包括持续胸部按压的综合救治干预对于院外心脏骤停患者可以考虑在综合救治干预中使用被动通气技术
• 这也许是已知的最好的GLS方法
• 这是一种两步法,首先将估计出 ρ ,然后,使用该估计值进行GLS估计
• 这两步的具体步骤:
1. 对怀疑存在序列相关性的模型进行OLS估计,获得残差序列后,再估计方程:
et = ρet–1 + ut
(9.21)
此设处 的随et机是误对差怀项疑存在序列相关性的模型进行OLS估计后获得的鳌头, ut 是服从古典假
20
Figure 9.6 单边 Durbin–Watson
d 检验的例子
21
序列相关性的补救
• 修正自相关的第一步就是仔细检查可能引起不纯的序列相关性的模型设 定误差
– 函数形式正确吗? – 确定没有遗漏的变量了吗? – 只有仔细检查了模型的设定后,才有必要对纯序列相关性进行检验并修正 • 有两种主要的修正序列相关性的方法: 1. 广义最小二乘法(GLS:Generalized Least Squares) 2. Newey-West 标准误
计量经济学第九章完整课件
回归模型的应用案例
1 2 3
消费物价指数预测
通过建立回归模型,利用历史数据和相关解释变 量预测未来消费物价指数,为货币政策制定提供 依据。
股票价格预测
利用回归模型分析历史股票价格和相关解释变量 ,预测未来股票价格走势,为投资者提供决策参 考。
经济增长预测
通过建立回归模型,利用历史数据和相关解释变 量预测未来经济增长趋势,为政府和企业制定发 展计划提供依据。
多元线性回归模型
总结词
多元线性回归模型是一种扩展的回归模型,允许我们同时考虑多个自变量对因变 量的影响。
详细描述
多元线性回归模型通过引入多个自变量来扩展基本的回归模型。这种方法能够更 全面地描述因变量和自变量之间的关系,并提供更准确的预测。在经济学、金融 学和其他领域中,多元线性回归模型被广泛用于研究各种现象。
合度越好。
变量的显著性检验
t检验
用于检验单个解释变量对被解释 变量的影响是否显著,通过计算t 统计量并进行假设检验得出结论
。
F检验
用于检验多个解释变量整体上对被 解释变量的影响是否显著,通过计 算F统计量并进行假设检验得出结 论。
z检验
用于检验某个解释变量在两个或多 个总体中是否存在显著差异,通过 计算z统计量并进行假设检验得出结 论。
PART 02
回归模型的检验
模型的拟合度检验
决定系数(R-squared):衡量 模型解释变量变异程度的指标, 值越接近1表示模型拟合度越好
。
调整决定系数(Adjusted Rsquared):考虑了模型中自变 量的数量对R-squared的影响, 值越接近1表示模型拟合度越好
。
均方误差(Mean Squared Error,MSE):衡量模型预测 误差的指标,值越小表示模型拟
计量经济学--时间序列分析PPT课件
在 工 作 文 件 主 窗 口 点 击 Quick / Estimate Equation 在 Equation Specification对话框中填入 y ar(1) ma(1)(或者填入 y y(-1) ma(1))便 得到模型ARMA(1,1)的估计结果,如表9.3.6(或表9.3.7)所示。
.
③Include in test equation:默认选择是检验式中只包括截距 项。其他两种选择是检验式中包括趋势项和截距项,检验式中不 包括趋势项和截距项。④Lag length: 自动选择包括6种选择标 准,也可以在最大滞后期(Maximum lag)选择区自己设定。
图9.2.5
.
4.Phillips-Perron检验
GDP(亿元) 21617.8 26638.1 34634.4 46759.4 58478.1 67884.6 74462.6 78345.2 82067.5 89468.1 97314.8 105172.3 117251.9
.
1978-2003年中国GDP时间序列图9.2.3表现了一个持续上升的 过程,即在不同的时间段上,其均值是不同的,因此可初步判断是 非平稳的。而且从它们的样本自相关系数的变化看,也是缓慢下降 的 , 再 次 表 明 它 们 的 非 平 稳 性 。 这 样 , 我 们 得 出 地 结 论 是 19782003年间中国GDP时间序列是非平稳序列。
.
(2)通过计算能够描述序列特征的一些统计量(如自相关系数和偏自 相关系数),来确定ARMA模型的阶数p和q,并在初始估计中选择 尽可能少的参数;
第9章 时间序列分析
9.1 时间序列的基本概念
9.1.1 时间序列
.
9.1.2 时间序列的数字特征 1.均值函数
计量经济学(共11张PPT)
分析与模型应 用阶段
是否可用于决策? 应用
修改整理模型
结构分析
预测未来
模拟
检验发展理论
第五节 经济计量学和其它学科的关系
数理经济学是运用数学研究有关经济理论
数理统计学是运用数学研究统计问题 经济统计学是对经济现象的统计研究
经济计量学是经济学、统计学、数学三者结合在一起的交叉学科。
经济学
数理经济学
经济统计学
四、我国经济计量学的发展
70-80年代
80-90年代 1998年
开始介绍《经济计量学》的学科内 容和国外发展情况
1995年《经济计量学》的教学大纲 正式发表;全国许多高校相继开设 《经济计量学》课程。
将《经济计量学》列入经济类各专 业八门公共核心课程之一
五、经济计量学的内容体系
按照研究的方 法不同
《Econometrics》。
从30年代到今天,尤其是二次大战以后,计量经济学在西方各 国的影响迅速扩大。曾说:“二次世界大战以后的经济学是计量经 济学的时代”。1969年首届诺贝尔经济学奖授予弗里希和丁伯根。 自1996年设立诺贝尔经济学奖至1989年27为获奖者中有15位是计量 经济学家,其中10位是世界计量经济学会的会长。
(时间序列数据、截面数据)
二、参数估计
三、模型检验(拟合优度、t 检验、F 检验) 四、模型应用(预测、结构分析、 模拟)
第三节 经济计量学的特点
1.它是研究经济现象的,它不但给出质的解释,而且给出确切的量的 描述,从而使经济学成为一门精密的科学。 定性分析-定量分析(简单的数量对比-模型分析)
2.能综合考虑多种因素,通过描述客观经济现象中极为复杂的因果关系,对 影响某一经济现象的众多因素(哪些是主要、次要因素)给出一目了然的 回答。
斯托克计量经济学第八章第九章stata实证
E8.1(1) (2) (3) (4)ahe lnahe lnahe lnahe age 0.585***0.0273***0.0814(0.0365) (0.00186) (0.0434) female -3.664***-0.186***-0.186***-0.186***(0.208) (0.0108) (0.0108) (0.0108) bachelor 8.083***0.428***0.428***0.428***(0.213) (0.0108) (0.0108) (0.0108) lnage 0.804***(0.0545)age2 -0.000915(0.000735) _cons -0.636 1.876***-0.0345 1.085(1.083) (0.0559) (0.185) (0.635) N7711 7711 7711 7711R20.200 0.201 0.201 0.201 adj. R20.1995 0.2003 0.2005 0.2004 Standard errors in parentheses (表1)*p < 0.05, **p < 0.01, ***p < 0.001(1)该问的回归结果如表第(1)列所示。
如果age从25增加到26岁,则预期收入每小时增加0.585美元。
如果age从33增加到34岁,则预期收入也是每小时增加0.585美元。
(2)该问的回归结果如表第(2)列所示。
如果age从25增加到26,则lnahe预计增加0.0273,即预期收入每小时增加2.73%。
如果age从33增加到34岁,则预期收入也是每小时增加2.73%。
(3)该问的回归结果如表第(3)列所示。
如果age从25增加到26岁,则lnage增加ln26-ln25≈0.04,预计lnahe增加0.04×0.804=0.03216,所以预期收入每小时增加3.216%。
《计量经济学》ppt课件
04
时间序列分析
时间序列基本概念与性质
时间序列定义
按时间顺序排列的一组数据,反映现象随时间 变化的发展过程。
时间序列构成要素
现象所属的时间(横坐标)和现象在某一时间 上的指标数值(纵坐标)。
时间序列性质
长期趋势、季节变动、循环变动和不规则变动。
时间序列平稳性检验方法
图形判断法
通过观察时间序列的折线图或散点图,判断 其是否具有明显的趋势或周期性变化。
05
非参数和半参数估计方法
非参数估计方法原理及应用
原理
非参数估计方法不对总体分布做具体假设,而是利用样本数据直接进行推断。其核心思想是通过核密度估计、最 近邻估计等方法,对样本数据的分布进行平滑处理,从而得到总体分布的估计。
应用
非参数估计方法广泛应用于各种实际问题中,如金融市场的波动率估计、生物医学中的生存分析、环境科学中的 气候变化预测等。其优点在于灵活性高,能够适应各种复杂的数据分布,但同时也存在计算量大、对样本量要求 较高等问题。
计量经济学研究方法与工具
研究方法
主要包括理论建模、实证分析和政策评估等方法。
工具
运用数学、统计学和计算机技术等多种工具,如回归分析、时间序列分析、面 板数据分析等。
02
经典线性回归模型
线性回归模型基本概念
线性回归模型定义
描述因变量与一个或多个自变量之间线性关系的数学模型。
回归方程
表示因变量与自变量之间关系的数学表达式,形如 Y=β0+β1X1+β2X2+…+βkXk。
利用指数平滑技术对时间序列进行预测, 适用于具有线性趋势和一定周期性变化的 时间序列。
ARIMA模型
神经网络模型
计量经济学课件完整版
计量经济学课件完整版计量经济学课件完整版一、课程简介计量经济学是经济学领域的一门重要学科,它利用数学、统计学和经济学等学科的知识和方法,对经济现象进行量化和分析。
本课程将系统地介绍计量经济学的基本概念、方法和应用,旨在帮助学生掌握计量经济学的理论和实践技能,为进一步学习和研究经济学打下坚实的基础。
二、课程内容本课程共分为八个单元,包括:1、回归分析基础2、模型选择与优化3、时间序列分析4、面板数据分析5、多元回归分析6、离散选择模型7、因子分析8、协整分析每个单元都包括理论讲解、案例分析、软件操作和习题等内容,让学生全面了解和掌握计量经济学的方法和技术。
三、课程安排本课程共36学时,安排如下:1、理论讲解(20学时)2、软件操作与实践(10学时)3、习题课与答疑(6学时)四、教学目的通过本课程的学习,学生将能够:1、掌握计量经济学的基本概念和方法;2、熟练运用常用的计量经济学软件进行数据分析;3、了解计量经济学在经济学领域的应用;4、提高解决实际问题的能力,为未来的学习和工作打下基础。
五、教学方法本课程采用多种教学方法,包括:1、课堂讲解:教师通过讲解和演示,帮助学生掌握计量经济学的基本理论和方法;2、案例分析:通过分析实际案例,让学生了解计量经济学在实践中的应用;3、小组讨论:学生分组进行讨论和交流,加深对课程内容的理解;4、实践操作:通过上机实践,让学生掌握计量经济学软件的操作技巧。
六、考核方式本课程的考核方式包括:1、平时作业:完成课程对应的练习题和思考题,占总成绩的30%;2、期中考试:进行期中考试,考核学生对课程内容的掌握情况,占总成绩的30%;3、期末考试:进行期末考试,全面考核学生对课程内容的理解和应用能力,占总成绩的40%。
七、参考资料本课程推荐以下参考书籍:1、《计量经济学基础》(作者:高铁梅);2、《计量经济学》(作者:斯托克);3、《应用计量经济学》(作者:詹姆斯·H·斯托克等)。
Stock 计量经济学ppt一到三章
The Statistical Analysis of Economic (and related) Data
Brief Overview of the Course
Economics suggests important relationships, often with policy implications, but virtually never suggests quantitative magnitudes of causal effects. What is the quantitative effect of reducing class size on student achievement? How does another year of education change earnings? What is the price elasticity of cigarettes? What is the effect on output growth of a 1 percentage point increase in interest rates by the Fed? What is the effect on housing prices of environmental improvements?
9
Initial data analysis: Compare districts with “small” (STR < 20) and “large” (STR ≥ 20) class sizes:
Class Size Average score (Y ) Small 657.4 Large 650.0 Standard deviation (sBYB) 19.4 17.9 n 238 182
《计量经济学》课件
序计 量 经 济 研 究 的 工 作 程
(三)参数估计
矩法 常用的参数估计方法极大似然法
最小二乘法
• 矩法——以样本矩代替总体矩建立方程, 求解参数的方法。
• 极大似然法——根据极大似然原理建立方 程,求解参数的方法。
• 最小二乘法——根据最小二乘原理建立方 程,求解参数的方法。
(四)模型的检验
前定变量外 滞生 后变 变量 量
滞后内生变量 滞后外生变量
前期的内生变量 前期的外生变量
• (4)控制变量
• 控制变量——人为设置的反映政策要求、决策 者意愿、经济系统的运行条件和运行状态等方 面的变量。
模型设计工作
经济变量的确定 模型方程的设定
• 计量经济模型——为了研究分析经济系统中的经 济变量之间的数量关系而采用的随机性 的数学方程。 y f (x1, x2 ,, xn ) u
• 结构分析包括:(1)利用模型分析和测度系统 中某一变量的(绝对和相对)变化对其他变量 的影响;(2)比较分析变量及参数变化对经济 系统平衡的影响;(3)分析与研究变量相互关 系的变化对经济系统平衡点位移的内在联系。
• 政策评价——利用计量经济模型和计算机技术, 模拟在不同政策(或决策)条件下,经济系统 运行的态势和结果,对政策(或决策)进行评 价和优选。
济 学 概
• 数理经济学为计量经济学提供经济模型; • 经济统计学为计量经济学提供经济数据;
述 • 数理统计学为计量经济学提供分析工具和
研究方法;
计量经济学与相关学科的关系图
经济学
数理经 济学
计量经 济学
经济统 计学
数学
数理统 计学
统计学
(四) 计量经济学的分类
计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
实例#1: 黄油的供给和需求
IV 回归最开始是用于估计农产品(例如黄油)的需求弹性: ln(Qibutter ) = 0 + 1ln( Pi butter ) + ui 1 = 黄油的价格弹性 = 价格变化 1%引起的需求量的百分 比变化 (回顾双对数模型) 数据: 不同年份中黄油价格和需求量的观测值 ln(Qibutter ) 关于 ln( Pi butter ) 的 OLS 回归中遭遇了双向因果关 系偏差(为什么?)
11
ln(Qibutter ) 关于 ln( Pi butter ) OLS 回归中的双向因果关系偏差源于 价格和需求量是由需求和供给共同决定的
12
供给和需求的交互作用得到了
利用这些数据得到的回归是需求曲线吗?
13
但如果只有供给移动了你将得到什么?
TSLS 通过分离出价格和量中源于供给移动的变动来估计 需求曲线. Z 是导致供给移动而需求不动的变量.
14
在供给需求实例中的TSLS:
ln(Qibutter ) = 0 + 1ln( Pi butter ) + ui 令 Z = 牧场地区的降雨量. Z 是一个有效的工具变量吗? (1) 外生性? corr(raini,ui) = 0? 合理的: 牧场地区是否下雨不影响需求 (2) 相关性? corr(raini,ln( Pi butter )) 0?
第 12 章
工具变量回归
第12章 工具变量回归
影响回归结果正确性的三大威胁有: 遗漏变量偏差,由于没有遗漏变量的观测数据所以不能 把它加到回归中; 双向因果关系 (X 导致了 Y, Y 导致了 X); 变量有测量误差 (X 中带有测量误差) 当 E(u|X) ≠ 0 时,工具变量回归可消除偏差——利用工具变 量( instrumental variable) Z
17
实例: 香烟需求
ln(Qicigarettes ) = 0 + 1ln( Pi cigarettes ) + ui 面板数据: 年香烟消费和平均支付价格(包含税收) 48 个美国大陆州, 1985-1995 提议的工具变量: Zi =每包的一般销售税 = SalesTaxi 是有效的工具变量吗? (1) 相关性? corr(SalesTaxi, ln( Pi cigarettes )) 0? (2) 外生性? corr(SalesTaxi,ui) = 0?
3
术语: 内生性(endogeneity)和外生性(exogeneity)
内生 变量是指与 u 相关的变量 外生 变量是指与 u 不相关的变量 注记: “内生的” 字面意思指 “在系统内决定,” 即, 和 Y 共
同确定的变量, 也是遭受 双向因果关系的变量. 然而,这 种定义较为狭义,IV 回归可用于处理遗漏变量偏差和测 量误差偏差, 而不仅仅是双向因果关系偏差.
2
12.1 单个回归变量和单个工具变量的IV 回归
Yi = 0 + 1Xi + ui IV 回归将 X 分解成两部分: 第一部分与 u 相关, 第二部分 与 u 不相关. 通过分离出与 u 不相关的部分, 可以用来估计
1.
利用工具变量 Zi 可以做到这一点,其中工具变量与 ui 不相 关. 工具变量能够检测出 Xi 中与 ui 不相关的变动 ,并利用这 部分估计 1.
-----------------------------------------------------------------------------| Robust lravgprs | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------rtaxso | .0307289 .0048354 6.35 0.000 .0209956 .0404621 _cons | 4.616546 .0289177 159.64 0.000 4.558338 4.674755 -----------------------------------------------------------------------------X-hat . predict lravphat;
5
IV 估计量, 一个X 和一个 Z
#1: 两阶段最小二乘(Two Stage Least Squares ,TSLS) 正如其名字指出的, TSLS 分为两个阶段,即两个回归: (1) 首先利用 X 关于 Z 的 OLS 回归分离出与 u 不相关的那部 分X: Xi = 0 + 1Zi + vi (1)
#2: 简单的代数 Yi = 0 + 1Xi + ui 于是, cov(Yi,Zi) = cov(0 + 1Xi + ui,Zi) = cov(0,Zi) + cov(1Xi,Zi) + cov(ui,Zi) = 0 + cov(1Xi,Zi) + 0 = 1cov(Xi,Zi) 其中 cov(ui,Zi) = 0 (工具外生性); 因此
因为 Zi 与 ui 不相关,因此 0 + 1Zi 与 ui 不相关. 我们不 知道0 或者 1 但我们可以估计它们 ˆ , 其中 X ˆ = ˆ0 + ˆ1 Zi, i = 1,…,n. 计算 Xi 的预测值 X i i
6
TSLS (续)
ˆ : (2) 将感兴趣回归中的 Xi 替换为 X i ˆ 的回归: 利用 OLS 建立 Y 关于 X i ˆ + ui Yi = 0 + 1 X i
7
TSLS小结
假设你有有效的工具 Zi.
ˆ 第 1 步: 建立 Xi 关于 Zi 的回归,得到预测值 X i ˆ 的回归, X ˆ 的系数就是 TSLS 估计 第 2 步: 建立 Yi 关于 X i i ˆ TSL量. 1
8
IV 估计量, 一个 X和一个Z (续)
ln( Pi butter ) 分离出了供给(至少是部分供给)引起的价格 对数的变化
Stage 2: 建立 ln(Qibutter ) 关于 ln( Pi butter ) 的回归 利用供给曲线的移动追踪需求曲线的对应回归.
16
基于TSLS的推断
大样本下, TSLS 估计量服从正态分布 推断 (假设检验, 置信区间)同常规方法(大样本下正确) 标准误差的重要注记: 来自第二阶段的 OLS 标准误差是不正确的 – 它们没有 ˆ 是估计的). 包括第一阶段的估计 ( X i 相反, 要采用计算 TSLS 估计量和正确 SE 的特定命令. 同前, 利用异方差稳健标准误差(SE)
这些系数是 TSLS 估计值 标准误差是错误的,因为它们忽略了第一阶段是估计的 事实
21
结合到一个命令中
Y X Z . ivreg lpackpc (lravgprs = rtaxso) if year==1995, r; IV (2SLS) regression with robust standard errors Number of obs = F( 1, 46) = Prob > F = R-squared = Root MSE = 48 11.54 0.0014 0.4011 .19035
-----------------------------------------------------------------------------| Robust lpackpc | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------lravphat | -1.083586 .3336949 -3.25 0.002 -1.755279 -.4118932 _cons | 9.719875 1.597119 6.09 0.000 6.505042 12.93471 ------------------------------------------------------------------------------
4
有效工具变量的两个条件
Yi = 0 + 1Xi + ui 要使工具变量 (“工具”) Z 有效, 必须满足下面两个条件: 1. 2.
工具相关性: corr(Zi,Xi) 0 工具外生性: corr(Zi,ui) = 0
现假设你找到了这样的 Zi (怎么找这样的 Z?) 问题:如何利用 Zi 估计 1?
现在我们有了来自 1st 阶段的预测值
20
第二阶段
Y X-hat . reg lpackpc lravphat if year==1995, r; Regression with robust standard errors Number of obs = F( 1, 46) = Prob > F = R-squared = Root MSE = 48 10.54 0.0022 0.1525 .22645
(2)
ˆ 与 ui 不相关(当 n 较大时), 所以第一个最小二乘假 因为 X i 设成立 (当 n 较大时) 因此可基于回归(2)利用 OLS 估计 1 这个论断依赖于大样本 (于是利用回归(1)可较好地估计 0 和1 ) ˆ TSLS . 得到的估计量被称为两阶段最小二乘 (TSLS) 估计量, 1
合理: 雨量不足会使牧草减少而使黄油减少
15
在供给需求实例中的TSLS (续)
ln(Qibutter ) = 0 + 1ln( Pi butter ) + ui Zi = raini = 牧场地区的降雨量. Stage 1: 建立 ln( Pi butter ) 关于 rain 的回归, 得到 ln( Pi butter ) .