清华经管计量经济学Lecture11
清华经管计量经济学Lecture5
hongshj@
Lecture 6
13 / 65
S TATA T IPS
We can get numerical solutions by using STATA: Rather than saying reg y x we say reg y x z
Shengjie Hong (SEM, Tsinghua)
Lecture 6
8 / 65
We can write this as 1 N 1 N 1 N
N N
ˆ0 − β ˆ1 xi − β ˆ2 zi yi − β
i =1
= 0
ˆ0 − β ˆ1 xi − β ˆ2 zi xi yi − β
i =1 N
= 0
ˆ0 − β ˆ1 xi − β ˆ2 zi zi yi − β
2
3
4
5
6
Shengjie Hong (SEM, Tsinghua)
hongshj@
Lecture 6
3 / 65
The model we considered before with omitted variable bias was yi = β0 + β1 xi + ui and ui = β2 zi + εi . Then we can write this as yi = β0 + β1 xi + β2 zi + εi .
N
ˆ0 β ˆ1 = 1 β N ˆ2 β
1 · yi xi · yi zi · yi i =1
N
further, we can write it equivalently as: ˆ β0 N 1 1 xi (1, xi , zi ) · β ˆ1 = 1 N N ˆ2 zi i =1 β
清华大学课程《计量经济学》配套习题和答案-114页文档资料
清华大学《计量经济学》配套习题和答案第一章 绪论(一)基本知识类题型1-1. 什么是计量经济学?1-2. 简述当代计量经济学发展的动向。
1-3. 计量经济学方法与一般经济数学方法有什么区别?1-4.为什么说计量经济学是经济理论、数学和经济统计学的结合?试述三者之关系。
1-5.为什么说计量经济学是一门经济学科?它在经济学科体系中的作用和地位是什么? 1-6.计量经济学的研究的对象和内容是什么?计量经济学模型研究的经济关系有哪两个基本特征?1-7.试结合一个具体经济问题说明建立与应用计量经济学模型的主要步骤。
1-8.建立计量经济学模型的基本思想是什么?1-9.计量经济学模型主要有哪些应用领域?各自的原理是什么?1-10.试分别举出五个时间序列数据和横截面数据,并说明时间序列数据和横截面数据有和异同?1-11.试解释单方程模型和联立方程模型的概念,并举例说明两者之间的联系与区别。
1-12.模型的检验包括几个方面?其具体含义是什么?1-13.常用的样本数据有哪些?1-14.计量经济模型中为何要包括随机误差项?简述随机误差项形成的原因。
1-15.估计量和估计值有何区别?哪些类型的关系式不存在估计问题? 1-16.经济数据在计量经济分析中的作用是什么?1-17.下列假想模型是否属于揭示因果关系的计量经济学模型?为什么?⑴ S R t t =+1120012.. 其中S t 为第t 年农村居民储蓄增加额(亿元)、R t 为第t 年城镇居民可支配收入总额(亿元)。
⑵ S R t t -=+144320030.. 其中S t -1为第(1-t )年底农村居民储蓄余额(亿元)、R t 为第t 年农村居民纯收入总额(亿元)。
1-18.指出下列假想模型中的错误,并说明理由:(1)RS RI IV t t t =-+83000024112... 其中,RS t 为第t 年社会消费品零售总额(亿元),RI t 为第t 年居民收入总额(亿元)(城镇居民可支配收入总额与农村居民纯收入总额之和),IV t 为第t 年全社会固定资产投资总额(亿元)。
《清华计量教案》课件
《清华计量教案》课件第一章:引言1.1 课程概述介绍《清华计量教案》课件的基本内容和目标强调计量在科学研究和实际应用中的重要性1.2 教学方法讲解与案例分析相结合互动讨论和问题解决1.3 学习目标了解计量学的基本概念和原理掌握基本的计量经济学分析方法第二章:数据收集与处理2.1 数据来源介绍收集数据的途径和注意事项强调数据质量和可靠性2.2 数据处理讲解数据的清洗、转换和整理方法介绍数据分析软件的使用2.3 案例分析分析实际案例,展示数据处理的过程和方法第三章:描述性统计分析3.1 描述性统计指标介绍均值、中位数、标准差等基本统计指标讲解如何解读和应用这些指标3.2 数据可视化介绍数据可视化的重要性和方法学习使用图表和图形展示数据特征3.3 案例分析分析实际案例,应用描述性统计分析方法第四章:概率与概率分布4.1 概率基础讲解概率的基本概念和计算方法介绍条件概率和联合概率4.2 离散概率分布学习离散随机变量的概率分布函数讲解期望和方差的计算方法4.3 连续概率分布介绍连续随机变量的概率密度函数学习连续数据的概率分布特征第五章:假设检验与置信区间5.1 假设检验基本概念讲解假设检验的目的和步骤介绍显著性水平和检验统计量5.2 常见假设检验方法学习t检验、z检验和卡方检验等方法讲解检验的适用条件和结果解释5.3 置信区间估计介绍置信区间的概念和计算方法学习如何选择合适的置信水平第六章:回归分析6.1 简单线性回归介绍简单线性回归模型的基本概念讲解回归系数和截距的估计方法学习回归模型的检验和评价指标6.2 多变量回归分析介绍多元线性回归模型的概念和应用学习多重共线性、异方差性和自相关问题的处理方法6.3 非线性回归分析介绍非线性回归模型的类型和估计方法学习如何选择合适的非线性模型和求解方法第七章:时间序列分析7.1 时间序列的基本概念讲解时间序列数据的特征和分类介绍时间序列分析的目的和方法7.2 单变量时间序列分析学习自回归模型、移动平均模型和指数平滑模型的构建和应用讲解时间序列预测的基本方法7.3 多变量时间序列分析介绍向量自回归模型和协整分析的概念和应用学习如何进行多变量时间序列数据的建模和分析第八章:面板数据分析8.1 面板数据的基本概念介绍面板数据的结构和特点讲解面板数据分析的目的和方法8.2 固定效应模型和随机效应模型学习固定效应模型和随机效应模型的估计方法讲解模型选择和检验的准则8.3 动态面板数据分析介绍动态面板数据的特征和建模方法学习动态面板数据的估计和分析技术第九章:生存分析与风险评估9.1 生存分析的基本概念讲解生存分析的定义和应用领域介绍生存函数和风险函数的概念9.2 生存分析的方法学习生存曲线拟合和生存预测的方法讲解生存分析的软件应用和结果解释9.3 风险评估与决策分析介绍风险评估的基本方法和模型学习如何应用生存分析结果进行风险管理和决策分析第十章:总结与展望10.1 课程总结回顾本门课程的主要内容和知识点强调计量经济学在科学研究和实际应用中的重要性10.2 案例研究分析实际案例,综合运用本课程所学知识进行分析和解决10.3 未来展望介绍计量经济学的发展趋势和前沿领域鼓励学生继续学习和深入研究计量经济学的问题重点和难点解析第一章:引言重点:计量学的基本概念和原理,以及其在科学研究和实际应用中的重要性。
计量经济学课件-李子奈(清华)
⑹ 答疑时间
⑺ 课程内容提纲及学时安排 (总课时:48学时,课内外周学时:3/6) 第一章 绪论 第三章 单方程计量经济学应用模型 第四章 联立方程计量经济学理论与方法 3学时 9学时 9学时 第二章 单方程计量经济学模型理论与方法 15学时
第五章 宏观计量经济模型
第六章 时间序列计量经济学模型
3学时
△ 模型
△ 数学模型
△ 经济数学模型
△ 计量经济学模型
△ 经济理论分析(行为分析)→数理分析 →数 量分析
三、计量经济学的内容体系
△ 广义计量经济学和狭义计量经济学 △ 初、中、高级计量经济学
△ 理论计量经济学和应用计量经济学
△ 经典计量经济学和非经典计量经济学
△ 微观计量经济学和宏观计量经济学
△广义计量经济学和狭义计量经济学
《计量经济学》
《Econometrics》 《经济计量学》
第一章 绪论
0.1 关于绪论
0.2 课程教学大纲 §1.1 计量经济学
§1.2 经典计量经济学模型的建模步骤
§1.3 计量经济学模型的应用
0 .1 关于绪论
○绪论是课程的纲。 ○学好绪论,可以说学好了课程的一半。参观一个 城市,先站在最高处俯瞰,然后走街串巷;了解 一座建筑,先看模型,后走进每一个房间。各起 一半作用。 ○绪论课的目的:了解课程的性质和在课程体系中 的地位;了解课程完整的内容体系和将要讲授的 内容;了解课程的重点和难点;了解课程的学习 方法;介绍课程中不讲的但是必须了解的课程内 容。 ○不必全懂,只需似懂非懂。
⑵ 先修课程 中级微观经济学、中级宏观经济学、经济统计 学、微积分、线性代数、概率论与数理统计、应用 数理统计
⑶ 教材及参考书
清华大学计量经济学课件
二、经济预测
• 计量经济学模型作为一类经济数学模型,是从 用于经济预测,特别是短期预测而发展起来的。
• 计量经济学模型是以模拟历史、从已经发生的 经济活动中找出变化规律为主要技术手段。
• 对于非稳定发展的经济过程,对于缺乏规范行 为理论的经济活动,计量经济学模型预测功能 失效。
• 模型理论方法的发展以适应预测的需要。
ln(人均食品需求量)=-2.0+0.5ln(人均收 入)-0.8ln(食品价格) +0.8ln(其它商品价格)
⑵ 统计检验 由数理统计理论决定 包括拟合优度检验 总体显著性检验 变量显著性检验
⑶ 计量经济学检验 由计量经济学理论决定 包括异方差性检验 序列相关性检验 共线性检验
⑷ 模型预测检验 由模型的应用要求决定 包括实际
例如:ln(人均食品需求量)=α+βln(人均收入) +γln(食品价格) +δln(其它商品价格)+ε
其中α 、β、γ、δ的符号、大小、 关系
二、样本数据的收集
⑴ 几类常用的样本数据 时间序列数据 截面数据 虚变量离散数据 联合应用
⑵ 数据质量 完整性 准确性 可比性 一致性
三、模型参数的估计
微观计量:
非
选择性样本模型
经
典
微观计量:
计
离散选择模型
量
经
济 学
时间序列:
协整理论—现代宏观计量
时间序列:
ARCH—现代金融计量
Heckman McFadden
Granger Engle
五、计量经济学在经济学科中的地位
△ 从现代西方经济学的特征看 △ 从西方经济学的发展历史看 △ 从世界一流大学经济学课程表看 △ 从国际经济学刊物论文看 △ 从经济学的“世界先进水平”看
清华经管IMBA管理经济学课件9
The grade (top corner) is the final grade (adjusted for the distribution)
-通用格式 -通用格式
Chapter 11: Pricing with Market Power
-通用格式 -通用格式 -通用格式 -通用格式 -通用格式 -通用格式 >95 85-95 75-85 <75
Chapter 11: Pricing with Market Power
Copyright © 2009 Pearson Education, Inc. Publishing as Prentice Hall • Microeconomics • Pindyck/Rubinfeld, 7e.
5 of 42
Figure 10.13 Competitive Buyer Compared to Competitive Seller
In (a), the competitive buyer takes market price P* as given. Therefore, marginal expenditure and average expenditure are constant and equal; quantity purchased is found by equating price to marginal value (demand). In (b), the competitive seller also takes price as given. Marginal revenue and average revenue are constant and equal; quantity sold is found by equating price to marginal cost.
清华大学经管学院 计量经济学 施新政课件第三章 统计推断
第三章统计推断•什么是统计推断?–()ˆkE β=–给定一次抽样,我们的估计量并不必然等于•例子kβˆkβkβ^*ˆˆincome β+0.401ˆβ=0089ˆ例子:,;•我们关心是否为零,不等于零并不意味着不等于零。
01educationβ=10.089β=1β1ˆβ1β–我们也会关心同一个回归方程中不同系数之间的关系。
**•例子:•我们关心是否等于,或者两者谁大谁小。
1β012kideducation dadeducation momeducation uβββ=+++2β•随机变量的概率分布()–密度函数: f(x)1aμ2aA B CD•1122Pr (); Pr (); Pr ()ob x A ob x B C ob x Da a a a <=<<=+>=–Cumulative distribution function (CDF)•Pr ()F z ob x z < •()Pr ()()()ob a x b F b F a <<=−•置信度的图示:双侧检验为例α‐c0c•单侧检验β–•计算1:0j H >ˆj t β•选择置信度,确定–αc1Pr ()n k ob c T α−−>=•如果,那么我们就可以拒绝原假设ˆjc t β>αc–•计算1:0j H β<ˆ•选择置信度,确定jt βc –•1Pr ()n k ob c T α−−>=ˆct <−如果,那么我们就可以拒绝原假设j βαc−•P 值能够拒绝原假设的最小置信度–给定,能够拒绝原假设的最小置信度。
•双侧检验:P 值=ˆjt β1(||||)ˆj n k prob t Tβ−−>•单侧检验–:P 值=1:0j H β>1()ˆj n k prob t T β−−>–:P 值= 1:0j H β<1()ˆjn k prob t T β−−<双侧检验P 值单侧检验P 值1:0j H β>ˆjt βˆj t β−•在假设成立的情况下,我们实际上是在做一个有约束条件的极小化问题0H 个有约束条件的极小化问题。
《清华计量教案》课件
《清华计量教案》课件第一章:引言1.1 课程目标让学生了解计量经济学的基本概念和原理。
培养学生运用计量经济学方法分析和解决实际问题的能力。
1.2 课程内容计量经济学的定义和研究对象计量经济学的历史和发展计量经济学在经济学研究中的应用1.3 教学方法讲授与案例分析相结合引导学生参与讨论和思考利用多媒体课件辅助教学第二章:数据来源与处理2.1 课程目标让学生了解数据的来源和类型。
培养学生掌握数据处理和清洗的基本方法。
2.2 课程内容数据来源:调查数据、官方统计数据、实验数据等数据类型:定量数据、定性数据、时间序列数据、面板数据等数据处理:数据清洗、数据转换、数据聚合等2.3 教学方法讲授与实例分析相结合引导学生进行数据处理实践利用计算机软件辅助教学第三章:描述性统计分析3.1 课程目标让学生了解描述性统计分析的基本概念和常用指标。
培养学生掌握描述性统计分析的方法和技巧。
3.2 课程内容频数、频率和比例均值、中位数和众数标准差、方差和离散系数分布形态:正态分布、偏态分布等3.3 教学方法讲授与实例分析相结合引导学生进行描述性统计分析实践利用计算机软件辅助教学第四章:概率论与数理统计基础4.1 课程目标让学生了解概率论和数理统计的基本概念和原理。
培养学生掌握概率论和数理统计的方法和技巧。
4.2 课程内容随机变量及其分布:离散型随机变量、连续型随机变量数学期望和方差协方差和相关系数假设检验和置信区间4.3 教学方法讲授与实例分析相结合引导学生进行概率论和数理统计实践利用计算机软件辅助教学第五章:线性回归分析5.1 课程目标让学生了解线性回归分析的基本概念和原理。
培养学生掌握线性回归分析的方法和技巧。
5.2 课程内容线性回归模型的定义和形式回归系数估计的普通最小二乘法回归模型的检验和诊断回归分析的应用实例5.3 教学方法讲授与实例分析相结合引导学生进行线性回归分析实践利用计算机软件辅助教学第六章:多元回归分析6.1 课程目标让学生了解多元回归分析的基本概念和原理。
《计量经济学导论》chapter 11
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
1)
, 2)
, and 3)
.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
is the same as that of
Lecture 8 Dynamic and Nonlinear Panels 高级计量经济学及Stata应用课件
2020/7/25
陈强 计量及Stata应用 (c) 2014
6
差分GMM的缺点
• 如果T很大,则会有很多工具变量,容易出 现弱工具变量(weak instruments)问题(通常 滞后越多期则相关性越弱),产生偏差。
.5385501 .1781989
.6849559 .3036127
wks
--. -.0159751 .0082523 -1.94 0.053 -.0321493
.000199
L1.
.0039944 .0027425
1.46 0.145 -.0013807 .0093695
ms union
occ south
则 yi, t2 与 it it i, t1 不相关,满足外生性。
2020/7/25
陈强 计量及Stata应用 (c) 2014
5
差分GMM
• 根据同样的逻辑,更高阶的滞后变量 yi, t3, yi, t4 , 也是有效工具变量,而Anderson-Hsiao估计量未 加以利用,故不是最有效率的。 • Arellano and Bond (1991)使用所有可能的滞后变
Cov(i, t1, i, t1) Var(i, t1) 0
• 但扰动项的差分将不存在二阶或更高阶的自相关。 为此,可以通过检验扰动项的差分是否存在一阶 与二阶自相关,来检验原假设。
2020/7/25
陈强 计量及Stata应用 (c) 2014
16
扰动项的自相关检验(续)
• 选择项“endogenous(ms,lag(0,2))”指定变量ms为内生解释变量(其中 的“0”表示内生解释变量不包含ms的任何滞后),而最多使用其两个更 高阶滞后值(即二阶与三阶)为工具变量。
清华经管计量经济学Lecture9
= 1-0.9931 = 0.0069.
Shengjie Hong (SEM, Tsinghua)
hongshj@
Lecture 9
12 / 52
Using the same reasoning, the p-values for the other types of tests are: If H0 : µ = µ∗ vs H1 : µ < µ∗ p-value = Pr (Z ≤ z ) .
Shengjie Hong (SEM, Tsinghua)
hongshj@
Lecture 9
10 / 52
Thus, we can now describe how to obtain the p-value for each type of test. . . Suppose we have H0 : µ = µ∗ vs H1 : µ > µ∗ . We know that we reject H0 in favor of H1 if our test-statistic z = is large. Since the p-value is the probability of observing a test-statistic at least as bad for H0 as the one we observed in the data, then the p-value is the probability of observing a test-statistic at least as large as the one we obtained in the data. X − µ∗
Shengjie Hong (SEM, Tsinghua)
计量经济学课件和答案_4 (1)[3页]
第一章绪论课后习题答案一、单项选择题C B B CD B A二、简述题1.计量经济学的含义是什么?答:以一定的经济理论和统计资料为基础,运用数学、统计学方法与电脑技术,以建立经济计量模型为主要手段,定量研究具有随机特性的经济变量之间的关系。
2.简述计量经济学与数理经济学、数理统计学的关系。
答:数理经济学与计量经济学:数理经济学也是着重于研究经济的定量方面,但它仅是用数学形式表达经济理论,并不关心经济理论的可测性,且模型所反映的经济变量之间的关系是确定的。
而计量经济学的主要兴趣在于利用由数理经济学剔除的数学模型及实际数据来验证经济理论;模型所反映的经济间的关系是非确定性的,随机的相关关系。
数理经济学为计量经济学提供了建模依据。
数理统计学与计量经济学:数理统计学为各种数据提供切实可靠的数学分析方法,是计量经济学建立模型的主要工具。
但数理统计学在研究变量之间关系时,要求研究变量必须服从一些假定。
但是在现实经济生活中,各经济变量很难完全满足数理统计学所作的假定,要研究经济变量之间的关系,计量经济学必须在数理统计方法上开发出特有的分析技术。
3.计量经济学中常用的数据类型有哪些?它们各自有什么特点?答:常用的统计数据有以下几种类型:(一)时间序列数据时间序列数据是不同时间点上收集到的数据,这类数据反映某一事物随时间的动态变化状态。
(二)横截面数据横截面数据是在同一时间不同统计单位相同统计指标组成的数列。
(三)面板数据面板数据有时间序列和横截面两个维度。
当这类数据按两个维度排列时,是排在一个平面上,与只有一个维度的数据排在一条线上有着明显的不同,整个表格像是一个面板。
(四)虚拟变量数据许多经济变量是可以定量度量的,但也有一些影响经济变量的因素无法定量度量,当需要把它们引入到模型中,常用人工构造的虚拟变量来表示。
如反映文化程度的虚拟变量可取为:1 0D ⎧=⎨⎩本科学历非本科学历4.什么计量经济学模型?计量经济学模型包括哪些要素?答:计量经济模型是用适当的数学关系式揭示经济活动中各个因素之间的定量关系。
清华经管计量经济学Lecture 2
Preliminary Part I: Basics of Probability Theory
The prerequisites of this course are introductory level probability theory and statistics . In this part we review the basics of the probability theory.
Number of flips
Shengjie Hong (SEM, Tsinghua)
hongshj@
Lecture 1
8 / 99
P ROBABILITY: T HE S TUDY OF R ANDOMNESS An example: Flip a coin 5000 times
Shengjie Hong (SEM, Tsinghua)
hongshj@
Lecture 1
12 / 99
T HE S AMPLE S PACE
The sample space S is the set of all possible outcomes. Let’s look at a few examples. Sample space of tossing a coin. Toss a coin. There are only two possible outcomes, and the sample space is S = {head, tail} or, more briefly, S = {H, T}. Sample space of tossing a coin three times. Toss a coin three times, and record the results of each of the three tosses in order.The sample space is the set of all 8 strings of three H’s and T’s: S = {HHH, HHT, HTH, HTT, THH, THT, TTH, TTT} . Sample space of tossing a coin four times. How many different outcomes are there in the sample space? Answer: 2 × 2 × 2 × 2 = 24 = 16.
计量经济学课件李子奈(清华)(1)
05
面板数据分析
面板数据基本概念与类型
面板数据定义
面板数据,也称为时间序列截面数据 或混合数据,是指在时间序列上取多 个截面,在这些截面上同时选取样本 观测值所构成的样本数据。
面板数据类型
根据观测值和截面的不同,面板数据 可以分为平衡面板数据和非平衡面板 数据。平衡面板数据指各截面在时间 序列上观测值个数相等,非平衡面板 数据则相反。
03
广义线性回归模型
广义线性模型基本概念
广义线性模型定义
广义线性模型是一种灵活的统 计模型,它扩展了线性回归模 型的应用范围,允许因变量遵 循非正态分布。
连接函数
连接函数是广义线性模型中的 关键组成部分,它将线性预测 器与非线性因变量连接起来, 描述了因变量的期望值与线性 预测器之间的关系。
指数分布族
半参数估计方法应用举例
在经济学领域,半参数估计方法可以用于面 板数据模型的分析。例如,可以利用半参数 固定效应模型对面板数据进行建模,既考虑 了个体间的异质性,又通过非参数部分描述
了模型的未知部分或误差部分。
07
计量经济学软件应用介绍
EViews软件基本操作与功能介绍
1 2 3
数据输入与整理
EViews支持多种数据格式的导入,如Excel、 CSV等,方便用户进行数据整理和管理。
计量经济学模型实现
R语言提供了丰富的计量经济学模型实现工具包, 如lm()函数用于线性回归分析,arima()函数用于时 间序列分析等。
模型诊断与优化
R语言支持对计量经济学模型进行诊断和优 化,如残差分析、异方差性检验等,以提高 模型的拟合效果和预测精度。
THANK YOU
感谢聆听
应用举例
面板数据分析在经济学、金融学、社会学等领域具有广泛的应用。例如,可以利用面板数据分析来研 究经济增长、金融市场波动、社会不平等等问题。通过对面板数据的建模和分析,我们可以更深入地 理解这些现象背后的动态过程和影响因素。
清华大学经济管理学院金融市场学ch(11)
推出国债期货的目的主要是为了活跃国债二级 市场
国债期货市场逼空现象原因
– 国债现券规模太小 – 利率变化过频 – 保值补贴引发的多空大战
清华大学 经济管理学院 国际贸易与金融系 朱宝宪副教授
八、314国债逼空事件
国债314品种是1992年发行的五年期国债品种。 314国债发行100亿,进入流通的有40亿,20万
低保证金;以后改为每张合约200元,进入交割月后保 证金提高至6,000元。 手续费:每张合约10元,以后降为5元。
十、327国债事件
327是指95年6月交收的192国债期货合约, 192是国债的代码,是92年7月1日发行的三年期国债。 事件的起因:192的票面利率为9.5%,由于通胀,93年
十二、标普500股指期货内容
交易单位:500美元乘以标准普尔500指数的点数 最小变动价位:0.05个点数(每张合约为25美元) 开市限价:在交易开盘时,最大价格波动超过上一日
结算价5个指数点。如价格在开市10分钟时达到此停板 额,将暂停2分钟,然后按新开盘价范围重新恢复交易。 合约月份:3、6、9、12月。 最后交易日:最终结算价格确定日的前一个工作日。 交割方式:按最终结算价以现金结算。此最终结算价 由合约月份的第三个星期五的500种股票指数的构成股 票市场开盘价所决定。
清华计量经济学课件 (14)
这种“量化”通常是通过引入“虚拟变量”来 完成的。根据这些因素的属性类型,构造只取“0” 或“1”的人工变量,通常称为虚拟变量(dummy variables),记为D。
• 例如,反映文程度的虚拟变量可取为: 1, 本科学历
(3) 1=1 ,但22 ,即两个回归的差异仅在其斜率, 称为汇合回归(Concurrent Regressions);
(4) 11,且22 ,即两个回归完全不同,称为相 异回归(Dissimilar Regressions)。
可以运用邹氏结构变化的检验。这一问题也可通过 引入乘法形式的虚拟变量来解决。
例如,进口消费品数量Y主要取决于国民收入X 的多少,中国在改革开放前后,Y对X的回归关系明 显不同。
这时,可以t*=1979年为转折期,以1979年的国
民收入Xt*为临界值,设如下虚拟变量:
Dt
1 0
t t* t t*
则进口消费品的回归模型可建立如下:
Yt
0
1X t
2(Xt
• 这里,虚拟变量D以与X相乘的方式引入了模型中,
从而可用来考察消费倾向的变化。
• 假定E(i)= 0,上述模型所表示的函数可化为: 正常年份:
E(Ct | X t , Dt 1) 0 (1 2 ) X t
反常年份:
E(Ct | X t , Dt 0) 0 1 X t
0
β
1
k
1
α
2
3 4
显然,(X,D)中的第1列可表示成后4列的线性组合, 从而(X,D)不满秩,参数无法唯一求出。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Shengjie Hong (SEM, Tsinghua)
hongshj@
Lecture 11
2 / 46
O UTLINE
1
Instrumental Variable
2
A Classical Example: Supply and Demand
Shengjie Hong (SEM, Tsinghua)
When xi and ui are correlated, we say xi is endogenous. Endogenous regressors are problematic since E (ui | xi ) = 0 (or any other constant).
Shengjie Hong (SEM, Tsinghua)
Shengjie Hong (SEM, Tsinghua) hongshj@ Lecture 11 14 / 46
TSLS As it sounds, TSLS has two stages – two regressions: Stage One: First isolates the part of x that is uncorrelated with u : Regress x on z using OLS xi = π0 + π1 zi + vi . (1)
Shengjie Hong (SEM, Tsinghua)
hongshj@
Lecture 11
10 / 46
E NDOGENEITY P ROBLEM
In general, in a simple regression model yi = β0 + β1 xi + ui
Utilize knowledge from OLS Show how the IV works
Sample analogue
More basic and straightforward Technically more familiar
These two thoughts will lead to the same estimator.
I NTRODUCTORY E CONOMETRICS
Lecture 11
Spring 2014, Tsinghua University
Shengjie Hong (SEM, Tsinghua)
hongshj@
Lecture 11
1 / 46
Instrumental Variables
Shengjie Hong (SEM, Tsinghua)
hongshj@
Lecture 11
5 / 46
We then wrote down the sample analogue of these equations: 1 N
N
xi yi − β0 − β1 xi
Shengjie Hong (SEM, Tsinghua)
hongshj@
Lecture 11
8 / 46
M EASUREMENT E RRORS IN x
Suppose we are looking at a regular setting: yi = β0 + β1 xi∗ + ui with E (ui | xi∗ ) = 0 To consistently estimate β1 , we simply need to regress y on x ∗ . However, we may not be able to observe x ∗ precisely.
Shengjie Hong (SEM, Tsinghua)
hongshj@
Lecture 11
9 / 46
Do we get a consistent estimator of β1 by regressing y on x ? From xi = xi∗ + vi , we know that xi∗ = xi − vi . So the original regression model yi = β0 + β1 xi∗ + ui can be written as yi = β0 + β1 (xi − vi ) + ui . Rearranging term, we get yi = β0 + β1 xi + ei where ei = ui − β1 vi . Answer: Probably Not. Because It is likely that E (ei | xi ) = 0.
Shengjie Hong (SEM, Tsinghua) hongshj@ Lecture 11 15 / 46
TSLS ˆi in the regression of interest: Stage Two: Replace xi by x ˆi using OLS: Regress y on x ˆi + εi yi = β0 + β1 x ˆi . where εi = ui + β1 v ˆi is (roughly) uncorrelated with εi because x
1
Omitted variable bias from a variable that is correlated with x but is unobserved, so cannot be included in the regression; Measurement errors: errors-in-variables bias (x is measured with error)
Shengjie Hong (SEM, Tsinghua)
Байду номын сангаас
hongshj@
Lecture 11
12 / 46
IV E STIMATION
IV estimation can be motivated by two different thoughts: Two stage least square (TSLS)
Because zi is uncorrelated with ui , π0 + π1 zi is uncorrelated with ui . We don’t know π0 or π1 but we have estimated them, so. . . ˆi , where Compute the predicted values of xi , x ˆi = π x ˆ0 + π ˆ1 zi for i = 1, . . . , n.
Shengjie Hong (SEM, Tsinghua)
hongshj@
Lecture 11
6 / 46
W HY E (ui | xi ) = 0 M AY FAIL
Two important threats to internal validity are:
1 2
(2)
ˆi is (a consistent estimator of) the part of xi that is uncorrelated with ui ; x ˆi is roughly uncorrelated with v ˆi . x
hongshj@
Lecture 11
11 / 46
Fixing this problem is a most important thing in labor economics. So what can we do? Suppose we have some other variable, call it zi and we believe that E [ui | zi ] = 0 This is called an instrumental variable (IV). The method of getting consistent estimator by using IV is called IV Estimation. It turns out that we can do essentially the same thing as what we did before.
Shengjie Hong (SEM, Tsinghua)
hongshj@
Lecture 11
13 / 46
TSLS
yi = β0 + β1 xi + ui How IV works: IV regression breaks x into two parts: a part that might be correlated with u , and a part that is not. By isolating the part that is not correlated with u , it is possible to estimate β1 . This is done using an instrumental variable, zi , which is uncorrelated with ui . The IV detects movements in xi that are uncorrelated with ui , and uses these to estimate β1 . This mechanism is best shown by TSLS.
We are able to observe x = x ∗ + v , where v is a measurement error. x is a “noised” version of x ∗ . We are not able to regress y on x ∗ . how about regress y on x ?