陈强_高级计量经济学及stata应用电子教材(包括数据集和勘误表)
第12章-多值选择模型
第 12 章 多值选择模型
12.1 多项 Logit 与多项 Probit 假设可供个体选择的方案为 y 1, 2, , J ,其中 J 为正整数。 个体 i 选择方案 j 的效用为
U ij xi β j ij (i 1, , n; j 1, , J )
exp( xi β j ) P( y j ) P( y j | y 1 or j ) P( y 1) P( y j ) 1 exp( xi β j )
上式与二值 Logit 具有完全相同的形式。
11
“几率比”(odds ratio)或“相对风险”(relative risk)为
17
图 12.1 中的“交通工具”可视为此树形结构的“根部”(root), 第一层(level 1)的“公共交通、私人交通”为“树干”(limb),而 第二层(level 2)的 “公交、 地铁、 自驾车、 出租车” 为 “树枝” (branch)。 可将此树形结构视为“决策树”(decision tree),但关键在于它 的统计性质,即在第二层的每组内部允许扰动项相关,比如
16
解决方法之一是,把相似的方案归入一组,允许同组内的方案 相关,但不同组的方案相互独立。 比如,在交通工具的选择上,可把“公交车、地铁”归入“公 共交通组” ,而把“自驾车、出租车”归入“私人交通组” ,形成 嵌套式(nested)的树形结构。
交通工具
公共交通
私人交通
公交
地铁
自驾车
出租车
图 12.1 嵌套 Logit 的树形结构
6
个体 i 选择方案 j 的效用:
高级计量经济学-1
计量经济分析工作应注意的问题
• 认真思考研究目的; • 认真从理论上考虑变量的经济学定义和作用机制; • 注意统计数据是否与理论定义相一致,是否存在改变定义 和统计方法的情况; • 检验统计数量是否存在异常情况; • 利用时间序列数据估计模型,必须对用名义价值表示的指 标做消除通货膨胀的处理; • 利用时间序列数据建立模型,应考虑先对变量的平稳性做 统计检验,以避免虚假回归。 • 考虑到我国的改革迚程和数据情况,应注意将时间序列数 据和截面数据结合建立模型,幵检验模型结构的稳定性。
高级计量经济学
齐鲁工业大学商学院
1
教材及参考书目
教材: 高级计量经济学及STATA应用 陈强 高等教育出版社
参考书目:
1. 栺林《计量经济分析》 (上 下册)人大费剑平译 2. 李子奈《高等应用计量经济学》清华大学出版社 3. 李子奈《高等计量经济学》清华大学出版社 4. 靳云汇 金赛男 《高级计量经济学》(上 下册)北京
15
课程论文评分标准
16
计量经济学研究的范式
(The paradigm of econometrics )
• 计量经济学假定,每种经济现象均有其隐含的因 果关系结构(经济机制) ,或者说存在一个“真 实”的模型。
– 农产品供给 – 农产品需求 – 市场均衡
• 建立计量经济模型的目的是利用严谨的方法来研 究经济现象,从而揭示和验证隐含的因果关系:
计量经济学研究的重要収展方向
小型结构模型与大觃模模型; 对模型设定迚行检验; 更多地使用广义矩(GMM)估计方法; 对时间序列做单位根(unit root)检验,以确定时间 序列的稳定性,更多地关注变量间是否存在协整 关系; • 建立各种非线性模型和动态模型; • 计量经济学软件的开収应用。 • • • •
Lecture 7 Static Panels 高级计量经济学及Stata应用课件
2021/8/3
陈强 计量及Stata应用 (c) 2014
21
异方差稳健的豪斯曼检验
• 传统的豪斯曼检验假设在 H0 成立的情况下,ˆRE是最有效
率的(fully efficient)。但如果扰动项存在异方差,则并非最 有效率量;故不适用于异方差的情形。
2016830陈强计量及stata应用c201418加权最小二乘法wls2016830陈强计量及stata应用c201419re估计量与mle估计量使用广义最小二乘法fgls来估计原模型即得到随机效应估计量randomeffectsestimator的一致估计量stata记为theta2016830陈强计量及stata应用c201420究竟使用固定效应还是随机效应无论原假设成立与否fe都是一致的
OLS不是最有效率的。
• 广义最小二乘法(Generalized Least Square, GLS)最有效率。
• GLS的特例为加权最小二乘法(Weightes Least Square, WLS)。
2021/8/3
陈强 计量及Stata应用 (c) 2014
17
加权最小二乘法(WLS)
2021/8/3
Lecture 7 Static Panels 高级计量经济 学及Stata应用课件
面板数据
• 面板数据(panel data或longitudinal data,也译为 “平行数据”),指的是在一段时间内跟踪同一组 个体(individual)的数据。
• 它既有横截面的维度(n位个体),又有时间维度(T 个时期)。
0
:
0 ”。此检验
《计量经济学实验》教学大纲
计量经济学实验IIEconometrics II一、课程基本情况课程类别:专业方向课课程总学时:32实验总学时:4学分:2开课学期:第5学期课程性质:选修对应理论课程:计量经济学n适用专业:财务管理专业教材:陈强,计量经济学及Stata应用,高等教育出版社,2015开课单位:经济管理学院财务与会计系二、实验课程的教学目标和任务教学目标:通过本课程的学习,使学生了解经济数量分析实验课程在经济类本科专业课程体系中的地位,了解经济数量分析在经济学科的开展和实际工作中的作用。
能够建立并应用简单的计量经济学模型,并对现实经济活动进行分析和预测。
使学生具有进一步学习与应用计量经济学理论、方法与模型的基础和能力。
教学任务:(1)在实验开始前,组织学生认真阅读《实验指导书》,使学生明确所作实验工程的实验目的、实验要求完成的实验内容和实验原理。
(2)指导学生根据《实验指导书》所要求的实验步骤进行实验,必要时老师可进行演示。
(3)要求学生根据实验结果进行实验分析总结,认真填写《计量经济学》实验课程报告,并批阅评定成绩。
(4)引导学生根据个人兴趣和教师指导,通过实验教学,综合掌握计量模型的建立步骤、估计原理、检验内容、对模型进行应用,得到有价值的结论。
三、实验课程的内容和要求四、课程考核(1)实验报告的撰写要求:一、经济理论背景;二、指标选取和数据(要求附数据表); 三、实验过程1.先作包括全体解释变量的回归模型,对回归结果进行分析并检验可能存在的计量经济学问题。
2.如果存在多重共线性,首先解决;3.然后再处理异方差问题;4•最后处理自相关问题;四、对最终模型进行分析,并解释经济意义;五、就模型所反映的问题给出针对性的政策建议或结论。
(2)实验报告:1次(3)考核及成绩评定:平时成绩和实验报告撰写综合计算五、参考书目1.STATA在统计与计量分析中的应用,南开大学出版社;王群勇,2007;2.高级计量经济学及stata应用,高等教育出版社;陈强,2010,第1版。
第20 章 似不相关回归
如果出现以下两种情形之一,则 GLS 与单一方程 OLS 的 结果完全相同,使用 GLS 并不会提高效率。
7
(1)各方程的扰动项互不相关(参见习题)。 (2)每个方程包含的解释变量完全相同(证明参见附录)。 比如,向量自回归模型(VAR)中的每个方程包含完全相 同的解释变量,故使用单一方程 OLS 估计 VAR 就够了。
1
语成绩造成影响,故两个方程的扰动项应该是相关的。
20.2 似不相关回归的假定
yNi = NXi βNi + εNi (i = 1, 2, ", n)
T×1 T×Ki Ki×1 T×1
(20.1)
2
y ≡ ⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝N yyy#1n2 ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟ = ⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜ X0 1 X 2 % X 0 n
ε1ε′2 ε2ε′2 "
εnε′2
" " " "
ε1ε′n ε2ε′n "
εnε′n
⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟nT×nT
(20.3)
3
E(εi
ε
′
i
)
=
σ ii
IT
(20.4)
E(εitε js ) = ⎧⎪⎪⎨⎪⎪⎩σ0ij
t=s t≠s
(20.5)
E(εiε′j
)
=
σ ij
IT
(20.6)
βˆ SUR = (X′Ωˆ −1X)−1 X′Ωˆ −1y (20.12)
这就是“似不相关估计量”(Zellner,1962),记为 βˆSUR 。使 用 FGLS 后得到新的残差,可以再一次计算 Ωˆˆ ,不断迭代
第6 章 最大似然估计法
y
)
⎤⎥⎥⎥⎦⎫⎪⎪⎬⎪⎪⎭−1
。
第二种方法是,将期望算子忽略掉,即
18
An var(θˆ
ML
)
=
⎡⎢⎢⎢⎣−
∂
2
ln L(θˆ ML ∂θˆ ∂θˆ ′
;
y
)
⎤⎥⎥⎥⎦−1
。此方法被称为“观测信息矩阵”
(Observed Information Matrix,OIM)法。
第三种方法利用信息矩阵等式,用
7
最优 σ2 。
在 第 一 步 , 选 择 β 使 得 ln L(β, σ2) 最 大 , 这 等 价 于 让 (y − Xβ)′(y − Xβ) 最小。
βˆ ML = βˆ OLS = (X′X)−1 X′y (6.9)
在第二步,对 σ2 求导,
−
n 2
1 σ2
+
1 2σ 4
e′e
20
其中,K 为约束条件的个数(即为解释变量的个数)。 2.似然比检验(Likelihood Ratio Test,LR):
H0 Θ
图 6.4、无约束与有约束的参数空间
21
如果 H0 正确,则 ln L(βˆU )−ln L(βˆ R ) 不应该很大。在此例中,
βˆ R = β0 。LR 统计量为,
19
6.7 三类渐近等价的统计检验
对于线性回归模型,检验原假设 H0 : β = β0 ,其中 βK×1 为未 知参数,β0 已知,共有 K 个约束。
1.沃尔德检验(Wald Test):如果 H0 正确,则 (βˆU −β0) 的绝 对值不应该很大。沃尔德统计量为,
W ≡ (βˆU −β0 )′ ⎡⎢⎣Var(βˆU )⎤⎥⎦−1 (βˆU −β0 ) ⎯d⎯→ χ2 (K ) (6.18)
工具变量法(二):弱工具变量
工具变量法(二):弱工具变量世上没有完美的计量方法,因为所有的计量方法与模型均依赖于一定的前提假设。
因此,在估计完计量模型后,通常需要对模型的前提假设进行检验,称为“诊断性检验”(diagnostic checking)或“模型检验”(model checking)。
工具变量法也不例外。
工具变量法的成立依赖于有效的工具变量(valid instruments),即所使用的工具变量须满足相关性(与内生解释变量相关)与外生性(与扰动项不相关)。
工具变量的相关性(Instrument Relevance)在大样本下,2SLS为一致估计。
但对于大多数实践中的有限样本(finite sample),2SLS估计量依然存在偏差(bias),并不以真实参数为其分布的中心,即而且,如果工具变量与内生变量的相关性较弱,则 2SLS 的偏差会变得更为严重。
直观来看,2SLS 的基本思想是通过外生的工具变量,从内生变量中分离出一部分外生变动(exogenous variations),以获得一致估计。
如果工具变量与内生变量的相关性很弱,则通过工具变量分离出的内生变量之外生变动仅包含很少的信息。
因此,利用这些少量信息进行的工具变量法估计就不准确,即使样本容量很大也很难收敛到真实的参数值。
这种工具变量称为“弱工具变量”(weak instruments)。
弱工具变量的后果弱工具变量的后果类似于样本容量过小,会导致 2SLS 的小样本性质变得很差,而 2SLS 的大样本分布也可能离正态分布相去甚远,致使基于大样本理论的统计推断失效。
下面通过蒙特卡洛模拟(Monte Carlo simulation)来直观地考察弱工具变量的后果。
考虑最简单的一元回归模型,假设其数据生成过程(data generating process)为:其中,为内生变量,与扰动项相关;而的真实系数为 2。
假设样本容量为10,000,并使用工具变量进行2SLS 回归。
高级计量经济学I教学大纲
高级计量经济学I教学大纲(2018年·秋季学期·经资院)授课教师:周晔馨 zhouyexin@教学对象:博士生、硕士生先修课程:有微积分、线性代数、概率论基础知识学时/学分:48学时/3学分教学方式:PPT+板书推导主要教材:1.Colin Cameron, Pravin K. Trivedi, Microeconometrics: Methods and Applications;2.陈强,高级计量经济学及Stata应用(第二版,研究生用),高等教育出版社,2014;3.J. Stock, M. Watson, Introduction to Econometrics.参考书籍:1.Joshua D. Angrist, Jörn-Steffen Pischke, Mostly Harmless Econometrics: AnEmpiricist’s Companion, 基本无害的计量经济学(MHE);2.伍德里奇,计量经济学导论:现代观点;3.L. Hamilton,应用Stata做统计分析;4.Angrist and Pischke,Mastering Econometrics;5.W. Green,Econometric Analysis.课程板块:共16次课,其中上课14次,半期考试1次,期末考试1次。
助教课:上机和作业讲解大约6次。
1、导论+OLS(多元回归+小样本理论+大样本理论)2、古典假定的违反,模型设定和数据问题3、分位数回归4、工具变量与内生性5、国庆6、离散因变量:二值选择模型Logit/Probit+多值选择模型,有序因变量7、受限因变量1:断尾回归Truncated、归并回归Tobit8、专题:如何做规范的实证研究9、半期闭卷考试10、受限因变量2:样本选择模型Heckit11、因果推断1:实验,处理效应模型PSM12、因果推断2:双重差分DID13、因果推断3:断点回归RD14、面板数据回归15、论文报告与点评16、期末闭卷考试成绩:总成绩由以下三部分组成:1、平时成绩(20%);2、期中考试成绩(纸考含上机题,30%);3、期末考试成绩(论文分享与点评,5%;纸考含上机题,45%)。
PPT-第12章-面板数据-计量经济学及Stata应用
如果仅考虑个体固定效应,称为“单向固定效应”(One-way FE)。
有时为节省参数(比如,时间维度T 较大),可引入时间趋势项, 以替代上述(T 1)个时间虚拟变量:
yit xit zi t ui it (12.12)
xit 可以随个体及时间而变(time-varying)。
扰动项由(ui it ) 两部分构成,称为“复合扰动项”(composite
error term)。
不可观测的随机变量ui 是代表个体异质性的截距项,即“个体效 应”(individual effects)。
9
it 为随个体与时间而改变的扰动项,称为“idiosyncratic error”。 一般假设{it}为独立同分布,且与ui 不相关。
8
这种模型称为“个体效应模型”(individual-specific effects model):
yit xit zi ui it (i 1, ,n; t 1, ,T ) (12.1)
zi为不随时间而变(time invariant)的个体特征( zit zi , t ),比如性 别;
反之,则称为“非平衡面板”(unbalanced panel)。主要关注平衡 面板,但在本章第 11 节讨论非平衡面板。
3
面板数据的主要优点如下。
(1) 有助于解决遗漏变量问题: 遗漏变量常由不可观测的个体差异或“异质性”(heterogeneity) 造成(比如个体能力)。 如果个体差异“不随时间而改变”(time invariant),则面板数据 提供了解决遗漏变量问题的又一利器。
如果T 较大,n较小,则称为“长面板”(long panel)。
宏微观经济学、计量经济学、国际贸易学相关书单
宏微观经济学、计量经济学、国际贸易学相关书单注:黄色标注的书表示在文件夹中可以找到电子版微观经济学:中级:范里安《微观经济学—现代观点》三联书店第2版拓展阅读:平新乔《微观经济学十八讲》高级:马斯克莱尔等(MWG)《微观经济学》(中英文电子版及习题答案)吉本斯《博弈论基础》(中英文电子版电子版)拓展阅读:Myerson《博弈论:矛盾冲突分析》(中英文电子版)宏观经济学:中高级:何樟勇、宋铮《高级宏观经济学》罗默《高级宏观经济学》(上财第2版、商务印书社、原版,中英文电子版)经济理论方面拓展阅读:布兰查德《高级宏观经济学》(中英文电子版)罗伯特·巴罗《宏观经济学》第5版(电子版)斯蒂芬·威廉森《宏观经济学》第3版(电子版)斯蒂芬马丁《高级产业经济学》第2版(电子版)Daron Acemoglu《An Introduction to Modern Economic Growth》数理工具方面参考书目:蒋中一《数理经济学基本方法》(中文电子版)蒋中一《动态最优化基础》(中文电子版)Kamien & Schwartz《Dynamic Optimization》(Second Edition)(英文电子版)龚六堂、苗建军《经济学中的优化方法》第2版计量经济学:中级:Gujarati, D.N. Basic Econometrics, 4th edition.(英文电子版)古扎拉蒂《计量经济学》第3版,人大出版社,2002年版高级:Greene W.H.《Econometric Analysis》,5th edition.应用参考书目:陈传波《Stata十八讲》(电子版):此书适用于Stata入门使用。
陈强《高级计量经济学及Stata应用》(电子版):此书适用于大样本数据理论分析和Stata操作应用。
Angrist & Pischke《Mostly Harmless Econometrics: An Empiricist’s Companion》(英文电子版):此书偏向回归中一些繁琐问题的分析。
第7讲异方差计量经济学及Stata应用
© 陈强,2015年,《计量经济学及Stata应用》,高等教育出版社。
第7章 异方差现实的数据千奇百怪,常不符合古典模型的某些假定。
从本章开始,逐步放松古典模型的各项假定。
7.1 异方差的后果“条件异方差”(conditional heteroskedasticity),简称“异方差”(heteroskedasticity),是违背球型扰动项假设的一种情形,即条件εX依赖于i,而不是常数2σ。
方差Var(|)i在异方差的情况下:(1) OLS 估计量依然无偏、一致且渐近正态。
因为在证明这些性质时,并未用到“同方差”的假定。
(2) OLS 估计量方差ˆVar(|)βX 的表达式不再是21()σ-'X X ,因为2Var(|)σ≠εX I 。
使用普通标准误的t 检验、F 检验失效。
(3) 高斯-马尔可夫定理不再成立,OLS 不再是BLUE(最佳线性无偏估计)。
在异方差的情况下,本章介绍的“加权最小二乘法”才是BLUE 。
为直观理解OLS 不是BLUE ,考虑一元回归i i i y x αβε=++。
假设Var(|)i εX 是解释变量i x 的增函数,即i x 越大则Var(|)i εX 越大,参见图7.1。
图7.1 异方差示意图OLS 回归线在i x 较小时可以较精确地估计,而在i x 较大时则难以准确估计。
方差较大的数据包含的信息量较小,但OLS却对所有数据等量齐观进行处理;故异方差的存在使得OLS的效率降低。
“加权最小二乘法”(Weighted Least Square,WLS)通过对不同数据所包含信息量的不同进行相应的处理以提高估计效率。
比如,给予信息量大的数据更大的权重。
计量经济学所指的“异方差”都是“条件异方差”,而非“无条件异方差”。
比如,大样本理论要求样本数据为平稳过程,而平稳过程的方差不变。
大样本理论是否已经假设同方差?关键要区分无条件方差(unconditional variance)与条件方差(conditional variance)。
第5章-大样本OLS高级计量经济学及Stata应用(第二版)课件
9
图 5.3 依分布收敛
10
d 如果 x 为正态分布,而 xn x ,则称 xn n1 为“渐近正态”
(asymptotically normal)。 依分布收敛意味着,两个随机变量的概率密度长得越来越像。 “依概率收敛”比“依分布收敛”更强(前者是后者的充分条件):
p d x ” “ xn x” “ xn
2
2
上式的交叉项为
ˆ E( ˆ ) E( ˆ ) E( ˆ ) E ˆ E( ˆ ) E( ˆ) 0 0 E
均方误差最小化,可视为在“估计量方差”与“偏差”之间进 行权衡(trade-off)。 多维情形的类似结论:
d z ,其中 z ~ N (0, 1) , 例:假设 xn d d 2 2 则 xn z 2 ,其中 z 2 ~ (1) ,即 xn (1) (因为平方是连续函数)
渐近标准正态的平方服从渐近 (1) 分布。
12
5.3 大数定律与中心极限定理 1.弱大数定律(Weak Law of Large Numbers) 假定 xn n1为独立同分布的随机序列, 且 E( x1 ) , Var( x1 ) 2 存 1 n p 。 在,则样本均值 xn i 1 xi n
小样本理论假定扰动项为正态分布,大样本理论无此限制。 (2) 小样本的精确分布(exact distribution)难推导。大样本的渐近 分布较易推导。 (3) 大样本理论要求样本容量较大,至少 n 30 ,最好 100 以上。
2
5.2 随机收敛 1.确定性序列的收敛 定义 确定性序列an n1 a1 , a2 , a3 ,“收敛”(converges)于常
第29章空间计量经济学
空间权重矩阵考虑的是一阶邻居,还可以考虑二阶邻居,即邻 居的邻居,可用矩阵W 2 来表示。 矩阵W 2 的主对角线上元素一般不再为 0,这意味着邻居的邻居 也包括自己。 实 践 中 , 有 时 对 空 间 权 重 矩 阵 进 行 “ 行 标 准 化 ” (row ij )除以其所在行元 standardization),即将矩阵中的每个元素(记为 w 素之和,以保证每行元素之和为 1:
i 1 j 1 n n
I
wij ( xi x )( x j x )
i 1 j 1 2 ( x x ) i i 1 n
n
n
18
莫兰指数 I 的取值一般介于-1 到 1 之间,大于 0 表示正自相关, 即高值与高值相邻、低值与低值相邻;小于 0 表示负自相关,即 高值与低值相邻。 如果莫兰指数 I 接近于 0,则表明空间分布是随机的,不存在空 间自相关。 莫兰指数 I 可视为观测值与其空间滞后(spatial lag)的相关系数。 如果将观测值与其空间滞后画成散点图,称为“莫兰散点图” (Moran scatterplot),则莫兰指数 I 就是该散点图回归线的斜率。 (即不存在空间自相关)。 考虑原假设 “ H 0 : Cov( xi , x j ) 0, i j ”
1
根据 Tobler (1970), “所有事物都与其他事物相关联,但较近的 事物比较远的事物更关联”(Everything is related to everything else, but near things are more related than distant things)。 这被称为“地理学第一定律”(First Law of Geography)。 各省之间的距离信息并不难获得,比如是否相邻,直线距离或 运输距离。 将各省的变量数据,再加上各省的位置信息(或相互距离),即可 得到“空间数据”(spatial data 或 areal data)。 研究如何处理空间数据的计量经济学分支,称为“空间计量经 济学”(spatial econometrics)。
第24章联立方程模型
3
yt1
yt 2
11 12 22 21 ytM M1 M 2 11 xtK 21 K1
xt1
xt 2
12 22
K 2
1M 2M MM 1M 2M t1 t 2 tM KM
0 0
故可用 OLS 来估计第二个方程。 在 第 三 个 方 程 中 , 内 生 解 释 变 量 为 ( y1 , y2 ) , 而 且 Cov( y1 , 3 ) Cov( y2 , 3 ) 0 ,故也可用 OLS 来估计。 2.间接最小二乘法 在恰好识别的情况下,可先用 OLS 来一致地估计简化式参数, 然后通过结构式参数与简化式参数的关系来求解结构式参数,称 为“间接最小二乘法”(Indirect Least Square,简记 ILS)。
第一个方程不含内生解释变量,可用 OLS 得到一致估计。
16
在第二个方程中,唯一的内生解释变量为 y1 ,且与扰动项不相关:
Cov( y1 , 2 ) Cov( x1 1 , 2 ) Cov( x1 , 2 ) Cov(1 , 2 ) 0
24.2 联立方程模型的识别 在对模型的总体参数进行估计之前,其参数必须“可识别” (identified)。 如果一个总体参数可识别,则该参数的任意两个不同取值,都 会在随机样本中显示出系统差异,即如果样本容量足够大,则应 该能够在统计意义上区分这两个不同的参数值。
8
反之,如果无论多大的样本都区分不开,即由不同参数值的总 体产生的观测数据在统计意义上是一样的,则该参数“不可识别” (unidentified)。 例 考虑以下回归模型: