潘省初计量经济学第3版ets9.pptx
合集下载
计量经济学 第三版 1-3章
1-24
相关系数定义如下:
XZ corr(X,Z) = = rXZ var( X ) var( Z ) X Z
cov( X , Z )
• 不受单位的影响 • –1 ≤ corr(X,Z) ≤ 1 • corr(X,Z) = 1意味着完全正线性相关 • corr(X,Z) = –1意味着完全负线性相关 • corr(X,Z) = 0 意味着没有线性关系
1-14
接下来…
• 熟悉估计、假设检验、臵信区间的原理 • 这些概念将直接应用到回归分析中 • 在学习回归分析之前,我们首先回顾关于估计、假 设检验、臵信区间的理论: –为什么会使用这些理论? –回顾统计学和计量经济学的知识基础
Copyright © 2011 Pearson Addison-Wesley. All rights reserved.
计量经济学简介
Chapters 1, 2 and 3
经济数据的统计分析
Copyright © 2011 Pearson Addison-Wesley. All rights reserved.
课程简述
• 经济理论给出了经济变量间的重要关系,却往往不 能对关系的大小进行定量分析。例如:
–减少班级规模对学生成绩的定量影响有多大? –增加一年教育年限如何影响收入? –香烟的价格弹性有多大? –利率提高1%对产出增长有什么影响? –环境改善对房价有什么影响?
Copyright © 2011 Pearson Addison-Wesley. All rights reserved.
1-25
相关系数衡量线性相关程度
Copyright © 2011 Pearson Addison-Wesley. All rights reserved.
完整的计量经济学课件 计量经济学课件第九章分布滞后和自回归模型
如:消费函数
通常认为, 通常认为 , 本期的消费除了受本期的收入影响 之外,还受前1 或前2期收入的影响: 之外,还受前1期,或前2期收入的影响: Ct=β0+β1Yt+β2Yt-1+β3Yt-2+t 滞后变量。 Yt-1,Yt-2为滞后变量。 再如:新增投资对生产效率和产出的作业不会立即 再如: 体现出来, 体现出来,生产效率和产出除了受到当期投资的影 还受到上一期甚至前很多期的投资积累的影响。 响,还受到上一期甚至前很多期的投资积累的影响。 价格变化对供给和需求的影响也同样都有类似的滞 后效应。 后效应。如蛛网效应中农产品的供给受到前一期的 价格的影响。 价格的影响。
局限性:1、运用阿尔蒙多项式法必须先知道分 局限性: 、 布滞后模型的滞后长度,因为X变量变换为 变量时, 变量变换为Z变量时 布滞后模型的滞后长度,因为 变量变换为 变量时, K必须是已知的;2、滞后效应的模式,对应于 , 必须是已知的; 、滞后效应的模式,对应于m, 必须是已知的 也必须预先知道,这就很难避免判断的主观偏差。 也必须预先知道,这就很难避免判断的主观偏差。
当m=2时,即 时
β i = a 0 + a1i + a 2 i
2
阿尔蒙多项式法
常见的滞后参数变化模式的m在1到4之间。 常见的滞后参数变化模式的 在 到 之间。 之间 确定了滞后参数多项式以后, 确定了滞后参数多项式以后,将这些多项式代入分 布滞后模型进行变换。 布滞后模型进行变换。 β i = a 0 + a1i + a 2 i 2 的情况为例, 以m=2的情况为例,把 = 的情况为例 代入前述分布滞后模型, 代入前述分布滞后模型,可得
现式估计法
优点: 优点:易于掌握 缺点: 缺点: 首先,滞后长度的确定没有明确的标准、根据; 首先,滞后长度的确定没有明确的标准、根据; 其次,引进较多期滞后会降低自由度, 其次,引进较多期滞后会降低自由度,回归分 析的有效性会降低; 析的有效性会降低; 第三, 第三,滞后变量之间的相关性可能引发共线性 问题; 问题;
计量经济学课件PPT3
¼ò µ¥ µØ Ëæ × Å ½â ÊÍ ± ä Á¿ ¸ö Êý µÄ Ôö ¼Ó ¶ø Ôö ´ó £¬ µ±± ä Á¿ ¸ö Êý Ôö ¼Ó µ½ Ò» ¶¨³Ì
¶È ʱ£¬ Ëü ½« ¿ª ʼ Ï ½µ ¬£ Èç ͼ Ëù ʾ ¡£
r2
R2
1
1
K ± ä Á¿ ¸ö Êý
k Ôö ¼Ó ʹ µÃ r 2 Ôö ¼Ó £¬ ´Ó ¶ø R2 Ôö ¼Ó k Ôö ¼Ó £¬ ʹ µÃ R2 ¼õ ÉÙ · ¶ Χº£ R2 £ r 2 £¬ µ± n ® ¥ £¬ R2 ®r 2
K ± ä Á¿ ¸ö Êý
返回
12
二、方程显著性检验(F检验)
依据假设检验的原理和步骤,把模型作为一个 整体进行假设检验,检验模型中被解释变量 与解释变量之间的线性关系是否显著的成立。
s 2 1 n k 1 1 R TSS
r 2
sT
n 1
R2
1
RSS TSS
n
n
1 k 1
1
(1
r2)
n
n
1 k 1
11
引入调整可决系数的作用
Ìí ¼Ó ½â ÊÍ ± ä Á¿ £¬ Ôò r 2 Ôö ¼Ó ¡£ µ÷Õû ¿É ¾ö ϵ Êý R2 ¿¼ ÂÇ ÁË × Ô ÓÉ ¶È £¬ Æä ²¢ ²»
F显著性性检验检验模型总体线性关系的显著性。 两者有如上的关系。
拟合优度是感性的,不宜苛求,应以F检验为准。 但F检验它只是把模型作为一个整体进行了检验, 还应对模型中的各个变量进行检验,决定它们是 否应当保留在模型之中。
16
F检验的步骤
潘省初计量经济学第3版
β 0 X 2t β1 X 2t X 1t ...... β K X 2t X Kt X 2tYt
......
......
......
......
β 0 X kt β1
X kt X 1t ...... β K
X Kt 2
X ktYt
按矩阵形式,上述方程组可表示为:
X'
1 Y1
X 1n
Y2
... ...
X
Kn
Yn
Y
即 ( X ' X )β X 'Y
β ( X X )1 X Y
14
三. 最小二乘估计量 β的性质 我们的模型为 Y X u
估计式为
Yˆ
Xβ
1.β 的均值
β ( X X )1 X Y
( X X )1 X ( Xβ u)
( X X )1 X Xβ ( X X )1 X u
收入不变的情况下,价格指数每上升一个点, 食品消费支出减少7.39亿元(0.739个billion)
3
例2:
Ct
β 1
β 2 Dt
β 3 Lt
ut
其中,Ct=消费,Dt=居民可支配收入 Lt=居民拥有的流动资产水平
β2的含义是,在流动资产不变的情况下,可支配收入变动 一个单位对消费额的影响。这是收入对消费额的直接影响。
为求Var( β ),我们考虑
E
β
β
β
β
β0 β0
E
β1 β1
...
β
0
β
0
β1 β1
...
βK
βK
β
K
βK
17
Var(β 0 )
【《计量经济学》(第三版)课件】计量三11
经济周期研究,经济结构研究,总需求、总消费、总投资规律,货 币供求和通货膨胀影响因素,人口和就业趋势、波动研究,一般均 衡研究等。 微观经济:厂商和产品供给、需求和价格弹性研究,消费者行为规律, 效用函数、边际消费倾向等。 国际经济:进出口总量、总额、弹性和贸易条件分析等。
犯罪因素、规律研究; 政治选举等预测分析; 流行规律性研究等
10
增长特征和模型函数
• AK模型:
y Ak
• 收敛性内生增长模型:
• CES模型: •
y Ak Bk
1
y A[a(bk) (1 a)(1 b) ]
11
(三)常用的多元函数
• 线性函数
K
Y i X i i 1
• 乘积函数 •
K或
Y A
X i i
i 1
K
i
Y A Xi Xi0
时间序列分析方法论的选择,结构模型和概率模型的竞争。 • 联立方程组模型和向量自回归模型(VAR)之间也有争论。
Sims(1980)认为联立方程组主观设定的结构方程不可信,建议使用 避免主观约束的向量自回归模型。大量研究表明VAR的预测效果优 于联立方程组模型。 • 面板数据分析用固定效应还是随机效应模型也有不同意见,一般认 为应该根据抽样方法来判断,凡是同样总体的重复抽样是固定效应 问题,而有新个体加入的抽样数据则有随机效应。但仅考虑抽样方 法和样本性质会忽略异质性本身的经济意义。 • 在实证分析中对模型类型合理性的检验判断非常重要。
• 对需求规律的计量经济分析,有多种方法和模型,包括 时间序列分析、需求因素的因果关系模型分析等。
• 一般地,可以根据所研究商品的性质、人们的消费心理 特点或规律等,初步确定影响需求的因素和相关模型。
犯罪因素、规律研究; 政治选举等预测分析; 流行规律性研究等
10
增长特征和模型函数
• AK模型:
y Ak
• 收敛性内生增长模型:
• CES模型: •
y Ak Bk
1
y A[a(bk) (1 a)(1 b) ]
11
(三)常用的多元函数
• 线性函数
K
Y i X i i 1
• 乘积函数 •
K或
Y A
X i i
i 1
K
i
Y A Xi Xi0
时间序列分析方法论的选择,结构模型和概率模型的竞争。 • 联立方程组模型和向量自回归模型(VAR)之间也有争论。
Sims(1980)认为联立方程组主观设定的结构方程不可信,建议使用 避免主观约束的向量自回归模型。大量研究表明VAR的预测效果优 于联立方程组模型。 • 面板数据分析用固定效应还是随机效应模型也有不同意见,一般认 为应该根据抽样方法来判断,凡是同样总体的重复抽样是固定效应 问题,而有新个体加入的抽样数据则有随机效应。但仅考虑抽样方 法和样本性质会忽略异质性本身的经济意义。 • 在实证分析中对模型类型合理性的检验判断非常重要。
• 对需求规律的计量经济分析,有多种方法和模型,包括 时间序列分析、需求因素的因果关系模型分析等。
• 一般地,可以根据所研究商品的性质、人们的消费心理 特点或规律等,初步确定影响需求的因素和相关模型。
【《计量经济学》(第三版)课件】计量三11
• 对需求规律的计量经济分析,有多种方法和模型,包括 时间序列分析、需求因素的因果关系模型分析等。
• 一般地,可以根据所研究商品的性质、人们的消费心理 特点或规律等,初步确定影响需求的因素和相关模型。
18
• 影响需求的主要因素:收入和预算、储蓄和资产、 价格和物价指数、替代品价格、互补品价格、通 货膨胀和货币错觉、价格和收入预期、时间变量、 季节性影响、投机心理、消费习惯、拥有量和普 及率、商品属性、宣传和广告。(微观、宏观有 所不同) • 关于消费需求、行为的理论:戈森定律、绝对收 入学说、相对收入学说;当前收入和永久收入、 流动资产说。总需求函数研究特别重要。
第11章
计量经济分析建模初步
1
第一节 研究对象和模型类型选择 第二节 模型结构设定 第三节 建模示例
2
第一节 研究对象和模型类型选择
一、计量分析的适用问题 二、模型类型的选择 三、模型类型选择背后的方法论意义
3
一、计量分析的适用问题
宏观微观、静态动态、预测和分析、局部规律和一般规律
几乎所有经济研究领域: 宏观经济:总量生产函数研究,增长因素分析和技术进步贡献度研究,
(二)计算出二阶矩、二阶矩矩阵 和参数估计值
• 两变量线性回归模型
Xi X Yi Y XiYi nXY
b i
Xi X 2
i
X
2 i
nX
2
i
i
a Y bX
• 没有常数项的两变量模型
X iYi
b i
X
2 i
• 多元线性回归模型
i
B XX1 XY 28
(三)计算残差及相关统计量
38
10
增长特征和模型函数
• AK模型:
• 一般地,可以根据所研究商品的性质、人们的消费心理 特点或规律等,初步确定影响需求的因素和相关模型。
18
• 影响需求的主要因素:收入和预算、储蓄和资产、 价格和物价指数、替代品价格、互补品价格、通 货膨胀和货币错觉、价格和收入预期、时间变量、 季节性影响、投机心理、消费习惯、拥有量和普 及率、商品属性、宣传和广告。(微观、宏观有 所不同) • 关于消费需求、行为的理论:戈森定律、绝对收 入学说、相对收入学说;当前收入和永久收入、 流动资产说。总需求函数研究特别重要。
第11章
计量经济分析建模初步
1
第一节 研究对象和模型类型选择 第二节 模型结构设定 第三节 建模示例
2
第一节 研究对象和模型类型选择
一、计量分析的适用问题 二、模型类型的选择 三、模型类型选择背后的方法论意义
3
一、计量分析的适用问题
宏观微观、静态动态、预测和分析、局部规律和一般规律
几乎所有经济研究领域: 宏观经济:总量生产函数研究,增长因素分析和技术进步贡献度研究,
(二)计算出二阶矩、二阶矩矩阵 和参数估计值
• 两变量线性回归模型
Xi X Yi Y XiYi nXY
b i
Xi X 2
i
X
2 i
nX
2
i
i
a Y bX
• 没有常数项的两变量模型
X iYi
b i
X
2 i
• 多元线性回归模型
i
B XX1 XY 28
(三)计算残差及相关统计量
38
10
增长特征和模型函数
• AK模型:
应用计量经济学第9章PPT课件
第9章
序列相关性
Slides by Niels-Hugo Blunch Washington and Lee University
纯序列相关性
• 纯序列相关性破坏了古典假设 IV,古典假设 IV保证了在正确设定 的方程中各误差项观测值之间没有相关性
• 最被广泛假设的序列相关性是一阶序列相关性,在一阶序列相关 性中,随机误差项的当期值是上一期值的函数:
929neweywest标准误当然并丌是所有修正纯序列相关性的方法都广义最小二乘法glsneweywest标准误通过修正标准误来修正序列相关性而丌改变估计的回归系数如果序列相关性仅仅影响标准误而丌影响估计系数的无偏性那么修正序列相关性时调整估计系数的标准误即可而没有必要调整系数本身的估计值如果紧急医疗系统采用包括持续胸部按压的综合救治干预对于院外心脏骤停患者可以考虑在综合救治干预中使用被动通气技术
• 这也许是已知的最好的GLS方法
• 这是一种两步法,首先将估计出 ρ ,然后,使用该估计值进行GLS估计
• 这两步的具体步骤:
1. 对怀疑存在序列相关性的模型进行OLS估计,获得残差序列后,再估计方程:
et = ρet–1 + ut
(9.21)
此设处 的随et机是误对差怀项疑存在序列相关性的模型进行OLS估计后获得的鳌头, ut 是服从古典假
20
Figure 9.6 单边 Durbin–Watson
d 检验的例子
21
序列相关性的补救
• 修正自相关的第一步就是仔细检查可能引起不纯的序列相关性的模型设 定误差
– 函数形式正确吗? – 确定没有遗漏的变量了吗? – 只有仔细检查了模型的设定后,才有必要对纯序列相关性进行检验并修正 • 有两种主要的修正序列相关性的方法: 1. 广义最小二乘法(GLS:Generalized Least Squares) 2. Newey-West 标准误
序列相关性
Slides by Niels-Hugo Blunch Washington and Lee University
纯序列相关性
• 纯序列相关性破坏了古典假设 IV,古典假设 IV保证了在正确设定 的方程中各误差项观测值之间没有相关性
• 最被广泛假设的序列相关性是一阶序列相关性,在一阶序列相关 性中,随机误差项的当期值是上一期值的函数:
929neweywest标准误当然并丌是所有修正纯序列相关性的方法都广义最小二乘法glsneweywest标准误通过修正标准误来修正序列相关性而丌改变估计的回归系数如果序列相关性仅仅影响标准误而丌影响估计系数的无偏性那么修正序列相关性时调整估计系数的标准误即可而没有必要调整系数本身的估计值如果紧急医疗系统采用包括持续胸部按压的综合救治干预对于院外心脏骤停患者可以考虑在综合救治干预中使用被动通气技术
• 这也许是已知的最好的GLS方法
• 这是一种两步法,首先将估计出 ρ ,然后,使用该估计值进行GLS估计
• 这两步的具体步骤:
1. 对怀疑存在序列相关性的模型进行OLS估计,获得残差序列后,再估计方程:
et = ρet–1 + ut
(9.21)
此设处 的随et机是误对差怀项疑存在序列相关性的模型进行OLS估计后获得的鳌头, ut 是服从古典假
20
Figure 9.6 单边 Durbin–Watson
d 检验的例子
21
序列相关性的补救
• 修正自相关的第一步就是仔细检查可能引起不纯的序列相关性的模型设 定误差
– 函数形式正确吗? – 确定没有遗漏的变量了吗? – 只有仔细检查了模型的设定后,才有必要对纯序列相关性进行检验并修正 • 有两种主要的修正序列相关性的方法: 1. 广义最小二乘法(GLS:Generalized Least Squares) 2. Newey-West 标准误
计量经济学第九章完整课件
回归模型的应用案例
1 2 3
消费物价指数预测
通过建立回归模型,利用历史数据和相关解释变 量预测未来消费物价指数,为货币政策制定提供 依据。
股票价格预测
利用回归模型分析历史股票价格和相关解释变量 ,预测未来股票价格走势,为投资者提供决策参 考。
经济增长预测
通过建立回归模型,利用历史数据和相关解释变 量预测未来经济增长趋势,为政府和企业制定发 展计划提供依据。
多元线性回归模型
总结词
多元线性回归模型是一种扩展的回归模型,允许我们同时考虑多个自变量对因变 量的影响。
详细描述
多元线性回归模型通过引入多个自变量来扩展基本的回归模型。这种方法能够更 全面地描述因变量和自变量之间的关系,并提供更准确的预测。在经济学、金融 学和其他领域中,多元线性回归模型被广泛用于研究各种现象。
合度越好。
变量的显著性检验
t检验
用于检验单个解释变量对被解释 变量的影响是否显著,通过计算t 统计量并进行假设检验得出结论
。
F检验
用于检验多个解释变量整体上对被 解释变量的影响是否显著,通过计 算F统计量并进行假设检验得出结 论。
z检验
用于检验某个解释变量在两个或多 个总体中是否存在显著差异,通过 计算z统计量并进行假设检验得出结 论。
PART 02
回归模型的检验
模型的拟合度检验
决定系数(R-squared):衡量 模型解释变量变异程度的指标, 值越接近1表示模型拟合度越好
。
调整决定系数(Adjusted Rsquared):考虑了模型中自变 量的数量对R-squared的影响, 值越接近1表示模型拟合度越好
。
均方误差(Mean Squared Error,MSE):衡量模型预测 误差的指标,值越小表示模型拟
计量经济学第三版-潘省初-第6章-动态经济模型-自回归模型和分布滞后模型
各系数在1%显著水平下都显著异于0。
从回归结果可知,(1-λ)的估计值为0.70,因而 调整系数λ的估计值为0.30,即调整速度为0.30。由 于Πt的系数是γλ的估计值,除以0.30,则得到长 期派息率(γ)的估计值为0.50。
24
二. 、适应预期模型
1、在模型中考虑预期的重要性 预期(expectation)的构模往往是应用经济学家 最重要和最困难的任务,在宏观经济学中更是如此。 投资、储蓄等都是对有关未来的预期很敏感的。如 果政府实施一项扩张政策,这将影响工商界人士有 关未来经济总状况的预期,特别是关于盈利能力的 预期,因而影响他们的投资计划。 例如,如果存在很可观的失业,则政府支出增加 被认为是有益的,并将刺激投资。另一方面,如果 经济正接近充分就业,则政府的扩张政策被认为将 导致通货膨胀,结果是工商界的信心受挫,投资下 降。
Dt*=γΠt
而实际股息服从部分调整机制
Dt (Dt* Dt1 ) U t
其中Ut为扰动项。因此
Dt Dt1 (Dt* Dt1 ) Ut
t Dt1 Ut
23
即 Dt t (1 )Dt1 Ut
使用美国公司部门1918—1941年数据,得到如下回 归结果:
Dˆ t 352.3 0.15t 0.70Dt1
Hale Waihona Puke Xe tXe t 1
(Xt
X
e t 1
)
0 1
(8)
26
(8)式可写成
X
e t
Xt
(1
)
X
e t 1
0 1
(9)
上式表明,X的预期值是其当前实际值和先前预期 值的加权平均。γ的值越大,预期值向X的实际发 生值调整的速度越快。
从回归结果可知,(1-λ)的估计值为0.70,因而 调整系数λ的估计值为0.30,即调整速度为0.30。由 于Πt的系数是γλ的估计值,除以0.30,则得到长 期派息率(γ)的估计值为0.50。
24
二. 、适应预期模型
1、在模型中考虑预期的重要性 预期(expectation)的构模往往是应用经济学家 最重要和最困难的任务,在宏观经济学中更是如此。 投资、储蓄等都是对有关未来的预期很敏感的。如 果政府实施一项扩张政策,这将影响工商界人士有 关未来经济总状况的预期,特别是关于盈利能力的 预期,因而影响他们的投资计划。 例如,如果存在很可观的失业,则政府支出增加 被认为是有益的,并将刺激投资。另一方面,如果 经济正接近充分就业,则政府的扩张政策被认为将 导致通货膨胀,结果是工商界的信心受挫,投资下 降。
Dt*=γΠt
而实际股息服从部分调整机制
Dt (Dt* Dt1 ) U t
其中Ut为扰动项。因此
Dt Dt1 (Dt* Dt1 ) Ut
t Dt1 Ut
23
即 Dt t (1 )Dt1 Ut
使用美国公司部门1918—1941年数据,得到如下回 归结果:
Dˆ t 352.3 0.15t 0.70Dt1
Hale Waihona Puke Xe tXe t 1
(Xt
X
e t 1
)
0 1
(8)
26
(8)式可写成
X
e t
Xt
(1
)
X
e t 1
0 1
(9)
上式表明,X的预期值是其当前实际值和先前预期 值的加权平均。γ的值越大,预期值向X的实际发 生值调整的速度越快。
计量经济学第三章完整课件
i 1
i 1
n
2
(Yi (ˆ0 ˆ1 X 1i ˆ2 X 2i ˆk X ki ))
i 1
于是得到关于待估参数估计值的正规方程组:
((ˆˆ00(ˆ0ˆˆ11XX1ˆ1i1i X1ˆiˆ22i XXˆ222ii
ki
ˆ 0 ˆ1 ˆ k
1 X 11 X k1
1 X 12 X k2
1 Y1
X 1n Y2
X kn
Yn
即
(XX)βˆ XY
或者说j给出了Xj的单位变化对Y均值的“直
接”或“净”(不含其他变量)影响。
总体回归模型n个随机方程的矩阵表达式为
Y Xβ μ
其中Biblioteka 1 X 11 X 1 X 12
1 X 1n
X 21 X 22
X 2n
X k1
X
k
2
X
kn
n( k 1)
也被称为总体回归函数的随机表达形式。它 的 非随机表达式为:
E(Yi | X1i , X 2i , X ki ) 0 1 X1i 2 X 2i k X ki
方程表示:各变量X值固定时Y的平均响应。
j也被称为偏回归系数,表示在其他解释变
量保持不变的情况下,Xj每变化1个单位时,Y 的均值E(Y)的变化;
Cov( X ji , i ) 0
j 1,2, k
假设4,随机项满足正态分布
i ~ N (0, 2 )
上述假设的矩阵符号表示 式:
假设1,n(k+1)矩阵X是非随机的,且X的秩=k+1,
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
横截面时间序列混合数据则包含不同横截面个体不 同时期的数据,或者说,混合数据包含既跨越时间又 跨越空间的数据。
如果混合数据包含的观测值来自同一批地区、公 司、人员或其它横截面个体的不同时期数据,则此 类混合数据称为面板数据(panel data)。
面板数据通常比非面板混合数据更有用,这是因 为面板数据中的地区、公司、人员等横截面个体在 各时期中一直保持不变,这使得我们更易于对随着 时间的推移所发生的变动进行比较。
我们将基于面板数据的回归模型称为面板数据模 型(panel data model)。面板数据模型正在得到日 益广泛的应用,文献也很多。限于篇幅,我们在这 里只能做一个入门性的介绍。需要深入研究的读者, 请参阅有关参考文献。
Baltagi, B. H.(2001),Econometric Analysis of Panel data, (Wiley: Chichester)
Yit 0 1EMPit 2OTM it uit
i 1, 2,3, 4
(9.5)
t 1980,1981,......2000
这里每个变量的观测值个数都是84。我们用表9 -1中全部数据估计此方程,结果如下:
Yˆit 14, 040.10 86.74EMPit 3168.47OTMit
使用表9-1的数据估计(9.1)-(9.4),由于每 个产业有21年的数据,因此每个回归中观测值个数都 是21。
这种分别对4个产业进行回归的缺点在于可能错失 包含在混合数据集中的那种一个产业影响另一个产业 的信息。换句话说,一个产业的数据中可能包含有对 于估计其它某个产业的回归系数有价值的信息,而这 种分别估计每个产业方程的做法无法利用这些信息, 这意味着估计值不够准确。
在表面不相关回归中,各个回归之间实际上确实
有关联。表面不相关回归容许各个回归方程的扰动 项之间存在跨方程相关,如上面四个方程中的诸u在 任何一个时期中不必相互独立,即不同方程的扰动 项之间可以存在同期相关。这样,SUR估计程序就 可以使用扰动项的相关来改善估计值。
具体来说,在SUR模型中,各个方程的扰动项在 时间上是独立的,但在横截面个体间相关,即
cov(uit
,
u
js
)
0
ij , t ,t
s s
各个回归之间任何的相关都是有价值的信息,它可
能是告诉我们某时期中发生了某些不止影响一个产业 的变化或事件,这一变化并没有被任何一个自变量捕 捉到,而只能反映在扰动项中。SUR程序用此信息来 改善系数估计值。事实上,GLS法被应用来利用这种 扰动项中跨横截面个体的相关。
我们可以通过分别运行4个回归来分析这些数据, 每个产业一个回归:
Y1t 0 1EMP1t 2OTM1t u1t Y2t 3 4EMP2t 5OTM 2t u2t Y3t 6 7 EMP3t 8OTM3t u3t Y4t 9 10EMP4t 11OTM 4t u4t
(9.1) (9.2) (9.3) (9.4)
因此,采用模型(9.5)是不合适的,我们下面 讨论可用于面板数据模型的其它估计方法。
*第二节 表面不相关回归
泽尔纳(Zellner)提出的表面不相关回归 (Seemingly unrelated regression,SUR)是一种 可供选择的分析面板数据的方法。
表面不相关回归是一组似乎不相关但实际上相关 的回归方程。表面不相关回归方程看上去不相关是 因为它们类似于方程(9.1)- (9.4)。在前面说到可 以分别对它们运行四个回归时,我们事实上有一个 冒失而错误的假设:各产业互不相干,因而我们可 以分别估计7)
(4.33)
R2 0.95
e2 2, 675, 700, 466
这种方法的致命缺陷是,估计出来的系数只有在 我们前面关于截距和斜率对于所有产业和所有时期 都是同样的值的假设成立的情况下才有用,实际情 况当然不是如此,比如说,很难想象每个时期中每 个产业的就业人数与其出口额之间的关系都相同, 增加1000名工人对不同产业出口额的影响应当是不 同的。
第九章 面板数据模型
第一节 面板数据和面板数据模型
混合数据(pooled data)是将横截面数据和时间 序列数据结合在一起的数据。
我们在第一章中曾介绍,横截面数据模型使用同一 时点不同个体(entity)的观测值,数据可来自不同地 区、公司、人员或其它个体;时间序列数据则是跨越 不同时期的同一地区、同一公司、同一个人或其它同 一个体的数据。
回到方程(9.1)- (9.4):
Y1t 0 1EMP1t 2OTM1t u1t Y2t 3 4EMP2t 5OTM 2t u2t Y3t 6 7 EMP3t 8OTM3t u3t Y4t 9 10EMP4t 11OTM 4t u4t
(9.1) (9.2) (9.3) (9.4)
Hsiao C. (2003), Analysis of Panel Data, 2nd Edition, (Cambridge University Press) 影印版由北京大学出版社出版,2005
本章中,我们将用一个贯穿始终的例子来说明估计 面板数据模型的各种方法。我们的数据来自以下4个产 业:
如果我们能够将4个产业的数据结合在一起,我们 的样本规模就会增大,从而可以使用所有可获得的信 息估计系数。
因此,我们需要讨论那些允许我们使用混合数据 的全部信息的估计技术,将跨时间跨空间的数据结合 在一起,而不是分别进行时间序列和横截面数据的回 归。
要做到这一点,最简单的方法是,假定截距和斜率 对于所有产业和所有时期都是一样的,进行下面的回 归:
产业1:钢铁; 产业2:橡胶、塑料; 产业3:石制品、陶瓷制品和玻璃制品; 产业4:纺织
模型中用到的变量是:
Yit = i产业第t年出口额,单位:百万美元,不变价
EMPit = i产业第t年就业人数,单位:千人
OTMit = i产业第t年平均每周加班小时数
我们收集了上述4个产业这3个变量1980-2000各 年的数据。事实上,对于这3个变量中的每一个,都 有84个观测值(4个产业乘以21年)。由于在每个时 期(每一年)都是这4个产业,因此这些混合数据是 面板数据,如表9-1所示。
如果混合数据包含的观测值来自同一批地区、公 司、人员或其它横截面个体的不同时期数据,则此 类混合数据称为面板数据(panel data)。
面板数据通常比非面板混合数据更有用,这是因 为面板数据中的地区、公司、人员等横截面个体在 各时期中一直保持不变,这使得我们更易于对随着 时间的推移所发生的变动进行比较。
我们将基于面板数据的回归模型称为面板数据模 型(panel data model)。面板数据模型正在得到日 益广泛的应用,文献也很多。限于篇幅,我们在这 里只能做一个入门性的介绍。需要深入研究的读者, 请参阅有关参考文献。
Baltagi, B. H.(2001),Econometric Analysis of Panel data, (Wiley: Chichester)
Yit 0 1EMPit 2OTM it uit
i 1, 2,3, 4
(9.5)
t 1980,1981,......2000
这里每个变量的观测值个数都是84。我们用表9 -1中全部数据估计此方程,结果如下:
Yˆit 14, 040.10 86.74EMPit 3168.47OTMit
使用表9-1的数据估计(9.1)-(9.4),由于每 个产业有21年的数据,因此每个回归中观测值个数都 是21。
这种分别对4个产业进行回归的缺点在于可能错失 包含在混合数据集中的那种一个产业影响另一个产业 的信息。换句话说,一个产业的数据中可能包含有对 于估计其它某个产业的回归系数有价值的信息,而这 种分别估计每个产业方程的做法无法利用这些信息, 这意味着估计值不够准确。
在表面不相关回归中,各个回归之间实际上确实
有关联。表面不相关回归容许各个回归方程的扰动 项之间存在跨方程相关,如上面四个方程中的诸u在 任何一个时期中不必相互独立,即不同方程的扰动 项之间可以存在同期相关。这样,SUR估计程序就 可以使用扰动项的相关来改善估计值。
具体来说,在SUR模型中,各个方程的扰动项在 时间上是独立的,但在横截面个体间相关,即
cov(uit
,
u
js
)
0
ij , t ,t
s s
各个回归之间任何的相关都是有价值的信息,它可
能是告诉我们某时期中发生了某些不止影响一个产业 的变化或事件,这一变化并没有被任何一个自变量捕 捉到,而只能反映在扰动项中。SUR程序用此信息来 改善系数估计值。事实上,GLS法被应用来利用这种 扰动项中跨横截面个体的相关。
我们可以通过分别运行4个回归来分析这些数据, 每个产业一个回归:
Y1t 0 1EMP1t 2OTM1t u1t Y2t 3 4EMP2t 5OTM 2t u2t Y3t 6 7 EMP3t 8OTM3t u3t Y4t 9 10EMP4t 11OTM 4t u4t
(9.1) (9.2) (9.3) (9.4)
因此,采用模型(9.5)是不合适的,我们下面 讨论可用于面板数据模型的其它估计方法。
*第二节 表面不相关回归
泽尔纳(Zellner)提出的表面不相关回归 (Seemingly unrelated regression,SUR)是一种 可供选择的分析面板数据的方法。
表面不相关回归是一组似乎不相关但实际上相关 的回归方程。表面不相关回归方程看上去不相关是 因为它们类似于方程(9.1)- (9.4)。在前面说到可 以分别对它们运行四个回归时,我们事实上有一个 冒失而错误的假设:各产业互不相干,因而我们可 以分别估计7)
(4.33)
R2 0.95
e2 2, 675, 700, 466
这种方法的致命缺陷是,估计出来的系数只有在 我们前面关于截距和斜率对于所有产业和所有时期 都是同样的值的假设成立的情况下才有用,实际情 况当然不是如此,比如说,很难想象每个时期中每 个产业的就业人数与其出口额之间的关系都相同, 增加1000名工人对不同产业出口额的影响应当是不 同的。
第九章 面板数据模型
第一节 面板数据和面板数据模型
混合数据(pooled data)是将横截面数据和时间 序列数据结合在一起的数据。
我们在第一章中曾介绍,横截面数据模型使用同一 时点不同个体(entity)的观测值,数据可来自不同地 区、公司、人员或其它个体;时间序列数据则是跨越 不同时期的同一地区、同一公司、同一个人或其它同 一个体的数据。
回到方程(9.1)- (9.4):
Y1t 0 1EMP1t 2OTM1t u1t Y2t 3 4EMP2t 5OTM 2t u2t Y3t 6 7 EMP3t 8OTM3t u3t Y4t 9 10EMP4t 11OTM 4t u4t
(9.1) (9.2) (9.3) (9.4)
Hsiao C. (2003), Analysis of Panel Data, 2nd Edition, (Cambridge University Press) 影印版由北京大学出版社出版,2005
本章中,我们将用一个贯穿始终的例子来说明估计 面板数据模型的各种方法。我们的数据来自以下4个产 业:
如果我们能够将4个产业的数据结合在一起,我们 的样本规模就会增大,从而可以使用所有可获得的信 息估计系数。
因此,我们需要讨论那些允许我们使用混合数据 的全部信息的估计技术,将跨时间跨空间的数据结合 在一起,而不是分别进行时间序列和横截面数据的回 归。
要做到这一点,最简单的方法是,假定截距和斜率 对于所有产业和所有时期都是一样的,进行下面的回 归:
产业1:钢铁; 产业2:橡胶、塑料; 产业3:石制品、陶瓷制品和玻璃制品; 产业4:纺织
模型中用到的变量是:
Yit = i产业第t年出口额,单位:百万美元,不变价
EMPit = i产业第t年就业人数,单位:千人
OTMit = i产业第t年平均每周加班小时数
我们收集了上述4个产业这3个变量1980-2000各 年的数据。事实上,对于这3个变量中的每一个,都 有84个观测值(4个产业乘以21年)。由于在每个时 期(每一年)都是这4个产业,因此这些混合数据是 面板数据,如表9-1所示。