高级计量经济学 第三章 面板数据模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Y i t X i t u i t i 1 , 2 ,, N ;t 1 , 2 ,, T
10
固定效应模型
对于面板数据,固定效应可以针对截面,也可以针对时期。 Y i t i t X i t u i t i 1 , 2 ,, N ;t 1 , 2 ,, T 固定效应是一个无法观察的因素,反映除Xit以外所有其他
在应用工作中,可以将面板数据分为:
平衡的面板数据(样本量=N*T)
非平衡的面板数据(样本量=
N i
Ti
)
5
将时间序列和截面数据混合使用 的主要理由
例1:供给行为模型
在生产函数分析中,人们长期关注的一个问题 是如何分离规模经济和技术进步产生的效果。
就我国农村情况而言,这类研究有助于回答是否应 鼓励扩大农户经营规模这一政策问题。
面板数据模型是将时间序列和截面数据联合使用建立的模 型。
可以增大样本数量 可以增大变量的变异程度 可以分析不同观察对象之间的差异 可以分析不同时期之间的差异 可以分析跨时期的因果关系(动态模型)
概括而言,联合使用时间序列和截面混合数据(Pooled data) 增加了信息含量,这不仅有利于改善模型估计结果,而且 可以探讨单纯用时间序列数据或截面数据无法分析的问题。
此外Panel数据样本量较大,因而允许引入更多的其他 影响因素(例如人口学变量)。
Panel模型结果可以帮助识别观察对象间的差别及消费 行为随时间的变化模式,这些信息有助于决策制定。
8
面板数据模型
在应用研究中,如果观察对象数量很大,那么建立反映每 个观察对象行为的时序关系模型将是一项非常复杂和费时 的工作。
e.s.it
1
dLnCit dLnYit
1
7
将时间序列和截面数据混合使用 的主要理由
例2:需求行为模型
对需求行为分析造成困扰的一个难题是如何分离收入 变化的影响和价格变化的影响。
两者的动态变化模式常常表现出高度相关,因而利用时间序列 数据建立模型面临严重的多重共线。
利用Panel数据可以增大价格和收入的变异程度,降低 其相关程度,从而改善模型参数的估计结果。
多余的固定效应/序列相关/Hausman检验
11Leabharlann Baidu
固定效应模型
考虑只涉及两个时期的情况,此时样本容 量为2N。
假定总体模型为:
Yit = β0 + D2t + β1Xit1 +…+ βkXitk +(i + eit)
此处D2t是代表第二个时期的虚拟变量
方程中加了一个不随时间变化的误差项i
因素产生的综合影响。 利用时间序列和截面混合数据建立模型时,如果忽略与不
同时期或观察对象相联系的特殊效应,那么不仅会造成信 息损失,而且会出现遗漏重要解释变量错误。
当固定效应与解释变量X相关时,OLS方法得出有偏的参数估计。
建立面板数据模型可以避免得到有偏的参数估计,并且可 以对模型进行更为严谨的统计检验。
高级计量经济学 第三章 面板数据模型
本章内容
什么是面板(平行)数据 利用面板数据建立模型的理由 面板数据模型一般表达形式 固定效应模型 随机效应模型(误差成份模型) 案例分析
2
什么是面板数据
经典计量经济学模型使用的或者是时序序列数据(time series data),或者是截面数据(crosss section data)。
所有不随时间变化的变量变为0 时间趋势变量变为常数项 新的模型不再存在X与误差项的相关,因而利用OLS方
法得到的估计系数不再是有偏的。
需要注意的是,差分后的样本量变为N,即减少 了N个样本。
3
面板数据有哪些来源
在现实生活中,有大量的公开统计数据属于时间 序列和截面混合数据。
历年分行政区的统计数据 上市企业报表 国家统计局居民收支调查 (定期轮换) 农产品成本调查数据 农业部农村经济研究中心固定观察点调查资料 …
4
处理时间序列和截面混合数据的 方法
处理时间序列和截面混合数据有以下两种做法:
若i与解释变量相关,即出现Cov(Xit, i)≠0,
那么用OLS方法得到的β估计值是有偏的。
12
固定效应模型
对于面板数据,可以用做一阶差分的方式分离出 固定效应。
由当期的观察值减去上一个时期的观察值后得到:
DYit = + β1DXi1t +…+ βkDXikt + Deit
可以发现,做一阶差分后:
由于这一因素,在应用研究中很少采用上述方法。 为了简化分析,研究人员常常假定:
斜率不随截面和时间变化 与每个观察对象相联系的特殊效应可以跨时期传递 与每个时期相联系的特殊效应适用于当期所有个体 模型的误差项满足特定的分布(涉及到估计技术选择)
均值和方差是否随时间和截面变化 是否存在序列相关 是否存在异方差
混合数据模型:将针对不同时期、不同对象的观察结 果(指标)看作是随机抽取的观察值。
处理方法最为简便,但由样本提取的信息不够充分。
面板数据模型(Panel data):将针对不同时期、不同对象 的观察结果看作是与时期或截面相关联的现象。
处理方法较复杂,但能够更充分地利用样本信息。
混合数据模型可以被看作是处理面板数据的一种特例。
截面数据可以反映规模差异的影响,但无法考 虑技术进步。
时间序列数据将两者的影响混合在一起而难以 分离。
6
将时间序列和截面数据混合使用 的主要理由
Greene的例子
成本函数为 C ostit CYit,P it,T
由成本函数可以计算出技术进步率:
r.t.c. dLnC
dT
也可以计算出规模经济系数:
9
面板数据模型
考虑以下利用混合数据建立的模型(2N个待估计参数) Y i t i i X i t u i t i 1 , 2 ,, N ;t 1 , 2 ,, T 此表达式意味着为每个截面单独建立模型。
是否可行(样本容量) 是否必要(研究目的)
简化假定1:有共同的斜率(N+1个待估计参数) Y i t i X i t u i t i 1 , 2 ,, N ;t 1 , 2 ,, T 上述情况属于截面固定效应模型(Fixed effect model) 。 简化假定2:有共同的常数项和斜率(2个待估计参数)
10
固定效应模型
对于面板数据,固定效应可以针对截面,也可以针对时期。 Y i t i t X i t u i t i 1 , 2 ,, N ;t 1 , 2 ,, T 固定效应是一个无法观察的因素,反映除Xit以外所有其他
在应用工作中,可以将面板数据分为:
平衡的面板数据(样本量=N*T)
非平衡的面板数据(样本量=
N i
Ti
)
5
将时间序列和截面数据混合使用 的主要理由
例1:供给行为模型
在生产函数分析中,人们长期关注的一个问题 是如何分离规模经济和技术进步产生的效果。
就我国农村情况而言,这类研究有助于回答是否应 鼓励扩大农户经营规模这一政策问题。
面板数据模型是将时间序列和截面数据联合使用建立的模 型。
可以增大样本数量 可以增大变量的变异程度 可以分析不同观察对象之间的差异 可以分析不同时期之间的差异 可以分析跨时期的因果关系(动态模型)
概括而言,联合使用时间序列和截面混合数据(Pooled data) 增加了信息含量,这不仅有利于改善模型估计结果,而且 可以探讨单纯用时间序列数据或截面数据无法分析的问题。
此外Panel数据样本量较大,因而允许引入更多的其他 影响因素(例如人口学变量)。
Panel模型结果可以帮助识别观察对象间的差别及消费 行为随时间的变化模式,这些信息有助于决策制定。
8
面板数据模型
在应用研究中,如果观察对象数量很大,那么建立反映每 个观察对象行为的时序关系模型将是一项非常复杂和费时 的工作。
e.s.it
1
dLnCit dLnYit
1
7
将时间序列和截面数据混合使用 的主要理由
例2:需求行为模型
对需求行为分析造成困扰的一个难题是如何分离收入 变化的影响和价格变化的影响。
两者的动态变化模式常常表现出高度相关,因而利用时间序列 数据建立模型面临严重的多重共线。
利用Panel数据可以增大价格和收入的变异程度,降低 其相关程度,从而改善模型参数的估计结果。
多余的固定效应/序列相关/Hausman检验
11Leabharlann Baidu
固定效应模型
考虑只涉及两个时期的情况,此时样本容 量为2N。
假定总体模型为:
Yit = β0 + D2t + β1Xit1 +…+ βkXitk +(i + eit)
此处D2t是代表第二个时期的虚拟变量
方程中加了一个不随时间变化的误差项i
因素产生的综合影响。 利用时间序列和截面混合数据建立模型时,如果忽略与不
同时期或观察对象相联系的特殊效应,那么不仅会造成信 息损失,而且会出现遗漏重要解释变量错误。
当固定效应与解释变量X相关时,OLS方法得出有偏的参数估计。
建立面板数据模型可以避免得到有偏的参数估计,并且可 以对模型进行更为严谨的统计检验。
高级计量经济学 第三章 面板数据模型
本章内容
什么是面板(平行)数据 利用面板数据建立模型的理由 面板数据模型一般表达形式 固定效应模型 随机效应模型(误差成份模型) 案例分析
2
什么是面板数据
经典计量经济学模型使用的或者是时序序列数据(time series data),或者是截面数据(crosss section data)。
所有不随时间变化的变量变为0 时间趋势变量变为常数项 新的模型不再存在X与误差项的相关,因而利用OLS方
法得到的估计系数不再是有偏的。
需要注意的是,差分后的样本量变为N,即减少 了N个样本。
3
面板数据有哪些来源
在现实生活中,有大量的公开统计数据属于时间 序列和截面混合数据。
历年分行政区的统计数据 上市企业报表 国家统计局居民收支调查 (定期轮换) 农产品成本调查数据 农业部农村经济研究中心固定观察点调查资料 …
4
处理时间序列和截面混合数据的 方法
处理时间序列和截面混合数据有以下两种做法:
若i与解释变量相关,即出现Cov(Xit, i)≠0,
那么用OLS方法得到的β估计值是有偏的。
12
固定效应模型
对于面板数据,可以用做一阶差分的方式分离出 固定效应。
由当期的观察值减去上一个时期的观察值后得到:
DYit = + β1DXi1t +…+ βkDXikt + Deit
可以发现,做一阶差分后:
由于这一因素,在应用研究中很少采用上述方法。 为了简化分析,研究人员常常假定:
斜率不随截面和时间变化 与每个观察对象相联系的特殊效应可以跨时期传递 与每个时期相联系的特殊效应适用于当期所有个体 模型的误差项满足特定的分布(涉及到估计技术选择)
均值和方差是否随时间和截面变化 是否存在序列相关 是否存在异方差
混合数据模型:将针对不同时期、不同对象的观察结 果(指标)看作是随机抽取的观察值。
处理方法最为简便,但由样本提取的信息不够充分。
面板数据模型(Panel data):将针对不同时期、不同对象 的观察结果看作是与时期或截面相关联的现象。
处理方法较复杂,但能够更充分地利用样本信息。
混合数据模型可以被看作是处理面板数据的一种特例。
截面数据可以反映规模差异的影响,但无法考 虑技术进步。
时间序列数据将两者的影响混合在一起而难以 分离。
6
将时间序列和截面数据混合使用 的主要理由
Greene的例子
成本函数为 C ostit CYit,P it,T
由成本函数可以计算出技术进步率:
r.t.c. dLnC
dT
也可以计算出规模经济系数:
9
面板数据模型
考虑以下利用混合数据建立的模型(2N个待估计参数) Y i t i i X i t u i t i 1 , 2 ,, N ;t 1 , 2 ,, T 此表达式意味着为每个截面单独建立模型。
是否可行(样本容量) 是否必要(研究目的)
简化假定1:有共同的斜率(N+1个待估计参数) Y i t i X i t u i t i 1 , 2 ,, N ;t 1 , 2 ,, T 上述情况属于截面固定效应模型(Fixed effect model) 。 简化假定2:有共同的常数项和斜率(2个待估计参数)