面板数据模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十讲经典面板数据模型
一、面板数据(panel data)
一维数据:
时间序列数据(cross section data):变量在时间维度上的数据截面数据(time series data):变量在截面空间维度上的数据)。
二维数据:
面板数据(同时在时间和截面空间上取得的,也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。
面板数据=截面数据+时间序列数据。
面板数据用双下标变量表示。例如
y i t, i = 1, 2, …, N; t = 1, 2, …, T
N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y i ., ( i = 1, 2, …, N)是随机变量在横截面上的N个数据;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。
平衡面板数据(balanced panel data)。
非平衡面板数据(unbalanced panel data)。
例1998-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。
表1.中国部分省级地区的居民数据(不变价格,元)
二、面板数据模型及其作用
1.经典面板数据模型
建立在古典假定基础上的线性面板数据模型.
2.非经典面板数据模型
(1)非平稳时间序列问题的面板数据模型(面板数据协整模型)
(2)非线性面板数据模型(如面板数据logit模型, 面板数据计数模型模型)
(3)其他模型(如面板数据分位数回归模型)
3.面板数据模型作用
(1)描述个体行为差异。
(2)Panel Data能够提供更多信息、更多变化性、更少共线性、更多自由度和更高效率。反观时间序列经常受多重共线性的困扰。
(3)Panel Data能够更好地研究动态调节,横截面分布看上去相对稳定但却隐藏了许多变化,Panel Data由于包含较长时间,能够弄清诸如经济政策变化对经济状况的影响等问题。
(4)Panel Data能更好地识别和度量纯时间序列和纯横截面数据所不能发现的影响因素。
(5)相对于纯横截面和纯时间序列数据而言,Panel Data能够构造和检验更复杂的行为模型。
(6)通常,Panel Data可以收集到更准确的微观单位(个人、
企业、家庭)的情况。由此得到的总体数据可以消去测量误差的影响。
尽管Panel Data研究的理论和应用发展很快,但目前仍然存在一些问题需要解决。例如,变量设计和收集数据困难;存在测量误差;存在选择性困难;时间序列较短;等等。
4.目前有关Panel Data的学术专著主要有:
1.Analysis of panel data / Cheng Hsiao. 1986.
2.Econometric analysis of panel data / Badi H.Baltagi. 1995.
3.The Econometrics of panel data : a handbook of the theory with applications / Matyas & Sevestre. 1996.
应用程序软件:stata、EViews。
三、经典面板数据模型的参数估计
不变系数模型:y it=α+βx it+u it
变截距模型:y it=αi+βx it+u it(时间变截距模型?双变模型?)
变系数模型:y it=αi+βi x it+u it(时间变截距模型?双变模型?)
(一)不变系数模型(混合估计模型)如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,即各回归系数不随个体或截面的变化而变化,那么就可以直接把面板数据混合在一起用
普通最小二乘法(OLS)估计参数,建立不变系数模型(混合估计模型)。
y it = α+βx it +u it, i = 1, 2, …, N; t = 1, 2, …, T
α和β不随i,t变化。称模型为混合估计模型。
数据形式变为:
例以表1中15个地区1996和2002年数据建立关于消费的混合估计模型,得结果如下:
输出结果1
Dependent Variable: Y?
Method: Pooled Least Squares
Included observations: 5
Number of cross-sections used: 15
Total panel (balanced) observations: 75
Variable Coefficient Std. Error t-Statistic Prob.
C 73.81960 84.48351 0.873775 0.3851
X? 0.761465 0.011710 65.02895 0.0000 R-squared 0.983030 Mean dependent var 5291.773
0.982798 S.D. dependent var 1745.640 Adjusted
R-squared
S.E. of regression 228.9535 Sum squared resid 3826637. F-statistic 4228.764 Durbin-Watson stat 0.864366 Prob(F-statistic) 0.000000