第九讲面板数据回归
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在stata中,首先使用xtset命令指定个 体特征和时间特征,然后可以用xtdes命 令显示面板数据的结构。
use fatality,clear
xtset state year
xtdes
短面板和长面板
如果面板数据 T 较小,而n 较大,这种 面板数据被称为“短面板”(short panel)。(大n小T)如fatality.dta
地区人均消费 CP-AH(安徽) CP-BJ(北京) CP-FJ(福建) CP-HB(河北) CP-HLJ(黑龙江) CP-JL(吉林) CP-JS(江苏) CP-JX(江西) CP-LN(辽宁) CP-NMG(内蒙古) CP-SD(山东) CP-SH(上海) CP-SX(山西) CP-TJ(天津) CP-ZJ(浙江)
mvalue
4833 4924.9 6241.7 5593.6 2289.5 2159.4 2031.3 2115.5 1819.4 2079.7 2371.6 2759.9
当描述截面数据时,我们用下标表示个体, 如Yi表示第i个个体的变量Y。当描述面板数 据时,我们需要其他符号来同时表示个体和 时期。为此我们采用双下标而不是单下标, 其中第一个下标i表示个体,第二个下标t表 示观测时间。
1996 3282.466 5133.978 4011.775 3197.339 2904.687 2833.321 3712.260 2714.124 3237.275 2572.342 3440.684 6193.333 2813.336 4293.220 5342.234
1997 3646.150 6203.048 4853.441 3868.319 3077.989 3286.432 4457.788 3136.873 3608.060 2901.722 3930.574 6634.183 3131.629 5047.672 6002.082
2000 4203.555 8206.271 5522.762 4361.555 3890.580 4077.961 5317.862 3612.722 4360.420 3877.345 5011.976 8651.893 3793.908 6145.622 6950.713
2001 4495.174 8654.433 6094.336 4457.463 4159.087 4281.560 5488.829 3914.080 4654.420 4170.596 5159.538 9336.100 4131.273 6904.368 7968.327
时间序列数据或截面数据都是一维数据。 例如时间序列数据是变量按时间得到的数 据;截面数据是变量在截面空间上的数据。 面板数据是同时在时间和截面上取得的二 维数据。所以,面板数据(panel data) 也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。
于是Yit表示n个个体中第i个个体在T期中的 第t个时期内变量Y的观测值。
面板数据用双下标变量表示。例如 Yit, i = 1, 2, …, N; t = 1, 2, …, T
N表示面板数据中含有N个个体。T表示时 间序列的最大长度。
对于样本点来说:
Stata中面板数据的表示
company
1 1 1 1 2 2 2 2 3 Baidu Nhomakorabea 3 3
反之,如果T 较大,而n 较小,则被称 为“长面板”(long panel)。 (大T 小n)如Grunfeld.dta
面板数据的优势
(1)可以解决遗漏变量问题:遗漏变量偏差是一 个普遍存在的问题。虽然可以用工具变量法解决, 但有效的工具变量常常很难找。遗漏变量常常是由 于不可观测的个体差异或“异质性” (heterogeneity)所造成,如果这种个体差异 “不随时间而改变”(time invariant),则面板 数据提供了解决遗漏变量问题的又一利器。
year
1951 1952 1953 1954 1951 1952 1953 1954 1951 1952 1953 1954
invest
755.9 891.2 1304.4 1486.7 588.2 645.5 641 459.3 135.2 157.3 179.5 189.6
mvalue
4833 4924.9 6241.7 5593.6 2289.5 2159.4 2031.3 2115.5 1819.4 2079.7 2371.6 2759.9
company
1 1 1 1 2 2 2 2 3 3 3 3
year
1951 1952 1953 1954 1951 1952 1953 1954 1951 1952 1953 1954
invest
755.9 891.2 1304.4 1486.7 588.2 645.5 641 459.3 135.2 157.3 179.5 189.6
1998 3777.410 6807.451 5197.041 3896.778 3289.990 3477.560 4918.944 3234.465 3918.167 3127.633 4168.974 6866.410 3314.097 5498.503 6236.640
1999 3989.581 7453.757 5314.521 4104.281 3596.839 3736.408 5076.910 3531.775 4046.582 3475.942 4546.878 8125.803 3507.008 5916.613 6600.749
2002 4784.364 10473.12 6665.005 5120.485 4493.535 4998.874 6091.331 4544.775 5402.063 4850.180 5635.770 10411.94 4787.561 7220.843 8792.210
面板数据的格式(例二)
面板数据,简言之是时间序列和截面数据的 混合。严格地讲是指对一组个体(如居民、 国家、公司等) 连续观察多期得到的资料。 所以很多时候我们也称其为“追踪资料”。 近年来,由于面板数据资料的获得变得相对 容易,使其应用范围也不断扩大。
1996-2002年中国15个省级地区的居民家庭人均消费数 据(不变价格) (例一)