南开大学张晓峒的面板数据模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1997
1998 IPAH IPBJ IPFJ IPHB IPHLJ
1999
2000
2001 IPSD IPSH IPSX IPTJ IPZJ
2002
CPAH CPBJ CPFJ CPHB CPHLJ
CPJL CPJS CPJX CPLN CPNMG
IPJL IPJS IPJX IPLN IPNMG
CP1999 CP2000 CP2001
CP2002
IP1999 IP2000 IP2001
IP2002
图 4 15 个省级地区的人均消费散点图
图 5 15 个省级地区的人均收入散点图(7 个横截面叠加) (每条连线表示同一年度 15 个地区的收入值)
(每条连线表示同一年度 15 个地区的消费值)
用 CP 表示消费, IP 表示收入。 AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ 分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽 宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。 15 个地区 7 年人均消费对收入的面板数据散点图见图 6 和图 7。 图 6 中每一种符号代表 一个省级地区的 7 个观测点组成的时间序列。相当于观察 15 个时间序列。图 7 中每一种符 号代表一个年度的截面散点图(共 7 个截面) 。相当于观察 7 个截面散点图的叠加。
图1
N=7,T=50 的面板数据示意图
例如 1990-2000 年 30 个省份的农业总产值数据。固定在某一年份上,它是由 30 个农业 总产总值数字组成的截面数据;固定在某一省份上,它是由 11 年农业总产值数据组成的一 个时间序列。面板数据由 30 个个体组成。共有 330 个观测值。 对于面板数据 yi t, i = 1, 2, …, N; t = 1, 2, …, T 来说,如果从横截面上看,每个变量都有 观测值, 从纵剖面上看, 每一期都有观测值, 则称此面板数据为平衡面板数据 (balanced panel data) 。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data) 。 注意:EViwes 3.1、4.1、5.0 既允许用平衡面板数据也允许用非平衡面板数据估计模型。 例 1(file:panel02) :1996-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人 均消费(不变价格)和人均收入数据见表 1 和表 2。数据是 7 年的,每一年都有 15 个数据, 共 105 组观测值。 人均消费和收入两个面板数据都是平衡面板数据,各有 15 个个体。人均消费和收入的 面板数据从纵剖面观察分别见图 2 和图 3。从横截面观察分别见图 4 和图 5。横截面数据散
资料来源: 《中国统计年鉴》1997-2003。 1999-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均收入数据(不变价格) 1996 4106.251 6569.901 4884.731 4148.282 3518.497 3549.935 4744.547 3487.269 3899.194 3189.414 4461.934 7489.451 3431.594 5474.963 6446.515 1997 4540.247 7419.905 6040.944 4790.986 3918.314 4041.061 5668.830 3991.490 4382.250 3774.804 5049.407 8209.037 3869.952 6409.690 7158.288 1998 4770.470 8273.418 6505.145 5167.317 4251.494 4240.565 6054.175 4209.327 4649.789 4383.706 5412.555 8773.100 4156.927 7146.271 7860.341 1999 5178.528 9127.992 6922.109 5468.940 4747.045 4571.439 6624.316 4787.606 4968.164 4780.090 5849.909 10770.09 4360.050 7734.914 8530.314 2000 5256.753 9999.700 7279.393 5678.195 4997.843 4878.296 6793.437 5088.315 5363.153 5063.228 6477.016 11432.20 4546.785 8173.193 9187.287 2001 5640.597 11229.66 8422.573 5955.045 5382.808 5271.925 7316.567 5533.688 5797.010 5502.873 6975.521 12883.46 5401.854 8852.470 10485.64 2002 6093.333 12692.38 9235.538 6747.152 6143.565 6291.618 8243.589 6329.311 6597.088 6038.922 7668.036 1Байду номын сангаас183.88 6335.732 9375.060 11822.00 地区人均收入 IP-AH(安徽) IP-BJ(北京) IP-FJ(福建) IP-HB(河北) IP-HLJ(黑龙江) IP-JL(吉林) IP-JS(江苏) IP-JX(江西) IP-LN(辽宁) IP-NMG(内蒙古) IP-SD(山东) IP-SH(上海) IP-SX(山西) IP-TJ(天津) IP-ZJ(浙江)
11000 10000 9000 8000 7000 6000 5000 4000 3000 2000 0 4000 8000 12000 16000 CPAH CPBJ CPFJ CPHB CPHLJ CPJL CPJS CPJX CPLN CPNMG CPSD CPSH CPSX CPTJ CPZJ
IP(1996-2002)
图6
用 15 个时间序列表示的人均消费对收入的面板数据
3
12000 CP1996 CP1997 CP1998 CP1999 CP2000 CP2001 CP2002
10000
8000
6000
4000 IP(1996-2002) 2000 2000 4000 6000 8000 10000 12000 14000
1
点图的表现与观测值顺序有关。 图 4 和图 5 中人均消费和收入观测值顺序是按地区名的汉语 拼音字母顺序排序的。
表1 1999-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均消费数据(不变价格) 1996 3282.466 5133.978 4011.775 3197.339 2904.687 2833.321 3712.260 2714.124 3237.275 2572.342 3440.684 6193.333 2813.336 4293.220 5342.234 1997 3646.150 6203.048 4853.441 3868.319 3077.989 3286.432 4457.788 3136.873 3608.060 2901.722 3930.574 6634.183 3131.629 5047.672 6002.082 1998 3777.410 6807.451 5197.041 3896.778 3289.990 3477.560 4918.944 3234.465 3918.167 3127.633 4168.974 6866.410 3314.097 5498.503 6236.640 1999 3989.581 7453.757 5314.521 4104.281 3596.839 3736.408 5076.910 3531.775 4046.582 3475.942 4546.878 8125.803 3507.008 5916.613 6600.749 2000 4203.555 8206.271 5522.762 4361.555 3890.580 4077.961 5317.862 3612.722 4360.420 3877.345 5011.976 8651.893 3793.908 6145.622 6950.713 2001 4495.174 8654.433 6094.336 4457.463 4159.087 4281.560 5488.829 3914.080 4654.420 4170.596 5159.538 9336.100 4131.273 6904.368 7968.327 2002 4784.364 10473.12 6665.005 5120.485 4493.535 4998.874 6091.331 4544.775 5402.063 4850.180 5635.770 10411.94 4787.561 7220.843 8792.210 地区人均消费 CP-AH(安徽) CP-BJ(北京) CP-FJ(福建) CP-HB(河北) CP-HLJ(黑龙江) CP-JL(吉林) CP-JS(江苏) CP-JX(江西) CP-LN(辽宁) CP-NMG(内蒙古) CP-SD(山东) CP-SH(上海) CP-SX(山西) CP-TJ(天津) CP-ZJ(浙江) 表2
资料来源: 《中国统计年鉴》1997-2003。
11000 10000 9000 8000 7000 6000 5000 4000 3000 2000 1996 1997 1998 1999 2000 2001 CPSD CPSH CPSX CPTJ CPZJ 2002
4000 2000 1996 8000 6000 12000 10000 14000
面板数据模型
1.面板数据定义。 时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据; 截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data) 。面板数据是同时在时间和截面空间上 取得的二维数据。面板数据示意图见图 1。面板数据从横截面(cross section)上看,是由若 干个体 (entity, unit, individual) 在某一时刻构成的截面观测值, 从纵剖面 (longitudinal section) 上看是一个时间序列。 面板数据用双下标变量表示。例如 yi t, i = 1, 2, …, N; t = 1, 2, …, T N 表示面板数据中含有 N 个个体。 T 表示时间序列的最大长度。 若固定 t 不变, yi ., ( i = 1, 2, …, N)是横截面上的 N 个随机变量;若固定 i 不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序 列(个体) 。
2
图2
15 个省级地区的人均消费序列(纵剖面) 图 3
15 个省级地区的人均收入序列(file:4panel02)
14000 12000 10000 8000 6000 4000 2000 2 4 CP1996 CP1997 CP1998 6 8 10 12 14
14000 12000 10000 8000 6000 4000 2000 2 4 IP1996 IP1997 IP1998 6 8 10 12 14
图7
用 7 个截面表示的人均消费对收入的面板数据(7 个截面叠加)
为了观察得更清楚一些,图 8 给出北京和内蒙古 1996-2002 年消费对收入散点图。从图 中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古 2002 年的收 入与消费规模还不如北京市 1996 年的大。 图 9 给出该 15 个省级地区 1996 和 2002 年的消费 对收入散点图。可见 6 年之后 15 个地区的消费和收入都有了相应的提高。