EVIEWS用面板数据模型预测
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第8讲用面板数据模型预测
1.面板数据定义
时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到的数据;截面数据是变量在固定时点的一组数据。面板数据是同时在时间和截面上取得的二维数据。面板数据也可以定义为相同截面上的个体在不同时点的重复观测数据或者称为纵向变量序列(个体)的多次测量。所以,面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。
面板数据示意图见图1。面板数据从横截面(cross section)看,是由若干个体(entity, unit, individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列。
图1 N=15,T=50的面板数据示意图
图2是1978~2005年中国各省级地区消费性支出占可支配收入比率序列图。
图2 1978-2005年中国各省级地区消费性支出占可支配收入比率序列图(价格平减过)
面板数据用双下标变量表示。例如
y i t, i = 1, 2, …, N; t = 1, 2, …, T
i对应面板数据中不同个体。N表示面板数据中含有N个个体。t对应面板数据中不同时点。T表示时间序列的最大长度。若固定t不变,y i ., ( i = 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。
这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据。
利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应回归模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。
例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。
对于面板数据y i t, i = 1, 2, …, N; t = 1, 2, …, T,如果每个个体在相同的时期内都有观测值记录,则称此面板数据为平衡面板数据(balanced panel data)。若面板数据中的个体在相同时期内缺失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。
案例1:1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)关系研究(file:5panel02)
1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)数据见file:panel02。数据是7年的,每一年都有15个数据,共105组观测值。
人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费面板数据按个体连线见图3,按截面连线见图4。人均收入面板数据按个体连线见图5,按截面连线见图6。
图3 15个省级地区的人均消费序列(个体)(file:5panel02)
图4 7个人均消费横截面数据(含15个地区)(每条连线表示同一年度15个地区的消费值)
图5 15个省级地区的人均收入序列(个体)(file:5panel02)
图6 7个人均收入横截面数据(含15个地区)(每条连线表示同一年度15个地区的收入值)
用CP表示消费,IP表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ,
ZJ 分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。
2000
300040005000600070008000900010000110000
4000
8000
12000
16000
IP(1996-2002)
CPAH CPBJ CPFJ CPHB CPHLJ CPJL CPJS CPJX CPLN CPNMG CPSD CPSH CPSX CPTJ CPZJ
图7 人均消费对收入的面板数据散点图(15个时间序列叠加)
2000
4000
6000
8000
10000
12000
2000
4000
6000
8000100001200014000
IP(1996-2002)
CP1996CP1997CP1998CP1999CP2000CP2001CP2002
图8 人均消费对收入的面板数据散点图(7个截面叠加)
15个地区7年人均消费对收入的面板数据散点图见图7和图8。图7中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图8中每一种符号代表一个年度的截面散点图(共7个截面)。相当于观察7个截面散点图的叠加。
为了观察得更清楚,图9给出北京和内蒙古1996-2002年消费对收入散点图。从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古2002年的收入与消费规模还不如北京市1996年的大。图10给出该15个省级地区1996和2002年的消费对收入散点图。6年之后15个地区的消费和收入都有了相应的提高。
图9 北京和内蒙古1996-2002年消费对收入散点图 图10 1996和2002年15个地区的消费对收入散点图
2.面板数据模型分类
用面板数据建立的模型通常有3种,即混合回归模型、固定效应回归模型和随机效应回归模型。
2.1 混合回归模型(Pooled model )。 如果一个面板数据模型定义为, y it = α + X it 'β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (1) 其中y it 为被回归变量(标量),α表示截距项,X it 为k ⨯1阶回归变量列向量(包括k 个回归量),β为k ⨯1阶回归系数列向量,εit 为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截面,回归系数α和β都相同。
如果模型是正确设定的,解释变量与误差项不相关,即Cov(X it ,εit ) = 0。那么无论是N →∞,还是T →∞,模型参数的混合最小二乘估计量(Pooled OLS )都是一致估计量。
2.2 固定效应回归模型(fixed effects regression model )。 固定效应模型分为3种类型,即个体固定效应回归模型、时点固定效应回归模型和个体时点双固定效应回归模型。下面分别介绍。
2.2.1个体固定效应回归模型(entity fixed effects regression model ) 如果一个面板数据模型定义为, y it = αi + X it 'β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (3) 其中αi 是随机变量,表示对于i 个个体有i 个不同的截距项,且其变化与X it 有关系;X it 为k ⨯1阶回归变量列向量(包括k 个回归量),β为k ⨯1阶回归系数列向量,对于不同个体回归系数相同,y it 为被回归变量(标量),εit 为误差项(标量),则称此模型为个体固定效应回归模型。
个体固定效应模型(3)的强假定条件是,
E(εit ∣αi , X it ) = 0, i = 1, 2, …, N
αi 作为随机变量描述不同个体建立的模型间的差异。因为αi 是不可观测的,且与可观测
的解释变量X it 的变化相联系,所以称(3)式为个体固定效应回归模型。 个体固定效应回归模型也可以表示为
y it = α1 D 1 + α2 D 2 + … +αN D N + X it 'β +εit , t = 1, 2, …, T (4) 其中
D i =⎩
⎨⎧= 其他,,个个体如果属于第,,0 ..., ,2 ,1,1N i i
注意:
(1)在EViews5.0输出结果中αi 是以一个不变的常数部分和随个体变化的部分相加而成。(2)在EViews 5.0以上版本个体固定效应对话框中的回归因子选项中填不填c 输出结果都会有固定常数项。
个体固定效应回归模型的估计方法有多种,首先设法除去αi 的影响,从而保证β估计量的一致性。(详见第3节,面板数据模型估计方法。)
下面解释设定个体固定效应回归模型的原因。假定有面板数据模型 y it = β0 + β1 x it +β2 z i +εit , i = 1, 2, …, N ; t = 1, 2, …, T (5) 其中β0为常数,不随时间、截面变化;z i 表示随个体变化,但不随时间变化的难以观测的变