第10章 Panel Data 模型
面板数据模型理论
5.2 面板数据模型理论5.2.1 面板数据模型及类型。
面板数据(panel data )也称时间序列截面数据(time series and cross section data )或混合数据(pool data )。
面板数据是同时在时间和截面空间上取得的二维数据。
面板数据从横截面(cross section )上看,是由若干个体(entity, unit, individual )在某一时刻构成的截面观测值,从纵剖面(longitudinal section )上看是一个时间序列。
面板数据用双下标变量表示。
例如:it y , N i ,,2,1 =;T t ,,2,1 =其中,N 表示面板数据中含有的个体数。
T 表示时间序列的时期数。
若固定t 不变,•i y ),,2,1(N i =是横截面上的N 个随机变量;若固定i 不变,t y •,),,2,1(T t =是纵剖面上的一个时间序列。
对于面板数据来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data )。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data )。
面板数据模型是建立在面板数据之上、用于分析变量之间相互关系的计量经济模型。
面板数据模型的解析表达式为:it it it it it x y μβα++= T j N i ,2,1;,2,1==其中,it y 为被解释变量;it α表示截距项,),,,(21k it it itit x x x x =为k ⨯1维解释变量向量;'21),,,(k it it it it ββββ =为1⨯k 维参数向量;i 表示不同的个体;t 表示不同的时间;it μ为随机扰动项,满足经典计量经济模型的基本假设),0(~2μσμIIDN it 。
面板数据模型通常分为三类。
panel data
平行数据(Panel Data)模型厦门大学财政系王艺明平行数据(Panel Data)§平行数据是指对不同时刻的横截面个体作连续观测所得到的多维数据。
由于这类数据有着独特的优点,使平行数据模型目前已在计量经济学、社会学等领域有着较为广泛的应用。
§平行数据在EViews中被称为时序与横截面混合数据(pooled time series and cross-section data)。
平行数据模型是一类利用平行数量分析变量间相互关系并预测其变化趋势的计量经济模型。
模型能够同时反映研究对象在时间和横截面单元两个方向上的变化规律及不同时间、不同单元的特性。
Panel Data模型的基本设定§平行数据模型的基本假设:参数齐性假设,即被解释变量y由某一参数的概率分布函数P(y|θ)。
§假定时间序列参数齐性,及参数值不随时间的不同而变化,则平行数据模型可表示为:§yit =αi+βi’xit+εiti=1,…,N; t=1,…,T§xit ’=(x1it,x2it,…,xKit),为外生变量向量,βi’=(β1i ,β2i,…,βKi),为参数向量,K是外生变量个数,T是时期总数§其中参数αi 和βi都是个体时期恒量(individual time-invariant variable),其取值只受到截面单元不同的影响§E(εit )=0; E(εit2)=σi2; E(εitεjt)=σij; E(εitεjt-s)=0Panel Data 模型的基本设定I §根据模型的不同设定通常有三类估计方法§T 较大,N 较小。
通常采用时间序列模型的假设,即T 趋于无穷大,而N 固定、有限。
§该假设下,标准的方法是Zellner 的似无相关回归方法(Zellner Seemingly Unrelated Regression, SUR ),该方法考虑到回归方程间残差的相关性,即E(εit εjt )=σij ,采用GLS 方法估计似无相关回归(SUR)§假设要估计以下方程组§y1t=α1+β1’x1t+u1t§y2t=α2+β2’x2t+u2t§y3t=α3+β3’x3t+u3t§由于各种经济形态中存在的共同事件对不同横截面误差的影响方式类似,所以它们是同期相关的§Cov(u1t ,u2t)=σ12, Cov(u2t,u3t)=σ23,Cov(u1t,u3t)=σ13§这种情况下可采用Zellner(1962)的似无相关回归(SUR)方法进行参数估计似无相关回归(SUR)§其步骤为§1、使用OLS方法分别估计每个方程并求残)差(uit§2、使用残差估计方差和协方差(σ)ij§3、使用第2步中求得的估计值求所有参数的广义最小二乘估计值(FGLS)§在EViews中可以直接进行SUR估计Panel Data 模型的基本设定II §N 较大而T 较小。
面板数据模型.讲课文档
其中,
称为复合误差(composite error)。
这一结果与1987年数据的横截面OLS回归结果不一 样。注意,使用混合OLS并不解决遗漏变量问题。
两时期面板数据分析(续4)
另一种方法,考虑了非观测效应与解释变量相关性。
(面板数据模型主要就是为了考虑非观测效应与解 释变量相关性的情形)例如在犯罪方程中,让ai中
为两类:一类是恒常不变的;另一类则随时间而变。
d2t表示当t=1时等于0而当t=2时等于1的一个虚拟变 量,它不随i而变。ai概括了影响yit的全部观测不到 的、在时间上恒定的因素,通常称作非观测效应, 也称为固定效应,即ai在时间上是固定的。特质误 差uit表示随时间变化的那些非观测因素。
两时期面板数据分析(续2)
第三,Panel Data Model可以通过设置虚拟变量对 个别差异(非观测效应)进行控制;即面板数据模 型可以用来有效处理遗漏变量(omitted varaiable) 的模型错误设定问题。
遗漏变量
使用面板数据的一个主要原因是,面板数据可以用 来处理某些遗漏变量问题。
例如,遗漏变量是不随时间而变化的表示个体异质 性的一些变量,如国家的初始技术效率、城市的历 史或个人的一些特征等。这些不可观测的不随时间 变化的变量往往和模型的解释变量相关,从而产生 内生性,导致OLS估计量有偏且不一致。
2000 4203.555 8206.271 5522.762 4361.555 3890.580 4077.961 5317.862 3612.722 4360.420 3877.345 5011.976 8651.893 3793.908 6145.622 6950.713
2001 4495.174 8654.433 6094.336 4457.463 4159.087 4281.560 5488.829 3914.080 4654.420 4170.596 5159.538 9336.100 4131.273 6904.368 7968.327
面板数据模型panel data model
自由度K为模型中解释变量(不包括截距项)的个数。
计量经济学,面板数据模型,王少平
24
六、动态面板数据模型
动态面板模型:解释变量中包含被解释变量的滞后 项。 一般形式:
Yit 1 2 X 2it k X kit Yit 1 it
it i t uit
Iit 1 2 Fit 3Cit Iit 1 i t uit i 1, 2,, N t 1, 2,, T
(5)
计量经济学,面板数据模型,王少平
11
四、静态面板数据模型估计
面板数据一般模型:
Yit 1 2 X 2it k X kit it
计量经济学,面板数据模型,王少平
26
2. LSDV估计的有偏和非一致性
模型(17)可以表示为: Yit 1 D1 N DN Yi,t 1 uit 等价于模型:
Y Y
* i ,t
* i ,t 1
* it
* it
其中:
1 T * Yi ,t 1 Yi ,t 1 Yi ,t T t 1
(18)
其中:uit 为经典误差项, E(i ) 0 E(iuit ) 0
要得到 的一致估计量:需为 Yi,t 1 寻找适当的工具变 量。 GMM以工具变量为基础,核心思想在于利用正交条件 估计未知参数。
计量经济学,面板数据模型,王少平
28
六、动态面板-IV估计
固定效应:如果个体效应或时间效应与模型中的解释变量相关 随机效应:如果个体效应或时间效应与模型中的解释变量不相 关
面板数据模型
面板数据模型面板数据模型(Panel Data Model)是一种经济学和统计学中常用的数据分析方法,它允许研究人员在时间和个体维度上分析数据。
该模型结合了截面数据(Cross-sectional Data)和时间序列数据(Time Series Data),能够捕捉到个体间的异质性和时间的动态变化。
面板数据模型的基本假设是个体间存在固定效应(Fixed Effects)和时间效应(Time Effects),即个体特定的不变因素和时间特定的不变因素会对观测数据产生影响。
通过控制这些效应,面板数据模型可以更准确地估计变量之间的关系。
面板数据模型的普通形式可以表示为:Yit = α + βXit + εit其中,Yit表示第i个个体在第t个时间点的观测值,α是截距项,β是自变量Xit的系数,εit是误差项。
面板数据模型可以通过固定效应模型(Fixed Effects Model)和随机效应模型(Random Effects Model)来估计参数。
固定效应模型假设个体间的差异是固定的,即个体特定的不变因素对观测数据产生影响。
该模型通过引入个体固定效应来控制个体间的差异,估计其他变量对因变量的影响。
随机效应模型假设个体间的差异是随机的,即个体特定的不变因素对观测数据不产生影响。
该模型通过引入个体随机效应来控制个体间的差异,估计其他变量对因变量的影响。
面板数据模型的估计方法包括最小二乘法(Ordinary Least Squares, OLS)、固定效应估计法(Fixed Effects Estimation)和随机效应估计法(Random Effects Estimation)。
最小二乘法是一种常用的估计方法,但在面板数据模型中存在一致性问题。
固定效应估计法通过个体间的差异来估计参数,可以解决一致性问题。
随机效应估计法则通过个体间和时间间的差异来估计参数,可以更全面地捕捉到数据的变化。
面板数据模型在经济学和社会科学研究中具有广泛的应用。
面板数据模型理论知识
1.Panel Data 模型简介Panel Data 即面板数据,是截面数据与时间序列数据综合起来的一种数据类型,是截面上个体在不同时点的重复观测数据。
相对于一维的截面数据和时间序列数据进行经济分析而言,面板数据有很多优点。
(1)由于观测值的增多,可以增加自由度并减少了解释变量间的共线性,提高了估计量的抽样精度。
(2)面板数据建模比单截面数据建模可以获得更多的动态信息,可以构建并检验更复杂的行为模型。
(3)面板数据可以识别、衡量单使用一维数据模型所不能观测和估计的影响,可以从多方面对同一经济现象进行更加全面解释。
Panel Data 模型的一般形式为it Kk kit kit it it x y μβα++=∑=1其中it y 为被解释变量,it x 为解释变量, i =1,2,3……N ,表示N 个个体;t =1,2,3……T ,表示已知T 个时点。
参数itα表示模型的截距项,k 是解释变量的个数,kitβ是相对应解释变量的待估计系数。
随机误差项itμ相互独立,且满足零均值,等方差为2δ的假设。
面板数据模型可以构建三种形式(以截面估计为例):形式一: 不变参数模型 i Kk ki k i x y μβα++=∑=1,又叫混合回归模型,是指无论从时间上还是截面上观察数据均不存在显著差异,故可以将面板数据混合在一起,采用普通最小二乘估计法(OLS )估计参数即可。
形式二:变截距模型i Kk ki k i i x y μβαα+++=∑=1*,*α为每个个体方程共同的截距项,i α是不同个体之间的异质性差异。
对于不同个体或时期而言,截距项不同而解释变量的斜率相同,说明存在不可观测个体异质影响但基本结构是相同的,可以通过截距项的不同而体现出来个体之间的差异。
当i α与i x 相关时,那就说明模型为固定效应模型,当i α与i x 不相关时,说明模型为随机效应模型。
形式三:变参数模型 i Kk ki ki i i x y μβαα+++=∑=1* ,对于不同个体或时期而言,截距项(i αα+*)和每个解释变量的斜率ki β都是不相同的,表明不同个体之间既存在个体异质影响也存在不同的结构影响,即每个个体或时期都对应一个互不相同的方程。
面板数据的模型(panel data model)
面板数据的模型(panel data model)王志刚 2004年11月11日一. 混合数据模型和面板数据模型如果扰动项it ε服从独立同分布假定,而且和解释变量不相关,那么就可以采用混合最小二乘法估计(Pooled OLS ),但是这里要注意POLS 暗含着一个假定就是,截距项和解释变量的系数是相同的,不随着个体和时间而变化。
我们一般采用单因子(one-way effects )模型,假定截距项具有个体异质性,也就是:这种模型是最常见的面板模型(又称为纵列数据longitudinal data ),因为面板数据往往要求个体纬度 N>>T(时间纬度),下面我们基本上以这种模型为例。
it u 是独立同分布,而且均值为0,方差为2u σ。
如对截距项和解释变量系数均有个体的异质性,那么要采用随机系数模型(Random coefficient model ),stata 的xtrchh 过程提供了相应的估计。
双因子模型(two-way ):it t i it u ++=γαε二. 固定效应(Fixed effects ) vs 随机效应(Random effects)如果个体效应i α是一个均值为0,方差为2ασ的独立同分布的随机变量,也就是()0,cov =it i x α,该模型就称为随机效应模型(又称为error component model );如果相关,则称为固定效应模型。
1.在随机效应模型中,it ε在每个个体内部存在着一阶自相关,因为他们都包含着相同的个体效应;此时OLS 无效,而且标准差也失真,应该采用广义最小二乘估计(GLS)其中:是个体按时间的均值;有待估计;我们可以通过对组内和组间估计得到相应的残差,从而可以计算出方差;T k n e e e e nnk nT ubetween between between between within within u 22222,,ˆˆ1σσσσσα-=-'='--=;组间估计:εβ+=..i i x y ;组内估计如下;2.如果个体效应和解释变量相关,OLS 和GLS 都将失效,此时要采用固定效应模型。
《计量经济分析方法与建模》课件第二版第10章 Panel Data 模型
面板数据含有横截面、时间和指标三维信息,利用
面板数据模型可以构造和检验比以往单独使用横截面数
据或时间序列数据更为真实的行为方程,可以进行更加 深入的分析。正是基于实际经济分析的需要,作为非经 典计量经济学问题,同时利用横截面和时间序列数据的 模型已经成为近年来计量经济学理论方法的重要发展之
一。
3
时间)信息的数据结构称为面板数据( panel data )。 有的书中也称为平行数据。本章将利用面板数据的计量
模型简称为Panel Data 模型。
1
经典线性计量经济学模型在分析时只利用了面板数据
中的某些二维数据信息,例如使用若干经济指标的时间序 列建模或利用横截面数据建模。然而,在实际经济分析中,
例10.4 研究企业投资需求模型
5家企业:
GM:通用汽车公司 CH:克莱斯勒公司 GE:通用电器公司 WE:西屋公司 US:美国钢铁公司 I :总投资 M :前一年企业的市场价值 (反映企业的预期利润) K :前一年末工厂存货和设备的价值 (反映企业必要重置投资期望值)
3个变量:
创建Pool对象,选择Objects/New Object/Pool…并在编辑
17
(3) 打开Pool序列的堆积式数据表。需要的话还可以单
击Order+/-按钮进行按截面成员堆积和按日期堆积之间的转 换。 (4) 单击Edit+/-按钮打开数据编辑模式输入数据。 如果有一个Pool包含识别名_CM,_CH,_GE,_WE,
_US,通过输入:I? M? K?,指示EViews来创建如下序列:
选择View/Spreadsheet(stacked data),EViews会要求输
入序列名列表
确认后EViews会打开新建序列的堆积式数据表。我们看 到的是按截面成员堆积的序列,Pool序列名在每列表头,截面
panel data做固定效应模型
panel data做固定效应模型时有下列几种方法:(stata)
假设id表示个体,t表示时间,y为被解释变量,x为解释变量。
假设id 有6组。
1、直接用xtreg命令:
xtreg y x ,i(id) fe
2、采用虚拟变量方法lsdv:
(1)采用xi 前缀方法
xi: reg y x i.id
(2)现产生虚拟变量,然后在用ols回归。
分为3种方法。
第一步:产生虚拟变量
egeni,gen(dumy) /*产生虚拟变量:dumy1 dumy2 ...dumy6*/第二步:回归分析
*方法1:包含截距项,去掉一个虚拟变量,如dumy1
reg y x dumy2-dumy6
*方法2:不包含截距项
reg y x dumy1-dumy6,noc
*方法3:包含截距项和所有的虚拟变量,必须的加约束条件
constraint define 1 dumu1+dumy2+dumy3+dumy4+dumy5+dumy6=0
cnsreg y x dumy1-dumy6,constraint(1)
(3)大量虚拟变量方法
areg y x,absorb(id)
3、采用within估计,但回归的系数的t值需要进行调整
bysort i: egenymean=mean(y)
bysort i: egenxmean=mean(x)
genyd=y-ymean
genxd=x-xmean
regydxd,noc /*无截距项*/
可能还有没有想到的地方,希望大家批评指正。
面板数据模型paneldatamodel
(6)
i 反映不随时间变化的个体上的差异性,被称为个体效应 t 反映不随个体变化的时间上的差异性,被称为时间效应
固定效应:个体效应或时间效应与模型中的解释变量相关 随机效应:个体效应或时间效应与模型中的解释变量不相关
12
四、静态面板数据模型估计
主要分两类:
静态面板数据模型
动态面板数据模型
计量经济学,面板数据模型,王少平 9
三、面板数据模型及其分类
静态面板模型:
Yit 1 2 X 2it L k X kit it it i t uit
i 1, 2,L , N t 1, 2,L ,T
例如:
Iit 1 2Fit 3Cit i t uit
▪ 个体和时间效应为0
Yit 1 2 X 2it L k X kit uit
i 1, 2,L , N t 1, 2,L ,T
(7)
▪ U满足经典假设
▪ 缺陷:假定个体间和不同时点的经济关系是同质的。
计量经济学,面板数据模型,王少平 14
四、静态面板-固定效应LSDV估计
Yit 1 2 X 2it L k X kit it
本数据。
计量经济学,面板数据模型,王少平 3
一、什么是面板数据
例如:4个公司20年的数据 变量:
投资(I) 厂商价值(F)、厂房设备存量(C) 4个公司: 通用电气(GE)、通用汽车(GM)、 美国钢铁(US)、西屋(Westing house) 20年: 1935-1954
计量经济学,面板数据模型,王少平 4
随机效应:如果个体效应或时间效应与模型中的解释变量不相 关
计量经济学,面板数据模型,王少平 8
EVIEWS面板数据分析操作教程及实例解析课件.ppt
再检验只含截距项的模型,最后检验二者都不含的模型。并且认为,只有三个模
型的检验结果都不能拒绝原假设时,我们才认为时间序列是非平稳的,而只要其
中有一个模型的检验结果拒绝了零假设,就可认为时间序列是平稳的。
精品
分析数据的平稳性软 件 操 作
在Pool对象,View/Unit Root Test,输入相应的Pool序列名
精品
协整检验 说 明
原:不存在协整
面板数据的协整检验方法可以分为两大类,一类是建立在Engle and Granger二 步法检验基础上的面板协整检验,具体方法主要有Pedroni检验和Kao检验;另 一类是建立在Johansen协整检验基础上的面板协整检验。
1.Pedroni检验 2.Kao检验 3.Johansen面板协整检验
精品
协整检验操作
Pool序列的协整检验 ※在EViews中打开pool对象,选
择Views/ Cointegration Test…, 则显示协整检验的对话框。
图10.6 面板数据的协整检验的对精话品框
Pedroni检验:
原假设:无协 整关系
此栏目下P值 均小于0.05 存在协整关系
此栏目下P值均 两个小于0.05 存在协整关系 一个大于0.05, 不支持协整
精品
思路一:变量之间是非同阶单整 :序列变换
◎变量之间是非同阶单整的指即面板数据中有些序列平稳而有些序列不平稳,
此时不能进行协整检验与直接对原序列进行回归。
◎对序列进行差分或取对数使之变成同阶序列
若变换序列后均为平稳序列可用变换后的序列直接进行回归
思路二 若变换序列后均为同阶非平稳序列,则请点
精品
方式二(方式是否正确,有待考证)
Panel Data 模型
Panel Data (面板数据)是指对不同时刻的截面个体进行连续观测所得到的多维时间序列数据。
由于这类数据可以整合更多的信息,所以面板数据模型目前在计量经济学、社会学等领域有较为广泛的应用。
一、模型的基本类型一般的线性合成数据模型可表示为:it it itit it y x u αβ'=++(1,,;1,,i N t T == ) (1) 式中,it α为常数项;1(,,)itit Kit x x x '= 为外生变量向量;1(,,)it it Kit βββ'= 为参数向量;K 是外生变量个数;N 为截面单位总数;T 是时期总数。
随机扰动项it u 相互独立,且满足零均值、同方差。
而这里的it α,it β包含了时间和截面效应,it α可以进一步再分成总体效应与个体效应之和,即:it i t ααδη=++ (2)式中,α表示总体效应;i δ表示截面效应;t η表示时期效应。
截面效应和时期效应一起构成个体效应。
如果参数值不随时间的不同而变化,模型(1)可写为:it i i it it y x u αβ'=++ (变系数模型) (3)式中,参数i α与i β的取值只受到截面单元不同的影响。
在参数不随时间变化的情况下,截距和斜率参数可以有如下两种假设: 01H :回归斜率系数相同但截距不同,即有1N ββ== 。
此时模型变为:it i it it y x u αβ'=++ (变截距模型) (4) 02H :回归斜率系数联和截距都相同,即有1N αα== ;1N ββ== 。
此时模型变为:it it it y x u αβ'=++ (5) 注意:这里没有斜率系数不同而截距相同的假设,因为当斜率不同的时候,考虑截距相同没有实际意义。
判断样本数据究竟符合哪种模型形式,可用以下统计量检验:3121()[(1)(1)][(1)]S S N K F S NT N K --+=-+ 2111()[(1)][(1)]S S N K F S NT N K --=-+ 式中,1S 、2S 、3S 分别表示(3)、(4)、(5)式的残差平方和。
paneldata做固定效应模型
paneldata做固定效应模型
panel data做固定效应模型时有下列⼏种⽅法:(stata)
假设id表⽰个体,t表⽰时间,y为被解释变量,x为解释变量。
假设id 有6组。
1、直接⽤xtreg命令:
xtreg y x ,i(id) fe
2、采⽤虚拟变量⽅法lsdv:
(1)采⽤xi 前缀⽅法
xi: reg y x i.id
(2)现产⽣虚拟变量,然后在⽤ols回归。
分为3种⽅法。
第⼀步:产⽣虚拟变量
egeni,gen(dumy) /*产⽣虚拟变量:dumy1 dumy2 ...dumy6*/第⼆步:回归分析*⽅法1:包含截距项,去掉⼀个虚拟变量,如dumy1
reg y x dumy2-dumy6
*⽅法2:不包含截距项
reg y x dumy1-dumy6,noc
*⽅法3:包含截距项和所有的虚拟变量,必须的加约束条件
constraint define 1 dumu1+dumy2+dumy3+dumy4+dumy5+dumy6=0 cnsreg y x dumy1-dumy6,constraint(1)
(3)⼤量虚拟变量⽅法
areg y x,absorb(id)
3、采⽤within估计,但回归的系数的t值需要进⾏调整
bysort i: egenymean=mean(y)
bysort i: egenxmean=mean(x)
genyd=y-ymean
genxd=x-xmean
regydxd,noc /*⽆截距项*/
可能还有没有想到的地⽅,希望⼤家批评指正。
面板数据回归(Panel Data)
一个简单的例子
• yt, xt , t=1,2 • c不随时间而改变,但是随个体变化而改变 • 考虑教育回报问题:yt=β0+βxt+c+ut • 外生性假设:E(ut| xt, c)=0 ⇒E(xt’ut)=0
• 讨论:
– 如果E(xt’c)=0,则可以进行Pooled OLS估计 – 如果:E(xt’c)≠0,则Pooled OLS不一致
面板数据模型的估计量
• Pooled OLS 估计量:
– 前面介绍过 – 如果解释变量xit与ci和uit都不相关,POLS一致 – 但是方差的估计结果有问题 • 总的随机扰动项存在序列相关
• Cov(ci+uit, ci+uit+1) ≠0,且很高
– 如果固定效应面板模型是正确的话,POLS不一致
• 解决办法:一阶差分(时间上相减) △y=β△x+△u △c=0不见了 • 考察古典假设:
– 要求E(△x’△u)=0,即△x与△u不相关 E(△x’△u)=E[(x2-x1)'(u2-u1)] =E(x2’u2)-E(x1’u2)-E(x2’u1)+E(x1’u1) =0 -E(x1’u2)-E(x2’u1) 则E(x1’u2)+E(x2’u1)=0 – 要求△x’△x满列秩,则没有一个△x=0,即每 个x在t=1,2中随时间有变化
严格外生性假设
• 假设
–E(u∣x, ci)=0 –即E(uit∣xi1, xi2,…,xis,…,xiT, ci)=0 –等价于E(yit∣xi1, xi2,…,xis,…,xiT, ci)=xitβ+ci –可以得到E(xituis)=0
• 解释
– 当ci和xit被控制,对任意的s≠t,xis对yit没有偏 效应(patial effect),即解释变量给定条件ci下是 严格外生的
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Panel Data模型
在进行经济分析时经常会遇到时间序列和横截面两 者相结合的数据。例如,在企业投资需求分析中,我们 会遇到多个企业的若干指标的月度或季度时间序列;在 城镇居民消费分析中,我们会遇到不同省市地区的反映 居民消费和居民收入的年度时间序列。本章将前述的企
业或地区等统称为截面,这种具有三维(截面、时期、
12
其中基本名 I 代表企业总投资、M 代表前一年企业的市场价值、K 代 表前一年末工厂存货和设备的价值。每个企业都有单独的 I、M、K 数据。 EViews会自动按附录A中 介绍的标准输入程序读取非堆积数据。并把 每个截面变量看作一个单独序列。注意要按照上述的Pool命名规则命名。
13
2. 堆积数据
9
3. Pool序列概念 一旦选定的序列名和 Pool中的截面成员识别名称相对应, 就可以利用这些序列使用 Pool了。其中关键是要理解 Pool 序 列的概念。 一个 Pool序列实际就是一组序列 , 序列名是由基本名和 所有截面识别名构成的。 Pool序列名使用基本名和“?”占位 符,其中“ ?” 代表截面识别名。如果序列名为 GDPJPN , GDPUSA,GDPUK,相应的Pool序列为GDP?。如果序列名 为JPNGDP,USAGDP,UKGDP,相应的Pool序列为 ?GDP。 当使用一个Pool序列名时,EViews认为将准备使用Pool 序列中的所有序列。EViews会自动循环查找所有截面识别名 称并用识别名称替代“?”。然后会按指令使用这些替代后的 名称了。Pool序列必须通过Pool对象来定义,因为如果没有 截面识别名称,占位符“?”就没有意义。
10.1 Pool对象
EViews对Panel Data模型的估计是通过含有Pool对象 的工作文件和具有面板结构的工作文件来实现的。 处理面板数据的EViews对象称为Pool。通过Pool对象 可以实现对各种变截距、变系数时间序列模型的估计,但 Pool对象侧重分析“窄而长”的数据,即截面成员较少, 而时期较长的侧重时间序列分析的数据。 对于截面成员较多,时期较少的“宽而短”的侧重截 面分析的数据,一般通过具有面板结构的工作文件 (Panel workfile)进行分析。利用面板结构的工作文件 可以实现变截距Panel Data模型以及动态Panel Data模型 的估计。
的数据从上到下依次堆积,每一列代表一个变量:
15
我们称上表数据是以截面成员堆积的,单击Order+/-实现堆 积方式转换,也可以按日期堆积数据:
每一列代表一个变量,每一列内数据都是按年排列的。如果 数据按年排列,要确保各年内截面成员的排列顺序要一致。
16
3. 手工输入/剪切和粘贴 可以通过手工输入数据,也可以使用剪切和粘贴工具输
23
在编辑框内输入计算描述统计量的序列。 EViews 可以
必须注意,Pool对象本身不包含序列或数据。一个 Pool对象只是对基本数据结构的一种描述。因此,删除一 个Pool并不会同时删除它所使用的序列,但修改Pool使用的 原序列会同时改变Pool中的数据。
6
1. 创建Pool对象
在本章中,使用的是一个研究投资需求的例子,包括了五家企业 和三个变量的20个年度观测值的时间序列: 例10.4 研究企业投资需求模型 5家企业: GM:通用汽车公司 CH:克莱斯勒公司 GE:通用电器公司 WE:西屋公司 US:美国钢铁公司 3个变量: I :总投资 M :前一年企业的市场价值 (反映企业的预期利润) K :前一年末工厂存货和设备的价值 (反映企业必要重置投资期望值)
21
10.1.3 输出Pool数据
按照和上面数据输入相反的程序可进行数据输出。由于
EViews可以输入输出非堆积数据,按截面成员堆积和按日期
堆积数据,因此可以利用EViews按照需要调整数据结构。
22
10.1.4 使用Pool数据
每个截面成员的基础序列都是普通序列,因此EViews中对 各单个截面成员序列适用的工具都可使用。另外,EViews还有 专门适用于Pool数据的专用工具。可以使用EViews对与一特定 变量对应的所有序列进行类似操作。 1. 检查数据 用 数 据 表 形 式 查 看 堆 积 数 据 。 选 择 View/Spreadsheet (stacked data),然后列出要显示的序列。序列名包括普通序列 名和Pool序列名。 2. 描述数据 可以使用 Pool对象计算序列的描述统计量。在 Pool 工具栏 选择View/Descriptive Statistics…,EViews会打开如下对话框:
列,或用于估计。也可以使用Pool对象来处理各单独序列。
11
10.1.2 输入Pool数据
有很多种输入数据的方法,在介绍各种方法之前,首 先要理解面板数据的结构,区别堆积数据和非堆积数据形 式。 面板数据的数据信息用三维表示:时期,截面成员, 变量。例如:1950年,通用汽车公司,投资数据。 使用三维数据比较困难,一般要转化成二维数据。有 几种常用的方法。 1. 非堆积数据 存在工作文件的数据都是这种非堆积数据,在这种形 式中,给定截面成员、给定变量的观测值放在一起,但和 其他变量、其他截面成员的数据分开。例如,假定我们的 数据文件为下面的形式:
10
4. 观察或编辑Pool定义
要显示Pool中的截面成员识别名称,单击工具条的
Define按钮,或选择View/Cross-Section Identifiers。如果需 要,也可以对识别名称列进行编辑。
5. Pool序列数据
Pool中使用的数据都存在普通 EViews序列中。这些序列
可以按通常方式使用:可以列表显示,图形显示,产生新序
2
面板数据含有横截面、时期和变量三维信息,利用
面板数据模型可以构造和检验比以往单独使用横截面数
据或时间序列数据更为真实的行为方程,可以进行更加 深入的分析。正是基于实际经济分析的需要,作为非经 典计量经济学问题,同时利用横截面和时间序列数据的 模型已经成为近年来计量经济学理论方法的重要发展之
一。
3
创建Pool对象,选择Objects/New Object/Pool…并在编辑窗口中输入截 面成员的识别名称:
7
对截面成员的识别名称没有特别要求,但必须能使用这 些识别名称建立合法的EViews序列名称。此处推荐在每个识 别名中使用“_”字符,它不是必须的,但把它作为序列名的 一部分,可以很容易找到识别名称。
4
10.1.1 含有Pool对象的工作文件
Pool对象在EViews中扮演着两种角色。首先,Pool对
象中包含了一系列的标识名。这些标识名描述了工作文件
中的面板数据的数据结构。在这个角色中,Pool对象在管 理和处理面板数据上的功能与组对象有些相似。其次,利 用Pool对象中的过程可以实现对各种Panel Data模型的估 计及对估计结果的检验和处理。在这个角色中,Pool对象 与方程对象有些相似
选择View/Spreadsheet(stacked data),EViews会要求输
入序列名列表
确认后EViews会打开新建序列的堆积式数据表。我们看 到的是按截面成员堆积的序列,Pool序列名在每列表头,截面
成员/年代识别符标识每行:
14
Pool数据排列成堆积形式,一个变量的所有数据放在一
起,和其他变量的数据分开。大多数情况下,不同截面成员
I_CM,I_CH,I_GE,I_WE,I_US;M_CM,M_CH, M_GE,M_WE,M_US;K_CM,K_CH,K_用Pool对象从文件输入堆积数据到各单独序列。当 文件数据按截面成员或时期堆积成时,EViews要求: (1) 堆积数据是平衡的 (2) 截面成员在文件中和在Pool中的排列顺序相同。 平衡的意思是,如果按截面成员堆积数据,每个截面成员 应包括正好相同的时期;如果按日期堆积数据,每个日期应包 含相同数量的截面成员观测值,并按相同顺序排列。 特别要指出的是,基础数据并不一定是平衡的,只要在输 入文件中有表示即可。如果观测值中有缺失数据,一定要保证 文件中给这些缺失值留有位置。 要使用 Pool 对象从文件读取数据,先打开 Pool ,然后选择 Procs/Import Pool Data(ASCII,.XLS,.WK?)… ,要使用与 Pool 对象对应的输入程序。
这种仅利用二维信息的模型在很多时候往往不能满足人们
分析问题的需要。例如,在生产函数分析中,仅利用横截 面数据只能对规模经济进行分析,仅利用混有规模经济和 技术革新信息的时间序列数据只有在假设规模收益不变的 条件下才能实现技术革新的分析,而利用面板数据可以同 时分析企业的规模经济(选择同一时期的不同规模的企业 数据作为样本观测值)和技术革新(选择同一企业的不同 时期的数据作为样本观测值),可以实现规模经济和技术 革新的综合分析。
变量)信息的数据结构称为面板数据( panel data )。 有的书中也称为平行数据。本章将利用面板数据的计量
模型简称为Panel Data 模型。
1
经典线性计量经济学模型在分析时只利用了面板数据
中的某些二维数据信息,例如使用若干经济指标的时间序 列建模或利用横截面数据建模。然而,在实际经济分析中,
8
2. Pool序列命名 在 Pool 中使用序列的关键是序列命名:使用基本名和 截面识别名称组合命名。截面识别名称可以放在序列名中 的任意位置,只要保持一致即可。 例如,现有一个Pool对象含有识别名 _JPN, _USA, _UK,想建立每个截面成员的GDP的时间序列,我们就使 用“GDP”作为序列的基本名。 可以把识别名称放在基本名的后面,此时序列名为 GDP_JPN,GDP_USA,GDP_UK;或者把识别名称放 在基本名的前面,此时序列名为 JPN _ GDP , USA _ GDP , UK_GDP。 把识别名称放在序列名的前面,中间或后面并没什么 关系,只要易于识别就行了。但是必须注意要保持一致, 不能这样命名序列: JPNGDP , GDPUSA , UKGDP1 ,因 为EViews无法在Pool对象中识别这些序列。