第11章 基本的Panel Data 模型(第三版)
面板数据模型

第十讲经典面板数据模型一、面板数据(panel data)一维数据:时间序列数据(cross section data):变量在时间维度上的数据截面数据(time series data):变量在截面空间维度上的数据)。
二维数据:面板数据(同时在时间和截面空间上取得的,也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。
面板数据=截面数据+时间序列数据。
面板数据用双下标变量表示。
例如y i t, i = 1, 2, …, N; t = 1, 2, …, TN表示面板数据中含有N个个体。
T表示时间序列的最大长度。
若固定t不变,y i ., ( i = 1, 2, …, N)是随机变量在横截面上的N个数据;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。
平衡面板数据(balanced panel data)。
非平衡面板数据(unbalanced panel data)。
例1998-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1。
人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。
表1.中国部分省级地区的居民数据(不变价格,元)二、面板数据模型及其作用1.经典面板数据模型建立在古典假定基础上的线性面板数据模型.2.非经典面板数据模型(1)非平稳时间序列问题的面板数据模型(面板数据协整模型)(2)非线性面板数据模型(如面板数据logit模型, 面板数据计数模型模型)(3)其他模型(如面板数据分位数回归模型)3.面板数据模型作用(1)描述个体行为差异。
(2)Panel Data能够提供更多信息、更多变化性、更少共线性、更多自由度和更高效率。
反观时间序列经常受多重共线性的困扰。
(3)Panel Data能够更好地研究动态调节,横截面分布看上去相对稳定但却隐藏了许多变化,Panel Data由于包含较长时间,能够弄清诸如经济政策变化对经济状况的影响等问题。
panel data

平行数据(Panel Data)模型厦门大学财政系王艺明平行数据(Panel Data)§平行数据是指对不同时刻的横截面个体作连续观测所得到的多维数据。
由于这类数据有着独特的优点,使平行数据模型目前已在计量经济学、社会学等领域有着较为广泛的应用。
§平行数据在EViews中被称为时序与横截面混合数据(pooled time series and cross-section data)。
平行数据模型是一类利用平行数量分析变量间相互关系并预测其变化趋势的计量经济模型。
模型能够同时反映研究对象在时间和横截面单元两个方向上的变化规律及不同时间、不同单元的特性。
Panel Data模型的基本设定§平行数据模型的基本假设:参数齐性假设,即被解释变量y由某一参数的概率分布函数P(y|θ)。
§假定时间序列参数齐性,及参数值不随时间的不同而变化,则平行数据模型可表示为:§yit =αi+βi’xit+εiti=1,…,N; t=1,…,T§xit ’=(x1it,x2it,…,xKit),为外生变量向量,βi’=(β1i ,β2i,…,βKi),为参数向量,K是外生变量个数,T是时期总数§其中参数αi 和βi都是个体时期恒量(individual time-invariant variable),其取值只受到截面单元不同的影响§E(εit )=0; E(εit2)=σi2; E(εitεjt)=σij; E(εitεjt-s)=0Panel Data 模型的基本设定I §根据模型的不同设定通常有三类估计方法§T 较大,N 较小。
通常采用时间序列模型的假设,即T 趋于无穷大,而N 固定、有限。
§该假设下,标准的方法是Zellner 的似无相关回归方法(Zellner Seemingly Unrelated Regression, SUR ),该方法考虑到回归方程间残差的相关性,即E(εit εjt )=σij ,采用GLS 方法估计似无相关回归(SUR)§假设要估计以下方程组§y1t=α1+β1’x1t+u1t§y2t=α2+β2’x2t+u2t§y3t=α3+β3’x3t+u3t§由于各种经济形态中存在的共同事件对不同横截面误差的影响方式类似,所以它们是同期相关的§Cov(u1t ,u2t)=σ12, Cov(u2t,u3t)=σ23,Cov(u1t,u3t)=σ13§这种情况下可采用Zellner(1962)的似无相关回归(SUR)方法进行参数估计似无相关回归(SUR)§其步骤为§1、使用OLS方法分别估计每个方程并求残)差(uit§2、使用残差估计方差和协方差(σ)ij§3、使用第2步中求得的估计值求所有参数的广义最小二乘估计值(FGLS)§在EViews中可以直接进行SUR估计Panel Data 模型的基本设定II §N 较大而T 较小。
Panel data简介

Panel data 简介及其在eviews 中的应用武汉大学经济学系数量经济学教研室《实践教改项目组》编制面板数据(panel data )回归模型与规则的时间序列或截面数据回归模型的区别在于其变量有两个下标,它同时使用截面数据和时间序列数据。
一、panel data 的优点面板数据相对于时间序列数据或截面数据的优点:1.能提供给研究者大量的数据点,这样可以增加自由度并减少解释变量间的共线性,从而改进计量经济估计的有效性。
为了估计模型参数,样本点越多越好。
样本点越多,估计的结果有效性越好,当样本点足够多时,估计结果可以视为具有一致性; 2. 面板数据模型可以从多层面分析经济问题。
3. 与时间序列数据或截面数据相比,面板数据能够更好的进行识别并控制和检验更复杂的行为模型。
二、模型的基本结构和分类面板数据回归模型的主要结构如下:T t N i u a X y it it it ,,2,1,,,2,1,/==++=β (1)其中,i 表示截面维度,可以表示家庭,个人,公司,国家等等;t 表示时间序列维度,是面板数据所研究的时间区间;it X 为解释变量,β为1⨯K 维向量,K 为解释变量的个数,β是斜率,a 是截距。
模型的矩阵形式为:11221111111121111111221111111111⨯⨯⨯⨯⨯⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛''''''+⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛NT NT N T T k NT NT N T T NT NT NT N T T u u u u u u X X X X X X y y y y y y βα 其中()k t t itX X X ,11,1,''=' 众所周知,随机误差项it u 包含了模型解释变量所不能解释的所有其它因素,并且it u 满足一些经典假设,这些假设是我们估计模型参数的基础。
面板数据模型panel data model

自由度K为模型中解释变量(不包括截距项)的个数。
计量经济学,面板数据模型,王少平
24
六、动态面板数据模型
动态面板模型:解释变量中包含被解释变量的滞后 项。 一般形式:
Yit 1 2 X 2it k X kit Yit 1 it
it i t uit
Iit 1 2 Fit 3Cit Iit 1 i t uit i 1, 2,, N t 1, 2,, T
(5)
计量经济学,面板数据模型,王少平
11
四、静态面板数据模型估计
面板数据一般模型:
Yit 1 2 X 2it k X kit it
计量经济学,面板数据模型,王少平
26
2. LSDV估计的有偏和非一致性
模型(17)可以表示为: Yit 1 D1 N DN Yi,t 1 uit 等价于模型:
Y Y
* i ,t
* i ,t 1
* it
* it
其中:
1 T * Yi ,t 1 Yi ,t 1 Yi ,t T t 1
(18)
其中:uit 为经典误差项, E(i ) 0 E(iuit ) 0
要得到 的一致估计量:需为 Yi,t 1 寻找适当的工具变 量。 GMM以工具变量为基础,核心思想在于利用正交条件 估计未知参数。
计量经济学,面板数据模型,王少平
28
六、动态面板-IV估计
固定效应:如果个体效应或时间效应与模型中的解释变量相关 随机效应:如果个体效应或时间效应与模型中的解释变量不相 关
面板数据模型

面板数据模型面板数据模型(Panel Data Model)是一种经济学和统计学中常用的数据分析方法,它允许研究人员在时间和个体维度上分析数据。
该模型结合了截面数据(Cross-sectional Data)和时间序列数据(Time Series Data),能够捕捉到个体间的异质性和时间的动态变化。
面板数据模型的基本假设是个体间存在固定效应(Fixed Effects)和时间效应(Time Effects),即个体特定的不变因素和时间特定的不变因素会对观测数据产生影响。
通过控制这些效应,面板数据模型可以更准确地估计变量之间的关系。
面板数据模型的普通形式可以表示为:Yit = α + βXit + εit其中,Yit表示第i个个体在第t个时间点的观测值,α是截距项,β是自变量Xit的系数,εit是误差项。
面板数据模型可以通过固定效应模型(Fixed Effects Model)和随机效应模型(Random Effects Model)来估计参数。
固定效应模型假设个体间的差异是固定的,即个体特定的不变因素对观测数据产生影响。
该模型通过引入个体固定效应来控制个体间的差异,估计其他变量对因变量的影响。
随机效应模型假设个体间的差异是随机的,即个体特定的不变因素对观测数据不产生影响。
该模型通过引入个体随机效应来控制个体间的差异,估计其他变量对因变量的影响。
面板数据模型的估计方法包括最小二乘法(Ordinary Least Squares, OLS)、固定效应估计法(Fixed Effects Estimation)和随机效应估计法(Random Effects Estimation)。
最小二乘法是一种常用的估计方法,但在面板数据模型中存在一致性问题。
固定效应估计法通过个体间的差异来估计参数,可以解决一致性问题。
随机效应估计法则通过个体间和时间间的差异来估计参数,可以更全面地捕捉到数据的变化。
面板数据模型在经济学和社会科学研究中具有广泛的应用。
第三部分面板模型1 短面板

第三部分面板数据模型——静态面板数据模型(短面板)一、引言1、基本概念混合数据(Pooled Data)面板数据(Panel data)短面板—大N小T(较多的出现在微观调查中)长面板—小N大T(较多的出现在宏观数据中)?30个省份(行业),20年的数据? N,T都不算大静态面板:解释变量不包含被解释变量的滞后值(本章研究静态短面板)动态面板:解释变量包括被解释变量的滞后值。
(下一章研究长面板和动态面板)2、面板模型的优点(1)使经济分析更为全面横截面:研究规模对产出,成本的影响时间序列:技术进步(混同规模)对产,成本的影响面板:同时研究规模,技术进步对产出成本的影响(2)多种共线的问题可以得到缓解(3)解决内生性的问题(重要,控制横截面个体异质性)二、面板模型的形式和分类 1.面板模型的一般的表述形式:,,1Kit it k it k it it k y x u αβ==++∑i=……N, 表示个体 t=1……T, 表示时间N* T 个观察值,如果不对系数施加约束,则无法求解。
这里X -是一组解释变量β-可以是变的,也可以是常数,k k itki ktββββ⎧⎪=⎨⎪⎩常系数模型变系数模型变系数模型 ,i it i αααααγ⎧⎪⎪=⎨⎪⎪+⎩t t 常截距 ,变截距,一维个体效应 ,变截距,一维时间效应 ,变截距,个体、时间效应,二维效应随机误差项可以分解,具体的it i t it u αγε=++ it i it u αε=+it t it u γε=+ it it u ε=其中ε相互独立,零均值,同方差it上述表述过于一般化,我们可以根据情况具体化进行讨论。
根据系数β是否变化,随机误差项μ的构成,以及解释变量和随机项的相关性,可以分类进行处理。
2、面板模型的分类 (1)混合模型模型的截距、系数,对于各个体成员、时间都相同。
,it it it y x u αβ=++或:0,it k k it it y x u αβ=++∑参数与I,t 均无关。
金融计量经济第四讲面板数据(PanelData)模型

• 因为是面板数据,涉及截面与时间,与一般的单方 程模型有所不同。模型(4. 1)实际上代表几种情形。 常用的有如下三种情形: • 情形1: i j , i j , • 情形2: i j , i j , • 情形3: i j , i j , • 理论上讲,根据截距或斜率是否可变,排列组合有 四种情形,上面三种未列出截距相同斜率不同的情 形。这三种是代表性的。 • 由截距和斜率的统计关系,情形2又可分为确定效 应模型与随机效应模型。
二、面板数据模型的检验
• 面板数据模型的检验主要是考虑截距项和斜率项在 不同截面不同时间下是否一致,所以检验的第一个 假设为: • H2: yit X it u, it 即斜率截距相同。 • 如果H2不能成立,则检验H1:yit i X it uit • 如果上面二个假设都不成立,则是斜率和截距都不 相同(情形3)的模型: yit i X it i uit • 一般不考虑截距相同而斜率不同的情况,实际应用 中这种情况没有意义。 • 面板数据模型的检验
• 平行数据或面板数据(panel data),我们也称这 些数据为联合利用时间序列/截面数据(Pooled time series,cross section)指在时间序列上取 多个截面,在这些截面上同时选取样本观测值所 构成的样本数据。面板数据计量经济学模型是近 20年来计量经济学理论方法的重要发展之一,具 有很好的应用价值。 • 适用问题如:生产分析中技术进步与规模影响; 开放式基金赎回影响;上市公司股权结构影响; 投资收益基本面影响等。
(二)截距斜率固定模型
• • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
面板数据模型paneldatamodel

(6)
i 反映不随时间变化的个体上的差异性,被称为个体效应 t 反映不随个体变化的时间上的差异性,被称为时间效应
固定效应:个体效应或时间效应与模型中的解释变量相关 随机效应:个体效应或时间效应与模型中的解释变量不相关
12
四、静态面板数据模型估计
主要分两类:
静态面板数据模型
动态面板数据模型
计量经济学,面板数据模型,王少平 9
三、面板数据模型及其分类
静态面板模型:
Yit 1 2 X 2it L k X kit it it i t uit
i 1, 2,L , N t 1, 2,L ,T
例如:
Iit 1 2Fit 3Cit i t uit
▪ 个体和时间效应为0
Yit 1 2 X 2it L k X kit uit
i 1, 2,L , N t 1, 2,L ,T
(7)
▪ U满足经典假设
▪ 缺陷:假定个体间和不同时点的经济关系是同质的。
计量经济学,面板数据模型,王少平 14
四、静态面板-固定效应LSDV估计
Yit 1 2 X 2it L k X kit it
本数据。
计量经济学,面板数据模型,王少平 3
一、什么是面板数据
例如:4个公司20年的数据 变量:
投资(I) 厂商价值(F)、厂房设备存量(C) 4个公司: 通用电气(GE)、通用汽车(GM)、 美国钢铁(US)、西屋(Westing house) 20年: 1935-1954
计量经济学,面板数据模型,王少平 4
随机效应:如果个体效应或时间效应与模型中的解释变量不相 关
计量经济学,面板数据模型,王少平 8
面板数据模型理论

5.2 面板数据模型理论5.2.1 面板数据模型及类型。
面板数据(panel data )也称时间序列截面数据(time series and cross section data )或混合数据(pool data )。
面板数据是同时在时间和截面空间上取得的二维数据。
面板数据从横截面(cross section )上看,是由若干个体(entity, unit, individual )在某一时刻构成的截面观测值,从纵剖面(longitudinal section )上看是一个时间序列。
面板数据用双下标变量表示。
例如:it y , N i ,,2,1 =;T t ,,2,1 =其中,N 表示面板数据中含有的个体数。
T 表示时间序列的时期数。
若固定t 不变,•i y ),,2,1(N i =是横截面上的N 个随机变量;若固定i 不变,t y •,),,2,1(T t =是纵剖面上的一个时间序列。
对于面板数据来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data )。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data )。
面板数据模型是建立在面板数据之上、用于分析变量之间相互关系的计量经济模型。
面板数据模型的解析表达式为:it it it it it x y μβα++= T j N i ,2,1;,2,1==其中,it y 为被解释变量;it α表示截距项,),,,(21k it it itit x x x x =为k ⨯1维解释变量向量;'21),,,(k it it it it ββββ =为1⨯k 维参数向量;i 表示不同的个体;t 表示不同的时间;it μ为随机扰动项,满足经典计量经济模型的基本假设),0(~2μσμIIDN it 。
面板数据模型通常分为三类。
第11章 面板数据模型

在打开工作文件窗口的基础上,点击主菜单中
的Objects\New Object… ,从而打开New Object(新 对象)选择窗(见图11.3.1)。
图11.4.1 Pool对象定义对话框
在 Type of object 选择区选择 Pool (混
合数据库),在 Name of object 选择区命名
需要在三个编辑框中分别输入相应的解释变量。在
Common coefficients栏中输入的变量斜率相同。在
Cross-section specific(截面设定)栏中输入的变量斜
率随个体不同而不同。在Period specific(时点设定) 栏中输入的变量斜率随时期不同而不同。在Estimation method(估计方式设定)选项区内有三个选项框,可以对 估计形式进行设定: Cross-sectio( 截面 ) 中包括 None( 不选 ) 、 Fixed( 固 定)、Random(随机),分别用来做非个体影响、个体固
这种情形意味着模型在横截面上存在个体影响,不存在结构性的变 化,即解释变量的结构参数在不同横截面上是相同的,不同的只是截距 项,个体影响可以用截距项ai (i=1,2,…,N)的差别来说明,故通常 把它称为变截距模型。
(3)变系数模型:ai≠aj,bi≠bj
这种情形意味着模型在横截面上存在个体影响,又存在
本数据符合变截距、不变系数模型;反之,则认为样本数据符合变系
数模型。
下面介绍假设检验的F统计量的计算方法。 首先计算变截距、变系数模型(11.1.6)的残差平方和S1。
11.3 混合回归模型
混合回归模型
11.4 变截距模型
该模型允许个体成员上存在个体影响,并用截距项的差别
PanelData模型

– 面板数据模型 – 综列数据模型 – 平行数据模型 – 时空数据模型
• 常用Panel Data 模型
– 变截矩模型(Variable-Intercept Models)
固定影响(Fixed-Effects) 随机影响(Random-Effects)
– 变系数模型(Variable-Coefficient Models)
y x u it i it it
i 1 , ,n t 1 , ,T
• 情形2:变截距模型。在横截面上有个体影响,无 结构变化。即个体影响表现为模型中被忽略的反 映个体差异的变量的影响,又分为固定影响和随 机影响两种情况。
y x u it it it
i 1 , ,n t 1 , ,T
i 1
n
Wyy Wyy,i
i1
n
1 S W W W W 2 yy xy xx xy
y x u it i it it
的残差平方和
1 n T y yit nTi1 t1
n T i 1 t 1
1 n T x xit nTi1 t1
固定影响 随机影响
– 动态变截矩模型(Dynamic Models with Variable Intercepts)
固定影响 随机影响
面板数据的模型(panel data model)

面板数据的模型(panel data model)王志刚 2004年11月11日一. 混合数据模型和面板数据模型如果扰动项it ε服从独立同分布假定,而且和解释变量不相关,那么就可以采用混合最小二乘法估计(Pooled OLS ),但是这里要注意POLS 暗含着一个假定就是,截距项和解释变量的系数是相同的,不随着个体和时间而变化。
我们一般采用单因子(one-way effects )模型,假定截距项具有个体异质性,也就是:这种模型是最常见的面板模型(又称为纵列数据longitudinal data ),因为面板数据往往要求个体纬度 N>>T(时间纬度),下面我们基本上以这种模型为例。
it u 是独立同分布,而且均值为0,方差为2u σ。
如对截距项和解释变量系数均有个体的异质性,那么要采用随机系数模型(Random coefficient model ),stata 的xtrchh 过程提供了相应的估计。
双因子模型(two-way ):it t i it u ++=γαε二. 固定效应(Fixed effects ) vs 随机效应(Random effects)如果个体效应i α是一个均值为0,方差为2ασ的独立同分布的随机变量,也就是()0,cov =it i x α,该模型就称为随机效应模型(又称为error component model );如果相关,则称为固定效应模型。
1.在随机效应模型中,it ε在每个个体内部存在着一阶自相关,因为他们都包含着相同的个体效应;此时OLS 无效,而且标准差也失真,应该采用广义最小二乘估计(GLS)其中:是个体按时间的均值;有待估计;我们可以通过对组内和组间估计得到相应的残差,从而可以计算出方差;T k n e e e e nnk nT ubetween between between between within within u 22222,,ˆˆ1σσσσσα-=-'='--=;组间估计:εβ+=..i i x y ;组内估计如下;2.如果个体效应和解释变量相关,OLS 和GLS 都将失效,此时要采用固定效应模型。
面板数据模型

it
it
it
面板数据模型
第6页
得
( )( )
X X Y Y it
i.
it
i.
ˆi t
( )2
X X it
i.
i
t
再预计 i
ˆ i Y i. ˆ X i.
方差预计量为:
e e 2
ˆ
i
( )2
it
i.
t
nt (n 1)
(3)设定检验
H : ...
0
1
2
n
H 1:至少有一个不等
Y X
it
i
it
it
截距项
, i
随机的 i
模型可以改写为:Y it
X W
it
it
其中W
it
i
it
混合影响
面板数据模型
横截面对Y干扰
第2页
二.固定效应模型
Y X
it
i
it
it
模型 (1)截距项
i
模型 (2)
i
t
i,
非随机的
t
对模型(1)
当 X it X *时
...
it
2 it 2
n itn
it
it
面板数据模型
第8页
3.对固定效应模型(2)设定和预计
Y X
it
i
t
it
it
(1)设定(不含截距项, 引进n+T-1个虚拟变量)
Y D D H H X
...
...
it
1 it1
n itn
2 it 2
T
itT
第11章 面板数据模型

回归模型来处理,但这样做就丧失了分析个体特殊 效应的机会。
5
面板数据模型的优点
第一,Panel Data Model通过对不同横截面单元不 同时间观察值的结合,增加了自由度,减少了解释 变量之间的共线性,从而得到更为有效的估计量;
第二,Panel Data Model是对同一截面单元集的重 复观察,能更好地研究经济行为变化的动态性;
第三,Panel Data Model可以通过设置虚拟变量对 个别差异(非观测效应)进行控制;即面板数据模 型可以用来有效处理遗漏变量(omitted varaiable) 的模型错误设定问题。
6
遗漏变量
使用面板数据的一个主要原因是,面板数据可以用 来处理某些遗漏变量问题。 例如,遗漏变量是不随时间而变化的表示个体异质 性的一些变量,如国家的初始技术效率、城市的历 史或个人的一些特征等。这些不可观测的不随时间 变化的变量往往和模型的解释变量相关,从而产生 内生性,导致OLS估计量有偏且不一致。 面板数据对遗漏变量问题的解决得益于面板数据对 同一个个体的重复观测。
比如有关个人、企业或城市、国家的横截面,现有 两年的数据,称之为t=1,t=2。 CRIME2.RAW包含1982和1987年若干城市的犯罪 和失业的数据。如果用1987年为横截面数据做回归, 得到
可以得出增加失业率会降低犯罪率的结论吗?
18
两时期面板数据分析(续1)
上述回归很可能存在遗漏变量问题。 一个解决办法是,控制住更多的因素,如年龄、性 别、教育、执法水平等。 另一种方法是,把影响因变量的观测不到的因素分 为两类:一类是恒常不变的;另一类则随时间而变。
21
Panel Data 模型

Panel Data (面板数据)是指对不同时刻的截面个体进行连续观测所得到的多维时间序列数据。
由于这类数据可以整合更多的信息,所以面板数据模型目前在计量经济学、社会学等领域有较为广泛的应用。
一、模型的基本类型一般的线性合成数据模型可表示为:it it itit it y x u αβ'=++(1,,;1,,i N t T == ) (1) 式中,it α为常数项;1(,,)itit Kit x x x '= 为外生变量向量;1(,,)it it Kit βββ'= 为参数向量;K 是外生变量个数;N 为截面单位总数;T 是时期总数。
随机扰动项it u 相互独立,且满足零均值、同方差。
而这里的it α,it β包含了时间和截面效应,it α可以进一步再分成总体效应与个体效应之和,即:it i t ααδη=++ (2)式中,α表示总体效应;i δ表示截面效应;t η表示时期效应。
截面效应和时期效应一起构成个体效应。
如果参数值不随时间的不同而变化,模型(1)可写为:it i i it it y x u αβ'=++ (变系数模型) (3)式中,参数i α与i β的取值只受到截面单元不同的影响。
在参数不随时间变化的情况下,截距和斜率参数可以有如下两种假设: 01H :回归斜率系数相同但截距不同,即有1N ββ== 。
此时模型变为:it i it it y x u αβ'=++ (变截距模型) (4) 02H :回归斜率系数联和截距都相同,即有1N αα== ;1N ββ== 。
此时模型变为:it it it y x u αβ'=++ (5) 注意:这里没有斜率系数不同而截距相同的假设,因为当斜率不同的时候,考虑截距相同没有实际意义。
判断样本数据究竟符合哪种模型形式,可用以下统计量检验:3121()[(1)(1)][(1)]S S N K F S NT N K --+=-+ 2111()[(1)][(1)]S S N K F S NT N K --=-+ 式中,1S 、2S 、3S 分别表示(3)、(4)、(5)式的残差平方和。
面板数据回归(Panel Data)

• Breusch and Pagan (1980) 检验
– 拉格朗日乘数检验(LM)
– 依赖于对uit的正态假设
• 具体检验统计量为
n T
LM2(TnT1)i1niT1
vˆˆit
2
vˆˆi2t
2
1 vˆˆu
yu
xuˆPOLS
0 1000 6.91
1003 3
0
20 30 30 3.43
• 如果总体很大,抽取的样本单位具有较大 的随机性,那么与个体有关的效应将被视 为具有随机分布的性质
基本假设
yit ci xit uit
• 假设RE.1
• (a) 严格外生性
E(uit|xi,ci)=0,
t=1,2,⋯,T
xi=xi1,xi2,⋯,xiT
yit = αit + xit ' βt + uit , i = 1,2,...,n, t = 1,...,Ti
– 参数太多,不可估计
– 需要对 αit,βt,uit 进行更多的假设限定
• 静态面板数据模型vs.动态面板数据模 型
– 如果xit不包含滞后因变量,上述模型为静态线性 面板数据模型,否则就是动态线性面板数据模型
i 1
i 1
• 在RE.1-RE.3成立时,如果我们用Pooled OLS来估计模型,估计量是一致的
• 但是POLS估计量忽略了随机误差项的结构 信息,所以不是有效的
•39; X )−1 • 因此可以考虑GLS的方法
• RE.1和RE.2假设保证后面的GLS估计结果 是一致的,RE.3保证v具有同方差结构,从 而假设保证FGLS估计结果是最有效的
(整理)PanelData模型的估计过程.

Panel Data模型的估计过程1.建立工作文件:CREATE A 1994 19992.建立Pool对象:在主菜单上点击Object \ New object,选择Pool,并输入Pool对象名:XF3.输入横截面标志:(为便于区别,标志名前加上_ )4.导入/ 输入数据:(1)在Pool窗口中点击View \ Spreadsheet (stacked data )(2)在序列窗口中输入序列名:cons? (注意Pool序列中统配符?都不可省略)(3)在序列窗口中先点击Edit按钮,进入数据输入/编辑状态(4)输入数据,此时可以手工输入,也可以从Excel表中直接复制-粘贴(这个方式较为方便),也可以从Excel文件导入(但必须先将Excel文件另存为win95格式,否则EViews不能识别);另外,序列窗口的数据顺序初始是按地区(横截面)排列,点击order按钮可以改成按年排列。
5.输入/ 生成其他变量数据:(1)再次点击View \ Spreadsheet (stacked data )(2)在序列窗口中输入新序列名:INC?(3)点击Procs \ Generate Pool Serise,生成新的Pool序列——上期消费CONS1:6.估计Panel Data模型:(1)打开Pool对象XF(2)点击Estimate按钮(3)在Estimation窗口中依次估计不同形式的模型:混合模型:在常系数栏(common coefficients)输入解释变量名cons1? inc?,在截据项栏(intercept)选择常数(common)变截据模型:在常系数栏(common coefficients )输入解释变量名cons1? inc?,在截据项栏(intercept )选择固定效应(fixed effects )变系数模型:在截面单元系数栏(cross section specific coefficients )输入解释变量名cons1? inc?, 在截据项栏(intercept )选择固定效应(fixed effects )7.8. Panel Data 模型的识别:∵ F 2={(1148951-299023) /[(28-1)(2+1)]}/[299023/28*5-28*3]=1.965 而 F 2 = 1.965 > F 0.05(81,56)=1.52 (利用Excel 的FINV 函数计算)∴ 拒绝H 20,模型不是混合回归模型又 ∵ F 1={(643899-299023) /[(28-1)*2]}/[299023/28*5-28*3]=1.196而 F 1 =1.196 < F 0.05(54,56)=1.56∴ 接受H 10,模型是变截据模型,而不是变系数模型,即各地区的边际消费倾向相同,差异只表现在平均水平上。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用横截面和时间序列数据的模型已经成为近年来计量经济学理
论方法的重要发展之一。
3
11.1 EViews软件的Pool对象
Eviews软件对Panel Data模型的估计是通过含有Pool对象的 工作文件和具有面板结构的工作文件(Panel workfile)来实现的。 处理面板数据的EViews对象称为Pool。通过Pool对象可以实 现对各种变截距、变系数时间序列模型的估计,但Pool对象侧重 分析“窄而长”的数据,即截面成员较少,而时期较长的侧重时 间序列分析的数据。 对于截面成员较多,时期较少的“宽而短”的侧重截面分析 的数据,一般通过具有面板结构的工作文件(Panel workfile)进
过输入:I? M? K?,指示EViews来创建如下序列:I_CM,I_CH,
I_GE,I_WE,I_US;M_CM,M_CH,M_GE,M_WE,M_US; K_CM,K_CH,K_GE,K_WE,K_US:
18
4. 文件输入
可以使用 Pool对象从文件输入堆积数据到各单独序列。当文件数 据按截面成员或时期堆积成时,EViews要求: (1) 堆积数据是平衡的
17
(3) 打 开 Pool 序 列 的 堆 积 式 数 据 表 。 需 要 的 话 还 可 以 单 击 Order+/-按钮进行按截面成员堆积和按日期堆积之间的转换。 (4) 单击Edit+/-按钮打开数据编辑模式输入数据。 如果有一个Pool包含识别名_CM,_CH,_GE,_WE,_US,通
20
11.1.3 输出Pool数据
按照和上面数据输入相反的程序可进行数据输出。由于EViews可以
输入输出非堆积数据,按截面成员堆积和按日期堆积数据,因此可以利 用EViews按照需要调整数据结构。
21
11.1.4 使用Pool数据
每个截面成员的基础序列都是普通序列,因此EViews中对各单个截
EViews会自动按附录A中 介绍的标准输入程序读取非堆积数据。并 把每个截面变量看作一个单独序列。注意要按照上述的Pool命名规则命名。
13
2. 堆积数据
选择View/Spreadsheet(stacked data),EViews会要求输入序列
名列表
确认后EViews会打开新建序列的堆积式数据表。我们看到的是 按截面成员堆积的序列,Pool序列名在每列表头,截面成员/年代识
1. 非堆积数据
存在工作文件的数据都是这种非堆积数据,在这种形式中,给定
截面成员、给定变量的观测值放在一起,但和其他变量、其他截面成
员的数据分开。例如,假定我们的数据文件为下面的形式:
12
其中基本名 I 代表企业总投资、M 代表前一年企业的市场价值、K 代
表前一年末工厂存货和设备的价值。每个企业都有单独的 I、M、K 数据。
9
3. Pool序列概念
一旦选定的序列名和 Pool 中的截面成员识别名称相对应,就
可以利用这些序列使用Pool了。其中关键是要理解Pool序列的概念。 一个Pool序列实际就是一组序列, 序列名是由基本名和所有截
面识别名构成的。Pool序列名使用基本名和“?”占位符,其中“?”
代表截面识别名。如果序列名为GDPJPN,GDPUSA,GDPUK, 相应的 Pool 序列为 GDP? 。如果序列名为 JPNGDP , USAGDP ,
析企业的规模经济(选择同一时期的不同规模的企业数据作为样本
观测值)和技术革新(选择同一企业的不同时期的数据作为样本观 测值),可以实现规模经济和技术革新的综合分析。
2
面板数据含有横截面、时期和变量三维信息,利用面板数
据模型可以构造和检验比以往单独使用横截面数据或时间序列
数据更为真实的行为方程,可以进行更加深入的分析。正是基 于实际经济分析的需要,作为非经典计量经济学问题,同时利
行分析,将在第12章介绍。利用面板结构的工作文件可以实现变
截距Panel Data模型以及动态Panel Data模型的估计。
4
11.1.1 含有Pool对象的工作文件
Pool对象在EViews中扮演着两种角色。首先,Pool对象中包含
了一系列的标识名。这些标识名描述了工作文件中的面板数据的数
据结构。在这个角色中,Pool对象在管理和处理面板数据上的功能与 组对象有些相似。其次,利用Pool对象中的过程可以实现对各种
11
11.1.2 输入Pool数据
有很多种输入数据的方法,在介绍各种方法之前,首先要理解面
板数据的结构,区别堆积数据和非堆积数据形式。 面板数据的数据信息用三维表示:时期,截面成员,变量。例如: 1950年,通用汽车公司,投资数据。 使用三维数据比较困难,一般要转化成二维数据。有几种常用的 方法。
值留有位置。
要 使 用 Pool 对 象 从 文 件 读 取 数 据 , 先 打 开 Pool , 然 后 选 择 Procs/Import Pool Data(ASCII,.XLS,.WK?)…,要使用与Pool对象对应
பைடு நூலகம்
的输入程序。
19
注明 Pool 序列是按行还 是按列排列,数据是按截面 成员堆积还是按日期堆积。 在编辑框输入序列的名 称。这些序列名应该是普通 序列名或者是Pool名。 填入样本信息,起始格 位置和表单名(可选项)。 如果输入序列用 Pool 序 列名,EViews会用截面成员 识别名创建和命名序列。如 果用普通序列名,EViews会 创建单个序列。 EViews会使用样本信息读入文件到说明变量中。如果输入的是普通 序列名,EViews会把多个数据值输入到序列中,直到从文件中读入的最 后一组数据。
10
4. 观察或编辑Pool定义
要显示Pool中的截面成员识别名称,单击工具条的Define按
钮,或选择View/Cross-Section Identifiers。如果需要,也可以对 识别名称列进行编辑。
5. Pool序列数据
Pool中使用的数据都存在普通EViews序列中。这些序列可以
按通常方式使用:可以列表显示,图形显示,产生新序列,或用 于估计。也可以使用Pool对象来处理各单独序列。
别符标识每行:
14
Pool 数 据排 列
成堆积形式,一个 变量的所有数据放 在一起,和其他变 量的数据分开。大 多数情况下,不同 截面成员的数据从 上到下依次堆积, 每一列代表一个变 量:
15
我们称上表数据是
以截面成员堆积的,单 击Order+/-实现堆积方
式转换,也可以按日期
堆积数据: 每一列代表一个变 量,每一列内数据都是 按年排列的。如果数据 按年排列,要确保各年 内截面成员的排列顺序 要一致。
第十一章 基本的Panel Data模型
在进行经济分析时经常会遇到时间序列和横截面两者相结合的 数据。例如,在企业投资需求分析中,我们会遇到多个企业的若干 指标的月度或季度时间序列;在城镇居民消费分析中,我们会遇到 不同省市地区的反映居民消费和居民收入的年度时间序列。本章将 前述的企业或地区等统称为截面,这种具有三维(截面、时期、变 量)信息的数据结构称为面板数据(panel data)。有的书中也称 为平行数据。本章将利用面板数据的计量模型简称为Panel Data 模 型。
1
经典线性计量经济学模型在分析时只利用了面板数据中的某些
二维数据信息,例如使用若干经济指标的时间序列建模或利用横截
面数据建模。然而,在实际经济分析中,这种仅利用二维信息的模 型在很多时候往往不能满足人们分析问题的需要。例如,在生产函
数分析中,仅利用横截面数据只能对规模经济进行分析,仅利用混
有规模经济和技术革新信息的时间序列数据只有在假设规模收益不 变的条件下才能实现技术革新的分析,而利用面板数据可以同时分
5
Pool对象的核心是建立表示截面成员的名称表。为明显起
见,名称要相对较短。例如,国家作为截面成员时,可以使用 USA代表美国,CAN代表加拿大,UK代表英国。
定义了 Pool的截面成员名称就等于告诉了 EViews ,模型的
数据结构。在上面的例子中,EViews会自动把这个Pool理解成对 每个国家使用单独的时间序列。
例10.4 研究企业投资需求模型
5家企业: GM:通用汽车公司 3个变量: I :总投资
CH:克莱斯勒公司
GE:通用电器公司 WE:西屋公司
M :前一年企业的市场价值
(反映企业的预期利润) K :前一年末工厂存货和设备的价值
US:美国钢铁公司
(反映企业必要重置投资期望值)
创建Pool对象,选择Objects/New Object/Pool…并在编辑窗口中输入截 面成员的识别名称:
必须注意,Pool对象本身不包含序列或数据。一个Pool对象
只是对基本数据结构的一种描述。因此,删除一个Pool并不会同 时删除它所使用的序列,但修改Pool使用的原序列会同时改变
Pool中的数据。
6
1. 创建Pool对象
在本章中,使用的是一个研究投资需求的例子,包括了五家企业和三 个变量的20个年度观测值的时间序列:
(2) 截面成员在文件中和在Pool中的排列顺序相同。
平衡的意思是,如果按截面成员堆积数据,每个截面成员应包括正 好相同的时期;如果按日期堆积数据,每个日期应包含相同数量的截面
成员观测值,并按相同顺序排列。
特别要指出的是,基础数据并不一定是平衡的,只要在输入文件中 有表示即可。如果观测值中有缺失数据,一定要保证文件中给这些缺失
7
对截面成员的识别名称没有特别要求,但必须能使用这些识 别名称建立合法的EViews序列名称。此处推荐在每个识别名中使
用“_”字符,它不是必须的,但把它作为序列名的一部分,可以很
容易找到识别名称。
8
2. Pool序列命名