计量经济学面板数据模型讲义(4-7)
计量经济学面板数据模型讲义4-7
面板数据模型1.面板数据定义。
时间序列数据或截面数据都是一维数据。
例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。
面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。
面板数据是同时在时间和截面空间上取得的二维数据。
面板数据示意图见图1。
面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。
面板数据用双下标变量表示。
例如y i t, i = 1, 2, …, N; t = 1, 2, …, TN表示面板数据中含有N个个体。
T表示时间序列的最大长度。
若固定t不变,y i ., ( i = 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。
图1 N=7,T=50的面板数据示意图例如1990-2000年30个省份的农业总产值数据。
固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。
面板数据由30个个体组成。
共有330个观测值。
对于面板数据y i t, i = 1, 2, …, N; t = 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。
注意:EViwes 3.1、4.1、5.0既允许用平衡面板数据也允许用非平衡面板数据估计模型。
面板数据模型 计量经济学 EVIEWS建模课件
⑶当使用一个Pool序列名时,EViews认为将 准备使用Pool序列中的所有序列。EViews会自动 循环查找所有截面识别名称,并用识别名称来替 代“?”。然后会按指令使用这些替代后的名称 了。Pool序列必须通过Pool对象来定义,因为如 果没有截面识别名称,占位符“?”就没有意义。
使用基本名和截面识别名称组合命名。截面 识别名称可以放在序列名中的任意位置,只要保 持一致即可。例如:GDP_JPN,GDP_USA,GDP_UK等; 其中“GDP”作为序列的基本名。
⑴通过View/Cross-Section Identifiers或选 择工具条的Define按钮,可以显示Pool中的截面成 员识别名称,并可以对其进行编辑。
⑵通过sheet按钮定义一组序列名, 序列名是 由基本名和所有截面识别名构成的。在Pool中的关 键是序列命名: 各序列名的命名规则可以使用基 本名和“?”占位符构成,其中“?”代表截面识 别名。如序列名为GDPJPN,GDPUSA,GDPUK,相应 的Pool序列命名时就要输入GDP?。如果序列名为 JPNGDP,USAGDP,UKGDP,则为 ?GDP。
⑴通过确定工作文件样本来指定堆积数据表中 要包含哪些时间序列观测值。
⑵打开Pool,选择View/Spreadsheet(stacked data),EViews会要求输入序列名列表,可以输入 普 通 序 列 名 或 Pool 序 列 名 。 如 果 是 已 有 序 列 , EViews 会 显 示 序 列 数 据 ; 如 果 这 个 序 列 不 存 在 , EViews会使用已说明的Pool序列的截面成员识别名 称建立新序列或序列组。
⒉ 堆积数据 选择View/Spreadsheet(stacked data), EViews会要求输入序列名列表。
计量经济学第三版潘省初第9章面板数据模型ppt课件
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
初看上去,这些结果似乎是分别回归的结果, 但它们不是。跨产业扰动项协方差的估计值被SUR 程序用来改善估计值,如前面所说的那样,这是为 什么说表面不相关回归实际上是由相关的回归组成。 在我们的例子中,SUR结果与四个方程的OLS结果 差不多。然而,在很多情况下,表面不相关回归显 著改善用最小二乘法得到得估计值。
大多数计量经济分析软件都有运行SUR的命令,表 面不相关回归步骤如下:
1.用OLS法分别估计每个方程,计算和保存回归中 得到的残差; 2.用这些残差来估计扰动项方差和不同回归方程扰 动项之间的协方差; 3.上一步估计的扰动项方差和协方差被用于执行广 义最小二乘法,得到各方程系数的估计值。
表面不相关回归得到的估计值是一致估计值。 用SUR方法和表9-1中的数据估计方程(9.1)- (9.4),结果如下:
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
Yˆ1t 5367.2427.45EMP1t 477.13OTM1t
t: (3.76) (5.97)
(1.62)
R20.66 et218,664,338
Yˆ2t 51,963.17142.87EMP2t1704.48OTM2t
t: (17.33) (24.43)
(1.77)
R20.99 et243,356,773
认识到了贫困户贫困的根本原因,才 能开始 对症下 药,然 后药到 病除。 近年来 国家对 扶贫工 作高度 重视, 已经展 开了“ 精准扶 贫”项 目
面板数据讲义
面板数据模型与应用1.面板数据定义panel data的中译:面板数据、桌面数据、平行数据、纵列数据、时间序列截面数据、混合数据(pool data)、固定调查对象数据。
面板数据定义(1)面板数据定义为相同截面上的个体在不同时点的重复观测数据。
(2)称为纵向(longitudinal)变量序列(个体)的多次测量。
面板数据从横截面(cross section)看,是由若干个体(entity, unit, individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列。
1图1 N=7,T=50的面板数据示意图2面板数据用双下标变量表示。
例如y i t, i = 1, 2, …, N; t = 1, 2, …, Ti对应面板数据中不同个体。
N表示面板数据中含有N个个体。
t对应面板数据中不同时点。
T表示时间序列的最大长度。
若固定t不变,y i ., ( i = 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。
2. 面板数据模型面板数据模型是利用面板数据构建的模型。
面板数据系一组个体在一段时间内的观测值形成的数据集,这里“个体”可以是个人、家庭、企业、行业、地区3或国家(Baltagi,2008)。
1966年,Balestra & Nerlove发表了第一篇利用面板数据模型研究天然气需求估计的论文,此后,面板数据模型这一新的计量分析方法在理论和应用上得到迅速发展,已形成现代计量经济学的一个相对独立的分支。
面板数据模型由于同时使用了截面数据(cross-sectional data)和时间序列数据(time series data),因而可以控制个体的异质性,识别、测量单纯使用这两种数据无法估计的效应;并且具有包含更多的信息、更大的变异和自由度、变量间的共线性也更弱的特性,可得到更精确的参数估计(Hsiao,2003、2008)。
面板数据模型.讲课文档
其中,
称为复合误差(composite error)。
这一结果与1987年数据的横截面OLS回归结果不一 样。注意,使用混合OLS并不解决遗漏变量问题。
两时期面板数据分析(续4)
另一种方法,考虑了非观测效应与解释变量相关性。
(面板数据模型主要就是为了考虑非观测效应与解 释变量相关性的情形)例如在犯罪方程中,让ai中
为两类:一类是恒常不变的;另一类则随时间而变。
d2t表示当t=1时等于0而当t=2时等于1的一个虚拟变 量,它不随i而变。ai概括了影响yit的全部观测不到 的、在时间上恒定的因素,通常称作非观测效应, 也称为固定效应,即ai在时间上是固定的。特质误 差uit表示随时间变化的那些非观测因素。
两时期面板数据分析(续2)
第三,Panel Data Model可以通过设置虚拟变量对 个别差异(非观测效应)进行控制;即面板数据模 型可以用来有效处理遗漏变量(omitted varaiable) 的模型错误设定问题。
遗漏变量
使用面板数据的一个主要原因是,面板数据可以用 来处理某些遗漏变量问题。
例如,遗漏变量是不随时间而变化的表示个体异质 性的一些变量,如国家的初始技术效率、城市的历 史或个人的一些特征等。这些不可观测的不随时间 变化的变量往往和模型的解释变量相关,从而产生 内生性,导致OLS估计量有偏且不一致。
2000 4203.555 8206.271 5522.762 4361.555 3890.580 4077.961 5317.862 3612.722 4360.420 3877.345 5011.976 8651.893 3793.908 6145.622 6950.713
2001 4495.174 8654.433 6094.336 4457.463 4159.087 4281.560 5488.829 3914.080 4654.420 4170.596 5159.538 9336.100 4131.273 6904.368 7968.327
第4讲面板数据模型-PPT文档资料
计量经济学
Econometrics
李平
2019年1月
© School of Management, 2005
第4讲 面板数据模型
主要内容
面板数据(Panel data) 固定效应 随机效应 固定效应和随机效应模型的比较
© School of Management, 2005
若所有的级差截距和基础斜率系数都显著,就可 以得出结论:4家公司的投资函数各不相同,从而 说明这4家公司的数据不能一视同仁,而要区别对 待,单独估计每家公司的X对Y的影响关系
© School of Management, 2005
© School of Management, 2005
第4讲 面板数据模型
混合回归(PLS)
所有系数都不随时间和个体的变化而变化
Y X Xu 1 2 2 3 3
直接用OLS估计
© School of Management, 2005
双击
单击
存在的问题:假设4家不同的公司的截距项和斜率系数 都完全相同,这是相当严格的假设,很可能扭曲了4个 公司Y和X之间关系的真实情况
© School of Management, 2005
例子:投资理论研究
为研究实际总投资(I)对实际资本存量(CAP)和企业 实际价值(PL)的关系,收集了4个公司,即通用电气 (GE)、通用汽车(GM)、美国钢铁(US)和西屋 (WEST),20年(1935-1954)的数据,共80个观测值。
1 9 22 i t 33 i t i t
D U M 5 3 X Xu
U M 3 5 , D U M 3 6 , . . . , D U M 3 5 其中 D 表示时间虚拟变量, 0 表示将1954年的截距项作为基准 由于考虑了回归模型随时间的改变,因此称为时间效 应模型(一个问题:自由度的损失)
第七讲 面板数据模型(Fixed Effect, Random Effect)
Y
it
+ D
2
it 2
... n D itn
X
it
it
3. 对固定效应的模型(2)设定和估计
Y
it
i
t
X
it
it
(1)设定(不含截距项,引进n+T-1个虚拟变量)
Y
it
1 D it1 ... n D itn
2
H
its
基本模型横截面对y的干扰混合影响截距项随机的模型可以改写为其中随机效应模型randomeffect固定效应模型fixedeffect或lsdv截距项模型模型非随机的由截距项体现个体差异截距项模型模型非随机的对模型1不同个体的差异与t无关对同一个个体
第八章 面板数据模型(Panel Data )
• 问题和动机
当 E (Y X it
it
i
X
it
it
对模型(1)
X时
*
*
X 从不同的个体来看 E (Y
) i
) k kt
X
*
E (Y
it
) E (Y kt ) i k
不同个体的差异与 t 无关
对同一个个体:
E (Y
it
) E (Y is ) i i 0
支出合计 C 1741.09 3552.07 4753.23 3479.17 2050.89 1475.16 1357.43 2703.36 1649.18 1554.59 1098.39 1127.37 1330.45 1123.71 1943.3 4147.3 5669.57 4285.13 2319.52 1583.31 1644.79 2927.35 1801.63 1770.56 1185.17 1336.85 1563.15 1030.13
第7章 面板数据模型课件
面板数据的优点
(1)可以控制个体异质性 可以克服未观测到的异质性(unobserved heterogeneity)这种遗漏变量问题。这个异质性是指在面 板数据样本期间内取值恒定的某些遗漏变量。 (2)面板数据模型容易避免多重共线性问题 • 面板数据具有更多的信息; • 面板数据具有更大的变异; • 面板数据的变量间更弱的共线性; • 面板数据模型具有更大的自由度以及更高的效率。 (3)与纯横截面数据或时间序列数据相比,面板数据模型 允许构建并检验更复杂的行为模型。
例 1 表 1 中展示的数据就是一个面板数据的例子。 表 1 华东地区各省市 GDP 历史数据 1995 1996 1997 1998 2462.57 2902.20 3360.21 3688.20 上海 江苏 浙江 安徽 福建 江西 5155.25 3524.79 2003.66 2191.27 1244.04 6004.21 4146.06 2339.25 2583.83 1517.26 6680.34 4638.24 2669.95 3000.36 1715.18 7199.95 4987.50 2805.45 3286.56 1851.98
yit yi ( X it X i ) +随机误差项
其中, y i 和 X i 代表各自变量个体的均值。 上式中,OLS 估计量主要利用的是个体变量对其均值偏离的信 息,随机误差项也仅反映对其个体均值的偏离波动,这是该估计 量被称为组内估计量的原因。
第二步,估计参数α 。由于已经得到了β 的估计值,所以α 的估 计就变得比较简单。
ˆ ) ˆ ( D D ) 1 D (Y X w
ˆ ˆ 其实就是用自变量和解释变量的个体均值和 w 按下列模型计
算出的误差项:
第八章面板数据模型计量经济学陶长琪ppt课件
2019
1
第一节 面板数据
第二节 面板数据回归模型概述
第三节 混合回归模型
第四节 变截距回归模型
第五节 变系数回归模型 第六节 效应检验与模型形式设定检验 第七节 面板数据的单位根检验和协整检验 第八节 案例分析
2019 2
第一节 面板数据
面板数据(Panel Data):也叫平行数据,指 某一变量关于横截面和时间两个维度的数据,记为
K 1 xK 1T u1T
Y1 1eT X11 U1
11
y11 y Y1 12 y1T
1 ui1x 211 x111 1 x u x 1 112 1 e X i 2 212 U 1 T 1 1 i 1 1 x11T uiTx21T
2019
u11 11 Yi i eT X i i Ui i 1 ,2, ,N u 12 21 U 1 1 i i e u K1 1T i T xKi1 xi1 x1i1 x2i1 i x x x x 1i 2 2i 2 Ki 2 i2 Xi xKiT 12 x1iT x2iT xiT
2019 10
对于个体 i 在时期 t 的观测值; ki 是待估参数;uit
xK 11 x11 y11 1 x111 x211 1 y x x 1 x x 212 K 12 12 Y1 12 K 1 1 1eT X 1 112 ki xkituit i 1 yit i ,2 , ,N t 1,2,,T k 1 xK 1T x1T 1 y1T 1 x11T x21T
面板数据模型 计量经济学 EVIEWS建模课件
三、 Pool数据的统计处理 ㈠一般描述统计
在 Pool 中 选 View/ Descriptive Statistics , 有如下话框:
堆积数据
堆积-截 面均值后 的数据
(3)截面成员变量(Cross-section specific): 计算每个截面变量所有时期的描述统计量。是通过 对各单独序列计算统计量而得到的。
(4)时期变量(Time period specific): 计算时 期特性描述统计量。对每一时期,使用pool中所有 截面成员的变量数据计算的统计量。
利用面板数据,采用不同的限制性假设,会 得到不同的面板数据回归计量模型。
㈠面板数据模型的一般形式
在面板数据中,我们设有N个成员,T个时期, 则以i表示截面,以t表示时间;且β0表示截距项 向量,β为回归系数向量。则一般模型形式为:
Yit = β0 + Xitβ + εit 其中Yit是分块被解释变量列向量,xit是解释变量 分块矩阵;β0和分别是对应于N和T的截距和斜 率的参数分块列向量; εit是残差分块列向量。
可以 把时期特 性统计量 存储为序 列对象。
㈢ 其它数据处理方法
⒈生成数据 ⑴可以使用PoolGenr(panelgenr)程序生成或 者修改Pool序列。即点击Pool工具栏的Poolgenr 并输入要生成的方程式,例如输入:r?=I?/I_US, 相当于输入下面五个命令:r_CM = I_CM/I_US; r_CH = I_CH/I_US;r_GE = I_GE/I_US;r_WE = I_WE/I_US;r_US = I_US/I_US。PoolGenr按照输 入的方程在各截面成员间进行循环计算,生成新 的序列或修改已有序列。 ⑵可联合使用PoolGenr和Genr生成新的变量。
第八章面板数据模型计量经济学ppt课件
第五节 变系数回归模型
前面所介绍的变截距模型中,横截面成员的个 体影响是用变化的截距来反映的,即用变化的截距 来反映模型中忽略的反映个体差异的变量的影响。 然而现实中变化的经济结构或不同的社会经济背景 等因素有时会导致反映经济结构的参数随着横截面 个体的变化而变化。因此,当现实数据不支持变截 距模型时,便需要考虑这种系数随横截面个体的变 化而改变的变系数模型。
(4) E (wit wis )
2 v
(t
s)
方差成分GLS法
普通OLS估计虽然仍是E无(w偏itw和is一) 致E估(v计i ,u但it)(其vi不再uis)
有 对效随机估效计应,模因型此进,行一估般计用E。广(v义i2 最v小iu二is 乘v法iui(t GuLituSi)s)
v2
28
随机效应变截距模型的估计 EViews按下列步骤估计随机效应变截距模型(个体)
Y 11eTX 11U 1
11
y11
Y1
y
12
y 1T
1 1
1
1
1
1eT
1
1
x111 u i 1 x 211
X1
U i x112 u
i
2
x 212
x11T u i T x 21T
i
xxKK112112 ii
x11 x12
xK1TK
i
x1T
Y 11eTX 11U 1
9
第二节 面板数据回归模型概述 一、面板数据回归模型的一般形式
K
yit i x ki kit uit k1
其中,i=1, 2, …,N 表示个N个体; t =1, 2, …,T 表 示T个时期;yit为被解释变量, 表示第i个个体在 t 时 期的观测值;xkit 是解释变量, 表示第k个解释变量
金融计量经济第四讲面板数据(Panel Data)模型
Pool中有缺失值,NT 就用除去缺失值后的总观测数代替。 中有缺失值, 就用除去缺失值后的总观测数代替。 中有缺失值 固定影响本身不是直接估计的, 固定影响本身不是直接估计的,计算公式mon选项,来重新估计模型。 选项,来重新估计模型。 该选择截距说明中的 选项
Mean dependent var 0.867553 S.D. dependent var 0.015661 Akaike info criterion 0.163841 Schwarz criterion 1841.697 Hannan-Quinn criter. Durbin-Watson stat 0.000000
(4.6)
固定影响系数中不报告标准差。如果想得到标准差, 固定影响系数中不报告标准差 。 如果想得到标准差 , 应
值得注意的是估计有太多截面成员的截面常数回归模型可 能很费时。 能很费时。
2. 随机影响 (Random Effects) 随机影响模型假设αit 项是共同系数 α 和不随时间改变 的截面说明随机变量u 的和, 是不相关的。 的截面说明随机变量 i 的和,ui 和残差 εi 是不相关的。
e′ eB 2 ˆ σB = B , N −K
其中 eBi = (
ˆ2 ˆ2 σu = σB −
ˆ σε2 T
(6.11)
∑ (y
t
it
−α − xitb)) / T
i=1,2,…, N
e′ eB 是组间回归的SSR 。 如果 σ u 的估计值是负值 , 是组间回归的 ˆ2 B
EViews将返回错误信息。 将返回错误信息。 将返回错误信息 有缺失观测值时T 在各截面成员间是不同的, 有缺失观测值时 i 在各截面成员间是不同的,EViews在进 在进 行方差估计时使用最大T 的值。 行方差估计时使用最大 i 的值。只要缺失观测值的数目可渐进 忽略,估计程序就是一致的。 忽略,估计程序就是一致的。
面板数据模型计量经济学EVIEWS建模课件
下载EViews安装程序后,按照提示进行安装,选择 合适的安装路径和组件。
03
安装完成后,需要配置EViews的环境变量和启动选 项。
EViews软件界面与操作
EViews的界面包括菜单栏、工具栏、工作区、状态栏等部分,用户可以通 过菜单栏选择需要的命令和功能。
工作区是用户进行数据分析和模型估计的主要区域,可以显示数据表格、 图形、方程等。
固定效应模型
在固定效应模型中,个体固定效应被包括在内,这意 味着模型将考虑每个个体特有的不随时间变化的特征 对因变量的影响。在EViews中,可以通过在`xtreg`命 令后加上`fe`来指定固定效应模型。解读固定效应模型 的估计结果时,应注意观察固定效应的系数和显著性 水平,以了解不同个体的固定效应对因变量的影响程 度和显著性。
提高估计精度
相对于单一时间序列或横截面数据模型,面板数据模型能够利用更多的信息,提高估计 的精度。
面板数据模型在经济学研究中的挑战与展望
数据质量和可获得性
高质量的面板数据是进行面板数据分 析的前提,但获取高质量的面板数据 存在一定的难度。
动态面板数据分析
模型选择和设定
在应用面板数据模型时,需要合理选 择和设定模型,以避免模型误设导致 的估计偏误。
社会学研究 面板数据模型在社会学研究中用 于分析社会现象和趋势,如人口 变化、教育发展、犯罪率等。
医学研究 面板数据模型在医学研究中用于 分析疾病发病率、流行趋势、治 疗效果等,为医学研究和公共卫 生政策提供依据。
02
EViews软件介绍
EViews软件概述
EViews是一款专门用于计量经济学和时 间序列分析的软件,提供了一系列强大 的统计分析工具和图形化界面,方便用 户进行数据分析和模型估计。
高级计量经济学 第三章 面板数据模型
高级计量经济学 第三章 面板数据模型
本章内容
什么是面板(平行)数据 利用面板数据建立模型的理由 面板数据模型一般表达形式 固定效应模型 随机效应模型(误差成份模型) 案例分析
可以在统计检验的基础上删除某类或某些虚拟变量,此时 通常不至于出现丢失重要解释变量的错误。
当观察对象很多时,设置虚拟变量的工作变得非常复杂, 需要估计的系数过多。
该方法也无法检验和处理误差项可能存在的序列相关。 利用Panel技术不仅可以提高效率,而且可以做更复杂的模
型估计和统计检验。
16
固定效应模型估计
就我国农村情况而言,这类研究有助于回答是否应 鼓励扩大农户经营规模这一政策问题。
截面数据可以反映规模差异的影响,但无法考 虑技术进步。
时间序列数据将两者的影响混合在一起而难以 分离。
6
将时间序列和截面数据混合使用 的主要理由
Greene的例子
成本函数为 C ostit CYit,P it,T
i j或 t s
E u iu j 0
i j
18
随机效应模型
用OLS方法对前述随机效应模型做估计得到的结果具有一 致性,但误差项出现序列相关。
此时与每个观察对象相对应的T个观察值的误差项可以写 作: wit ui eit
因而w为一个组合误差项,其方差和协方差为:
E wi2t u2 e2
固定效应模型将组间的差别看作是回归方程参数发生改变, 其适用范围仅限于特定的样本。
如果真实情况属于随机效应,那么唯一的问题是产生特殊 的随机误差。
第14章 面板数据模型讲解
(14.1.6)
t统计值 202.2730 p值 0.0000
R 2 0.8409
17.2520
5.7464
-3.1736
0.0000
0.0000
0.0017
(14.1.3)
it i t uit
i 1,2, N t 1,2,T
面板数据:多个观测对象的时间序列数据所组 成的样本数据。
i 反映不随时间变化的个体上的差异性, 被称为个体效应 t 反映不随个体变化的时间上的差异性, 被称为时间效应。
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
R 2 0.8393
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
8
§14.2 固定效应与随机效应
面板数据模型的一般形式:
Yit 0 1 X 1it K X Kit it
(14.2.1)
it i t uit i 1,2,, N t 1,2,, T
以下分析基于模型(14.4.1)的简化设定形式:
Yit Yi ,t 1 it
it i uit
(14.4.2)
E (i uit ) 0
18
其中: uit 为经典误差, E(i ) 0
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
一、动态面板数据模型的内生性问题
(14.3.2)
为解决虚拟变量的完全多重共线性,可直接估计模型:
计量经济学面板数据模型讲义
计量经济学面板数据模型讲义引言计量经济学研究是描述和分析经济现象的数量经验方法。
面板数据模型是计量经济学中常用的模型之一,它能够在保留个体差异的前提下,控制时间和个体的影响,从而更准确地估计经济关系和进行政策分析。
本讲义将介绍面板数据模型的基本概念、估计方法以及模型评估。
1. 面板数据模型基本概念面板数据也被称为纵向数据或追踪数据,它是对同一批个体在一段时间内的观测数据。
面板数据模型的基本概念包括固定效应模型和随机效应模型。
固定效应模型假设个体特定效应与解释变量无关,即个体差异是恒定的。
面板数据中,固定效应模型可以通过差分法进行估计。
差分法的基本思想是,通过个体间的差异消除个体固定效应,从而得到剩余误差项。
1.2 随机效应模型随机效应模型假设个体特定效应与解释变量有关,个体间的差异是随机的。
在随机效应模型中,个体特定效应是一个随机变量,它的估计可以通过最大似然估计法进行。
最大似然估计法能够通过拟合模型的似然函数,找到使似然函数取得最大值的参数估计值。
2. 面板数据模型的估计方法面板数据模型的估计方法包括固定效应估计和随机效应估计。
这两种方法分别适用于固定效应模型和随机效应模型。
固定效应估计可以通过差分法来实现。
差分法的基本步骤包括对面板数据进行平均化,然后对平均后的数据进行估计。
固定效应估计的优点是能够控制个体固定效应和解释变量的共线性问题,但是它忽略了个体特定效应的异质性。
2.2 随机效应估计随机效应估计可以通过最大似然估计方法来实现。
最大似然估计方法的基本思想是通过拟合模型的似然函数,找到使似然函数取得最大值的参数估计值。
随机效应估计的优点是能够同时估计个体特定效应和解释变量的影响,但是它要求平衡面板数据的假设成立。
3. 面板数据模型的模型评估在面板数据模型中,模型评估是非常重要的步骤,它能够帮助我们判断模型的拟合效果和模型的有效性。
模型评估的指标包括R平方、调整R平方以及经济学意义上的解释力。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量经济学面板数据模型讲义(4-7)面板数据模型1.面板数据定义。
时间序列数据或截面数据都是一维数据。
例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。
面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。
面板数据是同时在时间和截面空间上取得的二维数据。
面板数据示意图见图1。
面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。
面板数据用双下标变量表示。
例如y i t, i = 1, 2, …, N; t = 1, 2, …, TN表示面板数据中含有N个个体。
T表示时间序列的最大长度。
若固定t不变,y i ., ( i = 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t= 1, 2, …, T)是纵剖面上的一个时间序列(个体)。
图1 N=7,T=50的面板数据示意图例如1990-2000年30个省份的农业总产值数据。
固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。
面板数据由30个个体组成。
共有330个观测值。
对于面板数据y i t, i = 1, 2, …, N; t = 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。
注意:EViwes 3.1、4.1、5.0既允许用平衡面板数据也允许用非平衡面板数据估计模型。
例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。
数据是7年的,每一年都有15个数据,共105组观测值。
人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。
人均消费和收入的面板数据从纵剖面观察分别见图2和图3。
从横截面观察分别见图4和图5。
横截面数据散点图的表现与观测值顺序有关。
图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。
表1 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格)地区人均消费1996 1997 1998 1999 2000 2001 2002 CP-AH(安徽)3282.466 3646.150 3777.410 3989.581 4203.555 4495.174 4784.364 CP-BJ(北京)5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12 CP-FJ(福建)4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005 CP-HB(河北)3197.339 3868.319 3896.778 4104.281 4361.555 4457.463 5120.485 CP-HLJ(黑龙江)2904.687 3077.989 3289.990 3596.839 3890.580 4159.087 4493.535 CP-JL(吉林)2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874 CP-JS(江苏)3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331 CP-JX(江西)2714.124 3136.873 3234.465 3531.775 3612.722 3914.080 4544.775 CP-LN(辽宁)3237.275 3608.060 3918.167 4046.582 4360.420 4654.420 5402.063 CP-NMG(内蒙古)2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180 CP-SD(山东)3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770 CP-SH(上海)6193.333 6634.183 6866.410 8125.803 8651.893 9336.100 10411.94 CP-SX(山西)2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 4787.561 CP-TJ(天津)4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843 CP-ZJ(浙江)5342.234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210 资料来源:《中国统计年鉴》1997-2003。
表2 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均收入数据(不变价格)地区人均收入1996 1997 1998 1999 2000 2001 2002IP-AH (安徽) 4106.251 4540.247 4770.470 5178.528 5256.753 5640.597 6093.333 IP-BJ (北京) 6569.901 7419.905 8273.418 9127.992 9999.700 11229.66 12692.38 IP-FJ (福建) 4884.731 6040.944 6505.145 6922.109 7279.393 8422.573 9235.538 IP-HB (河北) 4148.282 4790.986 5167.317 5468.940 5678.195 5955.045 6747.152 IP-HLJ (黑龙江) 3518.497 3918.314 4251.494 4747.045 4997.843 5382.808 6143.565 IP-JL (吉林) 3549.935 4041.061 4240.565 4571.439 4878.296 5271.925 6291.618 IP-JS (江苏) 4744.547 5668.830 6054.175 6624.316 6793.437 7316.567 8243.589 IP-JX (江西) 3487.269 3991.490 4209.327 4787.606 5088.315 5533.688 6329.311 IP-LN (辽宁)3899.194 4382.250 4649.789 4968.164 5363.153 5797.010 6597.088 IP-NMG (内蒙古) 3189.414 3774.804 4383.706 4780.090 5063.228 5502.873 6038.922 IP-SD (山东) 4461.934 5049.407 5412.555 5849.909 6477.016 6975.521 7668.036 IP-SH (上海) 7489.451 8209.037 8773.100 10770.09 11432.20 12883.46 13183.88 IP-SX (山西) 3431.594 3869.952 4156.927 4360.050 4546.785 5401.854 6335.732 IP-TJ (天津) 5474.963 6409.690 7146.271 7734.914 8173.193 8852.470 9375.060 IP-ZJ (浙江)6446.5157158.2887860.3418530.3149187.28710485.6411822.00资料来源:《中国统计年鉴》1997-2003。
2000300040005000600070008000900010000110001996199719981999200020012002CPAH CPBJ CPFJ CPHB CPHLJ CPJL CPJS CPJX CPLN CPNMGCPSD CPSH CPSX CPTJ CPZJ20004000600080001000012000140001996199719981999200020012002IPAH IPBJ IPFJ IPHB IPHLJIPJL IPJS IPJX IPLN IPNMGIPSD IPSH IPSX IPTJ IPZJ图2 15个省级地区的人均消费序列(纵剖面)图3 15个省级地区的人均收入序列(file:4panel02)20004000600080001000012000140002468101214CP1996CP1997CP1998CP1999CP2000CP2001CP200220004000600080001000012000140002468101214IP1996IP1997IP1998IP1999IP2000IP2001IP2002图4 15个省级地区的人均消费散点图 图5 15个省级地区的人均收入散点图(7个横截面叠加)(每条连线表示同一年度15个地区的消费值) (每条连线表示同一年度15个地区的收入值)用CP 表示消费,IP 表示收入。
AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG , SD, SH, SX, TJ, ZJ 分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。
15个地区7年人均消费对收入的面板数据散点图见图6和图7。
图6中每一种符号代表一个省级地区的7个观测点组成的时间序列。
相当于观察15个时间序列。
图7中每一种符号代表一个年度的截面散点图(共7个截面)。
相当于观察7个截面散点图的叠加。
2000300040005000600070008000900010000110000400080001200016000IP(1996-2002)CPAH CPBJ CPFJ CPHB CPHLJ CPJL CPJS CPJX CPLN CPNMG CPSD CPSH CPSX CPTJ CPZJ图6 用15个时间序列表示的人均消费对收入的面板数据200040006000800010000120002000400060008000100001200014000IP(1996-2002)CP1996CP1997CP1998CP1999CP2000CP2001CP2002图7 用7个截面表示的人均消费对收入的面板数据(7个截面叠加)为了观察得更清楚一些,图8给出北京和内蒙古1996-2002年消费对收入散点图。