面板数据的F检验固定效应检验
面板数据模型估计一般要做哪些步骤?
协整检验方法的文献综述:(1)Kao(1999)、Kao and Chiang(2000)利用推广的DF和ADF检验提出了检验面板协整 的方法,这种方法零假设是没有协整关系,并且利用静态面板回归的残差来构建统计量。(2)Pedron(1999)在零假 设是在动态多元面板回归中没有协整关系的条件下给出了七种基于残差的面板协整检验方法。和Kao的方法不同 的是,Pedroni的检验方法允许异质面板的存在。(3)Larsson et al(2001)发展了基于Johansen(1995)向量自回归 的似然检验的面板协整检验方法,这种检验的方法是检验变量存在共同的协整的秩。我们主要采用的是 Pedroni、Kao、Johansen的方法。通过了协整检验,说明变量之间存在着长期稳定的均衡关系,其方程回归残差 是平稳的。因此可以在此基础上直接对原方程进行回归,此时的回归结果是较精确的。这时,我们或许还想进一 步对面板数据做格兰杰因果检验(因果检验的前提是变量协整)。但如果变量之间不是协整(即非同阶单整)的 话,是不能进行格兰杰因果检验的,不过此时可以先对数据进行处理。引用张晓峒的原话,“如果y和x不同阶, 不能做格兰杰因果检验,但可通过差分序列或其他处理得到同阶单整序列,并且要看它们此时有无经济意义。” 下面简要介绍一下因果检验的含义:这里的因果关系是从统计角度而言的,即是通过概率或者分布函数的角度体 现出来的:在所有其它事件的发生情况固定不变的条件下,如果一个事件X的发生与不发生对于另一个事件Y的发 生的概率(如果通过事件定义了随机变量那么也可以说分布函数)有影响,并且这两个事件在时间上又有先后顺 序(A前B后),那么我们便可以说X是Y的原因。考虑最简单的形式,Granger检验是运用F-统计量来检验X的滞后 值是否显著影响Y(在统计的意义下,且已经综合考虑了Y的滞后值;如果影响不显著,那么称X不是Y 的“Granger原因”(Granger cause);如果影响显著,那么称X是Y的“Granger原因”。同样,这也可以用于 检验Y是X的“原因”,检验Y的滞后值是否影响X(已经考虑了X 的滞后对X自身的影响)。 Eviews好像没有在 POOL窗口中提供Granger causality test,而只有unit root test和cointegration test。说明Eviews是无法对 面板数据序列做格兰杰检验的,格兰杰检验只能针对序列组做。也就是说格兰杰因果检验在Eviews中是针对普通 的序列对(pairwise)而言的。你如果想对面板数据中的某些合成序列做因果检验的话,不妨先导出相关序列到一 个组中(POOL窗口中的Proc/Make Group),再来试试。
面板数据分析简要步骤与注意事项(面板单位根—面板协整—回归分析)
面板数据分析简要步骤与注意事项(面板单位根检验—面板协整—回归分析)面板数据分析方法:面板单位根检验—若为同阶—面板协整—回归分析—若为不同阶—序列变化—同阶建模随机效应模型与固定效应模型的区别不体现为R2的大小,固定效应模型为误差项和解释变量是相关,而随机效应模型表现为误差项和解释变量不相关。
先用hausman检验是fixed 还是random,面板数据R-squared值对于一般标准而言,超过0.3为非常优秀的模型。
不是时间序列那种接近0.8为优秀。
另外,建议回归前先做stationary。
很想知道随机效应应该看哪个R方?很多资料说固定看within,随机看overall,我得出的overall非常小0.03,然后within是53%。
fe和re输出差不多,不过hausman检验不能拒绝,所以只能是re。
该如何选择呢?步骤一:分析数据的平稳性(单位根检验)按照正规程序,面板数据模型在回归前需检验数据的平稳性。
李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。
这种情况称为称为虚假回归或伪回归(spurious regression)。
他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。
因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。
因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。
而检验数据平稳性最常用的办法就是单位根检验。
首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。
单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993)很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。
342面板数据的F检验固定效应检验【zj】
面板数据模型( )检验,固定效应检验.面板数据定义。
进度序列数据或截面数据都是一维数据。
例如进度序列数据是变量按进度得到的数据。
截面数据是变量在截面空间上的数据。
面板数据()也称进度序列截面数据()或混合数据()。
面板数据是同时在进度和截面空间上取得的二维数据。
面板数据示意图见图。
面板数据从横截面()上看,是由若干个体(, , )在某一时刻构成的截面观测值,从纵剖面()上看是一个进度序列。
.面板数据用双下标变量表示。
例如, , , …, ; , , …,表示面板数据中含有个个体。
表示进度序列的最大长度。
若固定不变, ., ( , , …, )是横截面上的个随机变量。
若固定不变,. , ( , , …, )是纵剖面上的一个进度序列(个体)。
.图,的面板数据示意图例如年个省份的农业总产值数据。
固定在某一年份上,它是由个农业总产总值数字组成的截面数据。
固定在某一省份上,它是由年农业总产值数据组成的一个进度序列。
面板数据由个个体组成。
共有个观测值。
.对于面板数据, , , …, ; , , …, 来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据()。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据()。
.注意:、、既允许用平衡面板数据也允许用非平衡面板数据估计模型。
例():年中国东北、华北、华东个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表和表。
数据是年的,每一年都有个数据,共组观测值。
.人均消费和收入两个面板数据都是平衡面板数据,各有个个体。
人均消费和收入的面板数据从纵剖面观察分别见图和图。
从横截面观察分别见图和图。
横截面数据散点图的表现与观测值顺序有关。
图和图中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。
. 表年中国东北、华北、华东个省级地区的居民家庭人均消费数据(不变价格)地区人均消费(安徽)(北京)(福建)(河北)(黑龙江)(吉林)(江苏)(江西)(辽宁)(内蒙古)(山东)(上海)(山西)(浙江)资料来源:《中国统计年鉴》。
stata面板数据固定效应的异方差检验结果
标题:Stata面板数据固定效应的异方差检验结果在进行面板数据分析时,固定效应模型是一种常用的方法,它可以帮助研究者控制个体间的不可观测的异质性,并更准确地估计变量间的关系。
然而,在使用固定效应模型进行面板数据分析时,我们也需要关注异方差的存在,因为异方差的存在会影响到模型的稳健性和准确性。
本文将使用Stata软件对固定效应模型进行异方差检验,并共享检验结果。
1. 异方差的定义让我们来了解一下异方差的概念。
异方差是指误差项的方差不是恒定的,而是随着自变量或其他因素的变化而变化。
在面板数据分析中,由于不同个体或单位之间的特征差异,误差项的方差可能存在异方差的情况。
2. Stata软件中固定效应模型的异方差检验方法在Stata软件中,我们可以使用“xttest3”命令来进行固定效应模型的异方差检验。
这个命令可以帮助我们检验面板数据中误差项的异方差性质。
3. Stata命令示例下面是一个在Stata中进行固定效应模型异方差检验的示例:```stataxtset id timextreg y x1 x2, fexttest3```在这个示例中,我们首先使用“xtset”命令来指定面板数据的格式,然后使用“xtreg, fe”命令来拟合固定效应模型,最后使用“xttest3”命令来进行异方差检验。
4. 异方差检验的结果在进行了上述命令后,Stata会输出异方差检验的结果。
我们需要关注的主要指标包括LM统计量、Chisq统计量、以及对应的p值。
5. 结果分析对于LM统计量和Chisq统计量,它们的值越大,对应的p值越小,就越表明存在异方差。
通常情况下,我们会根据LM统计量和Chisq统计量的显著性水平来判断是否存在异方差。
如果p值小于0.05,我们就可以拒绝存在异方差的原假设,即面板数据中存在异方差。
6. 结论通过Stata软件对固定效应模型进行异方差检验,我们可以得出面板数据中是否存在异方差的结论。
如果存在异方差,我们需要在后续分析中进行相应的修正,以确保模型估计的准确性和稳健性。
面板数据模型理论知识
1.Panel Data 模型简介Panel Data 即面板数据,是截面数据及时间序列数据综合起来一种数据类型,是截面上个体在不同时点重复观测数据。
相对于一维截面数据和时间序列数据进行经济分析而言,面板数据有很多优点。
(1)由于观测值增多,可以增加自由度并减少了解释变量间共线性,提高了估计量抽样精度。
(2)面板数据建模比单截面数据建模可以获得更多动态信息,可以构建并检验更复杂行为模型。
(3)面板数据可以识别、衡量单使用一维数据模型所不能观测和估计影响,可以从多方面对同一经济现象进行更加全面解释。
Panel Data 模型一般形式为it K k kit kit it it x y μβα++=∑=1其中it y 为被解释变量,it x 为解释变量, i =1,2,3……N ,表示N 个个体;t=1,2,3……T ,表示已知T 个时点。
参数it α表示模型截距项,k 是解释变量个数,kit β是相对应解释变量待估计系数。
随机误差项it μ相互独立,且满足零均值,等方差为2δ假设。
面板数据模型可以构建三种形式(以截面估计为例):形式一: 不变参数模型 i K k ki k i x y μβα++=∑=1,又叫混合回归模型,是指无论从时间上还是截面上观察数据均不存在显著差异,故可以将面板数据混合在一起,采用普通最小二乘估计法(OLS )估计参数即可。
形式二:变截距模型i K k ki k i i x y μβαα+++=∑=1*,*α为每个个体方程共同截距项,i α是不同个体之间异质性差异。
对于不同个体或时期而言,截距项不同而解释变量斜率相同,说明存在不可观测个体异质影响但基本结构是相同,可以通过截距项不同而体现出来个体之间差异。
当i α及i x 相关时,那就说明模型为固定效应模型,当i α及i x 不相关时,说明模型为随机效应模型。
形式三:变参数模型 i K k ki ki i i x y μβαα+++=∑=1* ,对于不同个体或时期而言,截距项(i αα+*)和每个解释变量斜率ki β都是不相同,表明不同个体之间既存在个体异质影响也存在不同结构影响,即每个个体或时期都对应一个互不相同方程。
STATA面板数据回归(固定效应-随机效应-Hausman检验)
静态面板数据模型
我们一般所说的静态面板数据模型,是指解释变量中不包含被解释变量的滞后项(通
常为一阶滞后项)的情形。但严格地讲,随机干扰项服从某种序列相关(如 AR(1), AR(2), MA(1)等)的模型也不是静态模型。动态模型和静态模型在处理方法上往往有较大的差异。本 节中我们重点介绍两种最为常用的静态模型—固定效应模型和随机效应模型。 考虑如下模型: yit u it = xit β + u it = ai + εit (8.1) (8.2)
假设 1 表明干扰项 ε 与解释变量 x 的当期观察值、前期观察值以及未来的观察值均不相关,也 就是说我们的模型中所有的解释变量都是严格外生的。假设 2 就是一般的同方差假设,在此假 设下模型 (8.1) 的 OLS 估计是 BLUE 的。当此假设无法满足时,我们就需要处理异方差或序列 相关以便得到稳健性估计量。 组内估计量 上面我们已经提到,在假设 1 和假设 2 同时成立的情况下,模型 (8.1) 的 OLS 估计是 BLUE 的。但在实际操作的过程中,如果 N 比较大,那么我们的模型中将包含 (N+K) 个解释变 量,4 计算的工作量往往很大,对于 N 相当大的情况(如 N=10000 ),一般的计算机都无法胜
非均齐方差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.1 8.3.2 8.3.3 8.3.4 异方差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 序列相关 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 方差形式未知时的稳健性估计 . . . . . . . . . . . . . . . . . . . . . . . . . . STATA 实现 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
面板数据分析简要步骤与注意事项(面板单位根—面板协整—回归分析)
面板数据分析简要步骤与注意事项(面板单位根检验—面板协整—回归分析)面板数据分析方法:面板单位根检验—若为同阶—面板协整—回归分析—若为不同阶—序列变化—同阶建模随机效应模型与固定效应模型的区别不体现为R2的大小,固定效应模型为误差项和解释变量是相关,而随机效应模型表现为误差项和解释变量不相关。
先用hausman检验是fixed 还是random,面板数据R-squared值对于一般标准而言,超过0.3为非常优秀的模型。
不是时间序列那种接近0.8为优秀。
另外,建议回归前先做stationary。
很想知道随机效应应该看哪个R方?很多资料说固定看within,随机看overall,我得出的overall非常小0.03,然后within是53%。
fe和re输出差不多,不过hausman检验不能拒绝,所以只能是re。
该如何选择呢?步骤一:分析数据的平稳性(单位根检验)按照正规程序,面板数据模型在回归前需检验数据的平稳性。
李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。
这种情况称为称为虚假回归或伪回归(spurious regression)。
他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。
因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。
因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。
而检验数据平稳性最常用的办法就是单位根检验。
首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。
单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993)很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。
面板数据模型的检验方法研究
面板数据模型的检验方法研究一、本文概述在统计学和经济学的实证研究中,面板数据模型已经成为了一种非常重要的工具。
由于其能够同时考虑时间序列和横截面数据的信息,使得模型设定更加丰富,能够更好地刻画现实世界的复杂性。
然而,随着面板数据模型应用的广泛,如何对其进行准确且有效的检验,确保模型的适用性和预测准确性,成为了亟待解决的问题。
本文旨在探讨面板数据模型的检验方法,以期为相关领域的实证研究提供有益的参考。
具体而言,本文首先将对面板数据模型的基本理论进行梳理,明确其特点和适用场景。
然后,将详细介绍面板数据模型的常见检验方法,包括但不限于单位根检验、协整检验、模型设定检验等。
这些检验方法不仅能够检验模型的内在稳定性和一致性,还能为模型参数的估计和预测提供重要依据。
本文还将对面板数据模型检验方法的最新研究进展进行综述,以期为读者提供全面的视角。
本文将通过实际案例分析,演示面板数据模型检验方法的应用,从而增强文章的实用性和操作性。
总体而言,本文期望通过对面板数据模型检验方法的深入研究,为相关领域的研究者提供一套系统、完整的检验方法体系,以推动面板数据模型在实证研究中的应用和发展。
二、面板数据模型理论基础面板数据模型(Panel Data Model)是计量经济学中一个重要的分析工具,它能够同时处理横截面和时间序列两个维度的数据。
面板数据模型不仅能够控制不可观测的异质性,提高估计效率,还能更好地捕捉数据的动态特征。
因此,面板数据模型在经济、金融、社会学等领域得到了广泛的应用。
面板数据模型的理论基础主要建立在三大类别之上:固定效应模型、随机效应模型和混合效应模型。
固定效应模型假设每个个体的截距项是固定的,不同个体之间的截距项存在差异,但不随时间变化。
随机效应模型则假设截距项是随机的,并且与解释变量不相关。
混合效应模型则假设所有个体的截距项都相同,没有考虑个体差异。
在实际应用中,研究者通常需要根据样本数据和研究目的选择合适的模型。
面板数据模型估计一般要做哪些步骤?
步骤二:协整检验或模型修正
情况一:如果基于单位根检验的结果发现变量之间是同阶单整的,那么我们可以进行协整检验。协整检验是考察 变量间长期均衡关系的方法。所谓的协整是指若两个或多个非平稳的变量序列,其某个线性组合后的序列呈平稳 性。此时我们称这些变量序列间有协整关系存在。因此协整的要求或前提是同阶单整。但也有如下的宽限说法: 如果变量个数多于两个,即解释变量个数多于一个,被解释变量的单整阶数不能高于任何一个解释变量的单整阶 数。另当解释变量的单整阶数高于被解释变量的单整阶数时,则必须至少有两个解释变量的单整阶数高于被解释 变量的单整阶数。如果只含有两个解释变量,则两个变量的单整阶数应该相同。也就是说,单整阶数不同的两个 或以上的非平稳序列如果一起进行协整检验,必然有某些低阶单整的,即波动相对高阶序列的波动甚微弱(有可 能波动幅度也不同)的序列,对协整结果的影响不大,因此包不包含的重要性不大。而相对处于最高阶序列,由 于其波动较大,对回归残差的平稳性带来极大的影响,所以如果协整是包含有某些高阶单整序列的话(但如果所 有变量都是阶数相同的高阶,此时也被称作同阶单整,这样的话另当别论),一定不能将其纳入协整检验。
由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。其中 LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计 量、lm n & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量、Hadri Z 统计量,并且Levin, Lin & Chu t* 统计量、Breitung t统计量的原假设为存在普通的单位根过程,lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量的原假设为存在有效的单位 根过程, Hadri Z统计量的检验原假设为不存在普通的单位根过程。有时,为了方便,只采用两种面板数据单位 根检验方法,即相同根单位根检验LLC(Levin-Lin- Chu)检验和不同根单位根检验Fisher-ADF检验(注:对普 通序列(非面板序列)的单位根检验方法则常用ADF检验),如果在两种检验中均拒绝存在单位根的原假设则我 们说此序列是平稳的,反之则不平稳。如果我们以T(trend)代表序列含趋势项,以I(intercept)代表序列含 截距项,T&I代表两项都含,N(none)代表两项都不含,那么我们可以基于前面时序图得出的结论,在单位根检 验中选择相应检验模式。但基于时序图得出的结论毕竟是粗略的,严格来说,那些检验结构均需一一检验。具体 操作可以参照李子奈的说法:ADF检验是通过三个模型来完成,首先从含有截距和趋势项的模型开始,再检验只 含截距项的模型,最后检验二者都不含的模型。并且认为,只有三个模型的检验结果都不能拒绝原假设时,我们 才认为时间序列是非平稳的,而只要其中有一个模型的检验结果拒绝了零假设,就可认为时间序列是平稳的。此 外,单位根检验一般是先从水平(level)序列开始检验起,如果存在单位根,则对该序列进行一阶差分后继续 检验,若仍存在单位根,则进行二阶甚至高阶差分后检验,直至序列平稳为止。我们记I(0)为零阶单整,I(1)为 一阶单整,依次类推,I(N)为N阶单整。
固定效应检验样本中所有个体的截距参数相同的原假设
固定效应模型是一种用于处理面板数据的统计分析方法,其中研究对象个体的特征在不同时间点或空间点上进行观察。
在这种模型中,我们通常感兴趣的是个体特征在时间或空间上的变化,而不是个体特征之间的差异。
固定效应模型可以帮助我们控制个体特征的不变部分,从而更准确地分析个体特征在时间或空间上的变化。
固定效应模型在经济学、社会学和其他社会科学领域的研究中得到了广泛的应用。
在固定效应模型中,截距参数是一个重要的参数,它代表了个体特征在不受其他因素影响时的水平。
在进行固定效应模型的估计和推断过程中,一个重要的问题是,样本中所有个体的截距参数是否相同。
在这种情况下,我们可以使用固定效应检验来检验样本中所有个体的截距参数是否相同的原假设。
为了进行固定效应检验,我们需要进行以下步骤:1.提出原假设和备择假设在进行固定效应检验之前,我们首先需要提出原假设和备择假设。
在本文中,我们感兴趣的是样本中所有个体的截距参数是否相同,因此原假设可以表述为“样本中所有个体的截距参数相同”,备择假设则可以表述为“样本中所有个体的截距参数不同”。
2.选择适当的统计检验方法在明确原假设和备择假设之后,我们需要选择适当的统计检验方法。
对于固定效应模型中截距参数是否相同的检验,通常可以使用F检验或Wald检验。
F检验用于检验所有截距参数是否同时为零,而Wald 检验则可以用于检验所有截距参数是否相同。
3.进行假设检验在选择了适当的统计检验方法之后,我们进行假设检验。
具体来说,对于F检验,我们计算F统计量并进行显著性检验;对于Wald检验,我们计算Wald统计量并进行显著性检验。
在进行假设检验时,我们需要选择合适的显著性水平,例如5或1。
4.对检验结果进行解释我们对检验结果进行解释。
如果原假设被拒绝,即样本中所有个体的截距参数不相同,我们可以得出结论认为个体之间存在截距参数的差异;如果原假设未被拒绝,即样本中所有个体的截距参数相同,我们可以得出结论认为个体之间不存在截距参数的差异。
面板数据的F检验,固定效应检验
里板数据模型(PANEL DATA)F考验,牢固效力考验之阳早格格创做1.里板数据定义.时间序列数据大概截里数据皆是一维数据.比圆时间序列数据是变量准时间得到的数据;截里数据是变量正在截里空间上的数据.里板数据(panel data)也称时间序列截里数据(time series and cross section data)大概混同数据(pool data).里板数据是共时正在时间战截里空间上博得的二维数据.里板数据示企图睹图1.里板数据从横截里(cross section)上瞅,是由若搞个体(entity, unit, individual)正在某一时刻形成的截里瞅测值,从纵剖里(longitudinal section)上瞅是一个时间序列.里板数据用单下标变量表示.比圆yi t, i = 1, 2, …, N; t = 1, 2, …, TN表示里板数据中含有N个个体.T表示时间序列的最大少度.若牢固t稳定,yi ., ( i = 1, 2, …, N)是横截里上的N个随机变量;若牢固i稳定,y. t, (t = 1, 2, …, T)是纵剖里上的一个时间序列(个体).图1 N=7,T=50的里板数据示企图比圆1990-2000年30个省份的农业总产值数据.牢固正在某一年份上,它是由30个农业总产总值数字组成的截里数据;牢固正在某一省份上,它是由11年农业总产值数据组成的一个时间序列.里板数据由30个个体组成.公有330个瞅测值.对付于里板数据yi t, i = 1, 2, …, N; t = 1, 2, …, T去道,如果从横截里上瞅,每个变量皆有瞅测值,从纵剖里上瞅,每一期皆有瞅测值,则称此里板数据为仄稳里板数据(balanced panel data).若正在里板数据中拾得若搞个瞅测值,则称此里板数据为非仄稳里板数据(unbalanced panel data).注意:EViwes 3.1、4.1、5.0既允许用仄稳里板数据也允许用非仄稳里板数据预计模型.例1(file:panel02):1996-2002年华夏东北、华北、华东15个省级天区的住户家庭人均消耗(稳定代价)战人均支进数据睹表1战表2.数据是7年的,每一年皆有15个数据,共105组瞅测值.人均消耗战支进二个里板数据皆是仄稳里板数据,各有15个个体.人均消耗战支进的里板数据从纵剖里瞅察分别睹图2战图3.从横截里瞅察分别睹图4战图5.横截里数据集面图的表示与瞅测值程序有闭.图4战图5经纪均消耗战支进瞅测值程序是按天区名的汉语拼音字母程序排序的.住户家庭人均消耗数据(稳定代价)天区人均消耗1996199719981999200020012002 CP-AH(安徽)CP-BJ(北京)CP-FJ(祸建)CP-HB(河北)CP-HLJ(乌龙江)CP-JL(凶林)CP-JS(江苏)CP-JX(江西)CP-LN(辽宁)CP-NMG(内受古)CP-SD(山东)CP-SH(上海)CP-SX(山西)CP-TJ(天津)CP-ZJ(浙江)资料根源:《华夏统计年鉴》1997-2003.住户家庭人均支进数据(稳定代价)天区人均支进1996199719981999200020012002 IP-AH(安徽)IP-BJ(北京)IP-FJ(祸建)IP-HB(河北)IP-HLJ(乌龙江)IP-JL(凶林)IP-JS(江苏)IP-JX(江西)IP-LN(辽宁)IP-NMG(内受古)IP-SD(山东)IP-SH(上海)IP-SX(山西)IP-TJ(天津)IP-ZJ(浙江)资料根源:《华夏统计年鉴》1997-2003.图2 15个省级天区的人均消耗序列(纵剖里)图3 15个省级天区的人均支进序列(file:4panel02)图4 15个省级天区的人均消耗集面图图5 15个省级天区的人均支进集面图(7个横截里叠加)(每条连线表示共一年度15个天区的消耗值) (每条连线表示共一年度15个天区的支进值)用CP表示消耗,IP表示支进.AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、祸建省、河北省、乌龙江省、凶林省、江苏省、江西省、辽宁省、内受古自治区、山东省、上海市、山西省、天津市、浙江省.15个天区7年人均消耗对付支进的里板数据集面图睹图6战图7.图6中每一种标记代表一个省级天区的7个瞅测面组成的时间序列.相称于瞅察15个时间序列.图7中每一种标记代表一个年度的截里集面图(共7个截里).相称于瞅察7个截里集面图的叠加.图6 用15个时间序列表示的人均消耗对付支进的里板数据图7 用7个截里表示的人均消耗对付支进的里板数据(7个截里叠加)为了瞅察得更领会一些,图8给出北京战内受古1996-2002年消耗对付支进集面图.从图中不妨瞅出,无论是从支进仍旧从消耗瞅内受古的火仄皆矮于北京市.内受古2002年的支进与消耗规模还不如北京市1996年的大.图9给出该15个省级天区1996战2002年的消耗对付支进集面图.可睹6年之后15个天区的消耗战支进皆有了相映的普及.图8 北京战内受古1996-2002年消耗对付支进时序图图9 1996战2002年15个天区的消耗对付支进集面图2.里板数据的预计.用里板数据建坐的模型常常有3种.即混同预计模型、牢固效力模型战随机效力模型.2.1 混同预计模型.如果从时间上瞅,分歧个体之间不存留隐著性好别;从截里上瞅,分歧截里之间也不存留隐著性好别,那么便不妨曲交把里板数据混同正在所有用一般最小二乘法(OLS)预计参数.如果从时间战截里瞅模型截距皆不为整,且是一个相共的常数,以二变量模型为例,则建坐如下模型,yit = a +b1 xit +eit, i = 1, 2, …, N; t = 1, 2, …,T (1)a 战b1不随i,t变更.称模型(1)为混同预计模型.以例1中15个天区1996战2002年数据建坐闭于消耗的混同预计模型,得截止如下:图10EViwes预计要领:正在挨启处事文献窗心的前提上,面打主功能菜单中的Objects键,选New Object功能,进而挨启New Object(新对付象)采用窗.正在Type of Object采用区采用Pool(混同数据库),面打OK键,进而挨启Pool (混同数据)窗心.正在窗心中输进15个天区标记AH(安徽)、BJ(北京)、…、ZJ(浙江).工具栏中面打Sheet 键,进而挨启Series List(列写序列名)窗心,定义变量CP?战IP?,面打OK键,Pool(混同大概合并数据库)窗心隐现里板数据.正在Pool窗心的工具栏中面打Estimate 键,挨启Pooled Estimation(混同预计)窗心如下图.图11正在Dependent Variable(相依变量)采用窗挖进CP?;正在Common coefficients(系数相共)采用窗挖进IP?;Cross section specific coefficients(截里系数分歧)采用窗脆持空黑;正在Intercept(截距项)采用窗面打Common;正在Weighting(权数)采用窗面打No weighting.面打Pooled Estimation(混同预计)窗心中的OK键.得输出截止如图10.相映表黑式是= 129.6313+0.7587IPit15个省级天区的人均开销仄稳占支进的76%.如果从时间战截里上瞅模型截距皆为整,便不妨建坐不含截距项的(a = 0)的混同预计模型.以二变量模型为例,建坐混同预计模型如下,yit = b1 xit +eit, i = 1, 2, …, N; t = 1, 2, …,T (2)对付于本例,果为上式中的截距项有隐著性(t = 2.0 > t0.05 (103) = 1.99),所以建坐截距项为整的混同预计模型是分歧适的.EViwes预计要领:正在Pooled Estimation(混同预计)对付话框中Intercept(截距项)采用窗中选None,其余选项共上.2.2 牢固效力模型.正在里板数据集面图中,如果对付于分歧的截里大概分歧的时间序列,模型的截距是分歧的,则不妨采与正在模型中加假造变量的要领预计返回参数,称此种模型为牢固效力模型(fixed effects regression model).牢固效力模型分为3种典型,即个体牢固效力模型(entity fixed effects regression model)、时刻牢固效力模型(time fixed effects regression model)战时刻个体牢固效力模型(time and entity fixed effects regression model).底下分别介绍.(1)个体牢固效力模型.个体牢固效力模型便是对付于分歧的个体有分歧截距的模型.如果对付于分歧的时间序列(个体)截距是分歧的,然而是对付于分歧的横截里,模型的截距不隐著性变更,那么便该当建坐个体牢固效力模型,表示如下,yit = b1 xit +g1 W1 + g2W2 + … +gNWN +eit, t = 1, 2, …, T (3)其中Wi=eit, i = 1, 2, …, N; t = 1, 2, …, T,表示随机缺面项.yit, xit, i = 1, 2, …, N; t = 1, 2, …, T分别表示被阐明变量妥协释变量.模型(3)大概者表示为y1t = g1 +b1 x1t +e1t, i = 1(对付于第1个个体,大概时间序列),t = 1, 2, …, Ty2t = g2 +b1 x2t +e2 t, i = 2(对付于第2个个体,大概时间序列),t = 1, 2, …, T…yN t = gN +b1 xN t +e N t, i = N(对付于第N个个体,大概时间序列),t = 1, 2, …, T写成矩阵形式,y1 = (1 x1) +e1 = g1 +x1 b +e1…yN = (1 xN) +eN = gN + xNb+eN上式中yi,gi,ei,xi皆是N´1阶列背量.b为标量.当模型中含有k个阐明变量时,b为k´1阶列背量.进一步写成矩阵形式,= + b +上式中的元素1,0皆是T´1阶列背量.里板数据模型用OLS要领预计时应谦脚如下5个假定条件:(1)E(eit|xi1, xi2, …, xiT, ai) = 0.以xi1, xi2, …, xiT, ai为条件的eit的憧憬等于整.(2)(xi1, xi2, …, xiT), ( yi1, yi2, …, yiT), i = 1, 2, …, N分别去自于共一个共同分集总体,并相互独力.(3)(xit, eit)具备非整的有限值4阶矩.(4)阐明变量之间不存留真足共线性.(5)Cov(eit eis|xit,xis, ai) = 0, t ¹ s.正在牢固效力模型中随机缺面项eit正在时间上利害自相闭的.其中xit代表一个大概多个阐明变量.对付模型(1)举止OLS预计,局部参数预计量皆是无偏偏的战普遍的.模型的自由度是NT –1–N.当模型含有k个阐明变量,且N很大,相对付较小时,果为模型中含有k + N个被估参数,普遍硬件真止OLS运算很艰易.正在计量经济教硬件中是采与一种特殊处理办法举止OLS预计.预计本理是,先用每个变量减其组内均值,把数据核心化(entity-demeaned),而后用变更的数据先预计个体牢固效力模型的返回系数(不包罗截距项),而后利用组内均值等式预计截距项.那种要领预计起去速度快.简曲分3步如下.(1)最先把变量核心化(entity-demeaned).仍以单阐明变量模型(3)为例,则有= gi+ b1 + , i = 1, 2, …, N (4)其中 = ,= , = , i = 1, 2, …, N.公式(1)、(4)相减得,(yit - ) = b1(xit -) + (eit- ) (5)令(yit - ) = ,(xit -) = ,(eit- ) = ,上式写为= b1 + (6)用OLS法预计(1)、(6)式中的b1,截止是一般的,然而是用(6)式预计,不妨缩小被估参数个数.(2)用OLS法预计返回参数(不包罗截距项,即牢固效力).正在k个阐明变量条件下,把用背量形式表示,则利用核心化数据,按OLS法预计公式预计个体牢固效力模型中返回参数预计量的圆好协圆好矩阵预计式如下,() = ( ' )-1 (7)其中 = ,是相对付于的残好背量.(3)预计返回模型截距项,即牢固效力参数gi.= - (8)以例1(file:panel02)为例得到的个体牢固效力模型预计截止如下:注意:个体牢固效力模型的EViwes输出截止中不大众截距项.图12EViwes预计要领:正在EViwes的Pooled Estimation对付话框中Intercept选项中选Fixed effects.其余选项共上.注意:(1)个体牢固效力模型的EViwes输出截止中不大众截距项.(2)EViwes输出截止中不给出形貌个体效力的截距项相映的尺度好战t值.不认为截距项是模型中的要害参数.(3)当对付个体牢固效力模型采用加权预计时,输出截止将给出加权预计战非加权预计二种统计量评介截止.(4)输出截止的联坐圆程组形式不妨通过面打View选Representations功能赢得.(5)面打View选Wald Coefficient Tests…功能不妨对付模型的斜率举止Wald考验.(6)面打View选Residuals/Table, Graphs, Covariance Matrix, Correlation Matrix功能不妨分别得到按个体预计的残好序列表,残好序列图,残好序列的圆好协圆好矩阵,残好序列的相闭系数矩阵.(7)面打Procs选Make Model功能,将会出现预计截止的联坐圆程形式,进一步面打Solve键,正在随后出现的对付话框中不妨举止径背战固态预测.输出截止的圆程形式是(55.0)= 北京+ x2t = 1053.2 + 0.70x2t… (55.0)= 浙江+ x15t = 714.2 + 0.70x15t(55.0)从截止瞅,北京、上海、浙江是消耗函数截距(自收消耗)最大的3个天区.相对付于混同预计模型去道,是可有需要建坐个体牢固效力模型不妨通过F考验去完毕.本假设H0:分歧个体的模型截距项相共(建坐混同预计模型).备择假设H1:分歧个体的模型截距项分歧(建坐个体牢固效力模型).F统计量定义为:F= = (9)其中SSEr,SSEu分别表示拘束模型(混同预计模型)战非拘束模型(个体牢固效力模型)的残好仄圆战.非拘束模型比拘束模型多了N-1个被估参数.(混同预计模型给出大众截距项.)注意:当模型中含有k个阐明变量时,F统计量的分母自由度是NT-N-k.用上例预计,已知SSEr = 4824588,SSEu = 2270386,果为F= 7.15> F0.05(14, 89) = 1.81,所以,中断本假设.论断是该当建坐个体牢固效力模型.(2)时刻牢固效力模型.时刻牢固效力模型便是对付于分歧的截里(时刻面)有分歧截距的模型.如果确知对付于分歧的截里,模型的截距隐著分歧,然而是对付于分歧的时间序列(个体)截距是相共的,那么该当建坐时刻牢固效力模型,表示如下,yit = b1 xit +a1 + a2D2 + … +aT DT+eit, i = 1, 2, …,N (10)其中Dt=eit, i = 1, 2, …, N; t = 1, 2, …, T,表示随机缺面项.yi t, xit, i = 1, 2, …, N; t = 1, 2, …, T分别表示被阐明变量妥协释变量.模型(10)也可表示为yi1 = a1 +b1 xi1 + ei1, t = 1,(对付于第1个截里),i = 1, 2, …, Nyi2 = (a1 +a2) +b1 xi2 + ei2, t = 2,(对付于第2个截里),i = 1, 2, …, N…yiT = (a1 +aT) +b1 xiT + eiT, t = T,(对付于第T个截里),i = 1, 2, …, N如果谦脚上述模型假定条件,对付模型(2)举止OLS预计,局部参数预计量皆具备无偏偏性战普遍性.模型的自由度是NT –T-1.图13EViwes预计要领:正在Pooled Estimation(混同预计)窗心中的Dependent Variable(相依变量)采用窗挖进CP?;正在Common coefficients(系数相共)采用窗挖进IP? 战假造变量D1997, D1998, D1999, D2000, D2001, D2002;正在Cross section specific coefficients(截里系数分歧)采用窗脆持空黑;正在Intercept(截距项)采用窗面打Common;正在Weighting(权数)采用窗面打No weighting.面打Pooled Estimation(混同预计)窗心中的OK键.以例1为例得到的时刻牢固效力模型预计截止如下:(1.5) (74.6)(1.5) (0.4) (74.6)…(1.5) (0.4) (74.6)相对付于混同预计模型去道,是可有需要建坐时刻牢固效力模型不妨通过F考验去完毕.H0:对付于分歧横截里模型截距项相共(建坐混同预计模型).H1:对付于分歧横截里模型的截距项分歧(建坐时刻牢固效力模型).F统计量定义为:F= = (11)其中SSEr,SSEu分别表示拘束模型(混同预计模型的)战非拘束模型(时刻牢固效力模型的)的残好仄圆战.非拘束模型比拘束模型多了T-1个被估参数.注意:当模型中含有k个阐明变量时,F统计量的分母自由度是NT-T- k.用上例预计,已知SSEr= 4824588,SSEu= 4028843,果为F= 3.19> F0.05(14, 89) = 2.2,中断本假设,论断是该当建坐时刻牢固效力模型.(3)时刻个体牢固效力模型.时刻个体牢固效力模型便是对付于分歧的截里(时刻面)、分歧的时间序列(个体)皆有分歧截距的模型.如果确知对付于分歧的截里、分歧的时间序列(个体)模型的截距皆隐著天不相共,那么该当建坐时刻个体效力模型,表示如下,yit = b1 xit +a1+a2D2 +…+aT DT+g1W1+g2W2+…+gNWN+eit, i=1,2,…,N,t = 1, 2, …, T(12)其中假造变量Dt= (注意不是从1启初)Wi= (注意是从1启初)eit, i = 1, 2, …, N; t = 1, 2, …, T,表示随机缺面项.yi t, xit, (i = 1, 2, …, N; t = 1, 2, …, T)分别表示被阐明变量妥协释变量.模型也可表示为y11 = a1 +g1 +b1 x11 + e11, t = 1,i = 1(对付于第1个截里、第1个个体)y21 = a1 +g2 +b1 x21 + e21, t = 1,i = 2(对付于第1个截里、第2个个体)…yN1 = a1 +gN +b1 xN1 + eN1, t = 1,i = N(对付于第1个截里、第N个个体)y12 = (a1 +a2) +g1 +b1 x12 + e12, t = 2,i = 1(对付于第2个截里、第1个个体)y22 = (a1 +a2) +g2 +b1 x22 + e22, t = 2,i = 2(对付于第2个截里、第2个个体)…yN2 = (a1 +a2) +gN +b1 xN2 + eN2, t = 2,i = N(对付于第2个截里、第N个个体)…y1T = (a1 +aT) +g1 +b1 x12 + e1T, t = T,i = 1(对付于第T个截里、第1个个体)y2T = (a1 +aT) +g2 +b1 x22 + e2T, t = T,i = 2(对付于第T个截里、第2个个体)…yNT = (a1 +aT) +gN +b1 xNT + eNT, t = T,i = N(对付于第T个截里、第N个个体)如果谦脚上述模型假定条件,对付模型(12)举止OLS预计,局部参数预计量皆是无偏偏的战普遍的.模型的自由度是NT– N–T.注意:当模型中含有k个阐明变量时,F统计量的分母自由度是NT– N -T- k+1.以例1为例得到的截里、时刻牢固效力模型预计截止如下:图14EViwes预计要领:正在Pooled Estimation(混同预计)窗心中的Dependent Variable(相依变量)采用窗挖进CP?;正在Common coefficients(系数相共)采用窗挖进IP? 战假造变量D1997, D1998, D1999, D2000, D2001, D2002;正在Cross section specific coefficients(截里系数分歧)采用窗脆持空黑;正在Intercept(截距项)采用窗中选Fixed effects;正在Weighting(权数)采用窗面打No weighting.面打Pooled Estimation(混同预计)窗心中的OK键.注意:(1)对付于第1个截里(t=1)EViwes输出截止中把(a1+gi), (i = 1, 2, …, N)预计正在所有.(2)对付于第2, …, T个截里(t=1)EViwes输出截止中分别把(a1 +at), (t = 2, …, T)预计正在所有.输出截止如下:= 1996 + x11 = 537.9627 + 0.6712x11,(1996年安徽省)= 1996 + x21 = 1223.758 + 0.6712x21,(1996年北京市)…= 1997 + x11 = 98.91126 + 0.6712x11,(1997年安徽省)= 1997 + x21 = 98.91126 +1223.758 +0.6712x21,(1997年北京市)…= 2002 + + x15,7 = (183.3882 +870.4197) + 0.6712x15,1,(2002年浙江省)相对付于混同预计模型去道,是可有需要建坐时刻个体牢固效力模型不妨通过F考验去完毕.H0:对付于分歧横截里,分歧序列,模型截距项皆相共(建坐混同预计模型).H1:分歧横截里,分歧序列,模型截距项各不相共(建坐时刻个体牢固效力模型).F统计量定义为:F= =(13)其中SSEr,SSEu分别表示拘束模型(混同预计模型的)战非拘束模型(时刻个体牢固效力模型的)的残好仄圆战.非拘束模型比拘束模型多了N+T个被估参数.注意:当模型中含有k个阐明变量时,F统计量的分母自由度是NT-N-T- k+1.用上例预计,已知SSEr= 4824588,SSEu= 2045670,果为F= 5.6> F0.05(14, 89) = 1.64,中断本假设,论断是该当建坐时刻个体牢固效力模型.(4)随机效力模型正在牢固效力模型中采与假造变量的本果是阐明被阐明变量的疑息不敷完备.也不妨通过对付缺面项的领会去形貌那种疑息的缺得.yit = a+ b1 xit + eit (14)其中缺面项正在时间上战截里上皆是相闭的,用3个分量表示如下.eit = ui + vt + wit (15)其中ui ~N(0, su2)表示截里随机缺面分量;vt ~N(0, sv2)表示时间随机缺面分量;wit ~N(0, sw2)表示混战随机缺面分量.共时还假定ui,vt,wit之间互不相闭,各自分别不存留截里自相闭、时间自相闭战混战自相闭.上述模型称为随机效力模型.随机效力模型战牢固效力模型比较,相称于把牢固效力模型中的截距项瞅成二个随机变量.一个是截里随机缺面项(ui),一个是时间随机缺面项(vt).如果那二个随机缺面项皆遵循正态分集,对付模型预计时便不妨节省自由度,果为此条件下只需要预计二个随机缺面项的均值战圆好.假定牢固效力模型中的截距项包罗了截里随机缺面项战时间随机缺面项的仄稳效力,而且对付均值的离好分别是ui 战vt,牢固效力模型便形成了随机效力模型.为了简单明黑,先假定模型中只存留截里随机缺面项ui,不存留时间随机缺面分量(vt),yit = a+ b1 xit + (wit+ ui)= a+ b1 xit+eit (16)截里随机缺面项ui是属于第个个体的随机动摇分量,并正在所有时间范畴(t = 1,2, …, T)脆持稳定.随机缺面项ui, wit 应谦脚如下条件:E(ui) =0,E(wit) = 0E(wit 2) = sw2,E(ui 2)= su2,E(wit uj) =0, 包罗所有的i, t, j.E(wit wjs) =0, i ¹ j, t ¹ sE(ui uj) =0, i ¹ j果为根据上式有eit = wit+ ui所以那种随机效力模型又称为缺面分量模型(error component model).有论断,E(eit) = E(wit+uj) =0,(16)式,yit = a+ b1 xit + (wit+ ui),也不妨写成yit = (a + ui) + b1 xit + wit.遵循正态分集的截距项的均值效力au被包罗正在返回函数的常数项中.E(eit 2) = E(wit+uj)2 = sw2 +su2,E(eit eis) = E[(wit+ ui)(wis+ ui)] = E[(wit wis + ui wis + wit ui + ui2)] =su2, t ¹ s令ei = (ei1, ei2, …eiT)'则W = E(eiei') ==sw2 I(T´T) +su21(T´1)1(T´1) '其中I(T´T)是(T´T)阶单位阵,1(T´1)是(T´1)阶列背量.果为第i期与j期瞅测值是相互独力的,所以NT个瞅测值所对付应的随机缺面项的圆好与协圆好矩阵V是V = = ÄW = IN´NÄW其中IN´N表示由(T´1)阶列背量为元素形成的单位阵,其中每一个元素1大概0皆是(T´1)阶列背量.Ä表示科罗内克积(Kronecker product).其运算准则是AN´KÄB =考验个体随机效力的本假设与考验统计量是H0:su2 = 0.(混同预计模型)H1:su2 ¹ 0.(个体随机效力模型)LM= ==其中表示由个体随机效力模型预计的残好仄圆战. 表示由混同预计模型预计的残好仄圆战.统计量LM遵循1个自由度的c2分集.不妨对付随机效力模型举止广义最小二乘预计.以瞅测值圆好的倒数为权.为了供权数,必须采与二阶段最小二乘法预计.果为各随机缺面分量的圆好普遍是已知的,第一阶段用一般最小二乘预计法对付混同数据举止预计(采与牢固效力模型).用预计的残好预计随机缺面分量的圆好.第二步用那些预计的圆好预计参数的广义最小二乘预计值.如果随机缺面分量遵循的是正态分集,模型的参数还不妨用极大似然法预计.仍以例1为例给出随机效力模型预计截止如下:图15注意:随机效力模型EViwes输出截止中含有大众截距项.图16以例1为例,用个体随机效力模型战混同模型预计的统计量的值是LM = = =8.75´(24.4)2 = 5209果为F= 5209 > F0.05 (1) = 3.84,所以中断本假设,论断是该当建坐个体随机效力模型.假定截里截距战时间截距皆是随机的.分别遵循均值为au战av,圆好为su2战sv2的正态分集.随机缺面项将由3部分组成,并有圆好.Var(eit) = Var(ui) + Var(vt) + Var(wit) =su2 +sv2+sw2当su2战sv 2皆等于整,随机效力模型退化为牢固效力模型.随机效力模型战牢固效力模型哪一个更佳些?本质是各有劣缺面.随机效力模型的佳处是节省自由度.对付于从时间序列战截里二圆里上瞅皆存留较大变更的数据,随机效力模型能精确天形貌出缺面根源的特性.牢固效力模型的佳处是很简单领会任性截里数据所对付应的果变量与局部截里数据对付应的果变量均值的好别程度.别的,牢固效力模型不央供缺面项中的个体效力分量与模型中的阐明变量不相闭.天然,那一假定不可坐时,大概会引起模型参数预计的纷歧致性.(5)返回系数分歧的里板数据模型当认为对付于分歧个体,阐明变量的返回系数存留隐著性好别时,还不妨建坐返回系数分歧的里板数据模型. EViwes预计要领:正在Pooled Estimation(混同预计)窗心中的Dependent Variable(相依变量)采用窗挖进CP?;正在Common coefficients(系数相共)采用窗脆持空黑(如果需要预计时刻牢固效力也可输进假造变量D1997, D1998,D1999, D2000, D2001, D2002);正在Cross section specific coefficients(截里系数分歧)采用窗挖进IP?;正在Intercept(截距项)采用窗中选Fixed effects(也不妨搞其余采用);正在Weighting(权数)采用窗面打Noweighting(也不妨搞其余采用).面打Pooled Estimation(混同预计)窗心中的OK键.图17(9.1)= 北京+ x2t = 36.22 + 0.81x2t(31.0)…= 浙江+ x15t = 1328.26 + 0.63 x15t(21.1)R2 = 0.995, SSEr = 1409247用EViwes建坐里板数据预计模型步调.利用1996~2002年15个省级天区乡镇住户家庭年人均消耗性开销战年人均支进数据(稳定代价数据)介绍里板数据模型预计步调.(1)建坐混同数据库(Pool)对付象.最先建坐处事文献.正在挨启处事文献窗心的前提上,面打EViwes主功能菜单上的Objects键,选New Object功能(如图18),进而挨启New Object(新对付象)采用窗.正在Type of Object采用区采用Pool(合并数据库),并正在Name of Object采用区为混同数据库起名Pool01(初初隐现为Untitled).如图19,面打OK键,进而挨启混同数据库(Pool)窗心.正在窗心中输进15个天区的标记AH(安徽)、BJ(北京)、…、ZJ(浙江),如图20.图18 图19图20(2)定义序列名并输进数据.正在新建的混同数据库(Pool)窗心的工具栏中面打Sheet 键(第2种路径是,面打View键,选Spreadsheet (stacked data)功能),进而挨启Series List(列写序列名)窗心,定义时间序列变量CP?战IP?(?标记表示与CP战IP贯串的15个天区标记名)如图21.面打OK键,进而挨启混同数据库(Pool)窗心,(面打Edit+-键,使EViwes处于可编写状态)输进数据.输进完毕后的情形睹图22.图22所示为以截里为序的阵列式排列(stacked data).面打Order+-键,还不妨变更为以时间为序的阵列式排列.处事文献也不妨以合并数据(Pool data)战非合并数据的形式用复造战粘揭的要领建坐.图21 图22(3)预计模型图23面打Estimation键,随后弹出Pooled Estimation(混同预计)对付话窗(睹图23).先对付Pooled Estimation(混同预计)对付话窗中各选项功能给以阐明.Dependent Variable(相依变量)采用窗:用于挖写被阐明变量.Sample(样本范畴)采用窗:用于挖写样本区间. Balanced Sample(仄稳样本)采用块:面打挑勾后表示用仄稳数据预计.Common coefficients(系数相共)采用窗:用于挖写对付于分歧横截里斜率(返回系数)相共的阐明变量战假造变量. Cross section specific coefficients(截里系数分歧)采用窗:用于挖写对付于分歧横截里斜率(返回系数)分歧的阐明变量.Intercept(截距项)采用窗:从中不妨选None(不要截距项)、Common(共一截距项)、Fixed effects(个体分歧截距项分歧)、Random effects(随机效力截距项). Weighting(权数)采用窗:从中不妨选No weighting(等权预计)、Cross section weights(按截里与权数)、SUR(似不相闭返回)、iterate to convergence(迭代至支敛).“等权预计”的要领是所有的瞅测值皆给以相等的权数;“按截里与权数”的要领是以横截里模型残好的圆好为权数,属于广义最小二乘法预计.“似不相闭返回”的要领是利用横截里模型残好的协圆好举止广义最小二乘法预计,该法将自动建正横截里中出现的同圆好战近期自相闭;“迭代至支敛”要领当采用广义最小二乘法预计时,面打此键将包管参数预计背去到支敛为止.正在Options对付话框中不妨给出支敛准则战最大迭代次数.用EViwes不妨预计牢固效力模型(包罗个体牢固效力模型、时刻牢固效力模型战时刻个体牢固效力模型3种)、随机效力模型、戴有AR(1)参数的模型、截里分歧返回系数也分歧的里板数据模型.用EViwes不妨采用一般最小二乘法、加权最小二乘法(以截里模型的圆好为权)、似不相闭返回法预计模型参数.不妨正在Common coefficients采用窗战Cross section specific coefficients采用窗中挖进AR(1)项.如果把AR(1)项挖正在Common coefficients采用窗中相称于假设模型有相共的自返回缺面项,如果把AR(1)项挖正在Cross section specific coefficients采用窗中相称于假设模型有分歧的自返回缺面项.注意:如果把阐明变量挖进Cross section specific coefficients采用窗中,将会得到很多的返回参数.。
面板数据模型设定检验方法
1:(STATA 的双固定效应)xi :xtreg y x1 x2 i.year,fe 2:变系数模型 (1)生成虚拟变量 tab id,gen(id) gen open1=id1*open gen open2=id2*open (2)变系数命令xtreg y open1 open2。
,fe 面板数据模型设定检验方法4.1 F 检验先介绍原理。
F 统计量定义为()()/~, (30)/()R U U RSS RSS J F F J N k RSS N k -=-- 其中RSS r 表示施加约束条件后估计模型的残差平方和,RSS u 表示未施加约束条件的估计模型的残差平方和,J 表示约束条件个数,N 表示样本容量,k 表示未加约束的模型中被估参数的个数。
在原假设“约束条件真实”条件下,F 统计量渐近服从自由度为( J , N – k )的F 分布。
以检验个体固定效应回归模型为例,介绍F 检验的应用。
建立假设H 0:αi =α。
模型中不同个体的截距相同(真实模型为混合回归模型)。
H 1:模型中不同个体的截距项αi 不同(真实模型为个体固定效应回归模型)。
F 统计量定义为:F =)/()]()/[()(k N NT SSE k N NT k NT SSE SSE u u r --------1=)/()/()(k N NT SSE N SSE SSE u u r ----1(31)其中SSE r 表示约束模型,即混合估计模型的残差平方和,SSE u 表示非约束模型,即个体固定效应回归模型的残差平方和。
非约束模型比约束模型多了N -1个被估参数。
以案例1为例,已知SSE r = 4824588,SSE u = 2270386,F = )/()/()(11----N NT SSE N SSE SSE u u r =)/()/()(115105227038611522703864824588----=22510182443= 8.1(32)F 0.05(6, 87) = 1.8因为F = 8.1 > F 0.05(14, 89) = 1.8,推翻原假设,比较上述两种模型,建立个体固定效应回归模型更合理。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-高级面板数据方法【圣才出品】
第14章高级面板数据方法14.1复习笔记考点一:固定效应估计法★★★★★1.固定效应变换固定效应变换又称组内变换,考虑仅有一个解释变量的模型:对每个i,有y it =β1x it +a i +u it ,t=1,2,…,T对每个i 求方程在时间上的平均,便得到_y i =β1_x i +a i +_u i 其中,11T it t y T y-==∑(关于时间的均值)。
因为a i 在不同时间固定不变,故它会在原模型和均值模型中都出现,如果对于每个t,两式相减,便得到y it -_y i =β1(x it -_x i )+u it -_u i ,t=1,2,…,T或1 12it it it y x u ,t ,,,T=+=&&&&&&L β其中,it it i y y y =-&&是y 的除时间均值数据;对it x &&和it u &&的解释也类似。
方程的要点在于,非观测效应a i 已随之消失,从而可以使用混合OLS 去估计式1 12it it it y x u ,t ,,,T =+=&&&&&&L β。
上式的混合OLS 估计量被称为固定效应估计量或组内估计量。
组间估计量可以从横截面方程_y i =β1_x i +a i +_u i 的OLS 估计量而得到,即同时使用y 和x的时间平均值做一个横截面回归。
如果a i与_x i相关,估计量是有偏误的。
而如果认为a i 与x it无关,则使用随机效应估计量要更好。
组间估计量忽视了变量如何随着时间而变化。
在方程中添加更多解释变量不会引起什么变化。
2.固定效应模型(1)无偏性原始的非固定效应模型,只要让每一个变量都减去时间均值数据,即可得到固定效应模型。
固定效应模型的无偏性是建立在严格外生性的假定下的,所以FE模型需要假定特异误差u it应与所有时期的每个解释变量都无关。
stata混合回归和固定效应回归的f检验命令
Stata是一个广泛使用的统计分析软件,用于进行数据分析和统计建模。
在Stata中,混合回归和固定效应回归是两种常见的统计建模方法,用于处理面板数据和纵向数据。
在进行混合回归和固定效应回归分析时,我们经常需要进行F检验来检验模型的拟合优度和模型中自变量的显著性。
一、混合回归和固定效应回归的概念1. 混合回归模型混合回归模型是一种用于处理面板数据的统计建模方法,它将个体效应和时间效应引入到回归模型中,来控制个体特征和时间特征对因变量的影响。
混合回归模型通常包括固定效应回归和随机效应回归两种形式,可以通过引入个体固定效应和时间固定效应来控制面板数据中的个体异质性和时间趋势。
2. 固定效应回归模型固定效应回归模型是一种用于处理纵向数据的统计建模方法,它将个体效应引入到回归模型中,来控制个体特征对因变量的影响。
固定效应回归模型通常用于分析面板数据中个体特征对因变量的影响,通过引入个体固定效应来消除个体异质性对回归估计的影响。
二、混合回归和固定效应回归的F检验命令在Stata中进行混合回归和固定效应回归分析时,我们可以使用"xtreg"命令进行模型拟合,并使用"test"命令进行F检验。
1. xtreg命令在Stata中,我们可以使用"xtreg"命令来拟合混合回归和固定效应回归模型。
"xtreg"命令的基本语法为:"xtreg depvar indepvars, fe/re"其中,depvar表示因变量,indepvars表示自变量,fe表示固定效应回归,re表示随机效应回归。
通过使用"xtreg"命令,我们可以得到混合回归和固定效应回归模型的回归系数和显著性检验结果。
2. test命令在得到混合回归和固定效应回归模型的回归系数后,我们可以使用"test"命令来进行F检验。
面板数据中固定效应和随机效应的选择及其应用
声明:引用转载请注明来源于此处或,韩雪亮.“企业间关系与企业商业信用融资的实证研究”[D]暨南大学硕士论文,2012.面板数据中固定效应和随机效应的选择及其应用韩雪亮(暨南大学管理学院,广州510632)摘要:在面板数据中,固定效应模型和随机效应模型的选择问题一直存有很大争论。
本文通过比较,认为具体研究中选择固定效应模型还是随机效应模型,应该结合研究需要,而不是Hausman检验结果。
Hausman检验在某种程度上来说,是没有任何意义的,因为无论结果如何,选择固定效应模型总不会错。
Hausman检验与Breusch-Pagan检验存在本质上的区别,不能因为Hausman检验结果拒绝随机效应模型而否定Breusch-Pagan检验结果。
本文还通过一个实证分析,更直观的表达了这种思想。
实证分析结果表明,尽管所选择的变量在整体上能够影响到企业商业信用融资,但不同行业内的企业商业信用融资受到的影响因素不同。
关键词:固定效应;随机效应;Hausman检验;Breusch-Pagan检验;商业信用融资中图分类号:F064.1,F275.5 文献标识码:AFixed Effects Model and Random Effects Model Selection in Panel Data andits ApplicationHAN XueliangManagement School of Jinan University,Guangzhou 510632 Abstract:In panel data analysis, there has been arguing on fixed effects model and random effects model selection. In this paper, we compared these two models and consider that choose fixed effects model or random effects model should depend on your research need/theory, rather than Hausman test. To some extent, Hausman test doesnot work, since whatever the outcome, choose fixed effects model is always right. Like the difference between the fixed effects model and random effects model, thereis essential difference between Hausman test and Breusch-Pagan test. We cannot reject the Breusch-Pagan test when Hausman test rejects the random effects model. We also use one empirical analysis to convey this opinion. The empirial analysis results show that, in general the selected variables do have effect on the dependent variable, but when come into the different industries, the effect is differ.Key words:Fixed Effects Model;Random Effects Model;Hausman Test;Breusch-Pagan Test;Trade Credit0 引言面板数据(Panel Data)综合了时间序列数据和截面数据的特点,提供了更多与客观现实相关的信息,并控制了个体的异质性,增大了自由度和减小了变量间的多重共线性。
stata中f检验混合回归和固定效应的步骤和方法
stata中f检验混合回归和固定效应的步骤和方法1. 引言1.1 概述本篇长文将重点探讨在Stata中进行f检验的方法和步骤,特别是针对混合回归和固定效应模型。
随着经济和社会科学研究的不断发展,对于数据分析方法的需求也日益增加。
混合回归和固定效应模型作为常见的数据分析方法,在处理面板数据、纵向数据或空间数据等复杂情况下具有较高的适用性。
在本篇文章中,我们将详细介绍在Stata软件中如何使用f检验来评估混合回归模型和固定效应模型的拟合优度,并进一步比较两种模型之间的优缺点。
通过本文所提供的步骤和方法,读者将能够更好地理解并运用这些技术进行自己感兴趣的数据分析工作。
1.2 文章结构本文共包含五个主要部分。
首先,在引言部分,我们将介绍文章整体框架以及各个部分的内容安排。
其次,在第二部分中,我们将详细说明在Stata中进行混合回归模型f检验的步骤和方法。
然后,在第三部分中,我们将专注讨论固定效应模型,并介绍在Stata中进行此类模型的f检验的具体步骤。
接着,在第四部分,我们将比较混合回归和固定效应模型的优缺点,以及它们在不同情境下的适用性。
最后,在结论部分,我们将总结讨论过程,并提出实践意义和未来展望。
1.3 目的本文的主要目的是为读者提供一个清晰且全面的Stata中f检验混合回归和固定效应模型的指南。
通过了解这些方法和步骤,读者可以更好地理解面板数据分析中f检验的原理,掌握其实际操作技巧,并能够有效比较不同模型之间的优劣。
同时,本文旨在向读者展示混合回归和固定效应模型在经济学、社会学等多个领域中的实践应用价值,帮助读者更好地运用这些方法来解决自己研究或工作中面临的问题。
2. Stata中f检验混合回归的步骤和方法:2.1 混合回归简介:混合回归是一种常用的统计分析方法,用于探究自变量对因变量的影响。
在混合回归模型中,既包含了固定效应(Fixed Effects)也包含了随机效应(Random Effects)。
stat做面板结构方程模型
stat做面板结构方程模型一.面板数据随机效应与固定效应检验模型设定过程中最为关键同时也是最难的一步,在这方面功力的提高还需要大量的实践经验和对理论的深入理解。
1)检验个体效应的显著性。
我们做固定效应模型时,F检验表明固定效应模型由于混合OLS模型。
下面我们说明如何检验随机效应是否显著,命令为:xttest0。
若P 值为0.0000,表明随机效应非常显著。
2)Hausman检验。
具体步骤为:step1:估计固定效应模型,存储估计结果;step2:估计随机效应模型,存储估计结果;step3:进行Hausman检验;命令为:xtreg GDP FDI EX IM, fe /*step1*/eststore fextreg GDP FDI EX IM, re /*step2*/eststore rehausman fe re/*step3*/eststore 的作用在于把估计结果存储到名称为fe,re的临时性文件中。
然后我们就可以根据Hausman检验的值进行模型的选择了。
注意 Hausman检验需要将fe放在re前面。
二.动态面板数据模型对于面板数据,如果观测到被解释变量随时间而改变,则开启了动态面板对参数估计的可能性。
动态面板模型设定了一个个体的被解释变量部分取决于前一期的值。
当被解释变量的滞后一期或者多期出现在解释变量中。
对于短面板数据来说,需要研究短面板的固定效应模型估计,使用一阶差分消除固定效应。
通过解释变量的适当滞后期作为工具变量对一阶差分模型中的参数进行IV估计可以得到一致估计量。
但是Stata有一些固定的命令,可以直接进行动态面板估计。
如:xtabond、xtdpdsys、xtdpd。
以上这些命令使得模型更加容易估计,同时也提供了相关的一些检验。
三.静态面板数据操作简介首先对面板数据进行声明:前面是截面单元,后面是时间标识:tsset company yeartsset industry year产生新的变量:gennewvar=human*lnrd产生滞后变量Genfiscal(2)=L2.fiscal产生差分变量Genfiscal(D)=D.fiscal描述性统计xtdes :对Panel Data截面个数、时间跨度的整体描述Xtsum:分组内、组间和样本整体计算各个变量的基本统计量xttab 采用列表的方式显示某个变量的分布Stata中用于估计面板模型的主要命令:xtregxtreg depvar [varlist] [if exp] , model_type [level(#) ] Model type 模型be Between-effects estimatorfe Fixed-effects estimatorre GLSRandom-effects estimatorpa GEEpopulation-averaged estimatormle Maximum-likelihood Random-effectsestimatorxtreg命令的应用声明面板数据类型:xtset描述性统计:xtsum gdp investsci admin1.固定效应模型估计:xtreg gdp invest culture sci health admin techno,fe固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigma u 和sigma e),二者之间的相关关系(rho)最后一行给出了检验固定效应是否显著的F 统计量和相应的P 值2.随机效应模型估计:xtreg gdp invest culture sci health admin techno,re检验随机效应模型是否优于混合OLS 模型:在进行随机效应回归之后,使用xttest0检验得到的P 值为0.0000,表明随机效应模型优于混合OLS 模型3. 最大似然估计Ml:xtreg gdp invest culture sci health admin techno,mleHausman检验Hausman检验究竟选择固定效应模型还是随机效应模型:第一步:估计固定效应模型,存储结果xtreg gdp invest culture sci health admin techno,feest store fe第二步:估计随机效应模型,存储结果xtreg gdp invest culture sci health admin techno,reest store re第三步:进行hausman检验hausman feHausman检验量为:H=(b-B)´[Var(b)-Var(B)]-1(b-B)~x2(k)Hausman统计量服从自由度为k的χ2分布。
面板数据的F检验,固定效应检验
面板数据模型(PANEL DATA)F检验,固定效应检验1.面板数据定义。
时间序列数据或截面数据都是一维数据。
例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。
面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。
面板数据是同时在时间和截面空间上取得的二维数据。
面板数据示意图见图1。
面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。
面板数据用双下标变量表示。
例如y i t, i = 1, 2, …, N; t = 1, 2, …, TN表示面板数据中含有N个个体。
T表示时间序列的最大长度。
若固定t不变,y i ., ( i = 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。
图1 N=7,T=50的面板数据示意图例如1990-2000年30个省份的农业总产值数据。
固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。
面板数据由30个个体组成。
共有330个观测值。
对于面板数据y i t, i = 1, 2, …, N; t = 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。
注意:EViwes 3.1、4.1、5.0既允许用平衡面板数据也允许用非平衡面板数据估计模型。
面板数据截距固定和随机效应的判断
1(xit
-
xi
)
+
-
i
)
~ ,上式写为 令(yit - y i ) = ~ y it ,(xit - x i ) = ~ x it ,(it - i ) = it ~ ~ y it = 1 ~ x it + it
(6)
用 OLS 法估计(1) 、 (6)式中的1,结果是一样的,但是用(6)式估计,可以减少被估参 数个数。 (2)用 OLS 法估计回归参数(不包括截距项,即固定效应) 。
y i = i + 1 x i + i , i = 1, 2, …, N
其中 y i =
(4)
1 T
t 1
T
y
T
xit , i =
) =
1 T
t 1
T
it
,
i = 1, 2, …, N。公式(1)、(4)相减得,
(it
(yit (5)
yi
T
(12) 其中虚拟变量
1, 如果属于第t个截面,t 2,...,T。 Dt = 其他 0,
(注意不是从 1 开始)
1, 如果属于第i个个体,i 1,2,..., N。 Wi = (注意是从 1 开始) 其他 0,
it, i = 1, 2, …, N; t = 1, 2, …, T,表示随机误差项。yi t, xit, (i = 1, 2, …, N; t = 1, 2, …, T)分别表示被解释变量和解释变量。模型也可表示为
( SSEr SSEu ) /[( NT 2) ( NT T 1)] ( SSEr SSEu ) /(T 1) = SSEu /( NT T 1) SSEu /( NT T 1)
互助问答第23问 OlS模型、面板固定效应(FE)、面板随机效应(RE)模型估计的优缺点
问:关于三个模型比较的问题。
OlS模型、面板固定效应(FE)、面板随机效应(RE)模型估计的优缺点。
答:
给定一个面板数据,OLS模型可以作为基准模型,优点是简单,缺点是没纳入个体效应。
固定效应和随机效应模型的优点是纳入了个体效应。
当个体效应与自变量相关时,应使用固定效应模型,因为此时随机效应模型系数估计不一致。
当个体效应与自变量不相关时,教科书的传统说法是应该使用随机效应,因为更有效,并且有Hausman检验判断固定效应和随机效应模型哪个更好。
实际上,在线性面板模型中,目前大都默认使用固定效应,一来因为个体效应很难真正与自变量不相关,二来因为随着数据量的增大,有效性问题越来越不重要,大家更关注一致性问题。
但是,如果是非线性模型(比如Probit),控制大量个体哑变量(即固定效应)会造成系数估计偏差,随机效应模型可能会更好——计量中这依然是一个前沿领域。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
面板数据模型(P A N E L D A T A)F检验,固定效应检验1.面板数据定义。
时间序列数据或截面数据都是一维数据。
例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。
面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。
面板数据是同时在时间和截面空间上取得的二维数据。
面板数据示意图见图1。
面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。
面板数据用双下标变量表示。
例如y i t, i= 1, 2, …, N; t= 1, 2, …, TN表示面板数据中含有N个个体。
T表示时间序列的最大长度。
若固定t不变,y i ., ( i= 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t= 1, 2, …, T)是纵剖面上的一个时间序列(个体)。
图1 N=7,T=50的面板数据示意图例如1990-2000年30个省份的农业总产值数据。
固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。
面板数据由30个个体组成。
共有330个观测值。
对于面板数据y i t, i= 1, 2, …, N; t= 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。
注意:EViwes 、、既允许用平衡面板数据也允许用非平衡面板数据估计模型。
例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。
数据是7年的,每一年都有15个数据,共105组观测值。
人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。
人均消费和收入的面板数据从纵剖面观察分别见图2和图3。
从横截面观察分别见图4和图5。
横截面数据散点图的表现与观测值顺序有关。
图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。
表1 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格)地区人均消费1996 1997 1998 1999 2000 2001 2002 CP-AH(安徽)CP-BJ(北京)CP-FJ(福建)CP-HB(河北)CP-JL(吉林)CP-JS(江苏)CP-JX(江西)CP-LN(辽宁)CP-NMG(内蒙古)CP-SD(山东)CP-SH(上海)CP-SX(山西)CP-TJ(天津)CP-ZJ(浙江)资料来源:《中国统计年鉴》1997-2003。
表2 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均收入数据(不变价格)地区人均收入1996 1997 1998 1999 2000 2001 2002 IP-AH(安徽)IP-BJ(北京)IP-FJ(福建)IP-HB(河北)IP-JL(吉林)IP-JS(江苏)IP-JX(江西)IP-LN(辽宁)IP-NMG(内蒙古)IP-SD(山东)IP-SH(上海)IP-SX(山西)IP-TJ(天津)IP-ZJ(浙江)资料来源:《中国统计年鉴》1997-2003。
图2 15个省级地区的人均消费序列(纵剖面)图3 15个省级地区的人均收入序列(file:4panel02)图4 15个省级地区的人均消费散点图图5 15个省级地区的人均收入散点图(7个横截面叠加)(每条连线表示同一年度15个地区的消费值) (每条连线表示同一年度15个地区的收入值)用CP表示消费,IP表示收入。
AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。
15个地区7年人均消费对收入的面板数据散点图见图6和图7。
图6中每一种符号代表一个省级地区的7个观测点组成的时间序列。
相当于观察15个时间序列。
图7中每一种符号代表一个年度的截面散点图(共7个截面)。
相当于观察7个截面散点图的叠加。
图6 用15个时间序列表示的人均消费对收入的面板数据图7 用7个截面表示的人均消费对收入的面板数据(7个截面叠加)为了观察得更清楚一些,图8给出北京和内蒙古1996-2002年消费对收入散点图。
从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。
内蒙古2002年的收入与消费规模还不如北京市1996年的大。
图9给出该15个省级地区1996和2002年的消费对收入散点图。
可见6年之后15个地区的消费和收入都有了相应的提高。
图8 北京和内蒙古1996-2002年消费对收入时序图图9 1996和2002年15个地区的消费对收入散点图2.面板数据的估计。
用面板数据建立的模型通常有3种。
即混合估计模型、固定效应模型和随机效应模型。
混合估计模型。
如果从时间上看,不同个体之间不存在显着性差异;从截面上看,不同截面之间也不存在显着性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。
如果从时间和截面看模型截距都不为零,且是一个相同的常数,以二变量模型为例,则建立如下模型,y it = a +b1 x it +e it, i= 1, 2, …, N; t= 1, 2, …, T (1)a 和b1不随i,t变化。
称模型(1)为混合估计模型。
以例1中15个地区1996和2002年数据建立关于消费的混合估计模型,得结果如下:图10EViwes估计方法:在打开工作文件窗口的基础上,点击主功能菜单中的Objects键,选New Object功能,从而打开New Object(新对象)选择窗。
在Type of Object选择区选择Pool(混合数据库),点击OK键,从而打开Pool(混合数据)窗口。
在窗口中输入15个地区标识AH(安徽)、BJ(北京)、…、ZJ(浙江)。
工具栏中点击Sheet键,从而打开Series List(列写序列名)窗口,定义变量CP和IP,点击OK键,Pool(混合或合并数据库)窗口显示面板数据。
在Pool窗口的工具栏中点击Estimate键,打开Pooled Estimation(混合估计)窗口如下图。
图11在Dependent Variable(相依变量)选择窗填入CP;在Common coefficients (系数相同)选择窗填入IP;Cross section specific coefficients(截面系数不同)选择窗保持空白;在Intercept(截距项)选择窗点击Common;在Weighting(权数)选择窗点击No weighting。
点击Pooled Estimation (混合估计)窗口中的OK键。
得输出结果如图10。
相应表达式是= +IP itR2 = , SSE r = 4824588, (103) =15个省级地区的人均支出平均占收入的76%。
如果从时间和截面上看模型截距都为零,就可以建立不含截距项的(a = 0)的混合估计模型。
以二变量模型为例,建立混合估计模型如下,y it = b1 x it +e it, i= 1, 2, …, N; t= 1, 2, …, T (2)对于本例,因为上式中的截距项有显着性(t = > (103) = ),所以建立截距项为零的混合估计模型是不合适的。
EViwes估计方法:在Pooled Estimation(混合估计)对话框中Intercept (截距项)选择窗中选None,其余选项同上。
固定效应模型。
在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixed effects regression model)。
固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model)、时刻固定效应模型(time fixed effects regression model)和时刻个体固定效应模型(time and entity fixed effects regression model)。
下面分别介绍。
(1)个体固定效应模型。
个体固定效应模型就是对于不同的个体有不同截距的模型。
如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显着性变化,那么就应该建立个体固定效应模型,表示如下,y it = b1 x it +g1 W1 + g2W2 + … +g N W N+e it, t= 1, 2, …, T (3)其中W i=e it, i= 1, 2, …, N; t= 1, 2, …, T,表示随机误差项。
y it, x it, i = 1, 2, …, N; t= 1, 2, …, T分别表示被解释变量和解释变量。
模型(3)或者表示为y1t= g1+b1 x1t+e1t, i= 1(对于第1个个体,或时间序列),t= 1, 2, …, Ty2t= g2+b1 x2t+e2 t, i= 2(对于第2个个体,或时间序列),t= 1, 2, …, T…y N t= g N+b1 x N t+e N t, i= N(对于第N个个体,或时间序列),t= 1, 2, …, T写成矩阵形式,y1 = (1x1) +e1 = g1 +x1 b +e1…y N = (1x N) +e N = g N + x N b+e N上式中y i,g i,e i,x i都是N′1阶列向量。
b为标量。
当模型中含有k个解释变量时,b为k′1阶列向量。
进一步写成矩阵形式,= + b+上式中的元素1,0都是T′1阶列向量。
面板数据模型用OLS方法估计时应满足如下5个假定条件:(1)E(e it|x i1, x i2, …, x iT, a i) = 0。
以x i1, x i2, …, x iT, a i为条件的e it 的期望等于零。
(2)(x i1, x i2, …, x iT), ( y i1, y i2, …, y iT), i= 1, 2, …, N分别来自于同一个联合分布总体,并相互独立。