面板数据模型理论知识
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.Panel Data 模型简介
Panel Data 即面板数据,是截面数据与时间序列数据综合起来的一种数据类型,是截面上个体在不同时点的重复观测数据。
相对于一维的截面数据和时间序列数据进行经济分析而言,面板数据有很多优点。(1)由于观测值的增多,可以增加自由度并减少了解释变量间的共线性,提高了估计量的抽样精度。(2)面板数据建模比单截面数据建模可以获得更多的动态信息,可以构建并检验更复杂的行为模型。(3)面板数据可以识别、衡量单使用一维数据模型所不能观测和估计的影响,可以从多方面对同一经济现象进行更加全面解释。
Panel Data 模型的一般形式为it K k kit kit it it x y μβα++=∑
=1
其中it y 为被解释变量,it x 为解释变量, i =1,2,3……N ,表示N 个个体;t
=1,2,3……T ,表示已知T 个时点。参数it α表示模型的截距项,k 是解释变量
的个数,kit β是相对应解释变量的待估计系数。随机误差项it μ相互独立,且满足零
均值,等方差为2δ的假设。
面板数据模型可以构建三种形式(以截面估计为例):
形式一: 不变参数模型 i K k ki k i x y μβα++=∑
=1,又叫混合回归模型,是指无论
从时间上还是截面上观察数据均不存在显著差异,故可以将面板数据混合在一起,采用普通最小二乘估计法(OLS )估计参数即可。
形式二:变截距模型i K k ki k i i x y μβαα+++=∑
=1*,*α为每个个体方程共同的截距
项,i α是不同个体之间的异质性差异。对于不同个体或时期而言,截距项不同而解释变量的斜率相同,说明存在不可观测个体异质影响但基本结构是相同的,可以通过截距项的不同而体现出来个体之间的差异。当i α与i x 相关时,那就说明模型为固定效应模型,当i α与i x 不相关时,说明模型为随机效应模型。
形式三:变参数模型 i K k ki ki i i x y μβαα+++=∑
=1* ,对于不同个体或时期而
言,截距项(i αα+*)和每个解释变量的斜率ki β都是不相同的,表明不同个体之间既存在个体异质影响也存在不同的结构影响,即每个个体或时期都对应一个互不相同的方程。同样分为固定效应模型和随机效应模型两种。
注意:这里没有截距项相同而解释变量的系数不相同的模型。
2.Panel Data 模型分析步骤
2.1 单位根检验
无论利用Panel Data 模型进行截面估计还是时间估计分析的时候,我们先要进行单位根检验,只有Panel Data 模型中的数据是平稳的才可以进行回归分析,否则容易产生“虚假回归”。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的2R ,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归。面板单位根检验方法有5种:LLC 检验、IPS 检验、Breintung 检验、ADF-Fisher 检验和PP-Fisher 检验,前两种是相同根情况下的单位根检验方法, 后三
种是不同单位根情况下的检验方法。
若Panel Data 为平稳的,则进行回归分析;
1. Huasman 检验和F 检验
Huasman 检验的目的为检验Panel Data 模型是随机效应模型还是固定效应模型。原假设:模型是存在随机效应的。
F 检验的目的是判定需要拟合的模型形式。
F 检验有两个原假设:
1H :回归斜率系数相同而截距项不相同N βββ=== 21
2H :回归斜率系数和截距项都相同N ααα=== 21 N βββ=== 21 构建F 统计量
)]1(),1)(1[(~))1(()]1)(1/[()(1132
--+-+-+--=k T N k N F k N NT S k N S S F )]1(,)1[(~))1((])1/[()(1121---+---=k T N k N F k N NT S k N S S F
其中,1S 为变参数模型得残差平方和,2S 为变截距模型得残差平方和,3S 为不变
参数模型得残差平方和,N 是总个体数,T 为总时期数,k 为解释变量的个数。
判定规则为,首先利用2F 统计量对2H 检验,如果接受,则建立不变参数模型,检验结束。如果拒绝,则再利用1F 统计量对1H 检验,如果接受,则建立变截距模型;如果拒绝,则建立变系数模型。
2.利用Eviews 可以得出回归方程结果
横截面的异方差与序列的自相关性是运用面板数据模型时可能遇到的最为常见的问题,此时运用OLS 可能会产生结果失真,因此为了消除影响,对我国东、中、西部地区的分析将采用不相关回归方法( SeeminglyUnrelated Regression, SUR)来估计方程。而对于全国范围内的估计来说,由于横截面个数大于时序个数,所以采用截面加权估计法(Cross SectionWeights, CSW) 。
若Panel Data 的单位根检验是不平稳的,采取两种办法。
1.对序列进行差分或取对数使之变成同阶序列,若变换序列后均为平稳序列,可用变换后的序列直接进行回归分析。
2.若变换序列后均为同阶非平稳序列,则要进行协整检验。
协整检验的原假设:不存在协整
面板数据的协整检验方法可以分为两大类:
一类是建立在Engle and Granger 二步法检验基础上的面板协整检验,具体方法主要有Pedroni 检验和Kao 检验;
另一类是建立在Johansen 协整检验基础上的面板协整检验。
面板数据模型的理论知识远不止这么简单,我也只是学习到其的最简单最系统的思路。