stata面板数据操作示例
STATA面板数据模型操作命令讲解(word文档良心出品)
![STATA面板数据模型操作命令讲解(word文档良心出品)](https://img.taocdn.com/s3/m/7441b16255270722192ef7bf.png)
STATA 面板数据模型估计命令一览表一、静态面板数据的STATA 处理命令εαβit ++=x y it i it 固定效应模型μβit +=x y it itεαμit +=it it 随机效应模型(一)数据处理输入数据●tsset code year 该命令是将数据定义为“面板”形式●xtdes 该命令是了解面板数据结构●summarize sq cpi unem g se5 ln 各变量的描述性统计(统计分析)●gen lag_y=L.y /////// 产生一个滞后一期的新变量gen F_y=F.y /////// 产生一个超前项的新变量gen D_y=D.y /////// 产生一个一阶差分的新变量gen D2_y=D2.y /////// 产生一个二阶差分的新变量(二)模型的筛选和检验●1、检验个体效应(混合效应还是固定效应)(原假设:使用OLS混合模型)●xtreg sq cpi unem g se5 ln,fe对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。
在我们这个例子中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。
●2、检验时间效应(混合效应还是随机效应)(检验方法:LM统计量)(原假设:使用OLS混合模型)●qui xtreg sq cpi unem g se5 ln,re (加上“qui”之后第一幅图将不会呈现) xttest0可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。
可见,随机效应模型也优于混合OLS模型。
●3、检验固定效应模型or随机效应模型(检验方法:Hausman检验)原假设:使用随机效应模型(个体效应与解释变量无关)通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。
但是无法明确区分FE or RE的优劣,这需要进行接下来的检验,如下:Step1:估计固定效应模型,存储估计结果Step2:估计随机效应模型,存储估计结果Step3:进行Hausman检验●qui xtreg sq cpi unem g se5 ln,feest store fequi xtreg sq cpi unem g se5 ln,reest store rehausman fe (或者更优的是hausman fe,sigmamore/ sigmaless)可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。
(完整word版)STATA面板数据模型操作命令讲解
![(完整word版)STATA面板数据模型操作命令讲解](https://img.taocdn.com/s3/m/bea02f3fa417866fb84a8ed2.png)
STATA 面板数据模型估计命令一览表 一、静态面板数据的STATA 处理命令εαβit ++=x y it i it 固定效应模型μβit +=x y it itεαμit +=it it 随机效应模型(一)数据处理输入数据●tsset code year 该命令是将数据定义为“面板”形式●xtdes 该命令是了解面板数据结构●summarize sq cpi unem g se5 ln 各变量的描述性统计(统计分析)●gen lag_y=L.y /////// 产生一个滞后一期的新变量gen F_y=F.y /////// 产生一个超前项的新变量gen D_y=D.y /////// 产生一个一阶差分的新变量gen D2_y=D2.y /////// 产生一个二阶差分的新变量(二)模型的筛选和检验●1、检验个体效应(混合效应还是固定效应)(原假设:使用OLS混合模型)●xtreg sq cpi unem g se5 ln,fe对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。
在我们这个例子中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。
●2、检验时间效应(混合效应还是随机效应)(检验方法:LM统计量)(原假设:使用OLS混合模型)●qui xtreg sq cpi unem g se5 ln,re (加上“qui”之后第一幅图将不会呈现) xttest0可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。
可见,随机效应模型也优于混合OLS模型。
●3、检验固定效应模型or随机效应模型(检验方法:Hausman检验)原假设:使用随机效应模型(个体效应与解释变量无关)通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。
但是无法明确区分FE or RE的优劣,这需要进行接下来的检验,如下:Step1:估计固定效应模型,存储估计结果Step2:估计随机效应模型,存储估计结果Step3:进行Hausman检验●qui xtreg sq cpi unem g se5 ln,feest store fequi xtreg sq cpi unem g se5 ln,reest store rehausman fe (或者更优的是hausman fe,sigmamore/ sigmaless)可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。
STATA面板大数据模型操作命令讲解
![STATA面板大数据模型操作命令讲解](https://img.taocdn.com/s3/m/62ec353f1711cc7930b71645.png)
STATA 面板数据模型估计命令一览表一、静态面板数据的STATA 处理命令εαβit ++=xy itiit固定效应模型μβit +=xy ititεαμit+=itit随机效应模型(一)数据处理输入数据●tsset code year 该命令是将数据定义为“面板”形式 ●xtdes 该命令是了解面板数据结构●summarize sq cpi unem g se5 ln 各变量的描述性统计(统计分析)●gen lag_y=L.y /////// 产生一个滞后一期的新变量gen F_y=F.y /////// 产生一个超前项的新变量gen D_y=D.y /////// 产生一个一阶差分的新变量gen D2_y=D2.y /////// 产生一个二阶差分的新变量(二)模型的筛选和检验●1、检验个体效应(混合效应还是固定效应)(原假设:使用OLS混合模型)●xtreg sq cpi unem g se5 ln,fe对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。
在我们这个例子中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。
●2、检验时间效应(混合效应还是随机效应)(检验方法:LM统计量)(原假设:使用OLS混合模型)●qui xtreg sq cpi unem g se5 ln,re (加上“qui”之后第一幅图将不会呈现) xttest0可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。
可见,随机效应模型也优于混合OLS模型。
●3、检验固定效应模型or随机效应模型(检验方法:Hausman检验)原假设:使用随机效应模型(个体效应与解释变量无关)通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。
但是无法明确区分FE or RE的优劣,这需要进行接下来的检验,如下:Step1:估计固定效应模型,存储估计结果Step2:估计随机效应模型,存储估计结果Step3:进行Hausman检验●qui xtreg sq cpi unem g se5 ln,feest store fequi xtreg sq cpi unem g se5 ln,reest store rehausman fe (或者更优的是hausman fe,sigmamore/ sigmaless)可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。
STATA面板数据模型操作命令
![STATA面板数据模型操作命令](https://img.taocdn.com/s3/m/d6aadea68662caaedd3383c4bb4cf7ec4afeb612.png)
STATA 面板数据模型估计命令一览表一、静态面板数据的STATA 处理命令εαβit ++=x y it iit 固定效应模型 εαμit +=it it 随机效应模型一数据处理输入数据●tsset code year 该命令是将数据定义为“面板”形式●xtdes 该命令是了解面板数据结构●summarize sq cpi unem g se5 ln 各变量的描述性统计统计分析 ●gen lag_y=αi αi αi εit ~e it ~1-t e i ,8858.0~=θ5.0-~=θ验:是否存在门槛效应混合面板:reg is lfr lfr2 hc open psra tp gr,vcecluster sf固定效应、随机效应模型xtreg is lfr lfr2 hc open psra tp gr,feest store fextreg is lfr lfr2 hc open psra tp gr,reest store rehausman fe两步系统GMM 模型xtdpdsys rlt plf1 nai efd op ew ig ,lags1 maxldep2 twostep artests2 注:rlt 为被解释变量,“plf1 nai efd op ew ig ”为解释变量和控制变量; maxldep2表示使用被解释变量的两个滞后值为工具变量;pre 表示以某一个变量为前定解释变量;endogenous 表示以某一个变量为内生解释变量; 自相关检验:estat abond萨甘检验:estat sargan差分GMM模型Xtabond rlt plf1 nai efd op ew ig ,lags1 twostep artests2内生:该解释变量的取值是一定程度上由模型决定的;内生变量将违背解释变量与误差项不相关的经典假设,因而内生性问题是计量模型的大敌,可能造成系数估计值的非一致性和偏误;外生:该解释变量的取值是完全由模型以外的因素决定的;外生解释变量与误差项完全无关,不论是当期,还是滞后期;前定:该解释变量的取值与当期误差项无关,但可能与滞后期误差项相关;。
STATA面板数据模型操作命令
![STATA面板数据模型操作命令](https://img.taocdn.com/s3/m/24f5bacc6f1aff00bed51efb.png)
STATA 面板数据模型估计命令一览表一、静态面板数据的STATA处理命令(一)数据处理输入数据●tsset code year 该命令是将数据定义为“面板”形式●xtdes 该命令是了解面板数据结构●summarize sq cpi unem g se5 ln 各变量的描述性统计(统计分析)●gen lag_y=L.y /////// 产生一个滞后一期的新变量gen F_y=F.y /////// 产生一个超前项的新变量gen D_y=D.y /////// 产生一个一阶差分的新变量gen D2_y=D2.y /////// 产生一个二阶差分的新变量(二)模型的筛选和检验●1、检验个体效应(混合效应还是固定效应)(原假设:使用OLS混合模型)●xtreg sq cpi unem g se5 ln,fe对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。
在我们这个例子中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。
●2、检验时间效应(混合效应还是随机效应)(检验方法:LM统计量)(原假设:使用OLS混合模型)●qui xtreg sq cpi unem g se5 ln,re (加上“qui”之后第一幅图将不会呈现) xttest0可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。
可见,随机效应模型也优于混合OLS模型。
●3、检验固定效应模型or随机效应模型(检验方法:Hausman检验)原假设:使用随机效应模型(个体效应与解释变量无关)通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。
但是无法明确区分FE or RE的优劣,这需要进行接下来的检验,如下:Step1:估计固定效应模型,存储估计结果Step2:估计随机效应模型,存储估计结果Step3:进行Hausman检验●qui xtreg sq cpi unem g se5 ln,feest store fequi xtreg sq cpi unem g se5 ln,reest store rehausman fe (或者更优的是hausman fe,sigmamore/ sigmaless) 可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。
STATA面板数据模型操作命令讲解(word文档良心出品)
![STATA面板数据模型操作命令讲解(word文档良心出品)](https://img.taocdn.com/s3/m/500b53fa4b73f242326c5f4d.png)
STATA 面板数据模型估计命令一览表一、静态面板数据的 STATA 处理命令固定效应模型随机效应模型(一)数据处理输入数据• tsset code year 该命令是将数据定义为“面板”形式 • xtdes该命令是了解面板数据结构・ xtdescode: 1i 2, ■■■( 20n 工 20 year : 3004, 2005, ■…,2014T =11Delta(year) =1 unit span(year) =11 periods(code*year uniquely identifies eachobservation)Distribution of:min 8%2璃50^ 75% 95%max1111 11111111 11Freq. Percent Cum. Pattern20 100.00 100.00 1111111111120100.00XXXXXXXXXXX・ summarize sc I cpi unem gse5 InvariableObs Mean Std ・ Dev.Mi nMax sq 220 .Q142798 2.9303464.75e-0626.22301cpi2201*10655 *032496 1.045 1. 25 unem22Q .0349455 .0071556 .012 ,046 g220,10907 .0427523 0246 .2357220 .0268541 011671? .0053.0693220.1219364.0240077,074,203• summarize sq cpi unem g se5 In各变量的描述性统计(统计分析)• gen lag_y=L.y ///////产生一个滞后一期的新变量*= Xitit• ;itto U 一 if对于固定效应模型而言,回归结果中最后一行汇报的F 统计量便在于检验所 有的个体效应整体上显著。
5分钟搞定Stata面板数据分析
![5分钟搞定Stata面板数据分析](https://img.taocdn.com/s3/m/6afc60cc227916888486d7ff.png)
【原创】5分钟搞定Stata面板数据分析简易教程ver2.0作者:张达5分钟搞定Stata面板数据分析简易教程步骤一:导入数据原始表如下,数据请以时间(1998 ,1999,2000, 2001 ??)为横轴,样本名(北京,天津,河北??) 为纵轴1 裁*■■別1A I11 ■u 9K ILEXxl-V,j si aoLL B-iic190 ..1( HJ曲1 1g力«r4 々■l* Mfl 1KM J| JgRi MM3icm*w II7QQ-HQ Siq<XM3 7>D tuff 1'C4 3 4 IftJV-mi KH>loogi liW(0M 3M9WH jaii I MOKai W w ■齐itmxm fill OTI MiltaiK ■5W»U|JTXE HH sia心«9 f Id 叼m in a*ft I*■JtaC如M~4 気HiA|$A rm inoo IM? livra.wvtatr1IJMj X#*4>t1|筑・BF7 ■«|!N I9*V1IRV gw1W1VJ I-J H itW Ml «稠申审砂y li>M l>R Mdw VIM e> mu IM HM 內)944w 命■ n I L BII i mi 靜Ml hw w3K:1ST? *7^ FJE inm ifini uni4 5w 心HtJ TW JTfl 9MI*HAS■ilJto KO >4*461/M31 <141*11诃却4LJt 4ktt VM匸F<MO 4dN,■M I!Wi・】•\ 4 ■R- 呵鬥1皑用MA■J广*»i g Ml* <KM11*K=« 1 31 1MM I“tlM韓!1fi >w g ivt E4M laM■ii T PD w im W i.JV 1P w L*l 1tiZF MM7 <1 H1! liyi将中文地名替换为数字。
STATA面板数据模型操作命令讲解
![STATA面板数据模型操作命令讲解](https://img.taocdn.com/s3/m/1508ca8659f5f61fb7360b4c2e3f5727a4e92472.png)
STATA面板数据模型操作命令讲解面板数据模型主要用于分析在一段时间内,多个个体上观察到的数据。
在面板数据模型中,个体可以是个人、家庭、公司等。
面板数据模型的分析主要包括汇总统计、描述性统计、回归分析等。
下面是一些STATA中常用的面板数据分析命令的介绍和使用说明:1. xtset命令:该命令用于设置数据集的面板数据特征。
在使用面板数据模型之前,需要先将数据集设置为面板数据。
使用xtset命令可以指定面板数据集的个体维度和时间维度。
示例:xtset id year该命令将数据集按照id(个体)和year(时间)进行分类。
2. xtsummary命令:该命令用于生成面板数据的汇总统计信息,包括平均值、标准差、最小值、最大值等。
示例:xtsummary var1 var2该命令将变量var1和var2的汇总统计信息显示出来。
3. xtreg命令:该命令用于进行固定效应模型(Fixed Effects Model)的估计,其中个体效应被视为固定参数,时间效应被视为随机参数。
示例:xtreg y x1 x2, fe该命令将变量y对x1和x2进行固定效应模型估计。
4. xtfe命令:该命令用于进行固定效应模型的估计,并提供了更多的选项和功能。
示例:xtfe y x1 x2, vce(robust)该命令将变量y对x1和x2进行固定效应模型估计,并使用鲁棒标准误。
5. xtlogit命令:该命令用于进行面板Logistic回归分析,适用于因变量为二分类变量的情况。
示例:xtlogit y x1 x2, re该命令将变量y对x1和x2进行面板Logistic回归分析,并进行随机效应的估计。
6. areg命令:该命令用于进行差别法(Difference-in-Differences)模型的估计,适用于时间和个体差异的面板数据分析。
上述命令只是STATA中一部分常用的面板数据模型操作命令。
在实际应用中,根据具体的研究需求和数据特征,还可以使用其他面板数据模型命令进行分析,如xtlogit、xtprobit等。
8.3面板模型的Stata命令及实例
![8.3面板模型的Stata命令及实例](https://img.taocdn.com/s3/m/8bd6de0958eef8c75fbfc77da26925c52cc5919a.png)
面板模型的Stata命令及实例面板数据的设定xtset panelvar timevar设定面板数据的Stata 命令为:告诉Stata 你的数据为面板数据面板(个体)变量取值须为整数且不重复时间变量假如“panelvar ”是字符串,可用encode country, gen(cntry)转换为数字型变量面板数据的设定xtset panelvar timevar设定面板数据的Stata 命令为:面板数据的设定面板数据统计特性的Stata 命令:xtdes 显示面板数据的结构,是否为平衡面板。
xtsum xtline varname显示组内、组间与整体的统计指标。
对每位个体分别显示该变量的时间序列图;如希望将所有个体的时间序列图叠放在一起,可加上选择项overlay。
“种植业产值对数”(ltvfo,1980 年不变价格)案例以数据集lin_1992.dta为例,取自Lin(1992) 发表在美国经济评论上,对家庭联产承包责任制与中国农业增长的经典研究。
该省际面板包含中国28个省1970-1987年有关种植业的数据。
被解释变量解释变量耕地面积对数(ltlan,千亩),种植业劳动力(ltwlab),机械动力与畜力对数(ltpow,千马力),化肥使用量对数(ltfer,千吨),截止年底采用家庭联产承包制的生产队比重(hrs),农村消费者价格与农村工业投入品价格之比的一阶滞后(mipric1,1950 年=100),超额收购价格与农村工业投入品价格之比(giprice,1950 年=100),复种指数(mci,播种面积除以耕地面积),非粮食作物占播种面积比重(ngca),时间趋势(t),province(省),year(年)。
案例设定province与year为面板(个体)变量及时间变量:1use lin_1992.dta,clearxtset province year面板数据的设定案例显示数据集中以上变量的统计特征,进行描述性统计xtsum ltvfo ltlan ltwlab ltpow ltfer hrs mipric1 giprice mci ngca不同省的种植业产值均随时间而增长,但变化趋势与时机不尽相同。
5分钟搞定Stata面板数据分析小教程实用
![5分钟搞定Stata面板数据分析小教程实用](https://img.taocdn.com/s3/m/9c63ca7c16fc700abb68fcdd.png)
如图: 至此,使用 stata 进行面板数据回归分析完成。
口令: reshape long var, i (样本名 )
例如: reshape long var, i(province) 其中 var 代表的是所有的年份( var2,var3,var4 ) 转化后的格式如图:
转化成功后继续重命名,其中 _j 这 里代表原始表中的年份, var 代表该变量的名 称 口令例如: rename _j year rename var taxi 也可直接在需要修改的名称处双击,在弹出的窗口中修改 如图:
步骤三:排序
口令: sort 变 量名
例如: sort province year 意思为将 province 按升序排列,然后再根据排好的 列 如图:
province 数列排 year 这一
(虽然很多时候在执行 sort 前数据就已经符合要求了,但以防万一请务期数据处理就完成了,请如法炮制的处理所有的变量。在 处理新变量前请使用
5 分钟搞定 Stata 面板数据分析 简易教程
步骤一:导入数据
口令: insheet using 文 件路径
例如: insheet using C:\STUDY\paper\taxi.csv 其中 csv 格式可用 excel 的“另存为 ”导出 数据请以时间( 1999, 2000 ,2001 )为横轴,样本名( 1,2,3 )为 纵轴 请注意:表中不能有中文字符,否则会出现错误。面板数据中不能有空值,没 有数据的位置请以 0 代替。 如图:
也可直接将数据复制粘贴到 stata 的 data editor 中 如图:
步骤二:调整格式
首先请将代表样本的 var1 重命名
口令: rename v ar1 样 本名
STATA面板数据模型操作命令
![STATA面板数据模型操作命令](https://img.taocdn.com/s3/m/b4e6d37fad02de80d4d840de.png)
STATA 面板数据模型估计命令一览表 一、静态面板数据的STATA 处理命令εαβit ++=x y it i it 固定效应模型μβit +=x y it itεαμit +=it it 随机效应模型(一)数据处理输入数据●tsset code year 该命令是将数据定义为“面板”形式●xtdes 该命令是了解面板数据结构●summarize sq cpi unem g se5 ln 各变量的描述性统计(统计分析)●gen lag_y=L.y /////// 产生一个滞后一期的新变量gen F_y=F.y /////// 产生一个超前项的新变量gen D_y=D.y /////// 产生一个一阶差分的新变量gen D2_y=D2.y /////// 产生一个二阶差分的新变量(二)模型的筛选和检验●1、检验个体效应(混合效应还是固定效应)(原假设:使用OLS混合模型)●xtreg sq cpi unem g se5 ln,fe对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。
在我们这个例子中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。
●2、检验时间效应(混合效应还是随机效应)(检验方法:LM统计量)(原假设:使用OLS混合模型)●qui xtreg sq cpi unem g se5 ln,re (加上“qui”之后第一幅图将不会呈现) xttest0可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。
可见,随机效应模型也优于混合OLS模型。
●3、检验固定效应模型or随机效应模型(检验方法:Hausman检验)原假设:使用随机效应模型(个体效应与解释变量无关)通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。
但是无法明确区分FE or RE的优劣,这需要进行接下来的检验,如下:Step1:估计固定效应模型,存储估计结果Step2:估计随机效应模型,存储估计结果Step3:进行Hausman检验●qui xtreg sq cpi unem g se5 ln,feest store fequi xtreg sq cpi unem g se5 ln,reest store rehausman fe (或者更优的是hausman fe,sigmamore/ sigmaless)可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。
STATA面板数据模型操作命令讲解
![STATA面板数据模型操作命令讲解](https://img.taocdn.com/s3/m/d9eefc80dbef5ef7ba0d4a7302768e9951e76e61.png)
STATA⾯板数据模型操作命令讲解STATA ⾯板数据模型估计命令⼀览表⼀、静态⾯板数据的STATA 处理命令εαβit ++=xy itiit固定效应模型µβit +=xy ititεαµit+=itit随机效应模型(⼀)数据处理输⼊数据●tsset code year 该命令是将数据定义为“⾯板”形式●xtdes 该命令是了解⾯板数据结构●summarize sq cpi unem g se5 ln 各变量的描述性统计(统计分析)●gen lag_y=L.y /////// 产⽣⼀个滞后⼀期的新变量gen F_y=F.y /////// 产⽣⼀个超前项的新变量gen D_y=D.y /////// 产⽣⼀个⼀阶差分的新变量gen D2_y=D2.y /////// 产⽣⼀个⼆阶差分的新变量(⼆)模型的筛选和检验●1、检验个体效应(混合效应还是固定效应)(原假设:使⽤OLS混合模型)●xtreg sq cpi unem g se5 ln,fe对于固定效应模型⽽⾔,回归结果中最后⼀⾏汇报的F统计量便在于检验所有的个体效应整体上显著。
在我们这个例⼦中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。
●2、检验时间效应(混合效应还是随机效应)(检验⽅法:LM统计量)(原假设:使⽤OLS混合模型)●qui xtreg sq cpi unem g se5 ln,re (加上“qui”之后第⼀幅图将不会呈现) xttest0可以看出,LM检验得到的P值为0.0000,表明随机效应⾮常显著。
可见,随机效应模型也优于混合OLS模型。
●3、检验固定效应模型or随机效应模型(检验⽅法:Hausman检验)原假设:使⽤随机效应模型(个体效应与解释变量⽆关)通过上⾯分析,可以发现当模型加⼊了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。
但是⽆法明确区分FE or RE的优劣,这需要进⾏接下来的检验,如下:Step1:估计固定效应模型,存储估计结果Step2:估计随机效应模型,存储估计结果Step3:进⾏Hausman检验●qui xtreg sq cpi unem g se5 ln,feest store fequi xtreg sq cpi unem g se5 ln,reest store rehausman fe (或者更优的是hausman fe,sigmamore/ sigmaless)可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满⾜。
STATA面板数据模型操作命令
![STATA面板数据模型操作命令](https://img.taocdn.com/s3/m/08badeac6f1aff00bfd51e1a.png)
STATA 面板数据模型估计命令一览表一、静态面板数据的STATA 处理命令εαβit ++=x y it iit 固定效应模型 εαμit +=it it 随机效应模型(一)数据处理输入数据●tsset code year 该命令是将数据定义为“面板”形式●xtdes 该命令是了解面板数据结构●summarize sq cpi unem g se5 ln 各变量的描述性统计(统计分析) ●gen lag_y=L.y /////// 产生一个滞后一期的新变量gen F_y=F.y /////// 产生一个超前项的新变量gen D_y=D.y /////// 产生一个一阶差分的新变量gen D2_y=D2.y /////// 产生一个二阶差分的新变量(二)模型的筛选和检验●1、检验个体效应(混合效应还是固定效应)(原假设:使用OLS 混合模型) ●xtreg sq cpi unem g se5 ln,fe对于固定效应模型而言,回归结果中最后一行汇报的F 统计量便在于检验所有的个体效应整体上显着。
在我们这个例子中发现F 统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS 模型。
●2、检验时间效应(混合效应还是随机效应)(检验方法:LM 统计量)(原假设:使用OLS 混合模型)●qui xtreg sq cpi unem g se5 ln,re (加上“qui ”之后第一幅图将不会呈现) xttest0可以看出,LM 检验得到的P 值为0.0000,表明随机效应非常显着。
可见,随机效应模型也优于混合OLS 模型。
●3、检验固定效应模型or随机效应模型(检验方法:Hausman检验)原假设:使用随机效应模型(个体效应与解释变量无关)通过上面分析,可以发现当模型加入了个体效应的时候,将显着优于截距项为常数假设条件下的混合OLS模型。
但是无法明确区分FE or RE的优劣,这需要进行接下来的检验,如下:Step1:估计固定效应模型,存储估计结果Step2:估计随机效应模型,存储估计结果Step3:进行Hausman检验●qui xtreg sq cpi unem g se5 ln,feest store fequi xtreg sq cpi unem g se5 ln,reest store rehausman fe (或者更优的是hausman fe,sigmamore/ sigmaless) 可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。
STATA面板数据模型操作命令讲解
![STATA面板数据模型操作命令讲解](https://img.taocdn.com/s3/m/91eeec44773231126edb6f1aff00bed5b9f3733c.png)
STATA面板数据模型操作命令讲解STATA是一种常用的统计分析软件,可以用于面板数据模型的操作。
面板数据模型是一种用来分析涉及多个单位和多个时间点的数据的统计模型,其主要特点是能够考虑单位间和时间间的相关性。
在STATA中,可以使用一系列命令来进行面板数据模型的操作,包括数据导入、数据清洗、模型估计和结果展示等。
下面将详细介绍STATA中面板数据模型操作的常用命令。
首先,要进行面板数据模型的操作,首先需要将数据导入到STATA中。
STATA支持多种数据格式的导入,包括Excel、CSV和数据库等。
常用的导入命令包括:1. use命令:用于导入STATA格式的数据文件。
例如:use data.dta2. import命令:用于导入其他格式的数据文件。
例如:import excel data.xlsx, firstrow导入数据后,接下来需要进行数据清洗和变量定义。
可以使用一系列命令对数据进行操作,例如生成新变量、删除缺失值和标识变量等。
常用的数据清洗命令包括:1. generate命令:用于生成新变量。
例如:generate log_y = log(y)2. drop命令:用于删除变量。
例如:drop x3. replace命令:用于替换变量值。
例如:replace y = 0 if y < 0数据清洗完成后,就可以开始估计面板数据模型。
常用的估计命令包括固定效应模型(Fixed Effects Model)和随机效应模型(Random Effects Model)。
下面分别介绍这两种模型的估计命令。
1.固定效应模型的估计命令:xtreg y x1 x2, fe其中,xtreg表示面板数据的回归命令,y为因变量,x1和x2为自变量,fe为固定效应模型的选项。
2.随机效应模型的估计命令:xtreg y x1 x2, re其中,re表示随机效应模型的选项。
除了固定效应模型和随机效应模型,STATA还支持其他面板数据模型的估计方法,如差分估计(Difference-in-Differences)、合成控制法(Synthetic Control Method)等。
STATA面板数据模型操作命令
![STATA面板数据模型操作命令](https://img.taocdn.com/s3/m/b4e6d37fad02de80d4d840de.png)
STATA 面板数据模型估计命令一览表 一、静态面板数据的STATA 处理命令εαβit ++=x y it i it 固定效应模型μβit +=x y it itεαμit +=it it 随机效应模型(一)数据处理输入数据●tsset code year 该命令是将数据定义为“面板”形式●xtdes 该命令是了解面板数据结构●summarize sq cpi unem g se5 ln 各变量的描述性统计(统计分析)●gen lag_y=L.y /////// 产生一个滞后一期的新变量gen F_y=F.y /////// 产生一个超前项的新变量gen D_y=D.y /////// 产生一个一阶差分的新变量gen D2_y=D2.y /////// 产生一个二阶差分的新变量(二)模型的筛选和检验●1、检验个体效应(混合效应还是固定效应)(原假设:使用OLS混合模型)●xtreg sq cpi unem g se5 ln,fe对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。
在我们这个例子中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。
●2、检验时间效应(混合效应还是随机效应)(检验方法:LM统计量)(原假设:使用OLS混合模型)●qui xtreg sq cpi unem g se5 ln,re (加上“qui”之后第一幅图将不会呈现) xttest0可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。
可见,随机效应模型也优于混合OLS模型。
●3、检验固定效应模型or随机效应模型(检验方法:Hausman检验)原假设:使用随机效应模型(个体效应与解释变量无关)通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。
但是无法明确区分FE or RE的优劣,这需要进行接下来的检验,如下:Step1:估计固定效应模型,存储估计结果Step2:估计随机效应模型,存储估计结果Step3:进行Hausman检验●qui xtreg sq cpi unem g se5 ln,feest store fequi xtreg sq cpi unem g se5 ln,reest store rehausman fe (或者更优的是hausman fe,sigmamore/ sigmaless)可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。
STATA面板数据模型操作命令
![STATA面板数据模型操作命令](https://img.taocdn.com/s3/m/eb0b9ffe970590c69ec3d5bbfd0a79563c1ed43b.png)
STATA面板数据模型操作命令STATA是一个强大的统计分析软件,可以进行各种数据操作和模型建立。
对于面板数据,即具有时间序列和跨个体的数据,STATA提供了多种命令来进行数据的操作和模型的拟合。
以下是一些常用的STATA面板数据模型操作命令:1. xtset命令:用于设置数据集的面板结构,将数据按个体和时间次序排序。
例如,xtset country year可以将数据按照国家和年份排序。
2. xtreg命令:用于拟合面板数据的固定效应模型。
例如,xtreg y x1 x2, fe可以拟合一个包含固定效应的面板数据模型,其中y为因变量,x1和x2为解释变量。
3. xtfe命令:用于估计固定效应模型的固定效应,即个体固定效应模型。
例如,xtfe y x1 x2可以计算出个体固定效应。
4. xtgls命令:用于估计面板数据的一般化最小二乘回归模型。
例如,xtgls y x1 x2可以拟合一个包含一般固定效应的面板数据模型。
5. xtmixed命令:用于估计混合效应模型,即个体和时间固定效应模型。
例如,xtmixed y x1 x2 , country:, var(can)可以在个体和时间固定效应下估计一个模型。
6. xtreg, re命令:用于估计面板数据的随机效应模型。
例如,xtreg y x1 x2, re可以计算出随机效应模型。
7. xtivreg命令:用于估计面板数据的双向固定效应或双向随机效应的工具变量回归模型。
例如,xtivreg y (x1 = z1) (x2 = z2), fe可以计算出一个包含工具变量的双向固定效应模型。
8. xtdpd命令:用于估计面板数据的动态面板数据模型。
例如,xtdpd y x1 x2, lags(2)可以进行一个包含两期滞后的动态面板数据模型估计。
9. xtregar命令:用于估计拓展的面板数据模型。
例如,xtregar y x1 x2, fe(ec)可以在考虑了异方差和异方差的面板数据模型下进行估计。
STATA面板数据模型操作命令
![STATA面板数据模型操作命令](https://img.taocdn.com/s3/m/8f2991e9360cba1aa811da90.png)
一、静态面板数据地处理命令(一)数据处理输入数据● 该命令是将数据定义为“面板”形式● 该命令是了解面板数据结构● 各变量地描述性统计(统计分析)● 产生一个滞后一期地新变量产生一个超前项地新变量产生一个一阶差分地新变量产生一个二阶差分地新变量(二)模型地筛选和检验●、检验个体效应(混合效应还是固定效应)(原假设:使用混合模型)●对于固定效应模型而言,回归结果中最后一行汇报地统计量便在于检验所有地个体效应整体上显著.在我们这个例子中发现统计量地概率为,检验结果表明固定效应模型优于混合模型.文档收集自网络,仅用于个人学习●、检验时间效应(混合效应还是随机效应)(检验方法:统计量)(原假设:使用混合模型)● (加上“”之后第一幅图将不会呈现)文档收集自网络,仅用于个人学习可以看出,检验得到地值为,表明随机效应非常显著.可见,随机效应模型也优于混合模型.文档收集自网络,仅用于个人学习●、检验固定效应模型随机效应模型(检验方法:检验)原假设:使用随机效应模型(个体效应与解释变量无关)通过上面分析,可以发现当模型加入了个体效应地时候,将显著优于截距项为常数假设条件下地混合模型.但是无法明确区分地优劣,这需要进行接下来地检验,如下:文档收集自网络,仅用于个人学习:估计固定效应模型,存储估计结果:估计随机效应模型,存储估计结果:进行检验●(或者更优地是)文档收集自网络,仅用于个人学习可以看出,检验地值为,拒绝了原假设,认为随机效应模型地基本假设得不到满足.此时,需要采用工具变量法和是使用固定效应模型.文档收集自网络,仅用于个人学习●、时间固定效应(以上分析主要针对地是个体效应)如果希望进一步在上述模型中加入时间效应,可以采用时间虚拟变量来实现.首先,我们需要定义一下个时间虚拟变量.文档收集自网络,仅用于个人学习● () (命令用于列示变量地组类别,选项()用于生产一个以开头地年度虚拟变量)文档收集自网络,仅用于个人学习(作用在于去掉第一个虚拟变量以避免完全共线性)若在固定效应模型中加入时间虚拟变量,则估计模型地命令为:(四)异方差和自相关检验●、异方差检验(组间异方差)本节主要针对地是固定效应模型进行处理()检验原假设:同方差需要检验模型中是否存在组间异方差,需要使用命令.●显然,原假设被拒绝.此时,需要进一步以获得参数地估计量,命令为:● ()文档收集自网络,仅用于个人学习其中,组间异方差通过()选项来设定.上述结果是采用两步获得,即,先采用估计不考虑异方差地模型,进而利用其残差计算...,并最终得到估计量.文档收集自网络,仅用于个人学习●、序列相关检验对于较大地面板而言,往往无法完全反映时序相关性,此时便可能存在序列相关,在多数情况下被设定为()过程.文档收集自网络,仅用于个人学习原假设:序列不存在相关性.模型地序列相关检验对于固定效应模型,可以采用检验法,命令为:●可以发现,这里地,我们可以在地显著性水平下爱拒绝不存在序列相关地原假设.考虑到样本,该检验地最后一步是用对进行回归,因此,输入以下命令得到.检验该值是否显著异于,因为在原假设下(不相关),可见本例中不相等,拒绝原假设,说明存在序列相关.文档收集自网络,仅用于个人学习● ()模型地序列相关检验对于模型,可以采用命令来执行检验:● *这里汇报了个统计量,分别用于检验模型中随机效应(单尾和双尾)、序列相关以及二者地联合显著性,检验结果表明存在随机效应和序列相关,而且对随机效应和序列相关地联合检验也非常显著.文档收集自网络,仅用于个人学习稳健型估计上述结果表明,无论是还是模型,干扰项中都存在显著地序列相关.为此,我们进一步采用命令来估计模型,首先考虑固定效应模型:文档收集自网络,仅用于个人学习● *●、“异方差—序列相关”稳健型标准误虽然上述估计方法在估计方差协方差矩阵时考虑了异方差和序列相关地影响,但都未将两者联立在一起考虑,要获得“异方差序列相关”稳健型标准误,只需在命令中附加()或者()选项即可.例如,对于模型,我们可以执行如下命令:文档收集自网络,仅用于个人学习与之前未经处理地估计结果相比,附加命令()选项时地结果,虽然系数地估计值未发生变化,但此时得到地标准误明显增大了,致使得到地估计结果更加保守.对于面板数据模型而言,在计算所谓地“”标准误时,是以个体为单位调整标准误地.因此,我们得到地“”标准误其实是同时调整了异方差和序列相关后地标准误.换言之,上述结果与设定()选项地结果完全相同.文档收集自网络,仅用于个人学习●、截面相关检验原假设:截面之间不存在着相关性()模型检验对于模型,可以利用命令来检验截面相关性:●(该命令主要针对地是大小类型地面板数据,在本例中无法使用,故图标略去.)()模型检验对于模型,可以利用命令来检验截面相关性:●(下面命令是另一个检验指标)可以看出,两种不同地检验方法均显示面板数据存在着截面相关性.●、“异方差—序列相关—截面相关”稳健型标准误()模型估计对于模型,在确认上述存在着截面相关地情况下,我们可以采用()编写地命令获取()提出地“异方差—序列相关—截面相关”稳健型标准误:文档收集自网络,仅用于个人学习●这里,命令会自动选择地滞后阶数为,系数估计值和与地结果完全相同,但标准误存在着较大差异.可见,在本例中,截面相关对统计推断有较大地影响.文档收集自网络,仅用于个人学习若读者有跟高地方法来确定自相关地滞后阶数,则可以通过( )选项设定.当然,在多数情况下,这很难做到.不过我们可以通过附加()来估计仅考虑异方差和截面相关地稳健型标准误,命令如下:文档收集自网络,仅用于个人学习● ()()模型估计(略,待补充)二、动态面板数据地处理命令(一)差分文档收集自网络,仅用于个人学习() 文档收集自网络,仅用于个人学习(二)系统文档收集自网络,仅用于个人学习, 文档收集自网络,仅用于个人学习(三)内生性检验●(四)序列相关检验●: , 文档收集自网络,仅用于个人学习"黑龙江" "吉林" "辽宁" "山西" "湖北" "湖南" "河南" "江西" "安徽"文档收集自网络,仅用于个人学习。
STATA面板数据模型操作命令
![STATA面板数据模型操作命令](https://img.taocdn.com/s3/m/2ef5b6bec9d376eeaeaad1f34693daef5ff71352.png)
STATA面板数据模型操作命令下面是一些在STATA中用于面板数据模型操作的常用命令:1. xtset命令:该命令用于设置数据为面板数据,并指定面板数据的结构,如个体标识和时间标识。
例如,xtset id year将数据设置为个体标识为id,时间标识为year的面板数据。
2. xtreg命令:该命令用于估计面板数据模型中的固定效应或随机效应模型。
固定效应模型假设个体效应是固定的,随机效应模型则将个体效应看作是随机变量。
可以通过指定不同的选项进行不同类型的估计,如-fe表示固定效应,re表示随机效应。
3. xtsum命令:该命令用于汇总面板数据的描述统计信息,如平均值、标准差、最小值和最大值等。
可以使用不同的选项来指定需要计算的统计量。
4. xtline命令:该命令用于绘制面板数据的线性图。
可以使用不同的选项来指定需要绘制的变量和面板单位。
5. xttest0命令:该命令用于进行面板数据模型的序列相关性检验。
该命令会计算序列相关系数和相关性检验的统计量,并根据检验结果给出相应的结果。
6. xtreg命令(选项, qls):该命令用于估计面板数据模型中的定阶自相关模型。
该模型可以用来处理面板数据中存在的自相关问题。
7. xtivreg命令:该命令用于进行面板数据模型的时间因果分析。
该命令使用了仪器变量来解决内生性问题。
8. xtfe命令:该命令用于估计面板数据模型中的固定效应模型的回归系数。
该命令会将个体固定效应去除后,对回归方程进行估计。
9. xtgls命令:该命令用于估计面板数据模型中具有异方差和相关性的广义最小二乘回归系数。
该命令可以通过指定不同的选项来进行不同类型的估计。
10. xttrans命令:该命令用于进行面板数据模型的数据转换操作。
可以使用不同的选项来进行不同类型的数据转换。
以上是STATA中用于面板数据模型操作的一些常用命令。
在实际使用中,根据具体的需求和数据特点,可以结合不同的命令进行面板数据模型的分析和操作。
STATA面板数据模型操作命令
![STATA面板数据模型操作命令](https://img.taocdn.com/s3/m/30257a53d5bbfd0a78567371.png)
S T A T A 面板数据模型估计命令一览表一、静态面板数据的STATA 处理命令εαβit ++=x y it iit 固定效应模型 εαμit +=it it 随机效应模型(一)数据处理输入数据●tsset code year 该命令是将数据定义为“面板”形式●xtdes 该命令是了解面板数据结构●summarize sq cpi unem g se5 ln 各变量的描述性统计(统计分析) ●gen lag_y=L.y /////// 产生一个滞后一期的新变量gen F_y=F.y /////// 产生一个超前项的新变量gen D_y=D.y /////// 产生一个一阶差分的新变量gen D2_y=D2.y /////// 产生一个二阶差分的新变量(二)模型的筛选和检验●1、检验个体效应(混合效应还是固定效应)(原假设:使用OLS 混合模型) ●xtreg sq cpi unem g se5 ln,fe对于固定效应模型而言,回归结果中最后一行汇报的F 统计量便在于检验所有的个体效应整体上显著。
在我们这个例子中发现F 统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS 模型。
●2、检验时间效应(混合效应还是随机效应)(检验方法:LM 统计量) (原假设:使用OLS 混合模型)●qui xtreg sq cpi unem g se5 ln,re (加上“qui ”之后第一幅图将不会呈现) xttest0可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。
可见,随机效应模型也优于混合OLS模型。
●3、检验固定效应模型or随机效应模型(检验方法:Hausman检验)原假设:使用随机效应模型(个体效应与解释变量无关)通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。
但是无法明确区分FE or RE的优劣,这需要进行接下来的检验,如下:Step1:估计固定效应模型,存储估计结果Step2:估计随机效应模型,存储估计结果Step3:进行Hausman检验●qui xtreg sq cpi unem g se5 ln,feest store fequi xtreg sq cpi unem g se5 ln,reest store rehausman fe (或者更优的是hausman fe,sigmamore/ sigmaless) 可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。
stata面板数据攻略
![stata面板数据攻略](https://img.taocdn.com/s3/m/1ba9d909fbd6195f312b3169a45177232f60e424.png)
1、将数据在excel 表格中按以下顺序排列好。
第一列为年份,第二列为省份(省份用1-31个数字表示,字符不行),后面几列为变量。
2、将Excel表格另存为CSV格式,在Stata中导入CSV格式的文档(file-import-第一个选项,然后点Browse,在跳出的“打开”文档的文件类型选择CSV,找到自己之前保存好的CSV文档)。
3、定义面板数据,输入以下命令:. xtset province year4、单位根检验面板数据的单位根检验方法有很多种,一般我们只选两种,即相同根单位根检验和不同根单位根检验。
如果数据是平衡的,则可使用LLC检验(适用于同根)和IPS检验(适用于不同根)。
一般的stata并没有自带这两个程序需要自己下载安装,我们可以在命令栏键入:search levinlin, net和search ipshin, net,然后按照提示逐步安装。
也可直接输入命令:ssc install levinlin,即自动完成安装。
在开始进行协整检验之前,需要将面板数据转化为时间序列,使用以下命令:tsset province year 单位根检验输入如下命令:Levinlin 变量名,lags(1)Ipshin 变量名,lags(1)如果存在单位根,则需要进行一阶差分,并再次进行单位根检验,输入以下命令: levinlin D.变量名,lags(1)注:Users of Stata 11+ should use the official xtunitroot ips command。
菜单:Statistics > Longitudinal/panel data > Unit-root tests 具体操作可以参照李子奈的说法:单位根检验是通过三个模型来完成,首先从含有截距和趋势项的模型开始,再检验只含截距项的模型,最后检验二者都不含的模型。
并且认为,只有三个模型的检验结果都不能拒绝原假设时,我们才认为时间序列是非平稳的,而只要其中有一个模型的检验结果拒绝了零假设,就可认为时间序列是平稳的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8.2. 静态面板数据模型
4
估计模型的参数,而模型中个体的数目又不是很大的情况下,采用固定效应模型是个不错的选 择,因为它非常容易估计。但当我们需要对模型的误差成分进行分析时(通常分解为长期效果 和短期效果),就只能采用随机效应模型。在这种情况下,即使模型中的部分解释变量与个体 效应相关,我们仍然可以通过工具变量法对模型进行估计。
8.2.4 STATA 实现 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
8.3 非均齐方差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
8.2 静态面板数据模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
8.2.1 固定效应模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2
8.2. 静态面板数据模型
3
8.2 静态面板数据模型
我们一般所说的静态面板数据模型,是指解释变量中不包含被解释变量的滞后项(通 常为一阶滞后项)的情形。但严格地讲,随机干扰项服从某种序列相关(如 AR(1), AR(2), MA(1)等)的模型也不是静态模型。动态模型和静态模型在处理方法上往往有较大的差异。本 节中我们重点介绍两种最为常用的静态模型—固定效应模型和随机效应模型。
8.3.3 方差形式未知时的稳健性估计 . . . . . . . . . . . . . . . . . . . . . . . . . . 30
8.3.4 STATA 实现 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
8.2.2 随机效应模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
8.2.3 假设检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
8.2. 静态面板数据模型
5
任。所以我们有必要先进行一些变换以消除固定效应,进而对简化的模型进行估计,本小节和 下一小节介绍的这两种方法都是基于此目的进行的。
我们首先将所有观察值进行堆叠,于是模型 (8.1) 可用矩阵形式表示为:
y = Da + Xβ + ε
(8.6)
其 中 , y = (y1, y2, · · · , yN ) , ε = (ε1, ε2, · · · , ε N ) , 均 为 N T × 1 向 量, D = IN ⊗ 1T , a = (a1, a2, · · · , aN ) 。考虑到 D 矩阵的构造形式,它事实上对应着 N 个虚拟变量。因此,模型 (8.6) 等价于给混合 OLS 模型 y = Xβ + ε 加入 N 个虚拟变量。
这两种模型的差异主要反映在对“个体效应”的处理上。固定效应模型中的个体差异反映 在每个个体都有一个特定的截距项上;随机效应模型则假设所有的个体具有相同的截距项,个 体的差异主要反应在随机干扰项的设定上,因此该模型通常也称为“误差成分模型”。基于 此,一种常见的观点认为,当我们的样本来自一个较小的母体时,我们应该使用固定效应模 型,而当样本来自一个很大的母体时,应当采用随机效应模型。比如在研究中国地区经济增长 的过程中,我们以全国 28 个省区为研究对象,可以认为这 28 个省区几乎代表了整个母体。同 时也可以假设在样本区间内,各省区的经济结构、人口素质等不可观测的特质性因素是固定不 变的,因此采用固定效应模型是比较合适的。而当我们研究西安市居民的消费行为时,即使样 本数为 10000 人,相对于西安市 600 万人口的母体而言仍然是个很小的样本。此时,可以认为 不同的居民在个人能力、消费习惯等方面的差异是随机的,此时采用随机效应模型较为合适。
E[εi |xi , ai ] = 0
(8.4)
假设 2 :
V ar [εi |xi , ai ] = σ 2IT
(8.5)
假设 1 表明干扰项 ε 与解释变量 x 的当期观察值、前期观察值以及未来的观察值均不相关,也 就是说我们的模型中所有的解释变量都是严格外生的。假设 2 就是一般的同方差假设,在此假 设下模型 (8.1) 的 OLS 估计是 BLUE 的。当此假设无法满足时,我们就需要处理异方差或序列 相关以便得到稳健性估计量。
• 包含的信息量更大,降低了变量间共线性的可能性,增加了自由度和估计的有效性。
• 便于分析动态调整。
1如宁夏属于回族自治区,那里的回民因为信仰伊斯兰教,所以不允许饮酒的,而生活在宁夏的许多汉民也往往 因为自己的回民朋友无法饮酒而无形中减少了啤酒的消费量。
2如中国南部地区啤酒的消费量比较大,而北方很多地区只有在夏天才会饮用较多的啤酒,冬天他们一般是只喝 白酒的。
在正式估计模型之前,我们先定义一些有用的矩阵运算,它们将在后面的分析中反复 使用。定义 DD = IN ⊗ JT , 其中, JT = 1T 1T 为 T × T 维矩阵,每个元素均为 1。同时, 我们定义 P = D(D D)−1D = IN ⊗ J¯T , J¯T = (1/T )JT 是 T × T 维矩阵,每个元素均为 1/T ; Q = IN T − D(D D)−1D = IN T − P 。矩阵 P 和 Q 都具有如下性质:
组内估计量
上面我们已经提到,在假设 1 和假设 2 同时成立的情况下,模型 (8.1) 的 OLS 估计是 BLUE 的。但在实际操作的过程中,如果 N 比较大,那么我们的模型中将包含 (N+K) 个解释变 量,4计算的工作量往往很大,对于 N 相当大的情况(如 N=10000 ),一般的计算机都无法胜
8.4 参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1
第八章 面板数据模型
8.1 简介
面板数据,简言之是时间序列和截面数据的混合。严格地讲是指对一组个体(如居民、国 家、公司等)连续观察多期得到的资料。所以很多时候我们也称其为“追踪资料”。近年来, 由于面板数据资料获得变得相对容易,使得其应用范围也不断扩大。而关于面板数据的计量理 论也几乎涉及到了以往截面分析和时间序列分析中所有可能出现的主题,如近年来发展出的 面板向量自回归模型(Panel VAR)、面板单位根检验(Panel Unit Root test)、面板协整分析 (Panel Cointegeration)、门槛面板数据模型(Panel Threshold)等,都是在现有截面分析和时 间序列分析中的热点主题的基础上发展起来的。
遗憾的是,很多情况下,我们并不能明确地区分我们的样本来自一个较大母体还是较小的 母体。因此有些学者认为,区分固定效应模型和随机效应模型应当看使用二者的假设条件是否 满足。由于随机效应模型把个体效应设定为干扰项的一部分,所以就要求解释变量与个体效应 不相关,而固定效应模型并不需要这个假设条件。所以如果我们的检验结果表明该假设满足, 那么就应该采用随机效应模型,因为它更为有效,反之,就需要采用固定效应模型。
简言之,两种模型有各自的优缺点和适用范围,在实证分析的过程中,我们一方面要根据 分析的目的选择合适的模型,同时也要以 8.2.3 节中介绍的假设检验方法为基础进行模型筛选。
8.2.1 固定效应模型
模型的基本设定和假设条件 若视 ai 为固定效应,模型 (8.1) 可以采用向量的形式表示为:
yi = ai 1T + xi β + εi
Estimation with STATA
连玉君 (西安交通大学金禾经济研究中心)
arlion@ 2005.10
目录
第八章 面板数据模型
2
8.1 简介 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
(8.3)
其中, yi = (yi1, yi2, · · · , yiT ) , xi = (xi1, xi2, · · · , xiT ) , εi = (εi1, εi2, · · · , εiT ) , 1T 是一个所有元 素都为 1 的 T × 1 列向量。
我们有如下两个基本假设:3
假设 1 :
8.3.1 异方差 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
8.3.2 序列相关 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
考虑如下模型:
yit = xit β + uit uit = ai + εit
(8.1) (8.2)
其中, i = 1, 2, · · · , N , t = 1, 2, · · · , T ;xit 为 K ×1 列向量, K 为解释变量的个数, β 为 K × 1 系数列向量。对于特定的个体 i 而言, ai 表示那些不随时间改变的影响因素,而这些因 素在多数情况下都是无法直接观测或难以量化的,如个人的消费习惯、国家的社会制度等,我 们一般称其为“个体效应”(individual effects)。对“个体效应”的处理主要有两种方式:一种是 视其为不随时间改变的固定性因素,相应的模型称为“固定效应”模型;另一种是视其为随机 因素,相应的模型称为“随机效应”模型。