面板数据分析案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
面板数据分析案例
一、打开数据
利用stata软件打开数据gurnfeld.dta,得到有关
第一步,声明截面变量和时间变量。命令为:
tsset company year或xtset company year
显示:
panel variable: company (strongly balanced)
time variable: year, 1935 to 1954
delta: 1 year
第二步,进行样本的描述性统计。首先我们看看样本的大体分布情况,命令为:xtdes
company: 1, 2, ..., 10 n = 10
year: 1935, 1936, ..., 1954 T = 20
Delta(year) = 1 year
Span(year) = 20 periods
(company*year uniquely identifies each observation)
Distribution of T_i: min 5% 25% 50% 75% 95% max 20 20 20 20 20 20 20
Freq. Percent Cum. | Pattern
---------------------------+----------------------
10 100.00 100.00 | 11111111111111111111
---------------------------+----------------------
10 100.00 | XXXXXXXXXXXXXXXXXXXX
接下来,我们列示出样本中主要变量的基本统计量,命令为:xtsum
xtsum invest mvalue kstock
我们发现统计结果是按照"整体"、"组间"和"组内"三个层次进行的。当然,你也可以采用sum命令来得到基本统计量,而且在写论文时,所需列示的结果并不要求像上面那么详细,此时sum命令反而更实用。
第三歩,面板数据模型回归分析。
我们先做固定效应模型,命令为:
xtreg mvalue invest kstock,fe(软件默认为随机效应)
Fixed-effects (within) regression Number of obs = 200
Group variable: company Number of groups = 10
R-sq: within = 0.4117 Obs per group: min = 20 between = 0.8078 avg = 20.0 overall = 0.7388 max = 20
F(2,188) = 65.78 corr(u_i, Xb) = 0.6955 Prob > F = 0.0000
------------------------------------------------------------------------------ mvalue | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- invest | 2.856166 .3075147 9.29 0.000 2.249543 3.462789 kstock | -.5078673 .1403662 -3.62 0.000 -.7847625 -.2309721 _cons | 804.9802 32.43177 24.82 0.000 741.0033 868.9571 -------------+---------------------------------------------------------------- sigma_u | 905.81517
sigma_e | 268.73329
rho | .91910377 (fraction of variance due to u_i)
------------------------------------------------------------------------------ F test that all u_i=0: F(9, 188) = 113.76 Prob > F = 0.0000
结果的前两行列示了模型的类别(本例中为固定效应模型)、截面变量、以及估计中使用的样本数目和个体的数目。第3行到第5行列示了模型的拟合优度,分为组内、组间和样本总体三个层次。第6行和第7行分别列示了针对参数联合检验的F统计量和相应的P值,本例中分别为65.78和0.0000,表明参数整体上相当显著。第8-11行列示了解释变量的估计系数、标准差、t统计量和相应的P值以及95%的置信区间,这和我们在进行截面回归是得到的结果是一样的。最后四行列示了固定效应模型中个体效应和隨机干扰项的方差估计值(分别为sigma_u和sigma_e),二者之间的关系(rho)。最后一行给出了检验固定效应是否显著的F 统计量和相应的P值,本例中固定效应非常显著。
估计随机效应模型的命令为:
xtreg mvalue invest kstock,re
Random-effects GLS regression Number of obs = 200 Group variable: company Number of groups = 10
R-sq: within = 0.4115 Obs per group: min = 20 between = 0.8043 avg = 20.0 overall = 0.7371 max = 20
Wald chi2(2) = 149.94 corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000