stata处理面板数据及修正命令集合

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

步骤一:导入数据

原始表如下,

数据请以时间(1998,1999,2000,2001??)为横轴,样本名(北京,天津,河北??)为纵轴

将中文地名替换为数字。

注意:表中不能有中文字符,否则会出现错误。面板数据中不能有空值。

去除年份的一行,将其余部分复制到stata的data editor中,或保存为csv格式。

打开stata,调用数据。

方法一:直接复制到data editor中。

方法二:使用口令:insheet using??文件路径

调用例如:insheet using? C:\STUDY\paper\taxi.csv

其中csv格式可用excel的“另存为”导出

步骤二:调整格式

首先请将代表样本的var1重命名

口令:rename var1?样本名

例如:rename var1 province

也可直接在var1处双击,在弹出的窗口中修改:

接下来将数据转化为面板数据的格式

口令:reshape long var, i(样本名)

例如:reshape long var, i(province)

其中var代表的是所有的年份(var2,var3,var4??)

转化成功后继续重命名,其中_j 这里代表原始表中的年份,var代表该变量的名称

口令例如:

rename _j year

rename var taxi

也可直接在需要修改的名称处双击,在弹出的窗口中修改

步骤三:排序

口令:sort?变量名

例如:sort province year

意思为将province按升序排列,然后再根据排好的province数列排year这一列

最后,保存。

至此,一个变量的前期数据处理就完成了,请如法炮制的处理所有的变量,也就是说每个变量都做一个dta文件。在处理新变量前请使用

口令:clear

将stata重置

步骤四:合并数据

任意打开一个处理过的变量的dta文件作为基础表(推荐使用因变量的dta文件,这里使用so2作为因变量)

口令:?merge?样本名时间?using?文件路径

例如:merge province year using C:\STUDY\paper\taxi.dta

意思是将taxi的数据添加到so2的数据表中

然后使用

口令:tab _merge

然后使用

口令:drop _merge

将数据表中的_merge一列去掉,

接着重新使用

口令:sort?样本名时间

例如:sort province year

为新生成的表排序。

如法炮制,将所有的变量都添加到基础表中,

最终步骤:回归

首先,使用

口令:xtset??样本名时间

定义面板数据

例如:xtset province year

然后使用:

口令:xtreg?因变量自变量

进行回归分析

例如:xtreg so2 taxi busload drivers roadlength

至此,使用stata进行面板数据回归分析完成

面板模型分为混合回归模型、固定效应模型、随机效应模型

固定效应分为个体/时点固定效应,个体时点双固定效应

随机效应分为个体/时点随机效应,个体时点双随机效应

描述性统计:sum 标准化:sum(x-均值)/标准差

产生新变量:gen pol=(pol-均值)/标准差

(1)普通回归命令:reg y x1 x2 一般p<0.05

(2)检验多重共线性:estat vif vif为方差膨胀因子,vif<10,否则要消除多重共线性相关系数矩阵corr y x1 x2

区分固定效应还是随机效应:

xtreg y x1 x2, fe

est store fe 这一步结束看结果最后一行F检验p<0.05,排除混合回归

xtreg y x1 x2, re

est store re

hausman fe re,constant sigmamore hausman检验

P>0.05接受原假设:随机效应p<0.05接受备择假设:固定效应

区分个体固定效应还是时点固定效应:

xtreg y x1 x2, fe 结果p<0.05,则个体固定效应ok

xtreg y x1 x2 i.year 结果p<0.05,则时点固定效应ok

xtreg y x1 x2 i.year, fe 双向固定效应

xtreg y x1 x2, fe r r为聚类稳健标准误

将多个面板回归结果汇总到一起,命令如下:

xtreg y x1 x2

est store model1

xtreg y x3 x4

est store model2

:

:

以此类推

esttab model1 model2...

安装新命令:ssc install 名字或findit 名字,根据要求安装异方差检验:斯皮尔曼等级相关系数、怀特检验

克服异方差:权重

自相关:误差项与滞后项的相关关系

克服自相关:广义OLS

滞后变量:易多重共线性

虚拟变量:加法,测截距变动;乘法,测斜率变动

固定效应异方差检验:xtreg y x1 x2

Xttest3

序列相关检验:固定效应模型——xtserial y x1 x2

随机效应模型——xtreg y x1 x2, re

相关文档
最新文档