stata处理面板数据及修正命令集合
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
步骤一:导入数据
原始表如下,
数据请以时间(1998,1999,2000,2001??)为横轴,样本名(北京,天津,河北??)为纵轴
将中文地名替换为数字。
注意:表中不能有中文字符,否则会出现错误。面板数据中不能有空值。
去除年份的一行,将其余部分复制到stata的data editor中,或保存为csv格式。
打开stata,调用数据。
方法一:直接复制到data editor中。
方法二:使用口令:insheet using??文件路径
调用例如:insheet using? C:\STUDY\paper\taxi.csv
其中csv格式可用excel的“另存为”导出
步骤二:调整格式
首先请将代表样本的var1重命名
口令:rename var1?样本名
例如:rename var1 province
也可直接在var1处双击,在弹出的窗口中修改:
接下来将数据转化为面板数据的格式
口令:reshape long var, i(样本名)
例如:reshape long var, i(province)
其中var代表的是所有的年份(var2,var3,var4??)
转化成功后继续重命名,其中_j 这里代表原始表中的年份,var代表该变量的名称
口令例如:
rename _j year
rename var taxi
也可直接在需要修改的名称处双击,在弹出的窗口中修改
步骤三:排序
口令:sort?变量名
例如:sort province year
意思为将province按升序排列,然后再根据排好的province数列排year这一列
最后,保存。
至此,一个变量的前期数据处理就完成了,请如法炮制的处理所有的变量,也就是说每个变量都做一个dta文件。在处理新变量前请使用
口令:clear
将stata重置
步骤四:合并数据
任意打开一个处理过的变量的dta文件作为基础表(推荐使用因变量的dta文件,这里使用so2作为因变量)
口令:?merge?样本名时间?using?文件路径
例如:merge province year using C:\STUDY\paper\taxi.dta
意思是将taxi的数据添加到so2的数据表中
然后使用
口令:tab _merge
然后使用
口令:drop _merge
将数据表中的_merge一列去掉,
接着重新使用
口令:sort?样本名时间
例如:sort province year
为新生成的表排序。
如法炮制,将所有的变量都添加到基础表中,
最终步骤:回归
首先,使用
口令:xtset??样本名时间
定义面板数据
例如:xtset province year
然后使用:
口令:xtreg?因变量自变量
进行回归分析
例如:xtreg so2 taxi busload drivers roadlength
至此,使用stata进行面板数据回归分析完成
面板模型分为混合回归模型、固定效应模型、随机效应模型
固定效应分为个体/时点固定效应,个体时点双固定效应
随机效应分为个体/时点随机效应,个体时点双随机效应
描述性统计:sum 标准化:sum(x-均值)/标准差
产生新变量:gen pol=(pol-均值)/标准差
(1)普通回归命令:reg y x1 x2 一般p<0.05
(2)检验多重共线性:estat vif vif为方差膨胀因子,vif<10,否则要消除多重共线性相关系数矩阵corr y x1 x2
区分固定效应还是随机效应:
xtreg y x1 x2, fe
est store fe 这一步结束看结果最后一行F检验p<0.05,排除混合回归
xtreg y x1 x2, re
est store re
hausman fe re,constant sigmamore hausman检验
P>0.05接受原假设:随机效应p<0.05接受备择假设:固定效应
区分个体固定效应还是时点固定效应:
xtreg y x1 x2, fe 结果p<0.05,则个体固定效应ok
xtreg y x1 x2 i.year 结果p<0.05,则时点固定效应ok
xtreg y x1 x2 i.year, fe 双向固定效应
xtreg y x1 x2, fe r r为聚类稳健标准误
将多个面板回归结果汇总到一起,命令如下:
xtreg y x1 x2
est store model1
xtreg y x3 x4
est store model2
:
:
以此类推
esttab model1 model2...
安装新命令:ssc install 名字或findit 名字,根据要求安装异方差检验:斯皮尔曼等级相关系数、怀特检验
克服异方差:权重
自相关:误差项与滞后项的相关关系
克服自相关:广义OLS
滞后变量:易多重共线性
虚拟变量:加法,测截距变动;乘法,测斜率变动
固定效应异方差检验:xtreg y x1 x2
Xttest3
序列相关检验:固定效应模型——xtserial y x1 x2
随机效应模型——xtreg y x1 x2, re