stata上机实验第五讲
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
面板数据的格式
company 1 1 1 1 2 year 1951 1952 1953 1954 1951 invest 755.9 891.2 1304.4 1486.7 588.2 mvalue 4833 4924.9 6241.7 5593.6 2289.5
2
2 2 3 3 3 3
1952
面板数据
一些面板数据教材
• 面板数据分析 (美)萧政 著 • 横截面与面板数据的经济计量分析 伍德里 奇 著,王忠玉 译 • Baltagi. Econometric Analysis of Panel Data
• 最新动态可关注期刊: Journal of Econometrics
面板数据一些前沿问题
invest2003
invest2004
kstock2002
kstock2003
kstock2004
1 2 3 4 5 6
18.9 17.4 19 20 18.1 19.7
19.1 18.4 19.6 20.4 18.3 20
19.6 18.8 20.1 20.3 18.4 19.9
19.6 18.1 20.2 20.4 18.5 17.2
use grunfeld,clear xtset company year xtdes xtline invest(要等一下) 混合回归:reg invest mvalue kstock(扩大样本量) 固定效应:xtreg invest mvalue kstock ,fe(看F值 的P值) 随机效应:xtreg invest mvalue kstock ,re
• xtpcse OLS or Prais-Winsten models with panelcorrected standard errors • xtrchh Hildreth-Houck random coefficients models • xtivreg Instrumental variables and two-stage least squares for panel-data models • xtabond Arellano-Bond linear, dynamic panel data estimator • xtabond2 Arellano-Bond system dynamic panel data estimator(需要从网上下载) • xttobit Random-effects tobit models • xtintreg Random-effects interval data regression models
• • • •
3、面板数据格式不符合要求的处理。 例如如下表格格式该如何处理? 处理方法: 扁平数据变长条数据的命令:reshape use invest2,clear edit reshape long invest kstock, i(company) j(year)
company
invest2002
16.8 17.4 17 17.5 16.4 16.3
16.7 17 17.1 17.3 16.1 16.3
其他回归方法
• 1、聚类稳健的标准差 • 通常可以假设不同个体之间的扰动项相互独立, 但同一个体在不同时期的扰动项之间往往存在自 相关。故须采用聚类稳健的标准差。 use grunfeld,clear xtset company year reg invest mvalue kstock,vce(cluster company) 同理有: xtreg invest mvalue kstock,fe vce(cluster company) xtreg invest mvalue kstock,re vce(cluster company)
tab company,gen(dum) drop dum1 reg invest mvalue kstock dum* 与上述方法比较一下: xi:reg invest mvalue kstock i.company 结果完全一样。
组间估计法
• 对于随机效应模型,还可以采用“组间估 计量”。对于那些每个个体的时间序列数 据较不准确或“噪音”较大的数据,可对 每个个体取时间平均值,然后用平均值来 回归。 xtreg invest mvalue kstock ,be 由于损失了较多信息量,组间估计法并不 常用。
• 2、对于固定效应模型,可采用虚拟变量法。 • 基本思想:固定效应模型实质上就是在传 统的线性回归模型中加入 N-1 个虚拟变量, 使得每个截面都有自己的截距项。由于固 定效应模型假设存在着“个体效应”,每 个个体都有其单独的截距项。这就相当于 在原方程中引入n−1个虚拟变量(如果省略 常数项,则引入n个虚拟变量)来代表不同 的个体,获得每个个体的截据项。
结果解读
• 固定效应 • 随机效应
• 特别注意: • 1、三个R2哪个重要? 组内、组间、总体拟合优 度。 • 2、固定效应为什么有两个F检验? • 3、corr(u_i, Xb) 的含义。 • 4、 sigma_u、sigma_e、rho的含义。
• sigma_u是固定效应模型估计中的个体效应的方差估 计值 • sigma_e随机干扰项的方差估计值 • rho:rho= sigma_u ^2/(sigma_u^2+ sigma_e^2) , 是两者之间的关系(u-i))以及针对u_i显著性的联 合检验统计量(F值和p值)。 • corr(u_i, Xb) 个体效应与解释变量的相关系数,相关 系数为0或者接近于0,可以使用随机效应模型;相 关系数不为0,需要使用固定效应模型。u-i不表示残 差,表示个体效应。
其中, i=1,2,… N ; t=1, 2,…T uit称为复合扰动项。
固定效应模型
• 对于特定的个体i而言,ai 表示那些不随时 间改变的影响因素,如个人的消费习惯、 国家的社会制度、地区的特征、性别等, 一般称其为“个体效应” (individual effects)。如果把“个体效应”当作不随时 间改变的固定性因素, 相应的模型称为 “固定效应”模型。
固定效应模型
• 固定效应模型的公式变为: • Yit=ai+Xitb+εit • 回归结果是每个个体都有一个特定的截距 项。
随机效应模型
• 随机效应模型将个体效应ai视为随机因素, 即把个体效应设定为干扰项的一部分。公 式将变为: • Yit=Xitb+(ai+εit) • 回归的结果是随机效应模型的所有的个体 具有相同的截距项,个体的差异主要反应 在随机干扰项的设定上。
面板向量自回归模型(Panel VAR) 面板单位根检验(Panel Unit Root test) 面板协整分析(Panel Cointegeration) 门槛面板数据模型(Panel Threshold) 面板联立方程组 面板空间计量
静态面板数据
• 静态面板数据模型,是指解释变量中不包 含被解释变量的滞后项(通常为一阶滞后项) 的情形。但严格地讲,随机干扰项服从某 种序列相关的模型,如AR(1), AR(2), MA(1) 等,也不是静态模型。静态面板数据主要 有两种模型------固定效应模型和随机效应 模型。
1953 1954 1951 1952 1953 1954
645.5
641 459.3 135.2 157.3 179.5 189.6
2159.4
2031.3 2115.5 1819.4 2079.7 2371.6 2759.9
面板数据模型
• 考虑如下模型: • Yit=Xitb+Uit • uit=ai+εit
• xtabond Arellano-Bond linear, dynamic panel data estimator • xtabond2 Arellano-Bond system dynamic panel data estimator(需要从网上下载) • xttobit Random-effects tobit models • xtintreg Random-effects interval data regression models • xtreg Fixed-, between- and random-effects, and population-averaged linear models • xtregar Fixed- and random-effects linear models with an AR(1) disturbance • xtgls Panel-data models using GLS
• • • •
Hausman检验步奏 Step1:估计固定效应模型,存储估Байду номын сангаас结果; Step2:估计随机效应模型,存储估计结果; Step3:进行Hausman检验;
xtreg invest mvalue kstock ,fe est store fixed xtreg invest mvalue kstock ,re est store random hausman fixed random 本题接受原假设,即应该用随机效应。
模型选择
• 固定效应还是混合OLS? 可以直接观测F值 • 随机效应还是混合OLS? 先用随机效应回归,然后运行xttest0 • 固定效应还是随机效应? Hausman检验
• Hausman检验 • 基本思想:如果 Corr(a_i,x_it) = 0, Fe 和 Re 都是一致的,但Re更有效。 如果 Corr(a_i,x_it)!= 0, Fe 仍然一致,但 Re是有偏的。 因此原假设是Corr(a_i,x_it) = 0,即应该采 用随机效应。
• xtreg Fixed-, between- and random-effects, and population-averaged linear models • xtregar Fixed- and random-effects linear models with an AR(1) disturbance • xtgls Panel-data models using GLS • xtpcse OLS or Prais-Winsten models with panelcorrected standard errors • xtrchh Hildreth-Houck random coefficients models • xtivreg Instrumental variables and two-stage least squares for panel-data models
• 怎样选择固定效应和随机效应? • 随机效严格要求个体效应与解释变量不相 关,即 • Cov(ai,XitB)=0 • 而固定效应模型并不需要这个假设条件。 • 这是两种模型选择的关键。
面板数据基本命令
• 1、指定个体截面变量和时间变量:xtset • 2、对数据截面个数、时间跨度的整体描述: xtdes。分组内、组间和样本整体计算各个变量的 基本统计量xtsum。采用列表的方式显示某个变 量的分布xttab,较少使用。 • 3、list、sum、des、tabstat、histogram、 kdensity等命令都可以用。 • 4、对每个个体分别显示该变量的时间序列图: xtline。 • 5、静态面板数据基本回归命令:xtreg,系统默 认GLS估计。
几个常见问题
• 1、既然固定效应每个个体都有单独的截距 项,如何获得每个个体的截距项? xi:reg invest mvalue kstock i.company 即LSDV方法或者添加虚拟变量法。
• 2、非平衡面板如何处理? use nlswork,clear xtset idcode year xtdes 这是一份典型的大n小t型非平衡面板数据。 方法一:下载命令xtbalance提取成一个平衡面板 数据,但不推荐使用,因为会损失大量样本。 方法二:利用算法填补缺失值,需要经济理论和 算法的支撑。