stata笔记要点

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.一般检验

假设系数为0,t比较大则拒绝假设,认为系数不为0.

假设系数为0,P比较小则拒绝假设,认为系数不为0.

假设方程不显著,F比较大则拒绝假设,认为方程显著。

2.小样本运用OLS进行估计的前提条件为:

(1)线性假定。即解释变量与被解释变量之间为线性关系。这一前提可以通过将非线性转换为线性方程来解决。

(2)严格外生性。即随机扰动项独立于所有解释变量:与解释变量之间所有时候都是正交关系,随机扰动项期望为0。(工具变量法解决)

(3)不存在严格的多重共线性。一般在现实数据中不会出现,但是设置过多的虚拟变量时,可能会出现这种现象。Stata可以自动剔除。

(4)扰动项为球型扰动项,即随即扰动项同方差,无自相关性。

3.大样本估计时,一般要求数据在30个以上就可以称为大样本了。大样本的前提是

(1)线性假定

(2)渐进独立的平稳过程

(3)前定解释变量,即解释变量与同期的扰动项正交。

(4)E(XiXit)为非退化矩阵。

(5)gt为鞅差分序列,且其协方差矩阵为非退化矩阵。

与小样本相比,其不需要严格的外生性和正太随机扰动项的要求。

4.命令

稳健标准差回归:reg y x1x2x3,robust回归系数与OLS一样,但标准差存在差异。如果认为存在异方差,则使用稳健标准差。使用稳健标准差可以对大样本进行检验。

只要样本容量足够大,在模型出现异方差的情况下,使用稳健标准差时参数估计、假

设检验等均可正常进行,即可以很大程度上消除异方差带来的副作用

对单个系数进行检验:test lnq=1

线性检验:testnl_b[lnpl]=_b[lnq]^2

5.如果回归模型为非线性,不方便使用OLS,则可以采取最大似然估计法(MLE),或者非线

性最小二乘法(NLS)

6.违背经典假设,即存在异方差的情况。截面数据通常会出现异方差。

因此检验异方差可以:

(1)看残差图,但只是直观,可能并不准确。

rvfplot(residual-versus-fitted plot)与拟合值的散点图

rvpplot varname(residual-versus-predictor plot)与解释变量的散点图

扰动项的方差随观测值而变动,表示可能存在异方差。

(2)怀特检验:

estat imtest,white(post-estimation information matrix test)

P比较小,则拒绝同方差假设,表示存在异方差,不能用OLS。反之则证明为同方差。

(3)BP检验

estat hettest,iid(默认设置为使用拟合值y^)

estat hettest,rhs iid(使用方程右边的解释变量,而不是y^)

estat hettest[varlist],iid(使用某个指定的解释变量)

P小,则拒绝原假设。

如果存在异方差,则可以:

(1)使用OLS+稳健标准差robust

(2)广义最小二乘法(GLS)

(3)加权最小二乘法(WLS)

predict el,res(预测残差)

g e2=el^2

辅助回归:

g lne2=log(e2)

reg lne2lnq,noc

predict lne2f计算辅助回归的拟合值

g e2f=exp(lne2f)去掉对数即权重之倒数

reg lntc lnq lnpl lnpk lnpf[aw=1/e2f]

reg y x1x2x3[aw=1/var](aw表示analytical weight,var表示随即扰动项的方差。)

或者:

predict u,residuals

predict yf,xb

gen lnu2=ln(u^2)

gen yf2=yf^2

quietly reg lnu2yf yf2

predictnl u2f=exp(xb())

gen sd=sqrt(u2f)

vwls lntc lnq lnpl lnpf lnpk,sd(sd)

(4)可行广义最小二乘法(FGLS)

FGLS所做的过程和GLS一样,只是GLS假设扰动项的方差已知,若要用GLS,必须计

算得到扰动项方差,而FGLS则是在未知方差的情况下求方差并最终通过将异方差转换为同

方差后再运用OLS的结果。因此,GLS和FGLS在过程上是一致的。

6.自相关

时间序列中容易出现自相关,而截面数据也可能存在空间自相关。人为处理数据如移动平均等做法也可能导致自相关。

检验自相关可以:

(1)作图,但并不严格。

定义滞后算子L.(只有时间序列数据和面板数据才能定义时间变量。)

tsset yaear

一阶差分:D.x=xt-xt-1D2.X=xt-xt-2

LD.表示一阶差分的滞后值

画图:scatter el L.el

ac el(看自相关图)

pac el(看偏相关图)

(2)BG检验

estat bgodfrey(默认p=1)

estat bgodfrey,lags(p)

estat bgodfrey,nomiss0(使用不添加0的BG检验)

使用命令ac查看自相关图,或者设置较大的p值进行显著性检验,t期不显著了,则选择P=T-1

统计检验P值小,则拒绝假设。

(3)box-pierce Q检验/Ljung-Box Q

reg y x1x2x3

predict el,resid

wntestq el(使用stata提供的默认滞后期)

wntestq el,lags(p)(使用自己设定的滞后期)

(4)DW检验:现在已经不常用,因为其只能检验一阶自相关。

estat dwatson

自相关的处理方法:

(1)使用OLS+异方差自相关稳健的标准差(Heteroskedasticity and Autocorrelation

Consistent Standard Error,HAC)

newey y x1x2x3,lag(p)(HAC标准差,必须制定滞后阶数p)

滞后期数选择n^1/4

(2)使用OLS+聚类稳健的标准差(cluster robust standard error)面板数据中经常使用聚类稳健的标准差。

reg y x1x2x3,cluster(state)(聚类稳健标准差,假设“state”为聚类变量)

(3)使用可行广义最小二乘法(FGLS)

prais y x1x2x3(使用默认的PW估计法)

prais y x1x2x3,corc(使用CO估计法)

(4)修改模型设定,可能自相关是由于遗漏了自相关的解释变量。

7多重共线性

在回归后,使用命令VIF

estat vif经验表示,vif<10,则不存在多重共线性。

如果存在多重共线性,但是只关心整个方程预测被解释变量的能力,或者只关心变量的显著性,则不必理会多重共线性,因为多重共线性只是对单个解释变量的解释能力估计出现了偏差。存在多重共线性,则逐个剔除。

8.遗漏变量(解决扰动项严格外生性的问题)

遗漏变量与解释变量不相关时,扰动项与解释变量不相关,OLS估计依然一致,但扰动项方差过大,影响估计的精确度

如果遗漏变量与解释变量相关,扰动项与解释变量则会相关,导致OLS估计不再一致。出现“遗漏变量偏差”。

所以可以不研究某些解释变量而只对感兴趣的解释变量进行研究,但是重要的是遗漏解释变量不能与解释变量相关。解决遗漏解释变量的方法有:

相关文档
最新文档