关于实证论文计量软件的一些菜鸟心得(附stata简单操作)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Std. Err. 2824122 .0015022 .0610244 .0269521
[95% Conf. Interval] -1574884 .9489808 -.5844579 .0072282 9505442 .9548748 -.3450311 .1129737
其中,coef.所在的列就是行业特征参数
lnasset dr gov lnexp(这个是比较简单的统计,复杂的统计我就不介绍了) 因为我的数据首先是分年度进行分析的,也就是截面数据,所以首先我们需要对 截面数据进行异方差检验,我采用的是怀特检验。命令如下: fit da white reg da whitetst imtest(white 命令需要额外安装,安装命令如下:search white,net) 通过怀特检验,分析是否存在异方差。这个涉及计量经济学内容,我就不班门弄 斧了。大家自己看看吧。建议参考书:计量经济学(李子奈) 因为我的检验结果是存在异方差,所以我要对方程进行去除异方差的处理。我采 用的是 WSL 回归。 这个同样需要下载命令 wls0 (安装命令如下: search white,net) 。 因为这一部分我也是懵懵懂懂,就略去不介绍了,以免误导大家。 如果不存在异方差,就用简单的 ols 回归啦。回归命令如下:reg da tcst lnasset dr gov lnexp。 我的回归结果贴下图: (这是其中某一年的,因为截面数据普遍的 r 方偏低,大
最近大家都在忙着写毕业论文, 很多同学很不幸跟我一样选择走上了实证论 文这条不归路。作为一个从来没学过计量经济学的小菜鸟,这个真的很折磨人。 作为一个菜鸟,也有些菜鸟心得,下面给后来的新菜鸟们一些自己的小收获,仅 供参考啊。可能有些方面不是很完善,或者干脆就是错误的理解,还请各位不吝 赐教。 在开始介绍之前,先偷来一篇关于我们经常用的几款计量软件( sas , stata,spss,eviews)的对比: SAS 一般用法。SAS 由于其功能强大而且可以编程,很受高级用户的欢迎。也正 是基于此,它是最难掌握的软件之一。使用 SAS 时,你需要编写 SAS 程序来处理 数据,进行分析。如果在一个程序中出现一个错误,找到并改正这个错误将是困 难的。 数据管理。在数据管理方面,SAS 是非常强大的,能让你用任何可能的 方式来处理你的数据。它包含 SQL(结构化查询语言)过程,可以在 SAS 数据集 中使用 SQL 查询。但是要学习并掌握 SAS 软件的数据管理需要很长的时间,在 Stata 或 SPSS 中,完成许多复杂数据管理工作所使用的命令要简单的多。然而, SAS 可以同时处理多个数据文件,使这项工作变得容易。它可以处理的变量能够 达到 32,768 个,以及你的硬盘空间所允许的最大数量的记录条数。 统计分析。 SAS 能够进行大多数统计分析(回归分析,logistic 回归,生存分析,方差分析, 因子分析,多变量分析) 。SAS 的最优之处可能在于它的方差分析,混合模型分 析和多变量分析,而它的劣势主要是有序和多元 logistic 回归(因为这些命令很 难) ,以及稳健方法(它难以完成稳健回归和其他稳健方法) 。尽管支持调查数据 的分析,但与 Stata 比较仍然是相当有限的。 绘图功能。在所有的统计软件中, SAS 有最强大的绘图工具,由 SAS/Graph 模块提供。然而,SAS/Graph 模块的学 习也是非常专业而复杂,图形的制作主要使用程序语言。SAS 8 虽然可以通过点 击鼠标来交互式的绘图, 但不象 SPSS 那样简单。 总结。 SAS 适合高级用户使用。 它的学习过程是艰苦的, 最初的阶段会使人灰心丧气。然而它还是以强大的数据 管理和同时处理大批数据文件的功能,得到高级用户的青睐。 Stata 一般用法。Stata 以其简单易懂和功能强大受到初学者和高级用户的普遍欢
整理出如下如所示的样本: 接着打开 stata: 键入如下代码,进行回归: 1. 生成变量:
2. 输入数据:data-dataeditor- dataeditor(editor)
3. 键入回归命令 regress y x1 x2 x3,得到如下结果:
Source Model Residual Total y x1 x2 x3 _cons . SS 1996659.34 479.991078 1997139.33 Coef. 3965279 .9519278 -.4647445 .0601009 df 3 1345 1348 MS 665553.114 .35687069 1481.55737 t 1.40 633.67 -7.62 2.23 P>|t| 0.161 0.000 0.000 0.026 Number of obs F( 3, 1345) Prob > F R-squared Adj R-squared Root MSE = = = = = = 1349 . 0.0000 0.9998 0.9998 .59739
迎。使用时可以每次只输入一个命令(适合初学者) ,也可以通过一个 Stata 程序 一次输入多个命令(适合高级用户) 。这样的话,即使发生错误,也较容易找出 并加以修改。 数据管理。尽管 Stata 的数据管理能力没有 SAS 那么强大,它仍然 有很多功能较强且简单的数据管理命令,能够让复杂的操作变得容易。Stata 主 要用于每次对一个数据文件进行操作,难以同时处理多个文件。随着 Stata/SE 的 推出,现在一个 Stata 数据文件中的变量可以达到 32,768,但是当一个数据文件 超越计算机内存所允许的范围时,你可能无法分析它。 统计分析。Stata 也能够 进行大多数统计分析 (回归分析, logistic 回归, 生存分析, 方差分析, 因子分析, 以及一些多变量分析) 。Stata 最大的优势可能在于回归分析(它包含易于使用的 回归分析特征工具) ,logistic 回归(附加有解释 logistic 回归结果的程序,易用于 有序和多元 logistic 回归) 。Stata 也有一系列很好的稳健方法,包括稳健回归, 稳健标准误的回归,以及其他包含稳健标准误估计的命令。此外,在调查数据分 析领域,Stata 有着明显优势,能提供回归分析,logistic 回归,泊松回归,概率 回归等的调查数据分析。 它的不足之处在于方差分析和传统的多变量方法(多变 量方差分析,判别分析等) 。 绘图功能。正如 SPSS,Stata 能提供一些命令或鼠 标点击的交互界面来绘图。 与 SPSS 不同的是它没有图形编辑器。 在三种软件中, 它的绘图命令的句法是最简单的,功能却最强大。图形质量也很好,可以达到出 版的要求。另外,这些图形很好的发挥了补充统计分析的功能,例如,许多命令 可以简化回归判别过程中散点图的制作。 总结。Stata 较好地实现了使用简便和 功能强大两者的结合。 尽管其简单易学,它在数据管理和许多前沿统计方法中的 功能还是非常强大的。 用户可以很容易的下载到别人已有的程序,也可以自己去 编写,并使之与 Stata 紧密结合。 SPSS 一般用法。SPSS 非常容易使用,故最为初学者所接受。它有一个可以点击的 交互界面, 能够使用下拉菜单来选择所需要执行的命令。它也有一个通过拷贝和 粘贴的方法来学习其“句法”语言,但是这些句法通常非常复杂而且不是很直观。 数据管理。SPSS 有一个类似于 Excel 的界面友好的数据编辑器,可以用来输入和 定义数据(缺失值,数值标签等等) 。它不是功能很强的数据管理工具(尽管 SPS 11 版增加了一些增大数据文件的命令,其效果有限) 。SPSS 也主要用于对一个文
TAi ,
t
Asseti ,t
Βιβλιοθήκη Baidu0
1
Sale , i t FA , i 1 1 2 i t Asseti t , 1 Asseti t , Asset 1 i t
t , , 1
被解释变量:y,本例中是由 TA(i,t) / Asset(I,t-1) 所得,解释变量: X1,x2,x3.分别由 1/ Asset(I,t-1) ,FA(I,t)/ Asset(I,t-1),Δsale(I,t)/ Asset(I,t-1) 所得。
梅老师的课件啊, 讲解的很到位, 使用 eviews 处理面板数据的关键是建立 pool, 这个高老师的讲义里有,可以自己学习学习。为什么最后放弃 eviews,这个可能 是跟这个软件的限制有关。 目前我自己总结的是如果我们所需要做的回归方程的 解释变量数大于数据的年龄区间,比如我有 5 个变量,时间区间为 3 年,可能就 做不了了。所以,没办法,我只能转用 stata 了。学习了一点皮毛,想要深入学 习 stata 的同学可以看看连玉君老师的讲义,讲的很到位。 友情提醒,在进行处理之前要保证你所有的数据都是数值型的。 一 : 先 计 算 如 下 数 据 : 首 先 计 算 行 业 特 征 参 数 :
二:下面计算非操纵性应计利润:公式如下:
NDAi ,t 0
(Salei ,t ARi ,t ) FAi ,t 1 1 2 i ,t Asseti ,t 1 Asseti ,t 1 Asseti ,t 1
这个可以用 excel 计算, 方法我就不介绍了。 很简单的求和公式, 其中的 0 ,
1
, 2 为上面公式中计算得到的行业特征参数的估计值。不会的同学好好学习
下 excel 吧。
DAi ,t
三:计算可操纵性应计利润,公式如下:
TAi ,t Asseti ,t 1
NDAi ,t
,同样可以再
excel 中完成,也略过。 四: 下面我们将准备好的数据用来分析相关性。笔者是分析盈余管理和管理层薪 酬的相关性水平。这一部分老实说,我也不是很确定。只能谈谈我是怎么做的。 数据的输入方法和第一步介绍的方法一样,先定义变量,然后输入。这边同样跳 过。说明下:da 是我的被解释变量,后面的几个(lntc stock tcst gov lnexp)是解释变量。 如果大家需要进行描述性统计,键入如下命令: sum da lntc stock tcst lnasset dr
件进行操作,难以胜任同时处理多个文件。它的数据文件有 4096 个变量,记录 的数量则是由你的磁盘空间来限定。 统计分析。SPSS 也能够进行大多数统计分 析(回归分析,logistic 回归,生存分析,方差分析,因子分析,多变量分析) 。 它的优势在于方差分析(SPSS 能完成多种特殊效应的检验)和多变量分析(多 元方差分析,因子分析,判别分析等) ,SPSS11.5 版还新增了混合模型分析的功 能。其缺点是没有稳健方法(无法完成稳健回归或得到稳健标准误) ,缺乏调查 数据分析(SPSS12 版增加了完成部分过程的模块) 。 绘图功能。SPSS 绘图的交 互界面非常简单,一旦你绘出图形,你可以根据需要通过点击来修改。这种图形 质量极佳,还能粘贴到其他文件中(Word 文档或 Powerpoint 等) 。SPSS 也有用 于绘图的编程语句,但是无法产生交互界面作图的一些效果。这种语句比 Stata 语句难,但比 SAS 语句简单(功能稍逊) 。 总结。SPSS 致力于简便易行(其口 号是“真正统计,确实简单”) ,并且取得了成功。但是如果你是高级用户,随着 时间推移你会对它丧失兴趣。SPSS 是制图方面的强手,由于缺少稳健和调查的 方法,处理前沿的统计过程是其弱项。 总体评价 每个软件都有其独到之处, 也难免有其软肋所在。 总的来说, SAS, Stata 和 SPSS 是能够用于多种统计分析的一组工具。通过 Stat/Transfer 可以在数秒或 数分钟内实现不同数据文件的转换。因此,可以根据你所处理问题的性质来选择 不同的软件。举例来说,如果你想通过混合模型来进行分析,你可以选择 SAS; 进行 logistic 回归则选择 Stata;若是要进行方差分析,最佳的选择当然是 SPSS。 假如你经常从事统计分析, 强烈建议您把上述软件收集到你的工具包以便于数据 处理。 Eviews 做基本(naive)的时序实证分析可以用。很不错的软件。不需要使用者有 多少理论知识, 会用就行。 当然, 在我看来任何 serious 的研究是不能只用 eviews 来完成的。 关于如何选择计量软件,下面是笔者的经验之谈。我也只是简单的接触过 spss,eviews 和 stata。因为一开始准备做面板数据,所以很明显 spss 是不可以 完成这一任务的,所以想用 spss 来做面板数据的同学,你们放弃吧。本来是准 备采用 eviews 的,因为它是这几款中最简单的,如果想学的同学可以看看高铁