计量经济学stata上机教程
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对界面偏好进行设定 有时用户对于界面设定并不满意,可以通过菜单“Edit-->Preference-->General
Preference”进行选择,包括数据编辑器、do文件编辑器、图形编辑器等的风格都可以设定。 设定完可以保存“Edit-->Preference-->Save...-->New... 任意输入一个名称,如 myprefs”, 也可以通过在命令窗口中输入: window manage prefs save myprefs 实现。更多的信息, 可以在命令窗口键入 help window manage 进行了解。 Command 窗口 Stata 有三种命令执行方式 (1) 下拉菜单实现。这种操作方式需要不断地下拉菜单,执行起来相对较慢,而且菜单 中仅包含一些经常性的命令,不能涵盖所有命令,特别是一些外部命令。 (2) 通过 Command 窗口实现。 (3) Do 文档实现。 命令窗口方式较为直接迅速, 但要求用户必须熟悉各种命令语言, 而且每次只能执行一 个命令。使用时,用户只需要在窗口中输入想要执行的命令即可。例如输入: sysuse auto 回车键之后,Stata 系统自带的数据 auto.dta 将被调出。 Review 窗口 历史命令窗口显示以前执行过的命令。在历史命令窗口中双击命令项可重复运行该命 令。如果我们需要显示过去执行的多个命令,则可以在命令窗口中输入: #review 4 则 Stata 通过输出窗口显示当前命令之前执行过的 4 条命令。 每次键入命令较为烦琐, 如果用户的新命令与历史命令相同或相似, 只需将历史命令稍 作修改即可,此时可以点击该历史命令,该命令会显示在命令窗口中,我们进行修改后按回 车键就可以执行新命令。 找到历史命令的另一方法是用鼠标点击命令窗口后, 用向上翻页键寻找前面执行过的命 令。
2
Log 按钮:用来开启一个 log 文件。Log 文件可以保存在屏幕输出窗口中的结果, 其具体操作我们将在下文介绍。 图形窗口前置: 点击该按钮的前提条件是我们已经绘制了一个图形, 或者通过命令 调入了一个图形文件,否则该按钮将显示为灰色(非激活状态) 。 数据编辑器:可以对数据进行录入、编码、修改等工作。 数据浏览器:在该窗口中只能进行数据查看,不能对数据进行编辑和修改。 程序终止:在执行程序的过程中,用户可能会忽然想到程序需要修改某些内容,或 者由于编写上存在错误导致出现死循环, 迟迟不能呢给出计算结果, 这是需要点击 该按钮。
1
显示目前存储空间 查看目前实际设定的存储空间 设定存储空间的大小 设定最大矩阵阶数
set maxvar 2500 help limits
设定最大变量数(最小设定为2048) 显示Stata的各种极限
2. Stata 的界面管理
首次打开 Stata, 将会出现一个询问是否进行更新的对话框。 用户可根据需要进行选择。 一般而言, 更新与否不会影响基本功能的实现。 如果需要进行官方最新命令或内容的更 新,可在 command 窗口输入 update all ;更新完成后需要输入 update swap ,才能确 保以新文件覆盖旧文件。在 Stata 12 版中,则不需要输入 update swap 。
2014 计量经济学上机教程 1
Stata 操作基础
主要内容: 1. Stata 的特点与功能 2. Stata 的界面管理 3. Stata 的命令语法 4. 数据处理 5. 统计描述、制图与输出结果 6. log 文档与 do 文档 7. 常用函数 8. Stata 的帮助系统与学习资源 9. 课后练习
Hale Waihona Puke 主菜单介绍主菜单一般包括上述 8 个下拉式菜单。有时用户需要使用不同菜单下的多个命令,点 击菜单的操作方式显得麻烦且不利于重复运算, 因此本课程将不介绍这一操作方式。 所有的 数据处理和估计过程都采用命令窗口或者 do 文件执行方式。 工具栏介绍
工具栏是一些常用的快捷按钮,我们仅做一些必要的说明。 Save 按钮:用于保存当前正在使用的,存在于内存中的 Stata 数据,这些数据以 变量的形式存在,该菜单命令将这些变量保存在一个 Stata 电子表格中。一般情况 下不建议使用这一按钮, 因为你的数据可能来自于一个已经存在的数据文件, 点击 save 按钮以后, Stata 按照原来调用的地址和文件名进行保存, 会覆盖原来的文件。 在打开和保存之间, 我们的操作可能已经修改过其中的数据, 而这一过程是不可逆 的,保存以后就找不到原始文件了。在实证研究中,往往需要我们保存最原始的数 据和给出处理的过程。我们建议在命令窗口中输入 save 路径名\文件名
1. Stata 的特点与功能
将统计功能与计量分析完整地结合起来。 不仅可以实现诸多统计分析方法, 比如描述统 计、假设检验、方差分析、主成分分析等,而且可以实现多种计量经济模型的估计和检 验,包括经典单方程回归模型、 方程组模型、微观数据模型 (离散选择模型、计数模型、 截断模型、归并模型等) 、时间序列数据模型(ARMA、VAR、GARCH 等)以及面板 数据分析。 强大的数据处理功能。 精致的作图功能。 丰富的网络资源。 Stata 12 有各种版本, 其中尤以 SE (特殊版) 最为常用。 用户可以在命令栏中输入 about 命令查看所安装的版本信息。 不同的版本对于样本容量、变量个数、矩阵阶数等有着不同的限制,用户可以通过以下 命令了解和改变这些设定: memory query memory set memory 10m set matsize 250
上述运算符不区分大小写,可以重复,也可以进行各种组合。比如,L3.x 也 可以表述为 LLL.x、LL2.x、L2L.x。 #可以是单个数,也可以是数列(numlist),表示对同一变量的多次运算。比 如 L(1/3).x 表示 L.x、L2.x 和 L3.x。 x 可以是单个变量,也可以是多个变量,比如 L2.(GDP CPI)。 分类操作 by varlist 表示按照 by 后面的变量进行分别操作。例如对于数据集 auto.dta,我们想知道国产车 和进口车的价格和重量的统计描述。 sysuse auto, clear // 从系统导入相应的数据集
by foreign: sum price weight 赋值及运算=exp
5
主要用于给新变量赋值或者替换原变量的值。例如,在原变量 price 的基础上生成一个 新的变量 price2,生成规则是原来的价格上涨 15 元。 generate price2=price+15 list price price2 又如,直接将新生成的变量 price2 值减去 15 元,使得与 price 相同。 replace price2=price2-15 list price price2 条件表达式 if exp 例 1:查看国产车的品牌和价格两个变量的数据 list make price if foreign==0 例 2:查看价格超过 1 万元的进口车 list make price if foreign==1 & price>10000 例 3:查看价格超过 1 万元的车或者是进口车 list make price if foreign==1 | price>10000 例 4:分类查看国产和进口中超过 1 万元的车 by foreign: list make price if price>10000 其他选项以后具体介绍
3
Variables 窗口 变量列表窗口显示当前调入内存数据的所有变量名称、标签、变量类型和存储格式。如
果没有定义变量名,则 Stata 自动显示为 v1,v2,……;如果没有定义标签,则不显示标 签。在编辑 Stata 命令时,我们往往需要调用某些变量,此时可以用鼠标双击相应的变量名 称,则该名称会自动显现在窗口命令中。这种键入变量方式,可以避免手动输入时的拼写错 误。 Results 窗口 屏幕输出窗口显示命令的执行结果。在 Stata 11 和 12 版本中,结果输出窗口经常对于 中文显示为乱码。为使其支持中文显示,需要修改界面设定:点击 Edit-->Preference-->General Preference Results Color--> 选择 "Classic" Do 文件编辑窗口(点击链接至后文具体介绍) Do 文件命令执行方式是 Stata 的第三种方式,这也是大多数学术研究人员采用的命令 执行方式。该方式具有以下优点:第一,通过批量运行程序避免了菜单命令和命令窗口只能 一次运行一个命令的局限,有助于处理大规模数据以及复杂的估计检验;第二,Do 文件可 以直接保存执行过的命令,方便检查和纠错,而且一旦需要类似的运算,可以直接从保存的 命令文件中粘贴过来进行修改,避免重复劳动。 自 Stata11 发布后,其 do-files 编辑器具有了语法高亮显示、结构代码折叠、书签设定 等功能,而且,对于书写大型 do-files 的用户而言,命令的行数也不再受到任何限制。对于 中文用户而言,只需稍作调整,即可获得很好的显示效果。 打开 Do 文件编辑窗口有两种方式: 第一种是在工具栏中点击 (New Do-file Editor) ;
第二种是直接在命令窗口中输入并运行命令 doedit 。
3. Stata 的命令语法
Stata 所有的命令语句遵循共同的语法格式: [by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [using filename] [,options] 其中,方括号[]表示可选项,command 为命令函数,varlist 为变量,[if exp] [in range] 用于设定变量或观测值的范围,[weight]设定观测值的权重,[using filename]表示使用的数 据文件,options 表示命令的选项,依具体命令而不同。[by varlist:]表示对 varlist(分类变 量)中的每一类分别执行命令 command。 例如,计算基本统计指标的命令 summarize 的格式为
4
[by varlist:] summarize [varlist] [if] [in] [weight] [, options] by area: summarize income consume if income<8000, detail varlist 在 Stata 的语法中,varlist 表示一个或多个变量,varname 表示单个变量,newvarlist 表示新变量。 已存在的变量 对于数据中存在的变量, 允许的表示形式包括*、 ?和-。 其中, *表示任意字符, ? 表示一个字符,-表示两个变量之间的所有变量。 例如,数据文件中共有 10 个变量 var1,var2,……,var10,则 var*表示前 面含有 var 的所有变量; var?表示前面为 var 且后面只有一个字符的变量, 即 var1 , var2,……,var9;var1-var6 表示 var1,var2,……,var6。 新变量 生成新变量时, 变量名称不能简化。 如果变量具有相同的前缀并且都以数字结 尾,可以用-表示。比如输入新变量 v1、v2、v3、v4,可以键入 input v1-v4 end 时间序列变量 时间序列变量可以带有运算符,包括 运算符 L#.x F#.x D#.x S#.x 含义 x 的#阶滞后 x 的#阶超前 x 的#阶差分 x 的#阶季节差分 例子 1 L3.x=xt-3 F3.x=xt+3 D2.x=(xt-xt-1)-(xt-1-xt-2) S12.x= xt-xt-12 例子 2 一阶滞后可直接写为 L.x 一阶超前可直接写为 F.x 一阶差分可直接写为 D.x 一阶季节差分可直接写为 S.x