让你快速上手的stata讲义

合集下载

第一课 Stata入门

第一课 Stata入门

Stata软件基本操作和数据分析入门

第一讲Stata入门

第一节概况

Stata最初由美国计算机资源中心(Computer Resource Center)研制,现在为Stata公司的产品,其最新版本为7.0版。它操作灵活、简单、易学易用,是一个非常有特色的统计分析软件,现在已越来越受到人们的重视和欢迎,并且和SAS、SPSS一起,被称为新的三大权威统计软件。

Stata最为突出的特点是短小精悍、功能强大,其最新的7.0版整个系统只有10 MB左右,但已经包含了全部的统计分析、数据管理和绘图等功能,尤其是它的统计分析功能极为全面,即使与1G以上大小的SAS系统相比也毫不逊色。另外,由于Stata在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此运算速度极快。

由于Stata的用户群始终定位于专业统计分析人员,因此它的操作方式也别具一格,在Windows席卷天下的时代,它一直坚持使用命令行/程序操作方式,拒不推出菜单操作系统。但是,Stata的命令语句极为简洁明快,而且在统计分析命令的设置上又非常有条理,它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可以使用相同功能的选项,这使得用户学习时极易上手。更为令人叹服的是,Stata语句在简洁的同时又拥有着极高的灵活性,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。

除了操作方式简洁外,Stata的用户接口在其它方面也做得非常简洁,数据格式简单,分析结果输出简洁明快,易于阅读,这一切都使得Stata成为非常适合于统计教学的统计软件。

《stata基础》课件

《stata基础》课件
Stata基础课件PPT
本课程详细介绍Stata的基本操作、数据处理和分析、绘图功能和高级应用等 方面。从此你可以掌握Stata的全面操作,数据处理和分析,提高Stata的应用 水平。
Stata介绍
什么是Stata?
Stata是一款强大的数据分析 软件,被广泛应用于多个领 域,如社会科学、健康科学、 教育、经济学、金融、政治 科学等。
界面介绍
Stata界面的组成,如何打开Stata,如何 输入命令。
数据管理
数据类型的介绍,如何生成、保存和读 取数据集,如何编辑变量和观测值。
Stata数据处理
数据导入导出
如何导入和导出常见的数据文件 类型,如何处理缺失值。
数据的清洗、加工和合并
如何处理异常值、离群点、缺失 值,如何计算新的变量和合并数 据集。
Stata的扩展程序
Stata的并行计算
如何下载和安装Stata的扩展程序, 如何使用额外的命令。
如何利用Stata高效地运行大数据 集,如何使用Stata的并行计算。
总结和展望
1 Stata的优缺点
Stata的优点有:强大的数据管理和较高的统计分析能力;缺点有:虽然易学但不便宜, 还需要花时间去了解命令。
5
生存分析
如何进行生存分析,计算生存曲线。
Stata绘图功能
常用绘图命令
如何用Stata绘制各种类型的图 表。

STATA基本操作入门PPT课件

STATA基本操作入门PPT课件
第15页/共23页
9.画图:直方图
• 如果要做出q的直方图,宽度为1000 • 方法:histogram q,width(1000) frequence
第16页/共23页
9.2画图:经验分布图
• 如果要画变量 q的经验分布图(折线图) • 方法:kdensity q
第17页/共23页
9.3 画图:散点图
第10页/共23页
6.4 ຫໍສະໝຸດ Baidu看变量的统计特征
• 如果summarize 后面不输入具体变量,则展示所有变量的统计指标 • 方法:输入summarize 或 su
第11页/共23页
7.经验累积分布函数
• 如果要查看q的经验累积分布函数 • 方法:tabulate q 或则 ta q
第12页/共23页
• 如果要画散点图(两个变量) • 方法:scatter tc q • 问题:无法知道每个 点对应于哪个观测值
第18页/共23页
9.3.1 散点图改进
• 定义新变量值n来表示第n个观测值: • 方法:gen n=_n (_n表示第n个观测值) • 使散点图显示对应的观测值: • 方法:scatter tc q,mlabel(n) mlabpos(6)
第21页/共23页
9.6 图像合并展示
• 将线性拟合和二次拟合这两个图像在一起展示 • 方法:输入graph combine scatter1.gph scatter2.gph

Stata教程(免费)

Stata教程(免费)

第一章 Stata 概貌

§1.1 Stata的功能、特点和背景

Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件,由美国计算机资源中心(Computer Resource Center)研制。从1985至1998的十四年时间里,已连续推出1.1,1.2,1.3,1.4,1.5,……及2.0,2.1,3.0,3.1,4.0,5.0,6.0等多个版本,通过不断更新和扩充,内容日趋完善。它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点,又在许多方面别具一格。Stata融汇了上述程序的优点,克服了各自的缺点,使其功能更加强大,操作更加灵活、简单,易学易用,越来越受到人们的重视和欢迎。

Stata的突出特点是只占用很少的磁盘空间,输出结果简洁,所选方法先进,内容较齐全,制作的图形十分精美,可直接被图形处理软件或字处理软件如WORD等直接调用。

一、 Stata的数据管理能力

1.Stata的数据管理空间受计算机的操作系统和计算机扩展内存的影响。对640k内存的微机,3.1

版本的Stata可以管理2400个记录×99个变量,并随计算机扩展内存的增加而增加;对4.0的WINDOWS版本,Stata可以管理4800个记录×99个变量;对WINDOWS 95下的5.0版本,可根据计算机的配置情况设置变量数和记录数,如32M扩展内存的计算机,可处理2千万个数据。变量数和记录数可以互相交易(trade),即减少记录数可以增加变量数,减少变量数可以增加记录数。

2.可以将分组变量转换成指示变量(哑变量),将字符串变量映射成数字代码。

STATA实用教程

STATA实用教程

STATA实用教程

STATA是一种统计分析软件,广泛应用于数据分析、统计建模、数据

可视化等领域。它具有强大的数据处理能力和丰富的统计功能,能够快速、准确地处理大规模的数据集。下面是一些STATA实用教程,帮助初学者快

速上手该软件。

1.STATA基本操作

STATA的基本操作包括数据导入和导出、数据集处理、变量管理等。

首先要学会使用STATA命令行界面和菜单栏来进行操作,了解STATA常用

的命令和语法,掌握STATA常用的数据结构,如数据集、变量类型等。同时,还需要学会使用STATA的帮助文档和网络资源,解决自己在使用过程

中遇到的问题。

2.数据的描述性统计

STATA可以进行各种描述性统计,例如计算均值、中位数、标准差、

四分位数等,了解数据的分布情况。可以利用summarize、describe等命

令来进行描述性统计,还可以使用tabulate、histogram等命令进行变量

的频数统计和画出直方图。

3.数据清洗和转换

在实际应用中,数据往往需要进行清洗和转换。STATA提供了一系列

的命令,用于数据的清洗和转换。比如,drop、keep命令可以删除不需

要的变量或观察值;rename、recode命令可以对变量进行重命名和重新

编码;reshape、merge命令可以进行数据重塑和合并等操作。

4.统计分析

STATA提供了许多常用的统计方法和模型,可以进行统计分析。例如,t检验、方差分析、线性回归、Logistic回归、生存分析、聚类分析等。

用户可以使用STATA内置的命令来进行统计分析,也可以使用STATA扩展

第一讲 stata基础----山大stata实验课讲义

第一讲 stata基础----山大stata实验课讲义

几条最简单的命令
use 打开数据文件,一般加clear选型清空 内存中现有数据。 sysuse 打开系统数据文件。 describe 描述数据 edit 利用数据编辑器进行数据编辑。 browse类似于edit,但只能显示不能修改数 据。 list 列表的方式显示数据。 clear 清除内存中的数据和变量。
添加标签
打开wage1数据文件。 1。为整个数据添加标签:例如,将数据命名 为“工资表”。 2。为变量增加标签,例如, wage:年工资总额 educ:受教育年限。 exper:工龄。 3。为变量值增加标签 例如:为变量marrid添加数值标签marry: 1=married; 0=Unmarried
Stata 基础
Stata 统计软件包是目前世界上最著名的统 计软件之一,国外将Stata与SAS、SPSS 一 起被并称为三大权威软件。它同时具有数据 管理软件、统计分析软件、绘图软件、矩阵 计算软件和程序语言的特点,几乎可以完成 全部复杂的统计分析工作。被广泛地应用于 统计学、经济学、生物学、社会学、人口学 等领域。
不同版本对样本容量、变量个数、矩阵阶数、 宏的字符长度等有着不同的限制。 以stata 12的SE版为例,其最大变量个数为 32767,最大字符长度为244字节,最大矩 阵阶数为11000(即1100011000)。 Stata默认值为:变量个数为5000,最大矩 阵阶数为400,内存容量为10兆。如果用户 需要更多的内存或者更多的变量,可以在命 令栏输入如下命令进行扩展。 set maxvar 8000 <最大变量个数8000个。 > set memory 50m <占内存50兆。>

stata初级入门2-数据篇解析

stata初级入门2-数据篇解析

2024年8月15日星期四
《计量经济学软件应用》课程讲义
18
菜单操作:
Data > Create or change data > Create new variable Data > Create or change data > Create new variable (extended)
label define origin 0 “domestic” 1 “foreign”
label values foreign origin
2024年8月15日星期四
《计量经济学软件应用》课程讲义
13
4.变量的数据类型和长度
整数数值型:
(1)byte,(2)int, (3)long。
小数数值型:
范例:deocde price, genrate(price2)
包括数值数据的字符转换
destring命令: 将字符变量转换为数值变量
语法:destring [varlist], [generate (newvarlist) | replace] [options]
options:ignore (“chars”) 删除字符变量中的非数 值字符,force将非数值字符转换为缺失值
源,*.dbf xml数据:*.xml
菜单操作:file>import

Stata学习讲义

Stata学习讲义

Stata学习讲义

刘志阔

一、如何导入数据

Stata的数据处理功能是极其强大的,不过我们最好在excel中整理数据,然后导入到stata中就可以了。

命令:insheet using name.csv

*注意,Stata只能用csv格式,另外把数据放到stata的目录中。

二、如何进行回归

Stata中有很多命令,这些命令都是现成的,直接用就可以了。不过,怎么用是个问题。熟悉命令的基础上学会如何使用Help。最简单的命令reg做ols回归,xtreg处理面板等。

命令:reg y x

*注意,Stata命令的格式,自己回去看手册。

网络帮助可以采用如下命令获得findit scat3, net;search scat3, net

三、如何导出结果

Stata可以直接导出发表论文中回归结果,当然不是完全一样。

命令:outreg2 Results using name.word

四、如何画图

Stata的画图功能也是极其强大的,可以画出各种类型的图标。

命令:scatter y x || lfit y x

五、如何存储结果

Stata可以储存回归结果,便于分析。

命令:log using name log closed

1.codebook可以查看数据有没有缺失

2.xml_tab estout 可以输出结果

3.qui tab year, gen(yr) 可以生产时间虚拟变量。

4.g q=quarterly( qtr,"YQ")

5.form q %tq

6.recode province (min/11=1) (12/19=2) (20/31=3)

《STATA简易操作》课件

《STATA简易操作》课件

数据导入与导
数据导入
在Stata中,可以使用“import”命令将数据从外部文件导入到Stata中。支持多种格式,如CSV、 Excel等。
数据导出
使用“export”命令可以将Stata中的数据导出为外部文件。同样支持多种格式,如CSV、Excel等。
变量与数据类型
变量
在Stata中,变量代表数据中的一列。每个变量都有名称和数据类型。
数据类型
Stata支持多种数据类型,如数值型、字符型、日期型等。根据变量的数据类型,可以设置不同的格式和选项。
描述性统计分析
描述性统计分析
描述性统计分析是对数据进行初步处理和分析的方法,包括 计算均值、中位数、众数、标准差等统计指标,以及制作直 方图、箱线图等图表。
常用命令
在Stata中进行描述性统计分析的常用命令包括 “summarize”、“tabulate”、“graph”等。这些命令 可以根据需要选择不同的选项和参数,以获得更详细或定制 化的结果。
绘制折线图
折线图用于展示随时间变化的数据 趋势。
VS
在Stata中,可以通过输入“line yvar xvar”命令来绘制折线图。其中 yvar代表要展示的数据变量,xvar代 表时间变量。还可以通过添加选项来 修改线条样式、标记等。
05
Stata实战案例
案例一:线性回归分析

stata简单讲义第六讲

stata简单讲义第六讲

stata简单讲义第六讲

线性相关和回归

赵耐青

在实际研究中,经常要考察两个指标之间的关系,即:相关性。现以体重与身高的关系为例,分析两个变量之间的相关性。要求身高和体重呈双正态分布,既:在身高和体重平均数的附近的频数较多,远离身高和体重平均数的频数较少。 样本相关系数计算公式(称为Pearson 相关系数):

)

()()

)((2

2

YY

XX

XY L L L Y Y X X Y Y X X r =

----=

∑∑∑

(1)

1. 考察随机模拟相关的情况。

显示两个变量相关的散点图程序simur.ado (本教材配套程序,使用见前言)。命令为simur 样本量 总体相关系数 如显示样本量为100,ρ=0的散点图 本例命令为simur 100 0

数据格式为

X Y

171.0 58.0

176.0 69.0

175.0 74.0

172.0 68.0

170.0 64.0

173.0 68.5

168.0 56.0

172.0 54.0

170.0 62.0

172.0 63.0

173.0 67.0

168.0 60.0

171.0 68.0

172.0 76.0

173.0 65.0

Stata命令pwcorr 变量1 变量2 …变量m,sig 本例命令pwcorr x y,sig

pwcorr x y,sig

| x y

-------------+------------------

x | 1.0000

|

|

y | 0.5994 1.0000

| 0.0182

|

Pearson相关系数=0.5994,P值=0.0182<0.05,因此可以认为身高与体重呈正线性相关。

教你快速上手使用Stata进行数据处理和分析

教你快速上手使用Stata进行数据处理和分析

教你快速上手使用Stata进行数据处理和分

快速上手使用Stata进行数据处理和分析

第一章:Stata软件的介绍和安装

Stata是一款功能强大的统计分析软件,广泛应用于各个学科领

域的数据处理和分析工作中。它提供了强大的数据管理、数据处

理和数据分析功能,能够帮助用户高效地完成各种统计任务。

1.1 Stata软件的特点和应用领域

Stata具有易于使用的界面、丰富的数据处理和分析功能,可以

满足不同用户对数据分析的需求。它被广泛应用于社会科学、经

济学、医学、生物学等领域的数据处理和分析工作中。

1.2 Stata软件的安装和系统要求

Stata软件的安装非常简单,只需按照安装向导进行操作即可。

同时,为了保证软件的正常运行,用户需要满足一定的系统要求,比如合适的操作系统版本、足够的内存和硬盘空间等。

第二章:Stata基本命令和语法

在使用Stata进行数据处理和分析之前,我们需要了解一些基

本的命令和语法。下面是一些常用的命令和语法:

2.1 数据导入和导出命令

Stata可以导入多种数据格式,如Excel、CSV、SPSS等,通过

命令"import"和"export"可以实现数据的导入和导出。

2.2 数据的描述性统计和图表命令

Stata提供了丰富的命令来计算和展示数据的描述性统计信息,

比如平均值、标准差、频数等。通过命令"summarize"和"graph"可

以生成相应的统计表和图表。

2.3 数据的清洗和转换命令

在实际的数据处理中,我们经常需要对数据进行清洗和转换。Stata提供了一系列的命令来处理缺失值、异常值、重复值等问题,比如命令"drop"和"replace"等。

Stata教程(免费)

Stata教程(免费)

第一章 Stata 概貌

§1.1 Stata的功能、特点和背景

Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件,由美国计算机资源中心(Computer Resource Center)研制。从1985至1998的十四年时间里,已连续推出1.1,1.2,1.3,1.4,1.5,……及2.0,2.1,3.0,3.1,4.0,5.0,6.0等多个版本,通过不断更新和扩充,内容日趋完善。它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点,又在许多方面别具一格。Stata融汇了上述程序的优点,克服了各自的缺点,使其功能更加强大,操作更加灵活、简单,易学易用,越来越受到人们的重视和欢迎。

Stata的突出特点是只占用很少的磁盘空间,输出结果简洁,所选方法先进,内容较齐全,制作的图形十分精美,可直接被图形处理软件或字处理软件如WORD等直接调用。

一、 Stata的数据管理能力

1.Stata的数据管理空间受计算机的操作系统和计算机扩展内存的影响。对640k内存的微机,3.1

版本的Stata可以管理2400个记录×99个变量,并随计算机扩展内存的增加而增加;对4.0的WINDOWS版本,Stata可以管理4800个记录×99个变量;对WINDOWS 95下的5.0版本,可根据计算机的配置情况设置变量数和记录数,如32M扩展内存的计算机,可处理2千万个数据。变量数和记录数可以互相交易(trade),即减少记录数可以增加变量数,减少变量数可以增加记录数。

2.可以将分组变量转换成指示变量(哑变量),将字符串变量映射成数字代码。

第一讲 stata操作入门

第一讲 stata操作入门

第一讲 Stata操作入门

Stata7.0介绍

Stata7.0安装

安装时选择 intercooled,安装完成后运行wstata.exe Serial Number: 1970510407

Code: u8m$ 9jmq nki7 ymby k730 v9

Authorization: 10ra

●操作灵活、简单、易学易用

●和SAS、SPSS一起,被称为新的三大权威统计软件

●短小精悍、功能强大,包含了全部的统计分析、数据管理和绘图等功能

●统计分析功能极为全面

●运算速度极快。

●使用命令行/程序操作方式,新版本有菜单操作系统

●许多高级统计模块均是编程人员用其宏指令写成的程序文件(ADO文

件),这些文件可以由用户修改、添加和下载(见附加程序)

Stata的界面

图1即为Stata 7.0启动后的界面,除了Windows版本的软件都有的菜单栏、工具栏,状态栏等外,Stata的界面主要由四个窗口构成,分述如下:

1.结果窗口:位于界面右上部,软件运行中的所有信息,如所执行的命令、执行结果和出错信息等均在这里列出。窗口中会使用不同的颜色区分不同的文本,如白色表示命令,红色表示错误信息。

2.命令窗口:位于结果窗口下方,相当于DOS软件中的命令行,此处用于键入需要执行的命令,回车后即开始执行,相应的结果则会在结果窗口中显示出来。3.命令回顾窗口:即review窗口,位于界面左上方,所有执行过的命令会依次在该窗口中列出,单击后命令即被自动拷贝到命令窗口中;如果需要重复执行,用鼠标双击相应的命令即可。

4.变量名窗口:位于界面左下方,列出当前数据及中的所有变量名称。

第一讲 Stata操作入门

第一讲 Stata操作入门

Stata软件基本操作和数据分析入门

第一讲Stata操作入门

第一节概况

Stata最初由美国计算机资源中心(Computer Resource Center)研制,现在为Stata公司的产品,其最新版本为7.0版。它操作灵活、简单、易学易用,是一个非常有特色的统计分析软件,现在已越来越受到人们的重视和欢迎,并且和SAS、SPSS一起,被称为新的三大权威统计软件。

Stata最为突出的特点是短小精悍、功能强大,其最新的7.0版整个系统只有10 MB左右,但已经包含了全部的统计分析、数据管理和绘图等功能,尤其是它的统计分析功能极为全面,即使与1G以上大小的SAS系统相比也毫不逊色。另外,由于Stata在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此运算速度极快。

由于Stata的用户群始终定位于专业统计分析人员,因此它的操作方式也别具一格,在Windows席卷天下的时代,它一直坚持使用命令行/程序操作方式,拒不推出菜单操作系统。但是,Stata的命令语句极为简洁明快,而且在统计分析命令的设置上又非常有条理,它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可以使用相同功能的选项,这使得用户学习时极易上手。更为令人叹服的是,Stata语句在简洁的同时又拥有着极高的灵活性,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。

除了操作方式简洁外,Stata的用户接口在其它方面也做得非常简洁,数据格式简单,分析结果输出简洁明快,易于阅读,这一切都使得Stata成为非常适合于统计教学的统计软件。

stata入门中文讲义

stata入门中文讲义

及数据处理目录

第一章基础

的使用有两种方式,即菜单驱动和命令驱动。菜单驱动比较适合于初学者,容易入学,而命令驱动更有效率,适合于高级用户。我们主要着眼于经验分析,因而重点介绍命令驱动模式。

图的基本界面

关于的使用,可以参考手册,特别是[] ,尤其是第1章和第2章。

有关使用的资料非常多,其中官方的有手册,比如对于初学者,[]是有用的起点,最有用的手册可能是[] ’ 。除此之外,还有很多的其他相关手册,相关介绍参见用户手册[] —。

() 和 () 是的官方期刊,里面介绍一些没有包括在当前安装里的例子和程序。其中,是的前身,自年起,改为。另外,的网站上有很多有用的信息软件本身也提供很多有用的帮助命令,其中使用最多的可能是命令,比如当你忘记命令的使用方法时,可以在命令窗口输入,从而调出的窗口,提供命令的使用方法。有时,你如果不知道具体的命令,也可以使用命令获得帮助,比如想了解特征的函数命令,但有忘记了,可以使用调出所有的函数。

另外,还提供、、等搜索命令。会在官方帮助文件、、例子、、等搜索关键词,但不会搜索网络。会在网络(包括)上搜索可安装的程序。会进行更广范围的搜索,包括本机和网络信息,并且关

键词不必完整。会在本机上搜索所有的帮助文件(扩展名为或的文件),包括官方命令和用户写的命令。

1.1命令格式

所有命令基本具有下列模式

[:] [] [ ][][][][ ][, ]

方括号表示可选项,打字机体是直接输入,斜体需要用户替代,其中

表示前缀,是相应的命令,是变量列表,是表达式,是文件名,表示适用于该命令的一个或多个可选项。

stata简单讲义第六讲

stata简单讲义第六讲

4
100
5
106
5
104
5
107
5
109.5
5
111
5
107.5
5
107
5
111.5
5
103
5
109
6
115.5
6
115.5
6
111.5
6
110
6
114.5
6
112.5
6
116.5
6
110
6
114.5
6
110
7
125.5
7
117.5
7
118
7
117
7
122
7
119
7
119
7
125.5
7
120.5
7
122
7岁 125.5 117.5 118.0
8岁 121.5 128.5 124.0
平均身高
96.5 97.0 92.0 96.5 91.0 96.0 99.0 95.4
102.0 105.0 99.5 102.0 100.0 106.5 100.0 101.8
109.5 111.0 107.5 107.0 111.5 103.0 109.0 107.6
x | 1.0000
|
|
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Stata简明讲义

王非

中国经济研究中心

ebwf@

〇、写在前面的话

关于学习Stata的意义,大家只需知道:目前,Stata是计量经济学、特别是微观计量经济学的主流软件。因此,Stata很重要、很有用,而大家也会在使用Stata 的过程中慢慢体会到它的特点。

本讲义取名为“Stata简明讲义”,意在突出“简”和“明”两个字。虽然讲义长达五十多页,但相比Stata的完全手册来说,还不及九牛之一毛,故为“简”。实际上,完全手册中的很多内容都鲜有人(特别是计量经济学者)问津,而本讲义列出的内容则是大家经常用到的操作;所以,“简”也有“简”的好处。即便如此,掌握这份讲义也并非易事。所谓“明”,是明晰的意思。本讲义本着“手把手教”的精神,力求把每项操作都说得具体明晰,以方便初学者(特别是没有程序操作经历的初学者)尽快上手。至于本讲义在“简明”上做得怎么样,还需要各位读者来评判。

中心的一位学长邹传伟,曾经写过一份“Stata介绍”,在网上可以下载。那份讲义比较全面,但不够具体明晰。本讲义参照那份讲义,在框架上查漏补缺,并进一步地明晰化。本讲义第二部分的“do文件”和第七部分的“残差分析”的相关内容均来自于中心的沈艳老师的相关讲义,而沈老师对于本讲义的成形给予了细致的指导。本讲义附带了一些数据文件,其中“WAGE1.dta”和“WAGEPRC.dta”均来自Wooldridge的中级计量教材的数据集,而其他数据则为作者自己的杜撰。尽管从别人那里拿来了许多好东西,但本讲义的任何错误仍源于作者自己的疏忽。

本讲义是这样安排的:第一部分讲Stata的界面,第二部分讲do文件,第三部分讲怎样把数据导入Stata,第四部分专门讲help和search命令以及帮助文件的阅读方法,第五部分讲数据的描述及管理,第六部分讲如何画图,第七部分讲初步的回归分析。

祝各位学习愉快。

一、Stata长什么样?

首先,让我们看看Stata长什么样。我们以Stata 9.1(以下简称Stata)为例。点击可执行文件“wstata.exe”,即可看到Stata的基本界面:

中间黑色背景的区域就是Stata的基本显示界面,数据分析的结果一般显示在这一区域中。在我看来,黑色的背景有助于减缓视觉疲劳。如果你不喜欢这种显示方式,可以把鼠标放在这一区域中,点击鼠标右键,进而设定自己喜欢的显示方式。

围绕着黑色区域,有三个白色背景的框,左边两个,下边一个。左下角的框的标

题是“Variables”,这里会显示数据中所有变量的名称。下边的框的标题是“Command”,这里用来输入各种操作命令,命令操作的结果一般会显示在黑色区域中。左上角的框的标题是“Review”,这里会显示你曾经操作过的所有命令。在三个框的右上角,均有这样一个小图标:。点击它会使框隐藏起来,其效果类似于把QQ拖到屏幕的边上;再次点击会恢复原状。而点击右上角另外一个图标,会把相应的框关掉;如果想再次打开,可以点击菜单栏的“Window”,并选择相应的框。

黑色屏幕上方的菜单栏和图标栏,下文会逐步涉及。

二、良好的习惯从do文件开始

上文提到,Stata的Command框可以输入各种操作命令。实际上,绝大多数初学者(甚至很多长时间使用Stata的人)都只是通过Command框一条一条地输入命令,边走边看。这种做法的缺点在于:进行命令操作的时候具有盲目性,不易厘清自己将要做什么;而命令操作过后缺乏系统性,忘了自己曾经做过什么,而且别人也无法了解你的操作过程;另外,如果你想再次进行类似的操作,得重新输入曾经运行过的命令,比较繁琐。因此,大家最好从一开始就养成一个良好的习惯:在进行任何程序操作之前,都要事先写好完整的操作计划书;这一操作计划书在Stata里叫做do文件,而Stata会自动运行do文件中计划好的所有操作。

下面是一个do文件的一部分(选自沈艳老师的相关讲义),我们借此看一下do 文件是个怎样的东西。

第一行是这个do文件的名称,do文件的后缀名是“do”。第二行是这个do文件的作用,即你要通过这份操作计划书做什么事情。这两行不是操作的内容,而是对操作的注释。在do文件中,注释的部分用“/*”和“*/”包裹起来。有编程经验的人都知道,注释在程序里非常重要。从上面的do文件可以看出,注释不仅出现在开头,而且出现在每一段命令之前。注释虽然不直接参与程序的运行,但却可以帮助你清晰地规划将要做的事情,也可以帮助你在事后准确地回忆起曾经做过的事情,还可以帮助他人较快地读懂你的操作计划。一个好的注释必须简洁、清晰,能用短短几个词就准确地描述你要做的事情。

接下来,是“set more off”命令。在程序的运行过程中,如果显示结果很长(如一屏显示不完),屏幕下方就会出现“—more—”的标记;这时,Stata会暂停显示;只有按任意键,结果才能继续显示下去。而“set more off”就是把“—more—”

标记去掉的命令;这样,do文件在运行的过程中就不会因为某项操作的显示结果太长而暂停运行。

接下来,是“cap log close”命令。要明白这条命令,得先明白什么是log文件。打个比方,开大会的时候,需要录像机全程录像,以备事后查用。同样,运行操作程序的时候,也需要全程记录所有的操作命令和操作结果,以备事后查用。log 文件就是Stata中的录像带,用来忠实记录整个操作过程。如果准备拍新录像的时候,发现一盘旧录像带还在录像机里放着,那么就要先取出旧录像带,以便放入新录像带。同样,如果在进行新的程序操作之前,Stata还在运行着某个以前的log文件,那么就得先把这个log文件关掉,以便开启新的log文件进行记录。“log close”就是关闭旧的log文件的命令。在“log close”前面加“cap”的原因是:如果原来没有log文件在运行,那么运行“log close”命令会产生错误信息,Stata也就会因此中止do文件的运行;而前面的“cap”可以阻止在“log close”命令运行过程中的任何错误信息的出现,从而保证do文件的运行不会因此中止。

接下来便是开启新的log文件的命令。“log using”命令用来开启一个log文件,命令后面是log文件的路径和名称。值得强调的是,Stata命令中出现文件的路径和名称时,可以用双引号包裹起来,也可以不用。命令最后“replace”的意思是:如果在那个路径下已经存在一个这样的文件,那么新开启的log文件把原文件完全覆盖;如果你想在已经存在的log文件后面继续记录,可以把“replace”换成“append”。log文件的操作还有其他常用命令。直接运行“log”命令可以查询当前log文件的工作状态;“log off”命令可以暂停log文件的运行,就像把录像机暂时关掉;“log on”可以重新开始log文件的运行,就像重新开动录像机;如果想查看log文件记录的内容,可以在“view”命令后面加上log文件的路径和

名称。此外,点击图标栏的图标,也可以对log文件进行一系列的操作。

接下来就是导入数据、进行各种操作了。后文会逐步介绍相关的内容。

那么,怎样写这样一个do文件呢?主要有两种方法:一、打开一个记事本文件,

相关文档
最新文档