STATA入门学习——认识stata与stata数据管理功能
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
若需输入非数值型(例如字符型)数据,则需在原命令 input中加入“str+自选的字符长度N(通常令N=18) 该字符 型数据对应的变量名”,即 input A B C str18 D
例如:input A B C str18 D
ABC
D
1. 23 56 78 北京
2. 34 67 48 上海
3. end
《数据计量分析》
STATA入门学习
第一讲 认识 Stata
• Stata软件简介 • Stata主要功能模块介绍 • Stata窗口及基本操作
1.1 Stata软件简介
• Stata软件是现今较为流行的统计计量分析 软件,具有强大的数据处理和分析功能, 它是由Stata公司在1985年研制开发成功之 后面市的,到现在已经有二三十年的历史 了。
数据库的建立
方法4:将原本输在excel中的数据粘贴到stata中: 复制excel中的数据>data>data editor>点中所要存放数据的第一 个格子,点左键>paste
Stata的帮助系统
• Stata为用户提供了强大的帮助系统,新用户可以通过帮助 系统的应用,更好地利用Stata完成自己所需要的功能和操 作。Stata的帮助系统主要由Stata手册、Stata自带帮助和网 络帮助三个方面组成。
• (一)Stata手册是一本学习Stata使用的权威书籍,它按字 母顺序排列出了Stata所有相关的命令。
Panel data, Time series, Survey data • 多变量分析:
Cluster analysis • 抽样和模拟: Bootstrap, Monte Carlo Simulation – 绘图功能 – 编程和矩阵运算功能
数据处理
用户得到第一手数据之后要做的就是对数据进行基本 的处理,主要包括数据的读入、类型的转换、压缩等,此 外还可以对数据进行基本的描述分析,包括频数分布、离 散趋势、集中趋势的分析等等。
Stata的窗口
其界面由四大窗口组成的,它们是分别是 命令回顾窗口(Review)、结果窗口 (Results)、变量窗口(Variables)、和命令 输入窗口(Command)。
(1)命令回顾窗口(Review)
主要用来临时性存储已经执行过的命令语句。这些执行的 命令语句主要包括两种:一种是直接从命令窗口中输入的命令, 另一种是通过窗口菜单操作转化而成的命令。
– Cap log close
• 第五步:打开和关闭当前log:
– Log using filename – Log的关闭,log close
Company Logo
1.2 Stata主要功能模块介绍
• Stata主要功能
– 数据管理功能 – 统计分析功能
• 统计分析:概要统计、交互表 • 回归分析: OLS, 2SLS, Logit, Probit, Tobit, Heckman, GMM
– 命令行操作: • 在命令窗口中直接写入命令
– 程序操作: • 利用“window”下的“do-file editor”编辑do文件,把一系列
命令记录下来,需要用的时候,用“file”下的“do…”调出
执行记录下来的批量命令即可。
Stata语法和命令
Stata软件是通过运行命令来完成所需的分析的 Stata的基本语法格式如下: [ 特殊选项 ] 关键词 命令参数 [ , 命令选项 ] [by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [using filename] [, options] 其中,[]中的内容表示可以省略的部分,故可看出,只有command是必不 可少的,其他部分的内容用户可以依需要加入 有关命令、函数、变量名等要素表示方式的要求: ①都要用英文字母表示,并且区分大小写,例如“x”和“X”会被认为是 两个不同的变量。 ②同一条命令必须在同一行中书写,而不同的命令必须出现在不同行中。 ③命令都要用小写
end(样本数据全部录完后,结束录入工作)
save **.dta (保存该新建数据库)
例如: input A B C ABC
1. 23 45 67 2. 45 67 90 … n. end
数据库的建立
补充说明:
使用命令输入时,各变量名、各数据间都要用一个空格隔 开
系统默认输入的为数值型(float)数据
• 各个菜单的功能。 (1)File的下拉菜单包括打开、保存、查看文件,导入、导出数据以
及打印等等功能。 (2)Edit的下拉菜单包括数据的复制、粘贴等有关数据管理和设置
的功能。
(3)Data的下拉菜单包括数据的描述、编辑、浏览、增加或删除 变量、文件合并、矩阵操作等方面的内容.
(4)Graphics主要是用来作图的菜单,作图种类主要包括散点图、 线图、柱状图、饼图等等各种图形。
• Stata版本:9.0 ,10.0, 11.0 • Stata三类主要文件:
– 数据文件:*.dta,保存stata可用的数据文件;
– 命令程序文件:*.do,提交给stata执行的 一系列命令的集合的文件;
– 记录文件/结果文件:*.log,用来记录stata 运行的结果。
• do-file
(2)结果窗口(Results)
主要是用来显示命令执行结果的窗口。若是命令执行的结 果过长,则会在命令窗口的底端出现“more”这一字样,这时 只需要按下空格键或者回车键,就可以浏览下面的内容;如果 想停止浏览,只需要按“q”键或者工具栏中的 图标,就可 停止。
(3)变量窗口(Variables)
回归与建模分析
回归与建模分析是应用Stata做经济计量分析的重中之重, 主要包括基本回归分析、模型的设定与修正、离散被解释变量 模型、计数模型、受限因变量模型、时间序列分析、面板数据 分析、系统方程模型、蒙特卡罗模拟与自助法等方面的内容。
编程
Stata还可以实现用户自己编写的程序,极大地方便了用户的 使用。
补充说明: clear——移除软件中之前所使用过的任何数据
数据库的建立
2.新建数据库——录入数据 方法1(功能键法):data>data editor>弹出对话框,像在excel中 输入数据即可 (边输入边点preserve)>save 方法2(命令法1):edit ,弹出“data editor”的对话框后录入 方法3 (命令法2) : input 变量名1 变量名2 变量名3。。。(敲回车) 直接输入各变量所对应的数据(每输完一组敲回车输下一组)
• (二)Stata自带帮助系统是使用最方便,也是最常用的方 法。其命令语法为“help 所要查询命令名”
• (三)Stata的网络帮助系统更为强大,用户可以在网上查 找Stata还没有内置化的命令,实现自行安装。
Stata的运行方式
– 菜单操作: • 执行菜单操作后,在结果窗口能够显示命令行和命令的 结果
• 本课程书所介绍的功能主要是通过Stata10.0 来实现的。
• Stata与SAS、SPSS被共同成为三大权威统计软 件,它被广泛地应用于统计学、经济学、生物 学、医药学、社会学、人口学等等一系列学科 的研究,功能十分强大。但是与其他软件相比, Stata具有以下明显优势:
• (1)Stata操作较为简单,方便掌握。 • (2)Stata是一个开放的软件系统。 • (3)Stata具有强大的数据分析功能。 • (4)Stata具有强大的图形制作功能。
Company Logo
STATA基本介绍
• do-file
– 如何写do-file? – 规范的do-file应该包括哪些内容
• 第一步:清理内存,clear • 第二步:设定内存,set memory • 第三步:指定路径
– cd: f/research/stata/….
• 第四步:关闭以往log
(5)Statistics主要是用来进行各种统计和计量分析的菜单,主要 包括线性回归模型分析、时间序列分析、面板数据分析等等方 面的内容。
(6)User主要是用来构建用户自己的菜单,主要包括有关数据、 图表和统计分析等个方面的设置和操作。
(7)Window主要是用于对显示界面的操作,主要包括对Review、 Results、Variables、Command四大窗口的操作(删除和复原); 以及建立do-file文件。
绘图
绘图是进行数据分析的又一种重要的分析工具,Stata 提供了强大的绘图功能,主要包括散点图、线图、条形图、 直方图、饼图、箱线图、函数图等图形的绘制和相应设定。
统计分析
Stata具有强大的统计分析功能,比如,方差分析(包括单 因素方差分析、双因素与多因素方差分析、协方差分析等)和 假设检验(包括单个总体均值的检验、两个总体均值的检验、 总体方差的假设检验、拟合优度的检验等)。
save "C:\Users\asus\Desktop\vvv.dta"
file C:\Users\asus\Desktop\vvv.dta saved
数据库的建立
输入字符型数据时,可不加中文输入法下的引号直接输入, 也可加上英文输入法下的引号再输入,显示出来是一样的;但 若加上中文输入法下的引号,引号会与输入的字符一同显示。 若字符型数据中有空格,则在录入该数据时需加上英文输入 法下的引号,例如“上 海” 输入数据时,若敲完回车后发现某一个数据录入有误,可把 所有数据录入完毕end后:①使用edit命令或data editor功能键 打开刚才录入的数据库,直接修改错误数据即可;或②使用命 令修改,即replace 某变量=正确的数据 in 数据所在的行数,如 replace B=57 in 2,若B为字符型数据,则使用命令replace B=” 北京” in 2,这里B前面不加str18,北京必须用英文双引号引住。
1.3 Stata窗口及基本操作
• Stata的界面
运行Stata后,将会看到如图1.1所示的操作界面。
• Stata菜单栏
• Stata具有正常的标题栏、菜单栏、工具栏和状态栏。其中,菜单 栏是用户进行菜单操作的主要媒介和工具。菜单栏主要包括File、 Edit、Data、Graphics、Statistics、User、Window、Help这八个子 菜单。
百度文库 第二讲 stata数据管理功能
• 数据库的建立(数据录入) • 数据库管理 • 数据管理
数据库的建立
数据录入
1.打开(读入)stata中已存在的数据集 使用功能键:file>open… 输入命令:use **.dta,clear
例如:use "C:\Users\asus\Desktop\表2.6.1中国各地区城镇居 民家庭人均年可支配收入与人均年消费性支出.dta", clear
Review窗口可以临时性存储自Stata本次运行到结束的所有命 令,一旦关闭软件,所有的命令语句将会自动消失,若想永久 保存这些命令,可以通过单击右键选择全部命令语句生成dofile文件实现永久存储,需要使用时通过菜单“File”,选择下 面的“Do…”调出即可。
在Stata运行过程中,可以重复使用显示在Review窗口中的某 个命令,只需要左键单击命令,该命令将会重新显示在 Command窗口中,供用户进行再度使用或修改后使用、执行。
• 通俗来说,do-file是提交给stata执行的一系列命令的集合的文 件,相当于记事本。
– 使用do-file的理由?
• 可直接调出以前的运行程序并运行(File>Do…),可追溯过往 操作
• 可以整合庞杂的命令,减少命令输入 • 便于发现错误
– 如何在Do-file中做注释: * 整行注释 // 开始到该行结束注释 /// 开始到该行结束注释 第二行命令是该行命令的延续 (用于长命令的换行) /*注释*/ 使用最灵活广泛的注释
主要是用来显示变量名称和类型的窗口。点击某个变量名 称,其就可以显示在右方的命令窗口中。如果想要删除某个变 量,则只需要在命令窗口中输入“drop 该变量名” 命令,然后 点击回车键即可完成删除操作。
(4)命令输入窗口(Command)
是用户进行交互式程序操作的主要实现场所,只要用户将 相关命令输入,然后点击回车键即可运行该命令。