Stata入门手册 STATA操作方法概述
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计分析与计量分析的结合
单元统计:描述统计、假设检验(参数、非参数)、ANOVA、质量控制、统计 作图
多元统计:MANOVA、主成分、因子分析、典型相关、聚类、判别分析、对应 分析、多维标度 线性回归、非线性回归、工具变量回归、广义线性回归、分位数回归(稳健回 归)、系统方程模型(SUR、联立方程)、离散选择模型(二项选择、排序选择、 多项选择、条件Logit、嵌套Logit模型、二元选择模型等)、计数模型(泊松回归、 负二项回归)、截断与归并模型、海克曼选择模型、逐步回归(stepwise)等。 时间序列分析:时间序列的平滑、相关图、ARIMAX、GARCH、单位根检验、 Johansen协整检验、 VAR、VEC、滚动回归等。 面板数据(线性模型、工具变量回归、动态面板、分层混合效应、广义估计方 程(GEE)、随机边界模型等)。
语法结构(varlist)
已存在的变量
varlist表示若干变量。对于数据中存在的变量,允许的表达形式包括 *、?和。其中,*表示任意字符,?表示一个字符,表示两个变量 之间的所有变量(根据数据中变量的存放位置)。 比如,数据文件中共有20个变量,依次为var1、var2、… 、 var20,则var* 表示所有变量var1-var20,var?表示变量var1、 var2、… 、var9,var1-var6表示变量var1、var2、… 、var6。 新变量
生成新变量时,变量名称不能简化。如果变量具有相同的前缀并且 都以数字结尾,可以用-表示。比如,生成新变量V1、V2、V3、V4 input v1 v2 v3 v4 或者 . input v1-v4。
16
《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
语法结构(varlist)
运算符 含义 例子 备注
STATA简介:主要特点与功能
(3) Limited Dependent
Zeroinflated count yes Zerotruncated count yes
Binary EViews Stata EViews yes yes yes
Mutinominal yes yes yes
Ordered yes yes
ANOVA EViews Stata yes yes MANOVA
Survey
Survival
Discriminant
yes
Correspondence
yes
EViews
Stata yes
yes
yes
yes(6)
yes yes yes yes
11
《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
IVLS
yes yes
DPD
yes yes Tobit
Binary
Count
GEE
yes Unit root test yes net
yes Cointegration yes net
yes
Random Stochastic Coefficient Frontier yes yes
yes
yes
14
《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
<最大变量个数5000个。>)
<最大矩阵阶数10001000。>)
. set maxvar # (.set maxvar 5000 . set memory #m (.set memory 50m
. set maxsize # (.set maxsize 1000
<分配内存50兆。>)
5
《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
STATA简介:界面结构来自6《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
STATA简介:界面风格设置
风格设置:Edit - > Preference (右键->Preference) 字体设置: (右键->Font)
《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
STATA简介:主要特点与功能
Add New Features Examples Utilities
严谨、简练、灵活的程序语言。 Stata提供了严谨、简练而灵活的程序语句,用户可以编写自己的命 令和函数,也可以制作自己的对话框和窗口菜单。 强大的矩阵运算功能:Mata Mata是Stata的矩阵运算语言,实现各种运算 兼容性。 在Stata中可以直接运行其它程序;其他语言编写的程序可以作为插 件(Plugin)直接嵌入到Stata中。
2
《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
引言
解决方案: 不同的软件各有所长,各有所短。学习、掌握多种软件。但是不同 的软件在数据格式、操作方法、语法结构有很大区别,因此熟练掌 握一种软件需要花费较长的时间。 我们希望能够有一个相对较为综合的分析软件=>Stata在统计、计量 分析方面都非常出色。 是否已有相应的程序供我们直接运行=>Stata具有丰富的网络资源 掌握软件的编程方法,自己编写程序=>Stata具有简练、强大、快捷 的编程和运算功能。 Stata以其操作简单、运行快速而精确,全面的数据管理功能,精致的 作图,强大的统计与计量分析功能,简练标准的程序与矩阵运算功能、 丰富的网络资源,在统计学、经济学、金融学、心理学、计算机科学、 物理、化学等多个学科领域得到广泛使用 (/whystata/field.html)。
上述运算符不区分大小写,可以重复,也可以进行各种组合。比如, L3.x也可以等价地表述为LLL.x、LL2.x、L2L.x。 #可以为单个数,也可以为数列(numlist),表示对同一变量的多次运 算。比如,L(1/3).GDP表示L.GDP、L2.GDP、L3.GDP。x可以为 单个变量,也可以为多个变量,表示对不同变量的同一运算。比如 L2.(GDP CS)表示L2.GDP、L2.CS。L(1/3).(GDP CS)表示 L.GDP、L2.GDP、L3.GDP、L.CS、L2.CS、L3.CS。
3 《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
STATA简介:发展历史
Stata是一个用于数据管理和分析的统计软件,由Stata公司(StataCorp) 研制开发。从1985开始,先后开发了1.1, 1.2,…,等多个版本。目前Stata 的最新版本为2009年7月份推出的Stata 11.0。
调查数据分析
生存分析 蒙特卡洛模拟、自举法(bootstrap)、刀切法(jackknife)
8 《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
Capability
STATA简介:主要特点与功能
丰富的网络资源。
4
《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
STATA简介:发展历史
Stata 11包括四种版本:Small(小型版)、IC(标准版)、SE(特别版) 和MP(多处理器版)。其中属MP版本最为强大。MP版与SE版的功能 完全相同,但MP版的运算速度比SE版的要快很多。用户可以在命令栏 输入 about 查看所安装的Stata所属的版本。 不同版本对样本容量、变量个数、矩阵阶数、宏的字符长度等有着不 同的限制。以SE版为例,其最大变量个数为32767,最大字符长度为244 字节,最大矩阵阶数为11000(即1100011000)。Stata默认值为:最大 变量个数为5000,最大矩阵阶数为400,最大内存为50兆(在Stata10中为 10m)。如果用户需要更多的内存或者更多的变量,可以在命令栏输入如 下命令进行扩展。
manova主成分因子分析典型相关聚类判别分析对应分析多维标度线性回归非线性回归工具变量回归广义线性回归分位数回归稳健回归系统方程模型sur联立方程离散选择模型二项选择排序选择多项选择条件logit嵌套logit模型二元选择模型等计数模型泊松回归负二项回归截断与归并模型海克曼选择模型逐步回归stepwise等
比如,线性回归模型的命令regress的格式为:
. regress depvar [indepvars] [if] [in] [weight] [, options] 用户可以输入如下命令:
. regress depr dcpi drgdp if depr<20
15
《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
Parame- Nonpara- Quantity Random tric test metrc test control Sampling yes yes PCA yes yes Factor yes yes yes(U) yes(U,M) Cluster yes yes MDS Canonical
L#.x F#.x D#.x S#.x
x的#阶滞后。 x的#阶超前。 x的#次差分。 x的#阶季节差分
L3.x=xt-3 F3.x=xt+3 D2.x =(xt-xt-1)-(xt-1-xt-2) S12.x=(xt-xt-12)
一阶滞后可写为L.x 一阶超前可写为F.x 一次差分可写为D.x 一阶季节差分可写为S.x
yes yes
3SLS
yes yes
ML
yes yes
Eviews Stata Eviews
yes yes yes(6)
Quantile Stepwise
Stata
yes
yes
yes
yes
10
《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
STATA简介:主要特点与功能
(2) Statistical Method
语法结构
基本格式:
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [using filename] [, options] 其中,符号[ ]表示可选项。command为Stata的命令函数,varlist为变量, [if exp]、[in range]用于设定变量或观测值,[weight]用于设定观测值的 权重,[using filename]表示使用的数据文件,options表示命令的选项, 不同命令的选项也不同。[by varlist:]表示对varlist(分类变量)中的每 一类分别执行命令(command)。
STATA操作方法概述
引言 STATA简介
STATA的发展历史
STATA的界面结构
STATA的主要特点与功能
STATA的语法结构
1
《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
引言
规范性的研究包括两个核心的要素:理论模型和经验 分析(统计分析、计量分析)。 面临的问题:
研究者经常地希望利用多种方法从不同角度对数据进行分 析,但拥有绝对优势的软件是不存在的,不存在哪个软件 能解决所有的问题。 计量经济学发展迅速,新的方法层出不穷,而软件公司将 这些新方法嵌入到软件中是存在滞后的。
13
《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
STATA简介:主要特点与功能
(5) Panel data
Linear with Linear AR Eviews Stata yes yes GLS Eviews Stata yes yes Multilevel mixed effect yes Quantile
9
《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
STATA简介:主要特点与功能
Stata与EViews的比较
OLS GLS
yes yes yes(6)
(1) Regresson method
NLS
yes yes GLM
2SLS
yes yes Heckman
GMM
yes yes
(N)SUR
Nested Condilogit tional logit
Count model yes
yes
yes
yes
Censored Truncated
Stata
yes
yes
12
《STATA应用高级培训教程》 南开大学数量经济研究所 王群勇
STATA简介:主要特点与功能
(4) Time series
Seasonal SmoothUnit root CointeadjustARIMA ing test gration ment Eviews yes yes yes yes yes Stata MGARCH Eviews yes Stata Yes(11) yes State Space yes Yes(11) yes yes yes VECM yes yes ARCH yes yes Filter yes Yes(11)