第2讲 新手入门指南
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[GSW] Getting Started with Stata for Windows 新手入门指南(第二讲)
Stata是一个博大精深的(rich and deep)统计软件包,正如统计学本身的博大精深。新用户的最佳学习途径是练习手册上的每一个例子,在这方面花费时间多多练习会对今后从事真正的统计分析大有裨益(great benefit)。
Stata全部的官方指导手册都有一个符号标识:
[GSM] Getting Started with Stata for Mac
[GSU] Getting Started with Stata for Unix
[GSW] Getting Started with Stata for Windows
[U] Stata User’s Guide
[R] Stata Base Reference Manual
[D] Stata Data Management Reference Manual
[G] Stata Graphics Reference Manual
[XT] Stata Longitudinal-Data/Panel-Data Reference Manual
[ME] Stata Multilevel Mixed-Effects Reference Manual
[MI] Stata Multiple-Imputation Reference Manual
[MV] Stata Multivariate Statistics Reference Manual
[PSS] Stata Power and Sample-Size Reference Manual
[P] Stata Programming Reference Manual
[SEM] Stata Structural Equation Modeling Reference Manual
[SVY] Stata Survey Data Reference Manual
[ST] Stata Survival Analysis and Epidemiological Tables Reference Manual
[TS] Stata Time-Series Reference Manual
[TE] Stata Treatment-Effects Reference Manual:
Potential Outcomes/Counterfactual Outcomes
[ I ] Stata Glossary and Index
[M] Mata Reference Manual
1.Stata入门示例
第二讲将介绍几个Stata可以完成的基本任务,如打开一个数据集,调查数据集的内容,使用一些描述性统计,制作一些图表,并做一个简单的回归分析。这个方法应该给你一个直观印象:Stata可以做什么,以及Stata是如何工作的。会通过两种模式来进行:一是菜单和对话框模式;二是Stata命令行模式,这样就可以熟悉这两种模式。
一、打开示例文件:
1. 选择File > Example Datasets
2. 点击Example datasets installed with Stata
3. 点击use for auto.dta
二、简单的数据管理
命令:browse(1快捷键;2菜单;3命令,三种方式)
数据窗口类似于Excel电子表格,纵列表示变量,横行表示观测值。
单元格中的数据有多种颜色:
数值型变量:黑色
字符串变量:红色
分类变量:蓝色
命令:describe (描述数据结构)
引申命令:notes (数据集的注释)
命令:summarize (变量的概要统计)
引申命令:codebook (更详细的描述数据集的结构、内容和变量值)
codebook make
codebook foreign
给分类变量/指标(虚拟)变量添加值标签有两个优点:第一,变量存储为1个字节占用更少内存,相反,存储字符串“Domestic”需要8个字节。第二,指标变量很
容易纳入统计模型。
引申命令:codebook rep78
引申命令:browse if missing(rep78) (仅显示缺失值)
命令:list make if missing(rep78) [注意用法:if条件语句和missing()函数]
三、描述性统计
summarize price, detail
browse if price>13000
tabulate foreign (一维频数表one-way table,借助了值标签和变量标签)
tabulate rep78 (一维频数表one-way table)
tabulate rep78 foreign, row (二维交互表Two-way table,row表示加入行内百分比)
方法1:
summarize mpg if foreign==0
summarize mpg if foreign==1
方法2:
by foreign,sort: summarize mpg (比前面的命令更好:第一,值标签代替了数字,分组清楚明了;第二,不必事先知道分组变量的数值。注意:前缀命令by的用法)
by foreign,sort: summarize mpg
方法3:
tabulate foreign,summarize(mpg)
四、一个简单的假设检验