第2讲 新手入门指南

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

[GSW] Getting Started with Stata for Windows 新手入门指南(第二讲)

Stata是一个博大精深的(rich and deep)统计软件包,正如统计学本身的博大精深。新用户的最佳学习途径是练习手册上的每一个例子,在这方面花费时间多多练习会对今后从事真正的统计分析大有裨益(great benefit)。

Stata全部的官方指导手册都有一个符号标识:

[GSM] Getting Started with Stata for Mac

[GSU] Getting Started with Stata for Unix

[GSW] Getting Started with Stata for Windows

[U] Stata User’s Guide

[R] Stata Base Reference Manual

[D] Stata Data Management Reference Manual

[G] Stata Graphics Reference Manual

[XT] Stata Longitudinal-Data/Panel-Data Reference Manual

[ME] Stata Multilevel Mixed-Effects Reference Manual

[MI] Stata Multiple-Imputation Reference Manual

[MV] Stata Multivariate Statistics Reference Manual

[PSS] Stata Power and Sample-Size Reference Manual

[P] Stata Programming Reference Manual

[SEM] Stata Structural Equation Modeling Reference Manual

[SVY] Stata Survey Data Reference Manual

[ST] Stata Survival Analysis and Epidemiological Tables Reference Manual

[TS] Stata Time-Series Reference Manual

[TE] Stata Treatment-Effects Reference Manual:

Potential Outcomes/Counterfactual Outcomes

[ I ] Stata Glossary and Index

[M] Mata Reference Manual

1.Stata入门示例

第二讲将介绍几个Stata可以完成的基本任务,如打开一个数据集,调查数据集的内容,使用一些描述性统计,制作一些图表,并做一个简单的回归分析。这个方法应该给你一个直观印象:Stata可以做什么,以及Stata是如何工作的。会通过两种模式来进行:一是菜单和对话框模式;二是Stata命令行模式,这样就可以熟悉这两种模式。

一、打开示例文件:

1. 选择File > Example Datasets

2. 点击Example datasets installed with Stata

3. 点击use for auto.dta

二、简单的数据管理

命令:browse(1快捷键;2菜单;3命令,三种方式)

数据窗口类似于Excel电子表格,纵列表示变量,横行表示观测值。

单元格中的数据有多种颜色:

数值型变量:黑色

字符串变量:红色

分类变量:蓝色

命令:describe (描述数据结构)

引申命令:notes (数据集的注释)

命令:summarize (变量的概要统计)

引申命令:codebook (更详细的描述数据集的结构、内容和变量值)

codebook make

codebook foreign

给分类变量/指标(虚拟)变量添加值标签有两个优点:第一,变量存储为1个字节占用更少内存,相反,存储字符串“Domestic”需要8个字节。第二,指标变量很

容易纳入统计模型。

引申命令:codebook rep78

引申命令:browse if missing(rep78) (仅显示缺失值)

命令:list make if missing(rep78) [注意用法:if条件语句和missing()函数]

三、描述性统计

summarize price, detail

browse if price>13000

tabulate foreign (一维频数表one-way table,借助了值标签和变量标签)

tabulate rep78 (一维频数表one-way table)

tabulate rep78 foreign, row (二维交互表Two-way table,row表示加入行内百分比)

方法1:

summarize mpg if foreign==0

summarize mpg if foreign==1

方法2:

by foreign,sort: summarize mpg (比前面的命令更好:第一,值标签代替了数字,分组清楚明了;第二,不必事先知道分组变量的数值。注意:前缀命令by的用法)

by foreign,sort: summarize mpg

方法3:

tabulate foreign,summarize(mpg)

四、一个简单的假设检验

相关文档
最新文档