stata简明教程
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Stata数据的录入
1。直接录入。 2。在Excel或者记事本文件编辑好后导入。 numbe english math r 1001 90 76 1002 1003 87 76 72 80 financ e 90 80 85
1。直接录入。 利用data editor 2。在Excel或者记事本文件编辑好后导入。 直接粘贴 import导入(必须将excel文件存成csv格式) 除了csv格式,还可以导入txt格式和raw格式。 练习:利用import方法将wage1.csv导入。
Stata数据类型
数值型:用0、1、2…9 及+、–(正负号)与小数 点和( )来表示。 字符型:字符串变量由字母数字或一些特殊的符号 组成(如地名、住址,职业等等)。 注意:数字不表示大小信息,如电话、身份证号等。 字符型数据必须要加 “”。 日期型:在Stata中,1960 年1 月1 日被认为是第 0 天,因此1959 年12 月31 日为第-1天,表示形 式为:jan/10/2001或者10jan2001。
作图时命令方式比较复杂,建议多用菜单方式。 一起来做下列图形: 1。mpg 与 weight的散点图 2。 mpg 与 weight的散点图 3。 price 与 weight 均值的条形图 4。国产车与进口车价格的饼图 5。Mpg的直方图,并检验是否服从正态分布。
组合图形: 画出price与weight的来自百度文库点图,并画出其拟 合线。 图形界面设计: 图形标题,X轴标志,Y轴标志,样式选择, 图例,分组标志。
Stata的菜单介绍
最重要的菜单项: Data菜单 Graphic菜单 Statistics菜单 每执行一个菜单性会自动产生相应的命令。(我们 以summarize和regress为例加以阐述)。 我们的讲述以命令方式为主。
安装指南
分为安装版和简易版 安装版: (部分vista机器不支持) 解压 setup.rar 运行 setup 安装时选择 Stata SE 安装到C盘或者D盘(最好D盘) 安装完毕
建立回归方程
打开系统文件auto,建立如下方程: sysuse auto,clear regress price mpg weight foreign 打开文件score,建立如下方程: use score,clear reg testscr str
结果分析
Source Model Residual Total testscr str _cons SS 7794.11004 144315.484 152109.594 Coef. -2.279808 698.933 df 1 418 419 MS 7794.11004 345.252353 363.030056 t -4.75 73.82 P>|t| 0.000 0.000 Number of obs = F( 1, 418) Prob > F R-squared Adj R-squared Root MSE = = = = = 420 22.58 0.0000 0.0512 0.0490 18.581
几个简单的例子 di use sysuse sum scatter gen
举例:画出Y=X2的曲线图 drop _all (drop data from memory) set obs 100 (make 100 observations) gen x = _n (x = 1, 2, 3, .., 100) gen y = x^2 (y = 2, 4, 9, .., 10000) scatter y x (make a graph)
添加标签
打开wage1数据文件。 1。为整个数据添加标签:例如,将数据命名为“工 资表”。 菜单:Data->Labels->Label dataset 命令:label data “工资表“ 2。为变量增加标签,例如,给变量wage增加标签 “年工资总额” 菜单:Data->Labels->Label variables 命令 label variable wage “年工资总额”
命令回顾窗口:即review 窗口,位于界面左 上方,所有执行过的命令会依次在该窗口中 列出,选中某一行单击后命令即被自动拷贝 到命令窗口中;如果需要重复执行,用鼠标 双击相应的命令行即可。 变量名窗口:位于界面左下方,列出当前数 据集中的所有变量名称。 其他窗口一般使用时会自动跳出。 我们以auto数据源为例使用上述窗口。
Stata自带的示例数据表
为了方便大家学习,stata中有很多自带示例 数据,绝大部分数据都是美国的一些真实统 计数据,较新的数据和统计资料可以到stata 网站中下载。
文件的打开
1。所有的系统示例数据可以利用sysuse命 令打开。 2。用户自己的统计数据需要用use命令打开。 use命令默认打开 C:\data 或者 D:\data 中的数据。 3。如果需要打开其他文件夹的数据,必须改 变目录(例如,将自己的数据放入D:\abc) cd "D:\abc” 或者直接 file------open
不同版本对样本容量、变量个数、矩阵阶数、 宏的字符长度等有着不同的限制。以SE版为 例,其最大变量个数为32767,最大字符长 度为244字节,最大矩阵阶数为11000(即 1100011000)。Stata默认值为:最大变 量个数为5000,最大矩阵阶数为400,最大 内存为10兆。如果用户需要更多的内存或者 更多的变量,可以在命令栏输入如下命令进 行扩展。 set maxvar 5000 <最大变量个数5000个。 > set memory 50m <占内存50兆。>
Stata命令的规定
1。Stata的命令一定要区分大小写,除了极 个别的情况下,stata命令全部用小写。 2。大部分命令可以缩写。 使用缩写可以使stata的命令书写大为简化: 例如: display-------di summarize---sum describe------des 得到正确命令缩写的简单方法:看help。
2.还可以加入by选项和long选项,例如 Tabstat wage lwage, by(female) stat(…..) col(stat) long
Stata作图
STATA 提供各种曲线类型,包括点 (scatter)、线(line)、面(area),直 方图(histogram)、 条形图(bar)、饼图(pie)、函数曲线 (function)以及矩阵图(matrix)等。 同时,对时间序列数据有以ts 开头的一系列 特殊命令,如tsline。还有一类是对双变量的 回归拟合图(lfit、qfit 、lowess)等。
自己练习:为下列变量增加标签 educ:受教育年限。 exper:工龄。 tenure:现有岗位任期。
为变量值增加标签 例如:为变量marrid添加数值标签marry: 1=married; 0=Unmarried 菜单:Data->Labels->Label values->Define or modify label values Data->Labels->Label values>Assign label values to variable 命令: . label define marry 1 “married” 0 “unmarried" . label values married marry
命令格式简介
stata命令格式 [by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options] 1。Command 命令动词,经常用缩写。 2。varlist 表示一个变量或者多个变量,多 个变量之间用空格隔开。如 sum price weight 3。 by varlist 分类信息 按照某一变量的 不同特性分类
Stata上机实验
Stata 统计软件包是目前世界上最著名 的统计软件之一,国外将Stata与SAS、 SPSS 一起被并称为三大权威软件。它 同时具有数据管理软件、统计分析软件、 绘图软件、矩阵计算软件和程序语言的 特点,几乎可以完成全部复杂的统计分 析工作。
Stata有什么优势?
1。Stata 的命令语句极为简洁明快,易学易记。 2。强大的帮助信息。 本地帮助 Help 命令名 在线帮助Findit 命令名 3。始终处于计量经济学和统计学的最前沿。许多 Stata 程序员会针对计量经济学发展编写一些最新 的程序(ADO 文件), Stata提供了严谨、简练 而灵活的程序语句,用户可以编写自己的命令和函 数,同时可随时到Stata 网站寻找并下载最新的升 级文件。下载后可以直接使用,也可以自行修改、 添加功能。(例如当前流行的面板单位根和面板门 限数据,均可以安装下载使用)
4。 =exp 赋值及运算 5。 if exp 挑选满足条件的数据 6。 in range 对数据进行范围筛选 7。 Weight 给数据赋一个权重 8。 , options 命令增加一些可选信息 下面通过多个例子详解以上参数。
Stata数据处理
1。Stata的数据格式为 文件名.dta 2。对于系统自带数据文件,任何情况下可以 用 sysuse 命令打开。 3。对于C:\data(或者D:\data)下的文件, 可以使用use命令打开。 4。 放在其他目录的文件可以利用设置目录 或者“打开” 菜单打开。
使用tabstat命令计算描述性统计量 1.使用stat()输出统计指标:观测值的个数、 均值、中位数、标准差、偏度和峰度。 Tabstat wage lwage, stat(count mean p50 sd skew kurt) Bwt,还可以增加col(stat)选项使结果更便于 分析和对比。
学习有什么困难?
1。不同于以往的软件较多的运用菜单, Stata较多运用命令操作。(菜单很难记住 和找到)。 2。目前国内相关教材较少。 3。有些计量方法需要编程(如极大似然估 计),编程需要一定的计算机基础(不是我 们学习的重点)。
版本说明
最新版本Stata 12 我们使用的 Stata10.0 stata 10包括四种版本:Small(小型版)、 IC(标准版)、SE(特殊版)和MP(多处 理器版)。其中属MP版本最为强大。MP版 与SE版的功能完全相同,但MP版的运算速度 比SE版的要快很多。用户可以在命令栏输入 about 查看所安装的Stata所属的版本。
几条最简单的命令
use 打开数据文件,一般加clear选型清空 内存中现有数据。 sysuse 打开系统数据文件。 describe 描述数据 edit 利用数据编辑器进行数据编辑 list 类似于edit,但只能显示不能修改数据。
display 显示计算结果。经常写为: di summarize 求某个变量的观察值个数、平 均值、标准差、最小值和最大值。经常写为: sum scatter 生成两个变量的散点图。 set obs 定义样本个数(使用前一定要用drop 或者clear命令清空当前样本) generate 建立新变量并赋值。经常写为 gen
第一次运行会出现注册信息,此时需运 行keygen文件,将注册数据贴入。
Stata的文件
最重要的有三类文件 1。文件名.dta 数据文件 2。文件名.do 命令文件 3。文件名.ado 程序文件
Stata的目录结构及打开文件的操作
如果不加改变,安装时Stata会将系统程序安 装到: C:\Program file\stata10 中。 将所用系统自带的一些系统数据、应用程序、 帮助文件安装到 C:\Program file\stata10\ado\base 中 将所有升级程序安装到: C:\Program file\stata10\ado\update 中
Stata的窗口介绍
结果窗口:位于界面右上部,软件运行中的 所有信息,如所执行的命令、执行结果和出 错信息等均在这里列出。窗口中会使用不同 的颜色区分不同的文本,如白色表示命令, 红色表示错误信息。 命令窗口:位于结果窗口下方,相当于DOS 软件中的命令行,此处用于键入需要执行的 命令,回车后即开始执行,相应的结果则会 在结果窗口中显示出来。