stata初级入门1-介绍篇
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Stata 入门1 ——基本介绍篇
4/17/2014
《计量经济学软件应用》课程讲义
1
何为Stata?
Stata最初由美国计算机资源中心(Computer Resource Center)研制,现在为Stata公司的 产品,其最新版本为12.0版。 它操作灵活、简单、易学易用,是一个非常有 特色的统计分析软件,和SAS、SPSS一起, 被称为新的三大权威统计软件。
4/17/2014
《计量经济学软件应用》课程讲义
6
个人建议,仅供参考!
初学者最好主攻1个软件,个人比较认可stata。 熟悉后,可学习多个软件,但不建议学SAS, 太难了! 在实际数据处理分析时,可综合多个软件。如 用SPSS做统计分析,Eviews做时序分析, Stata做其它回归。虽然每个软件的数据格式 不同,但都可直接调用! 不要惧程序都是英文,SPSS有中文版,其它 皆无!
stata
简单易懂、界面似Excel,操作多样化(既可编写 程序,也可鼠标操作,像使用office) 数据管理能力弱于SAS,一次主要用于一个数据文 件,可处理的单个数据文件受内存大小影响,今天 可处理变量也达32768个。 强于回归分析、Logistic分析和调查数据分析,弱 于方差分析和多变量方法; 作图功能也很强大; 程序需要磁盘空间小,stata10基本就在140M,但 对内存要求高。 很多计量分析程序网上找,共享资源十分丰富! 小块头,大智慧!!
4/17/2014
《计量经济学软件应用》课程讲义
2
为何选用Stata? ——Stata,SPSS,SAS,Eviews比较
SAS
功能强大,可编程,很受高级用户的欢迎。 可同时处理多个数据文件,处理变量多达32768个,可以画你想 要的任何数据分析图 强于方差分析、混合模型分析和多变量分析,弱于有序和logistic 分析、稳健方法及调查数据分析(泊松等分布)。 最难掌握!!原因有二:(1)SAS操作需要自己编制程序来处 理和分析数据。新手一般很难掌握程序编写语言。(2)如果程 序出错,找到并改正错误很困难。 程序占用磁盘空间非常大,一般装完,大约2-3个G; 很难学,界面不知如何入手,很容易受打击(特别是没有程序和 外语语言基础的)! 一部大块头,具大智慧!! 4/17/2014 3 《计量经济学软件应用》课程讲义
12
Stata界面
4/17/2014
《计量经济学软件应用》课程讲义
13
Stata12的界面
如Windows版本的软件有菜单栏、工具栏,状态栏 等 Stata的界面主要是由四个窗口构成,分述如下:
1.结果窗口:位于界面右上部,软件运行中的所有信息, 如所执行的命令、执行结果和出错信息等均在这里列出。 窗口中会使用不同的颜色区分不同的文本,如白色表示命 令,红色表示错误信息。 2.命令窗口:位于结果窗口下方,相当于DOS软件中的 命令行,此处用于键入需要执行的命令,回车后即开始执 行,相应的结果则会在结果窗口中显示出来。 3.命令回顾窗口:即review窗口,位于界面左上方,所有 执行过的命令会依次在该窗口中列出,单击后命令即被自 动拷贝到命令窗口中;如果需要重复执行,用鼠标双击相 应的命令即可。 4.变量名窗口:位于界面左下方,列出当前数据及中的 所有变量名称,变量说明,数据格式。
4/17/2014 《计量经济学软件应用》课程讲义 19
有问题,找help菜单
在stata学习中,一定要学会和习惯用help菜单, 它能帮助你找到你要的信息;
4/17/2014
《计量经济学软件应用》课程讲义
20
Help中contents
4/17/2014
《计量经济学软件应用》课程讲义
21
Help中的search
《计量经济学软件应用》课程讲义 26
4/17/2014
学习本课前的准备
统计学 计量经济学 宏、微观经济学 英文
练习
请用set命令让结果显示窗口连续显示结果 请用set命令将stata所调用的内存容量更改为 500MB 说明save,replace在stata中的作用 通过help菜单来调出regress命令帮助文件
《计量经济学软件应用》课程讲义 23
4/17/2014
良好的习惯1:从do文件开始
利用菜单或command窗口逐条输入命令操作,不是 好习惯; 这种做法的缺点:(1)进行命令操作的时候具有盲 目性,不易理清自己将要做什么;(2)命令操作后 缺乏系统性,忘了自己曾做什么,而别人也无法了解 你的操作过程;(3)要想再进行类似操作,要重新 输入曾经运行过的命令,比较繁琐 好习惯:在进行任何操作前,要事先写好完整的操作 计划书,并将计划转化为do文件,并拿到stata中去 run。
《计量经济学软件应用》课程讲义 24
4/17/2014
一个do文件例子
4/17/2014
《计量经济学软件应用》课程讲义
25
良好的习惯2:所有结果操作都记录
在每次数据分析和处理时,最好将每次的分析过程和结果用log命令 记录下来,形成log文件,以便可追踪和回顾你的每次分析。 Log文件格式有smcl, txt等 Log命令: log using filename [, append replace [text|smcl] name(logname)] : Open log file,如log using c:\data\cfland.smcl [,append/replace] log {close|off|on} [logname]:Close log, temporarily suspend logging, or resume logging cmdlog:Report status of command log file cmdlog using filename [, append replace] :Open command log file cmdlog {close|on|off}: Close command log, temporarily suspend logging, or resume logging
《计量经济学软件应用》课程讲义 16
4/17/2014
Set 命令
4/17/2014
《计量经济学软件应用》课程讲义
17
常用set命令
Set:显示系统设置参数 set obs #:设置数据文件的记录(样本)个数,如set obs 100 set matsize # [, permanently]:设置数据文件的变量 最大个数,where 10 < # < 11,000 for Stata/MP and Stata/SE and where 10 < # < 800 for Stata/IC,如set matsize 250; Set maxvar #:也是设置变量最大个数,只用stata/SE; sysdir set :改变stata的系统目录(changes the path to Stata‘s system directories) Sysdir: lists Stata's system directories.
只查找信息的英文关键词。 第1选项:仅在安装文件夹和官方主页 中的FAQs查找;
第2选项:仅在官
方网站和其它网络 资源中上搜索
第3选项:在所有
资源中搜索
4/17/2014 《计量经济学软件应用》课程讲义 22
Help中的stata Command
前提是你知道 你要了解的命 令的命令名。 如regress(reg) 同help #,如 help reg 它会显示你要 查找了命令的 语法结构、参 数、例子
4/17/2014
《计量经济学软件应用》课程讲义
5
Eviews 界面人性化相对较差。使用前,最好熟悉每 个命令操作的程序语言; 数据处理功能弱; 强于时间序列分析,但其它回归分析(如面 板数据分析等)、数据处理、统计分析弱; 软件很小,不占空间,对内存大小要求也很 高; 小块头,小智慧!!
4/17/2014
《计量经济学软件应用》课程讲义
28
Baidu Nhomakorabea
除以上四个默认打开的窗口外,在Stata中还有数据 编辑窗口、程序文件编辑窗口、帮助窗口、绘图窗 口、Log窗口等,如果需要使用,可以用Window或 Help菜单将其打开。
4/17/2014 《计量经济学软件应用》课程讲义
15
使用前先熟悉几个命令
Set命令:显示和设置程序的系统参数,如分配 的可调用内存等; Clear命令:清除内存读取的数据文件和结果; Save命令:保存文件,常用save,replace; Edit命令:数据编辑窗口调出,可编辑; Browse 命令:数据编辑窗口调出,只可浏览, 不可编辑; Exit命令:退出stata程序
《计量经济学软件应用》课程讲义 4
4/17/2014
SPSS 界面人性化,基本如excell,很容易上手; 数据文件最多4096个变量,记录数量由磁盘空 间决定; 强于统计分析,如方差分析,没有稳健方法, 弱于计量分析,缺乏调查数据分析; 程序也比较大 大块头,小智慧!!非真正的计量软件,而是 统计软件
《计量经济学软件应用》课程讲义 18
4/17/2014
命令格式:以regress为例
[by varlist:] regress [depvar [varlist1 [(varlist2)]]] [weight] [if exp] [in range] [, level(#) beta hascons noconstant noheader eform(string) depname(varname) mse1 ] 命令中,[ ]内为选择项,括号外为必选项。 这里介绍命令的公共选择部分,专用选择项将在相应章节作介绍。 by varlist,是指定按变量varlist的取值逐一作多元线性回归。如变量名为 group,且取值为1,2,3,4,则“by group:”是指定Stata分别按 group=1, group=2, group=3和group=4的观察值分别作4个回归方程。在 选用该选择项前,要对变量排序,即先执行sort,如: sort group weight,是指本命令允许使用加权或频数,有[fw=频数变量]和[aw=加权变 量]两种形式。 if exp, 用条件语句指定条件。如,下列条件是合法的: if group==1 /* 对满足group=1条件的观察值进行分析 in range,指定观察值的范围,对在范围内的观察值作分析。下列语句是 合法的: in 1/25 /* 对观察值范围为1~25号的观察值作分析
《计量经济学软件应用》课程讲义 8
4/17/2014
Stata官方主页
4/17/2014
《计量经济学软件应用》课程讲义
9
4/17/2014
《计量经济学软件应用》课程讲义
10
加州大学的资源主页
4/17/2014
《计量经济学软件应用》课程讲义
11
普林斯顿大学的资源主页
4/17/2014
《计量经济学软件应用》课程讲义
《计量经济学软件应用》课程讲义 7
4/17/2014
常用的stata网上资源
官方主页:www.stata.com/support 加州大学:http://www.ats.ucla.edu/stat/ 普林斯顿大学: http://dss.princeton.edu/online_help/stats_packages /stata/stata.htm 人大经济论坛stata专版:www.pinggu.org.cn 中国经济学教育科研网:http://www.cenet.org.cn/ 西安大学连玉君老师个人主页 复旦大学陆铭老师个人主页
4/17/2014
《计量经济学软件应用》课程讲义
1
何为Stata?
Stata最初由美国计算机资源中心(Computer Resource Center)研制,现在为Stata公司的 产品,其最新版本为12.0版。 它操作灵活、简单、易学易用,是一个非常有 特色的统计分析软件,和SAS、SPSS一起, 被称为新的三大权威统计软件。
4/17/2014
《计量经济学软件应用》课程讲义
6
个人建议,仅供参考!
初学者最好主攻1个软件,个人比较认可stata。 熟悉后,可学习多个软件,但不建议学SAS, 太难了! 在实际数据处理分析时,可综合多个软件。如 用SPSS做统计分析,Eviews做时序分析, Stata做其它回归。虽然每个软件的数据格式 不同,但都可直接调用! 不要惧程序都是英文,SPSS有中文版,其它 皆无!
stata
简单易懂、界面似Excel,操作多样化(既可编写 程序,也可鼠标操作,像使用office) 数据管理能力弱于SAS,一次主要用于一个数据文 件,可处理的单个数据文件受内存大小影响,今天 可处理变量也达32768个。 强于回归分析、Logistic分析和调查数据分析,弱 于方差分析和多变量方法; 作图功能也很强大; 程序需要磁盘空间小,stata10基本就在140M,但 对内存要求高。 很多计量分析程序网上找,共享资源十分丰富! 小块头,大智慧!!
4/17/2014
《计量经济学软件应用》课程讲义
2
为何选用Stata? ——Stata,SPSS,SAS,Eviews比较
SAS
功能强大,可编程,很受高级用户的欢迎。 可同时处理多个数据文件,处理变量多达32768个,可以画你想 要的任何数据分析图 强于方差分析、混合模型分析和多变量分析,弱于有序和logistic 分析、稳健方法及调查数据分析(泊松等分布)。 最难掌握!!原因有二:(1)SAS操作需要自己编制程序来处 理和分析数据。新手一般很难掌握程序编写语言。(2)如果程 序出错,找到并改正错误很困难。 程序占用磁盘空间非常大,一般装完,大约2-3个G; 很难学,界面不知如何入手,很容易受打击(特别是没有程序和 外语语言基础的)! 一部大块头,具大智慧!! 4/17/2014 3 《计量经济学软件应用》课程讲义
12
Stata界面
4/17/2014
《计量经济学软件应用》课程讲义
13
Stata12的界面
如Windows版本的软件有菜单栏、工具栏,状态栏 等 Stata的界面主要是由四个窗口构成,分述如下:
1.结果窗口:位于界面右上部,软件运行中的所有信息, 如所执行的命令、执行结果和出错信息等均在这里列出。 窗口中会使用不同的颜色区分不同的文本,如白色表示命 令,红色表示错误信息。 2.命令窗口:位于结果窗口下方,相当于DOS软件中的 命令行,此处用于键入需要执行的命令,回车后即开始执 行,相应的结果则会在结果窗口中显示出来。 3.命令回顾窗口:即review窗口,位于界面左上方,所有 执行过的命令会依次在该窗口中列出,单击后命令即被自 动拷贝到命令窗口中;如果需要重复执行,用鼠标双击相 应的命令即可。 4.变量名窗口:位于界面左下方,列出当前数据及中的 所有变量名称,变量说明,数据格式。
4/17/2014 《计量经济学软件应用》课程讲义 19
有问题,找help菜单
在stata学习中,一定要学会和习惯用help菜单, 它能帮助你找到你要的信息;
4/17/2014
《计量经济学软件应用》课程讲义
20
Help中contents
4/17/2014
《计量经济学软件应用》课程讲义
21
Help中的search
《计量经济学软件应用》课程讲义 26
4/17/2014
学习本课前的准备
统计学 计量经济学 宏、微观经济学 英文
练习
请用set命令让结果显示窗口连续显示结果 请用set命令将stata所调用的内存容量更改为 500MB 说明save,replace在stata中的作用 通过help菜单来调出regress命令帮助文件
《计量经济学软件应用》课程讲义 23
4/17/2014
良好的习惯1:从do文件开始
利用菜单或command窗口逐条输入命令操作,不是 好习惯; 这种做法的缺点:(1)进行命令操作的时候具有盲 目性,不易理清自己将要做什么;(2)命令操作后 缺乏系统性,忘了自己曾做什么,而别人也无法了解 你的操作过程;(3)要想再进行类似操作,要重新 输入曾经运行过的命令,比较繁琐 好习惯:在进行任何操作前,要事先写好完整的操作 计划书,并将计划转化为do文件,并拿到stata中去 run。
《计量经济学软件应用》课程讲义 24
4/17/2014
一个do文件例子
4/17/2014
《计量经济学软件应用》课程讲义
25
良好的习惯2:所有结果操作都记录
在每次数据分析和处理时,最好将每次的分析过程和结果用log命令 记录下来,形成log文件,以便可追踪和回顾你的每次分析。 Log文件格式有smcl, txt等 Log命令: log using filename [, append replace [text|smcl] name(logname)] : Open log file,如log using c:\data\cfland.smcl [,append/replace] log {close|off|on} [logname]:Close log, temporarily suspend logging, or resume logging cmdlog:Report status of command log file cmdlog using filename [, append replace] :Open command log file cmdlog {close|on|off}: Close command log, temporarily suspend logging, or resume logging
《计量经济学软件应用》课程讲义 16
4/17/2014
Set 命令
4/17/2014
《计量经济学软件应用》课程讲义
17
常用set命令
Set:显示系统设置参数 set obs #:设置数据文件的记录(样本)个数,如set obs 100 set matsize # [, permanently]:设置数据文件的变量 最大个数,where 10 < # < 11,000 for Stata/MP and Stata/SE and where 10 < # < 800 for Stata/IC,如set matsize 250; Set maxvar #:也是设置变量最大个数,只用stata/SE; sysdir set :改变stata的系统目录(changes the path to Stata‘s system directories) Sysdir: lists Stata's system directories.
只查找信息的英文关键词。 第1选项:仅在安装文件夹和官方主页 中的FAQs查找;
第2选项:仅在官
方网站和其它网络 资源中上搜索
第3选项:在所有
资源中搜索
4/17/2014 《计量经济学软件应用》课程讲义 22
Help中的stata Command
前提是你知道 你要了解的命 令的命令名。 如regress(reg) 同help #,如 help reg 它会显示你要 查找了命令的 语法结构、参 数、例子
4/17/2014
《计量经济学软件应用》课程讲义
5
Eviews 界面人性化相对较差。使用前,最好熟悉每 个命令操作的程序语言; 数据处理功能弱; 强于时间序列分析,但其它回归分析(如面 板数据分析等)、数据处理、统计分析弱; 软件很小,不占空间,对内存大小要求也很 高; 小块头,小智慧!!
4/17/2014
《计量经济学软件应用》课程讲义
28
Baidu Nhomakorabea
除以上四个默认打开的窗口外,在Stata中还有数据 编辑窗口、程序文件编辑窗口、帮助窗口、绘图窗 口、Log窗口等,如果需要使用,可以用Window或 Help菜单将其打开。
4/17/2014 《计量经济学软件应用》课程讲义
15
使用前先熟悉几个命令
Set命令:显示和设置程序的系统参数,如分配 的可调用内存等; Clear命令:清除内存读取的数据文件和结果; Save命令:保存文件,常用save,replace; Edit命令:数据编辑窗口调出,可编辑; Browse 命令:数据编辑窗口调出,只可浏览, 不可编辑; Exit命令:退出stata程序
《计量经济学软件应用》课程讲义 4
4/17/2014
SPSS 界面人性化,基本如excell,很容易上手; 数据文件最多4096个变量,记录数量由磁盘空 间决定; 强于统计分析,如方差分析,没有稳健方法, 弱于计量分析,缺乏调查数据分析; 程序也比较大 大块头,小智慧!!非真正的计量软件,而是 统计软件
《计量经济学软件应用》课程讲义 18
4/17/2014
命令格式:以regress为例
[by varlist:] regress [depvar [varlist1 [(varlist2)]]] [weight] [if exp] [in range] [, level(#) beta hascons noconstant noheader eform(string) depname(varname) mse1 ] 命令中,[ ]内为选择项,括号外为必选项。 这里介绍命令的公共选择部分,专用选择项将在相应章节作介绍。 by varlist,是指定按变量varlist的取值逐一作多元线性回归。如变量名为 group,且取值为1,2,3,4,则“by group:”是指定Stata分别按 group=1, group=2, group=3和group=4的观察值分别作4个回归方程。在 选用该选择项前,要对变量排序,即先执行sort,如: sort group weight,是指本命令允许使用加权或频数,有[fw=频数变量]和[aw=加权变 量]两种形式。 if exp, 用条件语句指定条件。如,下列条件是合法的: if group==1 /* 对满足group=1条件的观察值进行分析 in range,指定观察值的范围,对在范围内的观察值作分析。下列语句是 合法的: in 1/25 /* 对观察值范围为1~25号的观察值作分析
《计量经济学软件应用》课程讲义 8
4/17/2014
Stata官方主页
4/17/2014
《计量经济学软件应用》课程讲义
9
4/17/2014
《计量经济学软件应用》课程讲义
10
加州大学的资源主页
4/17/2014
《计量经济学软件应用》课程讲义
11
普林斯顿大学的资源主页
4/17/2014
《计量经济学软件应用》课程讲义
《计量经济学软件应用》课程讲义 7
4/17/2014
常用的stata网上资源
官方主页:www.stata.com/support 加州大学:http://www.ats.ucla.edu/stat/ 普林斯顿大学: http://dss.princeton.edu/online_help/stats_packages /stata/stata.htm 人大经济论坛stata专版:www.pinggu.org.cn 中国经济学教育科研网:http://www.cenet.org.cn/ 西安大学连玉君老师个人主页 复旦大学陆铭老师个人主页