stata操介绍之基础部分(一)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 统计分析:概要统计、交互表 • 回归分析:
OLS, 2SLS, Logit, Probit, Tobit, Heckman, GMM Panel data, Time series, Survey data • 多变量分析: Cluster analysis • 抽样和模拟: Bootstrap, Monte Carlo Simulation
• 数据的输出可通过命令直接输出和使用菜单栏输出: 1、命令输出格式 outsheet [ varlist ] using filename [ if ] [ in ] [ ,opt ] 2、使用菜单栏输出 File>>Export>>Excel spreadsheet(*.xls,*xlsx)>>选中要输出的,设
1.8 Stata窗口介绍
• Stata 的界面主要是由四个窗口构成: 1、结果窗口 2、命令窗口 3、命令回顾窗口 4、变量名窗口 除以上四个默认打开的窗口外,在 Stata 中还有数据编辑窗口、
程序文件编 辑窗口、帮助窗口、绘图窗口、Log 窗口等,如果需要 使用,可以用 Window 或 Help 菜单将其打开。
在第一列输入数据后,Stata
第一列自动命名为var1(x);
在第二列输入数据后,第二列
自动命名为var2(y)……依次
类推。在输入数据后,双击纵 格顶端的变量名栏,可以更改 变量名,并可以在label栏中 注释变量名的含义,点击OK确 认。 数据输入完毕后,单击 preserve键确认所输数据,按 关闭键即可退出编辑器。
6、最后软件安装完成。
7、接下来对软件进行破解,在桌面打开Stata14快捷方式,会弹 出如下对话框。将序列号,授权码,激活码输入到对应框中即可。 序列号:(Seri)10699393 授权码:(Code)4gpp mkha 3yqe 3o9v g1m7 iu6j ou5j 激活码:(Auth)tsrk
在弹出的 对话框中输入:summarize 然后回车,得到与 help summarize,同样的结 果。
• 网络帮助: 如 . net from http://www.stata.com (连接stata官网)
二、Stata使用基础
2.1 Stata命令结构
• Stata的通用命令结构如下:
[ prefix : ] command [ varlist ] [= exp.] [ if exp. ] [ using filename ] [ in range ] [ weight = ] [ , options ]
含义
list
li
describe display summarize tabulate lable
des di, dis sum ta, tab lab
列出变量 rename ren
描述分析 展示变量 统计摘要 列表显示 标签
generate graph regress variable column
数据处理与运算
三、Stata数据处理与运算
本部分讨论的主要对象是数据内部的变量,具体内容就是介绍 Stata处理数据的基础知识与基础技术,其中包括:
变量的名称给定、变量与变量取值标签的设定、变量变量的类 型与储存格式的给定与更改、变量的运算、生成新变量、使用运算 函数等等。此外,Stata还可以用来选择数据中特定的观察个案与变 量。
命令回顾 窗口
结果窗口
命令窗口
变量 名
窗口
• 结果窗口:位于界面右上部,软件运行中的所有信息,如所执行 的命令、执 行结果和出错信息等均在这里列出。窗口中会使用不 同的颜色区分不同的文本, 如白色表示命令,红色表示错误信息。
• 命令窗口:位于结果窗口下方,相当于 DOS 软件中的命令行,此 处用于键 入需要执行的命令,回车后即开始执行,相应的结果则 会在结果窗口中显示出来。
3.拷贝、粘贴方式交互数据 Stata的数据编辑窗口是一个简单的电子表格,可以使用拷贝、粘贴方式直接和EXCEL等软件交互数据, 在数据量不大时,这种方式操作极为方便。
把excel数据导入stata 方法一:拷贝和粘贴方式 先做好excel数据文件, 在stata数据编辑器粘贴,变量名也可以复制过来,应该是最容易的方法。只 有点stata数据编辑器第一格即可复制全部数据。复制会问你是否把第一行作为变量。 方法二:导入的方式 先做好excel数据文件,并以“xml 表格(*.xml)”的形式保存,注意不能以“xml 数据(*.xml)”的形 式保存。而且注意,保存时不能在第一行中输入变量名,只能全部为数据。
3、绘图功能 4、编程和矩阵运算功能
1.3 Stata工作界面
1.4 Stata与其他软件的区别
1.5 工具书、论坛推荐
• Stata工具书: 1、Stata实用教程——王天夫、李博柏著(基础教程) 2、应用Stata做统计分析——汉密尔顿著;郭志刚等译(最全教程)
• Stata学习相关资料 1、经管之家论坛:http://bbs.pinggu.org/forum-67-1.html 2、Stata官方论坛:http://www.stata.com/links/resources.html
Stata 菜单栏简介
包含八项下拉菜单:文件、编辑、数据、绘图、统计分析、用户、窗口及帮助。
1.9 Stata命令输入
• Stata的命令输入方式: 1、点击菜单栏输入命令; 2、在命令窗口输入命令; 3、运行命令程序(利用.do文件);
1.10 Stata文件格式
• Stata常用的文件格式:
gen, g gr reg var col
重命名
新建变量 绘图 回归 变量 列
2.2 输入、输出与存储
• 数据的输入包括三种方法: 1.直接从键盘输入 2.打开已有数据文件 3.拷贝、粘贴方式交互数据
1.直接键盘输入 在Stata中可以使用命令行方式直接建立数据集,首先使用input命令制定相 应的变量名称,然后一次录入数据,最后使用end语句表明数据录入结束。
Stata中有两个命令对于用户寻找与安装命令包相当有用:search 和findit。
通过这两个命令可以找到相关搜索内容中有哪些额外的命令,点 击链接后安装即可。
• 命令包内容图例:
• 用法如下: findit var_2 (search var_2 )
1.12 Stata帮助
• 三种主要途径可获得Stata 帮助: Stata手册; Stata自带帮助; 网络帮助;
术语
含义
术语
含义
prefix
command varlist = exp.
if exp.
命令前缀
命令 变量串 表达式 条件表达式
using filename 使用的文件
in range weight
options
观察个案范围 权重 选项
• Stata常用命令及其缩写
命令或选项 缩写
含义 命令或选项 缩写
• 命令回顾窗口:即 review 窗口,位于界面左上方,所有执行过的 命令会依 次在该窗口中列出,选中某一行单击后命令即被自动拷 贝到命令窗口中;如果需 要重复执行,用鼠标双击相应的命令行 即可。
• 变量名窗口:位于界面左下方,列出当前数据集中的所有变量名 称,。 除以上四个默认打开的窗口外,在 Stata 中还有数据编辑 窗口、程序文件编 辑窗口、帮助窗口、绘图窗口、Log 窗口等, 如果需要使用,可以用 Window 或 Help 菜单将其打开。
2、选中“I accept the....”然后点击“Next”
3、继续点击“NEXT” 。
4、接下来选择安装组件。选中“Stata/MP”.然后点击“Next”.
5、选择安装路径。路径可以自行更改,可以使用默认(路径中不 要含有中文即可),默认路径为:C:\Program Files (x86)\Stata14\
建立两个变量x、y
录入相应的数值
2.用STATA的数据编辑器 ①进入数据编辑器 进入stata界面,在命令栏键入edit或在stata的window下拉菜单中单击data editor 编辑图标 (注意: 是浏览图标,点击后只能浏览,不能编辑)即可进入 stata数据编辑器。 ②数据编辑 stata 数据编辑器界面:此时进入了数据全屏幕编辑状态。
1.6 Stata软件分享(百度网盘)
1.stata14版
• 提取密码:fsqn
2.Stata文档教程
• 提取密码:9x1n
3.Stata视频教程
• 提取密码:ytwm
1.7 Stata安装
1、首先下载文件然后解压。解压完成后双击 “SetupStata14.exe”进行安装。点击“Next”继续。如下图:
3.1 变量与变量值
• Stata变量的命名原则: . 变量名中字符的组成部分为A~Z,a~z、0~9与下划线“ _ ”
,这些字符以外的其他符号不能出现在变量名当中; . 变量名不能以数字作为开始符号; . 变量名区分大小写字母,而且不能识别汉字;
• 变量的取值类型: 1、字符型变量:由特定的字符串构成,用来分辨不同的类型; 2、数值型变量:数值变量的取值由数字构成,参与数字运算; 3、日期型变量:在Stata中,1960 年1 月1 日被认为是第0 天,
置文件名,再点击确认即可(也可以选择其它输出格式)。
• 数据文件的存储: 1、存储在当前工作目录的命令输出格式: save filename [ ,replace] 2、更改工作目录的命令输出格式: save d:\data\undp\ filename
2.3 添加数据标签
• 添加标签包括给文件和变量添加标签,命令格式如下: . label data " label " . label variable varname " label "
它具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件 和程序语言的特点,又在许多方面别具一格。
Stata的突出特点是只占用很少的磁盘空间,输出结果简洁,所选 方法先进,内容较齐全,制作的图形十分精美,可直接被图形处理 软件或字处理软件如WORD等直接调用。
1.2 Swenku.baidu.comata功能
Stata主要功能: 1、数据管理功能 2、统计分析功能
• Stata手册:
Stata手册(英文版)默认存在于安装目录中(可在stata官网或百度下载中文版手册), 共13册,格式为PDF,可通过stata手册查阅相关帮助。
• Stata自带帮助:
1、直接在命令窗口中输入 help var_1 如 . help summarize
2、通过菜单窗口的点选方式获得帮助: 如 . help>>stata command
文件类型
扩展名
数据文件
.dta
命令程序文件
.do
运行程序文件
.ado
帮助文件
.hlp
说明
stata使用的数据
一系列命令的集合
用于完成用户提交的数据处理与统 计分析任务的程序文件
与相应的.ado文件有相同的文件名, 形成一堆文件,并提供在线帮助
1.11 Stata命令包安装
利用Stata做统计分析时,官方提供的命令包并不一定能满足需 求,因此许多研究者编写了大量的非官方命令包(包括.do文件、 .ado文件和帮助文件),使用此类非官方命令包之前需要对其进行 安装。
stata软件简介
• 内容目录
• 第一部分 1、接触Stata 2、Stata使用基础 3、数据处理与运算
• 第二部分 1、Stata制图 2、描述性统计分析 3、线性回归分析 4、时间序列分析 5、面板数据模型
第一部分
一、接触Stata
1.1 Stata简介
Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用 统计分析软件,由美国计算机资源中心(Computer Resource Center )研制。
数据编辑器
注意:
1.如果为某一变量输入的第一个值是一个数字,比如对人口、失业率和预 期寿命这些变量,那么stata便会认为这一列是一个“数值变量”,从此 以后只允许数字作为取值。 2.如果为某一变量第一次输入的是非数值字符,比如像地名的输入(或者 输入了带逗号的数字),那么stata会判断此列是字符串或文本变量。 3.在数据编辑器或数据浏览器中,字符串变量值显示为红色,这将其与数 值变量(黑色)或加标签的数值变量(蓝色)区分开来。
OLS, 2SLS, Logit, Probit, Tobit, Heckman, GMM Panel data, Time series, Survey data • 多变量分析: Cluster analysis • 抽样和模拟: Bootstrap, Monte Carlo Simulation
• 数据的输出可通过命令直接输出和使用菜单栏输出: 1、命令输出格式 outsheet [ varlist ] using filename [ if ] [ in ] [ ,opt ] 2、使用菜单栏输出 File>>Export>>Excel spreadsheet(*.xls,*xlsx)>>选中要输出的,设
1.8 Stata窗口介绍
• Stata 的界面主要是由四个窗口构成: 1、结果窗口 2、命令窗口 3、命令回顾窗口 4、变量名窗口 除以上四个默认打开的窗口外,在 Stata 中还有数据编辑窗口、
程序文件编 辑窗口、帮助窗口、绘图窗口、Log 窗口等,如果需要 使用,可以用 Window 或 Help 菜单将其打开。
在第一列输入数据后,Stata
第一列自动命名为var1(x);
在第二列输入数据后,第二列
自动命名为var2(y)……依次
类推。在输入数据后,双击纵 格顶端的变量名栏,可以更改 变量名,并可以在label栏中 注释变量名的含义,点击OK确 认。 数据输入完毕后,单击 preserve键确认所输数据,按 关闭键即可退出编辑器。
6、最后软件安装完成。
7、接下来对软件进行破解,在桌面打开Stata14快捷方式,会弹 出如下对话框。将序列号,授权码,激活码输入到对应框中即可。 序列号:(Seri)10699393 授权码:(Code)4gpp mkha 3yqe 3o9v g1m7 iu6j ou5j 激活码:(Auth)tsrk
在弹出的 对话框中输入:summarize 然后回车,得到与 help summarize,同样的结 果。
• 网络帮助: 如 . net from http://www.stata.com (连接stata官网)
二、Stata使用基础
2.1 Stata命令结构
• Stata的通用命令结构如下:
[ prefix : ] command [ varlist ] [= exp.] [ if exp. ] [ using filename ] [ in range ] [ weight = ] [ , options ]
含义
list
li
describe display summarize tabulate lable
des di, dis sum ta, tab lab
列出变量 rename ren
描述分析 展示变量 统计摘要 列表显示 标签
generate graph regress variable column
数据处理与运算
三、Stata数据处理与运算
本部分讨论的主要对象是数据内部的变量,具体内容就是介绍 Stata处理数据的基础知识与基础技术,其中包括:
变量的名称给定、变量与变量取值标签的设定、变量变量的类 型与储存格式的给定与更改、变量的运算、生成新变量、使用运算 函数等等。此外,Stata还可以用来选择数据中特定的观察个案与变 量。
命令回顾 窗口
结果窗口
命令窗口
变量 名
窗口
• 结果窗口:位于界面右上部,软件运行中的所有信息,如所执行 的命令、执 行结果和出错信息等均在这里列出。窗口中会使用不 同的颜色区分不同的文本, 如白色表示命令,红色表示错误信息。
• 命令窗口:位于结果窗口下方,相当于 DOS 软件中的命令行,此 处用于键 入需要执行的命令,回车后即开始执行,相应的结果则 会在结果窗口中显示出来。
3.拷贝、粘贴方式交互数据 Stata的数据编辑窗口是一个简单的电子表格,可以使用拷贝、粘贴方式直接和EXCEL等软件交互数据, 在数据量不大时,这种方式操作极为方便。
把excel数据导入stata 方法一:拷贝和粘贴方式 先做好excel数据文件, 在stata数据编辑器粘贴,变量名也可以复制过来,应该是最容易的方法。只 有点stata数据编辑器第一格即可复制全部数据。复制会问你是否把第一行作为变量。 方法二:导入的方式 先做好excel数据文件,并以“xml 表格(*.xml)”的形式保存,注意不能以“xml 数据(*.xml)”的形 式保存。而且注意,保存时不能在第一行中输入变量名,只能全部为数据。
3、绘图功能 4、编程和矩阵运算功能
1.3 Stata工作界面
1.4 Stata与其他软件的区别
1.5 工具书、论坛推荐
• Stata工具书: 1、Stata实用教程——王天夫、李博柏著(基础教程) 2、应用Stata做统计分析——汉密尔顿著;郭志刚等译(最全教程)
• Stata学习相关资料 1、经管之家论坛:http://bbs.pinggu.org/forum-67-1.html 2、Stata官方论坛:http://www.stata.com/links/resources.html
Stata 菜单栏简介
包含八项下拉菜单:文件、编辑、数据、绘图、统计分析、用户、窗口及帮助。
1.9 Stata命令输入
• Stata的命令输入方式: 1、点击菜单栏输入命令; 2、在命令窗口输入命令; 3、运行命令程序(利用.do文件);
1.10 Stata文件格式
• Stata常用的文件格式:
gen, g gr reg var col
重命名
新建变量 绘图 回归 变量 列
2.2 输入、输出与存储
• 数据的输入包括三种方法: 1.直接从键盘输入 2.打开已有数据文件 3.拷贝、粘贴方式交互数据
1.直接键盘输入 在Stata中可以使用命令行方式直接建立数据集,首先使用input命令制定相 应的变量名称,然后一次录入数据,最后使用end语句表明数据录入结束。
Stata中有两个命令对于用户寻找与安装命令包相当有用:search 和findit。
通过这两个命令可以找到相关搜索内容中有哪些额外的命令,点 击链接后安装即可。
• 命令包内容图例:
• 用法如下: findit var_2 (search var_2 )
1.12 Stata帮助
• 三种主要途径可获得Stata 帮助: Stata手册; Stata自带帮助; 网络帮助;
术语
含义
术语
含义
prefix
command varlist = exp.
if exp.
命令前缀
命令 变量串 表达式 条件表达式
using filename 使用的文件
in range weight
options
观察个案范围 权重 选项
• Stata常用命令及其缩写
命令或选项 缩写
含义 命令或选项 缩写
• 命令回顾窗口:即 review 窗口,位于界面左上方,所有执行过的 命令会依 次在该窗口中列出,选中某一行单击后命令即被自动拷 贝到命令窗口中;如果需 要重复执行,用鼠标双击相应的命令行 即可。
• 变量名窗口:位于界面左下方,列出当前数据集中的所有变量名 称,。 除以上四个默认打开的窗口外,在 Stata 中还有数据编辑 窗口、程序文件编 辑窗口、帮助窗口、绘图窗口、Log 窗口等, 如果需要使用,可以用 Window 或 Help 菜单将其打开。
2、选中“I accept the....”然后点击“Next”
3、继续点击“NEXT” 。
4、接下来选择安装组件。选中“Stata/MP”.然后点击“Next”.
5、选择安装路径。路径可以自行更改,可以使用默认(路径中不 要含有中文即可),默认路径为:C:\Program Files (x86)\Stata14\
建立两个变量x、y
录入相应的数值
2.用STATA的数据编辑器 ①进入数据编辑器 进入stata界面,在命令栏键入edit或在stata的window下拉菜单中单击data editor 编辑图标 (注意: 是浏览图标,点击后只能浏览,不能编辑)即可进入 stata数据编辑器。 ②数据编辑 stata 数据编辑器界面:此时进入了数据全屏幕编辑状态。
1.6 Stata软件分享(百度网盘)
1.stata14版
• 提取密码:fsqn
2.Stata文档教程
• 提取密码:9x1n
3.Stata视频教程
• 提取密码:ytwm
1.7 Stata安装
1、首先下载文件然后解压。解压完成后双击 “SetupStata14.exe”进行安装。点击“Next”继续。如下图:
3.1 变量与变量值
• Stata变量的命名原则: . 变量名中字符的组成部分为A~Z,a~z、0~9与下划线“ _ ”
,这些字符以外的其他符号不能出现在变量名当中; . 变量名不能以数字作为开始符号; . 变量名区分大小写字母,而且不能识别汉字;
• 变量的取值类型: 1、字符型变量:由特定的字符串构成,用来分辨不同的类型; 2、数值型变量:数值变量的取值由数字构成,参与数字运算; 3、日期型变量:在Stata中,1960 年1 月1 日被认为是第0 天,
置文件名,再点击确认即可(也可以选择其它输出格式)。
• 数据文件的存储: 1、存储在当前工作目录的命令输出格式: save filename [ ,replace] 2、更改工作目录的命令输出格式: save d:\data\undp\ filename
2.3 添加数据标签
• 添加标签包括给文件和变量添加标签,命令格式如下: . label data " label " . label variable varname " label "
它具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件 和程序语言的特点,又在许多方面别具一格。
Stata的突出特点是只占用很少的磁盘空间,输出结果简洁,所选 方法先进,内容较齐全,制作的图形十分精美,可直接被图形处理 软件或字处理软件如WORD等直接调用。
1.2 Swenku.baidu.comata功能
Stata主要功能: 1、数据管理功能 2、统计分析功能
• Stata手册:
Stata手册(英文版)默认存在于安装目录中(可在stata官网或百度下载中文版手册), 共13册,格式为PDF,可通过stata手册查阅相关帮助。
• Stata自带帮助:
1、直接在命令窗口中输入 help var_1 如 . help summarize
2、通过菜单窗口的点选方式获得帮助: 如 . help>>stata command
文件类型
扩展名
数据文件
.dta
命令程序文件
.do
运行程序文件
.ado
帮助文件
.hlp
说明
stata使用的数据
一系列命令的集合
用于完成用户提交的数据处理与统 计分析任务的程序文件
与相应的.ado文件有相同的文件名, 形成一堆文件,并提供在线帮助
1.11 Stata命令包安装
利用Stata做统计分析时,官方提供的命令包并不一定能满足需 求,因此许多研究者编写了大量的非官方命令包(包括.do文件、 .ado文件和帮助文件),使用此类非官方命令包之前需要对其进行 安装。
stata软件简介
• 内容目录
• 第一部分 1、接触Stata 2、Stata使用基础 3、数据处理与运算
• 第二部分 1、Stata制图 2、描述性统计分析 3、线性回归分析 4、时间序列分析 5、面板数据模型
第一部分
一、接触Stata
1.1 Stata简介
Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用 统计分析软件,由美国计算机资源中心(Computer Resource Center )研制。
数据编辑器
注意:
1.如果为某一变量输入的第一个值是一个数字,比如对人口、失业率和预 期寿命这些变量,那么stata便会认为这一列是一个“数值变量”,从此 以后只允许数字作为取值。 2.如果为某一变量第一次输入的是非数值字符,比如像地名的输入(或者 输入了带逗号的数字),那么stata会判断此列是字符串或文本变量。 3.在数据编辑器或数据浏览器中,字符串变量值显示为红色,这将其与数 值变量(黑色)或加标签的数值变量(蓝色)区分开来。