stata 第一章 基本操作
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
insheet using "D:\Teach课件\STATA\data\corgov.csv ",clear
为什么要加clear,原因是:
你必须先清除(clear)原来的数据,才能导入新的数据 你也可以先用drop _all 删除原有数据,然后导入新的数据
检查数据
describe ,list,browse,edit
查查capture有什么功能,help capture 注意:log命令的功能同样可以通过菜单方式实现
用doedit和do命令管理程序
步骤 用doedit打开程序管理窗口 编辑程序,保存程序,运行程序 例子
use "D:\Teach课件\STATA\data\corgov.dta",clear 打开程序:doedit 输入一系列命令: sum topone sum topone,d tab private 保存程序 运行程序:do "D:\Teach课件\STATA\data\do.do"
练习1.3
用stata打开corgov文件
看看一共有多少家样本 看看2010年一共有多少家样本 看看roa变量均值、方差、最小值、最大值是多少 看看roa变量的5%,75%的分位数是多少,偏度是多少 看看2010年private等于1的比例是多少
1.4结果和程序管理
log命令,你可以用log存储命令和结果
Insheet:导入数据
通常数据来源于数据库下载,而不是手工录入 导入格式 Stata不能直接支持很多格式(Excel files, SAS files) 可以先保存为csv格式后再导入stata 准备工作:将Excel文件另存为csv格式,然后导入 csv文件。 菜单窗口 File/import/ASCII data created by spreadsheet /browse file name 命令窗口 insheet using "D:\Teach课件\STATA\data\corgov.csv ",clear 在知道文件路径的情况下,往往使用insheet命令更为方便 对insheet了解更多, pls help insheet
练习1.5
合并corgov99-00和corgov01-10两张表
合并corgov和earning两张表 思考合并 追加命令有何用处?
课后练习
复习练习1.1-练习1.5的内容!
看一看stata的菜单里有些什么选项?
想一想stata的窗口各有些什么功能?
浏览一下stata的帮助里那些内容? 浏览一下stata的手册里有那些内容?
drop _all and clear
首先导入数据
insheet using "D:\Teach课件\STATA\data\corgov.csv ",clear
然后试试以下两个的差别:
insheet using "D:\Teach课件\STATA\data\corgov.csv "
在以后的操作中,注意=号和==号的区别。
打开stata数据 use "D:\Teach课件\STATA\data\corgov.dta",clear keep命令是drop命令的反向命令 keep year topone,删除其它变量,只保留year和topone这两 个变量 keep if year==2010,删除其它年度变量,只保留2010年的变 量 rename,编辑变量名称 rename topone top1 label ,为变量名贴标签,以更容易理解 label var top1 "第一大股东持股比例" clear,清空所有数据
Help 命令
菜单窗口 help/pdf document (Stata基本参考手册) help/content (Stata所有命令 介绍) help/stata command (搜索查询Stata命令) 命令窗口 help + stata 命令,例如: help display help help 另外,你也可以利用search命令寻求帮助,例如: search display search help
你可以通过下列菜单调整窗口设置
Edit/preferences Window/command, variables ……
display 命令
在命令窗口输入: display 1 display "song" 试试以下两者的区别: display "1+1" display 1+1
注意append命令和merge命令区别
思考merge和append命令相对于excel直接copy的优势 使用merge命令时,经常容易出错,merge完后,一定
要检验数据是否正确,可以用browse,也可以tab _merge。常见错误包括: 忘记sort一下数据,合并不成功 忘记添加关键词,导致合并的数据错误 stata的merge功能非常强,可以1:1, 1:m,m:m 详情请help merge
-加行
Name A B name year 2000 2000 Year size Size name A B A B year 2000 2000 2001 2001 size
A
B
2000
2000
我们希望在原始数据基础上增加对样本公司的其他特征的变量----
添列
name
AΒιβλιοθήκη Baidu
name
year
size
注意stata格式文件的后缀为.dta
练习1.1
导入表名为earning的Excel格式数据
检查数据 保存数据为stata数据格式
1.2编辑数据
打开stata数据 use "D:\Teach课件\STATA\data\corgov.dta",clear drop命令,删除变量或观察值 drop if year==2010,删除所有2010年的变量 drop year,删除year这个变量 drop _all,删除所有变量 注意:stata值的等号全为双等号,单等号是赋值命令,
试试browse,list,edit三个命令,看看三者的区别 注意:上述命令也可以通过菜单的方式实现。
保存数据
菜单窗口 File/save File/save as(另存为) 命令窗口 save "D:\Teach课件\STATA\data\corgov.dta " save "D:\Teach课件\STATA\data\corgov.dta ",replace replace的作用是,如果文件已存在,则替换
industry
year
2000
size
name A B
year 2000 2000
industry A B 2000 2000
B
2000
Master data
Using data
Business School of SYSU, 2010 19
1.5多表数据管理
append 命令:数据表之间纵向合并,追加数据 insheet using "D:\Teach课件\STATA\data\corgov99-00.csv ",clear save "D:\Teach课件\STATA\data\corgov99-00.dta ",replace insheet using "D:\Teach课件\STATA\data\corgov01-10.csv ",clear append using "D:\Teach课件\STATA\data\corgov99-00.dta " save "D:\Teach课件\STATA\data\corgov99-10.dta",replace br
宋顺林 中央财经大学 会计学院
内容提纲
1.1导入数据
1.2编辑数据 1.3描述数据
1.4结果和程序管理 1.5多表数据管理
1.1 导入数据
打开Stata软件
STATA由四个窗口构成
Review (列出历史命令)
Variables (变量列表)
Results (报告结果) Command (输入命令)
use "D:\Teach课件\STATA\data\corgov.dta",clear 打开log文件:capture log using “D:\Teach课件
\STATA\data\output.log”,replace sum topone sum topone,d tab private 查看log文件:view “D:\Teach课件\STATA\data\output.log” 关闭log文件:log close
merge命令
数据表之间横向合并,追加新的变量
insheet using "D:\Teach课件\STATA\data\corgov.csv",clear sort stkcd year save "D:\Teach课件\STATA\data\corgov.dta",replace insheet using "D:\Teach课件\STATA\data\earning.csv",clear sort stkcd year merge stkcd year using "D:\Teach课件\STATA\data\corgov.dta" tab _merge(数值为1表示表一有,表二没有;2表示表二有表一没有;3 表示都有) browse save "D:\Teach课件\STATA\data\corfin.dta,replace br help _merge
练习1.2
打开stata数据
删除private变量 只保留stkcd year两个变量
删除2008年的数据
只保留2010年的数据 将year变量改名为y 将y的标签设置为年度
1.3描述数据
count,看看有多少样本 count count if year==2008 summary or sum,描述样本的统计量 sum topone ,描述topone变量最基本统计量,均值、 方差、最小值、最大值 sum topone, d,描述topone变量更为详细的统计量,包 括偏度、峰度、分位数。 tabulate或tab,描述离散变量的基本统计量 tab private,描述private变量为0和1的百分比
导入数据之后,你可以检查一下数据是否导入成功,有好几种
方式可以帮到你: 在命令窗口输入describe 或 d ,将显示样本、变量数、数据大 小及变量的详细信息。 输入入list, 显示所有样本数据,试试以下命令: list in 1 list in 2/10 输入browse 或br, 在数据窗口浏览所有数据 输入edit,不仅可以数据窗口浏览数据,而且可以编辑和修改数 据
思考doedit和do的用处?
练习1.4
建立一个log文件
执行一些操作 用log文件存储你的操作结果 建立一个程序文件(do file) 执行一些操作
用do命令运行你的程序文件
1.3 多组数据处理
1.3 多组数据处理
整理数据过程中,我们经常会遇到两种情况
我们希望在2000年的数据表后面加上2001年相同变量的样本数据---
为什么要加clear,原因是:
你必须先清除(clear)原来的数据,才能导入新的数据 你也可以先用drop _all 删除原有数据,然后导入新的数据
检查数据
describe ,list,browse,edit
查查capture有什么功能,help capture 注意:log命令的功能同样可以通过菜单方式实现
用doedit和do命令管理程序
步骤 用doedit打开程序管理窗口 编辑程序,保存程序,运行程序 例子
use "D:\Teach课件\STATA\data\corgov.dta",clear 打开程序:doedit 输入一系列命令: sum topone sum topone,d tab private 保存程序 运行程序:do "D:\Teach课件\STATA\data\do.do"
练习1.3
用stata打开corgov文件
看看一共有多少家样本 看看2010年一共有多少家样本 看看roa变量均值、方差、最小值、最大值是多少 看看roa变量的5%,75%的分位数是多少,偏度是多少 看看2010年private等于1的比例是多少
1.4结果和程序管理
log命令,你可以用log存储命令和结果
Insheet:导入数据
通常数据来源于数据库下载,而不是手工录入 导入格式 Stata不能直接支持很多格式(Excel files, SAS files) 可以先保存为csv格式后再导入stata 准备工作:将Excel文件另存为csv格式,然后导入 csv文件。 菜单窗口 File/import/ASCII data created by spreadsheet /browse file name 命令窗口 insheet using "D:\Teach课件\STATA\data\corgov.csv ",clear 在知道文件路径的情况下,往往使用insheet命令更为方便 对insheet了解更多, pls help insheet
练习1.5
合并corgov99-00和corgov01-10两张表
合并corgov和earning两张表 思考合并 追加命令有何用处?
课后练习
复习练习1.1-练习1.5的内容!
看一看stata的菜单里有些什么选项?
想一想stata的窗口各有些什么功能?
浏览一下stata的帮助里那些内容? 浏览一下stata的手册里有那些内容?
drop _all and clear
首先导入数据
insheet using "D:\Teach课件\STATA\data\corgov.csv ",clear
然后试试以下两个的差别:
insheet using "D:\Teach课件\STATA\data\corgov.csv "
在以后的操作中,注意=号和==号的区别。
打开stata数据 use "D:\Teach课件\STATA\data\corgov.dta",clear keep命令是drop命令的反向命令 keep year topone,删除其它变量,只保留year和topone这两 个变量 keep if year==2010,删除其它年度变量,只保留2010年的变 量 rename,编辑变量名称 rename topone top1 label ,为变量名贴标签,以更容易理解 label var top1 "第一大股东持股比例" clear,清空所有数据
Help 命令
菜单窗口 help/pdf document (Stata基本参考手册) help/content (Stata所有命令 介绍) help/stata command (搜索查询Stata命令) 命令窗口 help + stata 命令,例如: help display help help 另外,你也可以利用search命令寻求帮助,例如: search display search help
你可以通过下列菜单调整窗口设置
Edit/preferences Window/command, variables ……
display 命令
在命令窗口输入: display 1 display "song" 试试以下两者的区别: display "1+1" display 1+1
注意append命令和merge命令区别
思考merge和append命令相对于excel直接copy的优势 使用merge命令时,经常容易出错,merge完后,一定
要检验数据是否正确,可以用browse,也可以tab _merge。常见错误包括: 忘记sort一下数据,合并不成功 忘记添加关键词,导致合并的数据错误 stata的merge功能非常强,可以1:1, 1:m,m:m 详情请help merge
-加行
Name A B name year 2000 2000 Year size Size name A B A B year 2000 2000 2001 2001 size
A
B
2000
2000
我们希望在原始数据基础上增加对样本公司的其他特征的变量----
添列
name
AΒιβλιοθήκη Baidu
name
year
size
注意stata格式文件的后缀为.dta
练习1.1
导入表名为earning的Excel格式数据
检查数据 保存数据为stata数据格式
1.2编辑数据
打开stata数据 use "D:\Teach课件\STATA\data\corgov.dta",clear drop命令,删除变量或观察值 drop if year==2010,删除所有2010年的变量 drop year,删除year这个变量 drop _all,删除所有变量 注意:stata值的等号全为双等号,单等号是赋值命令,
试试browse,list,edit三个命令,看看三者的区别 注意:上述命令也可以通过菜单的方式实现。
保存数据
菜单窗口 File/save File/save as(另存为) 命令窗口 save "D:\Teach课件\STATA\data\corgov.dta " save "D:\Teach课件\STATA\data\corgov.dta ",replace replace的作用是,如果文件已存在,则替换
industry
year
2000
size
name A B
year 2000 2000
industry A B 2000 2000
B
2000
Master data
Using data
Business School of SYSU, 2010 19
1.5多表数据管理
append 命令:数据表之间纵向合并,追加数据 insheet using "D:\Teach课件\STATA\data\corgov99-00.csv ",clear save "D:\Teach课件\STATA\data\corgov99-00.dta ",replace insheet using "D:\Teach课件\STATA\data\corgov01-10.csv ",clear append using "D:\Teach课件\STATA\data\corgov99-00.dta " save "D:\Teach课件\STATA\data\corgov99-10.dta",replace br
宋顺林 中央财经大学 会计学院
内容提纲
1.1导入数据
1.2编辑数据 1.3描述数据
1.4结果和程序管理 1.5多表数据管理
1.1 导入数据
打开Stata软件
STATA由四个窗口构成
Review (列出历史命令)
Variables (变量列表)
Results (报告结果) Command (输入命令)
use "D:\Teach课件\STATA\data\corgov.dta",clear 打开log文件:capture log using “D:\Teach课件
\STATA\data\output.log”,replace sum topone sum topone,d tab private 查看log文件:view “D:\Teach课件\STATA\data\output.log” 关闭log文件:log close
merge命令
数据表之间横向合并,追加新的变量
insheet using "D:\Teach课件\STATA\data\corgov.csv",clear sort stkcd year save "D:\Teach课件\STATA\data\corgov.dta",replace insheet using "D:\Teach课件\STATA\data\earning.csv",clear sort stkcd year merge stkcd year using "D:\Teach课件\STATA\data\corgov.dta" tab _merge(数值为1表示表一有,表二没有;2表示表二有表一没有;3 表示都有) browse save "D:\Teach课件\STATA\data\corfin.dta,replace br help _merge
练习1.2
打开stata数据
删除private变量 只保留stkcd year两个变量
删除2008年的数据
只保留2010年的数据 将year变量改名为y 将y的标签设置为年度
1.3描述数据
count,看看有多少样本 count count if year==2008 summary or sum,描述样本的统计量 sum topone ,描述topone变量最基本统计量,均值、 方差、最小值、最大值 sum topone, d,描述topone变量更为详细的统计量,包 括偏度、峰度、分位数。 tabulate或tab,描述离散变量的基本统计量 tab private,描述private变量为0和1的百分比
导入数据之后,你可以检查一下数据是否导入成功,有好几种
方式可以帮到你: 在命令窗口输入describe 或 d ,将显示样本、变量数、数据大 小及变量的详细信息。 输入入list, 显示所有样本数据,试试以下命令: list in 1 list in 2/10 输入browse 或br, 在数据窗口浏览所有数据 输入edit,不仅可以数据窗口浏览数据,而且可以编辑和修改数 据
思考doedit和do的用处?
练习1.4
建立一个log文件
执行一些操作 用log文件存储你的操作结果 建立一个程序文件(do file) 执行一些操作
用do命令运行你的程序文件
1.3 多组数据处理
1.3 多组数据处理
整理数据过程中,我们经常会遇到两种情况
我们希望在2000年的数据表后面加上2001年相同变量的样本数据---