stata-第一章-基本操作幻灯片
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
",replace
replace的作用是,如果文件已存在,则替换 注意stata格式文件的后缀为.dta
9
练习1.1
导入表名为earning的Excel格式数据 检查数据 保存数据为stata数据格式
10
1.2编辑数据
打开stata数据 use "D:\Teach课件\STATA\data\corgov.dta",clear drop命令,删除变量或观察值
菜单窗口
help/pdf document (Stata基本参考手册) help/content (Stata所有命令 介绍) help/stata command (搜索查询Stata命令)
命令窗口
help + stata 命令,例如: help display help help 另外,你也可以利用search命令寻求帮助,例如: search display search help
你可以通过下列菜单调整窗口设置
Edit/preferences Window/command, variables ……
3
display 命令
在命令窗口输入:
display 1 display "song"
试试以下两者的区别:
display "1+1" display 1+1
4
Help 命令
clear,清空所有数据
12
练习1.2
打开stata数据 删除private变量 只保留stkcd year两个变量 删除2008年的数据 只保留2010年的数据 将year变量改名为y 将y的标签设置为年度
13
1.3描述数据
count,看看有多少样本
count count if year==2008
数据
试试browse,list,edit三个命令,看看三者的区别 注意:上述命令也可以通过菜单的方式实现。
8
保存数据
菜单窗口
File/save File/save as(另存为)
命令窗口
save "D:\Teach课件\STATA\data\corgov.dta " save "D:\Teach课件\STATA\data\corgov.dta
drop if year==2010,删除所有2010年的变量 drop year,删除year这个变量 drop _all,删除所有变量
注意:stata值的等号全为双等号,单等号是赋值命令, ຫໍສະໝຸດ Baidu以后的操作中,注意=号和==号的区别。
11
打开stata数据 use "D:\Teach课件\STATA\data\corgov.dta",clear keep命令是drop命令的反向命令
14
练习1.3
用stata打开corgov文件 看看一共有多少家样本 看看2010年一共有多少家样本
keep year topone,删除其它变量,只保留year和topone这 两个变量
keep if year==2010,删除其它年度变量,只保留2010年的 变量
rename,编辑变量名称
rename topone top1
label ,为变量名贴标签,以更容易理解
label var top1 "第一大股东持股比例"
第一章 Stata 基本操作
宋顺林 中央财经大学 会计学院
1
内容提纲
1.1导入数据 1.2编辑数据 1.3描述数据 1.4结果和程序管理 1.5多表数据管理
2
1.1 导入数据
打开Stata软件
STATA由四个窗口构成
Review (列出历史命令) Variables (变量列表) Results (报告结果) Command (输入命令)
在命令窗口输入describe 或 d ,将显示样本、变量数、数据 大小及变量的详细信息。
输入入list, 显示所有样本数据,试试以下命令: list in 1 list in 2/10
输入browse 或br, 在数据窗口浏览所有数据 输入edit,不仅可以数据窗口浏览数据,而且可以编辑和修改
命令窗口
insheet using "D:\Teach课件\STATA\data\corgov.csv ",clear
在知道文件路径的情况下,往往使用insheet命令更为方便 对insheet了解更多, pls help insheet
6
drop _all and clear
首先导入数据
insheet using "D:\Teach课件\STATA\data\corgov.csv ",clear
然后试试以下两个的差别:
insheet using "D:\Teach课件\STATA\data\corgov.csv " insheet using "D:\Teach课件\STATA\data\corgov.csv
summary or sum,描述样本的统计量
sum topone ,描述topone变量最基本统计量,均值、 方差、最小值、最大值
sum topone, d,描述topone变量更为详细的统计量, 包括偏度、峰度、分位数。
tabulate或tab,描述离散变量的基本统计量
tab private,描述private变量为0和1的百分比
",clear
为什么要加clear,原因是:
你必须先清除(clear)原来的数据,才能导入新的数据 你也可以先用drop _all 删除原有数据,然后导入新的数据
7
检查数据
describe ,list,browse,edit
导入数据之后,你可以检查一下数据是否导入成功,有好几种 方式可以帮到你:
5
Insheet:导入数据
通常数据来源于数据库下载,而不是手工录入 导入格式
Stata不能直接支持很多格式(Excel files, SAS files) 可以先保存为csv格式后再导入stata
准备工作:将Excel文件另存为csv格式,然后导入 csv文 件。
菜单窗口
File/import/ASCII data created by spreadsheet /browse file name
replace的作用是,如果文件已存在,则替换 注意stata格式文件的后缀为.dta
9
练习1.1
导入表名为earning的Excel格式数据 检查数据 保存数据为stata数据格式
10
1.2编辑数据
打开stata数据 use "D:\Teach课件\STATA\data\corgov.dta",clear drop命令,删除变量或观察值
菜单窗口
help/pdf document (Stata基本参考手册) help/content (Stata所有命令 介绍) help/stata command (搜索查询Stata命令)
命令窗口
help + stata 命令,例如: help display help help 另外,你也可以利用search命令寻求帮助,例如: search display search help
你可以通过下列菜单调整窗口设置
Edit/preferences Window/command, variables ……
3
display 命令
在命令窗口输入:
display 1 display "song"
试试以下两者的区别:
display "1+1" display 1+1
4
Help 命令
clear,清空所有数据
12
练习1.2
打开stata数据 删除private变量 只保留stkcd year两个变量 删除2008年的数据 只保留2010年的数据 将year变量改名为y 将y的标签设置为年度
13
1.3描述数据
count,看看有多少样本
count count if year==2008
数据
试试browse,list,edit三个命令,看看三者的区别 注意:上述命令也可以通过菜单的方式实现。
8
保存数据
菜单窗口
File/save File/save as(另存为)
命令窗口
save "D:\Teach课件\STATA\data\corgov.dta " save "D:\Teach课件\STATA\data\corgov.dta
drop if year==2010,删除所有2010年的变量 drop year,删除year这个变量 drop _all,删除所有变量
注意:stata值的等号全为双等号,单等号是赋值命令, ຫໍສະໝຸດ Baidu以后的操作中,注意=号和==号的区别。
11
打开stata数据 use "D:\Teach课件\STATA\data\corgov.dta",clear keep命令是drop命令的反向命令
14
练习1.3
用stata打开corgov文件 看看一共有多少家样本 看看2010年一共有多少家样本
keep year topone,删除其它变量,只保留year和topone这 两个变量
keep if year==2010,删除其它年度变量,只保留2010年的 变量
rename,编辑变量名称
rename topone top1
label ,为变量名贴标签,以更容易理解
label var top1 "第一大股东持股比例"
第一章 Stata 基本操作
宋顺林 中央财经大学 会计学院
1
内容提纲
1.1导入数据 1.2编辑数据 1.3描述数据 1.4结果和程序管理 1.5多表数据管理
2
1.1 导入数据
打开Stata软件
STATA由四个窗口构成
Review (列出历史命令) Variables (变量列表) Results (报告结果) Command (输入命令)
在命令窗口输入describe 或 d ,将显示样本、变量数、数据 大小及变量的详细信息。
输入入list, 显示所有样本数据,试试以下命令: list in 1 list in 2/10
输入browse 或br, 在数据窗口浏览所有数据 输入edit,不仅可以数据窗口浏览数据,而且可以编辑和修改
命令窗口
insheet using "D:\Teach课件\STATA\data\corgov.csv ",clear
在知道文件路径的情况下,往往使用insheet命令更为方便 对insheet了解更多, pls help insheet
6
drop _all and clear
首先导入数据
insheet using "D:\Teach课件\STATA\data\corgov.csv ",clear
然后试试以下两个的差别:
insheet using "D:\Teach课件\STATA\data\corgov.csv " insheet using "D:\Teach课件\STATA\data\corgov.csv
summary or sum,描述样本的统计量
sum topone ,描述topone变量最基本统计量,均值、 方差、最小值、最大值
sum topone, d,描述topone变量更为详细的统计量, 包括偏度、峰度、分位数。
tabulate或tab,描述离散变量的基本统计量
tab private,描述private变量为0和1的百分比
",clear
为什么要加clear,原因是:
你必须先清除(clear)原来的数据,才能导入新的数据 你也可以先用drop _all 删除原有数据,然后导入新的数据
7
检查数据
describe ,list,browse,edit
导入数据之后,你可以检查一下数据是否导入成功,有好几种 方式可以帮到你:
5
Insheet:导入数据
通常数据来源于数据库下载,而不是手工录入 导入格式
Stata不能直接支持很多格式(Excel files, SAS files) 可以先保存为csv格式后再导入stata
准备工作:将Excel文件另存为csv格式,然后导入 csv文 件。
菜单窗口
File/import/ASCII data created by spreadsheet /browse file name