STATA与面板数据回归
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
逻辑运算
! ~ | & 不 不 或 和 > < >= <= == != ~=
比较关系
大于 小于 不小于 不大于 等于 不等于 不等于
www.themegallery.com
STATA数据分析基础
数据的初步处理
删除/保留 变量或者观测
• Drop/keep
排序
• Sort与gsort的区别(gsort可以设置排序,多个变量排序) • gsort variable, option(降序在变量前加-)
– Xi: i.year
• _n与_N的区别(_N默认最大值) • 面板数据tsset code year 告诉stata是面板数据,然后使用下面功能
– 滞后算子l. – 差分算子d.
• 截面数据
– 滞后与滞前 [_n+1] [_n-1]
bysort code:gen try1=ruralincome[_n-1] bysort是通过code相同的变量才进行命令
“压缩”数据(如取平均值)
• Collapse
collapse (mean)ruralincome,by(code) Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
数据的初步处理
STATA中常用的operator
• 生成dummy
• 第四部:打开log:
– – – – Cap log close Log using filename Log的暂停和开启,log on/log off 查看log: view d:\stata\data\auto.log
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
do-file
如何写do-file? 规范的do-file应该包括哪些内容
• 第一步:清理内存,clear • 第二步:设定内存,set memory • 第三步:指定路径
– cd: f/research/stata/….
Global libname方便) Use打开文件 (比
– Global libname “文件夹路径”,用$libname代替该路径
www.themegallery.com
STATA数据分析基础
三类文件
数据文件:*.dta 程序文件:*.do
结果文件:*.log
四个窗口和1个程序编辑器
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
STATA的界面
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
Stata的运行方式
菜单操作:
• 执行菜单操作后,在结果窗口能够显示命令行和命令的结 果
命令行操作:
• 在命令窗口中直接写入命令,一次只能写一行命令
程序操作:
• 利用do edit编辑do文件,执行批量的命令
安装文件大小 3G 1CD 94M 25M
3M 90M 100M 21M
R
free
30M
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
Stata是一个用于分析和管理数据的功能强大又小
巧玲珑的实用统计分析软件,由美国计算机资源中
心(Computer Resource Center)研制。从
1985到现在,已连续推出1.1,1.2,1.3,1.4,
1.5,……及2.0,2.1,3.0,3.1,4.0,5.0, 6.0,7.0.,8.0, 9.0.,10.0等多个版本。 Stata里不要修改原始数据,不可恢复
Company Logo 中国科学院农业政策研究中心
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
练习数据处理
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
STATA的描述统计功能
Summarize—最常用的描述统计命令 • 均值、方差、百分位数、最大值、最小值……
www.themegallery.com
STATA数据分析基础
Stata主要功能
数据管理功能 统计分析功能 • 统计分析:描述统计、交叉表格 • 回归分析: OLS, 2SLS, Logit, Probit, Tobit, Heckman, GMM, Panel data, Time series, Survey data • 多变量分析: multivariate regression, cluster analysis, • 抽样和模拟: 绘图功能 编程和矩阵运算功能
如何导出数据
粘贴 使用outsheet命令
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
如何保存数据
Save命令
如何调用数据
Use命令
• Use filename,options
查看内存中的数据
Browse命令 List命令 order命令
Company Logo
பைடு நூலகம்
www.themegallery.com
STATA数据分析基础
数据的初步处理
If语句,in语句和by语句 生成新变量
• generate和egen(egen后面可以跟函数,比generate功能强大)
改名字
• Rename
替换
• Replace
STATA中的逻辑运算符
use final.dta,clear sum
Table—功能强大的表格统计命令(常用) • 多变量表、多变量表…… Tabulate—简写为tab,是table的简化版 Count—数数命令 Correlate—相关系数 Pwcorr—correlate姊妹版 • Corr可以报告协方差,pwcorr可以报告p值(p值表示两变量在多大的显著程度上是
• gsort -year code, generate(order)
合并数据
• Merge(两个或多个文件必须有一个唯一对应的默认值建立链接关系)
save 2004_2006.dta sort year code save,replace file 2004_2006.dta saved use ruralincome.dta,clear sort year code merge year code using 2004_2006.dta 需要检查variables窗口 是不是有1,2 的情况存在,如果存在需要重新检查
• And / or: & / | • 等于“==”,不等于“!=”(负值=)
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
代数运算
+ * / ^ sqrt() ~= + 加 减 乘 除 指数 开方 不等于 字符相加
Company Logo 中国科学院农业政策研究中心
STATA在实证研究中的应用
LOGO
刘永东 中国科学院农业政策研究中心
www.themegallery.com
Outline
1 2 3 4
STATA数据分析基础
简单回归分析及STATA应用
内生性及STATA处理方法
Discrete Choice Model及STATA应用
Company Logo 中国科学院农业政策研究中心
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
Stata软件的特点
Stata功能强大 Stata软件小巧
Stata操作灵活、简单,易学易用
Stata编程语言简单,容易上手 Stata功能更新快
Company Logo 中国科学院农业政策研究中心
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
如何导入数据
直接输入(通过edit窗口) 粘贴数据(通过edit窗口)容易出错 用命令从外部文件导入(insheet命令)
• insheet命令: • Insheet using filename, options • 通过option指定外部文件类型 Excel的sls文件不能直接读取
Review Window
Buttons
Result Window
Variable Window
Command Window
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
STATA的界面
Buttons: open, save, print, open log file, open viewer, bring results window to front, bring graph window to front, open do-file, edit window, browse window, continue, break
– des(显示命令)
label var code "省代码“ label data "农村收入“ des
面板数据与截面数据转换
• Reshape long reshape wide ruralincome,i(code) j(year) 面板到截面 • Reshape wide reshape long ruralincome,i(code) j(year)截面到面板
clear set memory 50m cd "F:\stata seminar\practise data" cap log close log using zheda.log log on use 2006.data use ruralincome.dta,clear sum ruralincome view zheda.log
相关的)
• Corr删除所有缺失值,pwcorr仅删除pairwise中的缺失值
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
STATA的描述统计功能—画图
直方图
• Histogram,options (kden,normal)
分布检验的图形
• • • • QQ图—qnorm,pnorm 对称分布—symplot 均匀分布—quantile 数学变换后的分布检验—qladder
续接数据
• Append
use 2004_2005.dta,clear append using 2006.dta
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
数据的初步处理
贴标签
• Label
– Label data – Label var
www.themegallery.com
STATA数据分析基础
软件名称 SAS SPSS Stata GAUSS 计量经济学专用
Limdep/Nlogit Shazam Eviews Winrat TSP
最新版本 9.1.3 15.0 10.0 8.0
9.0/4.0 10.0 6.0 6.0 5.0
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
练习数据导入
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础
do-file
什么是do-file?
• 通俗来说,do-file就是STATA命令和程序的记事本。
使用do-file的理由?
• 可追溯过往操作 • 可以整合庞杂的命令,减少命令输入 • 便于发现错误
怎么打开do-file?
• Button
Do-file中做注释
• 程序前打*号,换行///
Company Logo 中国科学院农业政策研究中心
www.themegallery.com
STATA数据分析基础