STATA与面板数据回归

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖如何导入数据
▪ 直接输入(通过edit窗口) ▪ 粘贴数据(通过edit窗口)容易出错 ▪ 用命令从外部文件导入(insheet命令)
• insheet命令: • Insheet using filename, options • 通过option指定外部文件类型 Excel的sls文件不能直接读取
▪ 使用do-file的理由?
• 可追溯过往操作 • 可以整合庞杂的命令,减少命令输入 • 便于发现错误
▪ 怎么打开do-file?
• Button
▪ Do-file中做注释
• 程序前打*号,换行///
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
• 第四部:打开log:
– Cap log close – Log using filename – Log的暂停和开启,log on/log off – 查看log: view d:\stata\data\auto.log
中国科学院农业Co政m策pa研ny究L中og心o
❖ clear ❖ set memory 50m ❖ cd "F:\stata seminar\practise data"
相关的)
• Corr删除所有缺失值,pwcorr仅删除pairwise中的缺失值
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖ STATA的描述统计功能—画图
▪ 直方图
• Histogram,options (kden,normal)
❖ do-file
▪ 如何写do-file? ▪ 规范的do-file应该包括哪些内容
• 第一步:清理内存,clear • 第二步:设定内存,set memory • 第三步:指定路径
– cd: f/research/stata/…. Use打开文件 (比
Global libname方便)
– Global libname “文件夹路径”,用$libname代替该路径
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖练习数据导入
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖ do-file
▪ 什么是do-file?
• 通俗来说,do-file就是STATA命令和程序的记事本。
– des(显示命令)
label var code "省代码“ label data "农村收入“ des
▪ 面板数据与截面数据转换
• Reshape long reshape wide ruralincome,i(code) j(year) 面板到截面 • Reshape wide reshape long ruralincome,i(code) j(year)截面到面板
▪ “压缩”数据(如取平均值)
• Collapse collapse (mean)ruralincome,by(code)
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖数据的初步处理
▪ STATA中常用ห้องสมุดไป่ตู้operator
• 生成dummy
Variable Window
www.themegallery.com
STATA数据分析基础
Buttons
Result Window
Command Window
中国科学院农业Co政m策pa研ny究L中og心o
❖ STATA的界面
www.themegallery.com
STATA数据分析基础
❖Buttons: open, save, print, open log file, open viewer, bring results window to front, bring graph window to front, open do-file, edit window, browse window, continue, break
▪ 合并数据 • Merge(两个或多个文件必须有一个唯一对应的默认值建立链接关系)
save 2004_2006.dta sort year code save,replace file 2004_2006.dta saved use ruralincome.dta,clear sort year code merge year code using 2004_2006.dta 需要检查variables窗口 是不是有1,2 的情况存在,如果存在需要重新检查
use final.dta,clear sum
▪ Table—功能强大的表格统计命令(常用) • 多变量表、多变量表……
▪ Tabulate—简写为tab,是table的简化版 ▪ Count—数数命令 ▪ Correlate—相关系数 ▪ Pwcorr—correlate姊妹版
• Corr可以报告协方差,pwcorr可以报告p值(p值表示两变量在多大的显著程度上是
– Xi: i.year
• _n与_N的区别(_N默认最大值) • 面板数据tsset code year 告诉stata是面板数据,然后使用下面功能
– 滞后算子l. – 差分算子d.
• 截面数据
– 滞后与滞前 [_n+1] [_n-1]
bysort code:gen try1=ruralincome[_n-1] bysort是通过code相同的变量才进行命令
中国科学院农业Co政m策pa研ny究L中og心o
代数运算
+

-

*

/

^
指数
sqrt()
开方
~=
不等于
+
字符相加
www.themegallery.com
STATA数据分析基础
逻辑运算


~

|

&

比较关系
>
大于
<
小于
>=
不小于
<=
不大于
==
等于
!=
不等于
~=
不等于
中国科学院农业Co政m策pa研ny究L中og心o
▪ 续接数据 • Append
use 2004_2005.dta,clear append using 2006.dta
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖数据的初步处理
▪ 贴标签
• Label
– Label data – Label var
www.themegallery.com
STATA数据分析基础
❖ 数据的初步处理
▪ 删除/保留 变量或者观测 • Drop/keep
▪ 排序 • Sort与gsort的区别(gsort可以设置排序,多个变量排序) • gsort variable, option(降序在变量前加-)
• gsort -year code, generate(order)
❖ 软件名称 ❖ SAS ❖ SPSS ❖ Stata ❖ GAUSS ❖ 计量经济学专用
▪ Limdep/Nlogit ▪ Shazam ▪ Eviews ▪ Winrat ▪ TSP
❖R
www.themegallery.com
STATA数据分析基础
最新版本 9.1.3 15.0 10.0
8.0
❖如何导出数据
▪ 粘贴 ▪ 使用outsheet命令
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖如何保存数据
▪ Save命令
❖如何调用数据
▪ Use命令
• Use filename,options
❖查看内存中的数据
▪ Browse命令 ▪ List命令 ▪ order命令
安装文件大小 3G 1CD 94M 25M
9.0/4.0 10.0 6.0 6.0 5.0
free
3M 90M 100M 21M
30M
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖ Stata是一个用于分析和管理数据的功能强大又小 巧玲珑的实用统计分析软件,由美国计算机资源中 心(Computer Resource Center)研制。从 1985到现在,已连续推出1.1,1.2,1.3,1.4, 1.5,……及2.0,2.1,3.0,3.1,4.0,5.0, 6.0,7.0.,8.0, 9.0.,10.0等多个版本。
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖ Stata的运行方式
▪ 菜单操作:
• 执行菜单操作后,在结果窗口能够显示命令行和命令的结 果
▪ 命令行操作:
• 在命令窗口中直接写入命令,一次只能写一行命令
▪ 程序操作:
• 利用do edit编辑do文件,执行批量的命令
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖练习数据处理
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖ STATA的描述统计功能
▪ Summarize—最常用的描述统计命令 • 均值、方差、百分位数、最大值、最小值……
STATA在实证研究中的应用
LOGO
刘永东 中国科学院农业政策研究中心
www.themegallery.com
Outline
1
STATA数据分析基础
2
简单回归分析及STATA应用
3
内生性及STATA处理方法
4 Discrete Choice Model及STATA应用
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖数据的初步处理
▪ If语句,in语句和by语句 ▪ 生成新变量
• generate和egen(egen后面可以跟函数,比generate功能强大)
▪ 改名字
• Rename
▪ 替换
• Replace
▪ STATA中的逻辑运算符
• And / or: & / | • 等于“==”,不等于“!=”(负值=)
❖ cap log close ❖ log using zheda.log ❖ log on
❖ use 2006.data ❖ use ruralincome.dta,clear ❖ sum ruralincome
❖ view zheda.log
www.themegallery.com
Company Logo
Stata里不要修改原始数据,不可恢复
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖ Stata主要功能
▪ 数据管理功能 ▪ 统计分析功能
• 统计分析:描述统计、交叉表格 • 回归分析:
OLS, 2SLS, Logit, Probit, Tobit, Heckman, GMM, Panel data, Time series, Survey data • 多变量分析:
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖三类文件
▪ 数据文件:*.dta ▪ 程序文件:*.do ▪ 结果文件:*.log
❖ 四个窗口和1个程序编辑器
中国科学院农业Co政m策pa研ny究L中og心o
❖ STATA的界面
Review Window
▪ 分布检验的图形
• QQ图—qnorm,pnorm • 对称分布—symplot • 均匀分布—quantile • 数学变换后的分布检验—qladder
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
multivariate regression, cluster analysis, • 抽样和模拟: ▪ 绘图功能 ▪ 编程和矩阵运算功能
中国科学院农业Co政m策pa研ny究L中og心o
www.themegallery.com
STATA数据分析基础
❖ Stata软件的特点
▪ Stata功能强大 ▪ Stata软件小巧 ▪ Stata操作灵活、简单,易学易用 ▪ Stata编程语言简单,容易上手 ▪ Stata功能更新快
相关文档
最新文档