Stata 自学笔记

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Stata笔记
1.clear
2.input
3.save
e
5.sysuse
6.d/des/desc/describe
7.sum & return list & ereturn list
8.reg
9.clear results
10.matrix
11.type
12.insheet
13.rename
14.infile
15.browse
16.xmluse
press
18.xpose
19.tsset
20.outfile
21.outsheet
22.xmlsave
23.变量
Stata笔记
1.clear
清除内存数据。

数据都是存入内存来计算的,所以在输入大量数据之前,要先清除内存中的数据来释放空间。

删除的不光包括数据,还有变量,以及Data Editor 中的数据。

(就是删除所有数据,什么都不留)
不影响已经存在硬盘上的数据。

(只删除内存中的所有数据)
具体使用方法在下文中有具体例子。

手动输入数据。

可以分五次输入,也可以直接复制到Command 。

input x y x
50 30 20
20 30 50
20 52 60
end
保存数据。

此项如果保存在C 盘可能因为权限不够而报错。

换到其他盘符即可。

save data_name[,replace]
save 名称[,如果之前已经有这个名称,则替换(覆盖)。

]
使用、导入(.dta )数据。

use data_name[,clear]
use “file_path”[,clear]
use url[,clear]
use 名称[,清除。

]
2.input
3.save
e
导入软件安装时自带的数据时用。

sysuse auto,clear
导入汽车数据。

显示数据变量信息。

(名称、类型等等)
describe[,detail]
sum price weight turn
(以刚刚导入的汽车价格数据为例,price weight turn 为变量名称)
显示一些相关信息。

(观察值个数、平均数、最大最小值等等)
5.sysuse
6.d/des/desc/describe
7.sum & return list & ereturn list
return list
return 可以简写为ret
返回更多信息(包括sum 没有显示的)
ereturn list
ereturn 可以简写为eret
返回更详细的信息。

e:estimate,估计
回归分析。

reg price weight turn foreign
reg 变量名
8.reg
清除计算结果。

就是刚才的return/ereturn list 的结果。

但是变量并没有被清除。

再次输入return/ereturn list 会发现已经没有任何输出。

clear results
创建矩阵。

matrix A = I(5)
创建名称为A 的5*5的矩阵。

mat list A
显示A 矩阵。

9.clear results
10.matrix
mat dir
显示有多少矩阵。

clear matrix
清除矩阵。

再次查看矩阵,一经发现没有了。

以下是tab 键为分隔符的数据。

查看文件原始内容形式(.txt )。

导入文件内容。

一定要说明后缀名。

insheet using data.txt,clear
11.type
12.insheet
修改变量名称。

rename old_var_name new_var_name
在导入的时候直接修改变量名称,同时也是批量(一定要对应)。

不用一条条的修改。

insheet a p w t using data.txt,clear
以下是space 键(空格)为分隔符的数据。

直接使用insheet 导入无法识别所有变量,将其视为一个变量。

13.rename
14.infile
如果非要用insheet导入,在最后加上delimiter选项。

就可以正常导入了。

insheet using datas.txt,clear delimiter(” “)
使用infile可以直接导入以空格为分隔符的数据。

而不用指定delimiter。

同时可以指定变量名。

infile p w t using datas.txt,clear
包含字符串的情况下:
直接导入会出现错误。

指定变量名的情况下,也会出现数据遗漏,文字都变成“·”。

infile str20 v1 int v2 int v3 int v4 str10 v5 using strdata.txt,clear str:字符串类型(文字)
int:数值类型(数字)
指定变量类型后,可以顺利导入。

以逗号为分隔符的数据和上面一样。

原始数据:
导入:
infile str20 v1 int v2 int v3 int v4 str10 v5 using ddata.txt,clear
查看数据表内容。

browse
导入excel 文件数据。

旧版方式
xmluse data.xlsx doctype(excel) clear firstrow -
本条命令是错误的
提示无法识别这种文件类型。

xmluse data.xml doctype(excel) clear firstrow
需要将excel 另存为xml 格式。

然后再导入,就可以了。

doctype :指定文件类型,firstrow :第一行作为变量。

新版方式(Stata MP15.0)
import excel using data.xlsx,clear
直接导入excel ,不用更改格式。

15.browse
16.xmluse
精简优化资料的存储结构。

(自动检测变量大小)(自适应)
compress
可以看到优化结果。

同时browse 可以发现name 变量的宽度变小。

对调数据(转置)。

原始数据是横向的。

insheet using xpose.txt,clear
导入数据。

数据是横向的。

press
18.xpose
xpose,clear
要附加clear 选项。

设定变量。

tsset data
设定时间变量。

如图,使用系统数据,然后设定date 为时间变量。

结果显示:
导出数据。

空格为分隔符。

outfile using data_auto, wide replace
wide :解除每行80字符的限制,使每个观察值占一行。

19.tsset
20.outfile
导出部分变量。

outfile make-price foreign using data_auto, wide replace
导出数据。

Tab 键为分隔符。

outsheet make-mpg using data_outsheet,replace
导出数据。

XML 格式。

21.outsheet
22.xmlsave
xmlsave data_xmlsave,doctype(excel) replace
1. 命名规则:
(1)英文字母,数字,下划线组成,长度不超过32。

(2)不能以数字开头。

(3)区分大小写。

(4)尽量不要以_开头(虽然允许)。

2. 查看变量
ds [,has(type int)]
显示所有变量中类型为int 的。

ds [,not(type byte)]
显示所有变量中类型不是byte 的。

ds [,detail]
作用同des 。

23.变量
3. 查看/更改类型
list gear_ratio in 1/5
显示gear_ratio变量前五个。

d gear_ratio
显示gear_ratio变量信息。

下图中,%6.2f:%是定义格式前缀,6是整个变量最长占到6位,2是保留两位小数,f是fix简写,固定的格式。

recast int gear_ratio,force
更改gear_ratio变量类型为int。

force强制更改。

小数信息会丢失。

仍然显示小数是因为显示格式没有改变。

3. list
list price[,sep(int)]
显示price变量和值。

sep:separate 每隔多少行划一道分割线。

默认为5。

0就是没有分割线。

list price in 1/30,sep(0)
显示price前30个值。

sep(0)没有分割线。

sort rep78
以rep78进行排序。

list make price rep78 in 1/20,sepby(rep78)
显示make price rep78前20个,并以rep78的数据划分割线。

list price weight length ,noobs
noobs,不显示结果前面的序号。

方便复制。

list price weight length ,noobs clean
clean,去除边框。

仅显示数据。

相关文档
最新文档