stata命令总结
stata常用命令
predict e , residuals 或者 predict e, res 获得残差并把残差定义为 e (**********************)回归的假设检验 (**********************) (**********************)test 命令 (**********************)
regress price mpg weight foreign 1。要求方程省略常数项(自己设置常数项) Reg price mpg weight foreign , nocons (hascons) 2。稳健性估计(一般用于大样本 OLS) Reg price mpg weight foreign , vce (robust) 或者:reg price mpg weight foreign, r (常用的) 3。设置置信区间(默认 95%) reg price mpg weight foreign, level(99)(数字可以变) 4。标准化系数
gen lnu2=ln(u^2) reg lnu2 x1 x2… predict g,xb gen h=exp(g) gen invvar=1/h reg y x1 x2…*aweight=invvar+ (**********************)自相关 (**********************) 考察英国政府如何根据长期利率(r20 )的变化来调整短期利率( rs) ,数据集为 ukrates.dta 回归方程为:
STATA命令应用及详细解释
STATA命令应用及详细解释
1. summarize:该命令用于计算数值变量的描述性统计信息,包括均值、标准差、最小值、最大值等。
2. tabulate:该命令用于生成一个分类变量的频数和百分比表。它
可以计算单个变量的分布情况,也可以计算多个变量之间的交叉分布情况。
3. tabstat:该命令用于生成一个或多个数值变量的汇总统计信息,
包括均值、标准差、中位数等。与summarize命令相比,tabstat命令可
以同时计算多个变量的统计量。
4. regress:该命令用于进行线性回归分析。可以使用regress命令
估计一个自变量和一个或多个因变量之间的线性关系,并生成回归系数、
拟合优度等回归结果。
5. logistic:该命令用于进行逻辑回归分析。逻辑回归分析常用于
二分类问题,可以估计自变量对因变量的影响,并生成回归系数、odds
比等结果。
6. ttest:该命令用于进行两样本独立样本的t检验。可以比较两个
独立样本的均值差异,并计算t值、p值等检验结果。
7. oneway:该命令用于进行单因素方差分析。可以比较不同组别之
间的均值差异,并进行方差齐性检验和多重比较。
8. twoway:该命令用于进行双因素方差分析。可以同时比较两个因
素及其交互作用对均值差异的影响,并进行方差齐性检验和多重比较。
9. nonparametric:该命令用于进行非参数统计分析。包括
Wilcoxon秩和检验、Kruskal-Wallis H检验、Mann-Whitney U检验等非
参数假设检验方法。
10. generate:该命令用于创建一个新的变量,并根据已有变量和运
STATA命令应用及详细解释
STATA命令应用及详细解释
STATA是一种统计软件,被广泛应用于数据分析和统计建模。在STATA中,有许多命令可以用来汇总数据并提取关键统计信息,以便更好
地理解和解释数据。下面将介绍一些常用的STATA命令,并详细解释其用
途和功能。
1. summarize:
summarize命令用于对数值变量进行简单的统计汇总。它会输出变量
的观测数、均值、标准差、最小值、最大值等统计量。
2. tabulate:
tabulate命令用于对分类变量进行频数统计。它会输出每个分类变
量的取值及其频数,并可以计算相对频数和累计频数。
3. descriptives:
descriptives命令可以同时对数值变量和分类变量进行统计汇总。
它会输出每个变量的观测数、缺失值数、均值、标准差、最小值、最大值、频数等统计量。
4. summarizeby:
summarizeby命令可以按照一个或多个分类变量对数值变量进行分组
统计。它会输出每个分类组别的观测数、均值、标准差、最小值、最大值
等统计量。
5. collapse:
collapse命令用于对数据进行折叠操作,将数据按照指定的分类变量进行分组,并计算每组的汇总统计量。它可以用于生成汇总数据集,以便后续分析。
6. bysort:
bysort命令可以按照一个或多个变量对数据进行排序,然后对排序后的数据进行分组统计。它可以与其他命令结合使用,如collapse、egen等。
7. egen:
egen命令可以生成新的衍生变量,该变量可以基于原始数据进行计算。它支持许多统计函数,如均值、标准差、总和、中位数等,并可以按照一个或多个分类变量进行分组计算。
1.STATA常用命令集-中文版
1.STATA常用命令集-中文版
STATA 常用命令集
一、调整变量格式:
format x1 %10.3f ——将x1的列宽固定为10,小数点后取三位format x1 %10.3g ——将x1的列宽固定为10,有效数字取三位format x1 %10.3e ——将x1的列宽固定为10,采用科学计数法format x1 %10.3fc ——将x1的列宽固定为10,小数点后取三位,加入千分位分隔符
format x1 %10.3gc ——将x1的列宽固定为10,有效数字取三位,加入千分位分隔符
format x1 %-10.3gc ——将x1的列宽固定为10,有效数字取三位,加入千分位分隔符,加入“-”表示左对齐。
二、合并数据:
use "C:\Documents and Settings\xks\桌面\2006.dta", clear merge using "C:\Documents and Settings\xks\桌面\1999.dta"
——将1999和2006的数据按照样本(observation)排列的自然顺序合并起来
use "C:\Documents and Settings\xks\桌面\2006.dta", clear merge id using "C:\Documents and Settings\xks\桌面\1999.dta" ,unique sort
——将1999和2006的数据按照唯一的(unique)变量id来合并,在合并时对id进行排序(sort)
建议采用第一种方法。
stata命令大全(全)
*或者
xtdes
tsappend,add(5)/表示在每个省份再追加5年,用于面板数据/
tsset
*或者
tsdes
.tsappend,add(8)/表示追加8年,用于时间序列/
方差分解,比如三个变量Y,X,Z都是面板格式的数据,且满足Y二X+Z求方
差var(Y)协方差Cov(X,Y和Cov(乙Y)
*3.异方差、序列相关和截面相关检验
*4.动态面板模型(DID-GMM,SYS-GMM
*5.面板随机前沿模型
*6.面板协整分析(FMOLSQOLS
***说明:1-5均用STATA软件实现,6用GAUSS软件实现。
*生产效率分析(尤其指TFP:数据包络分析(DEA与随机前沿分析(SFA
***说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者, 侧重于比较C-D与Tran slog生产函数,一步法与两步法的区别。常应用于地区经 济差异、FDI溢出效应(Spillovers Effec)、工业行业效率状况等。
tab id, gen( dum)
list
*回归分析
reg logy logk logl dum*,
est store m_ols
xtreg logy logk logl, fe
est store m_fe
stata命令大全(全)
*********面板数据计量分析与软件实现*********之迟
辟智美创作
说明:以下do文件相当一部份内容来自于中山年夜学连玉君STATA教程,感谢他的贡献.自己做了一定的修改与筛选.
*面板数据模型
* 1.静态面板模型:FE 和RE
* 2.模型选择:FE vs POLS, RE vs POLS, FE vs RE(pols混合最小二乘估计)
* 3.异方差、序列相关和截面相关检验
* 4.静态面板模型(DIDGMM,SYSGMM)
* 6.面板协整分析(FMOLS,DOLS)
*** 说明:15均用STATA软件实现, 6用GAUSS软件实现.
* 生产效率分析(尤其指TFP):数据包络分析(DEA)与随机前沿分析(SFA)
*** 说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者,偏重于比力CD与Translog生产函数,一步法与两步法的区别.常应用于地域经济不同、FDI溢出效应(Spillovers Effect)、工业行业效率状况等.
* 空间计量分析:SLM模型与SEM模型
*说明:STATA与Matlab结合使用.常应用于空间溢出效应
(R&D)、财政分权、处所政府公共行为等.
*
* 一、经常使用的数据处置与作图
*
* 指定面板格式
xtset id year(id为截面名称,year为时间名称)
xtdes /*数据特征*/
xtsum logy h /*数据统计特征*/
sum logy h /*数据统计特征*/
*添加标签或更改变量名
label var h "人力资本"
Stata常用15条命令
【命令1】:导入数据
一般做实证分析使用的是excel中的数据,其后缀名为.xls,需要将其修改为.csv
insheet using name.csv, clear
【命令2】:删除重复变量
sort var1 var2
duplicatesdrop var1 var2, force
【命令3】:合并数据
use data1, clear
merge m:m var1 var2 using data2
drop if _merge==2
drop if _merge==1
drop _merge
【命令4】:描述性统计分析
tabstat var1var2, stat(n min mean median p25 p75 max
sd), if groupvar==0 or 1
输出到word中:
logout, save(name) word replace: tabstat var, stat(n min mean p50 max sd) col(stat)f(%9.2g)
【命令5】:结果输出
安装
ssc install estout, replace
单个回归
reg y x
esttab using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01)
多个回归一起
reg y x1
est store m1
reg y x2
est store m2
esttab m1 m2 using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01)
stata命令大全(全)
********* 面板数据计量分析与软件实现 *********
说明:以下do文件相当一部分内容来自于中山大学连玉君STATA教程,感谢他的贡献。本人做了一定的修改与筛选。
*----------面板数据模型
* 1.静态面板模型:FE 和RE
* 2.模型选择:FE vs POLS, RE vs POLS, FE vs RE (pols混合最小二乘估计) * 3.异方差、序列相关和截面相关检验
* 4.动态面板模型(DID-GMM,SYS-GMM)
* 5.面板随机前沿模型
* 6.面板协整分析(FMOLS,DOLS)
*** 说明:1-5均用STATA软件实现, 6用GAUSS软件实现。
* 生产效率分析(尤其指TFP):数据包络分析(DEA)与随机前沿分析(SFA)
*** 说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者,侧重于比较C-D与Translog生产函数,一步法与两步法的区别。常应用于地区经济差异、FDI 溢出效应(Spillovers Effect)、工业行业效率状况等。
* 空间计量分析:SLM模型与SEM模型
*说明:STATA与Matlab结合使用。常应用于空间溢出效应(R&D)、财政分权、地方政府公共行为等。
* ---------------------------------
* --------一、常用的数据处理与作图-----------
* ---------------------------------
* 指定面板格式
xtset id year (id为截面名称,year为时间名称)
stata命令大全(全)
********* 面板数据计量分析与软件实现 *********
说明:以下do文件相当一部分内容来自于中山大学连玉君STATA教程,感谢他的贡献。本人做了一定的修改与筛选。
*----------面板数据模型
* 1.静态面板模型:FE 和RE
* 2.模型选择:FE vs POLS, RE vs POLS, FE vs RE (pols混合最小二乘估计) * 3.异方差、序列相关和截面相关检验
* 4.动态面板模型(DID-GMM,SYS-GMM)
* 5.面板随机前沿模型
* 6.面板协整分析(FMOLS,DOLS)
*** 说明:1-5均用STATA软件实现, 6用GAUSS软件实现。
* 生产效率分析(尤其指TFP):数据包络分析(DEA)与随机前沿分析(SFA)
*** 说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者,侧重于比较C-D与Translog生产函数,一步法与两步法的区别。常应用于地区经济差异、FDI 溢出效应(Spillovers Effect)、工业行业效率状况等。
* 空间计量分析:SLM模型与SEM模型
*说明:STATA与Matlab结合使用。常应用于空间溢出效应(R&D)、财政分权、地方政府公共行为等。
* ---------------------------------
* --------一、常用的数据处理与作图-----------
* ---------------------------------
* 指定面板格式
xtset id year (id为截面名称,year为时间名称)
Stata基本命令
Stata基本命令
一、描述性统计
命令:sum(var1 var2)
二、独立样本t检验
命令:ttest var1, by(group)
三、回归
(一)检测变量是否需要加对数
1、C-D方程中基本都要加对数,除了0-1的小数和离散变量
命令:gen lnvar1=log(var1),若var1有零值,则gen lnvar1=log(var1+1) 2、其他方程的变量检测
(1)sktest var1,若PT(skewness)>0.05,则呈正态分布,不用加对数(2)ladder var1,若P(chi2)越大,就选这种形式。
(二)构建面板数据
命令:xtset county year
(三)回归
1、随机效应模型
命令:xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005 south north,re 2、固定效应模型(地区变量不需要放进去)
命令:xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005,fe
3、随机效应模型和固定效应模型的结果只能两者选其一,方法是Hausman检验,做法如下:第一步:固定效应模型回归 xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005,fe
第二步:存储固定效应值 est store fe
第三步:随机效应模型回归 xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005 south north,re
stata命令总结
stata命令总结.doc
Stata命令总结
引言
Stata是一款强大的统计分析软件,广泛应用于经济学、社会学、医学等领域。Stata命令是进行数据处理、统计分析、图形展示等操作的基础。本文将对Stata中常用的命令进行总结,以帮助用户更高效地使用Stata进行数据分析。
Stata基础命令
1. 数据管理
导入数据:import excel, import delimited
导出数据:export excel, export delimited
数据集保存:save, saveold
2. 变量管理
创建变量:generate, egen
修改变量:replace
删除变量:drop
3. 数据清洗
数据类型转换:destring, encode, format
缺失值处理:mvdecode, drop if missing()
异常值检测:tabulate, summarize
描述性统计分析
1. 基本统计量
描述性统计:summarize
频率统计:tabulate
相关系数:correlate
2. 分组统计
分组描述:bysort, xtsum 分组汇总:collapse
3. 数据转换
数据长格式:reshape long 数据宽格式:reshape wide 推断性统计分析
1. 假设检验
t检验:ttest
方差分析:anova
卡方检验:tabulate, chi2 2. 回归分析
线性回归:regress
逻辑回归:logit
泊松回归:poisson
3. 时间序列分析
时间序列描述:tsreport
自回归模型:arima
stata常用命令总结
stata常用命令总结
Stata是一种统计分析软件,常用于数据处理、数据分析和统计建模等领域。以下是一些常用的Stata命令的总结:
1. 数据加载与保存:
- `use`:加载Stata数据文件。
- `import`:导入其他文件格式的数据。
- `save`:保存当前数据文件。
- `export`:将数据导出到其他文件格式。
2. 数据处理与变量操作:
- `generate`:创建新变量。
- `replace`:替换变量值。
- `drop`:删除变量或观测。
- `rename`:重命名变量。
- `sort`:对数据进行排序。
- `merge`:合并数据集。
3. 描述性统计与数据分析:
- `summarize`:计算变量的描述性统计量。
- `tabulate`:制表统计。
- `regress`:进行线性回归分析。
- `logit`:进行Logistic回归分析。
- `anova`:进行方差分析。
- `ttest`:进行双样本t检验。
4. 绘图与可视化:
- `histogram`:绘制直方图。
- `scatter`:绘制散点图。
- `line`:绘制折线图。
- `boxplot`:绘制箱线图。
- `graph combine`:组合多个图形。
5. 循环与条件语句:
- `forvalues`:进行循环操作。
- `if`:根据条件进行数据筛选。
- `foreach`:对变量进行循环操作。
这只是一些常用的Stata命令的总结,Stata还有很多其他强大的功能和命令。你可以参考Stata官方文档或其他相关资源,深入了解更多命令和用法。
(完整)stata命令总结,推荐文档
stata11常用命令
注:JB统计量对应的p大于0.05,则表明非正态,这点跟sktest和swilk 检验刚好相反;
dta为数据文件;
gph为图文件;
do为程序文件;
注意stata要区别大小写;
不得用作用户变量名:
_all _n _N _skip _b _coef _cons _pi _pred _rc _weight double
float long int in if using with
命令:
读入数据一种方式
input x y
1 4
2 5.5
3 6.2
4 7.7
5 8.5
end
su/summarise/sum x 或 su/summarise/sum x,d
对分组的描述:
sort group
by group:su x
%%%%%
tabstat economy,stats(max) %返回变量economy的最大值
%%stats括号里可以是:mean,count(非缺失观测值个数),sum(总和),max,min,range,
%% sd,var,cv(变易系数=标准差/均值),skewness,kurtosis,median,p1(1%分位
%% 数,类似地有p10, p25, p50, p75, p95, p99),iqr(interquantile range = p75 – p25)
_all %描述全部
_N 数据库中观察值的总个数。
_n 当前观察值的位置。
_pi 圆周率π的数值。
list
gen/generate %产生数列
egen wagemax=max(wage)
clear
stata命令大全(全)[整理版]
*********面板数据计量分析与软件实现*********
说明:以下do文件相当一部分内容来自于中山大学连玉君STATA教程,感谢他的贡献。本人做了一定的修改与筛选。
*----------面板数据模型
* 1.静态面板模型:FE 和RE
* 2.模型选择:FE vs POLS, RE vs POLS, FE vs RE (pols混合最小二乘估计)
* 3.异方差、序列相关和截面相关检验
* 4.动态面板模型(DID-GMM,SYS-GMM)
* 5.面板随机前沿模型
* 6.面板协整分析(FMOLS,DOLS)
*** 说明:1-5均用STATA软件实现, 6用GAUSS软件实现。
* 生产效率分析(尤其指TFP):数据包络分析(DEA)与随机前沿分析(SFA)
*** 说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者,侧重于比较C-D与Translog 生产函数,一步法与两步法的区别。常应用于地区经济差异、FDI溢出效应(Spillovers Effect)、工业行业效率状况等。
* 空间计量分析:SLM模型与SEM模型
*说明:STATA与Matlab结合使用。常应用于空间溢出效应(R&D)、财政分权、地方政府公共行为等。
* ---------------------------------
* --------一、常用的数据处理与作图-----------
* ---------------------------------
* 指定面板格式
xtset id year (id为截面名称,year为时间名称)
stata常用命令总结
stata常用命令总结
Stata常用命令总结
Stata是一款广泛应用于数据分析与统计建模的统计软件,具有强大的功能和广泛的应用领域。在Stata中,我们可以通过命令来完成数据的读取、整理、分析和可视化等任务。本文将对一些常用的Stata命令进行总结和介绍,以帮助读者更好地理解和应用Stata软件。
一、数据的读取与整理
1. 读取数据文件:
- use 文件名:读取已经存在的Stata数据文件。
- import delimited 文件名:读取以逗号、制表符或其他分隔符分隔的文本文件。
2. 显示数据:
- describe:显示数据文件的基本信息,包括变量名、数
据类型、有效观测数等。
- browse:以表格形式显示数据文件的部分观测值。
3. 数据整理:
- generate 新变量名=计算公式:创建新的变量,并根据
指定公式进行计算。
- egen 新变量名=计算函数:根据指定的计算函数对现有
变量进行计算,并创建新的变量。
二、数据的统计分析与建模
1. 描述性统计:
- summarize 变量名:对指定变量进行描述性统计,包括
均值、标准差、最小值、最大值等。
- tabulate 变量名:生成指定变量的频数表和百分比表。
2. 数据筛选与子集选择:
- keep 如果条件:保留符合条件的观测值,删除不满足条件的观测值。
- drop 如果条件:删除符合条件的观测值,保留不满足条件的观测值。
- qui keep 如果条件:以无输出方式保留符合条件的观测值并生成新数据集。
- qui drop 如果条件:以无输出方式删除符合条件的观测值并生成新数据集。
stata命令大全(全)
********* 面板数据计量分析与软件实现 *********
说明:以下do文件相当一部分内容来自于中山大学连玉君STATA教程,感谢他的贡献。本人做了一定的修改与筛选。
*----------面板数据模型
* 1.静态面板模型:FE 和RE
* 2.模型选择:FE vs POLS, RE vs POLS, FE vs RE (pols混合最小二乘估计) * 3.异方差、序列相关和截面相关检验
* 4.动态面板模型(DID-GMM,SYS-GMM)
* 5.面板随机前沿模型
* 6.面板协整分析(FMOLS,DOLS)
*** 说明:1-5均用STATA软件实现, 6用GAUSS软件实现。
* 生产效率分析(尤其指TFP):数据包络分析(DEA)与随机前沿分析(SFA)
*** 说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者,侧重于比较C-D与Translog生产函数,一步法与两步法的区别。常应用于地区经济差异、FDI 溢出效应(Spillovers Effect)、工业行业效率状况等。
* 空间计量分析:SLM模型与SEM模型
*说明:STATA与Matlab结合使用。常应用于空间溢出效应(R&D)、财政分权、地方政府公共行为等。
* ---------------------------------
* --------一、常用的数据处理与作图-----------
* ---------------------------------
* 指定面板格式
xtset id year (id为截面名称,year为时间名称)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
stata11常用命令
注:JB统计量对应的p大于0.05,则表明非正态,这点跟sktest和swilk 检验刚好相反;
dta为数据文件;
gph为图文件;
do为程序文件;
注意stata要区别大小写;
不得用作用户变量名:
_all _n _N _skip _b _coef _cons _pi _pred _rc _weight double
float long int in if using with
命令:
读入数据一种方式
input x y
1 4
2 5.5
3 6.2
4 7.7
5 8.5
end
su/summarise/sum x 或 su/summarise/sum x,d
对分组的描述:
sort group
by group:su x
%%%%%
tabstat economy,stats(max) %返回变量economy的最大值
%%stats括号里可以是:mean,count(非缺失观测值个数),sum(总和),max,min,range,
%% sd,var,cv(变易系数=标准差/均值),skewness,kurtosis,median,p1(1%分位
%% 数,类似地有p10, p25, p50, p75, p95, p99),iqr(interquantile range = p75 – p25)
_all %描述全部
_N 数据库中观察值的总个数。
_n 当前观察值的位置。
_pi 圆周率π的数值。
list
gen/generate %产生数列
egen wagemax=max(wage)
clear
use
by(分组变量)
set more 1/0
count %计数
gsort +x (升序)
gsort -x (降序)
sort x 升序;并且其它变量顺序会跟着改变
label var y "消费" %添加标签
describe %描述数据文件的整体,包括观测总数,变量总数,生成日期,每个变量的存储类型(storage type),标签(label)
replace x5=2*y if x!=3 %替换变量值
replace age = 25 in 107 %令第107个观测中age为25
rename y2 u %改变变量名
drop in 2 %删除全部变量的第2行
drop if x==. 删去x为缺失值的所有记录
keep if x<2 %保留小于2的数据,其余变量跟随x改变
keep in 2/10 %保留第2-10个数
keep x1-x5 %保留数据库中介于x1和x5间的所有变量 (包括x1和x5),其余变量删除
ci x1 x2,by(group) %算出置信区间,不过先前对group要先排序,即sort group;
%by的意思逐个进行
cii 12 3.816667 0.2710343, level(90) %已知均值,方差,计算90%的置信区间
cii 10 2 %obs=10,mean=2,以二项分布形式,计算置信区间
centile x,centile(2.5 25 50 75 97.5) %取分位数
correlate/corr x y z %相关系数
pwcorr x y,sig %给出原假设r=0的命令
%如果变量非服从正态分布,则spearman x y
regress/reg mean year %回归方程建立 reg y x,noconstant %无常数项predict meanhat %预测拟合值
predict e,residual %得到残差
estat hettest % 异方差检验
dwstat % Durbin-Watson自相关检验
vif % 方差膨胀因子
logit y x1 x2 x3 (y取0或1,是被解释变量,x1-x3是被解释变量) %logit 回归
probit y x1 x2 x3 (y取0或1,是被解释变量,x1-x3是被解释变量) %probit 回归
tobit y x1 x2 x3 (y取值在0和1之间,是被解释变量,x1-x3是被解释变量) %tobit回归
sktest e %残差正态性检验 p>0.05则接受原假设,即服从正态分布;
%% sktest是基于变量的偏度和斜度(正态分布的偏度为0,斜度为3)
swilk x %基于Shapiro-Wilk检验
%%p值越小,越倾向于拒绝零假设,也就是变量越有可能不服从正态分布
xi %生成虚拟变量
tabulat gender,summ(math) %用gender指标对math进行分类,返回两类math 的mean、std、freq
tabulate=tab %gen f=int((shengao-164)/3)*3+164 组距为3
tabulate 变量名 [, generate(新变量) missing nofreq nolabel plot ] %%%%%
generate(新变量) // 按分组变量产生哑变量
nofreq // 不显示频数
nolabel // 不显示数值标记
plot // 显示各组频数图示
missing // 包含缺失值
cell // 显示各小组的构成比(小组之和为 1) column // 按栏显示各组之构成(各栏总计为 1)
row // 按行显示各组之构成(各行总计为 1) %%%%%
求和,求最小?
mod(x,y) %求余数
means %返回三种平均值
di normprob(1.96)
di invnorm(0.05)
di binomial(20,5,0.5)
di invbinomial(20,5,0.5)
di tprob(10,2)
di invt(10.0.05)
di fprob(3,27,1)
di invfprob(3,27,0.05)
di chi2(3,5)
di invchi2(3,0.05)
stack x y z,into(e) %把三列合成一列
xpose,clear %矩阵转置
append using d:\0917.dta %把已打开的文件(x y z)跟0917里的(x y z)合并,是竖向合并,即观察值合并;
merge using D:\0917.dta %把已打开的文件(x y z)跟0917里的(a b)合并,是横向合并,即变量合并;
format x %9.2e %科学记数
format x %9.2f %2位小数
%产生随机数
%1 产生20个在(0,1)区间上均匀分布的随机数uniform()
set seed 100
set obs 20
gen r=uniform()
list