stata命令总结

合集下载

stata常用命令

stata常用命令

predict e , residuals 或者 predict e, res 获得残差并把残差定义为 e (**********************)回归的假设检验 (**********************) (**********************)test 命令 (**********************)
regress price mpg weight foreign 1。要求方程省略常数项(自己设置常数项) Reg price mpg weight foreign , nocons (hascons) 2。稳健性估计(一般用于大样本 OLS) Reg price mpg weight foreign , vce (robust) 或者:reg price mpg weight foreign, r (常用的) 3。设置置信区间(默认 95%) reg price mpg weight foreign, level(99)(数字可以变) 4。标准化系数

gen lnu2=ln(u^2) reg lnu2 x1 x2… predict g,xb gen h=exp(g) gen invvar=1/h reg y x1 x2…*aweight=invvar+ (**********************)自相关 (**********************) 考察英国政府如何根据长期利率(r20 )的变化来调整短期利率( rs) ,数据集为 ukrates.dta 回归方程为:

STATA命令应用及详细解释

STATA命令应用及详细解释

STATA命令应用及详细解释

1. summarize:该命令用于计算数值变量的描述性统计信息,包括均值、标准差、最小值、最大值等。

2. tabulate:该命令用于生成一个分类变量的频数和百分比表。它

可以计算单个变量的分布情况,也可以计算多个变量之间的交叉分布情况。

3. tabstat:该命令用于生成一个或多个数值变量的汇总统计信息,

包括均值、标准差、中位数等。与summarize命令相比,tabstat命令可

以同时计算多个变量的统计量。

4. regress:该命令用于进行线性回归分析。可以使用regress命令

估计一个自变量和一个或多个因变量之间的线性关系,并生成回归系数、

拟合优度等回归结果。

5. logistic:该命令用于进行逻辑回归分析。逻辑回归分析常用于

二分类问题,可以估计自变量对因变量的影响,并生成回归系数、odds

比等结果。

6. ttest:该命令用于进行两样本独立样本的t检验。可以比较两个

独立样本的均值差异,并计算t值、p值等检验结果。

7. oneway:该命令用于进行单因素方差分析。可以比较不同组别之

间的均值差异,并进行方差齐性检验和多重比较。

8. twoway:该命令用于进行双因素方差分析。可以同时比较两个因

素及其交互作用对均值差异的影响,并进行方差齐性检验和多重比较。

9. nonparametric:该命令用于进行非参数统计分析。包括

Wilcoxon秩和检验、Kruskal-Wallis H检验、Mann-Whitney U检验等非

参数假设检验方法。

10. generate:该命令用于创建一个新的变量,并根据已有变量和运

STATA命令应用及详细解释

STATA命令应用及详细解释

STATA命令应用及详细解释

STATA是一种统计软件,被广泛应用于数据分析和统计建模。在STATA中,有许多命令可以用来汇总数据并提取关键统计信息,以便更好

地理解和解释数据。下面将介绍一些常用的STATA命令,并详细解释其用

途和功能。

1. summarize:

summarize命令用于对数值变量进行简单的统计汇总。它会输出变量

的观测数、均值、标准差、最小值、最大值等统计量。

2. tabulate:

tabulate命令用于对分类变量进行频数统计。它会输出每个分类变

量的取值及其频数,并可以计算相对频数和累计频数。

3. descriptives:

descriptives命令可以同时对数值变量和分类变量进行统计汇总。

它会输出每个变量的观测数、缺失值数、均值、标准差、最小值、最大值、频数等统计量。

4. summarizeby:

summarizeby命令可以按照一个或多个分类变量对数值变量进行分组

统计。它会输出每个分类组别的观测数、均值、标准差、最小值、最大值

等统计量。

5. collapse:

collapse命令用于对数据进行折叠操作,将数据按照指定的分类变量进行分组,并计算每组的汇总统计量。它可以用于生成汇总数据集,以便后续分析。

6. bysort:

bysort命令可以按照一个或多个变量对数据进行排序,然后对排序后的数据进行分组统计。它可以与其他命令结合使用,如collapse、egen等。

7. egen:

egen命令可以生成新的衍生变量,该变量可以基于原始数据进行计算。它支持许多统计函数,如均值、标准差、总和、中位数等,并可以按照一个或多个分类变量进行分组计算。

1.STATA常用命令集-中文版

1.STATA常用命令集-中文版

1.STATA常用命令集-中文版

STATA 常用命令集

一、调整变量格式:

format x1 %10.3f ——将x1的列宽固定为10,小数点后取三位format x1 %10.3g ——将x1的列宽固定为10,有效数字取三位format x1 %10.3e ——将x1的列宽固定为10,采用科学计数法format x1 %10.3fc ——将x1的列宽固定为10,小数点后取三位,加入千分位分隔符

format x1 %10.3gc ——将x1的列宽固定为10,有效数字取三位,加入千分位分隔符

format x1 %-10.3gc ——将x1的列宽固定为10,有效数字取三位,加入千分位分隔符,加入“-”表示左对齐。

二、合并数据:

use "C:\Documents and Settings\xks\桌面\2006.dta", clear merge using "C:\Documents and Settings\xks\桌面\1999.dta"

——将1999和2006的数据按照样本(observation)排列的自然顺序合并起来

use "C:\Documents and Settings\xks\桌面\2006.dta", clear merge id using "C:\Documents and Settings\xks\桌面\1999.dta" ,unique sort

——将1999和2006的数据按照唯一的(unique)变量id来合并,在合并时对id进行排序(sort)

建议采用第一种方法。

stata命令大全(全)

stata命令大全(全)
xtset id year
*或者
xtdes
tsappend,add(5)/表示在每个省份再追加5年,用于面板数据/
tsset
*或者
tsdes
.tsappend,add(8)/表示追加8年,用于时间序列/
方差分解,比如三个变量Y,X,Z都是面板格式的数据,且满足Y二X+Z求方
差var(Y)协方差Cov(X,Y和Cov(乙Y)
*3.异方差、序列相关和截面相关检验
*4.动态面板模型(DID-GMM,SYS-GMM
*5.面板随机前沿模型
*6.面板协整分析(FMOLSQOLS
***说明:1-5均用STATA软件实现,6用GAUSS软件实现。
*生产效率分析(尤其指TFP:数据包络分析(DEA与随机前沿分析(SFA
***说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者, 侧重于比较C-D与Tran slog生产函数,一步法与两步法的区别。常应用于地区经 济差异、FDI溢出效应(Spillovers Effec)、工业行业效率状况等。
tab id, gen( dum)
list
*回归分析
reg logy logk logl dum*,
est store m_ols
xtreg logy logk logl, fe
est store m_fe

stata命令大全(全)

stata命令大全(全)

*********面板数据计量分析与软件实现*********之迟

辟智美创作

说明:以下do文件相当一部份内容来自于中山年夜学连玉君STATA教程,感谢他的贡献.自己做了一定的修改与筛选.

*面板数据模型

* 1.静态面板模型:FE 和RE

* 2.模型选择:FE vs POLS, RE vs POLS, FE vs RE(pols混合最小二乘估计)

* 3.异方差、序列相关和截面相关检验

* 4.静态面板模型(DIDGMM,SYSGMM)

* 6.面板协整分析(FMOLS,DOLS)

*** 说明:15均用STATA软件实现, 6用GAUSS软件实现.

* 生产效率分析(尤其指TFP):数据包络分析(DEA)与随机前沿分析(SFA)

*** 说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者,偏重于比力CD与Translog生产函数,一步法与两步法的区别.常应用于地域经济不同、FDI溢出效应(Spillovers Effect)、工业行业效率状况等.

* 空间计量分析:SLM模型与SEM模型

*说明:STATA与Matlab结合使用.常应用于空间溢出效应

(R&D)、财政分权、处所政府公共行为等.

*

* 一、经常使用的数据处置与作图

*

* 指定面板格式

xtset id year(id为截面名称,year为时间名称)

xtdes /*数据特征*/

xtsum logy h /*数据统计特征*/

sum logy h /*数据统计特征*/

*添加标签或更改变量名

label var h "人力资本"

Stata常用15条命令

Stata常用15条命令

【命令1】:导入数据

一般做实证分析使用的是excel中的数据,其后缀名为.xls,需要将其修改为.csv

insheet using name.csv, clear

【命令2】:删除重复变量

sort var1 var2

duplicatesdrop var1 var2, force

【命令3】:合并数据

use data1, clear

merge m:m var1 var2 using data2

drop if _merge==2

drop if _merge==1

drop _merge

【命令4】:描述性统计分析

tabstat var1var2, stat(n min mean median p25 p75 max

sd), if groupvar==0 or 1

输出到word中:

logout, save(name) word replace: tabstat var, stat(n min mean p50 max sd) col(stat)f(%9.2g)

【命令5】:结果输出

安装

ssc install estout, replace

单个回归

reg y x

esttab using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01)

多个回归一起

reg y x1

est store m1

reg y x2

est store m2

esttab m1 m2 using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01)

stata命令大全(全)

stata命令大全(全)

********* 面板数据计量分析与软件实现 *********

说明:以下do文件相当一部分内容来自于中山大学连玉君STATA教程,感谢他的贡献。本人做了一定的修改与筛选。

*----------面板数据模型

* 1.静态面板模型:FE 和RE

* 2.模型选择:FE vs POLS, RE vs POLS, FE vs RE (pols混合最小二乘估计) * 3.异方差、序列相关和截面相关检验

* 4.动态面板模型(DID-GMM,SYS-GMM)

* 5.面板随机前沿模型

* 6.面板协整分析(FMOLS,DOLS)

*** 说明:1-5均用STATA软件实现, 6用GAUSS软件实现。

* 生产效率分析(尤其指TFP):数据包络分析(DEA)与随机前沿分析(SFA)

*** 说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者,侧重于比较C-D与Translog生产函数,一步法与两步法的区别。常应用于地区经济差异、FDI 溢出效应(Spillovers Effect)、工业行业效率状况等。

* 空间计量分析:SLM模型与SEM模型

*说明:STATA与Matlab结合使用。常应用于空间溢出效应(R&D)、财政分权、地方政府公共行为等。

* ---------------------------------

* --------一、常用的数据处理与作图-----------

* ---------------------------------

* 指定面板格式

xtset id year (id为截面名称,year为时间名称)

stata命令大全(全)

stata命令大全(全)

********* 面板数据计量分析与软件实现 *********

说明:以下do文件相当一部分内容来自于中山大学连玉君STATA教程,感谢他的贡献。本人做了一定的修改与筛选。

*----------面板数据模型

* 1.静态面板模型:FE 和RE

* 2.模型选择:FE vs POLS, RE vs POLS, FE vs RE (pols混合最小二乘估计) * 3.异方差、序列相关和截面相关检验

* 4.动态面板模型(DID-GMM,SYS-GMM)

* 5.面板随机前沿模型

* 6.面板协整分析(FMOLS,DOLS)

*** 说明:1-5均用STATA软件实现, 6用GAUSS软件实现。

* 生产效率分析(尤其指TFP):数据包络分析(DEA)与随机前沿分析(SFA)

*** 说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者,侧重于比较C-D与Translog生产函数,一步法与两步法的区别。常应用于地区经济差异、FDI 溢出效应(Spillovers Effect)、工业行业效率状况等。

* 空间计量分析:SLM模型与SEM模型

*说明:STATA与Matlab结合使用。常应用于空间溢出效应(R&D)、财政分权、地方政府公共行为等。

* ---------------------------------

* --------一、常用的数据处理与作图-----------

* ---------------------------------

* 指定面板格式

xtset id year (id为截面名称,year为时间名称)

Stata基本命令

Stata基本命令

Stata基本命令

一、描述性统计

命令:sum(var1 var2)

二、独立样本t检验

命令:ttest var1, by(group)

三、回归

(一)检测变量是否需要加对数

1、C-D方程中基本都要加对数,除了0-1的小数和离散变量

命令:gen lnvar1=log(var1),若var1有零值,则gen lnvar1=log(var1+1) 2、其他方程的变量检测

(1)sktest var1,若PT(skewness)>0.05,则呈正态分布,不用加对数(2)ladder var1,若P(chi2)越大,就选这种形式。

(二)构建面板数据

命令:xtset county year

(三)回归

1、随机效应模型

命令:xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005 south north,re 2、固定效应模型(地区变量不需要放进去)

命令:xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005,fe

3、随机效应模型和固定效应模型的结果只能两者选其一,方法是Hausman检验,做法如下:第一步:固定效应模型回归 xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005,fe

第二步:存储固定效应值 est store fe

第三步:随机效应模型回归 xtreg y var1 var2 DID t_2008 t_2007 t_2006 t_2005 south north,re

stata命令总结

stata命令总结

stata命令总结.doc

Stata命令总结

引言

Stata是一款强大的统计分析软件,广泛应用于经济学、社会学、医学等领域。Stata命令是进行数据处理、统计分析、图形展示等操作的基础。本文将对Stata中常用的命令进行总结,以帮助用户更高效地使用Stata进行数据分析。

Stata基础命令

1. 数据管理

导入数据:import excel, import delimited

导出数据:export excel, export delimited

数据集保存:save, saveold

2. 变量管理

创建变量:generate, egen

修改变量:replace

删除变量:drop

3. 数据清洗

数据类型转换:destring, encode, format

缺失值处理:mvdecode, drop if missing()

异常值检测:tabulate, summarize

描述性统计分析

1. 基本统计量

描述性统计:summarize

频率统计:tabulate

相关系数:correlate

2. 分组统计

分组描述:bysort, xtsum 分组汇总:collapse

3. 数据转换

数据长格式:reshape long 数据宽格式:reshape wide 推断性统计分析

1. 假设检验

t检验:ttest

方差分析:anova

卡方检验:tabulate, chi2 2. 回归分析

线性回归:regress

逻辑回归:logit

泊松回归:poisson

3. 时间序列分析

时间序列描述:tsreport

自回归模型:arima

stata常用命令总结

stata常用命令总结

stata常用命令总结

Stata是一种统计分析软件,常用于数据处理、数据分析和统计建模等领域。以下是一些常用的Stata命令的总结:

1. 数据加载与保存:

- `use`:加载Stata数据文件。

- `import`:导入其他文件格式的数据。

- `save`:保存当前数据文件。

- `export`:将数据导出到其他文件格式。

2. 数据处理与变量操作:

- `generate`:创建新变量。

- `replace`:替换变量值。

- `drop`:删除变量或观测。

- `rename`:重命名变量。

- `sort`:对数据进行排序。

- `merge`:合并数据集。

3. 描述性统计与数据分析:

- `summarize`:计算变量的描述性统计量。

- `tabulate`:制表统计。

- `regress`:进行线性回归分析。

- `logit`:进行Logistic回归分析。

- `anova`:进行方差分析。

- `ttest`:进行双样本t检验。

4. 绘图与可视化:

- `histogram`:绘制直方图。

- `scatter`:绘制散点图。

- `line`:绘制折线图。

- `boxplot`:绘制箱线图。

- `graph combine`:组合多个图形。

5. 循环与条件语句:

- `forvalues`:进行循环操作。

- `if`:根据条件进行数据筛选。

- `foreach`:对变量进行循环操作。

这只是一些常用的Stata命令的总结,Stata还有很多其他强大的功能和命令。你可以参考Stata官方文档或其他相关资源,深入了解更多命令和用法。

(完整)stata命令总结,推荐文档

(完整)stata命令总结,推荐文档

stata11常用命令

注:JB统计量对应的p大于0.05,则表明非正态,这点跟sktest和swilk 检验刚好相反;

dta为数据文件;

gph为图文件;

do为程序文件;

注意stata要区别大小写;

不得用作用户变量名:

_all _n _N _skip _b _coef _cons _pi _pred _rc _weight double

float long int in if using with

命令:

读入数据一种方式

input x y

1 4

2 5.5

3 6.2

4 7.7

5 8.5

end

su/summarise/sum x 或 su/summarise/sum x,d

对分组的描述:

sort group

by group:su x

%%%%%

tabstat economy,stats(max) %返回变量economy的最大值

%%stats括号里可以是:mean,count(非缺失观测值个数),sum(总和),max,min,range,

%% sd,var,cv(变易系数=标准差/均值),skewness,kurtosis,median,p1(1%分位

%% 数,类似地有p10, p25, p50, p75, p95, p99),iqr(interquantile range = p75 – p25)

_all %描述全部

_N 数据库中观察值的总个数。

_n 当前观察值的位置。

_pi 圆周率π的数值。

list

gen/generate %产生数列

egen wagemax=max(wage)

clear

stata命令大全(全)[整理版]

stata命令大全(全)[整理版]

*********面板数据计量分析与软件实现*********

说明:以下do文件相当一部分内容来自于中山大学连玉君STATA教程,感谢他的贡献。本人做了一定的修改与筛选。

*----------面板数据模型

* 1.静态面板模型:FE 和RE

* 2.模型选择:FE vs POLS, RE vs POLS, FE vs RE (pols混合最小二乘估计)

* 3.异方差、序列相关和截面相关检验

* 4.动态面板模型(DID-GMM,SYS-GMM)

* 5.面板随机前沿模型

* 6.面板协整分析(FMOLS,DOLS)

*** 说明:1-5均用STATA软件实现, 6用GAUSS软件实现。

* 生产效率分析(尤其指TFP):数据包络分析(DEA)与随机前沿分析(SFA)

*** 说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者,侧重于比较C-D与Translog 生产函数,一步法与两步法的区别。常应用于地区经济差异、FDI溢出效应(Spillovers Effect)、工业行业效率状况等。

* 空间计量分析:SLM模型与SEM模型

*说明:STATA与Matlab结合使用。常应用于空间溢出效应(R&D)、财政分权、地方政府公共行为等。

* ---------------------------------

* --------一、常用的数据处理与作图-----------

* ---------------------------------

* 指定面板格式

xtset id year (id为截面名称,year为时间名称)

stata常用命令总结

stata常用命令总结

stata常用命令总结

Stata常用命令总结

Stata是一款广泛应用于数据分析与统计建模的统计软件,具有强大的功能和广泛的应用领域。在Stata中,我们可以通过命令来完成数据的读取、整理、分析和可视化等任务。本文将对一些常用的Stata命令进行总结和介绍,以帮助读者更好地理解和应用Stata软件。

一、数据的读取与整理

1. 读取数据文件:

- use 文件名:读取已经存在的Stata数据文件。

- import delimited 文件名:读取以逗号、制表符或其他分隔符分隔的文本文件。

2. 显示数据:

- describe:显示数据文件的基本信息,包括变量名、数

据类型、有效观测数等。

- browse:以表格形式显示数据文件的部分观测值。

3. 数据整理:

- generate 新变量名=计算公式:创建新的变量,并根据

指定公式进行计算。

- egen 新变量名=计算函数:根据指定的计算函数对现有

变量进行计算,并创建新的变量。

二、数据的统计分析与建模

1. 描述性统计:

- summarize 变量名:对指定变量进行描述性统计,包括

均值、标准差、最小值、最大值等。

- tabulate 变量名:生成指定变量的频数表和百分比表。

2. 数据筛选与子集选择:

- keep 如果条件:保留符合条件的观测值,删除不满足条件的观测值。

- drop 如果条件:删除符合条件的观测值,保留不满足条件的观测值。

- qui keep 如果条件:以无输出方式保留符合条件的观测值并生成新数据集。

- qui drop 如果条件:以无输出方式删除符合条件的观测值并生成新数据集。

stata命令大全(全)

stata命令大全(全)

********* 面板数据计量分析与软件实现 *********

说明:以下do文件相当一部分内容来自于中山大学连玉君STATA教程,感谢他的贡献。本人做了一定的修改与筛选。

*----------面板数据模型

* 1.静态面板模型:FE 和RE

* 2.模型选择:FE vs POLS, RE vs POLS, FE vs RE (pols混合最小二乘估计) * 3.异方差、序列相关和截面相关检验

* 4.动态面板模型(DID-GMM,SYS-GMM)

* 5.面板随机前沿模型

* 6.面板协整分析(FMOLS,DOLS)

*** 说明:1-5均用STATA软件实现, 6用GAUSS软件实现。

* 生产效率分析(尤其指TFP):数据包络分析(DEA)与随机前沿分析(SFA)

*** 说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者,侧重于比较C-D与Translog生产函数,一步法与两步法的区别。常应用于地区经济差异、FDI 溢出效应(Spillovers Effect)、工业行业效率状况等。

* 空间计量分析:SLM模型与SEM模型

*说明:STATA与Matlab结合使用。常应用于空间溢出效应(R&D)、财政分权、地方政府公共行为等。

* ---------------------------------

* --------一、常用的数据处理与作图-----------

* ---------------------------------

* 指定面板格式

xtset id year (id为截面名称,year为时间名称)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

stata11常用命令

注:JB统计量对应的p大于0.05,则表明非正态,这点跟sktest和swilk 检验刚好相反;

dta为数据文件;

gph为图文件;

do为程序文件;

注意stata要区别大小写;

不得用作用户变量名:

_all _n _N _skip _b _coef _cons _pi _pred _rc _weight double

float long int in if using with

命令:

读入数据一种方式

input x y

1 4

2 5.5

3 6.2

4 7.7

5 8.5

end

su/summarise/sum x 或 su/summarise/sum x,d

对分组的描述:

sort group

by group:su x

%%%%%

tabstat economy,stats(max) %返回变量economy的最大值

%%stats括号里可以是:mean,count(非缺失观测值个数),sum(总和),max,min,range,

%% sd,var,cv(变易系数=标准差/均值),skewness,kurtosis,median,p1(1%分位

%% 数,类似地有p10, p25, p50, p75, p95, p99),iqr(interquantile range = p75 – p25)

_all %描述全部

_N 数据库中观察值的总个数。

_n 当前观察值的位置。

_pi 圆周率π的数值。

list

gen/generate %产生数列

egen wagemax=max(wage)

clear

use

by(分组变量)

set more 1/0

count %计数

gsort +x (升序)

gsort -x (降序)

sort x 升序;并且其它变量顺序会跟着改变

label var y "消费" %添加标签

describe %描述数据文件的整体,包括观测总数,变量总数,生成日期,每个变量的存储类型(storage type),标签(label)

replace x5=2*y if x!=3 %替换变量值

replace age = 25 in 107 %令第107个观测中age为25

rename y2 u %改变变量名

drop in 2 %删除全部变量的第2行

drop if x==. 删去x为缺失值的所有记录

keep if x<2 %保留小于2的数据,其余变量跟随x改变

keep in 2/10 %保留第2-10个数

keep x1-x5 %保留数据库中介于x1和x5间的所有变量 (包括x1和x5),其余变量删除

ci x1 x2,by(group) %算出置信区间,不过先前对group要先排序,即sort group;

%by的意思逐个进行

cii 12 3.816667 0.2710343, level(90) %已知均值,方差,计算90%的置信区间

cii 10 2 %obs=10,mean=2,以二项分布形式,计算置信区间

centile x,centile(2.5 25 50 75 97.5) %取分位数

correlate/corr x y z %相关系数

pwcorr x y,sig %给出原假设r=0的命令

%如果变量非服从正态分布,则spearman x y

regress/reg mean year %回归方程建立 reg y x,noconstant %无常数项predict meanhat %预测拟合值

predict e,residual %得到残差

estat hettest % 异方差检验

dwstat % Durbin-Watson自相关检验

vif % 方差膨胀因子

logit y x1 x2 x3 (y取0或1,是被解释变量,x1-x3是被解释变量) %logit 回归

probit y x1 x2 x3 (y取0或1,是被解释变量,x1-x3是被解释变量) %probit 回归

tobit y x1 x2 x3 (y取值在0和1之间,是被解释变量,x1-x3是被解释变量) %tobit回归

sktest e %残差正态性检验 p>0.05则接受原假设,即服从正态分布;

%% sktest是基于变量的偏度和斜度(正态分布的偏度为0,斜度为3)

swilk x %基于Shapiro-Wilk检验

%%p值越小,越倾向于拒绝零假设,也就是变量越有可能不服从正态分布

xi %生成虚拟变量

tabulat gender,summ(math) %用gender指标对math进行分类,返回两类math 的mean、std、freq

tabulate=tab %gen f=int((shengao-164)/3)*3+164 组距为3

tabulate 变量名 [, generate(新变量) missing nofreq nolabel plot ] %%%%%

generate(新变量) // 按分组变量产生哑变量

nofreq // 不显示频数

nolabel // 不显示数值标记

plot // 显示各组频数图示

missing // 包含缺失值

cell // 显示各小组的构成比(小组之和为 1) column // 按栏显示各组之构成(各栏总计为 1)

row // 按行显示各组之构成(各行总计为 1) %%%%%

求和,求最小?

mod(x,y) %求余数

means %返回三种平均值

di normprob(1.96)

di invnorm(0.05)

di binomial(20,5,0.5)

di invbinomial(20,5,0.5)

di tprob(10,2)

di invt(10.0.05)

di fprob(3,27,1)

di invfprob(3,27,0.05)

di chi2(3,5)

di invchi2(3,0.05)

stack x y z,into(e) %把三列合成一列

xpose,clear %矩阵转置

append using d:\0917.dta %把已打开的文件(x y z)跟0917里的(x y z)合并,是竖向合并,即观察值合并;

merge using D:\0917.dta %把已打开的文件(x y z)跟0917里的(a b)合并,是横向合并,即变量合并;

format x %9.2e %科学记数

format x %9.2f %2位小数

%产生随机数

%1 产生20个在(0,1)区间上均匀分布的随机数uniform()

set seed 100

set obs 20

gen r=uniform()

list

相关文档
最新文档