stata 指令小结

合集下载

STATA命令应用及详细解释汇总

精品文档命令应用及详细解释（汇总）STATA调整变量格式：，小数点后取三位x1的列宽固定为10format x1 .3f ——将，有效数字取三位的列宽固定为10format x1 .3g ——将x1 ，采用科学计数法的列宽固定为10format x1 .3e ——将x1，小数点后取三位，加的列宽固定为10x1format x1 .3fc ——将入千分位分隔符，有效数字取三位，的列宽固定为10format x1 .3gc ——将x1 加入千分位分隔符，有效数字取三10x1format x1 %-10.3gc ——将的列宽固定为”表示左对齐位，加入千分位分隔符，加入“- 合并数据：\2006.dta, clear 桌面use C:\Documents and Settings\xks\\1999.dta 桌面merge using C:\Documents and Settings\xks\排列的自然）observation 样本（的数据按照——将1999和2006 顺序合并起来\2006.dta, clear 桌面use C:\Documents and Settings\xks\桌面merge id using C:\Documents and Settings\xks\\1999.dta ,unique sort 来合并，）（20061999——将和的数据按照唯一的unique变量id. 精品文档）进行排序（sort在合并时对id 建议采用第一种方法。

对样本进行随机筛选：sample 5050%的样本，其余删除在观测案例中随机选取sample 50,count 50个样本，其余删除在观测案例中随机选取查看与编辑数据：browse x1 x2 if x3>3 （按所列变量与条件打开数据查看器）（按所列变量与条件打开数据编辑器）edit x1 x2 if x3>3）merge）与扩展（append数据合并（表示样本appendmerge 表示样本量不变，但增加了一些新变量；目不变。

计量经济学stata命令汇总

计量经济学stata命令汇总1. 数据处理与描述性统计summarize 变量1 变量2…计算变量的均值、中位数等统计量tabulate 变量1 变量2…制表histogram 变量画单变量直方图scatter 变量1 变量2…画双变量散点图graph twoway 程序名变量1 变量2…绘制双变量图形sort 变量按照变量排序by 变量: 命令按照变量拆分数据并执行命令replace 变量=表达式替换变量中的值generate 新变量=表达式生成新变量egen 新变量=函数(变量) 生成新变量2. 回归分析regress 因变量自变量1 自变量2…普通最小二乘回归reg 相关变量,robust 异方差鲁棒性回归logit 因变量自变量1 自变量2…二元Logit模型probit 因变量自变量1 自变量2…二元Probit模型tobit 因变量自变量1 自变量2… 截尾变量（下界或上界）cens(下界或上界) 截尾Tobit模型heckman 因变量自变量1 自变量2… 难以观察到自变量矩阵决策过程变量名称=接收权值做二阶段回归Heckman选择模型pheckman 因变量自变量1 自变量2… 难以观察到自变量矩阵决策过程经验Bayes做二阶段回归Pooled Heckman选择模型xtset 变量1 变量2…指定面板数据xtreg 因变量自变量1 自变量2…, fe/be/fevd/arellano间隔估计xtlogit 因变量自变量1 自变量2…, fe面板Logit模型xtprobit 因变量自变量1 自变量2…, fe面板Probit模型3. 时间序列分析dfuller 变量单位根检验tsset 变量指定时间序列数据tsline 变量绘制时间序列图arma 阶数, lags(*laglist*) ARMA过程估计arima 阶数, lags(*laglist*) 差分阶数(*diff*) 现有模型(*model*) ARIMA模型估计arch hq/aic, lags(*laglist*) ARCH模型估计garch q=p o=r t=m, arch(q) garch(p) GARCH模型估计ivregress （2SLS）因变量自变量1（内生变量）编号=gmm/cluster(varname) 内生变量外生变量IV或2SLS回归分析4. 面板数据分析&横截面数据分析xtsum 等对面板数据的描述统计量xttest0 2个变量计算相对于H0的t值，考虑了异方差和面板数据结构（前提是两个变量符合随机效应或固定效应假设）xttobit 因变量自变量1 自变量2… 下界 cens(下界或上界)面板Tobit模型xtreg 因变量自变量1 自变量2…, fe/be/fevd/arellano面板回归模型xtlogit/xtprobit 因变量自变量1 自变量2…, fe面板分类模型5. 高级统计方法cluster 变量聚类分析pca 变量1 变量2…, components(4)主成分分析mvreg 因变量向量1 向量2…, clustervar(cluster)多元回归及聚类分析multilevel 因变量自变量1 自变量2…, mle 内部命令（通常是cov）多层线性模型分析glm 因变量自变量1 自变量2…, family(binomial) 连接函数(logit/probit) 难以观察到自变量（即随机拦截模型）其他选项广义线性模型分析heckprob/reg3 因变量自变量1 自变量2… 等随机效应模型分析。

stata命令总结

表2-1: 回归分析相关‎命令一览命令用途anova 方差和协方差‎分析heckma‎n Heckma‎n筛选模型intreg‎离散型变量模‎型，包括Tobi‎t、cnreg 和intre‎givreg 工具变量法（IV 或2SLS）newey Newey-West 标准差设定下‎的回归prais 针对序列相关‎的P rais‎-W inste‎n, Cochra‎n e-Orcutt‎, or Hildre‎t h-Lu 回归qreg 分量回归reg OLS 回归sw 逐步回归法reg3 三阶段最小二‎乘回归rreg 稳健回归（不同于方差稳‎健型回归，即White‎方法）sureg 似无相关估计‎svyhec‎k man 调查数据的H‎eckman‎筛选模型svyint‎r eg 调查数据的间‎断变量回归svyreg‎r ess 调查数据的线‎性回归tobit Tobit 回归treatr‎e g treatm‎e nt 效应模型truncr‎e g 截断回归表2-2: 时间序列命令‎一览命令用途clemao‎1允许结构突变‎的单位根检验‎zandre‎w sdfulle‎rdfglspperro‎ncoin 单方程协整检‎验dwstat‎参考dwst‎at2 , durbin‎a2durbin‎h表2-3: Panel Data 模型相关命令‎一览I命令模型统计描述相关‎命令：xtdes 变量类型，数据类型描述‎xtsum 基本统计量xttab 按表格形式列‎示xtpatt‎e rn 面板数据的模‎式估计相关命令‎：xtreg 面板数据模型‎（固定效应、随机效应）xtrega‎r含有AR(1) 干扰项的固定‎效应和随机效‎应面板数据模‎型xtgls 截面-时序混合模型‎，可处理异方差‎、组内序列相关‎和组间相关性‎xtpcse‎OLS or Prais-Winste‎n models‎with panel-correc‎t ed standa‎r d errors‎xtrchh‎Hildre‎t h-Houck random‎coeffi‎c ients‎models‎xtivre‎g面板模型的工‎具变量或两阶‎段最小二乘法‎估计xtabon‎d Arella‎n o-Bond(1991) 线性动态面板‎数据模型估计‎xtabon‎d2 Arella‎n o-Bover(1995) 系统GMM 动态面板数据‎模型估计xttobi‎t Tobit 随机效应面板‎模型xtintr‎e g Random‎-effect‎s interv‎a l data regres‎s ion models‎xtlogi‎t Fe, Re, Pa logit models‎xtprob‎i t Re, Pa probit‎models‎xtclog‎l og Re, Pa cloglo‎g models‎xtpois‎s on Fe, Re, Pa Poisso‎n models‎xtnbre‎g Fe, Re, Pa negati‎v e binomi‎a l models‎xtfron‎t ier 面板随机前沿‎模型xthtyl‎o r Hausma‎n-Taylor‎estima‎t or for error-compon‎e nts models‎表2-4: Panel Data 模型相关命令‎一览II命令模型假设检验相关‎：test Wald 检验，如时间效应联‎合显著性检验‎xttest‎0随机效应检验‎xttest‎1面板序列相关‎检验xttest‎2 adsxtseri‎a l Wooldr‎i dge 一阶序列相关‎检验xtab Arella‎n o 面板一阶序列‎相关检验hausma‎n Hausma‎n检验面板单位根和‎协整相关：xtunit‎stata提‎供的检验方法‎ipshin‎IPS(2003)面板单位根检‎验levili‎n Levin，Lin和Ch‎u(LLC, 2002)面板单位根检‎验madful‎l er Sarno-Taylor‎(1998) 面板单位根检‎验xtfish‎e r Maddal‎a和Wu(1999),基于P 值的面板单位‎根检验表2-5: Post-estima‎t ion Comman‎d s命令名称用途‎adjust‎列示预测结果‎的均质，适于多种回归‎分析，可分组列示estima‎t es 估计结果的存‎储、再显示、列表比较等hausma‎n Hausma‎n模型识别检验‎lincom‎获得参数的线‎性组合，在Logit‎模型中可以获‎得系数线性组‎合的OR 值linkte‎s t 但方程lin‎k识别检验，用y 对O y 和O y2 回归lrtest‎似然比（LR）检验mfx 计算边际效应‎和弹性系数nlcom 系数的非线性‎组合predic‎t获得拟合值、残差等predic‎t nl 获得非线性估‎计的拟合值、残差等test 线性约束的假‎设检验，Wald 检验testnl‎非线性约束的‎假设检验vce 列示参数估计‎值的方差-协方差矩阵表2-6: 二维图种类一‎览图形种类简单‎描述scatte‎r scatte‎r plotline line plotconnec‎t ed connec‎t ed-line plotscatte‎r i scatte‎r with immedi‎a te argume‎n tsarea line plot with shadin‎gbar bar plotspike spike plotdropli‎n e dropli‎n e plotdot dot plotrarea range plot with area shadin‎grbar range plot with barsrspike‎range plot with spikes‎rcap range plot with capped‎spikes‎rcapsy‎m range plot with spikes‎capped‎with symbol‎s rscatt‎e r range plot with marker‎srline range plot with linesrconne‎c ted range plot with lines and marker‎stsline‎time-series‎plottsrlin‎e time-series‎range plotmband median‎-band line plotmsplin‎e spline‎line plotlowess‎LOWESS‎line plotlfit linear‎predic‎t ion plotqfit quadra‎t ic predic‎t ion plotfpfit fracti‎o nal polyno‎m ial plotlfitci‎linear‎predic‎t ion plot with CIsqfitci‎quadra‎t ic predic‎t ion plot with CIsfpfitc‎i fracti‎o nal polyno‎m ial plot with CIsfuncti‎o n line plot of functi‎o nhistog‎r am histog‎r am plotkdensi‎t y kernel‎densit‎y plot表2-7: 二维图选项一‎览选项类别简单‎描述added line option‎s draw lines at specif‎i ed y or x values‎added text option‎displa‎y text at specif‎i ed (y,x) value axis option‎s labels‎, ticks, grids, log scales‎title option‎s titles‎, subtit‎l es, notes, captio‎n slegend‎option‎legend‎explai‎n ing what means what scale(#) resize‎text, marker‎s, and line widths‎region‎option‎s outlin‎i ng, shadin‎g, aspect‎ratio, sizeaspect‎option‎constr‎a in aspect‎ratio of plot region‎scheme‎(scheme‎n ame) overal‎l lookby(varlis‎t, ...) repeat‎for subgro‎u psnodraw‎suppre‎s s displa‎y of graphname(name, ...) specif‎y name for graphsaving‎(filena‎m e, ...) save graph in fileadvanc‎e d option‎s diffic‎u lt to explai‎n表2-9: 模拟分析相关‎命令一览命令用途备注‎抽样相关：corr2d‎a ta 产生具有指定‎相关性的数据‎仅适用于模拟‎相关分析drawno‎r minvnor‎m(unifor‎m()) 产生服从标准‎正态分布的随‎机数函数，可调节均值和‎方差matuni‎f orm(r,c) 产生均匀分布‎函数sample‎从现有数据中‎进行非重复随‎机抽样参考b‎sample‎sim arma 产生服从AR‎I MA 过程的随机变‎量需要下载Bootst‎r ap 相关：bootst‎r apbsbstatbsampl‎eMC 相关:simula‎t e MC simula‎t ionjknife‎类似于MCpermut‎epostfi‎l e 存储MC 的结果statsb‎yexp list。

Stata命令整理

Stata命令整理Stata 命令语句格式：[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]1、[by varlist:]*如果需要分别知道国产车和进⼝车的价格和重量，可以采⽤分类操作来求得，sort foreign //按国产车和进⼝车排序. by foreign: sum price weight*更简略的⽅式是把两个命令⽤⼀个组合命令来写。

. by foreign, sort: sum price weight如果不想从⼩到⼤排序，⽽是从⼤到⼩排序，其命令为gsort。

. sort - price //按价格从⾼到低排序. sort foreign -price /*先把国产车都排在前，进⼝车排在后⾯，然后在国产车内再按价格从⼤⼩到排序，在进⼝车内部，也按从⼤到⼩排序*/2、[=exp]赋值运算. gen nprice=price+10 //⽣成新变量nprice，其值为price+10/*上⾯的命令generate(略写为gen) ⽣成⼀个新的变量，新变量的变量名为nprice,新的价格在原价格的基础上均增加了10 元。

. replace nprice=nprice-10 /*命令replace 则直接改变原变量的赋值，nprice调减后与price 变量取值相等*/3、[if exp]条件表达式. list make price if foreign==0*只查看价格超过1 万元的进⼝车（同时满⾜两个条件），则. list make price if foreign==1 &price>10000*查看价格超过1 万元或者进⼝车（两个条件任满⾜⼀个）. list make price if foreign==1 | price>100004、[in range]范围筛选sum price in 1/5注意“1/5”中，斜杠不是除号，⽽是从1 到 5 的意思，即1，2，3，4，5。

stata常用命令总结

Stata常用命令总结Stata是一种统计分析软件，广泛用于社会科学、经济学、生物医学等领域的数据分析。

它具有丰富的功能和灵活的数据处理能力，能够进行各种统计分析、数据可视化和模型建立。

本文将总结Stata的常用命令，包括重要观点、关键发现和进一步思考，帮助读者更好地理解和使用Stata。

一、数据导入和处理e命令：用于导入Stata数据文件（.dta）。

2.import命令：用于导入其他格式的数据文件（如Excel、CSV等）。

3.save命令：用于保存当前数据文件。

4.drop命令：用于删除变量或观察值。

5.keep命令：用于保留指定的变量或观察值。

重要观点：在数据导入和处理阶段，要注意数据的完整性和准确性。

需要检查数据的缺失值、异常值和数据类型，做好数据清洗和预处理工作。

二、数据描述和统计分析1.summarize命令：用于计算变量的描述性统计量，如均值、标准差、最大值、最小值等。

2.tabulate命令：用于制作交叉表和列联表。

3.correlate命令：用于计算变量之间的相关系数。

4.regress命令：用于进行线性回归分析。

5.logit命令：用于进行二分类的逻辑回归分析。

重要观点：在进行数据描述和统计分析时，要根据研究问题选择合适的方法和指标。

同时要注意解释统计结果的意义，避免过度解读和误导。

三、数据可视化1.histogram命令：用于绘制直方图。

2.scatter命令：用于绘制散点图。

3.twoway命令：用于绘制多种类型的图形，如线图、柱状图、饼图等。

4.graph export命令：用于将图形导出为图片文件。

重要观点：数据可视化是数据分析的重要手段，能够直观地展示数据的分布和关系。

在进行数据可视化时，要选择合适的图形类型和参数，使图形简洁明了，易于理解和解释。

四、面板数据分析1.xtset命令：用于设置面板数据的时间和单位。

2.xtreg命令：用于进行面板数据的固定效应或随机效应模型分析。

stata常用命令总结

说明：（1）在最前面加上“*”号表示该行为注释语句，STATA 将只显示不执行；（2）在一个命令的中间加入注释，要用：/*注释内容*/（3）对较长的命令或者为便于阅读，将一行命令写成几行时，用///来分开（4）在命令行的后面加入注释：//注释语句将一部分内容变成注释内容，前后用/*被注释掉的语句*/ */about *查看所安装的Stata所属版本update all *更新stata命令库sysuse *打开系统自带的示例数据use *打开用户自己的统计数据，默认打开C:\data或D:\data中的数据use"D:\abc" *打开其他文件夹的数据，等价于菜单file--open--abc insheet using D:\1.csv, clear *导入其他格式的数据insheet using D:\1.csv, double clear *对导入数据的精度要求很高outsheet using myresult.txt *导出数据outsheet using myresult.asc *导出数据*此时建立的文件myresult.txt第一行为变量名，第2～6 行为变量值。

变量列间用Tab键分隔。

如果不希望在第一行存储变量名，则可以使用nonames 选项。

如果文件已经存在，则需要使用replace 选项outsheet using myresult.asc, nonamesoutsheet using myresult.asc, nonames replaceclear //清空内存中现有数据describe //描述数据概貌edit *利用数据编辑器进行数据编辑list *类似于edit，但只能显示不能修改数据display *显示计算结果dispay log(2) *当计算器用drop_all *drop data from memoryset obs *定义样本个数（使用前一定要用drop或clear命令清空当前样本）summarize y *求某个变量的观察值个数、平均值、标准差、最小值和最大值summarize y,detail *显示某个变量更多的指标（峰度、偏度等）scatter y x *生成两个变量的散点图line y x *生成两个变量的折线图*用双Y 轴，将降雨量用左纵轴表示，将单产用右纵轴表示。

stata命令总结

stata命令总结.docStata命令总结引言Stata是一款强大的统计分析软件，广泛应用于经济学、社会学、医学等领域。

Stata命令是进行数据处理、统计分析、图形展示等操作的基础。

本文将对Stata中常用的命令进行总结，以帮助用户更高效地使用Stata进行数据分析。

Stata基础命令1. 数据管理导入数据：import excel, import delimited导出数据：export excel, export delimited数据集保存：save, saveold2. 变量管理创建变量：generate, egen修改变量：replace删除变量：drop3. 数据清洗数据类型转换：destring, encode, format缺失值处理：mvdecode, drop if missing()异常值检测：tabulate, summarize描述性统计分析1. 基本统计量描述性统计：summarize频率统计：tabulate相关系数：correlate2. 分组统计分组描述：bysort, xtsum 分组汇总：collapse3. 数据转换数据长格式：reshape long 数据宽格式：reshape wide 推断性统计分析1. 假设检验t检验：ttest方差分析：anova卡方检验：tabulate, chi2 2. 回归分析线性回归：regress逻辑回归：logit泊松回归：poisson3. 时间序列分析时间序列描述：tsreport自回归模型：arima高级统计分析1. 面板数据分析面板数据描述：xtset, xtsum固定效应模型：xtreg fe随机效应模型：xtreg re2. 多层次模型多层次线性模型：xtmelogit3. 结构方程模型结构方程模型：sem绘图与可视化1. 基本图形散点图：scatter线图：line柱状图：bar2. 高级图形箱线图：boxplot直方图：histogram核密度估计图：kdensity3. 交互式图形交互式图形：twoway, graph edit编程与自动化1. 循环与条件语句循环：foreach, forvalues条件语句：if, else2. 脚本与批处理脚本编写：do-file批处理：batch3. 宏与用户定义命令宏：macro用户定义命令：program define结语Stata命令的掌握是进行高效数据分析的前提。

stata常用命令总结

stata常用命令总结Stata是一种统计分析软件，常用于数据处理、数据分析和统计建模等领域。

以下是一些常用的Stata命令的总结：1. 数据加载与保存：- `use`：加载Stata数据文件。

- `import`：导入其他文件格式的数据。

- `save`：保存当前数据文件。

- `export`：将数据导出到其他文件格式。

2. 数据处理与变量操作：- `generate`：创建新变量。

- `replace`：替换变量值。

- `drop`：删除变量或观测。

- `rename`：重命名变量。

- `sort`：对数据进行排序。

- `merge`：合并数据集。

3. 描述性统计与数据分析：- `summarize`：计算变量的描述性统计量。

- `tabulate`：制表统计。

- `regress`：进行线性回归分析。

- `logit`：进行Logistic回归分析。

- `anova`：进行方差分析。

- `ttest`：进行双样本t检验。

4. 绘图与可视化：- `histogram`：绘制直方图。

- `scatter`：绘制散点图。

- `line`：绘制折线图。

- `boxplot`：绘制箱线图。

- `graph combine`：组合多个图形。

5. 循环与条件语句：- `forvalues`：进行循环操作。

- `if`：根据条件进行数据筛选。

- `foreach`：对变量进行循环操作。

这只是一些常用的Stata命令的总结，Stata还有很多其他强大的功能和命令。

你可以参考Stata官方文档或其他相关资源，深入了解更多命令和用法。

(完整)stata命令总结,推荐文档

stata11常用命令注：JB统计量对应的p大于0.05，则表明非正态，这点跟sktest和swilk 检验刚好相反；dta为数据文件；gph为图文件；do为程序文件；注意stata要区别大小写；不得用作用户变量名：_all _n _N _skip _b _coef _cons _pi _pred _rc _weight doublefloat long int in if using with命令：读入数据一种方式input x y1 42 5.53 6.24 7.75 8.5endsu/summarise/sum x 或 su/summarise/sum x,d对分组的描述：sort groupby group:su x%%%%%tabstat economy,stats(max) %返回变量economy的最大值%%stats括号里可以是：mean，count(非缺失观测值个数)，sum(总和)，max，min，range，%% sd，var，cv(变易系数＝标准差/均值)，skewness，kurtosis，median，p1(1％分位%% 数，类似地有p10, p25, p50, p75, p95, p99)，iqr(interquantile range = p75 – p25)_all %描述全部_N 数据库中观察值的总个数。

_n 当前观察值的位置。

_pi 圆周率π的数值。

listgen/generate %产生数列egen wagemax=max(wage)clearuseby(分组变量)set more 1/0count %计数gsort +x (升序)gsort -x (降序)sort x 升序；并且其它变量顺序会跟着改变label var y "消费" %添加标签describe %描述数据文件的整体，包括观测总数，变量总数，生成日期，每个变量的存储类型(storage type)，标签(label)replace x5=2*y if x!=3 %替换变量值replace age = 25 in 107 %令第107个观测中age为25rename y2 u %改变变量名drop in 2 %删除全部变量的第2行drop if x==. 删去x为缺失值的所有记录keep if x<2 %保留小于2的数据，其余变量跟随x改变keep in 2/10 %保留第2-10个数keep x1-x5 %保留数据库中介于x1和x5间的所有变量 (包括x1和x5)，其余变量删除ci x1 x2,by(group) %算出置信区间,不过先前对group要先排序，即sort group；%by的意思逐个进行cii 12 3.816667 0.2710343, level(90) %已知均值，方差，计算90%的置信区间cii 10 2 %obs=10,mean=2,以二项分布形式，计算置信区间centile x,centile(2.5 25 50 75 97.5) %取分位数correlate/corr x y z %相关系数pwcorr x y,sig %给出原假设r=0的命令%如果变量非服从正态分布，则spearman x yregress/reg mean year %回归方程建立 reg y x,noconstant %无常数项predict meanhat %预测拟合值predict e,residual %得到残差estat hettest % 异方差检验dwstat % Durbin-Watson自相关检验vif % 方差膨胀因子logit y x1 x2 x3 (y取0或1，是被解释变量，x1-x3是被解释变量) %logit 回归probit y x1 x2 x3 (y取0或1，是被解释变量，x1-x3是被解释变量) %probit 回归tobit y x1 x2 x3 (y取值在0和1之间，是被解释变量，x1-x3是被解释变量) %tobit回归sktest e %残差正态性检验 p>0.05则接受原假设，即服从正态分布；%% sktest是基于变量的偏度和斜度(正态分布的偏度为0，斜度为3)swilk x %基于Shapiro-Wilk检验%%p值越小，越倾向于拒绝零假设，也就是变量越有可能不服从正态分布xi %生成虚拟变量tabulat gender,summ(math) %用gender指标对math进行分类，返回两类math 的mean、std、freqtabulate=tab %gen f=int((shengao-164)/3)*3+164 组距为3tabulate 变量名 [, generate(新变量) missing nofreq nolabel plot ] %%%%%generate(新变量) // 按分组变量产生哑变量nofreq // 不显示频数nolabel // 不显示数值标记plot // 显示各组频数图示missing // 包含缺失值cell // 显示各小组的构成比(小组之和为 1) column // 按栏显示各组之构成(各栏总计为 1)row // 按行显示各组之构成(各行总计为 1) %%%%%求和，求最小？mod(x,y) %求余数means %返回三种平均值di normprob(1.96)di invnorm(0.05)di binomial(20,5,0.5)di invbinomial(20,5,0.5)di tprob(10,2)di invt(10.0.05)di fprob(3,27,1)di invfprob(3,27,0.05)di chi2(3,5)di invchi2(3,0.05)stack x y z,into(e) %把三列合成一列xpose,clear %矩阵转置append using d:\0917.dta %把已打开的文件（x y z）跟0917里的（x y z）合并，是竖向合并，即观察值合并；merge using D:\0917.dta %把已打开的文件（x y z）跟0917里的（a b）合并，是横向合并，即变量合并；format x %9.2e %科学记数format x %9.2f %2位小数%产生随机数%1 产生20个在(0，1)区间上均匀分布的随机数uniform()set seed 100set obs 20gen r=uniform()list%clear 清除内存set seed 200 设置种子数为 200set obs 20 设置样本量为 20range no 1 20 建立编号 1 至 20gen r=uniform() 产生在(0,1)均匀分布的随机数gen group=1 设置分组变量 group 的初始值为 1sort r 对随机数从小到大排序replace group=2 in 11/20 设置最大的 10 个随机数所对应的记录为第2组，即：最小的10个随机数所对应的记录为第1组sort no 按照编号排序list 显示随机分组的结果也可以list if group==1和list no if group==1%2 产生10个服从正态分布N（100，6^2）的随机数invnorm(uniform())*sigma+u clear 清除内存set seed 200 设置种子数为 200set obs 10 设置样本量为 10 gen x=invnorm(uniform())*6+100 产生服从 N(100，6^2)的随机数list画图注意有些图前面要加histogram 直方图line 折线图scatter 散点图scatter y x,c(l) s(d) b2("(a)")graph twoway connected y x 连点图graph bar (sum) var2,over(var1) blabel(total) %条形图. graph bar p52 p72,by(d). graph bar p52 p72,over(d). graph bar p52 p72,by(d) stack. graph bar p52 p72,over(d) stack////////////数据如下%d p52 p72%1 163.2 27.4%2 72.5 83.6%3 57.2 178.2histogram x,bin(8) norm %画直方图，加正态分数线graph pie a b o ab if area==1,plabel(_all percent) %画饼图graph pie var2, over(var1) plabel(_all percent) %饼图graph pie p52 p72,by(d) %饼图graph box y1 %箱体图qnorm x %qq图lfit y x %回归直线graph matrix gender economy math 多变量散点图line yhat x||scatter y x,c(.l) s(O.) xline(12) yline(5.4) %线形图&散点图有一些通用的选项可以给图形“润色”：标题title(“string”) （string可为任意的字符串，下同）脚注note(“string”)横座标标题xtitle(“string”)纵座标标题ytitle(“sting”)横座标范围 xaxis(a,b) （a<b为两个数字，下同）纵座标范围 yaxis(a,b)插入文字 text （该命令既要指定插入文字的内容，也要指定插入的位置）插入图例 legend （该命令既要指定图例的内容，也要指定其位置）绘制散点图和线条的两个主要的选择项为：connect(c...c) //连接各散点的方式，c表示：或简写为c(c...c) . 不连接 (缺省值)l 用直线连接L 沿x方向只向前不向后直线连接m 计算中位数并用直线连接s 用三次平滑曲线连接J 以阶梯式直线条连接|| 用直线连接在同一纵向上的两点II 同 ||, 只是线的顶部和底部有一个短横Symbol(s...s) // 表示各散点的图形，s 表示：或简写为s(s...s) O 大圆圈 (缺省值)S 大方块T 大三角形o 小圆圈d 小菱形p 小加号. 小点i 无符号[varname] 用变量的取值代码表示[_n] 用点的记录号表示数学函数等都要与generate、replace、display一起使用，不能单独使用程序文件douse d:\0917.dtareg y xline y x,saving(d:\d4)按ctrl+D执行字符串操作函数：length(s) %长度函数，计算s的长度, 如，displength("ab")的结果是2substr(s,n1,n2) %子串函数，获得从s的n1个字符开始的n2个字符组成的字符串,disp substr("abcdef",2,3)的结果是"bcd"string(n) %将数值n转换成字符串函数，如，dispstring(41)+"f"的结果是"41f"real(s) %将字符串s转换成数值函数，如，dispreal("5.2")+1的结果是6.2upper(s) %转换成大写字母函数，如，disp upper("this")的结果是"THIS"lower(s) %转换成小写字母函数，如disp lower("THIS")的结果是"this"index(s1,s2) %子串位置函数，计算s2在s1中第一次出现的起始位置, 如果s2不在s1中, 则结果为0。

STATA命令应用及详细解释(汇总情况)

STATA命令应用及详细解释（汇总）调整变量格式：format x1 .3f ——将x1的列宽固定为10，小数点后取三位format x1 .3g ——将x1的列宽固定为10，有效数字取三位format x1 .3e ——将x1的列宽固定为10，采用科学计数法format x1 .3fc ——将x1的列宽固定为10，小数点后取三位，加入千分位分隔符format x1 .3gc ——将x1的列宽固定为10，有效数字取三位，加入千分位分隔符format x1 %-10.3gc ——将x1的列宽固定为10，有效数字取三位，加入千分位分隔符，加入“-”表示左对齐合并数据：use "C:\Documents and Settings\xks\桌面\2006.dta", clear merge using "C:\Documents and Settings\xks\桌面\1999.dta" ——将1999和2006的数据按照样本（observation）排列的自然顺序合并起来use "C:\Documents and Settings\xks\桌面\2006.dta", clear merge id using "C:\Documents and Settings\xks\桌面\1999.dta" ,unique sort——将1999和2006的数据按照唯一的（unique）变量id来合并，在合并时对id进行排序（sort）建议采用第一种方法。

对样本进行随机筛选：sample 50在观测案例中随机选取50%的样本，其余删除sample 50,count在观测案例中随机选取50个样本，其余删除查看与编辑数据：browse x1 x2 if x3>3 （按所列变量与条件打开数据查看器）edit x1 x2 if x3>3 （按所列变量与条件打开数据编辑器）数据合并（merge）与扩展（append）merge表示样本量不变，但增加了一些新变量；append表示样本总量增加了，但变量数目不变。

stata命令汇总

一、建立stata数据集（dataset）1、用键盘建立小型数据集①input 命令input str2sex age y x1-x3end②打开Data Editor，采用copy & paste方法二、数据管理1、显示当前数据（观测或变量）list sex y in 1/10２、变量排序sort三、描述统计1、tabulatetab sex2、histogram -- Histogramshistogram y3、summarize -- Summary statisticssum x14、tabstat -- Display table of summary statisticstabstat y x1, statistics(n mean sd var q)二、数据管理6、egen -- Extensions to generate三、单变量描述统计量——数字特征3、summarize -- Summary statistics常用描述量【Variable，Obs，Mean，Std. Dev.，Min，Max】summarize varlist基本描述量【Percentiles（1%、5%、10%、25%、50%、75%、90%、95%、99%），Smallest，Largest，Obs，Sum of Wgt.，Mean，Std. Dev.，Variance，Skewness，Kurtosis】summarize varlist, detail4、tabstat -- Display table of summary statistics分位数和分位数差tabstat varlist, statistics(min p1 p5 p10 q p90 p95 p99 max range iqr)矩描述量tabstat varlist, statistics(n sum mean sd variance cv skewness kurtosis semean)三、单变量描述统计量——数字特征1、summarizesummarize [varlist] [, options]2、tabstattabstat varlist[,statistics(statname [...])]三、描述统计8、原始数据图示法——茎叶图stem varname[,options]9、原始数据图示法——箱线图（盒须图）graph box yvars[,options]10、数字特征（描述统计量）示意图graph bar yvar [, options]一、建立stata数据集（dataset）2、读*.txt文件中的数据建立数据集insheet x1-x20using“K:\insdata\Data\Dayhugp20070903.txt”, clear二、数据管理3、generate——由数学函数生成新变量gen x1x2=x1*x2描述统计1、tabulate -- for one-way tables of frequenciestab sex2、单变量描述统计——连续分布直方图histogram x, start(#) w(#) freq addlabels单变量描述统计——数字型离散分布条形图histogram x, discrete freq addlabels gap(5)5、单变量描述统计——单项式单向次数分布表tab1varlist6、单变量描述统计——离散分布条形图twoway bar yvar xvar—— displays numeric (y,x) data as bars.Example:contract x, freq(xfreq)twoway bar xfreq x7、单变量描述统计——分类型离散分布条形图graph bar yvars, over( categories ) —— draws vertical bar charts. In a vertical bar chart, the y axis is numerical, and the x axis is categorical.Example:gen frequency=1graph bar (count)frequency, over(categories)8、单变量描述统计——离散分布饼图graph pie, over( varname)1、简单随机样本：设X是有密度f(x)的随机变量，若n个随机变量X1、X2、…、X n相互独立且有相同密度f(x)，则称X1、X2、…、X n是来自总体X的容量为n的简单随机样本，简称样本(sample)。

stata总结

stata总结Stata使用总结一、简单命令1.打开文件use“文件路径”,clear（或者快捷键操作，file-open-）2.保存文件save （或者快捷键操作，file-save as）3.数据导入，可以直接复制粘贴4.为变量命名：rename var name ；数据标签label5.生成新的变量gen var=（=为赋值符号，==为等号）6.删除drop var（删除某一变量）drop if （删除满足某一条件的数据）keep if （保存满足某一条件的数据）二、字符串数据如何转化为数值型数据1.destring var，replace ignore（）一般处理存在缺失变量导致非数值型2.encode var，gen（newvar）可以处理文字3.gen newvar=substr(var,1,1) 提取变量中的某些，如2000-01-01，提取年份。

三、数据简单处理和描述1、删除极端值/截尾处理winsorize var, gen(newvar) p(0.01)2、数据描述：sum var（,detail）/describe /list3、T检验ttest var，by（）四、数据合并1、merge var using“路径”2、append using“路径”五、回归处理1、reg y x1 x2,robust2、xtreg x1 x2,fe xtreg y x1 x23、logit y x1 x24、tobit y x1 x25、gmm y x1 x2六、数据导出1、logout,save(tab01) excel replace: corr var1 var22、outreg2 using F:\... \test.doc,replace七、画图1.频率图：histogram var,title() bin(15) xtitle() norm2.散点图：scatter var1 var23.折线图：八、删除重复duplicates drop var,force九、循环程序1、foreach2、forv3、while十、数据转换rehsape long/wide var，i() j()十一、其他1.sort VAR2.gen newvar=date(var)3.egen newvar=mean/sum(var)。

stata入门操作总结

Stata入门操作总结
1. 导入数据：
方法一：点击文件选项，选择导入，根据数据类型选择即可。

方法二：进入数据编辑器界面，点击“文件”选择打开。

注意，该方式只能打开.dta文件，若数据量较小建议在Excel 中的打开，全选后复制，粘贴至数据编辑器中。

2. 修改变量标签：
在数据编辑器的属性窗口直接输入即可。

在命令窗口输入label variable 城市“city”，注意var后面的跟变量名称，即使是汉字也不需要加引号。

3. 检视数据：
输入命令describe（可简写为d）看数据集中变量名称、标签等。

若想看某几个变量的具体数据，则输入命令：list A B C。

也可通过逻辑关系来定义数据集子集，比如列出C变量大于等于10000的数据，则使用命令：list A C if C>=10000。

这里注意下其他表示关系的逻辑符号有“==”（等于）、“~=”（不等于，也可以用“！”）。

4. 进行假设检验：T检验（又称学生t检验）用于统计量服从正态分布，但方差未知的情况。

具体操作包括单样本t检验、独立样本t检验和配对样本t检验，分别用于检验总体方差未知、正态数据或近似正态的单样本均值是否与已知的总体均值相等，两对独立的正态数据或近似正态的样本的均值是否相等（可根据总体方差是否相等分类讨论），以及一对配对样本的均值的差是否等于某一个值。

以上是Stata入门操作总结，希望对您有所帮助。

计量经济学stata上机命令整理

计量经济学上机命令整理实验一edit 打开数据编辑器browse 打开数据浏览器rename 对变量重新命名labelsavedescribe 对数据集简要描述sort 排序例如:list in -10/-1list 显示变量的数值Generate 缩小:gen 生成新的变量后面可以接if条件句Replace 替换append 覆盖Summarize 缩写:su 总结后面可以接if条件句实验二twoway (scatter y x)(connected ey_x x) 在该散点图上,做出条件均值点sc y x||lfit y x 画出线图和散点图Reg y x 做出回归Rename ** y **指原变量名用于修改变量名字graph twoway scatter y x 画出y x 的二维散点图Line y x 做出y x 的线条图egen Ey_x=mean(y),by(x) 求在同一x水平下,求y的均值实验三Regress y x1 x2 ........做多元回归Precict e,re 预测方差Sort e 按照方差排序Cor y x 测试y与x的相关程度Pwcorr y x 也是测试y与x的相关程度Set obs 90 (90为任意一个数字),增加一个或者多个样本值Replace x=980 in 90 为第90个样本值赋值(980为任意一个数字)Predict yhat 预测y的估计值Display invttail(n,p) n为自由度;p为概率(一般为0.025)。

用来求t分布的t 值Display ttail(n,t)知道t值求T<t的右端概率Destring (变量名,可省略),replace ignore("-$") 将其他类型的数据转化为数值型Hist e残差直方图hist e,norm加了一条正态分布线Two connected y x 二维图连线Two connected y x,yline(0) 在y=0处画一条线(也可x=0)Kdensity e,normal 对残差画出密度图Sktest e 利用e的偏锋度做是否符合正态分布的检验gen low=yhat-t*se gen high=yhat+t*se 预测置信区间Twoway lfitci y x 置信区间与回归之间作图实验四(第五章)Gen lny=log(y)生成y的对数Gen lnx=log(x)生成x的对数Drop y或者x 删除变量Predict se,stdp 预测所有的标准误实验五(第六章)虚拟变量Tab quarter,gen(d) quarter代表变量,对变量quarter生成虚拟变量d Gen d1_x=d1*x 或者是(d2,d3,d4与x2,x3,x4)生成交互作用的虚拟变量Reg y x1 x2...d2 d3 d4.....(d1通常省略,常数项)Egen ybar=mean(y) 生成y的均值实验六(第八章:多重共线性)Gen t=0Replace t=1 if x<(或>或>=或<=)数值Test (t=0)(t_x=0)做假设联合检验,求出新的F值Test (lnx2+lnx3=1) 求出新的F检验统计量Cor lnx2-lnx6 求lnx2与lnx3到Lnx6之间的相关程度,找出是否存在多重共线性问题Pcorr lnx2 lnx3-lnx6 也是测量变量之间的相关程度Estat vif 估计方差膨胀因子(方差膨胀因子越大,说明两个此变量与y的共线性越高,应该考虑删除)实验七八(第九十章)Predict e,reGen e2=e^2Est store m1 记录原回归的内容Est tab m1 m2 展示上述记录过的回归内容并作出比较Est tab m1 m2.....,seEstat imtest 怀特检验Estat hettest BP检验Regress y x2 x3...,robust 校正后的怀特检验自相关检验Regress y x...Est store m1Predict e,reSc e obs,yline(0)Tsset obs或者其他变量,用来表示时间变化Dwstat 进行DW检验并查表得出自相关程度Gen rho=1-d/2 rho 代表ρ估计Prais y x,corc (one,two...)括号可接可不接表示从OLS残差中估计ρ Gen dy1=y-l.y*ρ1Gen dx1=y-l.y*ρ1Gen dy2=y-l.y*ρ2Gen dx2=y-l.y*ρ2 (rho=ρ)Replace dy1=sqrt(1-rho^2)*y if ......补充第一个样本值比如ifobs==1958 Replace dx1=sqrt(1-rho^2)*x if .......。

stata命令总结

stata命令总结表2-1: 回归分析相关命令一览命令用途anova 方差和协方差分析heckman Heckman 筛选模型intreg 离散型变量模型，包括T obit 、cnreg 和intregivreg 工具变量法（IV 或2SLS）newey Newey-West 标准差设定下的回归prais 针对序列相关的Prais-Winsten, Cochrane-Orcutt, or Hildreth-Lu 回归qreg 分量回归reg OLS 回归sw 逐步回归法reg3 三阶段最小二乘回归rreg 稳健回归（不同于方差稳健型回归，即White 方法）sureg 似无相关估计svyheckman 调查数据的Heckman 筛选模型svyintreg 调查数据的间断变量回归svyregress 调查数据的线性回归tobit Tobit 回归treatreg treatment 效应模型truncreg 截断回归表2-2: 时间序列命令一览命令用途clemao1 允许结构突变的单位根检验zandrewsdfullerdfglspperroncoin 单方程协整检验dwstat 参考dwstat2 , durbina2durbinh表2-3: Panel Data 模型相关命令一览I命令模型统计描述相关命令：xtdes 变量类型，数据类型描述xtsum 基本统计量xttab 按表格形式列示xtpattern 面板数据的模式估计相关命令：xtreg 面板数据模型（固定效应、随机效应）xtregar 含有AR(1) 干扰项的固定效应和随机效应面板数据模型xtgls 截面-时序混合模型，可处理异方差、组内序列相关和组间相关性xtpcse OLS or Prais-Winsten models with panel-corrected standard errors精品文库xtrchh Hildreth-Houck random coefficients modelsxtivreg 面板模型的工具变量或两阶段最小二乘法估计xtabond Arellano-Bond(1991) 线性动态面板数据模型估计xtabond2 Arellano-Bover(1995) 系统GMM 动态面板数据模型估计xttobit Tobit 随机效应面板模型xtintreg Random-effects interval data regression modelsxtlogit Fe, Re, Pa logit modelsxtprobit Re, Pa probit modelsxtcloglog Re, Pa cloglog modelsxtpoisson Fe, Re, Pa Poisson modelsxtnbreg Fe, Re, Pa negative binomial modelsxtfrontier 面板随机前沿模型xthtylor Hausman-Taylor estimator for error-componentsmodels表2-4: Panel Data 模型相关命令一览II命令模型假设检验相关：test Wald 检验，如时间效应联合显著性检验xttest0 随机效应检验xttest1 面板序列相关检验xttest2 adsxtserial Wooldridge 一阶序列相关检验xtab Arellano 面板一阶序列相关检验hausman Hausman 检验面板单位根和协整相关：xtunit stata提供的检验方法ipshin IPS(2003)面板单位根检验levilin Levin，Lin和Chu(LLC, 2002)面板单位根检验madfuller Sarno-Taylor(1998) 面板单位根检验xtfisher Maddala和Wu(1999),基于P 值的面板单位根检验表2-5: Post-estimation Commands命令名称用途adjust 列示预测结果的均质，适于多种回归分析，可分组列示estimates 估计结果的存储、再显示、列表比较等hausman Hausman 模型识别检验lincom 获得参数的线性组合，在Logit 模型中可以获得系数线性组合的OR 值linktest 但方程link 识别检验，用y 对O y 和O y2 回归lrtest 似然比（LR）检验mfx 计算边际效应和弹性系数nlcom 系数的非线性组合predict 获得拟合值、残差等predictnl 获得非线性估计的拟合值、残差等test 线性约束的假设检验，Wald 检验精品文库testnl 非线性约束的假设检验vce 列示参数估计值的方差-协方差矩阵表2-6: 二维图种类一览图形种类简单描述scatter scatterplotline line plotconnected connected-line plotscatteri scatter with immediate argumentsarea line plot with shadingbar bar plotspike spike plotdropline dropline plotdot dot plotrarea range plot with area shadingrbar range plot with barsrspike range plot with spikesrcap range plot with capped spikesrcapsym range plot with spikes capped with symbols rscatter range plot with markersrline range plot with linesrconnected range plot with lines and markerstsline time-series plottsrline time-series range plotmband median-band line plotmspline spline line plotlowess LOWESS line plotlfit linear prediction plotqfit quadratic prediction plotfpfit fractional polynomial plotlfitci linear prediction plot with CIsqfitci quadratic prediction plot with CIsfpfitci fractional polynomial plot with CIsfunction line plot of functionhistogram histogram plotkdensity kernel density plot表2-7: 二维图选项一览选项类别简单描述added line options draw lines at specified y or x values added text option display text at specified (y,x) valueaxis options labels, ticks, grids, log scalestitle options titles, subtitles, notes, captionslegend option legend explaining what means whatscale(#) resize text, markers, and line widths精品文库region options outlining, shading, aspect ratio, size aspect option constrain aspect ratio of plot region scheme(schemename) overall lookby(varlist, ...) repeat for subgroupsnodraw suppress display of graphname(name, ...) specify name for graphsaving(filename, ...) save graph in fileadvanced options difficult to explain表2-9: 模拟分析相关命令一览命令用途备注抽样相关：corr2data 产生具有指定相关性的数据仅适用于模拟相关分析drawnorminvnorm(uniform()) 产生服从标准正态分布的随机数函数，可调节均值和方差matuniform(r,c) 产生均匀分布函数sample 从现有数据中进行非重复随机抽样参考bsample sim arma 产生服从ARIMA 过程的随机变量需要下载Bootstrap 相关：bootstrapbsbstatbsampleMC 相关:simulate MC simulationjknife 类似于MCpermutepostfile 存储MC 的结果statsbyexp list。

stata常用命令总结

stata常用命令总结Stata常用命令总结Stata是一款广泛应用于数据分析与统计建模的统计软件，具有强大的功能和广泛的应用领域。

在Stata中，我们可以通过命令来完成数据的读取、整理、分析和可视化等任务。

本文将对一些常用的Stata命令进行总结和介绍，以帮助读者更好地理解和应用Stata软件。

一、数据的读取与整理1. 读取数据文件：- use 文件名：读取已经存在的Stata数据文件。

- import delimited 文件名：读取以逗号、制表符或其他分隔符分隔的文本文件。

2. 显示数据：- describe：显示数据文件的基本信息，包括变量名、数据类型、有效观测数等。

- browse：以表格形式显示数据文件的部分观测值。

3. 数据整理：- generate 新变量名=计算公式：创建新的变量，并根据指定公式进行计算。

- egen 新变量名=计算函数：根据指定的计算函数对现有变量进行计算，并创建新的变量。

二、数据的统计分析与建模1. 描述性统计：- summarize 变量名：对指定变量进行描述性统计，包括均值、标准差、最小值、最大值等。

- tabulate 变量名：生成指定变量的频数表和百分比表。

2. 数据筛选与子集选择：- keep 如果条件：保留符合条件的观测值，删除不满足条件的观测值。

- drop 如果条件：删除符合条件的观测值，保留不满足条件的观测值。

- qui keep 如果条件：以无输出方式保留符合条件的观测值并生成新数据集。

- qui drop 如果条件：以无输出方式删除符合条件的观测值并生成新数据集。

3. 参数估计与假设检验：- regress 因变量自变量1 自变量2 ...：进行普通最小二乘回归分析。

- ttest 变量名, by(分组变量)：进行两组样本均值差异的t检验。

4. 数据可视化：- scatter 变量1 变量2：绘制散点图。

- histogram 变量名：绘制直方图。

stata总结

stata总结Stata操作相关问题回归分析（reg），这里可以设置任意的置信水平，过程如下：Set level 98Reg var2 var3 var4 var5方差和协方差矩阵（vce），这是在回归之后，直接输入vce命令就可以了；当然，用matrix list e（V）也是可以的，效果一样；当你输入，ereturn list命令，就会出现关于这个回归方程的诸多结果。

假设检验：直接输入test var3 var4等就可以进行检验稳健性估计：reg var2 var3 var4 var5,robust即在回归指令后输入,robust就可以了，估计出的参数结果一样，但是标准误不一样，统计量也不一样参数估计的限定，此时，就是在回归指令后输入相应的限制因素，不需要用逗号隔开，类如：reg var2 var3 var5 in 1/37 if var4<1其中，in和if都表示限制命令，其中in表示的是在1-37中的数据，if 表示当var小于1时的所有数据预测（predict），对因变量进行预测的时候，输入如下命令：predict var2hat。

如果你要看预测效果，和原有的进行比较，就输入summ var2 var2hat。

也即，预测的时候，需要再预测的因变量后加入hat的后缀。

无常数项回归，如果要进行无常数项回归，那么在原有的回归命令后需要加上逗号+noconstant，命令如下：reg var2 var3 var4,noconstantTest命令详解：单个自变量的检验，直接输入test var3等类似的就可以了；如果要进行联合检验，就依次输入需要检验的变量，如test var3 var4等类似的就可以的；如果要检验一个表达式，那么就要输入如下命令：test var3 = 0.5*var4，如果是数值，就可以是这样的test var3= 1如果你想得出某个自变量与残差之间的关系图，在进行了回归分析后，输入以下命令：rvpplot var3就可以了B-p检验，进行了回归分析之后，如果要进行异方差检验，可以采用b-p检验的方法，检验过程很简单，如对单个变量进行检验，指令如下：hettest var3；如果是对多个变量进行检验，检验方法如下：hettest var3 var4 var5依据怀特检验原理，对方程进行怀特检验程序如下：一般怀特检验：quietly reg var2 var3 var4 var5predict u,residualgen usq=u^2gen var3sq=var3^2gen var4sq=var4^2gen var5sq=var5^2gen var3_var4=var3*var4gen var3_var5=var3*var5gen var4_var5=var4*var5reg usq var3 var4 var5 var3sq var4sq var5sq var3_var4 var3_var5 var4_var5特殊怀特检验quietly reg var2 var3 var4 var5predict u,residualgen usq=u^2gen var2sq=var2^2reg usq var2 varsq直接进行怀特检验的方法有的情况下，可以直接输入whitetst或者whitetst,fitted，分别表示一般和特殊检验怀特检验的具体过程如上，但是在变量十分多的情况下，怀特检验就不适用了加权最小二乘法，采用残差作为权重的计算方法，程序如下：reg var2 var3 var4 predict u,residualgen m=1/ugen var2m=var2/m gen var3m=var3/m gen var4m=var4/m reg var2m var3m var4m 序列相关的检验方法：reg var2 var3 var4 predict u,residualgen u1=u in 1/37reg u var3 var4 u1。

STATA常用命令总结(34个含使用示例)

STATA常用命令总结（34个含使用示例）1. sum：计算变量的简要统计信息，如均值、标准差等。

示例：sum variable2. tabulate：生成变量的频数表。

示例：tabulate variable3. describe：显示数据集的基本信息，如变量名和数据类型。

示例：describe dataset4. drop：删除数据集中的变量。

示例：drop variable5. keep：保留数据集中的变量，删除其他变量。

示例：keep variable6. rename：重命名变量。

示例：rename variable newname7. gen：根据已有变量生成新的变量。

示例：gen newvar = expression8. egen：根据已有变量生成新的变量，可以使用更复杂的函数和运算符。

示例：egen newvar = function(variable)9. recode：对变量的取值进行重新编码。

示例：recode variable (oldvalues= newvalues) 10. dropif：根据条件删除观测。

示例：dropif condition11. keepif：根据条件保留观测。

示例：keepif condition12. sort：对数据集按指定变量进行排序。

示例：sort variable13. merge：将两个数据集按照共享变量合并。

示例：merge 1:1 variable using dataset214. reshape：将数据从宽格式转换为长格式或反之。

示例：reshape long var, i(id) j(year)15. regress：进行线性回归分析。

示例：regress dependent_var independent_vars 16. logistic：进行逻辑回归分析。

示例：logistic dependent_var independent_vars 17. probit：进行Probit回归分析。

STATA常用命令总结(34个含使用示例)

STATA常用命令总结（34个含使用示例）1. clear：清空当前工作空间中的数据。

示例：clear2. use：加载数据文件。

示例：use "data.dta"3. describe：查看数据文件的基本信息。

示例：describe4. summarize：统计数据的描述性统计量。

示例：summarize var1 var2 var35. tabulate：制作数据的列联表。

示例：tabulate var1 var26. scatter：绘制散点图。

示例：scatter x_var y_var7. histogram：绘制直方图。

示例：histogram var8. boxplot：绘制箱线图。

示例：boxplot var1 var29. ttest：进行单样本或双样本t检验。

示例：ttest var, by(group_var)10. regress：进行最小二乘法线性回归分析。

示例：regress dependent_var independent_var1 independent_var211. logistic：进行逻辑斯蒂回归分析。

示例：logistic dependent_var independent_var1 independent_var212. anova：进行方差分析。

示例：anova dependent_var independent_var13. chi2：进行卡方检验。

示例：chi2 var1 var214. correlate：计算变量之间的相关系数。

示例：correlate var1 var2 var315. replace：替换数据中的一些值。

示例：replace var = new_value if condition16. drop：删除变量或观察。

示例：drop var17. rename：重命名变量。

示例：rename old_var new_var18. generate：生成新变量。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

== equal != not or ~= equal
price 3,984 10,372 4,499 11,995
== tests if something is equal = assigns a value to a variable
Stata has 6 data types, and data can also be missing: missing string int long float double byte To convert between numbers & strings: gen foreignString = string(foreign) "1" 1 tostring foreign, gen(foreignString) "1" decode foreign , gen(foreignString) "foreign" 1
AT COMMAND PROMPT
PgUp Tab cls PgDn
keyboard buttons F2 describe data Ctrl + 8 open the data editor clear delete data in memory
Ctrl + 9 open a new .do file Ctrl + D highlight text in .do file, then ctrl + d executes it in the command line
bysort rep78 : summarize
price
if foreign == 0 & price <= 9000, detail
In this example, we want a detailed summary with stats like kurtosis, plus mean and median
apply the command across each unique combination of variables in varlist1 function: what are you going to do to varlists?
[=exp]
[if exp]
[in range]
[weight]
gen foreignNumeric = real(foreignString) "1" "1" destring foreignString, gen(foreignNumeric) encode foreignString, gen(foreignNumeric) "foreign"
no data true/false words numbers
Change Data Types
< less than <= less than or equal to > greater than >= greater or equal to
if foreign != 1 | price >= 10000
make Chevy Colt Buick Riviera Honda Civic Volvo 260 foreign 0 0 1 1 price 3,984 10,372 4,499 11,995
if foreign != 1 & price >= 10000
Set up
pwd print current (working) directory cd "C:\Program Files (x86)\Stata13" change working directory dir display filenames in working directory fs *.dta List all Stata data in working directory underlined parts are shortcuts – capture log close use "capture" close the log on any existing do files or "cap" log using "myDoFile.txt", replace create a new log file to record your work and results search mdesc packages contain find the package mdesc to install extra commands that expand Stata’s toolkit ssc install mdesc install the package mdesc; needs to be done once
with Stata 14.1 Cheat Sheet
For more info see Stata’s reference manual ()
Data Processing
Useful Shortcuts
Basic Syntax
All Stata functions have the same format (syntax): [by varlist1:] command [varlist2]
BROWSE OBSERVATIONS WITHIN THE DATA
browse or Ctrl + 8 positive number. To exclude missing values, use the !missing(varname) syntax open the data editor list make price if price > 10000 & !missing(price) clist ... (compact form) list the make and price for observations with price > $10,000 display price[4] display the 4th observation in price; only works on single values gsort price mpg (ascending) gsort –price –mpg (descending) sort in order, first by price then miles per gallon duplicates report assert price!=. finds all duplicate values in each variable verify truth of claim levelsof rep78 display the unique values for rep78
apply weights
பைடு நூலகம்
[using filename]
pull data from a file (if not loaded)
[,options]
special options for command
column to save output as condition: only apply to apply a new variable apply the function specific rows command to if something is true
recast double mpg generic way to convert between types
SEE DATA DISTRIBUTION
Summarize Data
tabulate rep78, mi gen(repairRecord) one-way table: number of rows with each value of rep78 tabulate rep78 foreign, mi two-way table: cross-tabulate number of observations for each combination of rep78 and foreign bysort rep78: tabulate foreign for each value of rep78, apply the command tabulate foreign tabstat price weight mpg, by(foreign) stat(mean sd n) create compact table of summary statistics displays stats
formats numbers for all data include missing values create binary variable for every rep78 value in a new variable, repairRecord
Import Data
sysuse auto, clear for many examples, we load system data (Auto data) use the auto dataset. use "yourStataFile.dta", clear load a dataset from the current directory frequently used commands are import excel "yourSpreadsheet.xlsx", /* highlighted in yellow */ sheet("Sheet1") cellrange(A2:H11) firstrow import an Excel spreadsheet import delimited"yourFile.csv", /* */ rowrange(2:11) colrange(1:8) varnames(2) import a .csv file webuse set "https:///GeoCenter/StataTraining/raw/master/Day2/Data" webuse "wb_indicators_long" set web-based directory and load data from the web