stata常用作图指令包你满意

合集下载

Stata常用命令

Stata常用命令

Stata常用命令大学期间觉得学的最有用的软件之一就是stata了,对stata基本是在血和泪的尝试中爬过,到了最后基本属于只要stata不出现红字错误命令就开心得不得了。

顺便整理一下常用的stata命令如下,应该对付计量方向第一学期的入门问题不大(求stata大神不虐..),所以就只写了一部分常用的,有时间后面再补充吧。

主要就是分为基本操作和回归统计两部分:1、基本操作import/use/insheet/merge:基本常用的导入文件就是这四个了,建议直接从stata的menu菜单中导入,导入xlsx和csv这种常见的格式时还有一些备用选项可以自己体验一下(比如string和把第一行视为变量名之类)。

merge需要单独说一下,因为是将两个数据库合并为一个,原理也比较简单,两个数据库中根据一些相同的变量把其他数据“加”到原来的数据库中,也是建议直接菜单操作,不要用命令。

在Data的Combine datasets的merge two datasets中,分为1:1、m:1、1:m各种形式,基本用两次就差不多能搞懂。

help:一定第一个学的是这个!啥不会就help一下,不知道函数了就help function,不知道回归细节就help regress,多读help文件!gen/egen:最常用的建立函数的命令,这两个不同之处在于gen一般是初等函数,egen的函数会复杂一些。

常用的函数包括数学函数和其他函数,比如count/tag之类,建议直接到菜单里Data下Create data的create new variable或create new variable(extended)直接生成函数,会方便的多。

mean/abs/sqrt/max/min/sum/sd:常用数学函数,分别是求均值、绝对值、方根、最大最小、求和、方差用的。

keep if/drop if:这两个也是最常用的,在数据需要进行筛选的时候,两个命令的区别也很明显,keep是留下哪些,drop是去掉哪些。

STATA最常用命令大全

STATA最常用命令大全

statasave命令FileSave As例1. 表1.为某一降压药临床试验数据,试从键盘输入Stata,并保存为Stata格式文件。

STATA数据库的维护排序SORT 变量名1 变量名2 ……变量更名rename 原变量名新变量名STATA数据库的维护删除变量或记录drop x1 x2 /* 删除变量x1和x2drop x1-x5 /* 删除数据库中介于x1和x5间的所有变量(包括x1和x5)drop if x<0 /* 删去x1<0的所有记录drop in 10/12 /* 删去第10~12个记录drop if x==. /* 删去x为缺失值的所有记录drop if x==.|y==. /* 删去x或y之一为缺失值的所有记录drop if x==.&y==. /* 删去x和y同时为缺失值的所有记录drop _all /* 删掉数据库中所有变量和数据STATA的变量赋值用generate产生新变量generate 新变量=表达式generate bh=_n /* 将数据库的内部编号赋给变量bh。

generate group=int((_n-1)/5)+1 /* 按当前数据库的顺序,依次产生5个1,5个2,5个3……。

直到数据库结束。

generate block=mod(_n,6) /* 按当前数据库的顺序,依次产生1,2,3,4,5,0。

generate y=log(x) if x>0 /* 产生新变量y,其值为所有x>0的对数值log(x),当x<=0时,用缺失值代替。

egen产生新变量set obs 12egen a=seq() /*产生1到N的自然数egen b=seq(),b(3) /*产生一个序列,每个元素重复#次egen c=seq(),to(4) /*产生多个序列,每个序列从1到#egen d=seq(),f(4)t(6) /*产生多个序列,每个序列从#1到#2encode 字符变量名,gen(新数值变量名)作用:将字符型变量转化为数值变量。

stata命令大全(全)

stata命令大全(全)
*--> R-sq: overall corr{x_it*b_w,y_it}A2
*
*-- F(4,373) = 855.93检验除常数项外其他解释变量的联合显著性
*-- corr(u_i, Xb)=-0.2347
*-- sigma_u, sigma_e, rho
* rho = sigma_uA2/(sigma_uA2+sigma_eA2)
*空间计量分析:SLM模型与SEM模型
*说明:STATA与Matlab结合使用。常应用于空间溢出效应(R&D)、财政 分权、地方政府公共行为等。
、常用的数据处理与作图
*指定面板格式
xtset id year(id为截面名称,year为时间名称)
xtdes /*数据特征*/
xtsum logy h /*数据统计特征*/
drop if id==2/*注意用==*/
*如何得到连续year或id编号(当完成上述操作时, 为形成panel格式,需要用egen命令)
ege n year_ new二group(year)
xtset id year_ new
**保留变量或保留观测值
keep inv /*删除变量*/
**或
keep if year==2000
dis e(sigma_u)A2/(e(sigma_u)A2+e(sigma_e)A2)
个体效应是否显著?
*F(28,373) =338.86 HO: al=a2 = a3 = a4 = a29
*Prob > F = 0.0000表明,固定效应高度显著
*---如何得到调整后的R2即adj-R2?
ereturn list
考虑中国29个省份的C-D生产函数

有趣的stata指令

有趣的stata指令

有趣的stata指令有趣的Stata指令:让数据分析更有趣Stata是一款强大的数据分析软件,拥有丰富的指令和功能。

在这篇文章中,我将介绍一些有趣的Stata指令,让你的数据分析过程更加有趣和高效。

1. “egen”指令:创建自定义变量“egen”指令可以用来创建自定义变量,这给了我们很大的灵活性。

例如,我们可以使用“egen”指令计算一个变量的总和、平均值、标准差等统计量,或者根据条件创建新的变量。

这样,我们可以根据自己的需求灵活地处理数据。

2. “graph”指令:绘制漂亮的图表数据可视化是数据分析过程中非常重要的一环。

Stata的“graph”指令可以帮助我们绘制各种各样的图表,如散点图、直方图、折线图等。

我们可以根据需要调整图表的样式、颜色、标签等,使图表更加漂亮和易于理解。

3. “collapse”指令:数据聚合当我们需要对大量数据进行分组汇总时,可以使用“collapse”指令。

该指令可以按照指定的变量进行分组,并对其他变量进行聚合操作,如计算平均值、总和等。

这样,我们可以更加方便地进行数据分析和比较。

4. “reshape”指令:数据重塑当数据的结构不符合我们的分析需求时,可以使用“reshape”指令进行数据重塑。

该指令可以将数据从宽格式转换为长格式,或者从长格式转换为宽格式,以便更好地进行数据分析和处理。

5. “tabulate”指令:频数统计在数据分析中,我们经常需要计算某个变量的频数和比例。

Stata 的“tabulate”指令可以帮助我们快速计算变量的频数、比例和交叉表等。

这样,我们可以更好地了解数据的分布情况和特征。

6. “egenmore”指令:扩展egen功能Stata的“egenmore”指令是一个额外的命令集,可以扩展egen的功能。

它包含了许多有用的统计指标和变换函数,如rank、percentile等。

使用这些指令,我们可以更加方便地进行复杂的数据处理和分析。

stata常用作图指令包你满意

stata常用作图指令包你满意

S tata tata 作图常用指令作图常用指令作图常用指令1.1.茎叶图茎叶图茎叶图stem x1,line(2)(做x1的茎叶图,每一个十分位的树茎都被拆分成两段来显示,前半段为0~4,后半段为5~9)stem x1,width(2)(做x1的茎叶图,每一个十分位的树茎都被拆分成五段来显示,每个小树茎的组距为2)stem x1,round(100)(将x1除以100后再做x1的茎叶图)2.2.直方图直方图直方图 histogram mpg, discrete frequency normal xlabel(1(1)5)(discrete 表示变量不连续,frequency 表示显示频数,normal 加入正太分布曲线,xlabel 设定x 轴,1和5为极端值,(1)为单位)histogram price, fraction norm(fraction 表示y 轴显示小数,除了frequency 和fraction 这两个选择之外,该命令可替换为“percent”百分比,和“density”密度;未加上discrete 就表示将price 当作连续变量来绘图)histogram price, percent by(foreign)(按照变量“foreign”的分类,将不同类样本的“price”绘制出来,两个图分左右排布)histogram mpg, discrete by(foreign, col(1))(按照变量“foreign”的分类,将不同类样本的“mpg”绘制出来,两个图分上下排布)histogram mpg, discrete percent by(foreign, total) norm(按照变量“foreign”的分类,将不同类样本的“mpg”绘制出来,同时绘出样本整体的“总”直方图)3.3.二变量图二变量图二变量图graph twoway lfit price weight || scatter price weight(作出price和weight的回归线图——“lfit”,然后与price和weight的散点图相叠加)twoway scatter price weight,mlabel(make)(做price和weight的散点图,并在每个点上标注“make”,即厂商的取值) twoway scatter price weight || lfit price weight,by(foreign)(按照变量foreign的分类,分别对不同类样本的price和weight做散点图和回归线图的叠加,两图呈左右分布)twoway scatter price weight || lfit price weight,by(foreign,col(1))(按照变量foreign的分类,分别对不同类样本的price和weight做散点图和回归线图的叠加,两图呈上下分布)twoway scatter price weight [fweight= displacement],msymbol(oh)(画出price和weight的散点图,“msybol(oh)”表示每个点均为中空的圆圈,[fweight= displacement]表示每个点的大小与displacement的取值大小成比例)twoway connected y1 time, yaxis(1) || y2 time, yaxis(2)(画出y1和y2这两个变量的时间点线图,并将它们叠加在一个图中,左边“yaxis(1)”为y1的度量,右边“yaxis(2)”为y2的)twoway line y1 time,yaxis(1) || y2 time,yaxis(2)(与上图基本相同,就是没有点,只显示曲线)graph twoway scatter var1 var4 || scatter var2 var4 || scatter var3 var4(做三个点图的叠加)graph twoway line var1 var4 || line var2 var4 || line var3 var4(做三个线图的叠加)graph twoway connected var1 var4 || connected var2 var4 || connected var3 var4(叠加三个点线相连图)更多变量4.4.更多变量更多变量graph matrix a b c y(画出一个散点图矩阵,显示各变量之间所有可能的两两相互散点图)graph matrix a b c d,half(生成散点图矩阵,只显示下半部分的三角形区域)graph matrix price mpg weight length,half by( foreign,total col(1) ) (根据foreign变量的不同类型绘制price等四个变量的散点图矩阵,要求绘出总图,并上下排列)其他图形5.5.其他图形其他图形graph box y,over(x) yline(.22)(对应x的每一个取值构建y的箱型图,并在y轴的0.22处划一条水平线) graph bar (mean) y,over(x)对应x的每一个取值,显示y的平均数的条形图。

stata常用命令-数据处理-基本绘图

stata常用命令-数据处理-基本绘图

stata常用命令-数据处理-基本绘图cd //change directory 改变原有路径,即设置本次工作的存储位置cd "E:\研二第一学期==\孙老师,空间分析==\空间分析,结课论文==\maoyu\maoyu" //修改原有路径doedit //打开某个dofiledoedit D:\stata11\ado\personal\Net_course_A\A1_intro.do //完整路径doedit A1_intro.do //部分路径,当该文件在当前工作目录中do //执行某个写好的dofile文件do E:\maoyu\myron.dodo D:\stata11\profile.doshellout //打开工作目录中的某个文件shellout Stata_A_dofiles.pdfshellout E:\suns\A.xlsshellout "E:\suns\A.xls"cdout //打开当前工作目录ado // 呈现已经安装的外部命令use //调入数据use "E:\研二第一学期==\孙老师,空间分析==\空间分析,结课论文==\maoyu\maoyu\IndividualA_C2_maoyu.dta",clear//clear 意味着覆盖之前打开的数据clear //清除已经导入的数据sysdir //显示系统目录,如stata安装位置help //打开帮助文档,如help logisticview browse //打开某个网页链接,如view browse "https:///people/78197287/"view browse "/bbs/forum-67-1.html" //人大经济论坛// //两个斜杠代表命令结束,一般在斜杠后作备注/// // 三个斜杠代表换行,一个完整命令与句未结束,下一行接着上一行的Ctrl+D //快速执行当前do文档中的所有命令语句help window manage //界面风格设定帮助Edit-->Preference //界面风格设定按钮选择* //行开头使用星号代表该行处于非命令执行状态,可作文字说明pwd // 显示stata当前工作的路径edit // 打开数据编辑器,可在里面进行复制粘贴,如从excel中复制数据//粘贴时它会提示你是选择第一行作为变量名还是作为数据本身//当然,也可以在数据编辑器里多数据进行手动修改,一般不建议手动修改。

常用stata命令-好用

常用stata命令-好用

我常用到的stata命令最重要的两个命令莫过于help和search了。

即使是经常使用stata的人也很难,也没必要记住常用命令的每一个细节,更不用说那些不常用到的了。

所以,在遇到困难又没有免费专家咨询时,使用stata自带的帮助文件就是最佳选择。

stata的帮助文件十分详尽,面面俱到,这既是好处也是麻烦。

当你看到长长的帮助文件时,是不是对迅速找到相关信息感到没有信心?闲话不说了。

help和search都是查找帮助文件的命令,它们之间的区别在于help用于查找精确的命令名,而search是模糊查找。

如果你知道某个命令的名字,并且想知道它的具体使用方法,只须在stata的命令行窗口中输入help空格加上这个名字。

回车后结果屏幕上就会显示出这个命令的帮助文件的全部内容。

如果你想知道在stata下做某个估计或某种计算,而不知道具体该如何实现,就需要用search命令了。

使用的方法和help类似,只须把准确的命令名改成某个关键词。

回车后结果窗口会给出所有和这个关键词相关的帮助文件名和链接列表。

在列表中寻找最相关的内容,点击后在弹出的查看窗口中会给出相关的帮助文件。

耐心寻找,反复实验,通常可以较快地找到你需要的内容。

下面该正式处理数据了。

我的处理数据经验是最好能用stata的do文件编辑器记下你做过的工作。

因为很少有一项实证研究能够一次完成,所以,当你下次继续工作时。

能够重复前面的工作是非常重要的。

有时因为一些细小的不同,你会发现无法复制原先的结果了。

这时如果有记录下以往工作的do文件将把你从地狱带到天堂。

因为你不必一遍又一遍地试图重现做过的工作。

在stata窗口上部的工具栏中有个孤立的小按钮,把鼠标放上去会出现“bring do-file editor to front”,点击它就会出现do文件编辑器。

为了使do文件能够顺利工作,一般需要编辑do文件的“头”和“尾”。

这里给出我使用的“头”和“尾”。

/*(标签。

stata常用命令总结

stata常用命令总结

Stata常用命令总结Stata是一种统计分析软件,广泛用于社会科学、经济学、生物医学等领域的数据分析。

它具有丰富的功能和灵活的数据处理能力,能够进行各种统计分析、数据可视化和模型建立。

本文将总结Stata的常用命令,包括重要观点、关键发现和进一步思考,帮助读者更好地理解和使用Stata。

一、数据导入和处理e命令:用于导入Stata数据文件(.dta)。

2.import命令:用于导入其他格式的数据文件(如Excel、CSV等)。

3.save命令:用于保存当前数据文件。

4.drop命令:用于删除变量或观察值。

5.keep命令:用于保留指定的变量或观察值。

重要观点:在数据导入和处理阶段,要注意数据的完整性和准确性。

需要检查数据的缺失值、异常值和数据类型,做好数据清洗和预处理工作。

二、数据描述和统计分析1.summarize命令:用于计算变量的描述性统计量,如均值、标准差、最大值、最小值等。

2.tabulate命令:用于制作交叉表和列联表。

3.correlate命令:用于计算变量之间的相关系数。

4.regress命令:用于进行线性回归分析。

5.logit命令:用于进行二分类的逻辑回归分析。

重要观点:在进行数据描述和统计分析时,要根据研究问题选择合适的方法和指标。

同时要注意解释统计结果的意义,避免过度解读和误导。

三、数据可视化1.histogram命令:用于绘制直方图。

2.scatter命令:用于绘制散点图。

3.twoway命令:用于绘制多种类型的图形,如线图、柱状图、饼图等。

4.graph export命令:用于将图形导出为图片文件。

重要观点:数据可视化是数据分析的重要手段,能够直观地展示数据的分布和关系。

在进行数据可视化时,要选择合适的图形类型和参数,使图形简洁明了,易于理解和解释。

四、面板数据分析1.xtset命令:用于设置面板数据的时间和单位。

2.xtreg命令:用于进行面板数据的固定效应或随机效应模型分析。

stata 常用命令

stata 常用命令

stata 常用命令Stata是一个流行的统计分析软件,广泛应用于各个领域的数据分析和研究。

它提供了丰富的命令和功能,可帮助用户处理、分析和可视化数据。

在本文中,我将向您介绍一些常用的Stata命令,以及它们在数据分析中的应用。

1. 数据导入与导出在使用Stata进行数据分析之前,我们需要将数据导入软件环境中。

Stata支持多种数据格式,如Excel、CSV、SPSS等。

对于Excel数据,我们可以使用命令"import excel"将数据导入到Stata中;对于CSV数据,可以使用"import delimited"命令。

Stata还提供了"export"命令,可将分析结果导出为Excel、CSV等格式,便于与其他软件进行交互。

2. 数据清洗与处理在数据分析过程中,数据清洗是一个重要的步骤。

Stata提供了一系列命令来处理和净化数据。

"drop"命令可以删除数据集中的变量或观察值;"replace"命令用于修改变量的取值;"gen"命令可以创建新的变量等。

"merge"命令可用于合并不同数据集,"sort"命令可用于排序数据等。

3. 描述性统计分析Stata提供了简单而强大的描述性统计分析命令,帮助用户了解数据的基本特征。

"summarize"命令可用于计算变量的均值、标准差等统计量;"tabulate"命令可用于制作交叉分类表;"histogram"命令可绘制变量的直方图等。

这些命令使我们能够更好地理解数据的分布和特征。

4. 统计模型估计Stata是一个强大的统计软件,支持各种常见的统计模型估计。

"regress"命令可用于进行线性回归分析;"logit"命令可用于二元逻辑回归分析;"heckman"命令可用于处理选择模型等。

stata最常用命令大全

stata最常用命令大全

statasave‎命令File&#6‎1672;Save ‎A s例1. 表1‎.为某一降压药临床试‎验数据,试从键盘输入‎S tata,并保存为‎S tata格式文件。

‎STATA数据库的‎维护排序SORT‎变量名1 变量名2‎……变量更名‎r ename 原变量‎名新变量名STA‎T A数据库的维护删‎除变量或记录dro‎p x1 x2 ‎ /* ‎删除变量x1和x2‎d rop x1-x5‎‎/* 删除数据库中介‎于x1和x5间的所有‎变量(包括x1和x5‎)drop if ‎x<0 ‎ /* 删去x1<‎0的所有记录dro‎p in 10/12‎ /* 删‎去第10~12个记录‎drop if x‎==. ‎/* 删去x为缺失‎值的所有记录dro‎p if x==.|‎y==. /* 删‎去x或y之一为缺失值‎的所有记录drop‎if x==.&y‎==. /* 删去‎x和y同时为缺失值的‎所有记录drop ‎_all ‎ /* 删掉‎数据库中所有变量和数‎据STATA的变量‎赋值用genera‎t e产生新变量ge‎n erate 新变量‎=表达式gener‎a te bh=_n ‎‎‎/* 将‎数据库的内部编号赋给‎变量bh。

gene‎r ate group‎=int((_n-1‎)/5)+1 ‎/* 按当前数据‎库的顺序,依次产生5‎个1,5个2,5个‎3……。

直到数据库结‎束。

generat‎e block=mo‎d(_n,6) ‎ /* 按‎当前数据库的顺序,依‎次产生1,2,3,4‎,5,0。

gene‎r ate y=log‎(x) if x>0‎‎/* 产生‎新变量y,其值为所有‎x>0的对数值log‎(x),当x<=0时‎,用缺失值代替。

‎e gen产生新变量‎s et obs 12‎egen a=se‎q() ‎ /*产生1到‎N的自然数egen‎b=seq(),b‎(3) /*产生‎一个序列,每个元素重‎复#次egen c‎=seq(),to(‎4) /*产生多个‎序列,每个序列从1到‎#egen d=s‎e q(),f(4)t‎(6) /*产生多个‎序列,每个序列从#1‎到#2encode‎字符变量名,ge‎n(新数值变量名)‎作用:将字符型变量转‎化为数值变量。

Stata_画图专题(2):基础绘图命令

Stata_画图专题(2):基础绘图命令
2
1.2 scatter:散点图
命令格式
[
]
[ ][ ][
][
]
twoway scatter varlist if in weight , options
[
][
]
scatter varlist || lfit varlist || line varlist
其中下划线、方括号的含义与前面相同,不赘述。此处 varlist 是变量列表,一般二维的散点图 就是两个变量;[options] 是可选参数,参数很多,请 help scatter 来查看。常用的有 “连线” connect(l) 和 “去散点” msymbol(i),在下面的结果中可以看到。在第二行的命令中给出了散 点图的用途 —“构造回归曲线” lfit。第二行命令的意思是(1)画出散点图,(2)拟合回归直 线并(3)按点的先后顺序连接起来。上述三个可以组合起来使用。
• “堆叠”,即表示多个柱状图叠在一起(看累计总值及每组占比),命令是 stack。
其余的选项请 help graph bar 来查看。上述两行命令区别是第二行命令只是水平 (horizontal) 形式的条形图。
表 3: 描述统计命令 命令 含义
mean median
p1 p50 p99
sd sum count max/min first/last
string functions
programming functions
datetime_functions time-series functions
matrix functions
三角函数、取整、对/指数、最值等 伯努利、卡方、正态、几何分布等 符合某一概率分布的随机数组 字符串拼接、提取、长度及 ASCII 码等 e/r/s 型返回值及其他编程方面的函数 对于日期/时间数据的转化、提取等

Stata常用指令

Stata常用指令
分成相同cases五組
egen iseicat=cut(isei), at(10, 40, 70, 90)
table iseicat, contents(min isei max isei) =>檢查
分成10, 40, 70三組
不包括上限(eg.90)
不被包括者=> MV
egen iseicat=cut(isei), at(10, 40, 70, 90) icodes
listblck in 1/10, repeat(1)
(findit listblck)
list,但將版面精縮
repeat(1/n) =>前1(n)個重複出現after row 2
(findit univar)
univar chinese math science, boxplot
, by(gender) onehdr
=>Phat=predicted p
=exp(a+bx)/[1+exp(a+bx)]
=> xb = lg odd = ln(p/(1-p))
predict phat
graph twoway mspline phat x2
adjust, by(var1) exp後者=前者*exp(b)
adjust, by(var1) prp/(1-p)=odds (when var1=n)
prgen isei, f(30) t(60) gen(ff) x(male=0)
prgen isei, f(30) t(60) gen(mm) x(male=1)
twoway (connected ffp1 ffx) (connected mmp1 mmx)

stata常用命令资料

stata常用命令资料

stata常用命令资料Stata是一种广泛使用的统计分析软件,它提供了丰富的数据处理、统计计算和图形绘制功能。

下面是一些常用的Stata命令及其用法,以帮助您更好地使用Stata进行数据分析。

1. 数据导入与导出- `import excel:从Excel文件中导入数据。

- `import delimited:从文本文件中导入数据。

- `save:保存当前数据集。

- `use:加载已保存的数据集。

- `export excel:将数据导出到Excel文件。

2. 数据处理与清洗- `drop:删除变量或观察。

- `keep:保留指定变量或观察。

- `rename:重命名变量。

- `egen:生成新变量,如求和、平均值等。

- `egen group:按照指定的变量进行分组。

3. 描述统计- `summarize:计算变量的描述统计量,如均值、标准差等。

- `tabulate:制表统计,用于计算分类变量的频数和百分比。

- `histogram:绘制直方图。

- `correlate:计算变量之间的相关系数。

- `egen:生成新的汇总统计量,如总和、均值等。

4. 统计模型- `regress:线性回归分析。

- `logit:二项逻辑回归分析。

- `probit:概率回归模型。

- `ttest:单样本或双样本t检验。

- `anova:方差分析。

5. 数据可视化- `scatter:绘制散点图。

- `line:绘制折线图。

- `bar:绘制柱状图。

- `histogram:绘制直方图。

- `graph combine:将多个图形合并为一个图形。

6. 数据管理- `sort:对数据进行排序。

- `merge:合并两个数据集。

- `reshape:改变数据集的结构。

- `append:将多个数据集追加到一个数据集中。

- `collapse:将数据按照指定的变量进行折叠。

7. 循环与条件语句- `foreach:循环变量的值。

Stata常用命令100条

Stata常用命令100条

Stata常用命令100条数据管理设置工作路径:cd导入间隔符为制表符或逗号等格式的文本文件:insheet 导入固定列格式的文件:infix导入自由格式的文本文件:infile导入XML格式文件:xmluse更改变量的存储格式:recast建立新变量:generate或egen重命名变量rename变量排序:order删除变量或观测值:drop生成分类变量:recode字符串与数值变量间转换:destring或encode升序或降序排列:gsort升序排列:sort检查数据是否存在重复观测值:isid报告、标记或删除重复观测值:duplicates长数据与宽数据间转换:reshape生成变量的统计指标数据:collapse横向合并数据:merge纵向添加数据:append根据组内配对合并变量:joinby标量:scalar随机抽样:sample有放回的抽样:bsample从多元正态分布随机变量中抽样:drawnorm 生成特定相关结构的变量:corr2data统计制图直方图:histogram一般绘图命令:graph或twoway对称图:symplot分位数图:quantile正态分布分位数图:qmormQQ分位数图:qqplot标准化正态概率图:pnorm卡方概率图:pchi37条外部命令:传送门描述统计数据概要描述:summarize或describe生成汇总统计表:tabstat或tabulate相关性:correlate或pwcorr假设检验t检验:ttest方差检验:sdtest比率检验:prtest二项概率检验:bitestK-S检验:ksmirnov符号检验:signtestWilcoxon符号秩检验:signrankWilcoxon秩和检验:ranksumKruskal-Wallis:H检验:kwallis方差分析方差分析:anova单因素方差分析:oneway多元统计分析主成分分析:pca主成分散点图:loadingplot因子分析:factor因子旋转:rotate模型适切度检验:estat smc及estat anti及estat kmo 计算主成分得分或因子得分:predict碎石图:screeplot聚类分析:cluster典型相关分析:canon回归分析OLS线性回归:regress受约束的线性回归:cnsreg非线性最小二乘估计:nl多变量回归:mvreg似不相关回归:suregProbit回归:probitLogistic回归:logit定序probit模型:oprobit定序logit模型:ologit归并模型:cnregTobit模型:tobit多层线性模型:mixed泊松回归:poisson负二项回归:nbreg时间序列分析定义时间序列:tssetARIMA,ARMAX和其它动态回归模型:arima 自相关:ac偏自相关:pac预测:predict时间序列图:tsline蒙特卡罗模拟:simulateADF单位根检验:dfullerPP单位根检验pperronDF-GLS单位根检验:dfgls跨相关图:xcorr结构向量自回归模型:svar自回归条件异方差模型:arch门限回归:threg状态空间模型:sspace面板数据分析定义面板:xtset面板数据结构:xtdescribe面板OLS模型:xtreg面板GLS模型:xtgls面板GEE模型:xtgee面板probit模型:xtprobit面板logit模型:xtlogit差分GMM模型:xtabond系统GMM模型:xtdpdsysHausman检验:hausman似然比检验:lrtest空间计量从截面数据到空间面板:传送门。

stata常用命令总结

stata常用命令总结

stata常用命令总结Stata是一种统计分析软件,常用于数据处理、数据分析和统计建模等领域。

以下是一些常用的Stata命令的总结:1. 数据加载与保存:- `use`:加载Stata数据文件。

- `import`:导入其他文件格式的数据。

- `save`:保存当前数据文件。

- `export`:将数据导出到其他文件格式。

2. 数据处理与变量操作:- `generate`:创建新变量。

- `replace`:替换变量值。

- `drop`:删除变量或观测。

- `rename`:重命名变量。

- `sort`:对数据进行排序。

- `merge`:合并数据集。

3. 描述性统计与数据分析:- `summarize`:计算变量的描述性统计量。

- `tabulate`:制表统计。

- `regress`:进行线性回归分析。

- `logit`:进行Logistic回归分析。

- `anova`:进行方差分析。

- `ttest`:进行双样本t检验。

4. 绘图与可视化:- `histogram`:绘制直方图。

- `scatter`:绘制散点图。

- `line`:绘制折线图。

- `boxplot`:绘制箱线图。

- `graph combine`:组合多个图形。

5. 循环与条件语句:- `forvalues`:进行循环操作。

- `if`:根据条件进行数据筛选。

- `foreach`:对变量进行循环操作。

这只是一些常用的Stata命令的总结,Stata还有很多其他强大的功能和命令。

你可以参考Stata官方文档或其他相关资源,深入了解更多命令和用法。

(完整)stata命令总结,推荐文档

(完整)stata命令总结,推荐文档

stata11常用命令注:JB统计量对应的p大于0.05,则表明非正态,这点跟sktest和swilk 检验刚好相反;dta为数据文件;gph为图文件;do为程序文件;注意stata要区别大小写;不得用作用户变量名:_all _n _N _skip _b _coef _cons _pi _pred _rc _weight doublefloat long int in if using with命令:读入数据一种方式input x y1 42 5.53 6.24 7.75 8.5endsu/summarise/sum x 或 su/summarise/sum x,d对分组的描述:sort groupby group:su x%%%%%tabstat economy,stats(max) %返回变量economy的最大值%%stats括号里可以是:mean,count(非缺失观测值个数),sum(总和),max,min,range,%% sd,var,cv(变易系数=标准差/均值),skewness,kurtosis,median,p1(1%分位%% 数,类似地有p10, p25, p50, p75, p95, p99),iqr(interquantile range = p75 – p25)_all %描述全部_N 数据库中观察值的总个数。

_n 当前观察值的位置。

_pi 圆周率π的数值。

listgen/generate %产生数列egen wagemax=max(wage)clearuseby(分组变量)set more 1/0count %计数gsort +x (升序)gsort -x (降序)sort x 升序;并且其它变量顺序会跟着改变label var y "消费" %添加标签describe %描述数据文件的整体,包括观测总数,变量总数,生成日期,每个变量的存储类型(storage type),标签(label)replace x5=2*y if x!=3 %替换变量值replace age = 25 in 107 %令第107个观测中age为25rename y2 u %改变变量名drop in 2 %删除全部变量的第2行drop if x==. 删去x为缺失值的所有记录keep if x<2 %保留小于2的数据,其余变量跟随x改变keep in 2/10 %保留第2-10个数keep x1-x5 %保留数据库中介于x1和x5间的所有变量 (包括x1和x5),其余变量删除ci x1 x2,by(group) %算出置信区间,不过先前对group要先排序,即sort group;%by的意思逐个进行cii 12 3.816667 0.2710343, level(90) %已知均值,方差,计算90%的置信区间cii 10 2 %obs=10,mean=2,以二项分布形式,计算置信区间centile x,centile(2.5 25 50 75 97.5) %取分位数correlate/corr x y z %相关系数pwcorr x y,sig %给出原假设r=0的命令%如果变量非服从正态分布,则spearman x yregress/reg mean year %回归方程建立 reg y x,noconstant %无常数项predict meanhat %预测拟合值predict e,residual %得到残差estat hettest % 异方差检验dwstat % Durbin-Watson自相关检验vif % 方差膨胀因子logit y x1 x2 x3 (y取0或1,是被解释变量,x1-x3是被解释变量) %logit 回归probit y x1 x2 x3 (y取0或1,是被解释变量,x1-x3是被解释变量) %probit 回归tobit y x1 x2 x3 (y取值在0和1之间,是被解释变量,x1-x3是被解释变量) %tobit回归sktest e %残差正态性检验 p>0.05则接受原假设,即服从正态分布;%% sktest是基于变量的偏度和斜度(正态分布的偏度为0,斜度为3)swilk x %基于Shapiro-Wilk检验%%p值越小,越倾向于拒绝零假设,也就是变量越有可能不服从正态分布xi %生成虚拟变量tabulat gender,summ(math) %用gender指标对math进行分类,返回两类math 的mean、std、freqtabulate=tab %gen f=int((shengao-164)/3)*3+164 组距为3tabulate 变量名 [, generate(新变量) missing nofreq nolabel plot ] %%%%%generate(新变量) // 按分组变量产生哑变量nofreq // 不显示频数nolabel // 不显示数值标记plot // 显示各组频数图示missing // 包含缺失值cell // 显示各小组的构成比(小组之和为 1) column // 按栏显示各组之构成(各栏总计为 1)row // 按行显示各组之构成(各行总计为 1) %%%%%求和,求最小?mod(x,y) %求余数means %返回三种平均值di normprob(1.96)di invnorm(0.05)di binomial(20,5,0.5)di invbinomial(20,5,0.5)di tprob(10,2)di invt(10.0.05)di fprob(3,27,1)di invfprob(3,27,0.05)di chi2(3,5)di invchi2(3,0.05)stack x y z,into(e) %把三列合成一列xpose,clear %矩阵转置append using d:\0917.dta %把已打开的文件(x y z)跟0917里的(x y z)合并,是竖向合并,即观察值合并;merge using D:\0917.dta %把已打开的文件(x y z)跟0917里的(a b)合并,是横向合并,即变量合并;format x %9.2e %科学记数format x %9.2f %2位小数%产生随机数%1 产生20个在(0,1)区间上均匀分布的随机数uniform()set seed 100set obs 20gen r=uniform()list%clear 清除内存set seed 200 设置种子数为 200set obs 20 设置样本量为 20range no 1 20 建立编号 1 至 20gen r=uniform() 产生在(0,1)均匀分布的随机数gen group=1 设置分组变量 group 的初始值为 1sort r 对随机数从小到大排序replace group=2 in 11/20 设置最大的 10 个随机数所对应的记录为第2组,即:最小的10个随机数所对应的记录为第1组sort no 按照编号排序list 显示随机分组的结果也可以list if group==1和list no if group==1%2 产生10个服从正态分布N(100,6^2)的随机数invnorm(uniform())*sigma+u clear 清除内存set seed 200 设置种子数为 200set obs 10 设置样本量为 10 gen x=invnorm(uniform())*6+100 产生服从 N(100,6^2)的随机数list画图注意有些图前面要加histogram 直方图line 折线图scatter 散点图scatter y x,c(l) s(d) b2("(a)")graph twoway connected y x 连点图graph bar (sum) var2,over(var1) blabel(total) %条形图. graph bar p52 p72,by(d). graph bar p52 p72,over(d). graph bar p52 p72,by(d) stack. graph bar p52 p72,over(d) stack////////////数据如下%d p52 p72%1 163.2 27.4%2 72.5 83.6%3 57.2 178.2histogram x,bin(8) norm %画直方图,加正态分数线graph pie a b o ab if area==1,plabel(_all percent) %画饼图graph pie var2, over(var1) plabel(_all percent) %饼图graph pie p52 p72,by(d) %饼图graph box y1 %箱体图qnorm x %qq图lfit y x %回归直线graph matrix gender economy math 多变量散点图line yhat x||scatter y x,c(.l) s(O.) xline(12) yline(5.4) %线形图&散点图有一些通用的选项可以给图形“润色”:标题title(“string”) (string可为任意的字符串,下同)脚注note(“string”)横座标标题xtitle(“string”)纵座标标题ytitle(“sting”)横座标范围 xaxis(a,b) (a<b为两个数字,下同)纵座标范围 yaxis(a,b)插入文字 text (该命令既要指定插入文字的内容,也要指定插入的位置)插入图例 legend (该命令既要指定图例的内容,也要指定其位置)绘制散点图和线条的两个主要的选择项为:connect(c...c) //连接各散点的方式,c表示:或简写为c(c...c) . 不连接 (缺省值)l 用直线连接L 沿x方向只向前不向后直线连接m 计算中位数并用直线连接s 用三次平滑曲线连接J 以阶梯式直线条连接|| 用直线连接在同一纵向上的两点II 同 ||, 只是线的顶部和底部有一个短横Symbol(s...s) // 表示各散点的图形,s 表示:或简写为s(s...s) O 大圆圈 (缺省值)S 大方块T 大三角形o 小圆圈d 小菱形p 小加号. 小点i 无符号[varname] 用变量的取值代码表示[_n] 用点的记录号表示数学函数等都要与generate、replace、display一起使用,不能单独使用程序文件douse d:\0917.dtareg y xline y x,saving(d:\d4)按ctrl+D执行字符串操作函数:length(s) %长度函数,计算s的长度, 如,displength("ab")的结果是2substr(s,n1,n2) %子串函数,获得从s的n1个字符开始的n2个字符组成的字符串,disp substr("abcdef",2,3)的结果是"bcd"string(n) %将数值n转换成字符串函数,如,dispstring(41)+"f"的结果是"41f"real(s) %将字符串s转换成数值函数,如,dispreal("5.2")+1的结果是6.2upper(s) %转换成大写字母函数,如,disp upper("this")的结果是"THIS"lower(s) %转换成小写字母函数,如disp lower("THIS")的结果是"this"index(s1,s2) %子串位置函数,计算s2在s1中第一次出现的起始位置, 如果s2不在s1中, 则结果为0。

stata 常用命令

stata 常用命令

stata 常用命令Stata是一款经济学和统计学分析软件,它拥有一个广泛的命令库,可用于数据分析、统计建模、可视化等。

在Stata中,我们可以使用很多命令来完成各种任务。

以下是一些常用的Stata命令:1. import 命令import 命令用于导入数据到Stata中。

我们可以使用 import 命令来导入各种文件格式,如 Excel、CSV、SPSS 等。

如果我们想要导入Excel 文件,我们可以使用以下命令:import excel "data.xlsx", sheet("Sheet1") firstrow clear该命令将导入 data.xlsx 文件中的 Sheet1 中的数据到 Stata 中。

指定的 firstrow 参数将告诉 Stata 该文件中的第一行是变量名,因此我们可以让 Stata 自动读取变量名称。

2. summarize 命令summarize 命令用于计算一个或多个变量的描述性统计量,如均值、标准差、最小/最大值等。

该命令的语法如下:summarize variable1 variable2 variable3…例如,要计算变量 x 的均值、标准差和最大值,我们可以使用以下命令:summarize x, detail3. sort 命令sort 命令用于按一个或多个变量对数据进行排序。

该命令的语法如下:sort variable1 variable2 variable3…例如,要按变量 x 排序数据集,我们可以使用以下命令:sort x4. tabulate 命令tabulate 命令用于计算一个或多个变量的频率分布表(也称为列联表)。

该命令的语法如下:tabulate varia ble1 [variable2] [variable3]…例如,要计算变量 x 和 y 的频率分布表,我们可以使用以下命令:tabulate x y5. regress 命令regress 命令用于估计回归模型。

STATA常用命令总结(34个含使用示例)

STATA常用命令总结(34个含使用示例)

STATA常用命令总结(34个含使用示例)1. sum:计算变量的简要统计信息,如均值、标准差等。

示例:sum variable2. tabulate:生成变量的频数表。

示例:tabulate variable3. describe:显示数据集的基本信息,如变量名和数据类型。

示例:describe dataset4. drop:删除数据集中的变量。

示例:drop variable5. keep:保留数据集中的变量,删除其他变量。

示例:keep variable6. rename:重命名变量。

示例:rename variable newname7. gen:根据已有变量生成新的变量。

示例:gen newvar = expression8. egen:根据已有变量生成新的变量,可以使用更复杂的函数和运算符。

示例:egen newvar = function(variable)9. recode:对变量的取值进行重新编码。

示例:recode variable (oldvalues= newvalues) 10. dropif:根据条件删除观测。

示例:dropif condition11. keepif:根据条件保留观测。

示例:keepif condition12. sort:对数据集按指定变量进行排序。

示例:sort variable13. merge:将两个数据集按照共享变量合并。

示例:merge 1:1 variable using dataset214. reshape:将数据从宽格式转换为长格式或反之。

示例:reshape long var, i(id) j(year)15. regress:进行线性回归分析。

示例:regress dependent_var independent_vars 16. logistic:进行逻辑回归分析。

示例:logistic dependent_var independent_vars 17. probit:进行Probit回归分析。

STATA常用命令总结(34个含使用示例)

STATA常用命令总结(34个含使用示例)

STATA常用命令总结(34个含使用示例)1. clear:清空当前工作空间中的数据。

示例:clear2. use:加载数据文件。

示例:use "data.dta"3. describe:查看数据文件的基本信息。

示例:describe4. summarize:统计数据的描述性统计量。

示例:summarize var1 var2 var35. tabulate:制作数据的列联表。

示例:tabulate var1 var26. scatter:绘制散点图。

示例:scatter x_var y_var7. histogram:绘制直方图。

示例:histogram var8. boxplot:绘制箱线图。

示例:boxplot var1 var29. ttest:进行单样本或双样本t检验。

示例:ttest var, by(group_var)10. regress:进行最小二乘法线性回归分析。

示例:regress dependent_var independent_var1 independent_var211. logistic:进行逻辑斯蒂回归分析。

示例:logistic dependent_var independent_var1 independent_var212. anova:进行方差分析。

示例:anova dependent_var independent_var13. chi2:进行卡方检验。

示例:chi2 var1 var214. correlate:计算变量之间的相关系数。

示例:correlate var1 var2 var315. replace:替换数据中的一些值。

示例:replace var = new_value if condition16. drop:删除变量或观察。

示例:drop var17. rename:重命名变量。

示例:rename old_var new_var18. generate:生成新变量。

常用的27个Stata命令

常用的27个Stata命令

常用的27个Stata命令【1】直接导入csv格式数据insheet using name.csv, clear【2】修改变量长度format var %20.2g【3】删除重复值sort var1 var2duplicatesdrop var1 var2, force【4】数据合并use data1, clearmerge m:m var1var2 using data2drop if _merge==2drop if _merge==1drop _merge【5】生成一期滞后项tsset stkcd accpergen newvarname=L.varname【6】将文字转化为数字变量genBigN=0replaceBigN=1 if strmatch(dadtunit,'普华永道*') 【7】删除有缺失值的记录egen mis=rowmiss(_all)drop if misdrop mis【8】行业划分clonevarsic2=indorder stkcd accper sic2replace sic2=substr(sic2,1,1) if substr(sic2,1,1)!=”C”replace sic2=substr(sic2,1,2) if substr(sic2,1,1)==”C”tabulate sic2 accper【9】日期只保留年份drop if substr( reptdt ,6,2)!='12'replace reptdt=substr(reptdt,1,4)gen accper=real(reptdt)【10】数据分列split date ,parse(-) destring ignor('-')【11】求两个日期之间的间隔天数g td=date(trading_date,'YMD')g ed=date(eventdate,'YMD')form td ed %tdg d=ed-td【12】生成行业、年份哑变量tab year, gen(year)tab industry, gen(industry)【13】对数据进行Winsorize处理findit winsor2winsor2 varname, replace cut(1 99)【14】描述性统计tabstat var1var2, stat(n min mean median p25 p75 max sd), if groupvar==0 or 1logout, save(name) word replace: tabstat var, stat(n min mean p50 max sd) col(stat)f(%9.2g)【15】两变量列联表tabulate var1 var2, row chi2 taub gamma【16】两样本间的均值T检验ttest var, by(groupvar)【17】两样本中位数Z检验ranksum var, by(groupvar)【18】Pearson/Spearman系数spearmanx*n matax=st_data(.,'x*')c=correlation(x)n=rows(c)b=strofreal(lowertriangle(c)uppertriangle(st_matrix('r(Rho)')),'%9.3f')p=st_matrix('r(P)')for (i=2; i<=n; i ) {for (j=1; j<=i-1; j ) {p[i,j]=2*ttail(rows(x)-2,abs(c[i,j]/sqrt((1-c[i,j]^2)/(rows(x)-2)))) b[i,j]=b[i,j] (p[i,j]<0.01?'***':(p[i,j]<0.05?'**':(p[i,j]<0.1?'*':''))) b[j,i]=b[j,i] (p[j,i]<0.01?'***':(p[j,i]<0.05?'**':(p[j,i]<0.1?'*':''))) }}c=editvalue(b, '2.000', '1')cend直接导出结果logout, save(pw) word replace:pwcorr_avars, star1(0.01) star5(0.05) star10(0.1)【19】按年度按中位数分组方法一bysort year: egen g=xtile(var), n(2)方法二bys accper: cumul icindex, g(g) eqlevelsof accper, local(id)display '`r(levels)''local cut1 = 1/2foreach x of local id {recode g (min/`cut1'=0)(`cut1'/max=1) if accper==`x'}分三组bys accper:cumul icindex, g(g) eqlevelsof accper, local(id)display '`r(levels)''local cut1 = 1/3local cut2 = 2/3foreach x of local id {recode g (min/`cut1'=1)(`cut1'/`cut2'=2)(`cut2'/max=3)if accper==`x'}【20】输出回归结果安装ssc install estout, replace单个回归regesttab using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01)多个回归一起regest store m1regest store m2esttab m1 m2 using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01)连续运行tobit模型结果导出:esttab m1 m2, b(%9.4f) t scalars(N ll Fchi2 type), using name.rtf, compress nogap连续运行OLS模型结果导出:esttab m1m2, b(%9.4f) tscalars(N r2 F p), using name.rtf, compress nogap【21】异方差检验及处理检验:怀特检验ssc install whitetstregestat imtest, white处理:“OLS 稳健标准差”reg y x1 x2 x3, robust【22】DW检验(序列相关性一阶)gen id=_ntsset idestat dwatson【23】多重共线性reg y x1 x2 x3vif【24】是否遗漏高次项例如,检验y对x的线性回归有没有遗漏高次项reg y xestat ovtest或者estat ovtest, rhs【25】逐步回归stepwise, pe(0.1): reg y x【26】Maddala(1983)两阶段处理效应模型treatreg yx1-xn, tr(z=w1-wm)two【27】Justified Jones Modelstatsby _b, by(ind accper)saving(*.dta,replace):reg yx, noconstantmerge m:m indaccper using *.dtagen yhat=y-_b*x◆◆◆◆精彩回顾点击上图查看:7-8月北京&广州Stata暑假研讨班| 第十一&十二届“高级计量经济学及stata应用”研讨班重磅发布!。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

S tata tata 作图常用指令作图常用指令作图常用指令
1.1.茎叶图茎叶图茎叶图
stem x1,line(2)
(做x1的茎叶图,每一个十分位的树茎都被拆分成两段来显示,前半段为0~4,后半段为5~9)
stem x1,width(2)
(做x1的茎叶图,每一个十分位的树茎都被拆分成五段来显示,每个小树茎的组距为2)
stem x1,round(100)
(将x1除以100后再做x1的茎叶图)
2.2.直方图直方图
直方图 histogram mpg, discrete frequency normal xlabel(1(1)5)
(discrete 表示变量不连续,frequency 表示显示频数,normal 加入正太分布曲线,xlabel 设定x 轴,1和5为极端值,(1)为单位)
histogram price, fraction norm
(fraction 表示y 轴显示小数,除了frequency 和fraction 这两个选择之外,该命令可替换为“percent”百分比,和“density”密度;未加上discrete 就表示将price 当作连续变量来绘图)
histogram price, percent by(foreign)
(按照变量“foreign”的分类,将不同类样本的“price”绘制出来,两个图分左右排布)
histogram mpg, discrete by(foreign, col(1))
(按照变量“foreign”的分类,将不同类样本的“mpg”绘制出来,两个图分上下排布)
histogram mpg, discrete percent by(foreign, total) norm
(按照变量“foreign”的分类,将不同类样本的“mpg”绘制出来,同时绘出样本整体的“总”直方图)
3.3.二变量图二变量图二变量图
graph twoway lfit price weight || scatter price weight
(作出price和weight的回归线图——“lfit”,然后与price和weight的散点图相叠加)
twoway scatter price weight,mlabel(make)
(做price和weight的散点图,并在每个点上标注“make”,即厂商的取值) twoway scatter price weight || lfit price weight,by(foreign)
(按照变量foreign的分类,分别对不同类样本的price和weight做散点图和回归线图的叠加,两图呈左右分布)
twoway scatter price weight || lfit price weight,by(foreign,col(1))(按照变量foreign的分类,分别对不同类样本的price和weight做散点图和回归线图的叠加,两图呈上下分布)
twoway scatter price weight [fweight= displacement],msymbol(oh)
(画出price和weight的散点图,“msybol(oh)”表示每个点均为中空的圆圈,[fweight= displacement]表示每个点的大小与displacement的取值大小成比例)twoway connected y1 time, yaxis(1) || y2 time, yaxis(2)
(画出y1和y2这两个变量的时间点线图,并将它们叠加在一个图中,左边“yaxis(1)”为y1的度量,右边“yaxis(2)”为y2的)
twoway line y1 time,yaxis(1) || y2 time,yaxis(2)
(与上图基本相同,就是没有点,只显示曲线)
graph twoway scatter var1 var4 || scatter var2 var4 || scatter var3 var4(做三个点图的叠加)
graph twoway line var1 var4 || line var2 var4 || line var3 var4
(做三个线图的叠加)
graph twoway connected var1 var4 || connected var2 var4 || connected var3 var4
(叠加三个点线相连图)
更多变量
4.4.更多变量
更多变量
graph matrix a b c y
(画出一个散点图矩阵,显示各变量之间所有可能的两两相互散点图)
graph matrix a b c d,half
(生成散点图矩阵,只显示下半部分的三角形区域)
graph matrix price mpg weight length,half by( foreign,total col(1) ) (根据foreign变量的不同类型绘制price等四个变量的散点图矩阵,要求绘出总图,并上下排列)
其他图形
5.5.其他图形
其他图形
graph box y,over(x) yline(.22)
(对应x的每一个取值构建y的箱型图,并在y轴的0.22处划一条水平线) graph bar (mean) y,over(x)
对应x的每一个取值,显示y的平均数的条形图。

括号中的“mean”也可换成median、sum等
graph bar a1 a2,over(b) stack
(对应在b的每一个取值,显示a1和a2的条形图,a1和a2是叠放成一根条形柱。

若不写入“stack”,则a1和a2显示为两个并排的条形柱)
graph dot (median)y,over(x)
(画点图,沿着水平刻度,在x的每一个取值水平所对应的y的中位数上打点)qnorm x
(画出一幅分位-正态标绘图)
rchart a1 a2 a2
(画出质量控制R图,显示a1到a3的取值范围)。

相关文档
最新文档