第三章 statar软件教程-基础图形绘制
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我们着重讲解上述选项中最重要的三个选项:connect(connectstyle)、sort[(varlist)] 和lpattern(linepatternstyle)。
Page 13
STATA从入门到精通
3.2.5震荡选项(jitter_options)的设定
一旦我们设定了震荡选项jitter(#),scatter会在绘图前向数据中增加 白噪声,选项中的数字“#”就是用来指定一个数字,表明震荡的程 度占绘图区域的百分比。
STATA从入门到精通
Page 10
变量名
存储 方式
显示 方式 %12.0g %28s %9.0g %9.0g
标签
含义
region country popgrowth lexp
byte str28 float byte
region
地区,1表示欧洲或者亚洲、2表示北美洲、 3表示南美洲 国家名称 平均人口增长率(%) 预期人口寿命(年)
散点的形状选项可以简写为ms( ),括号中填充的是各种形状,表3-5总结了散点图形状的各种选择。
2. 散点的颜色mcolor(colorstylelist) 散点的颜色选择非常丰富,包括从黑到白的灰阶、蓝色、黄色、红色,还可以使用RGB或者CMYK进 行数字调色,. 3. 散点的大小msize(markersizestylelist) msize(markersizestylelist)选项用于控制每个散点的大小,这个选项的取值从最小的vtiny到最大的 ehuge。这些取值都是有含义的:第一个层次是tiny,第二个层次是small,第三个层次是medium,接 着是large和huge, 4. 散点的整体设定 可以通过另外一个选项来同时设定这五个方面,也就是设定散点图的整体显示效果,这个选项就是 markerstyle( )。 其的取值如下:p1 - p15 设定散点图整体样式;p1box - p15box 设定箱线图整体样式;p1dot p15dot 设定点图图整体样式。
所谓“markers”就是在纸上画点的用笔手法,所以散点显示选项(marker_options)的设定包括了 散点的形状、颜色、大小等等。这其中,散点的形状msymbol(symbolstylelist)、散点的颜色 mcolor(colorstylelist)和散点的大小msize(markersizestylelist)是比较重要的三个选项. 1. 散点的形状msymbol(symbolstylelist)
Page 8
STATA从入门到精通
3.2.3散点标签选项(marker_label_options)的设定
散点标签选项(marker_label_options)用于设定散点图标签,所谓散点图 标签一般是指位于每个散点旁的用于说明该散点所代表个体的文字,比如如 果我们所做的图形是每个国家的期望寿命与这个国家的人均GNP之间的散点 图,那么我们可能需要在每个散点旁放置一个“标签”用以说明每个散点所 代表的国家。散点标签选项主要包括表3-8 所示的九个具体的选项: 选项名称 含义 mlabel(varname) 确定标签变量 mlabstyle(markerlabelstyle) 标签整体样式 mlabposition(clockposstyle) 标签位置 mlabvposition(varname) 另一种标签的方法 mlabgap(relativesize) 标签与散点的距离 mlabangle(anglestyle) 标签的角度 mlabtextstyle(textstyle) 标签文字的整体样式 mlabsize(textsizestyle) 标签的大小 mlabcolor(colorstyle) 标签的颜色
Page 12
STATA从入门到精通
3.2.4连线选项(connect_options)的设定
连线选项(connect_options)用来设定如何用线将散点图上各点连接起来,这样可 以更加清楚地查看变动的趋势。
选项名称 connect(connectstyle) sort[(varlist)] cmissing({y|n} ...) lpattern(linepatternstyle) lwidth(linewidthstyle) lcolor(colorstyle) lstyle(linestyle) pstyle(pstyle) recast(newplottype) (newplottype) 选项含义 设定如何连接相邻的两点 在连接之前首先对x轴变量进行排序 如何对待缺失值 连线的类型,是实现还是虚线 连线的宽度 连线的颜色 连线的整体样式 整体的作图样式 更高阶的选项,将绘图视为一个新的绘图类型
STATA从入门到精通
3.2绘制散点图
3.2.1绘制散点图的命令和最基本的使用
绘制散点图的命令语法如下: [twoway] scatter varlist [if] [in] [weight] [, options]
scatter绘图还可以与其他类型二维制图命令放在一起,绘制重叠的复 合图形,比如可以是如下形式的命令:
表3-3 year 1900 1901 1902 1903 1904 1905 1906 1907 1908 1909 1910 1911 1912 1913 1914
数据集uslifeexp2.dta le year le 47.3 1915 54.5 49.1 1916 51.7 51.5 1917 50.9 50.5 1918 39.1 47.6 1919 54.7 48.7 1920 54.1 48.7 1921 60.8 47.6 1922 59.6 51.1 1923 57.2 52.1 1924 59.7 50 1925 59 52.6 1926 56.7 53.5 1927 60.4 52.5 1928 56.8 54.2 1929 57.1
关于散点标签的设置
关于点与点之间连接线的设置 图形的整体类型 振荡散点的设置 关于附加坐标的设置 包括图题、图例、坐标线、图形文 字、by语句、以及区域(regions) 选项的设置等
Page 4
STATA从入门到精通
【例3-1】数据集uslifeexp2.dta是一个关于美国1900年到1940年人均期望寿命 的数据,这个数据只有两个变量year和le,前者记录年份,后者则是该年份 的美国人期望寿命(单位:年),数据的情况如表3-2。
gnppc
safewater
float
byte
%9.0g
%9.0g
人均GNP(美元)
安全饮水情况(一个从1到100的指数,部 分数据有缺失)
Page 11
STATA从入门到精通
【例3-4】再次利用数据集lifeexp.dta,要求用北美洲国家的数据绘 制以预期人口寿命lexp为y轴变量,以人均GNP gnppc为x轴变量的 散点图,要求添加国家名称country作为标签,并将标签放置在隐藏 的散点上。
百度文库
核心部分中诸如轴线间隔、连线、数值显示等附加部分;
用户在核心部分周围添加的诸如图形名称、轴线说明、图例名称、数据 来源等文字部分; 在复杂图形中,用户添加在核心部分上的其他图形的叠加部分。 第1与第4部分是由Stata制图命令的主干部分来完成的,而第2与第3 部分则是由制图命令中的选项来完成的。
Page 2
Page 7
STATA从入门到精通
【例3-2】这里仍然使用第二章中的数据集wage.dta,这是一个关于就业的微观 数据集,该数据集共有526个观测值,24个变量,主要变量的情况是:wage表 示工资(百元), educ表示教育程度, exper表示工作经验即工作的年数, tenure表示在当前岗位上工作的年数,以上变量都是以年来计量的,接下来的三 个虚拟变量nonwhite、female、married分别表示是否是白种人、是否是女性 以及是否婚配。 我们拟利用这个数据集绘制educ与wage以及exper与wage的散点图。具体要求 如下: 默认情况下绘制女性的educ与wage以及exper与wage的散点图。 绘制女性的educ与wage以及exper与wage的散点图,要求前者使用整 体样式p9,后者使用整体样式p8。 绘制女性的educ与wage以及exper与wage的散点图,要求散点图形状 前者选择实心圆,后者选择大写字母X;散点颜色前者选择绿色,后者选择蓝色; 塞散点大小均选择中等。 绘制女性的educ与wage以及exper与wage的散点图,要求前者使用整 体样式p9,后者使用整体样式p8。同时,散点图形状前者选择实心圆,后者选 择大写字母X;散点颜色前者选择绿色,后者选择蓝色;塞散点大小均选择中等。
. twoway (scatter ...) (line ...) (lfit ...) ... 上述命令也可以等价地写成: . scatter ... || line ... || lfit ... || ... 其中line或者lfit都是其他的二维制图命令。
Page 3
STATA从入门到精通
利用该数据,我们要求完成如下三个任务:
1. 使用这个数据集绘制le和year的散点图。
2. 绘制le和year的散点图,并将各点用直线连接起来。 3. 要求绘制如3-2一样的图形,但是要将其中的散点去掉。
Page 5
STATA从入门到精通
【例3-5】使用Stata的系统数据auto.dta,这个数据在前面已经多次 使用,这里不再赘述。请绘制mpg和weight的散点图,并使用震荡 选项使各个散点相互分离。
scatter命令的选项非常复杂,我们将逐个解析,力图通过详细的讲解使读者 明白常用选项的使用,表3-2罗列了这些选项的分类:
表3-2 scatter绘图命令的选项分类
选项(options) marker_options 含义 关于散点外观的设置
marker_label_options
connect_options composite_style_option jitter_options axis_choice_options twoway_options
STATA 从入门到精通
第三章 基础图形绘制
3.1 Stata绘图简介
3.1.1主要的图形类型
Stata提供了包含广泛图形库的一系列图形类型供用户使用。其中主 要的图形类型有以下几种:直方图、扇形图、条形图、散点图、直线 图以及数据拟合图。 3.1.2图形的组成部分与制图命令的结构 简单地讲,Stata中图形的组成大致可以分为以下四个部分: 由横轴与纵轴围成的图形的核心部分;
STATA从入门到精通
Page 9
【例3-3】数据集lifeexp.dta是一个关于全球68国人口生存状况的数据, 这些国家分别来自欧亚、北美和南美四大洲,表3-10 是所有变量的 一个概览,表3-11列出了数据集中北美洲国家的观测值,这一部分也 正是本例所需要的数据。要求使用北美洲国家的数据绘制以预期人口 寿命lexp为y轴变量,以人均GNP gnppc为x轴变量的散点图,要求 添加国家名称country作为标签,并使得这些标签可以恰当的显示而 不相互重叠。 我们分如下四步来完成这一任务: 首先打开数据集lifeexp.dta,并使用list命令查看北美洲国家的数据。 然后使用Stata默认的设置绘制添加了国家名称作为标签的散点图。 尝试利用mlabpos( )选项调整标签的位置。 尝试利用mlabvposition(varname)选项为某些特殊的观测值设定标 签位置。 尝试利用改变坐标轴的覆盖范围来设定标签。
year 1930 1931 1932 1933 1934 1935 1936 1937 1938 1939 1940
le 59.7 61.1 62.1 63.3 61.1 61.7 58.5 60 63.5 63.7 62.9
Page 6
STATA从入门到精通
3.2.2散点显示选项(marker_options)的设定