SAS作图详细教程剖析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数值型
数值型
悬浮颗粒物含量的平均值
铅含量的平均值
取纽约州的数据制作平均悬浮颗粒物含量随月份变化的散点图 : libname dst 'd:\sasbook\dst'; goptions reset=all; proc gplot data=dst.airqual; plot ave_tsp*month; where state='NY'; run;
2.基本散点图
一般形式:
PROC GPLOT <DATA = 数据集名>; PLOT 纵坐标变量*横坐标变量; RUN;
说明:
1)DATA = 数据集名:此选项指定数据集的名称, 要求用二级文件名表示; 2)PLOT语句中指定纵坐标变量和横坐标变量,要求 必须是数值型变量; 3)每条观测对应图上的一个点。
3.散点图和连线图的修饰
点的符号、大小、颜色; 点间连线、连线方式、线型、宽度; 坐标轴:包括刻度、标签、颜色等; 图例的配置与修饰。
3.1 SYMBOL语句
一般形式:
SYMBOL<n> 选项;
功能:用于控制图中点和连线的显示方式。 说明:n是SYMBOL语句序号,取值范围:1~99。系统缺 省值为1。 取消SYMBOL语句的设置
例1:假设数据集dst.airqual中保存的是在 一段时间内美国47个州的逐月的空气质量监 测数据。其中包含下列变量:
变量名
STATE REGION MONTH
类型
字符型 数值型 数值型
说明
州名,用2个字母的缩写表示 州所在地区,用1~7的数字表示 月份,用1~12的数字表示
AVE_TSP
AVE_LEAD
BLACK
RED GREEN BLUE YELLOW CYAN MAGENTA PINK ORANGE
黑色(缺省方式)
红色 绿色 蓝色 黄色 青色 洋红 粉红 橙色
BROWN
GREY
棕色
ቤተ መጻሕፍቲ ባይዱ灰色
HEIGHT | H = n<单位>:设置图中点的大小。
CELL CM 单元,SAS默认单位 厘米
PCT
PT IN
说明:
过程步都是以PROC语句开始,后面紧跟过程名, 用以区分不同的过程步。 尖括号中的内容是可选项,省略时对应的系统默 认值如下:
处理最近建立的数据集; 处理所有变量(对于一个计算过程步处理所有数值变 量); 处理数据集中的所有观测。
§2 制作散点图和连线图
散点图——以数据集中某两个变量为纵坐标 变量和横坐标变量,每条观测对应于图中的 一个点,数据集中的多条观测就在平面上构 成一幅散点图。 连线图——是将散点图中的各点之间以一定 的方式用直线或曲线相连所形成的图形。
屏幕画面大小的百分数
象素 英寸
POINTLABEL:在图中每个点的旁边标注纵坐标变量的值。 例2:对于例1我们作如下修饰:
goptions reset=all; symbol v=diamond cv=red h=1.5 pointlabel; proc gplot data=dst.airqual; plot ave_tsp*month; where state='NY'; run;
SAS作图详细教程
§1 SAS程序的过程步
SAS 的过程步可看作是已经编写好的子程序, 用户可以在需要的时候调用它们。 过程步的一般形式:
PROC 过程名 <DATA = 数据集名> <选项>; 过程的专用语句描述; <VAR 变量序列;> <WHERE 条件表达式;> <BY 变量序列;> RUN;
不加选项的SYMBOL语句 SYMBOL<n>; 通过恢复系统缺省设置的图形选项语句取消前面对所有SYMBOL 语句的设置。 GOPTIONS RESET = SYMBOL;
全局性:可以出现在过程步内或过程步之外,一旦定义则一直保持 到重新定义或退出SAS系统; 可加性:一个选项的定义不影响其他选项。
性质
1)设置点
VALUE | V = 符号:设置图中点的表示符号
符号名称 PLUS X STAR SQUARE DIAMOND TRIANGLE HASH 符号表示 +(缺省方式) X * □ ◇ △ #
PAW
POINT DOT CIRCLE NONE
::
. ● ○ 无符号
COLOR | C = 颜色:设置图中点和连线的颜色。 CV=颜色:设置图中点的颜色。
2)设置连线
选项 : INTEPOL | I = 连线方式:设置相邻点之间的连线方式。
名称 NONE JOIN SPLINE NEEDLE SMnn RL<CLInn> RQ RC 连线方式 不连线(缺省方式) 直线 光滑的样条曲线 通过点的并且垂直于横坐标轴的直线 绘制不经过散点的样条曲线。nn曲线光滑性与拟合度的 折衷,取值:00~99。 线性回归直线,CLInn:另外绘制预测值的置信区间曲线, nn:置信区间大小。 二次曲线 三次曲线
GOPTIONS 图形选项;
功能:根据需要来进行图形选项的设置,设置有 关图形输出的各项参数。 说明:
此操作一般在绘图之前进行。 此语句属于环境设置语句。
恢复系统的缺省设置
图形选项:
RESET = ALL | GOPTIONS | GLOBAL | ……
说明:
GOPTIONS:将所有全局语句(如TITLE等)的设置恢复为缺省状 态。 GOPTIONS:将所有关于图形的设置恢复为缺省状态。 ALL:同时实现上述两种功能。
散点图和连线图的作用:
1)揭示一个变量随另一个变量的变化 2)显示变量间的关系 3)对不同的数据进行比较 4)显示数据值的分析
实现:调用过程步GPLOT或PLOT。前者是 在GRAPH窗口中以精确方式绘图,后者是 在OUTPUT窗口中以非精确方式绘图。
1.图形选项设置
一般形式:
注意:绘制高分辨率的统计图非常耗费系统资源,因此当我们 提交作图语句时,SAS系统只是把它们送入程序缓冲区。只有 当用户打开GRAPH窗口时,程序才真正执行,绘出统计图。然 后此过程步处于驻留状态,系统可以继续执行所提交的语句, 从而实现了用户和系统之间的交互操作。结束驻留状态的方法 有:(1)提交另一个程序步;(2)提交QUIT语句。