ch2_统计图形
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
AXISn 定义坐标;
图形关键字 block hbar
RUN;
绘制的图形类型 方块图 水平的条形图
图形关键字 pie pie3d
绘制的图形类型 饼形图 三维饼形图
hbar3d
vbar vbar3d
水平的三维条形图
竖立的条形图 竖立的三维条形图
donut
star
环形图
星形图
SAS软件与统计应用教程
STAT
SAS软件与统计应用教程
STAT
2.3
统计图形
2.3.1 定量变量的图形表示
2.3.2 分类变量的图形表示
图形是展示数据的重要方法,图形的形象直观
是数据报表无法替代的。
SAS软件与统计应用教程
STAT
2.3.1 定量变量的图形表示
1. 直方图
直方图(Histogram)又称柱状图、质量分布图。是一 种统计报告图,由一系列高度不等的纵向条纹或线段表 示数据分布的情况。 一般用横轴表示数据类型,纵轴 表示分布情况。
VAXIS = 值列举
overlay
设定垂直轴主刻度的值
多个图共坐标
SAS软件与统计应用教程
STAT
SYMBOL语句用来控制表示点的符号和点间的连线。 其中n是不同SYMBOL语句的序号,可以是1-99,缺省 为1。选项见表2-7。
表2-7 SYMBOL语句的选项
选项 V = 符号 C = 颜色 CV =颜色 H = n<单位> POINTLABEL i = 连线方式 CI = 颜色 L = n W = n 意义 表示点使用的符号 表示点的符号及连线的颜色 专指点的符号的颜色 指名符号的大小 在点的附近表明Y轴变量的值 指明连线的方式 专指连线的颜色 n为线型的序号 n表示线的宽度 0 – 空白线,1 - 实线,2 – 虚线 none, join, spline, needle 单位有:cell, cm, pct, pt, in 取值 plus, x, star, square, diamond, triangle, hash, y, z, paw, point, dot, circle black, red, green, blue, cyan, magenta, gray, pink, orange, brown, yellow
SAS软件与统计应用教程
STAT
2.3.2 分类变量的图形表示
分类变量也可以通过图形直观地描绘出它们各类的数 量和所占比例,常用的有条形图、饼图和马赛克图。
1. 条形图
条形图(Bar Chart)给出分类变量取每个值的频数,如 图2-26所示为变量R_ID取值的条形图。
SAS软件与统计应用教程
STAT
PROC GPLOT DATA = <数据集名>; PLOT <纵轴变量> * <横轴变量> [= <变量>][/<选项>]; [SYMBOLn <选项>;] RUN;
常用的选项见表2-6。
SAS软件与统计应用教程
表2-6 PLOT语句的选项
选项 意义 说明
STAT
FRAM | NOFRAM
CFRAM = 颜色
可以作散点图、曲线图、直方图、扇
形图、三维曲面图、等高线图、地图
,等等。
SAS软件与统计应用教程
STAT
1. GCHART过程
(1) 语法格式 GCHART过程用于绘制直方图、饼形图(扇形图)、 三维直方图等表示变量分布的图形。其语法格式为:
PROC GCHART DATA = <数据集名>;
<图形关键字> <(分类)变量名称>/<选项列表>
proc gplot data = mylib.sryzc; plot Income*outgo = r_id; symbol1 color=black v = star; symbol2 color=blue v = dot; run;
SAS软件与统计应用教程
STAT
(3) 连线图 为了绘制连线,只要在SYMBOL语句中指定i = join。 例如绘制家庭总收入对家庭编号的连线图(图2-49左), 代码如下:
结果如图所示。
思考:subgroup和group的区别?
SAS软件与统计应用教程
STAT
可以指定分组的变量,例如在每个区段内再分段,可 以用如下代码:
proc gchart data = mylib.sryzc; vbar Income / group = R_Id; run;
结果如图所示。
SAS软件与统计应用教程
proc gchart data = mylib.sryzc; Hbar Income; run;
结果如图所示。
SAS软件与统计应用教程
STAT
可以指定分组的变量,例如在每个区段内再分段,可 以用如下代码:
proc gchart data = mylib.sryzc; vbar Income / subgroup = R_Id; run;
STAT
(4) 画饼形图 使用PIE关键字可以画饼形图,PIE3D关键字可以画 三维饼形图。例如,画出数据集mylib.sryzc中Income变 量的三维饼形图的代码如下:
proc gchart data = mylib.sryzc; PIE3D Income; run;
结果如图所示。
SAS软件与统计应用教程
SAS软件与统计应用教程
STAT
图2-22 密度直方图与频数直方图
SAS软件会根据样本容量在样本取值范围内自动地确定 一个分组方式,另外也提供了设定分组的方法。
SAS软件与统计应用教程
STAT
2. 盒形图
盒形图(boxplot,又称箱图、箱线图、盒子图), 是利用数据中的五个统计量:最小值、第一四分位数、 中位数、第三四分位数与最大值来描述数据的一种方法, 它也可以粗略地看出数据是否具有有对称性,分布的分 散程度等信息,
(2) 画条形图(直方图) 使用VBAR关键字可以画条形图。例如,画出数据集 Mylib.sryzc中Income变量的条形图的代码如下:
proc gchart data = mylib.sryzc; vbar Income; run;
结果如图所示。
SAS软件与统计应用教程
STAT
(2) 画条形图(直方图) 使用HBAR关键字可以画条形图。例如,画出数据集 Mylib.sryzc中Income变量的条形图的代码如下:
STAT
(4) 画饼形图 使用donut关键字可以画环形图,例如,画出数据集 mylib.sryzc中地区(areaID)变量的环形图的代码如下:
proc gchart data = mylib.income; donut Income/subgroup =areaID; run;
结果如图所示。
SAS软件与统计应用教程
SAS软件与统计应用教程
STAT
2.3.1 定量变量的图形表示
1. 直方图
对于数值型变量,常用直方图(histogram)来展示 变量取值的分布。将变量取值的范围分成若干区间,在 等间隔区间的情况下,每个区间的长度称为组距。考察 数据落入每一区间的频数与频率,在每个区间上画一个 矩形,它的宽度是组距,它的高度可以是频数、频率或 密度(频率/组距),在高度是密度的情况,每一矩形 的面积恰是数据落入区间的频率,这种直方图可以估计 总体的概率密度。
SAS软件与统计应用教程
STAT
2. 盒形图
图2-23的左边是根据居民家庭的收入情况所绘的盒形图; 右边是分地区情况所绘的盒形图。
SAS软件与统计应用教程
STAT
3. 散点图(Scatter Plot)。
散点图用于表示一个变量随另一个变量变化的大致趋 势。 散点图将序列显示为一组点。值由点在图表中的位置 表示。
SAS软件与统计应用教程
STAT
3. 散点图
比如家庭的收入和支出情况的数据,这里家庭总收入是 一个变量,而家庭总支出是第二个变量。希望通过图形 了解收入和支出的关系,这时可以用一个变量为横坐标 (如家庭总收入),另一个为纵坐标(这里是家庭总支 出 ) 来 作 图 ( 图 2-24 ) 。 这 种 图 称 为 散 点 图 (Scatter Plot)。
SAS软件与统计应用教程
STAT
symbol语句是全局语句;
恢复symbol的默认值: goptions reset =symbol; *关于图形的设置恢复到 默认值; goptions reset =globol; 恢复到默认值; *所有全局语句的设置
SAS软件与统计应用教程
STAT
(2) 散点图
绘制家庭总收入对家庭总支出的散点图,代码如下:
proc gplot data = mylib.sryzc; plot Income*outgo; run;
结果显示了一个GRAPHICS窗口,绘出了以Income 为纵轴、以Outgo为横轴的散点图(见图)。
SAS软件与统计应用教程
STAT
可以在图中按第三个变量分组画出散点图(如图2-48 右),代码如下:
proc gplot data = mylib.sryzc; plot Income*id; symbol i=join v=star; run;
SAS软件与统计应用教程
S百度文库AT
也可以分地区绘制家庭总收入对家庭编号的连线图 (图2-49右),代码如下:
proc gplot data = mylib.sryzc; plot Income*id=r_id; symbol1 color=black i=join v = star; symbol2 color=blue i=join v = dot; run;
马赛克图(Mosaic Plot)一般不对单个变量做,而是对 两个分类变量来做。这种图的好处是直观显示了两个变 量每种取值组合的观测个数和比例,如图2-28所示。
2.4.3 编程绘制统计图
SAS软件与统计应用教程
STAT
SAS可以把存贮在SAS数据集中的数据
以图形的方式形象直观地显示出来。
在SAS/GRAPH模块的支持下,SAS
STAT
图形关键字后的变量名用以指定进行图形描述时的分组 变量,可以是数值型的(此时以各组的组中值为分组的 标志),也可以是字符型的。 选项比较重要的有: SUBGROUP = 变量名(分组变量),指定要进行分组 (各组段内再分组)的变量; TYPE = 统计量关键字,表示对变量(SUMVAR所指定 的变量)的哪一种统计量进行绘图,比如频数 (FREQ)、均数(MEAN)、总计(SUM)、频数百 分比(PCTN)等; SUMVAR = 变量名(数值变量),指定要进行统计计 算的变量,也就是“TYPE = 统计量关键字”选项中统 计量的计算所依据的变量。
SAS软件与统计应用教程
STAT
proc gchart data = mylib.income;
vbar areaid/sumvar=income type =mean; run;
SAS软件与统计应用教程
STAT
2. 使用GPLOT过程绘制散点图和连线图
通常用散点图和连线图可以表示: ● 一个变量随另一个变量的变化; ● 变量之间的关系; ● 数据值的分布。 (1) GPLOT过程的一般格式
SAS软件与统计应用教程
STAT
4. 线图
线图(Line Plot)用来表示变量间的取值变化情况. 适用于显示在相等时间间隔下数据的趋势。在折线图中, 类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀 分布。
SAS软件与统计应用教程
STAT
4. 线图
有单式和复式两种(图2-25)。 在复式线图中可用不同颜色的实线来标志区别,如图 2-25右所示。
STAT
(3) 画三维条形图 使用BLOCK关键字可以画三维条形图。例如,画出 数据集mylib.sryzc中Income变量的三维条形图的代码如 下:
proc gchart data = mylib.sryzc; block Income/ group = R_Id; run;
结果如图所示。
SAS软件与统计应用教程
在图形四周加入或不加入边框
边框内的颜色
缺省为 加入
缺省为 白色
AUTOHREF(AUTOV EREF)
NOAXIS CAXIS = 颜色 CTEXT = 颜色 HAXIS = 值列举
在水平(垂直)轴的每个主刻度处 加入水平(垂直)参考线
取消坐标轴及相关的图形元素 设定轴的颜色 设定与轴相关字符的颜色 设定水平轴主刻度的值
2. 饼图
通常,饼图(Pie Chart)可以对分类变量描述其频数取 值的比例,对于数值变量,则像直方图那样应先计算各 区间取值的频数,再按比例画出。 图2-27中给出的是家庭支出分组频数的饼图。要注意 的是,如果有太多的分组,那么饼图就不那么好看了。
SAS软件与统计应用教程
STAT
3. 马赛克图
图形关键字 block hbar
RUN;
绘制的图形类型 方块图 水平的条形图
图形关键字 pie pie3d
绘制的图形类型 饼形图 三维饼形图
hbar3d
vbar vbar3d
水平的三维条形图
竖立的条形图 竖立的三维条形图
donut
star
环形图
星形图
SAS软件与统计应用教程
STAT
SAS软件与统计应用教程
STAT
2.3
统计图形
2.3.1 定量变量的图形表示
2.3.2 分类变量的图形表示
图形是展示数据的重要方法,图形的形象直观
是数据报表无法替代的。
SAS软件与统计应用教程
STAT
2.3.1 定量变量的图形表示
1. 直方图
直方图(Histogram)又称柱状图、质量分布图。是一 种统计报告图,由一系列高度不等的纵向条纹或线段表 示数据分布的情况。 一般用横轴表示数据类型,纵轴 表示分布情况。
VAXIS = 值列举
overlay
设定垂直轴主刻度的值
多个图共坐标
SAS软件与统计应用教程
STAT
SYMBOL语句用来控制表示点的符号和点间的连线。 其中n是不同SYMBOL语句的序号,可以是1-99,缺省 为1。选项见表2-7。
表2-7 SYMBOL语句的选项
选项 V = 符号 C = 颜色 CV =颜色 H = n<单位> POINTLABEL i = 连线方式 CI = 颜色 L = n W = n 意义 表示点使用的符号 表示点的符号及连线的颜色 专指点的符号的颜色 指名符号的大小 在点的附近表明Y轴变量的值 指明连线的方式 专指连线的颜色 n为线型的序号 n表示线的宽度 0 – 空白线,1 - 实线,2 – 虚线 none, join, spline, needle 单位有:cell, cm, pct, pt, in 取值 plus, x, star, square, diamond, triangle, hash, y, z, paw, point, dot, circle black, red, green, blue, cyan, magenta, gray, pink, orange, brown, yellow
SAS软件与统计应用教程
STAT
2.3.2 分类变量的图形表示
分类变量也可以通过图形直观地描绘出它们各类的数 量和所占比例,常用的有条形图、饼图和马赛克图。
1. 条形图
条形图(Bar Chart)给出分类变量取每个值的频数,如 图2-26所示为变量R_ID取值的条形图。
SAS软件与统计应用教程
STAT
PROC GPLOT DATA = <数据集名>; PLOT <纵轴变量> * <横轴变量> [= <变量>][/<选项>]; [SYMBOLn <选项>;] RUN;
常用的选项见表2-6。
SAS软件与统计应用教程
表2-6 PLOT语句的选项
选项 意义 说明
STAT
FRAM | NOFRAM
CFRAM = 颜色
可以作散点图、曲线图、直方图、扇
形图、三维曲面图、等高线图、地图
,等等。
SAS软件与统计应用教程
STAT
1. GCHART过程
(1) 语法格式 GCHART过程用于绘制直方图、饼形图(扇形图)、 三维直方图等表示变量分布的图形。其语法格式为:
PROC GCHART DATA = <数据集名>;
<图形关键字> <(分类)变量名称>/<选项列表>
proc gplot data = mylib.sryzc; plot Income*outgo = r_id; symbol1 color=black v = star; symbol2 color=blue v = dot; run;
SAS软件与统计应用教程
STAT
(3) 连线图 为了绘制连线,只要在SYMBOL语句中指定i = join。 例如绘制家庭总收入对家庭编号的连线图(图2-49左), 代码如下:
结果如图所示。
思考:subgroup和group的区别?
SAS软件与统计应用教程
STAT
可以指定分组的变量,例如在每个区段内再分段,可 以用如下代码:
proc gchart data = mylib.sryzc; vbar Income / group = R_Id; run;
结果如图所示。
SAS软件与统计应用教程
proc gchart data = mylib.sryzc; Hbar Income; run;
结果如图所示。
SAS软件与统计应用教程
STAT
可以指定分组的变量,例如在每个区段内再分段,可 以用如下代码:
proc gchart data = mylib.sryzc; vbar Income / subgroup = R_Id; run;
STAT
(4) 画饼形图 使用PIE关键字可以画饼形图,PIE3D关键字可以画 三维饼形图。例如,画出数据集mylib.sryzc中Income变 量的三维饼形图的代码如下:
proc gchart data = mylib.sryzc; PIE3D Income; run;
结果如图所示。
SAS软件与统计应用教程
SAS软件与统计应用教程
STAT
图2-22 密度直方图与频数直方图
SAS软件会根据样本容量在样本取值范围内自动地确定 一个分组方式,另外也提供了设定分组的方法。
SAS软件与统计应用教程
STAT
2. 盒形图
盒形图(boxplot,又称箱图、箱线图、盒子图), 是利用数据中的五个统计量:最小值、第一四分位数、 中位数、第三四分位数与最大值来描述数据的一种方法, 它也可以粗略地看出数据是否具有有对称性,分布的分 散程度等信息,
(2) 画条形图(直方图) 使用VBAR关键字可以画条形图。例如,画出数据集 Mylib.sryzc中Income变量的条形图的代码如下:
proc gchart data = mylib.sryzc; vbar Income; run;
结果如图所示。
SAS软件与统计应用教程
STAT
(2) 画条形图(直方图) 使用HBAR关键字可以画条形图。例如,画出数据集 Mylib.sryzc中Income变量的条形图的代码如下:
STAT
(4) 画饼形图 使用donut关键字可以画环形图,例如,画出数据集 mylib.sryzc中地区(areaID)变量的环形图的代码如下:
proc gchart data = mylib.income; donut Income/subgroup =areaID; run;
结果如图所示。
SAS软件与统计应用教程
SAS软件与统计应用教程
STAT
2.3.1 定量变量的图形表示
1. 直方图
对于数值型变量,常用直方图(histogram)来展示 变量取值的分布。将变量取值的范围分成若干区间,在 等间隔区间的情况下,每个区间的长度称为组距。考察 数据落入每一区间的频数与频率,在每个区间上画一个 矩形,它的宽度是组距,它的高度可以是频数、频率或 密度(频率/组距),在高度是密度的情况,每一矩形 的面积恰是数据落入区间的频率,这种直方图可以估计 总体的概率密度。
SAS软件与统计应用教程
STAT
2. 盒形图
图2-23的左边是根据居民家庭的收入情况所绘的盒形图; 右边是分地区情况所绘的盒形图。
SAS软件与统计应用教程
STAT
3. 散点图(Scatter Plot)。
散点图用于表示一个变量随另一个变量变化的大致趋 势。 散点图将序列显示为一组点。值由点在图表中的位置 表示。
SAS软件与统计应用教程
STAT
3. 散点图
比如家庭的收入和支出情况的数据,这里家庭总收入是 一个变量,而家庭总支出是第二个变量。希望通过图形 了解收入和支出的关系,这时可以用一个变量为横坐标 (如家庭总收入),另一个为纵坐标(这里是家庭总支 出 ) 来 作 图 ( 图 2-24 ) 。 这 种 图 称 为 散 点 图 (Scatter Plot)。
SAS软件与统计应用教程
STAT
symbol语句是全局语句;
恢复symbol的默认值: goptions reset =symbol; *关于图形的设置恢复到 默认值; goptions reset =globol; 恢复到默认值; *所有全局语句的设置
SAS软件与统计应用教程
STAT
(2) 散点图
绘制家庭总收入对家庭总支出的散点图,代码如下:
proc gplot data = mylib.sryzc; plot Income*outgo; run;
结果显示了一个GRAPHICS窗口,绘出了以Income 为纵轴、以Outgo为横轴的散点图(见图)。
SAS软件与统计应用教程
STAT
可以在图中按第三个变量分组画出散点图(如图2-48 右),代码如下:
proc gplot data = mylib.sryzc; plot Income*id; symbol i=join v=star; run;
SAS软件与统计应用教程
S百度文库AT
也可以分地区绘制家庭总收入对家庭编号的连线图 (图2-49右),代码如下:
proc gplot data = mylib.sryzc; plot Income*id=r_id; symbol1 color=black i=join v = star; symbol2 color=blue i=join v = dot; run;
马赛克图(Mosaic Plot)一般不对单个变量做,而是对 两个分类变量来做。这种图的好处是直观显示了两个变 量每种取值组合的观测个数和比例,如图2-28所示。
2.4.3 编程绘制统计图
SAS软件与统计应用教程
STAT
SAS可以把存贮在SAS数据集中的数据
以图形的方式形象直观地显示出来。
在SAS/GRAPH模块的支持下,SAS
STAT
图形关键字后的变量名用以指定进行图形描述时的分组 变量,可以是数值型的(此时以各组的组中值为分组的 标志),也可以是字符型的。 选项比较重要的有: SUBGROUP = 变量名(分组变量),指定要进行分组 (各组段内再分组)的变量; TYPE = 统计量关键字,表示对变量(SUMVAR所指定 的变量)的哪一种统计量进行绘图,比如频数 (FREQ)、均数(MEAN)、总计(SUM)、频数百 分比(PCTN)等; SUMVAR = 变量名(数值变量),指定要进行统计计 算的变量,也就是“TYPE = 统计量关键字”选项中统 计量的计算所依据的变量。
SAS软件与统计应用教程
STAT
proc gchart data = mylib.income;
vbar areaid/sumvar=income type =mean; run;
SAS软件与统计应用教程
STAT
2. 使用GPLOT过程绘制散点图和连线图
通常用散点图和连线图可以表示: ● 一个变量随另一个变量的变化; ● 变量之间的关系; ● 数据值的分布。 (1) GPLOT过程的一般格式
SAS软件与统计应用教程
STAT
4. 线图
线图(Line Plot)用来表示变量间的取值变化情况. 适用于显示在相等时间间隔下数据的趋势。在折线图中, 类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀 分布。
SAS软件与统计应用教程
STAT
4. 线图
有单式和复式两种(图2-25)。 在复式线图中可用不同颜色的实线来标志区别,如图 2-25右所示。
STAT
(3) 画三维条形图 使用BLOCK关键字可以画三维条形图。例如,画出 数据集mylib.sryzc中Income变量的三维条形图的代码如 下:
proc gchart data = mylib.sryzc; block Income/ group = R_Id; run;
结果如图所示。
SAS软件与统计应用教程
在图形四周加入或不加入边框
边框内的颜色
缺省为 加入
缺省为 白色
AUTOHREF(AUTOV EREF)
NOAXIS CAXIS = 颜色 CTEXT = 颜色 HAXIS = 值列举
在水平(垂直)轴的每个主刻度处 加入水平(垂直)参考线
取消坐标轴及相关的图形元素 设定轴的颜色 设定与轴相关字符的颜色 设定水平轴主刻度的值
2. 饼图
通常,饼图(Pie Chart)可以对分类变量描述其频数取 值的比例,对于数值变量,则像直方图那样应先计算各 区间取值的频数,再按比例画出。 图2-27中给出的是家庭支出分组频数的饼图。要注意 的是,如果有太多的分组,那么饼图就不那么好看了。
SAS软件与统计应用教程
STAT
3. 马赛克图