第五章.spss之统计图的绘制(张文彤)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章:SPSS统计绘图功能详解
(医学统计之星:张文彤)
上次更新日期:
5.1 常用统计图
5.1.1 操作界面介绍(条图)
5.1.1.1 条图的通用界面
5.1.1.2 复式条图与分段条图的界面
5.1.2 其他常用统计图
5.1.2.1 散点图
5.1.2.2 线图
5.1.2.3 饼图
5.1.2.4 面积图
5.1.2.5 直方图
5.1.2.6 其他
5.1.3 常用统计图编辑方法详解
5.2 交互式统计图
5.3 统计地图
在常用的统计软件中,SAS绘制的统计图不太美观;而SPSS绘制的统计图较为美观,可以满足大多数情况下的要求;STATA绘制的统计图形最为精美,但由于它采用命令行方式操作,美观的图形需要添加大量选项,普通人不易掌握;而S-PLUS、MATHLAB等偏数理统计的软件虽然绘图能力也非常强,但由于自
身的定位问题,并不为大多数人所熟悉。因此,在各种统计软件中,以SPSS 制作的统计图应用最为广泛。
EXECL的统计绘图功能非常的强,我们还有必要学习SPSS的绘图功能吗?
这个问题我的看法是:EXCEL由于它的纯中文界面和简单而强大的绘图功能,使得可以用它来直接绘制各种简单的统计图,但是,EXCEL可以直接绘制的统计图种类有限,象误差条图、自回归图等它就无能为力,即是它支持的线图、条图等,如果过于复杂,如叠式条图、累计条图等也无法作出,而这些图在统计中是经常会碰到的,此时就只有采用统计软件来绘制,SPSS就是其中的佼佼者。
§5.1常用统计图
在SPSS 10.0版中,除了生存分析所用的生存曲线图被整合到ANALYZE 菜单中外,其他的统计绘图功能均放置在graph菜单中。该菜单具体分为以下几部分:
•Gallery:相当于一个自学向导,将统计绘图功能做了简单的介绍,初学者可以通过它对SPSS的绘图能力有一个大致的了解。
•Interactive:交互式统计图,这是SPSS 9.0版新增的内容。
•Map:统计地图,这是SPSS 10.0版新增的内容。
市面上所能见到的SPSS 10.0 D版由于执照不全,并不能安装统计地图模块。
•下方的其他菜单项是我们最为常用的普通统计图,具体来说有:
条图散点图线图
直方图饼图面积图
箱式图正态Q-Q图正态P-P图
质量控制图Pareto图自回归曲线图
高低图交互相关图序列图
频谱图误差线图
其中后面几种图形用于时间序列分析。我们的讲解将这些常规统计图为主,对交互式统计图和统计地图只举例介绍,就不再全面讲述了。
我们所用的数据集为SPSS自带的anxiety.sav,本章的大多数例子都将围绕该数据集展开。
5.1.1 操作界面介绍(条图)
5.1.1.1 条图的通用界面
由于不同图形的绘图对话框有相当强的共性,下面我们通过一个简单的例子来看看绘图菜单的大致界面是怎么样的,通过这个例子大家可以举一反三。
例5.1:在数据集anxiety.sav中分不同的subject对变量score值(之和)绘制条图。
选择graphs==>bar后,系统首先会弹出一个简单的导航对话框如下所示:绘制简单条图(单式条图)
绘制复式条图
绘制堆积条图(分段条图)
定义统计图中数据的表达类型:
条图反映了同一变量若干条记录的分组汇总
条图反映了不同变量的汇总
条图反映了个体观察值
在该对话框中,SPSS将条图进行了大致的分类,对话框的上半部分用于选择条图类型,下半部分的Data in Chart are单选框组用于定义条图中数据的表达类型。这里根据我们所需绘制条图的类型,应该选择简单条图,在表达类型中则应选择"Summaries for groups of cases"。选好后单击DEFINE钮,系统开启正式的条图定义对话框如下:
对话框左侧为通用的侯选变量列表框,右侧的对话框元素依次解释如下:【Bars Represent单选框组】
用于定义条图中直条所代表的含义,可以是样本例数、样本数所占的百分比、累计样本例数、累计样本数所占的百分比或其余汇总函数,在例5.1中我们要对变量score的值绘图,因此选择最后一项"Other summary function",系统开启summary function对话框如下所示:
该对话框中列出了更多的统计汇总函数,可以满足绝大多数情况的需要。具体有:
•上部:包括大多数常用统计汇总函数,如均数、标准差、中位数、方差、众数、最大、最小值、样本例数、变量值之和、累计变量值。
•中部:可对各记录按大小进行筛选,如上侧百分之多少,或者只选择小
于某个数值的记录。具体的数值在value框中输入。
•下部:可按数值大小值选择取值在某个范围内的记录,具体的范围在low 和high框中输入。
注意上面的一些函数是和前面重复的,如样本例数。
此外,对话框最下侧还有一个Values are grouped midpoints复选框,当选中median of values或percentile单选框时该框变为可选,选中则表明数据为频数表格式,所输入的数值为组中值。
根据我们的目的,这里选择sum of values单选框,单击continue后系统回到上一个对话框。
【Category Axis框】
用于选择所需的分类变量,此处必选。这里根据要求,将subject选入,可以见到此时OK已经变黑可用了。
【Template框】
用于选择绘制条图的模板,一般较少用。
【Titles钮】
用于输入统计图的标题和脚注,最多可以输入两行主标题,一行副标题,两行脚注。
【Options钮】
弹出Options对话框,用于定义相关的选项,有:
o Confidence Interval框输入需要计算的均数差值可信区间范围,默认为95%。如果是和总体均数为0相比,则此处计算的就是样本所在总
体均数的可信区间。
o Missing Values单选框组定义分析中对缺失值的处理方法,可以是具体分析用到的变量有缺失值才去除该记录(Excludes cases analysis by