SPSS学习系列16. 统计量与统计图
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
16. 统计量与统计图
针对连续变量做描述性统计。描述性统计量分为:
(1)刻画集中趋势——均值、中位数、众数;
(2)刻画离散程度——方差、标准差、极差、变异系数;
(3)刻画分布形态——偏度、峰度。
一、简单的描述性统计
有数据文件:
对“数学成绩”、“英语成绩”做描述性统计。
1. 【分析】——【描述统计】——【描述】,打开“描述性”窗口,将变量“数学成绩”“英语成绩”选入【变量】框,
2.点【选项】,打开“选项”子窗口,根据需要勾选
点【继续】回到原窗口;
若需要得到Z标准分数,勾选“将标准化得分另存为变量”;点【确定】得到
注:默认是按变量选入顺序输出上表。
二、探索性描述统计
输出统计量和统计图,其主要作用有:
(1)检查异常值;(2)检验数据的分布特征(是否服从正态分布);
1.【分析】——【描述统计】——【探索】,打开“探索”窗口,将变量“数学成绩”“英语成绩”选入【变量】框
注:若在【因子变量】框选入若干分类变量,将按其水平值组合分别统计分析;注意勾选【输出】可选项的“两者都”。
2. 点【统计量】,打开“统计量”子窗口,
“M-估计量”——当数据背离正态分布、带长尾、或有极端数据时,M-估计量仍能提供很好的中心趋势估计;
“界外值”——可以检验数据是否有极端值存在;
3. 点【绘制】,打开“图”子窗口,【箱图】勾选“按因子水平分组”,【描述性】勾选“茎叶图”、“直方图”,勾选“带检验的正态图”(检验数据是否具有正态性)
点【继续】回到原窗口,点【确定】得到
(1)样本量大于50用Kolmogorov-Smirnov检验,样本量小于50用Shapiro-Wilk检验;
(2)原假设H0:服从正态分布;H1:不服从正态分布。P值<, 拒绝原假设H0;P值>, 接受原假设H0, 即服从正态分布;
本例中,数学成绩的P值=>, 故服从正态分布;英语成绩的P值=<, 故不服从正态分布。
数学成绩 Stem-and-Leaf Plot Frequency Stem & Leaf 4 . 2
.00 4 .
.00 5 .
5 . 5556777
6 . 024
6 . 5578
7 . 0111124
7 . 8
8 . 244
8 . 5577779
9 . 1224
9 . 5789
10 . 0
Stem width: 10
Each leaf: 1 case(s)
茎叶图,SPSS自动根据全距选定5作为组距,以第5行为例,茎的数字为6,叶的数字为024,表示该组距有三个观察值:60,62,64
即正态概率分布图,越接近直线,表示越服从正态分布。
残差图。
盒形图。
“英语成绩”的上述图形(略)。
三、盒形图
在一条数轴上,以数据的上下四分位数(Q1-Q3)为界画一个矩形盒子(中间50%的数据落在盒内);在数据的中位数位置画一条线段为中位线;用◇标记数据的均值;默认延长线不超过盒长的倍,之外的点认为是异常值(用○标记)。
盒形图的主要应用就是,剔除数据的异常值、判断数据的偏态和尾重。
有数据文件:
依前文做探索性描述统计,只绘制“直方图”和“盒形图”。
注:X1为正偏态数据(偏度>0, 高峰左偏移、右长尾),均值 > 中位数42 > 众数35. 盒形图中的黑线为中位数位置;圆圈标记为异常值;若有*标记,表示极端值(3倍IQR外)。
注:X2为负偏态数据(偏度<0, 高峰右偏移、左长尾)。