第4章spss描述性统计分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Frequency 1 1 1 1 1 1 1 1 1 1 2 3 1 1 1 18
语文
Percent 5.6 5.6 5.6 5.6 5.6 5.6 5.6 5.6 5.6 5.6 11.1 16.7 5.6 5.6 5.6
100.0
Valid Percent 5.6 5.6 5.6 5.6 5.6 5.6 5.6 5.6 5.6 5.6 11.1 16.7 5.6 5.6 5.6
考察数据的分布特性:主要考察数据的正态性。
考察变量间数据的相互关系:考察变量间相关性及 方差齐性。
考察变量列表 分组变量
主要功能: 1、通过茎叶图(Stem and leaf Plots)描述频数分布
茎(Stem):整数部分,其值为 Stem 乘以 Stem width,可以多位,
表示该行出现数的相同部分
奇异值(上下)o:超过箱图本 体高度1.5倍的数据。
中位数
箱图本体:矩形部分,上下边 对应上下四分位数
极端值(上下) ﹡:超过箱图主 体高度3倍的数据。
箱图主体:图中个案数占50%(大于25% 且小于75%的百分位数)
箱线图是利用数据中的五个统计量:最小值、第一四分 位数、中位数、第三四分位数与最大值来描述数据的 一种方法,它也可以粗略地看出数据是否具有有对称 性,分布的分散程度等信息
100.0
Cumulative Percent 5.6 11.1 16.7 22.2 27.8 33.3 38.9 44.4 50.0 55.6 66.7 83.3 88.9 94.4 100.0
数学 18 0
83.33 7.639
27 75.75 85.00 89.00
语文 18 0
74.78 12.066
3、通过Q-Q概率图描述数据分布的正态性 Q-Q概率图有两种:
(1)正态概率图(Normal Probability Plots)-直观反 映实际分布和理论分布的差异。
如图,纵坐标为Z分数值,斜线为Z分数期望标准线。 点越趋近斜线,则越符合正态分布。
(2)反趋势正态概率图(Detrended Normal Probability Plots) -直观反映实际分布和理论分布的差异。
特点:扇形面积表示频数或百 分比。适于研究内在的结 构组成。
【实例4.1】计算全部学生英语、数学及语文三门成绩的 均值、标准差、极差和四分位数,并生成语文成绩各 区间的频数分布表和显示频数的饼图。
Statistics按钮: 四分位数
按输入值定义 等分位数
按输入不同值 定义分位数
Charts按钮:
峰度系数:反映分布形态陡缓程度。
kurton1 s 1 iis n1(xiS 4x)43
【实例4.2】计算全部学生三门成绩的均值、标准差、最 大值及最小值,并考察学生成绩的分布形态。
Options按钮:
结果:
4.3 探索性分析(Explore)
能分组进行分析,适用于对资料的性质、分布 特点完全不清楚情况,有助于确定对数据进行进一 步分析的方案。 主要对数据进行三方面考察: 考察数据真实性:找出偏离主体较远的数据,如非 正常值和极端值,分析之,并判断其正确性。
频数分析中常用的三种基本统计图: 条形图(柱形图 Bar Chart)
特点:宽度(类别)相同,高 度表示频数或频率,常分 开排列。
适于定类、定序资料
直方图(Histograms)
饼图(Pie Chart)
特点:矩形面积表示频数或频率,宽为 组距,高为密度,可附正态线,也称 质量分布图。适于定距资料。
结果:
N
Validቤተ መጻሕፍቲ ባይዱ
Missing
Mean
Std. Deviation
Range
Percentiles 25
50
75
Statistics
英语 18 0
87.39 5.873
22 83.50 87.00 92.00
Valid 43 55 68 69 70 72 74 75 76 77 78 79 85 94 95 Total
据一般水平的中心值或代表值。如样本均值、中位数、 众数、总和等。
描述离散趋势:反映一组数据的各观测值距离中心的离 散程度。如样本方差、标准差、极差、 最大值、最小值 及均值标准误差 SES/ n 等。
描述分布形态:考察数据分布是否对称、偏斜程度及 陡缓程度。主要指偏度和峰度。
偏度系数:反映数据形态对称性。Skewn n1 e1 si n1s(xiS 3x)3
5)Ratio:比率分析,对两变量间变量值比率变化的描述分析
4.1 Frequencies(频数分析)
进行频数分布表的分析,适合于定性资料, 以及部分定量资料,不能分组进行。
对数据的分布趋势进行初步分析。
基本概念: 频数(Frequency): 百分比(Percent,频率 ): 有效百分比(Valid Percent):各频数占有效样 本数(除去缺失样本数)的百分比。 累计百分数(Cumulative Percent):最后累积取 值100。
叶(Leaf):小数部分,其值为 Leaf 乘以 Each leaf,只能一位,表
示该行出现数的不同部分
茎叶图可以观察出现同茎,不同叶组成数出现的频数。 如第三行数据表示:总共3个case,其中一个9x10+0=90, 2个9x10+2=92
2、通过箱图(Boxplots)描述数据分布
正常值分 界点
52 69.75 76.50 79.00
4.2 Descriptive( 基本描述统计)
对变量进行整体描述性统计分析,但不能分组 进行,包括集中趋势值,离散趋势值,偏度系数, 峰度系数等。
最适合服从正态分布的定量资料,使用频率最 高,且可将原始数据转换成标准Z分值并存入数据 库。
常见基本描述统计量大致有三类: 描述集中趋势:反映一组数据的共同趋势,即反映数
SPSS 的描述性分析功能模块有: 1)Frequencies:频数分析,描述统计数据的频数分布特征
2)Descriptive : 基本描述统计,对单变量计算基本描述统计量
3)Explore: 探索性分析,考察一些极端值和奇异值;考察变量 与变量间分布的差异是否显著
4)Crosstabs:交叉列联表,讨论变量间的频数关系及各种测度 (定类、定序、定距、定比)间的相关关系