第四章SPSS描述统计分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通过【分析】【描述统计】菜单中的过程来 完成描述统计分析。描述统计分析( Descriptive Statistics)包括子菜单:【 频率】、【描述】、【探索】 、【交叉表】
、【PP图】等 。Baidu Nhomakorabea
【交叉表】涉及到卡方检验、品质相关检验 等,本书将交叉表分析及其检验分析方法作 为第五章进行讲述。
4.1 频数分析
P-P图还可检验的很多分布:对数正态分布、t分布 、均匀分布、帕累托分布等等。
在选择某一分布时,“自由度”的复选框变亮:在 该文本框中输入正整数,表示所选分布的自由度。
在分布参数栏:在该栏中可输入所选分布类型的 参数,选择的分布不同,参数输入窗口也不同。“ 根据数据估算”:为系统默认选项。选择此项,系 统将自动从数据中推测数据分布的参数,否则就要 在该选项下方的参数框中根据需要自行指定。
第7步:结果分析。 第一个统计表:个案处理摘要(略) 第二个统计表:描述统计表。
在该表中,分男 、女分别输出各 种统计量。通过 此表,能较全面 地反映数据的集 中趋势、离散趋 势。
第三个统计表:M-估计
相应统计知识还没学,不管它。
第四个统计表:输出百分位数。
有两种计算方式:加权平均、图基枢纽。计算的 百分位数能较好分析数据的百分位参照点。
第十章 信度和效度分析 第十一章 非参数检验 第十二章 多选变量分析 第十三章 SPSS应用案例——问卷调查分析 第十四章 SPSS应用案例——测验质量分析 第十五章 探索性因子分析及案例应用 第十六章 基本统计图表的制作 第十七章 SPSS应用分析归纳小结
第四章 描述统计分析
从第四章开始讲解 【分析】菜单命令 下的数据分析方法 ,点击【分析】菜 单命令下拉子菜单 。
第五个统计表:输出极值。
按男、女分组 ,分别输出最 大五个数和最 小五个数。
第六个统计表:正态性检验。
第六个统计表:正态性检验。
(1)柯尔莫戈洛夫-斯米诺夫的检验所对应 的显著性水平sig为0.200,大于0.05,接受 原假设,即认为男生、女生的智力测验分数服 从正态分布
(2)夏皮洛-威尔克的检验所对应的显著性 水平sig为0.368和0.598,大于0.05,接受原 假设,即认为男生、女生的智力测验分数服从 正态分布
统计】【描述】菜单命令,打开如图所示的对
话框。
第3步:设置分析变量。从左边的源变量框 里选择一个或多个变量进入右边的“变量 :”框里。在本例中选“总分”、“智商分 数”变量进入“变量:”框。
选中 “□将标准化值另存为变量” 复 选框,将计算该变量的z值并保存结果到当 前数据集中。
第4步:选定统计分析选项。单击【选 项】按钮,打开下图所示的对话框, 该对话框用于选择统计量:
如果P-P图中各个观测点不呈直线,但有一定 规律,可以对变量数据进行转换,使转换后 的数据更接近指定分布或另外指定的分布。
4.4 P-P图
Q-Q图同样可以用于检验数据的分布,其 检验效果是一样的。所不同的是,Q-Q图 是用变量数据分布的分位数与所指定分 布的分位数之间的关系曲线来进行检验 的。
案例:【例4-4】试对某一次测验的测验分 数对该测验分数进行正态分布图形描述。
第1步:打开分析数据。打开“测验数据文 件.sav”文件。
第2步:启动分析过程。点击【分析】【 描述统计】【P-P图】菜单,打开对话框 。
第3步:设置分析变量。从左边的变量列表, 通过单击向右按钮可选择“总分”变量进入 “变量”(Variables)列表框中。当然,可 以同时选择多个变量,本例中仅选择一个。
SPSS 23.0 统计分析
——在心理学与教育学中的应用
第四章 描述统计分析
2020/7/9
全书目录
第一章 SPSS 23.0简介与基本操作 第二章 数据编辑与整理 第三章 数据转换 第四章 描述统计分析 第五章 交叉表分析 第六章 比较平均值 第七章 方差分析 第八章 相关分析 第九章 回归分析
“季节性差异”,用于确定指明计算时间序 列的季节差分。只有在对当前变量的数据序 列定义了周期以后才可用,如果当前周期为 0,将不能计算季节差分。
需要注意的是,这些数据转换并不改变变量 中的变量值,只影响正态概率图。
检验分布栏:可选择不同的分布类型,检验变量数 据是否符合所选分布。单击选项分布栏下的箭头可 选择不同的分布类型。SPSS默认的检验分布是正态 ,即正态分布(Normal)。
□描述:输出均数、 中位数、众数、5%修正 均数、标准误、方差、 标准差、最小值、最大 值、范围、四分位全距 、峰度系数、峰度系数 的标准误、偏度系数、 偏度系数的标准误。
□M-估计量:作中心趋势的粗略最大似然确 定,输出四个不同权重的最大似然确定数;
□离群值:输出五个最大值与五个最小值; □百分位数:输出第5%、10%、25%、50%、 75%、90%、95%位数;
4.3 探索分析
案例:【例4-3】试对10岁少儿的智力测验 分数进行探索分析,对该测验分数进行正 态分布检验、分析茎叶图。
第1步:打开分析数据。打开“10岁少儿的 智力测验分数.sav”文件。
第2步:启动分析过程
点击【分析】【描述统计】【探索】命 令,打开对话框。
第3步:统计量选择。
点击【统计】按钮,弹出“探索:统计”对 话框
所谓Z分值是指某原始数值比其均值高 多少个标准差。
4.2 描述分析
案例:【例4- 2】被试对某一次测验的测验
总分进行分析,描述该测验分数的基本描述 信息,以及将每个被试的分数转化为标准化 分数。
第1步:打开分析数据。打开“测验数据文 件.sav”文件。
第2步:启动分析过程。点击【分析】【描述
本例以上四个复选框全部选择
第4步:设置绘图
点击【图】按钮,弹出“探索:图”对话框。
在“描述”栏内,同 时选择“ 茎叶图”、 “直方图”两个复选框 ,要求作茎叶描述,以 及直方图显示。
同时,选择“含检验 的正态图”。
第5步:设置选项。点击【选项】按钮,弹 出“探索:选项”对话框。
第6步:在主对话框中点击【确定】按 钮 。SPSS在输出窗口的输出结果。
集中趋势的统计量:
第一个框:离散 第二个框:分布
第5步:点击【确定】按钮,提交执行 。SPSS在输出窗口的输出结果。
第6步:结果分析。
第一个表:统计量
在原数据集最右边,多了一列数据“Z智 商分数”、“Z总分”,分别是智商分数 、总分的标准分数,如下图所示:
第
四 4.1 频数分析
当性别为女时,同理,智力测验分数服从正态分布的 假设可以接受。
解释见下一页。
去趋势,也就是实测数据值距离正态期望值 的偏差。
当性别为男时,去趋势正态Q-Q图中的点也 都是在0.00附近(只有一个点比较大,为0.9; 大部分点都在0.25以内),可以反映实测数据 值与正态期望值的具体差距情况。
第十个统计图:箱图
第2步:启动分析过程。点击【分析】【 描述统计】【频率】菜单命令 。
第3步:设置分析变量。从左边的源变量框里 选择一个和多个变量进入右边的“变量:”框 里。 本例选“总分”变量进入“变量:”框。
第4步:输出频率分布表。在主界面中“ 显示 频率表”,系统默认为选中显示,在本例中也 选中。
第5步:设置输出的统计量。点“统计”。
频率分布分析主要通过频率分布表、条形图 和直方图,以及集中趋势和离散趋势的各种 统计量来描述数据的分布特征。
案例:【例4-1】试对某一次测验的测验总分 进行频率分析,描述测验分数的分布表,以 及累计百分比表,并绘制分数分布直方图。
4.1 频数分析
第1步:打开分析数据。打开“测验数据文 件.sav”文件。
图中方箱为四分位 数的箱图,中心粗线 为中位数(50%百分 位的观察值),箱图 的上线、下线为( 25%、75%百分位的观 察值),外部的两端 线为最大值与最小值 。
4.4 P-P图
P-P图通过变量分布累计比与某一分布累计比 生成的图形。通过P-P图可以检验数据是否符 合指定的分布。
原假设H0为:观察变量的数据完全符合指定分 布。此时,P-P图中各点近似呈一条直线。
第四章 描述统计分析
包括:【报告】,【描述统计】,【定制表】 ,【比较平均值】,【一般线性模型】,【广 义线性模型】,【混合模型】,【相关】,【 回归】,【对数线性】,【神经网络】,【分 类】,【降维】,【标度】,【非参数检验】 ,【时间序列预测】,【生存分析】,【多重 响应】,【缺失值分析】,【多重插补】,【 复杂抽样】,【质量控制】,【ROC曲线图】 ,【时间和空间建模】。
第二个表: 频率表
第三个图:频率分布的直方图 此图表明,这批数据基本接近正态分布。
【思考题】
在智力测验分析中,往往根据分数将智力 分为几个等级,然后再统计报告各个智力 等级的人数,如下表所示(在下表的数据 仅为参考,实际统计数字以数据文件的统 计结果为准)。 以“智力测验分数.sav”文件为例,在 SPSS中如何实现如下分析结果?
第七个统计图:直方图。(省略) 第八个统计图:茎叶图。
在男孩的智力测验分数的 茎叶图中的第二行,频率是 数量为1,也就是有1个数值 ,茎(Stem)为8,叶( Leaf)为5,其实该数值是 85;第三行,频率是数量为 5,有5个数值是茎为9,叶 为16889,其实这5个数值是 91、96、98、98、99。 其 余数据依此类推。
章
描 4.2 描述分析 述 4.3 探索分析
统
计 4.4 P-P图 分 4.5 SPSS表格处理:三线表的制作
析
4.3 探索分析
调用探索性分析过程,可对变量的分布进行 更为深入详尽的描述性分析。
它在一般描述统计指标的基础上,增加观察 数据的分布描述、发现数据是否有异常值或 极值,以及有关数据其他特征的文字与图形 描述,显得更加细致与全面,有助于用户思 考对数据进行进一步分析的方案。
第
四 4.1 频数分析
章
描 4.2 描述分析 述 4.3 探索分析
统
计 4.4 P-P图 分 4.5 SPSS表格处理:三线表的制作
析
统计分析往往是从了解数据的基本特征开始 的。
描述数据分布特征的统计量可分为两类:一 类表示变量的中心位置,另一类表示变量的 变异程度(或称离散程度),两者相互补充 ,共同反映数据的全貌。
第
四 4.1 频数分析
章
描 4.2 描述分析 述 4.3 探索分析
统
计 4.4 P-P图 分 4.5 SPSS表格处理:三线表的制作
析
4.2 描述分析
描述统计分析(Descriptives)过程是 对变量进行描述统计分析,包括计算集 中趋势、离散趋势、分布等统计指标, 而且可将原始数据转换成标准Z分值并 存入数据集中。
第4步:设置分析参数。
在对话框的“转换(Transform)”栏:“ 自 然对数转换”,对当前变量的数据取自然对数 ,即将原有变量转换成以自然数e为底的对数 变量。
“将值标准化”,将当前变量的数据转换为 标准分数。
“差异”,对当前变量的数据进行差分转换 ,即利用变量中连续数据之间的差值来转换 数据。选择此项以后,后面的文本框变为可 用,在其中输入一个正整数,以确定转换的 差分度,默认值为1。
第九个统计图:正态Q-Q图。
Q-Q图是用变量数据分布的分位数与所指定 分布的分位数之间的关系曲线来进行检验 的。这里是与正态分布进行检验,因而称 为正态Q-Q图。 原假设H0:一个变量的数据服从正态分布 ,正态Q-Q图将是一条直线。
当性别为男时,正态Q-Q图中的点都是在直线附近, 也就是说,智力测验分数服从正态分布的假设可以接 受。
第6步:统计图形输出
点“图表”。
如果某一变量为连续 型的变量,则可以选择
直方图;
如果某一变量为离散 型的变量,只有少量的 变化值,则选择饼图、 条形图。
第7步:设置频率表格式。点“格式”
第8步:点击【确定】,提交执行。 第9步:结果分析。
第一个表:统计量
在此表中列出的信息有:有效观察值有810个, 缺失值0个,平均数62.25,标准差18.751。 以 及百分位27所对应50分,百分位72所对应74分。