spss教程常用的数据描述统计:频数分布表等统计学
第4章-SPSS基本统计分析课件
第4章-SPSS基本统计分析
采用两种方式实现上述分析:
第一,数值计算,即计算常见的基本统计量的值 ,通过数值来准确反映数据的基本统计特征
第二,图形绘制,通过图形来直观展示数据的分 布特点
第4章-SPSS基本统计分析
4.1 频数分析表
l 目的
l quartiles:计算四分位数25%(QL)、50%(中位数)、 75%(QU)
l cut points for n equal groups: n等份
l percentile: 自定义百分位点
计算其他基本描述统计量。描述集中趋势、离散 程度、分布形态的统计量。
第4章-SPSS基本统计分析
在计算百分位数值和中位数
第4章-SPSS基本统计分析
应用举例
频数分析表
以“居民储蓄调查数据”为例,进行频数分析。有两 个分析目标:
目标一:分析储户的户口和职业的基本情况。
目标二:分析储户一次存(取)款金额的分布,并对城 镇储户和农村储户进行比较
第4章-SPSS基本统计分析
目标一:分析储户的户口和职业的基本情况。 频数分析表 分析特点:
绘制统计图
– 柱形图或条形图(Bar Chart) – 饼图( Pie Chart ) – 直方图(Histograms)
第4章-SPSS基本统计分析
实验一SPSS的基本操作与描述统计
实验一 SPSS的基本操作与描述统计
一、实验目的
熟悉SPSS软件的操作界面,掌握在SPSS中完成变量定义和数据输入的方法,掌握使用SPSS完成原始统计数据整理的方法。掌握使用SPSS完成描述统计的方法,能够根据变量类型正确计算数据集中程度和离散程度的统计指标,掌握使用SPSS绘制统计图形的方法,培养解释描述统计结果的能力。
(本次实验4学时)
二、实验步骤及要求
(1)在SPSS空数据文件中设计“姓名”、“性别”、“身高”、“学习努力程度”四个变量,(其中性别变量中男用1代表,女用0代表;学习努力程度分五级,分别以1—5数字代表)以本班10位同学为样本(必须包括自己,且作为第一个样本输入),根据其实际情况输入统计数据,将数据文件保存为“输入练习.sav”;【数据输入窗口截图,拷贝到实验报告中】
(2)使用SPSS读取“实验一”文件夹中的“专业名额.xls”文件,在“公费名额”变量第11(MBA)行输入数值,该数值为个人学号最后两位,例如学号是707010219,则输入19。数据文件保存为“专业名额.sav”;【数据输入窗口截图,拷贝到实验报告中】
(3)在上一步保存的“专业名额.sav”数据文件中,在“会计学”和“企业管理”之间插入一行数据,该行数据为你所学专业,如“国际贸易”或“物流管理”,并在公费名额及自费名额里输入任意整数数据,最后保存文件;【数据输入窗口截图,拷贝到实验报告中】在最新保存的“专业名额.sav”数据文件中,使用SPSS“计算新变量”菜单,生成“录取总人数”变量,同时自动计算其数值,该数值=公费名额+自费名额;【数据输入窗口截图,拷贝到实验报告中】
SPSS软件的操作与应用第2讲描述性统计
描述性统计的基本指标
总结
均值
中位数
众数
标准差
描述性统计的基本指标 包括均值、中位数、众 数、标准差等,这些指 标可以帮助我们了解数 据的集中趋势和离散程 度。
表示数据的平均水平, 计算方法是所有数值相 加后除以数值的数量。
将数据按大小ቤተ መጻሕፍቲ ባይዱ列后, 位于中间位置的数值。 对于奇数个数据,中位 数就是中间那个数;对 于偶数个数据,中位数 是中间两个数的平均值 。
THANKS FOR WATCHING
感谢您的观看
交叉表分析
总结词
交叉表分析用于分析两个或多个分类变量之间的关联关系。
详细描述
通过交叉表分析,可以了解不同分类变量之间的交叉频率分布情况,以及各交叉组合所占的比例。在 SPSS中,可以通过“分析”菜单中的“表”选项进行交叉表分析。
04 描述性统计的实际应用
人口普查数据的描述性统计
总结词
分析人口普查数据,了解人口数量、性 别比例、年龄结构等基本信息。
SPSS软件的操作与应用第2讲
contents
目录
• SPSS软件介绍 • 描述性统计基础 • SPSS中描述性统计的常用功能 • 描述性统计的实际应用 • 案例分析
01 SPSS软件介绍
SPSS软件的发展历程
1968年,美国斯坦福大学成立统计咨询服 务部(Stanford Statistical Services), 推出SPSS软件的前身。
SPSS数据的基本统计分析
目标二的分析思路:
分析储户一次存(取)款金额的数量是否存在不均衡现象, 可以从分析金额是否有大量的异常值入手。
一般而言,若储户存取款金额服从正态分布,那么根据3σ准则 (3个标准差准则),异常值通常为3个标准差之外的变量值。 可通过数据的标准化处理来判断。(先标准化,再依据标准化值 分组,后用频数分析)
(3)点击‘选项’按钮,做二级对话框设置
(4)选中右下角‘标准化得分保存为变量’可将数据标准化后的取 值保存到数据文档中。
对数据标准化 Zi i ,并作 为新变量保存在文件中。
x u
案例分析:居民储蓄调查数据
目标一:计算存(取)款金额的基本描述统计量,并分 别对城镇储户和农村储户进行比较;
相关分析的概念 测量级别 类-类 (类-序) 序-序 类\序-距 (≥3) 相关系数 λ G/ rs E/E2 取值范围 [0.1] [-1.1] [0.1] PRE意义 λ G/rs2 E2 检验方法 χ2 T检验 F检验
SPSS程序 crosstabs Crosstabs/ correlation crosstabs/ Oneway/means crosstabs/ correlation/linear
显示每组变量的条形分类图 不输出列联表
计算r和rs系数. 相关性 检验
定类变量
定序变量
SPSS统计分析方法及应用基本统计分析课件2
4.2 计算基本描述统计量 • 4.2.1 基本描述统计量
常见的基本描述统计量有三大类: 刻画集中趋势的统计量 刻画离中趋势的统计量 刻画分布形态的统计量
第14页/共85页
1、刻画集中趋势的描述统计量 集中趋势是指一组数据向某一中心值靠拢的倾
向。 (1)均值(Mean):即算术平均数,是反映某变
第7页/共85页
2、计算其他基本描述统计量 SPSS频数分析还能够计算其他基本统计量,
其中包括描述集中趋势(Central Tendency)的基 本统计量、描述离散程度(Dispersion)的基本 统计量、描述分布形态(Distribution)的基本统 计量等。
第8页/共85页
设置频数表输出的格式
第12页/共85页
• 4.1.4 频数分析的应用举例 利用商品房购买意向的调查数据进行频数
分析,有以下两个分析目标: 目 标 一 : 分 析 被 调 查 者 的 户 籍 状 况 以 及 他 们认为房价的变化状况。 目 标 二 : 分 析 月 住 房 开 销 的 分 布 , 并 对 不 同居住类型进行比较。
第29页/共85页
2. 分析月住房开销的数量是否存在不均衡现象。
分析:假设月住房开销的分布服从正态分布,
跟据3 原则,异常值通常为3个标准差范围之
外的值,可通过对数据的标准化处理来判断。 标准化的数学定义为:
SPSS统计分析实用教程(第2版)
配对样本t检验要求两个样本之间存在一定的关联性,例如同一组对象在不同条件下的测量值。通过比较两个相关样本的均值,我们可以判断它们之间是否存在显著差异。配对样本t检验的前提假设包括样本来自正态分布总体、方差齐性等。
详细描述
04
方差分析
总结词
用于比较一个分类变量对数值型变量的影响。
详细描述
单因素方差分析是用来比较不同组之间的总体均值是否存在显著差异。它通过分析一个分类变量对数值型变量的影响,来检验各组之间的差异是否显著。
结果解读
03
卡方统计量越接近于0,说明实际观测频数与期望频数越接近,即样本数据与理论假设越一致;如果卡方统计量较大,则说明样本数据与理论假设存在显著差异。
卡方检验
二项式检验
二项式检验主要用于检验两个独立样本是否来自同一总体。
计算方法
通过计算两个独立样本的二项式统计量,即实际观测频数与期望频数的差的平方与实际观测频数的比值,来评估两个样本是否来自同一总体。
通过图形方式展示两个变量之间的关系,可以直观地观察到它们之间的模式和趋势。
相关分析
散点图
相关系数
预测模型
通过一个或多个自变量预测因变量的值,建立预测模型,并评估模型的拟合优度和预测能力。
回归系数
描述自变量对因变量的影响程度,通过回归系数可以了解各个自变量对因变量的贡献。
数据统计分析SPSS教程完整版
详细描述
配对样本T检验用于比较两个相关样本的均值。在配对样本T检验中,我们比较两个相 关样本的观测值和对应的控制值或基线值。通过计算T统计量,我们可以判断两个相关 样本的均值是否存在显著差异。配对样本T检验常用于实验设计和临床试验中,以评估
实验处理或干预措施对观测值的影响。
04
方差分析
单因素方差分析
1. 打开SPSS软件,导入数据; 2. 选择“分析”菜单中的 “比较均值”选项;3. 在 “比较均值”对话框中,选 择“单因素方差分析”;4. 将数值型变量拖入“因变量” 框,将分类变量拖入“因子” 框;5. 点击“运行”按钮, 查看结果。
双因素方差分析
• 总结词:双因素方差分析用于比较两个分类变量对数值型变量的影响。
总结词
详细描述
适用场景
操作步骤
单因素方差分析用于比较一 个分类变量对数值型变量的 影响。
单因素方差分析是用来比较 不同组之间的平均值是否有 显著差异的统计方法。它通 过分析一个分类变量(单因 素)对数值型变量的影响, 来检验各组之间的差异是否 显著。
适用于只有一个分类变量的 情况,例如不同地区消费者 的消费水平是否有显著差异 。
输出结果
输出表格中会列出每个变量的描 述性统计量,包括均值、标准差、 最小值、最大值等。
数据探索与可视化
数据探索与可视化
通过绘制图表、制作散点图等方法,直观地展示数据之间 的关系和分布情况。
第4章 SPSS基本统计分析
数分析来分析数据
应用举例
分析被访者选择的付款方式 分析不同收入段被访者选择的付款方式
1、定义多项选择变量集
• 1)分析→多重响应→定义变量集
• 2)选择进入多选项变量集的变量
• 3)指定多选项变量集中的变量是按照哪种方法分
解的
• 4)给多选项变量集命名
• 5)将定义好的多选项变量集添加到“多响应集”
• 刻画分布形态的描述统计量
– 偏度、峰度
平均指标
算术平均数 数值平均数 几何平均数
平均指标 众数
位置平均数 中位数
1.当总体分布呈对称状态时,三者合而为一,
即X M e M 0
如图: f
X Me M0
2. 当总体分布呈非对称状态时
(1). 如果分布右偏,则 X M e M 0
提纲
1
频数分析
2
计算基本描述统计量
复合分组下的频数分析 多选项分析
3
4
5
比率分析
1、基本操作
• 分析→描述统计→交叉表
• 选择行变量和列变量
• 指定绘制各变量交叉分组下的频数分布图
• 指定列联表单元格中的输出内容
• 指定列联表各单元格的输出顺序
• 指定用哪种方法分析行变量和列变量之间的关系
2、应用举例
• 累计百分比:即各百分比逐级累加起来的结果,
SPSS统计分析教程-频数分布分析
统计分析往往是从了解数据的基本特征开始的。描述数据分布特征的统计量可分为两类:一类表示数量的中心位置,另一类表示数量的变异程度(或称离散程度)。两者相互补充,共同反映数据的全貌。
这些内容可以通过SPSS中的“Descriptive Statistics”菜单中的过程来完成。
1 频数分析 (Descriptive Statistics - Frequencies)
频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。
下面我们通过例子来学习单变量频数分析操作。
1) 输入分析数据
在数据编辑器窗口打开“data1-2.sav”数据文件。
2)调用分析过程
在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。
图3-4 “Frequencies” 对话框
3)设置分析变量
从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。在这里我们选“三化螟蚁螟 [虫口数]”变量进入“Variable(s):”框。
4)输出频数分布表
Display frequency tables,选中显示。
5)设置输出的统计量
单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量:
图3-5 “Statistics”对话框
① 选择百分位显示“Percentiles Values”栏:
Quartiles:四分位数,显示25%、50%和75%的百分位数。
统计分析与Spss应用第五章(描述性统计分析)
描述性统计只对统计数据的结构和总体情 况进行描述,并不能深入了解统计数据的 内部规律。 Spss的许多模块都可完成描述性统计分析, 但专门为该目的而设计的几个模块则集中 在descriptive statistics菜单中,他们就是计 算各种统计量或绘制统计图来实现描述功 能。
图形参数选择对话框
返回
【Charts钮】弹出Charts对话框,用于设定 所做的统计图。 Chart type单选钮组 定义统计图类型,有四 种选择:无、条图(Bar chart)、圆图(Pie chart)、直方图Histogram),其中直方图 还可以选择是否加上正态曲线(With normal curve)。 Chart Values单选钮组 定义是按照频数还是 按百分比做图(即影响纵坐标刻度)。 【Format钮】弹出Format对话框,用于定 义输出频数表的格式,不过用处不大,一 般不管。
5.2 Descriptives过程
Descriptives过程是连续资料统计描述应用 最多的一个过程,他可对变量进行描述性 统计分析,计算并列出一系列相应的统计 指标。这和其他过程相比并无不同。但该 过程还有个特殊功能就是可将原始数据转 换成标准正态评分值并以变量的形式存入 数据库供以后分析。
381 47.883 f 52.035 47.618 .683
spss教程-常用的数据描述统计:频数分布表等--统计学
第二节 常用的数据描述统计
本节拟讲述如何通过 SPSS 菜单或命令获得常用的统计量、频数分布表等。 1 •数据
这部分所用数据为第一章例 1中学生成绩的数据, 这里我们加入描述学生性别的变量
“sex ”和班级
的
变量"class”,前几个数据显示如下(图 2-2),将数据保存到名为
“2-6-1.sav ”的文件中。
1 • Frequencies 语句
(1)操作
打开数据文件“ 2-6-1.sav ”,单击主菜单 Analyze /Descriptive Statistics / Frequencies …;出现频数分布 表对话框如图2-3所示。
图 2— 3: Frequencies 定义窗口
把score 变量从左边变量表列中选到右边;并请注意选中下方的
显示
Display frequency table 复选框(要求 OK 按钮了。如果您想同时获得一
图2-2:数据输入格式示例
频数分布表)。如果您只要求得到一个频数分布表;那么就可以点
些统计量,及统计图表,还需要进一步设置。
①Statistics 选项
单击Statistics按钮,打开对话框,请按图2-4自行设置。有关说明如下:
(i)在定义百分位值(perce ntile value)的矩形框中,选择想要输出的各种分位数,SPSS提供的选项有: Quartiles四分位数,即显示25%、50%、75%的百分位数。
Cut points | | equal把数据平均分为几份。如本例中要求平均分为3份。
Percentile显示用户指定的百分位数,可重复多次操作。本例中要求15%、50%、85%的百分位数。(ii)在定义输出集中趋势(Central Tendency)的矩形框中,选择想要输出的集中统计量,常用的选项有:Mean算术平均数
SPSS统计分析—描述性统计分析
大差异。
•
• 执行【Analyze】/【Descriptive Statistics】/【Ratio】命令, 弹出如以下图所示对话框
• 结果解读
• 相比照描述的常用指标
4、极值表 5、正态性检验
6、方差齐次性检验
7、茎叶图 茎叶图包括频数〔Frequency〕、茎〔Stem〕和叶〔Leaf〕3局部。
8、QQ图和QQ去势图
◆ 问题:各种图形是用来做什么的?正态性检验和方差齐次 性检验方法的作用分别是什么?
列联表分析-Crosstabs
1、四格卡方检验的根本思想
检验结果和图形,有助于用户进一步地分析数据。 • ◆ 适用范围:对资料的性质,分布特点等完全不清楚的时候
补充:假设检验
• 定义:假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。 • 它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从
某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的 统计量,依据一定的概率原那么,以较小的风险来判断估计数值与总体数值(或 者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检 验方法。
• 学生身高的探索性分析
•
执行【Analyze】/【Descriptive Statistics】/
【Explore】命令,弹出如下图对话框
第四章 SPSS的基本统计分析
计算描述统计量
描述集中趋势的统计量
– 均值(mean):表示某变量所有变量值集中趋势或平均水平的统计量。 适用于定距数据。 特点:利用了全部数据,易受极端值的影响。
描述离散程度的统计量
– 标准差(standard deviation--Std Dev):表示某变量的所有变量值离散程度的 统计量。 SPSS中计算的是样本标准差。
(2)选择一个变量作为行变量到row框. (3)选择一个变量作为列变量到column框. (4)可选一个或多个变量作为控制变量到layer框.
– 控制变量的层次设置:同层为水平数加;不同层为水平数积.
(5)是否显示各分组的棒图(display clustered bar charts )
产生交叉列联表
•统计量服从(r-1)*(c-1)个
优 良 中 及格 总数
自由度的卡方分布
•count:观察(实际)频数 男 10 5
5
3
23
•expected count:期望频数
(期望频数反映的是H0成立情 女 8
12 4
1
25
况下的数据分布特征)
•Residual:剩余
总数 18 17 9
4
48
(观察频数-期望频数)
多选项分析
多选项频数分析
– 菜单选项:analyze->multiple response->frequencies
SPSS-2 统计描述
正态性检验方法举例
100名健康成年男子血清总胆固醇含量
4.77 4.56 4.12 3.50 4.43 3.18 6.36 5.16 4.17 4.40 3.37 4.90 5.18 4.69 4.25 3.97 6.38 5.09 4.03 4.55 6.14 4.37 5.77 4.38 4.03 5.16 4.88 4.52 4.47 5.38 3.95 5.39 3.05 4.89 5.85 5.10 5.55 4.38 3.40 3.89 3.56 6.30 4.79 6.25 4.09 5.86 3.04 4.31 3.91 4.60 4.23 5.21 5.12 5.32 3.35 4.79 4.55 4.58 2.70 4.47 4.31 7.22 5.20 4.50 4.08 5.34 3.35 5.72 4.60 3.64 4.71 5.54 5.10 4.63 4.79 4.24 4.87 6.55 4.09 4.34 5.69 3.93 4.70 3.61 5.30 4.32 4.17 4.76 5.96 5.18 4.12 5.21 4.74 4.44 4.97 4.77 5.85 4.61 5.48 6.14
Normal Q-Q Plot By SPSS
【Analyze】
【Descriptive Statistics】
【Q-Q Plots…】
第4章:SPSS的统计分析
4.3.4 交叉分组下的频数分析应用举例
案例: 案例: 利用“住房状况.sav”,分析本市户口和外地户口家庭对“ 未来三年是否买房”是否持相同的态度。 分析: 分析: 本案例可以利用交叉分组下的频数分析来实现。列联表的 行变量为“户口状况”,列变量为“未来三年”,在列联表中 输出各种百分比、期望频数、剩余、标准化剩余。同时,显示 各交叉分组下的频数分布条形图,并利用卡方检验方法,对本 市户口和外地户口家庭对该问题的态度是否一致进行检验。
第二步, 第二步,计算检验统计量 列联表分析的卡方检验统计量是Pearson卡方统计量。 第三步,确定显著性水平( level) 第三步,确定显著性水平(significant level)和临界值 显著性水平a是指原假设为真却将其解决的风险,即弃真的 概率。通常设为0.05或0.01,在卡方检验中,由于卡方统计量 服从一个“(行数-1)×(列数-1)”个自由度的卡方分布, 因此,在行列数目和显著性水平a确定时,卡方临界值是唯一 的。 第四步, 第四步,结论和决策 对统计做决策通常有以下两种方式:
4.2.2 计算基本描述统计量的应用举例
案例一: 案例一: 利用“住房状况.sav”,对人均住房面积计算基本描述统 计量,并分别对本市户口和外地户口家庭进行比较。 分析: 分析: 由于进行本市户口和外地户口家庭进行比较,因此应首 先对数据进行拆分(split file),然后计算人均住房面积的基本 描述统计量。 操作: 操作: 数据拆分: 数据拆分:【数据(data)】【spilt file(拆分个案)】 计算描述统计: 计算描述统计:【分析(analyze)】 【描述统计(descriptive statistics)】 【描述(descriptives)】
数据统计分析SPSS教程完整版
安装完成后,双击桌面快捷方式或从 开始菜单启动SPSS。关闭时,点击右 上角的关闭按钮。
数据输入与保存
数据输入
在SPSS中,可以通过直接输入数据或 导入数据(如Excel、CSV等格式)进 行数据输入。
数据保存
数据输入完成后,点击文件菜单选择 保存,选择保存位置和文件名,保存 为SPSS格式(.sav)。
因素分析
通过因素分析探究心理学数据中的潜在结构,揭示 变量之间的内在联系和共同变异。
结构方程模型
利用结构方程模型探究心理学变量之间的复 杂关系,构建因果关系模型,验证理论假设 。
感谢您的观看
THANKS
数据整理
01
数据筛选
通过使用过滤器功能,筛选出符合 特定条件的数据。
数据合并
可以将多个数据文件合并成一个文 件,方便进行综合分析。
03
02
数据排序
根据某一列或多列数据进行排序, 以便更好地观察数据分布。
数据转置
将数据行列互换,方便处理和分析。
04
02
描述性统计分析
频数分析
总结词
频数分析用于统计数据集中每个变量的不同取值的出现次数。
数据转换
总结词
数据转换用于对原始数据进行处理和变换,以满足统计分析的需要。
详细描述
数据转换的方法包括数据编码、数据分组、数据标准化等。在SPSS中,可以通过“转 换”命令来进行数据转换,例如将分类变量转换为虚拟变量、将连续变量转换为有序分
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节常用的数据描述统计
本节拟讲述如何通过SPSS菜单或命令获得常用的统计量、频数分布表等。
1.数据
这部分所用数据为第一章例1中学生成绩的数据,这里我们加入描述学生性别的变量“sex”和班级的变量“class”,前几个数据显示如下(图2-2),将数据保存到名为“2-6-1.sav”的文件中。
图2-2:数据输入格式示例
1.Frequencies语句
(1)操作
打开数据文件“2-6-1.sav”,单击主菜单Analyze /Descriptive Statistics / F requencies…,出现频数分布表对话框如图2-3所示。
图2-3:Frequencies定义窗口
把score变量从左边变量表列中选到右边,并请注意选中下方的Display frequency table复选框(要求
显示频数分布表)。如果您只要求得到一个频数分布表,那么就可以点OK按钮了。如果您想同时获得一些统计量,及统计图表,还需要进一步设置。
①Statistics选项
单击Statistics按钮,打开对话框,请按图2-4自行设置。有关说明如下:
(ⅰ)在定义百分位值(percentile value)的矩形框中,选择想要输出的各种分位数,SPSS提供的选项有:
●Quartiles四分位数,即显示25%、50%、75%的百分位数。
●Cut points equal 把数据平均分为几份。如本例中要求平均分为3份。
Percentile显示用户指定的百分位数,可重复多次操作。本例中要求15%、50%、85%的百分位数。(ⅱ) 在定义输出集中趋势(Central Tendency)的矩形框中,选择想要输出的集中统计量,常用的选项有:
●Mean 算术平均数
●Median 中数
●Mode 众数
●Sum 算术和
(ⅲ)在定义输出离散统计量(Dispersion)的矩形框中,选择想要输出的离散统计量,常用的选项有:
●Std. Deviation 标准差
●Variance 方差
●Range 全距
●Minimum 最小值
●Maximum 最大值
●S.E. mean 平均数的标准误
(ⅳ)描述数据分布(Distribution)的统计量
●Skewness 偏度,非对称分布指数。
●Kurtosis 峰度,CASE围绕中心点的扩展程度。
另外,频数过程(Frequence)除了能够提供上面常用的统计量外,还可以对分组数据计算百分位数和中数(Values are group midpoints),即对于已经分组的数据,并且数据中的原始数据表示的是组中数的数据计算百分位数的值和中位数。
图2-4:次数分布统计量定义窗口图2-5:次数分布图形定义窗口
在本例中,我们选择输出:四分位点的值,平均分为3等分的分位点的值和15%,50%,85%的分位点的值;对于集中趋势的度量,选择输出算术平均数、中数、众数和总和,对于离散程度的度量选择输出标准差和方差。
②Charts选项
为了获得统计图表,单击主对话框中的Charts铵钮,打开它的对话框,如图2-5所示。
用户可以在图形类型(Chart Type)选择框中定义输出的图形类型,频数(Frequence)过程可以提供的输出选项有:
●None 不显示图表
●Bar charts 条形图
●Pie charts 圆形图
●Histograms 直方图
另外,对于图形中纵坐标值的表示,可以有两种方式:
●Frequencies 纵座标为变量值的频数
●Percentages 纵座标为变量值的百分比
在本例中,由于学生成绩可以看成是连续性的数据,所以这里选择输出直方图,并拟合正态曲线。点击Continue返回主对话框。
③Format选项
单击Format…,打开Format对话框,如图2-6所示。在该对话框,可以选择数据输出显示的顺序(Order by),Frequencies提供的选项有:文档来自于网络搜索
●Ascending values 在输出频数分布表时按变量值升序排列
●Descending values 在输出频数分布表时按变量值降序排列
●Ascending counts 输出频数分布表时按变量值频数的升序排列
●Descending counts 输出频数表时按变量值频数的降序排列
图2-6:定义输出显示格式对话框
在Format 中我们一律使用默认选项。点击Continue 返回主对话框,在主对话框中点击OK,可以得到次数分布的输出结果。(2)结果及解释
①学生成绩变量的Frequences 输出描述统计结果:
Statistics
SCORE 100079.68079.75080.07.02649.3717968.072.07575.00076.50079.75082.50084.00087.000
Valid Missing
N
Mean Median Mode
Std. Deviation Variance Sum
1525
33.3333333350
66.666666677585
Percentiles
输出说明:
N 后面的Valid 和Missing 分别用来描述有效值样本容量和缺失值的样本个数,在本例所用数据中,有100个有效数字,缺失值的个数为0。Mean 、Median 、Mode 和Sum 分别用来描述算术平均数、中数、众数和数据的总和,本例所用数据的算术平均数为79.680,中数为79.75,众数为80,数据总和为7968.0。Std. Deviation 和Variance 分别用来描述数据的标准差和方差,这里数据的标准差为7.026,方差为49.371。Percentiles 后给出不同的百分位数对应的值,如15后面的数字72.075表示,15%的分位点的值为72.075,即小于72.075分的人数占总人数的15%。(表中有两个无穷循环小数,是我们自定义的三等分的百分位数)