第3章SPSS描述性统计分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图3-17 【探索】对话框
Step 02 在对话框左侧的候选变量列表框中选取一个或多 个待分析变量,将它们移入右侧的【因变量列表】列表框中 ,表示要进行探索性分析的变量。 Step 03 在候选变量列表框中可以选取一个或多个分组变 量,将它们移入右侧的【因子列表】列表框中。分组变量的 选择可以将数据按该变量中的观测值进行分组分析。如果选 择的分组变量不止一个,那么会以分组变量的不同取值进行 组合分组。
图3-13 【描述:选项】对话框
Step 04 在【描述性】对话框中,勾选【将标准化得分另 存为变量】复选框,表示对所选择的每一个变量进行标准化 处理,同时产生相应的Z得分,并作为新变量保存到数据窗 口中。
Step 05 单击【Bootstrap】按钮,弹出如图3-5所示的 【Bootstrap】对话框,在此对话框中可以进行均值、标准 差、方差、偏度和峰度的Bootstrap估计。
Step 04 从候选变量列表框中选择一个变量作为标识变量 ,并将其移入【标注个案】列表框中。选择标识变量的作用 在于,当系统在数据探索过程中发现异常值时,便可利用标 识变量加以标记,以便于用户找这些异常值。如果不选择它 ,系统默认以ID变量作为标识变量。
Step 06 在【探索】对话框下面的【输出】选项组中可 以选择以下输出项。
统计分析的目的是研究总体的数量特征。为实现上述分析, 往往采用两种方式实现:第一,数值计算,即计算常用的基本 统计量的值,通过数值来准确反映数据的基本统计特征;第二, 图形绘制,即绘制常见的基本统计图形,通过图形来直观展现 数据的分布特点。通常,这两种方式都是混合使用的。
3.1.1 频数分析的基本原理
1.使用目的 频数分布表是描述性统计中最常用的方法之一。它 主要能够了解变量取值的状况,对把握数据分布特 征非常有用。例如,了解某班学生考试的学习成绩、 了解某地区居民的收入水平等都可以借助于频数分 析。
频率分析 过程就是专门为产生频数表而设计的。它不 仅可以产生详细的频数表,还可以按要求给出某百分 位点的数值以及常用的条图、饼图等统计图。同时, SPSS的频数分析还可以进行分位数、描述集中趋势的 基本统计量等计算功能。这些统计量的具体分析会在 以后章节中讲解。
Valid N (listwise
)
36
3.3.1 探索性分析的基本原理
1.使用目的 探索性数据分析(Exploratary Data Analysis,
简称EDA)的基本思想是从数据本身出发,不拘泥于模 型的假设而采用非常灵活的方法来探讨数据分布的大 致情况,也可以为进一步结合模型的研究提供线索, 为传统的统计推断提供良好的基础和减少盲目性。
图3-19 【探索:图】对话框
Step 08 在【探索】对话框中还可以单击【选项】按钮 ,弹出如图3-20所示的【探索:选项】对话框,在该对话 框中确定对待缺失值的方式。
图3-20 【探索:选项】对话框
Step 09 单击【Bootstrap】按钮,弹【Bootstrap】 对话框,在该对话框中可以进行如下统计量Bootstrap 估计。 支持均值、5% 切尾均值、标准差、方差、中位数、 偏度、峰度和内距的Bootstrap估计。 M估计量表支持Huber的M估计量、Tukey的双权重 、Hampel的M 估计量和Andrew的Wave的Bootstrap 估计。 百分位数表支持百分位数的Bootstrap估计。 Step 10 单击【确定】按钮结束操作,SPSS软件自 动输出结果。
图3-8 选择输出统计量
Step 04 单击【图表】按钮,弹出如图3-9所示的【频率:图 表】对话框,由于该数据属于数值型,因此点选【条形图】 单选钮,表示结果输出条形图;再单击【继续】按钮,返回 【频率】对话框。
图3-9 选择输出图形类型
Step 05 单击【确定】按钮完成操作。 (1)基本统计结果输出
两者都:输出图形以及描述性统计量。 统计量:只输出描述统计量。 图:只输出图形。 Step 07 在【探索】对话框中还可以点选【统计量】单 选钮,这个选项提供了各类基本描述性统计输出结果;
图3-18 【探索:统计量)】对话框
Step 07 在【探索】对话框中还可以点选【绘制】单选钮, 它提供了图形输出类型。
频数分析基本统计结果
N Percentiles
有效 缺失 25 50 75
38 0 18.00 20.00 23.00
(2)频数分析表输出
14 15 16 17 18 19 有 20 效 21 22 23 24 26 27 Tot al
频率 1 3 2 1 3 6 4 5 3 3 4 2 1
38
Baidu Nhomakorabea
频数分析表
图3-14 【描述性】对话框
Step 02 在左侧的候选变量列表框中选择“male”和 “female”变量,将其添加至【变量】列表框中,表示它是 进行描述性统计分析的变量,如图3-15所示。
图3-15 选择分析变量
Step 03 单击【选项】按钮,其主要目的是选择需要输出 的描述性统计量,这里除了选择系统默认的统计量外,还勾 选了范围、偏度系数和峰度系数复选框;再单击【继续】按 钮,返回【描述性】对话框,如图3-16所示。 Step 04 单击【确定】按钮完成操作。
单击【统计量】按钮,弹出如图3-2所示的【频率: 统计量】对话框,该对话框主要用于输出各类基本统计 量结果。
图3-2 【频率:统计量】对话框
单击【图表】按钮,弹出如图3-3所示的【频率:图 表】对话框,该对话框主要用于输出图形结果。
图3-3 【频率:图表】对话框
Step 05 单击图3-1中的【格式】按钮,弹出如图3-4 所示的【频率:格式】对话框,在此对话框中可以设 置频数表输出的格式。
SPSS中的探索过程用于计算指定变量的探索性统计量和 有关的图形。它既可以对观测量整体分析,也可以进行分组 分析。从这个过程可以获得箱线图、茎叶图、直方图、各种 正态检验图、频数表、方差齐性检验等结果,以及对非正态 或正态非齐性数据进行变换,并表明和检验连续变量的数值 分布情况。
Step 01 选择菜单栏中的【分析】→【描述统计】→ 【探索】命令,弹出【探索】对话框,如图3-17所示, 该对话框是探索性分析的主操作窗口。
图3-5 【Bootstrap】对话框
Step 07 单击【确定】按钮结束操作,SPSS软件自动 输出结果。
假设某公司每周大约卖出2000万件产品,但市场的需求不
稳定,该公司的生产经理想更好的掌握近期该产品的分布情 况。假设下面给出的销售数字(单位:百万)代表近期公司 该产品每周的销售数据。利用频数分析你能得到什么有助于 生产及销售的的信息?
Step 01 选择菜单栏中的【分析】→【描述统计】→【描 述】命令,弹出【描述性】对话框,如图3-12所示,该对话 框是描述性统计分析的主操作窗口。
图3-12 【描述】对话框
Step 02 在左侧的候选变量列表框中选取一个或多个待分 析变量,将它们移入右侧的【变量】列表框中。 Step 03 单击【选项】按钮,弹出如图3-13所示的【描 述:选项】对话框,该对话框用于指定输出的描述性统计 量。这些统计量的含义是:均数、总和、标准差、方差、 全距、最小值)、最大值、标准误差、峰度系数和偏度系 数。
2.主要内容 一般来说,进行探索性分析主要考察以下内容。 (1)检查数据是否有错。过大或过小的数据均可能是异 常值、影响点或错误值。要检查这样的数据,并分析 原因,然后决定是否从分析中剔除这些数据。 (2)获得数据分布特征。很多统计方法模型对数据的分 布有要求,如方差分析就需要数据服从正态分布。 (3)对数据的初步观察,发现一些内在规律。
(1)采用重抽样技术从原始样本中抽取一定数量(自 己给定)的样本,此过程允许重复抽样。
(2)根据抽出的样本计算给定的统计量T。
(3)重复上述N次(一般大于1000),得到N个统计量 T。
(4) 计算上述N个统计量T的样本值,最终得到统计 量的估计值。
Step 01 选择菜单栏中的【分析】→【描述统计】→ 【频率】命令,弹出【频率】对话框,如图3-1所示,这 是频数分析的主操作窗口。
女演员:50 44 35 80 26 28 41 21 61 38 49 33 74 30 33 41 31 35 41 42 37 26 34 34 35 26 61 60 34 24 30 37 31 27 39 34
Step 01 打开随书光盘中的数据文件3-2.sav,其中 “male”和“female”列分别表示男演员和女演员;选择 菜单栏中的【分析】→【描述性统计】→【描述】命令,弹 出【描述性】对话框,如图3-14所示。
图3-4 【频率:格式】对话框
Step 06 单击图3-1中的【Bootstrap】按钮,弹出如图3-5 所示的【Bootstrap】对话框,在此对话框中可以进行下述 统计量的Bootstrap估计。 支持均值、标准差、方差、中位数、偏度、峰度和百分位 数的Bootstrap估计。 支持百分比的Bootstrap估计。
24 18 18 26 24 23 16 18 21 20 21 24 19 19 14 22 21 26 27 15 19 17 20 20 19 22 23 16 23 21 15 19 21 20 22 15 24 19
Step 01 打开SPSS软件和数据文件3-1.sav,选择菜单栏 中的【分析】→【描述统计】→【频率】命令,弹出【频率】 对话框,如图3-6所示。
图3-16 选择输出图形类型
男演员
N 全距 极小值 极大值 均值 标准差
偏度
峰度
统计量 统计量 统计量 统计量 统计量 统计量 统计量 标准误 统计量 标准误
36 45 31 76 45.14 10.406 0.898 0.393 0.704 0.768
女演员
36 59 21 80 38.94 13.546 1.503 0.393 2.111 0.768
图3-6 【频率】对话框
Step 02 在左侧的候选变量列表框中选择“sale”变量,将 其添加至【变量】列表框中,表示它是进行频数分析的变量, 如图3-7所示。
图3-7 选择分析变量
Step 03 单击【统计量】按钮,弹出如图3-8所示的【频率: 统计量】对话框;勾选【四分位数】复选框,要求输出四分 数,然后单击【继续】按钮,返回【频率】对话框。
百分百 有效百分比 累积百分比
2.6
2.6
2.6
7.9
7.9
10.5
5.3
5.3
15.8
2.6
2.6
18.4
7.9
7.9
26.3
15.8 15.8
42.1
10.5 10.5
52.6
13.2 13.2
65.8
7.9
7.9
73.7
7.9
7.9
81.6
10.5 10.5
92.1
5.3
5.3
97.4
2.6
2.6
Step 06 单击【确定】按钮结束操作,SPSS软件自动输 出结果。
请你分析不同性别演员获得奥斯卡奖的年龄差异性。
男演员:32 37 36 32 51 53 33 61 35 45 55 39 76 37 42 40 32 60 38 56 48 48 40 43 62 43 42 44 41 56 39 46 31 47 45 60
100.0
100.0 100.0
(3)直方图
3.2.1 描述统计分析的基本原理
1.使用目的 2.刻画集中趋势的描述统计量 3.刻画离散程度的描述统计量 4.刻画分布形态的描述统计量
描述过程过程是连续资料统计描述应用最多的一个过程, 它可对变量进行描述性统计分析计算,并列出一系列相应的 统计指标。这和其他过程相比并无不同。但该过程还有个特 殊功能,就是可将原始数据转换成标准化值,并以变量的形 式保存。
图3-1 【频率】对话框
Step 02 在左侧的候选变量列表框中,选取一个或多个 待分析变量,单击 按钮,将它们移入右侧的【变量】列
表框中。 Step 03 勾选【显示频率表格】复选框,输出频数分析表。 Step 04 在该对话框中还可以单击【统计量】和【图表】 等按钮,进行其他基本统计分析,这些选项提供了丰富的统 计输出结果。
Step 02 在对话框左侧的候选变量列表框中选取一个或多 个待分析变量,将它们移入右侧的【因变量列表】列表框中 ,表示要进行探索性分析的变量。 Step 03 在候选变量列表框中可以选取一个或多个分组变 量,将它们移入右侧的【因子列表】列表框中。分组变量的 选择可以将数据按该变量中的观测值进行分组分析。如果选 择的分组变量不止一个,那么会以分组变量的不同取值进行 组合分组。
图3-13 【描述:选项】对话框
Step 04 在【描述性】对话框中,勾选【将标准化得分另 存为变量】复选框,表示对所选择的每一个变量进行标准化 处理,同时产生相应的Z得分,并作为新变量保存到数据窗 口中。
Step 05 单击【Bootstrap】按钮,弹出如图3-5所示的 【Bootstrap】对话框,在此对话框中可以进行均值、标准 差、方差、偏度和峰度的Bootstrap估计。
Step 04 从候选变量列表框中选择一个变量作为标识变量 ,并将其移入【标注个案】列表框中。选择标识变量的作用 在于,当系统在数据探索过程中发现异常值时,便可利用标 识变量加以标记,以便于用户找这些异常值。如果不选择它 ,系统默认以ID变量作为标识变量。
Step 06 在【探索】对话框下面的【输出】选项组中可 以选择以下输出项。
统计分析的目的是研究总体的数量特征。为实现上述分析, 往往采用两种方式实现:第一,数值计算,即计算常用的基本 统计量的值,通过数值来准确反映数据的基本统计特征;第二, 图形绘制,即绘制常见的基本统计图形,通过图形来直观展现 数据的分布特点。通常,这两种方式都是混合使用的。
3.1.1 频数分析的基本原理
1.使用目的 频数分布表是描述性统计中最常用的方法之一。它 主要能够了解变量取值的状况,对把握数据分布特 征非常有用。例如,了解某班学生考试的学习成绩、 了解某地区居民的收入水平等都可以借助于频数分 析。
频率分析 过程就是专门为产生频数表而设计的。它不 仅可以产生详细的频数表,还可以按要求给出某百分 位点的数值以及常用的条图、饼图等统计图。同时, SPSS的频数分析还可以进行分位数、描述集中趋势的 基本统计量等计算功能。这些统计量的具体分析会在 以后章节中讲解。
Valid N (listwise
)
36
3.3.1 探索性分析的基本原理
1.使用目的 探索性数据分析(Exploratary Data Analysis,
简称EDA)的基本思想是从数据本身出发,不拘泥于模 型的假设而采用非常灵活的方法来探讨数据分布的大 致情况,也可以为进一步结合模型的研究提供线索, 为传统的统计推断提供良好的基础和减少盲目性。
图3-19 【探索:图】对话框
Step 08 在【探索】对话框中还可以单击【选项】按钮 ,弹出如图3-20所示的【探索:选项】对话框,在该对话 框中确定对待缺失值的方式。
图3-20 【探索:选项】对话框
Step 09 单击【Bootstrap】按钮,弹【Bootstrap】 对话框,在该对话框中可以进行如下统计量Bootstrap 估计。 支持均值、5% 切尾均值、标准差、方差、中位数、 偏度、峰度和内距的Bootstrap估计。 M估计量表支持Huber的M估计量、Tukey的双权重 、Hampel的M 估计量和Andrew的Wave的Bootstrap 估计。 百分位数表支持百分位数的Bootstrap估计。 Step 10 单击【确定】按钮结束操作,SPSS软件自 动输出结果。
图3-8 选择输出统计量
Step 04 单击【图表】按钮,弹出如图3-9所示的【频率:图 表】对话框,由于该数据属于数值型,因此点选【条形图】 单选钮,表示结果输出条形图;再单击【继续】按钮,返回 【频率】对话框。
图3-9 选择输出图形类型
Step 05 单击【确定】按钮完成操作。 (1)基本统计结果输出
两者都:输出图形以及描述性统计量。 统计量:只输出描述统计量。 图:只输出图形。 Step 07 在【探索】对话框中还可以点选【统计量】单 选钮,这个选项提供了各类基本描述性统计输出结果;
图3-18 【探索:统计量)】对话框
Step 07 在【探索】对话框中还可以点选【绘制】单选钮, 它提供了图形输出类型。
频数分析基本统计结果
N Percentiles
有效 缺失 25 50 75
38 0 18.00 20.00 23.00
(2)频数分析表输出
14 15 16 17 18 19 有 20 效 21 22 23 24 26 27 Tot al
频率 1 3 2 1 3 6 4 5 3 3 4 2 1
38
Baidu Nhomakorabea
频数分析表
图3-14 【描述性】对话框
Step 02 在左侧的候选变量列表框中选择“male”和 “female”变量,将其添加至【变量】列表框中,表示它是 进行描述性统计分析的变量,如图3-15所示。
图3-15 选择分析变量
Step 03 单击【选项】按钮,其主要目的是选择需要输出 的描述性统计量,这里除了选择系统默认的统计量外,还勾 选了范围、偏度系数和峰度系数复选框;再单击【继续】按 钮,返回【描述性】对话框,如图3-16所示。 Step 04 单击【确定】按钮完成操作。
单击【统计量】按钮,弹出如图3-2所示的【频率: 统计量】对话框,该对话框主要用于输出各类基本统计 量结果。
图3-2 【频率:统计量】对话框
单击【图表】按钮,弹出如图3-3所示的【频率:图 表】对话框,该对话框主要用于输出图形结果。
图3-3 【频率:图表】对话框
Step 05 单击图3-1中的【格式】按钮,弹出如图3-4 所示的【频率:格式】对话框,在此对话框中可以设 置频数表输出的格式。
SPSS中的探索过程用于计算指定变量的探索性统计量和 有关的图形。它既可以对观测量整体分析,也可以进行分组 分析。从这个过程可以获得箱线图、茎叶图、直方图、各种 正态检验图、频数表、方差齐性检验等结果,以及对非正态 或正态非齐性数据进行变换,并表明和检验连续变量的数值 分布情况。
Step 01 选择菜单栏中的【分析】→【描述统计】→ 【探索】命令,弹出【探索】对话框,如图3-17所示, 该对话框是探索性分析的主操作窗口。
图3-5 【Bootstrap】对话框
Step 07 单击【确定】按钮结束操作,SPSS软件自动 输出结果。
假设某公司每周大约卖出2000万件产品,但市场的需求不
稳定,该公司的生产经理想更好的掌握近期该产品的分布情 况。假设下面给出的销售数字(单位:百万)代表近期公司 该产品每周的销售数据。利用频数分析你能得到什么有助于 生产及销售的的信息?
Step 01 选择菜单栏中的【分析】→【描述统计】→【描 述】命令,弹出【描述性】对话框,如图3-12所示,该对话 框是描述性统计分析的主操作窗口。
图3-12 【描述】对话框
Step 02 在左侧的候选变量列表框中选取一个或多个待分 析变量,将它们移入右侧的【变量】列表框中。 Step 03 单击【选项】按钮,弹出如图3-13所示的【描 述:选项】对话框,该对话框用于指定输出的描述性统计 量。这些统计量的含义是:均数、总和、标准差、方差、 全距、最小值)、最大值、标准误差、峰度系数和偏度系 数。
2.主要内容 一般来说,进行探索性分析主要考察以下内容。 (1)检查数据是否有错。过大或过小的数据均可能是异 常值、影响点或错误值。要检查这样的数据,并分析 原因,然后决定是否从分析中剔除这些数据。 (2)获得数据分布特征。很多统计方法模型对数据的分 布有要求,如方差分析就需要数据服从正态分布。 (3)对数据的初步观察,发现一些内在规律。
(1)采用重抽样技术从原始样本中抽取一定数量(自 己给定)的样本,此过程允许重复抽样。
(2)根据抽出的样本计算给定的统计量T。
(3)重复上述N次(一般大于1000),得到N个统计量 T。
(4) 计算上述N个统计量T的样本值,最终得到统计 量的估计值。
Step 01 选择菜单栏中的【分析】→【描述统计】→ 【频率】命令,弹出【频率】对话框,如图3-1所示,这 是频数分析的主操作窗口。
女演员:50 44 35 80 26 28 41 21 61 38 49 33 74 30 33 41 31 35 41 42 37 26 34 34 35 26 61 60 34 24 30 37 31 27 39 34
Step 01 打开随书光盘中的数据文件3-2.sav,其中 “male”和“female”列分别表示男演员和女演员;选择 菜单栏中的【分析】→【描述性统计】→【描述】命令,弹 出【描述性】对话框,如图3-14所示。
图3-4 【频率:格式】对话框
Step 06 单击图3-1中的【Bootstrap】按钮,弹出如图3-5 所示的【Bootstrap】对话框,在此对话框中可以进行下述 统计量的Bootstrap估计。 支持均值、标准差、方差、中位数、偏度、峰度和百分位 数的Bootstrap估计。 支持百分比的Bootstrap估计。
24 18 18 26 24 23 16 18 21 20 21 24 19 19 14 22 21 26 27 15 19 17 20 20 19 22 23 16 23 21 15 19 21 20 22 15 24 19
Step 01 打开SPSS软件和数据文件3-1.sav,选择菜单栏 中的【分析】→【描述统计】→【频率】命令,弹出【频率】 对话框,如图3-6所示。
图3-16 选择输出图形类型
男演员
N 全距 极小值 极大值 均值 标准差
偏度
峰度
统计量 统计量 统计量 统计量 统计量 统计量 统计量 标准误 统计量 标准误
36 45 31 76 45.14 10.406 0.898 0.393 0.704 0.768
女演员
36 59 21 80 38.94 13.546 1.503 0.393 2.111 0.768
图3-6 【频率】对话框
Step 02 在左侧的候选变量列表框中选择“sale”变量,将 其添加至【变量】列表框中,表示它是进行频数分析的变量, 如图3-7所示。
图3-7 选择分析变量
Step 03 单击【统计量】按钮,弹出如图3-8所示的【频率: 统计量】对话框;勾选【四分位数】复选框,要求输出四分 数,然后单击【继续】按钮,返回【频率】对话框。
百分百 有效百分比 累积百分比
2.6
2.6
2.6
7.9
7.9
10.5
5.3
5.3
15.8
2.6
2.6
18.4
7.9
7.9
26.3
15.8 15.8
42.1
10.5 10.5
52.6
13.2 13.2
65.8
7.9
7.9
73.7
7.9
7.9
81.6
10.5 10.5
92.1
5.3
5.3
97.4
2.6
2.6
Step 06 单击【确定】按钮结束操作,SPSS软件自动输 出结果。
请你分析不同性别演员获得奥斯卡奖的年龄差异性。
男演员:32 37 36 32 51 53 33 61 35 45 55 39 76 37 42 40 32 60 38 56 48 48 40 43 62 43 42 44 41 56 39 46 31 47 45 60
100.0
100.0 100.0
(3)直方图
3.2.1 描述统计分析的基本原理
1.使用目的 2.刻画集中趋势的描述统计量 3.刻画离散程度的描述统计量 4.刻画分布形态的描述统计量
描述过程过程是连续资料统计描述应用最多的一个过程, 它可对变量进行描述性统计分析计算,并列出一系列相应的 统计指标。这和其他过程相比并无不同。但该过程还有个特 殊功能,就是可将原始数据转换成标准化值,并以变量的形 式保存。
图3-1 【频率】对话框
Step 02 在左侧的候选变量列表框中,选取一个或多个 待分析变量,单击 按钮,将它们移入右侧的【变量】列
表框中。 Step 03 勾选【显示频率表格】复选框,输出频数分析表。 Step 04 在该对话框中还可以单击【统计量】和【图表】 等按钮,进行其他基本统计分析,这些选项提供了丰富的统 计输出结果。