SPSS第四章基本统计分析

合集下载

第4章-SPSS基本统计分析

2016/12/25
21
基本描述统计量
描述离散程度的统计量
离散程度：指一组数据远离“中心值”的程度。即考查所有数据相对于“中心值”分布的疏密程度。如果数据都紧密地集中在“中心值”的周围，数据的离散程度较小，则说明“中心值”对数据的代表性就好；如果数据比较松散地分布在“中心值”的周围，数据的离散程度较大，则 “中心值”说明数据特征是不具有代表性的。
案例

利用“大学生职业生涯规划数据”进行以下分析：
1. 计算专业和职业认知得分的基本描述统计
量，并比较男女生的得分差异； 2. 分析是否存在专业和职业认知得分的异常值。

应用举例
基本描述统计
以“居民储蓄调查数据”为例，对一次存(取)款金额。有两个分析目标：目标一：计算存(取)款金额的基本描述统计量，并对城镇储户和农村储户进行比较 (数据拆分)
SK 0
左(负)偏态
x
M M
152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 e 169o170 171 172 173 174 175
基本描述统计量

描述陡峭程度的统计量
– 峰度(kurtosis): 描述某变量取值分布形态陡缓程
龄
合计
频数分析表

频数分析的任务：编制频数分布表
用宽度相同的条形的高度或长短来表示频数分布变化的图如果有缺省值，那 – 各组的名称形。使用于定序和定类变量的分析么有效百分比能更 – 频数（Frequency）加准确地反映取值用圆形及圆内扇形的面积来表示频数百分比变化的图形。 – 百分比（Percent）分布状况

第四章 SPSS基本统计分析共60页文档

操作步骤：
打开数据文件“婴儿体重.sav”。打开 Descriptives主对话框，选定变量t进入 Variable栏中。
选中Save standardized values as variables复选框，要求计算变量的z值，并保存结果到当前数据集中。
单击Options按钮，选中Mean、 Std.Deviation、Minimum、Maximum 、 Variance 项。
统计量
选择一个或多个变量右移入 Variable（s）框。
统计图频数输出的顺序
输出统计量对话框
Chart 对话框
按变量值的升序输出按频数的升序输出
统计表中变量的各项分析结果在一张表并列显示
按各个变量组织输出，输出结果将按照每个变量一张表的形式显示
控制频数表输出范围类型的最大数目为
• 统计结果表明：本市户口家庭的人均住房面积的均值是21.7平方米，低于外地户口家庭 26.7。无论是本市户口还是外地户口，人均住房面积的分布均呈一定的右偏分布（两个偏度统计量分别为2.18和1.43），且本市户口的偏度更大些；同时，本市户口和外地户口家庭人均住房面积均呈尖峰分布（两个峰度统计量分别为8.3和2.1）。由此可见，本市户口和外地户口中的大部分家庭的人均住房面积都低于各自的平均水平，此时，仅用均值刻画住房状况是不准确的。
(二）基本描述统计量
• 常见的基本描述统计量可以分为三大类： 1、集中趋势的描述统计量（均值、中位值、众值）； 2、离散程度的描述统计量（标准差、方差、极差）； 3、分布形态的描述统计量（偏度系数、峰度系数）。
（三）应用举例
• 利用住房状况调查问卷数据，对人均住房面积计算基本描述统计量，并分别对本市户口和外地户口家庭进行比较。（首先进行数据拆分）

4-1.SPSS基本统计分析

口”的两类调查对象在居室面积(变量a7)
上的分布差异。
具体要求—— 上述各题，均要求随机选择规定数量的个案来进行分析。(数量的确定：用自己学号的最后两位数乘以10，再加上1600，所得数字为各人要分析的个案数量。）
第二节
描述性统计分析
一、概述
SPSS的描述性统计分析过程的功能与频数分析过程类似，但没有图形功能。
集中值
离散值
分布参数栏
其中，选项“values are group midpoints”，如果数据已经分组，就按分组的数据计算中位数和百分位数。
在“Chart（图形）”对话框中，其中“Histogram(s)(直方图)”下方的 “With normai curve(绘制正态分布曲线)”，表示在显示的直方图中添加正态曲线图，用于推断数据是否近似服从正态分布。

SPSS输出的频数分布表包括的内容：
⑴频数（Frequency）
⑵百分比（Percent）
⑶有效百分比（Valid Percent）
⑷累计百分比（Cumulative Percent）
三、操作演示与例题分析1
数据：“2000某市房产抽查”数据
变量：a6房屋结构
结果呈现的内容：
⑴ 频数分布表；
⑵ 基本图形；
注意—— 不同层次变量能够适用的集中值和离散值是不一样的。在Statistics对话框中，要根据不同的变量选择不同的统计值。定类变量：众值、异众比率。定序变量：中位数、四分互差；众值、异众比率。
定距变量：均值、极差和方差；众值、异众比率；中位数、四分互差。
Format(格式)对话框
选择频数表中排列顺序用于设置频数表输出的格式多变量框中可设定多变量表格输出的格式

第四章SPSS基本统计分析

SPSS （以5种饮料购买频数.sav为例）
菜单分析
描述统计
频率
SPSS
SPSS
SPSS
SPSS
SPSS
SPSS频数分析的扩展功能
• 计算分位数 • 计算其他描述统计量 • 频数分析表格式的定义
计算集中趋势
SPSS
计算分位数
计算离散程度
SPSS
频数分布格式定义
频数分析应用举例 SPSS （以居民储蓄调查数据.sav为例）
根据样本数据，产生二维或多维交叉列联表
在交叉列联表的基础上，对两两变量间是否存在一定的相关性进行分析
目的
分析多变量不同取值下的分布，掌握多变量的联合分布特征，进而分析变量之间的相互影响和关系
交叉列联表的主要内容
SPSS
行变量
列变量
二维交叉列联表行边缘分布
列边缘分布
SPSS
SPSS
SPSS
SPSS
对存款金额按照户口进行拆分
SPSS
按户口拆分好的数据
SPSS
对拆分好的数据进行频数分析
SPSS
SPSS
SPSS
练习
• 现有SY-3（公司职员统计表）.sav，要求对其中的变量年龄和受教育年限进行频数分析，结果输出中要求有四分位数、均值、标准差、方差、最大值、最小值、数据分布的偏度和峰度情况，输出条形图，图表值按照频率输出，格式则按照系统默认的方式进行，要显示频率表格。
分析
多重响应
定义变量集
SPSS
SPSS
分析 SPSS
多重响应
频率
SPSS
SPSS
储户的存款目的 SPSS

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

WORD 格式整理《统计分析与SPSS的应用（第五版）》（薛薇）课后练习答案第 4 章 SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析，分析被调查者的常住地、职业和年龄分布特征，并绘制条形图。

分析——描述统计——频率，选择“常住地”，“职业”和“年龄”到变量中，然后，图表——条形图——图表值（频率）——继续，勾选显示频率表格，点击确定。

Statistics户口所在职业年龄地Valid282282282NMissing000户口所在地Frequency Percent Valid CumulativePercent Percent中心城市20070.970.970.9 Valid 边远郊区8229.129.1100.0Total282100.0100.0职业Frequency Percent Valid CumulativePercent Percent 国家机关248.58.58.5商业服务业5419.119.127.7文教卫生18 6.4 6.434.0公交建筑业15 5.3 5.339.4Valid 经营性公司18 6.4 6.445.7学校15 5.3 5.351.1一般农户3512.412.463.5种粮棉专业4 1.4 1.464.9户WORD 格式整理种果菜专业10 3.5 3.568.4户工商运专业3412.112.180.5户退役人员17 6.0 6.086.5金融机构3512.412.498.9现役军人3 1.1 1.1100.0Total282100.0100.0年龄Frequency Percent Valid CumulativePercent Percent20 岁以下4 1.4 1.4 1.420~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.550 岁以上4114.514.5100.0Total282100.0100.0分析：本次调查的有效样本为282 份。

第四章_SPSS基本统计分析

S .E.of .Mean

(x X )
M
2

[ x E ( x )]2 M

n
其中：为总体标准差，n为样本单位数
2.刻画离散程度的描述统计量
离散程度是指一组数据远离其“中心值”的程度
。（1）如果数据都紧密地集中在“中心值”的周围，数据的离散程度较小，说明这个“中心值”对数据的代表性好。（2）如果数据仅是比较松散地分布在“中心值”的周围，数据的离散程度较大，则此“中心值”说明数据特征是不具有代表性的。
• 4.2.2 计算基本描述统计量的操作
（1）选择菜单Analyze－Descriptive Statistics－Descriptives，出现如下窗口：
（2）将需计算的数值型变量选择到Variable(s)框中。（3）单击Option按钮指定计算哪些基本描述统计量，出现如下窗口：
基本统计量分布
基本描述统计量的应用举例
（1）利用住房状况调查数据，对人均住房面积计算基本统计量，并分别对本市户口和外地户口进行家庭比较。（2）利用住房状况调查数据，分析人均住房面积是否存在不均衡现象。
基本描述统计量的应用举例
分析：（1）不均衡现象可以通过分析是否存在大量异常值—根据 3 准则，处于3倍标准差之外的值一般为异常值。（2）可通过对数据的标准化处理来判断。标准化的数学定义为：
2.计算其他基本描述统计量
SPSS频数分析还能够计算其他基本统计量，其中包括：（1）描述集中趋势（Central Tendency）的基本统计量（2）描述离散程度（Dispersion）的基本统计量（3）描述分布形态（Distribution）的基本统计量

第4章 SPSS基本统计分析讲解

4.1 频数分析 4.2 计算基本描述统计量 4.3 交叉分组下的频数分析 4.4 多选项分析 4.5 比率分析
学习目标及内容：
掌握SPSS 频数分析的基本方法及其操作明确基本描述统计量的含义，并掌握其操作
掌握交叉列联分析的基本方法，了解卡方检验的基本思想，并熟练操作
掌握对多选项问题的不同拆分方法和应用场合，并能用于数据分析
25%、50%、75%的百分位数；
将数据平均分为所设定的相等等份，可输入2— 100 的整数，如键入4则输出第25、50、75百分位数
自定义百分位数，可输入0—统计量对话框
案例:分析人均住房面积的分布情况，并对本市户口和外地户口家庭进行比较
?展示所有样本的四分位数：在变量【variable（s）】中选择“人均面积”，在【statistics】中选择四分位数【quartiles】即可。
?SPSS 提供了计算任意分位数的功能，用户可以指定将数据等分为n份（Cut points for n equal groups ）。
?还可以直接指定分位点（Percentile ）。
四分位差（也称内距或四分位距）
?它是上四分位数（QU，即位于75% ）与下四分位数（QL，即位于25% ）。计算公式为：Qd =QU-QL
操作：运用前面介绍的分组操作按“人均面积”将住房分成1、2、3、4组，并赋给变量值，如1为人均住房 “小于10平方米”…
?【transform 】→【recode into different variables 】
?然后选择频数分析【analyze 】→【descriptive statistics 】→ 【frequercies 】，采用“分组后的人均面积”作为计算频数的变量。在【charts 】中使用直方图histograms ，带正态曲线with normal curve;

第4章 SPSS基本统计分析

• 分析不同居住类型的被访者未来的购房预期是否一致
练习3
• 完成上例
提纲
1
频数分析
2
计算基本描述统计量
复合分组下的频数分析多选项分析
3
4
5
比率分析
多选项分析
实现思路 1）按多选项二分法或多选项分类法将多选项问题分解成若干的问题，并设置若干个SPSS变量 2）采用多选项频数分析或多选项交叉分组下的频
• 选择若干个频数分析的变量
• 选择绘制统计图形
4、频数分析的扩展功能
计算分位数 • 分位数：是变量在不同百分位点上的取值。分位点在0~100之间。 • 分位数差是一种描述数据离散程度的方式。分位数差越大，表示数据在相应分位上的离散程度越大
4、频数分析的扩展功能
频数分布表格式的定义 • 调整频数分布表中数据的输出顺序
– 按变量值的升序或降序输出 – 按频数值的升序或降序输出
• 压缩频数分布表
– SPSS默认如果变量取值的个数或取值区间的个数大于10，则不输出相应的频数分布表
5、频数分析应用举例
分析月住房开销的分布，并对不同居住类型进行比较 • 1）“月住房开销”为定距型变量→先分组，再编制频数分布表
• 2）计算月住房开销的四分位数→按照“居住类型” 将数据拆分，并重新计算四分位数→进行比较
• 累计百分比：即各百分比逐级累加起来的结果，
最终取值为100%。
2、频数分析中常用统计图
• 条形图：适用于定序和定类变量的分析。条形图
的纵坐标可以是频数,也可以是百分比。
• 饼图：饼图中圆内的扇形面积可以表示频数,也可
以表示百分比。
• 直方图：适用于定距型变量的分析。
3、频数分析的基本操作

第章 SPSS 基本统计量的描述

存 (取 )款金额
直方图
二、计算基本描述统计量
目的：精确把握变量的总体分布状况。基本操作： ✓ 描述统计－频率过程：统计 ✓ 描述统计－描述过程 ✓ 描述统计－探索过程 ✓ 均值比较－均值过程（分组显示）用途：计算变量的集中趋势、离散趋势、偏度、
峰度等指标，绘制统计图。
几个过程的基本描述统计量比较
农村户口
户口
城镇户口
饼图
Frequency
100
0 0.0
Std. Dev = 10945.57 Mean = 4738.1 10000.0 20000.0 30000.0 40000.0 50000.0 60000.0 70000.0 80000.0 90000.0N10=000208.02.00
McNemar：配对计数资料的卡方检验。零假设
为两变量的阳性率无差别源自2(bc 1)2
bc
Kappa一致性检验：系数取值－1～1。测量同一观测对象在两变量（两变量服从二项分布）上取值的一致性程度。其绝对值越接近1，说明一致性程度越高。一般来说：
✓ 系数>=0.7,一致性程度较高；
✓ 0.4~0.7,一致性程度一般；
卡方检验操作：统计量选项
【单元格】：用于定义列联表单元格中需要计算的指标：
计数：是否输出实际观察数和理论数；
百分比：是否输出行百分数、列百分数以及合计百分数；
残差：选择残差的显示方式；
【格式】：用于选择行变量是升序还是降序排列。
结果：城乡储户的收入水平没有明显差异。
Pearson卡方值的影响因素
C
2 2 n
A11A22A12A21
R1R2C1C2
2

第四章SPSS基本统计分析

婴儿体重的描述统计量
Des cripti ve St atist ics N 婴儿体重 Valid N (listwise) 20 20 Minimum 2272.00 Maximum Mean 4654.00 3233.4500 Std. Deviation 653.2335
这时打开原数据集，可看到多了一列zt，这是t 的z 分数，如下图所示：
Explore 主对话框
Statistics对话框
Explore 栏中Plots对话框
Explore 栏中Options对话框
确定缺失值的处置： •因变量或分组变量中带有缺失值的观测量都将在分析过程中被剔除。 •在分析过程中根据分组变量产生的组中带缺失值的观测量都将被剔除。
•分组变量的缺失值被单独分为一组，输出频数时将标出缺失Huber's Tukey's Hampel's a b d SEX M-Estimator Biweight M-Estimatorc Andrews' Wave HIGHT 1 133.0168 133.1928 133.1157 133.1930 2 135.4183 136.2104 135.1852 136.2327 a. The weighting constant is 1.339. b. The weighting constant is 4.685. c. The weighting constants are 1.700, 3.400, and 8.500 d. The weighting constant is 1.340*pi.
打开Statistics对话框，选中Descriptives 、Mestimation、 Outliers复选项，单击Continue返回；打开Plot对话框，选择Boxplots栏中的Factor levels together项，选择Descriptives栏内的 Stem-and-leaf 复选项，选择Spread vs level with levene Test栏中的 Power estimation项，单击 Continue 返回。单击OK

SPSS第四章-基本统计分析

Continue Cancel
Help
Suppress tables with more than 18 categories
.
格式的参数说明即操作
调整频数分布表中数据输出顺序(order by)
按值的升序或者降序输出；按频数的升序或者降序输出；
压缩频数分布表
如果变量取值太多或者区间太多，就需要压缩分布表；
.
Charts…
Format…
4.1.2 频数分析的基本操作（续）
Chart Type None
Bar Chart Pie Chart Histograms
With normal curve
Continue Cancel
Help
Chart Values Frequencies
Percentages
第4章 SPSS基本统计分析
制作人：夏怡凡
.
主要内容：
引言介绍基本统计分析的重要性和主要内容；频数分析介绍如何对数据的频数分布进行把握；计算基本描述统计量进一步描述更为精确的数据
分布特征；列联表分析描述多个变量之间是否存在相关关系；多选项分析对应处理问卷种多选的问题；比率分析描述两变量间比率的变化（新增功能）。
表现集中趋势的统计
量主要有
1n
均值：数学定义中位数：
x n i1 xi
众数：
.
4.2 .1.2 刻画离散程度的描述统计量
条形图（Bar Chart）：用条形的高度和长短表示频数分布的图形，适用定序和定类变量的分析；
饼图（Pie Chart）：用圆形和圆内扇形面积表示频数百分比，圆内扇形既可以表示频数也可以表示百分比；
直方图（Histograms）：用矩形面积表示频数分布变化，试用与定距变量的分析，可以附加正态曲线

第4章：SPSS的统计分析

把“地区标志”作为分组变量，对不同的组进行比较
ADD 平均绝对离差
COD离散系数 Mean centered COV 均值的变异系数
COV变异系数
Median centered COV中位数变异系数
分析analyze描述统计descriptivestatistics频数frequencies点击图表chart选择统计图点击格式format调整频数分布表中数据的输出顺序点击格式format调整分布表中数据的输出顺序统计结果输出结果输出窗口413频数分析的扩展功能spss编制频数分布表和绘制统计图是频数分析的基本任务除此之外在频率窗口中通点击统计量statistics按钮还可以计算其他的统量
数据拆分
表明该数据是进行拆分了的
计算描述统计
分析结果（结果输出窗口）分析结果（结果输出窗口）
4.3 交叉分组下的频数分析
4.3.1 交叉分组下的频数分析的目的和基本任务通过频数分析能够掌握单个变量的数据分布情况。在实际分析中，不仅要了解单变量的特征，还要分析多个变量不同取值下的分布，掌握多变量的联合分布特征，进而分析变量间的相互影响和关系。对多变量的联合分布特征的分析，常采用交叉分组下的频数分析来完成。交叉分组下的频数分析又称列联表分析，它包括两大基本任务：第一，根据收集到的样本数据编制交叉列联表；第二，在交叉列联表的基础上，对两两变量间是否存在一定的相关性进行分析。
1.多选项二分法 1.多选项二分法多选项二分法就是将多选项问题中的每个答案设为一个 SPSS变量，每个变量只有0或1两个取值，分别表示选择该答案和不选择该答案。例如：多选项二分法. 2. 多选项分类法多选项分类法中，首先估计多选项问题最多可能出现的答案个数；然后，为每个答案设置一个SPSS变量，变脸取值为多选项问题中的可选答案。例如：多选项分类法. 在选择多选项问题分解时，对于所选答案具有一定顺序的多选项问题可采用多选项分类法分解，而没有顺序的问题可采用二分法分解。

spss基本统计分析

依次连接各点，依次连接各点，即可得分布折线图。即可得分布折线图。
0.70
? 0.60
0.50
0.40
0.30
0.40
0.60
0.80
1.00
1.20
1.40
1.60
n
f P-P图和图和Q-Q图图和图
直方图和茎叶图是评估数据分布的常用图形, 直方图和茎叶图是评估数据分布的常用图形 P-P 图和Q-Q图是直观表示数据分布是否正态。图是直观表示数据分布是否正态。图和图是直观表示数据分布是否正态 P-P图是根据变量的累积概率对应于所指定的理论图是根据变量的累积概率对应于所指定的理论分布累积概率绘制的散点图;Q-Q图是根据变量数据图是根据变量数据分布累积概率绘制的散点图分布的分位数与所指定分布分位数之间的曲线来进行检验。检验。
b 园图（饼图）园图（饼图）
用于表示计数资料、用于表示计数资料、质量性状资料或半定量等级）资料的构成比。（等级）资料的构成比。所谓构成比，就是各类别、所谓构成比，就是各类别、等级的观测值个数 (次数与观测值总个数样本含量的百分比。次数)与观测值总个数样本含量)的百分比次数与观测值总个数(样本含量的百分比。把园图的全面积看成100%，按各类别、等级的，按各类别、把园图的全面积看成构成比将园面积分成若干分，构成比将园面积分成若干分，以扇形面积的大小表分别表示各类别、等级的比例。分别表示各类别、等级的比例。
第四章基本统计分析
SPSS统计分析功能概述一、SPSS统计分析功能概述
1、SPSS数值、数值分析过程 2、SPSS图形、图形分析过程
1、SPSS数值分析过程 SPSS数值分析过程

《SPSS统计分析方法及应用》第四章--基本统计分析

SPSS提供了计算任意分位数的功能，用户可以指定将数据等分为n份（Cut points for n equal groups）。还可以直接指定分位点（Percentile）。
《SPSS统计分析方法及应用》第四章--基本统计分析
2、计算其他基本描述统计量 SPSS频数分析还能够计算其他基本统计量，其中
《SPSS统计分析方法及应用》第四章--基本统计分析
（2）频数分析的第二个任务是绘制统计图
条形图（Bar Chart）：用宽度相同的条形的高度或长短来表示频数分布变化的图形，适用于定序和定类变量的分析。饼图（Pie Chart）：用圆形及圆内扇形的面积来表示频数百分比变化的图形，以利于研究事物内在结构组成等问题。直方图（Histograms）：用矩形的面积来表示频数分布变化的图形，适用于定距型变量的分析。
分布形态栏
输出统计量对话框
《SPSS统计分析方法及应用》第四章--基本统计分析
4.1.3 SPSS频数分析的扩展功能 1、计算分位数（Percentile Values）
分位数是变量在不同分位点上的取值。分位点在0－ 100之间。一般使用较多的是四分位点（Quartiles），即将所有数据按升序排序后平均等分成四份，各分位点依次是25％，50％，75％。于是四分位数便分别是25％， 50％，75％点所对应的变量值。此外，还有八分位数、十六分位数等。
的频数的升序排列按变量各种取值发生
的频数的降序排列
多变量框中可设定多变量表格输出的格式
控制频数表输出的分类数量。默认为10
Format 对话框
《SPSS统计分析方法及应用》第四章--基本统计分析
3、频数分布表格式（Format）的定义（1）调整频数分布表中数据的输出顺序（Order by）：频数分布表中的内容的输出顺序可以按变量值的升序输出（Ascending values），按变量值的降序输出（Descending values），按频数的升序输出（ Ascending counts），按频数的降序输出（ Descending counts）。

第4章 SPSS基本统计分析

第4章 SPSS基本统计分析
▪ 4.1 频数分析 4.1.1 频数分析的目的和基本任务 4.1.2 频数分析的基本操作 4.1.3 SPSS频数分析的扩展功能 4.1.4 频数分析的应用举例
▪ 4.1.1 频数分析的目的和基本任务 ▪ 目的 ▪ 粗略把握变量值的分布状况。 ▪ 例：研究被调查者的特征（如：性别、年龄、收入） ▪ 研究被调查者对某个问题的总体看法（如：教学方式、
12
10
2
4
0.4
B
14
10
4
16
1.6
C
9
10
-1
1
0.1
D
5
10
-5Βιβλιοθήκη 252.5E10
10
0
0
0.0
∑ χ2 (fofe)2 4.6
fe
▪ 自由度：df=k-1 ▪ 在0.05的显著性水平下，查表自由度为4时的
卡方临界值为：9.488
▪ 在spss中的操作
卡方检验原理例二
▪ 我们假设有一位社会研究者有兴趣调查高级中学学生对于大学学历的重要性的态度。她询问了一个60 名高级中学学生的样本，接受大学教育是否变得更加重要、更不重要或者没有变化。
户城镇户口口
农村户口
买东西 113
59
存钱合计
87
200
23
82
合计
172
110
282
2
n
Cramer's V
▪ Cramer's V是基于卡方统计量的关联性测量。
2
V nmin(R1)(C1)
选择行、列数最小一个
收 300元以下入 300~800 水平 800~1500

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

中 0 500 0
高 0 0 600
一致
1 - 29
青中老
低 0 0 400
中 0 600 0
高 500 0 0
应用举例
受教育程度越高通信支出越高吗？受教育程度越高通信支出比例越高吗？
1 - 30
多选项分析
什么是多选项问题？
(1)即:在回答某些问题时,答案在两个以上例如:请问您平时主要的休闲娱乐方式是: a.看电视、听广播 b.玩游戏 c.体育运动 d.逛街购物e.经常去港澳游玩 f.看书学习 g.喝酒聊天 h.工作太忙,没时间休闲娱乐又如：您经常浏览的网站？在下列品牌中您信任哪些品牌？ (2)多选项问题不能直接处理。因为SPSS中的一个变量对每一个答案只能取一个值。
2 2
2
C
2
1 - 27
分析列联表中变量间的关系
Ordinal（定序变量）

反映定序变量一致性指标行变量等级越高，列变量等级也越高或越低 ——一致性高行变量等级越高，列变量等级不定——不一致指标绝对值越大越相关，越接近0越无关
1 - 28
定序变量一致性检验
年龄与工资收入交叉列联表低青 400 一致中 0 老 0
n 3
3
计算描述统计量
描述陡峭程度的统计量

峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。
峭度为0表示与正态分布峭度相同。大于0表示比正态分布陡，尖峰。小于0表示比正态分布缓；平峰。
Kurtosis
1 - 12
1 n -1
i 1 ( xi x) / SD 3
n 4 4
计算描述统计量
其他统计量

均值标准误差(S.E means)
中心极限定理认为：样本均值~N(u,2/n) 反映样本均值与总体真值间的平均离散
程度样本数越大，样本均值的离散程度越小，对真值的估计越准确
1 - 13
计算描述统计量
基本操作步骤
(1)菜单选项:Analyze->Descriptive Statistics ->Descripive (2)选择将参加计算的数值型变量名到Variables框。 ——仅适用于数值型变量
1 - 23
分析列联表中变量间的关系
•卡方检验基本步骤
(1)H0:行列变量之间无关联或相互独立 (2)构造卡方统计量 •统计量服从(r-1)*(c-1) 个自由度的卡方分布 •count:观察(实际)频数 •expected count:期望频数
(期望频数反映的是H0成立情况下的数据分布特征)
采用的方法
制作频数分布表：包括计算频数、累计频数、百分比、累计百分比绘制统计图形：条形图（品质数据）、饼图、直方图（数量数据）

1-3
频数分析
基本操作步骤
(1)菜单选项:Analyze->Descriptive Statistics->Frequencies (2)选择几个待分析的变量到variables框. (3)chart选项，选择所需要的图形例：班级男女生频数分布表、成绩分布表
数据标准化处理应用举例源自快速找到移动话费出众的客户网通集团企业效益评价

1 - 15
探索性描述分析
目的:在未知数据分布特点情况下,通过计算详尽描述统计量, 辅助全面的统计图,认识数据分布。基本操作步骤 (1)菜单选项:analyze->descriptive statistics->Explore (2)选择将参加计算的数值型变量名到Dependent list框 (3)进行分组描述分析时，将分组变量选入Fact list框描述统计量： M统计量：集中趋势的估计值，不受极端值影响。用于判断有无异常值。
购买数量多少列总计个案数
已婚者 31％ 69％ 100％ 700
单身者 52％ 48％ 100％ 300
男性女性购买数量已婚者单身者已婚者单身者多 35％ 40％ 25％ 60％少列总计个案数 65％ 100％ 400 60％ 100％ 120 75％ 100％ 300 40％ 100％ 180
分位数、中位数、众数的应用举例
不同类型的移动客户月话费比较（数据拆分）利用分位数（不显示频数分布表），比较男女生成绩集中程度
1-8
计算描述统计量
目的

精确把握变量的总体分布状况，了解数据的集中趋势、离散趋势、对称程度、陡峭程度。
基本方法

计算基本描述统计量
1-9
计算描述统计量
描述集中趋势的统计量均值(mean):表示某变量所有变量值集中趋势或平均水平的统计量。适用于定距定比数据。特点：利用了全部数据，易受极端值的影响。描述离散程度的统计量标准差(standard deviation--Std Dev):表示某变量的所有变量值离散趋势的统计量。 SPSS中计算的是样本标准差。方差(variance):标准差的平方。 SPSS中计算的是样本方差。极差 (range):最大值(minimum)-最小值(minimum) 1 - 10
1-6
频数分析
• 频数分析中的其他分析
• 计算中位数、分位数:适用于定序、定距数据 – 数据按升序排序后，找到若干个分位点上的变量值 – quartiles:计算四分位数25%(QL)、50%(中位数)、 75%(QU) – cut points for n equal groups: n等份 – percentile: 自定义百分位点 • 计算众数:适用于定类数据（但必须是数值型）
1-7
频数分析
• 频数分析中的其他分析
• 分位数的应用
• 从一个侧面比较两组样本数据的集中趋势
– 例：( QL=50,QU=80) 和 (QL=70,QU=75) 的比较
• 在排除极端值影响的条件下，通过计算分位数差，比较两组样本数据的离散程度
– 例: ( QL=50,QU=80) 和 (QL=70,QU=75) 的比较
1 - 24
优男女总数 10 8 18 37.5

2
( fo f e ) fe
中 5 4 9 18.8
2
良 5 12 17 35.4
及格 3 1 4 8.3
总数 23 25 48 100
分析列联表中变量间的关系
卡方检验基本步骤
(3)计算卡方统计量的值，并得到该统计量值的概率P 值 (4)决策。概率P与显著性水平比较，小于等于则拒绝 H0,否则不能拒绝 statistics选项 Pearson Chi-Square:常用于行列变量独立性检验 Likelihood Ratio：可用于对数线性模型检验 Fisher‘s Exact Test：N<40,或Fe<5 Linear-by-Linear Association：线性相关卡方检验
进一步计算

cells选项:选择在频数分析表中输出各种百分比. row:行百分比(Row pct); column:列百分比(Col pct); total:总百分比(Tot pct);
1 - 22
分析列联表中变量间的关系目的：
通过列联表分析，检验行列变量之间是否独立。
方法：

卡方检验：对品质数据的相关性进行度量（这里两变量均为定类数据或定序数据）
1 - 32
多选项分析
多选项二分法
将每个答案作为一个变量，每个变量只有两个取值 (0或1)。例如:
变量名 X1 X2 X3 X4 X5 X6 变量名标签北京大学清华大学人民大学北京理工大学北京师范大学北京外国语大学编码方案 0 1 0 0 0 0 0 1 1 1 1 1
1 - 16
探索性描述分析
相关图形

箱线图茎叶图直方图正态分布图：检验变量是否符合正态分布方差齐性检验：各组离散程度是否相同

H0：方差相等
举例：两班学生成绩分布情况，离散程度是否相同。
1 - 17
购买数量多少列总计个案数
全部样本 37.3％ 62.7％ 100％ 1000
第四章 SPSS的基本统计分析
1-1
SPSS的基本统计分析
频数分析-对应图表法计算描述统计量-对应数值法探索性描述分析-结合交叉分组下的频数分析
多选项分析
统计图-对应图形法
1-2
频数分析
目的
粗略把握变量的总体分布状况。
例：对某个问题的总体看法，如新业务的使用愿望、教学效果等对某事物的客观描述，如通话的漫游类型、大客户的行业分布
1-4
频数分析
• 应用举例
移动通话的漫游类型分析特点：定类数据使用频数、百分比、总数(不可缺少的) 不使用频数表中给出的累计频数和累计百分比移动通话时间分析、移动客户话费分析特点：定序数据、数量数据除使用频数、百分比、总数外，还可以充分使用累计频数和累计百分比
1-5
频数分析
• 数据中存在缺失值 • 使用有效百分比(分母为有效样本数) • 例：学生成绩得优率、得良率 Frequencies->Format 频数分布表输出按变量值、频数升序、降序输出
购买流行服装
交叉分组下的频数分析
针对定类数据和定序数据的频数分析(用于定类定序数据分析有custom table\logistic\loglinear) 目的:通过了解不同变量在不同水平下的数据分布情况，判断水平对变量是否有影响
例：女生的学习成绩比男生好吗？(两变量) 不同专业的女生学习成绩都比男生好吗？ (三变量)

实现步骤
1 - 25

SPSS第四章基本统计分析

第4章-SPSS基本统计分析

第四章 SPSS基本统计分析共60页文档

4-1.SPSS基本统计分析

第四章SPSS基本统计分析

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

第四章_SPSS基本统计分析

第4章 SPSS基本统计分析讲解

第4章 SPSS基本统计分析

第 章 SPSS 基本统计量的描述

第四章SPSS基本统计分析

SPSS第四章-基本统计分析

第4章：SPSS的统计分析

spss基本统计分析

《SPSS统计分析方法及应用》第四章--基本统计分析

第4章 SPSS基本统计分析

第章 SPSS 基本统计量的描述