SPSS统计分析—描述性统计分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• ① Frequencies:产生变量值的频数分布表,并可计算常见 描述性统计量和绘制相对应的统计图。
• ② Descriptives:计算一般的描述性统计量。 • ③ Explore:探索性分析,使用户能够从大量的分析结果之
中挖掘到所需要的统计信息。
• ④ Crosstabs:对分类变量进行统计推断,包括卡方检验、 确切概率等,是SPSS重要的过程。
4、极值表 5、正态性检验
6、方差齐次性检验
7、茎叶图
茎叶图包括频数(Frequency)、茎(Stem)和叶(Leaf)3 部分。
8、QQ图和QQ去势图
◆ 问题:各种图形是用来做什么的?正态性检验和方差齐次 性检验方法的作用分别是什么?
列联表分析-Crosstabs
1、四格卡方检验的基本思想
◆ 问题:能否通过直观的描述假设检验的基本思想?
一般步骤: (1)根据问题的需要对所研究的总体作某种假设,记作
H0
(2)选取合适的统计量,这个统计量的选取要使得在假 设H0成立时,其分布为已知。
(3)由实测的样本,计算出统计量的值。
(4)计算并根据预先给定的显著性水平进行检验,作出 拒绝或接受假设H0的判断。
• 学生身高的探索性分析 执行【Analyze】/【Descriptive Statistics】/ 【Explore】命令,弹出如图所示对话框
• 结果解读 1、描述性统计分析表
其中,5% Trimmed Mean:去掉5%极端数之后的均值。
2、M-均值估计——检验异常数据。
3、分位点表
其中Tukey's Hinges表示的是绘制箱图时所用的分位点数据, 它的计算方法和一般的百分位数略有不同。
描述性统计分析
描述性统计分析是基础的统计分析过程。
通过描述性统计分析,可以挖掘出很多统计量 的特征。
1、描述性统计量:集中趋势与离散趋势
2、频数分布表分析
3、基础统计量分析
4、探S索P性S分S析统计分析从基础到实践(第2版)
5、列联表分析 6、相对比分析
联系Email:sharepub@126.com
每个格子中的理论频数T是在假定两组的发癌率相等(均等于两 组合计的发癌率)的情况下计算出来的,如第一行第一列的理论 频数为71*91/113=57.18,故卡方值越大,说明实际频数与理论频 数的差别越明显,两组发癌率不同的可能性越大。
2、卡方检验方法的适用条件
• 吸烟习惯与患病率的关系
调查339名50岁以上吸烟习惯与患慢性气管炎病的关系,如 上表所示。试问吸烟者与不吸烟者慢性气管炎患病率是否有 所不同。 ◆ 数据的预处理:WEIGHT CASE
Z变换(标准正态变换):
zi
xi
S
x
其中 表x 变量的均值,S表变量的标准差。如果选择该项,
则数据文件中将自动生成一列名为“Z+原变量名”的新 变量。

变换前
变换后
◆问题:标准正态分布变化后的数据有什么作用?
探索性分析——Explore
• 与前面介绍的两个过程相比,【Explore】过程更加强大。 • 它除了可以计算常见描述性统计量之外,还可以给出一些简
在分类资料统计分析中我们常会遇到这样的资料,如两组大白鼠 在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别? --------------------------------------------------------处理 发癌数 未发癌数 合计 发癌率% ---------------------------------------------------------甲组 52 19 71 73.24 乙组 39 3 42 92.86 --------------------------------------------------------合计 91 22 113 80.33 --------------------------------------------------------卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频 数T 差值平方与理论频数之比的累计和。
2、按要求给出某个分位点
3、绘制常用的条图、饼图等统计图
适用范围:更适用于对分类变量以及不服从正态分布的连 续性变量进行描述。
• 学生身高频数表:已知有某地120名12岁男童身高数据,编 制其传统的简易频数表。
执行【Analyze】/【Descriptive Statistics】/ 【Frequencies】命令,弹出如下所示对话框
• 执行【Analyze】/【Descriptive Statistics】/【Ratio】 命令,弹出如下图所示对话框
• 结果解读
• 相对比描述的常用指标
• 基本思想:概率反证法
(1)为了检验一个零假设(即虚拟假设)是否成立, 先假定它 是成立的,然后看接受这个假设之后,是否会导致不合理结 果。如果结果是合理的,就接受它;如不合理,则否定原假 设。
(2)所谓导致不合理结果,就是看是否在一次观察中, 出 现小概率事件。通常把出现小概率事件的概率记为0.01或者 0.05,即显著性水平。
单的检验结果和图形,有助于用户进一步地分析数据。 • ◆ 适用范围:对资料的性质,分布特点等完全不清楚的时

补充:假设检验
• 定义:假设检验是数理统计学中根据一定假设条件由样本 推断总体的一种方法。
• 它是根据原资料作出一个总体指标是否等于某一个数值,某 一随机变量是否服从某种概率分布的假设,然后利用样本资 料采用一定的统计方法计算出有关检验的统计量,依据一定 的概率原则,以较小的风险来判断估计数值与总体数值(或 者估计分布与实际分布)是否存在显著差异,是否应当接受 原假设选择的一种检验方法。
• 执行【Analyze】/【Descriptive Statistics】/ 【Crosstabs】命令,弹出如图所示对话框
• 结果解读
1、列联表 2、卡方检验结果
3、条图
相对比描述——Ratio
• 在实际问题中,研究者有时除了希望了解变量自身的统计特 征,还希望得到两个变量相对比之间的统计描述。
• ⑤ Ratio:计算两个变量相对比的统计量特征。
• ⑥ P-P Plots:绘制P-P图,检验数据服从的分布情况。
• ⑦ Q-Q Plots:绘制Q-Q图,检验数据服从的分布情况
频数分析-Frequencies
• 频数分析简介
频数分析表是描述性统计中最常用的方法之一,它主要包 括以下几点功能: 1、产生详细的频数表
描述性统计量
集中趋势
离散趋势
分布情况
均值
Mean
标准差 Std.deviatiom 偏度
Skewness
中位数 Median
方差
Variance
峰度
Kurtosis
众数
Fra Baidu bibliotek
Mode
极小值
Minimum

Sum
极大值
Maximum
全距
Range
均值的标准 误差
S.E.mean
• 【Descriptive Statistics】子菜单
• 法一:通过对两个变量作除法形成一个新变量,然后分析新 变量的统计特征来得到。
• 法二:直接通过【Ratio】过程来分析两个变量之间的相对 比关系,并且可以得到多于第一种方法的信息。
• 各地区城乡居民消费水平比较
已知有2005年各省城乡居民消费水平,试按地区对各省城 乡消费水平之比进行分析,并比较不同地区之间城乡消费水 平是否有较大差异。
这个过程有一个特殊的功能,可将原始数据转换成标准正 态分布评分值,并以变量形势存入数据库供以后分析。
• 学生身高频数表 执行【Analyze】/【Descriptive Statistics】/
【Explore】命令,弹出如下对话框
• 结果解读 1、描述性分析表
zi
xi
S
x
2、标准正态分布变化
• 结果解读 1、频数表
2、描述性统计量 3、直方图
◆ 问题:以上3个结果分别用来说明什么问题?
基础统计分析-Descriptive
• Descriptive简介
Descriptive过程是连续资料统计描述应用最多的一个过程。
对变量进行描述性统计分析,计算并列出一系列相应的统 计指标。这与其它过程相比并无不同。
相关文档
最新文档