SPSS统计分析—描述性统计分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• ① Frequencies:产生变量值的频数分布表,并可计算常见 描述性统计量和绘制相对应的统计图。
• ② Descriptives:计算一般的描述性统计量。 • ③ Explore:探索性分析,使用户能够从大量的分析结果之
中挖掘到所需要的统计信息。
• ④ Crosstabs:对分类变量进行统计推断,包括卡方检验、 确切概率等,是SPSS重要的过程。
4、极值表 5、正态性检验
6、方差齐次性检验
7、茎叶图
茎叶图包括频数(Frequency)、茎(Stem)和叶(Leaf)3 部分。
8、QQ图和QQ去势图
◆ 问题:各种图形是用来做什么的?正态性检验和方差齐次 性检验方法的作用分别是什么?
列联表分析-Crosstabs
1、四格卡方检验的基本思想
◆ 问题:能否通过直观的描述假设检验的基本思想?
一般步骤: (1)根据问题的需要对所研究的总体作某种假设,记作
H0
(2)选取合适的统计量,这个统计量的选取要使得在假 设H0成立时,其分布为已知。
(3)由实测的样本,计算出统计量的值。
(4)计算并根据预先给定的显著性水平进行检验,作出 拒绝或接受假设H0的判断。
• 学生身高的探索性分析 执行【Analyze】/【Descriptive Statistics】/ 【Explore】命令,弹出如图所示对话框
• 结果解读 1、描述性统计分析表
其中,5% Trimmed Mean:去掉5%极端数之后的均值。
2、M-均值估计——检验异常数据。
3、分位点表
其中Tukey's Hinges表示的是绘制箱图时所用的分位点数据, 它的计算方法和一般的百分位数略有不同。
描述性统计分析
描述性统计分析是基础的统计分析过程。
通过描述性统计分析,可以挖掘出很多统计量 的特征。
1、描述性统计量:集中趋势与离散趋势
2、频数分布表分析
3、基础统计量分析
4、探S索P性S分S析统计分析从基础到实践(第2版)
5、列联表分析 6、相对比分析
联系Email:sharepub@126.com
每个格子中的理论频数T是在假定两组的发癌率相等(均等于两 组合计的发癌率)的情况下计算出来的,如第一行第一列的理论 频数为71*91/113=57.18,故卡方值越大,说明实际频数与理论频 数的差别越明显,两组发癌率不同的可能性越大。
2、卡方检验方法的适用条件
• 吸烟习惯与患病率的关系
调查339名50岁以上吸烟习惯与患慢性气管炎病的关系,如 上表所示。试问吸烟者与不吸烟者慢性气管炎患病率是否有 所不同。 ◆ 数据的预处理:WEIGHT CASE
Z变换(标准正态变换):
zi
xi
S
x
其中 表x 变量的均值,S表变量的标准差。如果选择该项,
则数据文件中将自动生成一列名为“Z+原变量名”的新 变量。
•
变换前
变换后
◆问题:标准正态分布变化后的数据有什么作用?
探索性分析——Explore
• 与前面介绍的两个过程相比,【Explore】过程更加强大。 • 它除了可以计算常见描述性统计量之外,还可以给出一些简
在分类资料统计分析中我们常会遇到这样的资料,如两组大白鼠 在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别? --------------------------------------------------------处理 发癌数 未发癌数 合计 发癌率% ---------------------------------------------------------甲组 52 19 71 73.24 乙组 39 3 42 92.86 --------------------------------------------------------合计 91 22 113 80.33 --------------------------------------------------------卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频 数T 差值平方与理论频数之比的累计和。
2、按要求给出某个分位点
3、绘制常用的条图、饼图等统计图
适用范围:更适用于对分类变量以及不服从正态分布的连 续性变量进行描述。
• 学生身高频数表:已知有某地120名12岁男童身高数据,编 制其传统的简易频数表。
执行【Analyze】/【Descriptive Statistics】/ 【Frequencies】命令,弹出如下所示对话框
• 执行【Analyze】/【Descriptive Statistics】/【Ratio】 命令,弹出如下图所示对话框
• 结果解读
• 相对比描述的常用指标
• 基本思想:概率反证法
(1)为了检验一个零假设(即虚拟假设)是否成立, 先假定它 是成立的,然后看接受这个假设之后,是否会导致不合理结 果。如果结果是合理的,就接受它;如不合理,则否定原假 设。
(2)所谓导致不合理结果,就是看是否在一次观察中, 出 现小概率事件。通常把出现小概率事件的概率记为0.01或者 0.05,即显著性水平。
单的检验结果和图形,有助于用户进一步地分析数据。 • ◆ 适用范围:对资料的性质,分布特点等完全不清楚的时
候
补充:假设检验
• 定义:假设检验是数理统计学中根据一定假设条件由样本 推断总体的一种方法。
• 它是根据原资料作出一个总体指标是否等于某一个数值,某 一随机变量是否服从某种概率分布的假设,然后利用样本资 料采用一定的统计方法计算出有关检验的统计量,依据一定 的概率原则,以较小的风险来判断估计数值与总体数值(或 者估计分布与实际分布)是否存在显著差异,是否应当接受 原假设选择的一种检验方法。
• 执行【Analyze】/【Descriptive Statistics】/ 【Crosstabs】命令,弹出如图所示对话框
• 结果解读
1、列联表 2、卡方检验结果
3、条图
相对比描述——Ratio
• 在实际问题中,研究者有时除了希望了解变量自身的统计特 征,还希望得到两个变量相对比之间的统计描述。
• ⑤ Ratio:计算两个变量相对比的统计量特征。
• ⑥ P-P Plots:绘制P-P图,检验数据服从的分布情况。
• ⑦ Q-Q Plots:绘制Q-Q图,检验数据服从的分布情况
频数分析-Frequencies
• 频数分析简介
频数分析表是描述性统计中最常用的方法之一,它主要包 括以下几点功能: 1、产生详细的频数表
描述性统计量
集中趋势
离散趋势
分布情况
均值
Mean
标准差 Std.deviatiom 偏度
Skewness
中位数 Median
方差
Variance
峰度
Kurtosis
众数
Fra Baidu bibliotek
Mode
极小值
Minimum
和
Sum
极大值
Maximum
全距
Range
均值的标准 误差
S.E.mean
• 【Descriptive Statistics】子菜单
• 法一:通过对两个变量作除法形成一个新变量,然后分析新 变量的统计特征来得到。
• 法二:直接通过【Ratio】过程来分析两个变量之间的相对 比关系,并且可以得到多于第一种方法的信息。
• 各地区城乡居民消费水平比较
已知有2005年各省城乡居民消费水平,试按地区对各省城 乡消费水平之比进行分析,并比较不同地区之间城乡消费水 平是否有较大差异。
这个过程有一个特殊的功能,可将原始数据转换成标准正 态分布评分值,并以变量形势存入数据库供以后分析。
• 学生身高频数表 执行【Analyze】/【Descriptive Statistics】/
【Explore】命令,弹出如下对话框
• 结果解读 1、描述性分析表
zi
xi
S
x
2、标准正态分布变化
• 结果解读 1、频数表
2、描述性统计量 3、直方图
◆ 问题:以上3个结果分别用来说明什么问题?
基础统计分析-Descriptive
• Descriptive简介
Descriptive过程是连续资料统计描述应用最多的一个过程。
对变量进行描述性统计分析,计算并列出一系列相应的统 计指标。这与其它过程相比并无不同。
• ② Descriptives:计算一般的描述性统计量。 • ③ Explore:探索性分析,使用户能够从大量的分析结果之
中挖掘到所需要的统计信息。
• ④ Crosstabs:对分类变量进行统计推断,包括卡方检验、 确切概率等,是SPSS重要的过程。
4、极值表 5、正态性检验
6、方差齐次性检验
7、茎叶图
茎叶图包括频数(Frequency)、茎(Stem)和叶(Leaf)3 部分。
8、QQ图和QQ去势图
◆ 问题:各种图形是用来做什么的?正态性检验和方差齐次 性检验方法的作用分别是什么?
列联表分析-Crosstabs
1、四格卡方检验的基本思想
◆ 问题:能否通过直观的描述假设检验的基本思想?
一般步骤: (1)根据问题的需要对所研究的总体作某种假设,记作
H0
(2)选取合适的统计量,这个统计量的选取要使得在假 设H0成立时,其分布为已知。
(3)由实测的样本,计算出统计量的值。
(4)计算并根据预先给定的显著性水平进行检验,作出 拒绝或接受假设H0的判断。
• 学生身高的探索性分析 执行【Analyze】/【Descriptive Statistics】/ 【Explore】命令,弹出如图所示对话框
• 结果解读 1、描述性统计分析表
其中,5% Trimmed Mean:去掉5%极端数之后的均值。
2、M-均值估计——检验异常数据。
3、分位点表
其中Tukey's Hinges表示的是绘制箱图时所用的分位点数据, 它的计算方法和一般的百分位数略有不同。
描述性统计分析
描述性统计分析是基础的统计分析过程。
通过描述性统计分析,可以挖掘出很多统计量 的特征。
1、描述性统计量:集中趋势与离散趋势
2、频数分布表分析
3、基础统计量分析
4、探S索P性S分S析统计分析从基础到实践(第2版)
5、列联表分析 6、相对比分析
联系Email:sharepub@126.com
每个格子中的理论频数T是在假定两组的发癌率相等(均等于两 组合计的发癌率)的情况下计算出来的,如第一行第一列的理论 频数为71*91/113=57.18,故卡方值越大,说明实际频数与理论频 数的差别越明显,两组发癌率不同的可能性越大。
2、卡方检验方法的适用条件
• 吸烟习惯与患病率的关系
调查339名50岁以上吸烟习惯与患慢性气管炎病的关系,如 上表所示。试问吸烟者与不吸烟者慢性气管炎患病率是否有 所不同。 ◆ 数据的预处理:WEIGHT CASE
Z变换(标准正态变换):
zi
xi
S
x
其中 表x 变量的均值,S表变量的标准差。如果选择该项,
则数据文件中将自动生成一列名为“Z+原变量名”的新 变量。
•
变换前
变换后
◆问题:标准正态分布变化后的数据有什么作用?
探索性分析——Explore
• 与前面介绍的两个过程相比,【Explore】过程更加强大。 • 它除了可以计算常见描述性统计量之外,还可以给出一些简
在分类资料统计分析中我们常会遇到这样的资料,如两组大白鼠 在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别? --------------------------------------------------------处理 发癌数 未发癌数 合计 发癌率% ---------------------------------------------------------甲组 52 19 71 73.24 乙组 39 3 42 92.86 --------------------------------------------------------合计 91 22 113 80.33 --------------------------------------------------------卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频 数T 差值平方与理论频数之比的累计和。
2、按要求给出某个分位点
3、绘制常用的条图、饼图等统计图
适用范围:更适用于对分类变量以及不服从正态分布的连 续性变量进行描述。
• 学生身高频数表:已知有某地120名12岁男童身高数据,编 制其传统的简易频数表。
执行【Analyze】/【Descriptive Statistics】/ 【Frequencies】命令,弹出如下所示对话框
• 执行【Analyze】/【Descriptive Statistics】/【Ratio】 命令,弹出如下图所示对话框
• 结果解读
• 相对比描述的常用指标
• 基本思想:概率反证法
(1)为了检验一个零假设(即虚拟假设)是否成立, 先假定它 是成立的,然后看接受这个假设之后,是否会导致不合理结 果。如果结果是合理的,就接受它;如不合理,则否定原假 设。
(2)所谓导致不合理结果,就是看是否在一次观察中, 出 现小概率事件。通常把出现小概率事件的概率记为0.01或者 0.05,即显著性水平。
单的检验结果和图形,有助于用户进一步地分析数据。 • ◆ 适用范围:对资料的性质,分布特点等完全不清楚的时
候
补充:假设检验
• 定义:假设检验是数理统计学中根据一定假设条件由样本 推断总体的一种方法。
• 它是根据原资料作出一个总体指标是否等于某一个数值,某 一随机变量是否服从某种概率分布的假设,然后利用样本资 料采用一定的统计方法计算出有关检验的统计量,依据一定 的概率原则,以较小的风险来判断估计数值与总体数值(或 者估计分布与实际分布)是否存在显著差异,是否应当接受 原假设选择的一种检验方法。
• 执行【Analyze】/【Descriptive Statistics】/ 【Crosstabs】命令,弹出如图所示对话框
• 结果解读
1、列联表 2、卡方检验结果
3、条图
相对比描述——Ratio
• 在实际问题中,研究者有时除了希望了解变量自身的统计特 征,还希望得到两个变量相对比之间的统计描述。
• ⑤ Ratio:计算两个变量相对比的统计量特征。
• ⑥ P-P Plots:绘制P-P图,检验数据服从的分布情况。
• ⑦ Q-Q Plots:绘制Q-Q图,检验数据服从的分布情况
频数分析-Frequencies
• 频数分析简介
频数分析表是描述性统计中最常用的方法之一,它主要包 括以下几点功能: 1、产生详细的频数表
描述性统计量
集中趋势
离散趋势
分布情况
均值
Mean
标准差 Std.deviatiom 偏度
Skewness
中位数 Median
方差
Variance
峰度
Kurtosis
众数
Fra Baidu bibliotek
Mode
极小值
Minimum
和
Sum
极大值
Maximum
全距
Range
均值的标准 误差
S.E.mean
• 【Descriptive Statistics】子菜单
• 法一:通过对两个变量作除法形成一个新变量,然后分析新 变量的统计特征来得到。
• 法二:直接通过【Ratio】过程来分析两个变量之间的相对 比关系,并且可以得到多于第一种方法的信息。
• 各地区城乡居民消费水平比较
已知有2005年各省城乡居民消费水平,试按地区对各省城 乡消费水平之比进行分析,并比较不同地区之间城乡消费水 平是否有较大差异。
这个过程有一个特殊的功能,可将原始数据转换成标准正 态分布评分值,并以变量形势存入数据库供以后分析。
• 学生身高频数表 执行【Analyze】/【Descriptive Statistics】/
【Explore】命令,弹出如下对话框
• 结果解读 1、描述性分析表
zi
xi
S
x
2、标准正态分布变化
• 结果解读 1、频数表
2、描述性统计量 3、直方图
◆ 问题:以上3个结果分别用来说明什么问题?
基础统计分析-Descriptive
• Descriptive简介
Descriptive过程是连续资料统计描述应用最多的一个过程。
对变量进行描述性统计分析,计算并列出一系列相应的统 计指标。这与其它过程相比并无不同。