《SPSS相关分析》PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
月份 1 2 3 4 5 6 北京 194.7 213.5 243.6 248.2 253.3 202 天津 161.7 185.2 166.8 214.3 221 182.5 石家庄 193.8 219.2 220.9 240.9 277.9 213.4 大连 月份 北京 天津 石家庄 大连 163.5 7 203.2 179.5 185.4 228.5 195.3 8 187.4 149.8 152.1 174 223.1 9 198.9 178.7 203.4 202.7 276.9 10 225.2 194.7 220.7 228.4 243.4 11 201.4 172.8 197.5 172.9 190 12 144 119.1 97.9 167
第1步 分析:身高是定距变量,考虑用Pearson相关系数来 衡量。 第2步 数据的组织:分成两列,一列是父亲的身高,另一 列是儿子的身高。
9
SPSS 19统计分析使用教程
电子工业出版社
7.2二元变量相关分析
第3步 选择菜单“分析→相关→双变量”,打开如图7-1所 示的对话框,将“father”和“son”两变量移入“变量”框 中;“相关系数”选择Pearson;在“显著性检验”中选择 “双侧检验”;
显 著 性 ( 双 侧 ) .000 df 7
从中可以看出,月降雨量、月平均日照时数和月平均湿度 为控制变量,生长量与月平均气温关系密切,偏相关系数 为0.977,双尾检测的相伴概率为0.000(表示趋近于0的正 数),明显小于显著性水平0.05。故应拒绝原假设,说明中 山柏的生长量与气温间存在显著的相关性。
r 1 6 Di2 n(n 1)
i 1 2 n
Z r n 1
Kendall’s等级相关系数 及Z统计量
2 (U V ) n(n 1)
9n(n 1) Z 2(2n 5)
6
SPSS 19统计分析使用教程
电子工业出版社
7.2 二元变量相关分析
(3) 分析步骤
SPSS 19统计分析使用教程
电子工业出版社
第七章
相关分析
1
SPSS 19统计分析使用教程
电子工业出版社
主要内容
7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析
2
SPSS 19统计分析使用教程
电子工业出版社
7.1相关分析简介 (1) 函数关系与相关关系
变量之间的关系可以分为两种:一种是函数关系,另一种是 相关关系。函数关系是一一对应的确定性关系,比较容易分析 和测度。可是在现实世界中,变量间的关系往往并不是简单的 确定性关系,也就是说,变量之间有着密切的关系,但又不能 由一个或几个变量的值确定另一个变量的值,即当自变量x取某 一值时,因变量y的值可能会有多个。这种变量之间的非一一对 应的、不确定性的关系,称之为相关关系。
(2) 相关分析基本概念
衡量事物之间,或称变量之间线性相关程度的强弱并用适 当的统计指标表示出来,这个过程就是相关分析。相关系数是 衡量变量之间相关程度的一个指标,总体的相关系数用ρ表示, 样本的相关系数用r表示。
3
SPSS 19统计分析使用教程
电子工业出版社
主要内容
7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析
14
SPSS 19统计分析使用教程
电子工业出版社
7.3 偏相关分析
(4) SPSS实现举例
【例7-3】 下表是四川绵阳地区3年生中山柏的数据,分析月 生长量与月平均气温、月降雨量、月平均日照时数、月平均湿 度4个气候因素中哪些因素有关。
月 月生 月平均 份 长量 气温 1 2 3 4 5 6 0.01 0.5 1.5 10.8 13 16.3 4.2 7.4 10 16.1 21.1 23.9 月降 月平均日 月平均 月生 月平均 月份 雨量 照时数 湿度 长量 气温 17 10.8 17.4 19.7 248.7 72.2 54.5 73.8 84.7 137 149.6 109.5 81 79 75 75 77 79 7 8 9 18 19.3 14.8 24.7 24.5 22 18 13.1 6.8 月降 雨量 96.9 269.5 194.8 58.1 4.9 12.6 月平均日 月平均 照时数 湿度 101.6 164.6 81.6 84 79.3 66.5 83 86 83 82 81 82
r
( x x)( y y)
i 1 i i 2 n i 1
( xi x)
i 1
n
( yi y)
2
t
r n2 1 r2
5
SPSS 19统计分析使用教程
电子工业出版社
7.1二元变量相关分析
定序变量的相关性分析 :定序变量又称为有序(ordinal)变 量、顺序变量、等级变量,它取值的大小能够表示观测对象的 某种顺序关系(等级、方位或大小等)。定序变量的相关系数 用斯皮尔曼(Spearman)相关系数和肯德尔(Kendall’s )相 关系数来衡量。 Spearman相关系数及Z统计量
(2) 统计原理
不相似性测度
对定距数据的不相似性(距离)测度可以使用的统计量有:欧 几里得距离、平方欧氏距离、切比雪夫距离、Block距离、明可斯 基距离等。 对定序数据,主要使用卡方不相似测度和斐方测度。 对二值(只有两种取值)数据变量之间的距离描述,使用欧氏 距离、平方欧氏距离、尺寸差异、模式差异、方差、形或兰斯和威 廉斯等距离统计量。
17
SPSS 19统计分析使用教程
电子工业出版社
主要内容
7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析
18
SPSS 19统计分析使用教程
电子工业出版社
7.4 距离分析
(1) 基本概念
距离分析是对观测量之间相似或不相似程度的一种测度, 是计算一对观测量之间的广义距离。这些相似性或距离测度可 以用于其他分析过程,例如因子分析、聚类分析或多维定标分 析,有助于分析复杂的数据集。
19
SPSS 19统计分析使用教程
电子工业出版社
7.4 距离分析
相似性测度 对于定距数据主要使用皮尔逊相关系数和夹角余弦距离; 对于二值数据的相似性测度主要包括简单匹配系数、 Jaccard相似性指数、Hamann相似性测度等20余种。 其中的距离又分为个案(观测记录)之间的距离和变量之 间的距离两种。
8
SPSS 19统计分析使用教程
电子工业出版社
7.2二元变量相关分析
(4) SPSS实现举例
【例7-1】为了分析父亲与儿子身高之间的相关性,现抽样了 12对父子的身高,数据如下表。请对其进行相关性分析(显著 性水平取α =0.05)。
父亲身高 65 儿子身高 68 63 66 67 68 64 65 68 69 62 66 70 68 66 65 68 71 67 67 69 68 71 70
3.667
12
3.538
12
11
SPSS 19统计分析使用教程
电子工业出版社
主要内容
7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析
12
SPSS 19统计分析使用教程
电子工业出版社
7.3 偏相关分析
(1) 基本概念
偏相关分析的任务就是在研究两个变量之间的线性相关关 系时控制可能对其产生影响的变量,这种相关系数称为偏相关 系数。偏相关系数的数值和简单相关系数的数值常常是不同的, 在计算简单相关系数时,所有其他自变量不予考虑。
10 10.3 11 12 8 1
15
SPSS 19统计分析使用教程
电子工业出版社
7.3 偏相关分析
第1步 分析:这4个气候因素彼此均有影响,分析时应对生长 量与4个气候因素分别求偏相关,如在求生长量与气候因素的 相关时控制其他因素的影响。所以需进行偏相关分析; 第2步 数据组织:如上表定义4个变量,输入数据即可; 第3步 进行偏相关分析:选择菜单“分析→相关→双变量”, 指定分析变量和控制变量,分析变量“hgrow”和“temp”的 偏相关系数,并将“rain”、“hsun”、“humi”设为控制变量。 如下图所示设置。
提出零假设H0:即两总体无显著的线性关系; 构造检验统计量:由于不同的相关系数采用不同的检验统计量, 因此在相关分析时,不同的过程需要构造不同的检验统计量; 计算检验统计量的观测值及对应的概率p值; 对两总体的相关性进行推断:如果检验统计量的概率p值小于 给定的显著性水平,应拒绝零假设,即认为两总体之间存在显著性 线性关系;反之,应接受零假设。
4
SPSS 19统计分析使用教程
电子工业出版社
7.1二元变量相关分析
(1) 基本概念
二元变量的相关分析是指通过计算变量间两两相关的相关 系数,对两个或两个以上变量之间两两相关的程度进行分析。 根据所研究的变量类型不同,又可以分为二元定距变量的相关 分析和二元定序变量的相关分析。
(2) 统计原理
二元定距变量的相关分析 :定距变量又称为间隔(interval) 变量(即连续属性变量),变量值之间可以比较大小,可以用 加减法计算出差异的大小。 Pearson 简单相关系数及t统计量 n
根据经验可将其相关程度分为几种:当|r|≥0.8时视为高度相 关;当0.5≤|r|<0.8时视为中度相关;当0.3 ≤ |r|<0.5时视为低度相 关;当|r|<0.3时说明变量之间的相关性很弱。
7
SPSS 19统计分析使用教程
电子工业出版社
7.2二元变量相关分析
第2步 对样本来自的两总体是否存在显著的线性关系进行推断: 由于存在抽样的随机性和样本数量较少等原因,通常样本相关 系数不能直接用来说明样本来自的两总体是否具有显著的线性 相关性,需要通过假设检验的方式对样本的总体进行统计推断。
13
SPSS 19统计分析使用教程
电子工业出版社
7.3 偏相关分析
检验的统计量为:
t r.
(3)统计分析步骤
n k 2.r 1 r2
第1步 根据公式计算偏相关系数; 第2步 对样本来自的两总体是否存在显著性相关进行推断。
提出零假设H0:即两总体的偏相关系数与零无显著性差异; 选择检验统计量:偏相关分析选择的是t统计量; 计算t值及对应的概率p值; 决策:如果相伴概率p值小于给定的显著性水平,则应拒绝零假 设,认为两总体的偏相关系数与零有显著性差异;否则,接受原 假设。
10
SPSS 19统计分析使用教程
电子工业出版社
7.2二元变量相关分析
第4步 主要结果及分析。
父亲身高 Pearson 相关性 显著性(双侧) 父亲 身高 平方与叉积的和 协方差 N Pearson 相关性 显著性(双侧) 儿子 身高 平方与叉积的和 84.667 7.697 12 .703* .011 40.333 1 儿子身高 .703* .011 40.333 3.667 12 1 38.917
16
16
SPSS 19统计分析使用教程
电子工业出版社
7.3 偏相关分析
第4步 主要结果及分析。
控制变量 相关性 生长量 月降雨量 & 月平均日照 时数 & 月平均湿度 月平均气温 生 长量 1.00 0 月平均气 温 .977
ห้องสมุดไป่ตู้
显著性(双侧)
df 相关性
.
0 .977
.000
7 1.000 . 0
其中包括了叉积离差矩 阵、协方差矩阵、 Pearson相关系数及相 伴概率p值。从表中可 看出,相关系数为 0.703>0,说明呈正相 关,而相伴概率值 Sig.=0.005<0.05,因此 应拒绝零假设(H0:两 变量之间不具相关性), 即说明儿子身高是受父 亲身高显著性正影响的。
协方差
N
*. 在 0.05 水平(双侧)上显著相关。
第1步 计算相关系数r:利用样本数据计算样本相关系数,样 本相关系数反映了两变量间线性相关程度的强弱。相关系数的 取值范围界于-1与1之间,即-1≤r≤1
当0<r ≤ 1,表明变量之间存在正相关关系; 当-1 ≤ r<0,表明变量之间存在负相关关系; 当|r|=1时,表示其中一个变量的取值完全取决于另一个变量, 二者即为函数关系; 当r=0时,说明变量之间不存在线性相关关系,但这并不排除 变量之间存在其它非线性相关的可能。
(3) 分析步骤
距离分析中不存在假设检验问题,主要是通过SPSS自动 计算变量或个案之间的相似性或不相似性距离,根据其计算 距离值的大小来确定变量或个案之间的相似性或不相似性的 强弱。
20
SPSS 19统计分析使用教程
电子工业出版社
7.4 距离分析
(4) SPSS实现举例
【例7-4】 已知我国四城市2004年各月的日照时数如下表 所示,请分析各城市日照数是否近似。
(2) 统计原理
控制一个变量和控制两个变量的偏相关系数分别为:
rxy , z
rxy rxz ryz (1 r )(1 r )
2 xz 2 yz
rxy , z1z2
rxy , z1 rxz1, z2 ryz2 , z1
2 2 (1 rxz )(1 r yz2 , z1 ) 1 , z2
相关文档
最新文档