第8章 SPSS 20.0相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4 在【显著性检验】 框中选择输出相关系数 检验的双侧检验的概率值还是单侧检验的概率 值。 5 选中【标记显著性相关】 选项表示分析结 果中除显示统计检验的概率 值以外,还输出 星号标记,以标明变量间的相关性是否显著; 不选中则不输出星号标记。 6 在 【选项】 按钮中的【统计量】 选项中, 若选中叉积偏差和协方差,表示输出各变量的
x3
4 6 5.9 6.4 5 6.7 7.5 6 3.5 8 5 5.8
43.3
44.1 42.8 33.6 34.2 48 38 35.9 40.4 36.8 45.2 35.1
8
6.5 6.6 3.7 6.2 7 4 4.5 5.9 5.6 4.8 3.9
23
35 39 21 7 40 35 23 33 27 34 15
具体操作步骤: 1、按照顺序分析分析→相关→双变量。如图 8-4 2、在【双变量相关分析】框中,选择“身 高”“体重”“肺活量”到【变量框】。在 【相关系数】中选择Pearson以及Spearman, 在【显著性检验】中选择 双侧检验 。 3、选中 【标记显著性相关】 4、在 【选项】 按钮中的 【统计量】 选项 中将两个选项选中如图8-5 分析结果如表8-3,8-4,8-5所示
i i
且式(8.1)可被简化为
r =1
6 D
i 1 2
n
2 i
n n 1
2
其中
2 D i Ui Vi i 1 i 1
nቤተ መጻሕፍቲ ባይዱ
n
小样本下,在零假设成立时Spearman等级 相关系数服从Spearman分布; 在大样本, Z Spearman等级相关系数的检验 统计量为 统计量,其数学定义为
Z =r n 1
SPSS 将自动计算 Spearman 等级相关系数、 Z 检验统计量的观测值和对应的概率
p 值。
Kendall 相关采用非参数检验方法用来度 量定序变量间的线性相关关系。它利用变 量秩数据计算一致对数目 (U) 和非一致 对数目(V)
Kendall 统计量的数学定义为
Pearson 简单相关系数用来度量两定距型 变量间的线性相关性。如测度收入和储蓄、 身高和体重、工龄和收入等变量间的线性 相关关系时可用Pearson 简单相关系数, 它的数学定义为
r=
x x y y
n i 1 i i
x x y y
n 2 n i 1 i i 1 i
义的选项主要有:
■指定某个变量为散点图的纵轴变量,选【 Y 轴( Y )】框
中。
■指定某个变量为散点图的横轴变量,选【 Y 轴( Y )】框
中。
■可指定作为分组的变量到【设置标记】
框中,表示按该 变量的不同取值将样本数据分成若干组,并在一张图上分 别以不同颜色绘制个散点图。该项可以省略。
■可指定标记变量到【标注个案】框中,表示将标记变量
的各变量标记在散点图的相应点的旁边。该项可以省略。
例8.1某科学基金会的管理人员欲分析从事
数学研究工作的中等或较高水平的数学家
的年工资额y与他们的研究成果的质量指标
x1,从事研究工作的时间x2以及能够获得资
助 x3 的指标之间的关系,调查了 24 位数学
家,得到如表8-1数据.试绘制出简单散点图。
例8.2 以下是29名中学生的编号、身高、体 重和肺活量数据,求身高、体重和肺活量 之间的Pearson相关系数以及Spearman相 关系数
表 8-2 学生身高体重肺活量数据
学生编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 身高 135.1 139.9 163.6 146.5 156.2 156.4 167.8 149.7 145 148.5 165.5 135 153 152 160.5 153 147 157.5 155.1 160.5 143 149.9 160.8 159 158 150 144.5 154.6 156.5 体重 32 30.4 46.2 33.5 37.1 35.5 41.5 31 33 37.2 49.5 27.6 41 32 47.2 32 40.5 43.3 44.7 37.5 31.5 33.9 40.4 38.5 37.5 36 34.7 39.5 32 肺活量 1.75 1.75 2.75 2.5 2.75 2 2.75 1.5 2.5 2.25 3 1.25 2.75 1.75 2.25 1.75 2 2.25 2.75 2 1.75 2.25 2.75 2.25 2 1.75 2.25 2.5 1.75
第二,对样本来自的两总体是否存在显著 的线性关系进行推断。 由于存在抽样的随机性和样本量可能较小 等原因,通常样本相关关系数不能 直接用来说明样本来自的两总体是否具有 显著的线性相关性,而需要通过假设检验 的方式对样本来自的总体是否存在显著的 线性相关进行统计推断。
基本步骤是: ●提出零假设,即两总体无线性相关性。 p ●选择检验统计量。对不同类型的变量应采用不同的 相关系数,对应也应采用不同的检验统计量。 ●计算检验统计量的观测值和对应的概率 值。 ●决策。如果检验统计量的概率 值小于给定的显著 性水平 ,应拒绝零假设,认为两总体间存在显著 的线性相关性;反之,如果检验统计量的概率 值 大于给定的显著性水平 ,则不能拒绝零假设,可 以认为两总体不存在显著的线性相关性。
表8-3 描述性统计量 均值 身高 体重 肺活量 152.5552 37.1276 2.1897 标准差 8.36402 5.53275 .45146 N 29 29 29
表8-3给出了身高、体重、肺活量的描述性 统计分析
表8-4 相关性 身高 身高 Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N 体重 Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N 肺活量 Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N **. 在 .01 水平(双侧)上显著相关。 1958.792 69.957 29 .738
虽然散点图能够直观展现变量之间的统计关系,
但并不精确。相关系数则以数值的方式精确地反映 了两个变量间线性相关的强弱程度。利用相关关系 进行变量间线性关系的分析通常需要完成以下两大 步骤: r
第一,计算样本相关系数
。
利用样本数据计算样本相关系数。样本相关系数
反映了两变量间线性相关程度的强弱。对不同类型 的变量应采用不同的相关关系指标,但它们的取值 范围和含义都是相同的
r
r 0
● 相关系数 的取值在-1至+1之间。 r 1 ● 表示两变量存在正的线性相关关系; r -1 表示两变量存在负的线性相关关系。 r 0 ● 表示两变量存在完全正相关关系; r 0.8 表示两变量存在完全负相关关系; r 0.3 表示两变量不存在线性相关关系。 ● 表示两变量之间具有较强的线性关 系; 表示两变量之间具有较弱的线
Z
在利用SPSS计算两变量间的相关系数之前 应按一定格式组织好数据,应定义两个 SPSS变量分别存放相应两变量的变量值。 计算相关系数的基本操作步骤是: 1 选择菜单中分析→相关→双变量。如图8-4 2 选择参加计算相关系数的变量到【变量】 框。 3 在 【相关系数】 框中选择计算哪种相关系 数。
2
(8.1)
n 为样本数,xi 和 y分别为两变量的变量 i
值
进一步得知简单相关系数也即
1 n xi x yi y r= n i 1 S x S y
(8.2)
Pearson 简单相关系数的检验统计量为 统 计量,其数学定义为
8.1 相关分析概述 8.2 散点图 8.3 相关系数 8.4 偏相关分析 8.5 距离相关分析
事物之间的联系总是错综复杂的,任何事物的变 化与其它事物是相互联系和相互影响的。事物之 间的关系可分为两类,一类是函数关系,一类是 统计关系。所谓函数关系指的是两事物之间的一 种一一对应的关系,即当一个变量 取一定值时, 另一变量 可以依确定的函数取唯一确定的值。 另一类普遍存在的关系是统计关系。统计关系指 的是两事物之间的一种非一一对应关系,即当一 个变量 取一定值时,另一变量 无法依确定的函数 取唯一确定的值,例如,家庭收入和支出、子女 身高和父母身高之间的关系等。
2 = U V n n 1
在小样本下Kendall 服从Kendall 分布 在大样本下采用的检验统计量为 9n n 1 Z 2 2n 5
统计量近似服从标准正态分布 SPSS将自动计算Kendall 相关、 检验统 计量的观测值和对应的概率 P值。
表8-1 24位数学家相关数据
y
33.2 40.3 38.7 46.8 41.4 37.5 39 40.7 30.1 52.9 38.2 31.8
x1
3.5 5.3 5.1 5.8 4.2 6 6.8 5.5 3.1 7.2 4.5 4.9
x2
9 20 18 33 31 13 25 30 5 47 25 11
8.2.1散点图含义 绘制散点图是相关分析过程中极为常用且非常直观 的分析方式。它将数据以点的形式在直角平面上。 通过观察散点图能够直观地发现变量间的统计关系 以及它们的强弱程度和数据对的可能走向,在实际 分析中,散点图经常表现出某些特定的形式。如极 大多数的是数据点组成类似于橄榄球的形状,或集 中形成一根棒状,而剩余的少数数据点则零散地分 布在四周,通常橄榄球和棒状代表了数据对的主要 结构和特征,可以利用曲线将这种主要结构的轮廓 描述出来,使数据的主要特征更突显。
t
r n2 1 r
2
SPSS将自动计算Pearson 简单相关系数、
Spearman等级相关系数用来度量定序变量间的线 性相关关系。该系数的设计思想与 Pearson 简单相 关系数完全相同,仍然可依照式(8.1)计算,相应 的指标特征也相似。然而在计算Spearman等级相关 系数时,由于数据为非定距的,因此计算时并不直 xi , yi 接采用原始数据 , 而是利用数据的秩,即将两变 U , V 量的秩 代替 代入式(8.1)中,于是其中 的 和 的取值范围被限制在1至 n 之间,
绘制散点图的基本操作步骤如下: 1选择菜单图形 → 旧对话框→ 散点图,出 现如下图的对话框。
2 选择散点图的类型。SPSS提供了5种类 型的散点图。 3 根据所选择的散点图类型,比如选择 【简单散点图】,单击【定义】出现如图82的对话框
简单散点图是表示一对变量间统计关系的散点图。应定
8.3
7 7.4 4.3 7 7.6 4.9 5 6.4 6.1 5.5 4.4
具体操作步骤:
1选择菜单图形 → 旧对话框→ 散点图,出现如图8-1的对 话框。
2选择散点图的类型【简单散点图】。
3单击【定义】,出现如图8-2的对话框,把左侧“数学 家的年工资”指定到右侧【 Y 轴】中,把“研究工作时间” 指定到【X轴】中。 得到如图8-3的散点图,从散点图中可以看出,研究工作 时间与年工资具有较强的相关关系。
事物之间的函数关系比较容易分析和测度,而事物 之间的统计关系却不像函数关系那样直接,但确实 普遍存在,并且有的关系强,有的关系弱,程度各 有差异。如何测度事物间统计关系的强弱是人们关 注的问题。相关分析和回归分析是以不同的方式测 度事物间统计关系的非常有效的工具。相关分析通 过图形和数值两种方式,能够有效地揭示事物之间 统计关系的强弱程度。 在进行相关分析的时候,散点图是非常重要的工具, 分析前最好用绘制散点图,已初步判断变量之前是 否存在相关趋势,该趋势是否为直线趋势,忽视散 点图的作用直接进行相关分析很可能得出错误结论。 虽然散点图比较形象直观,但不是很精确。相关分 析更精确的方法是通过统计指标描述变量之间的关 系。比较常见的是相关系数。