SPSS统计分析第7章相关分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n(n ? 1)
Z ? ? 9n(n ? 1)
2(2n ? 5)
7.2 二元变量相关分析
(3) 分析步骤
?第1步 计算相关系数r:利用样本数据计算样本相关系数,样
本相关系数反映了两变量间线性相关程度的强弱。相关系数的
取值范围界于-1与1之间,即-1≤r≤1
? 当0<r ≤ 1,表明变量之间存在正相关关系;
? 当-1 ≤ r<0,表明变量之间存在负相关关系;
? 当|r|=1时,表示其中一个变量的取值完全取决于另一个变量, 二者即为函数关系;
? 当r=0时,说明变量之间不存在线性相关关系,但这并不排除 变量之间存在其它非线性相关的可能。
根据经验可将其相关程度分为几种:当|r|≥0.8时视为高度相 关;当0.5≤|r|<0.8时视为中度相关;当0.3 ≤ |r|<0.5时视为低度相 关;当|r|<0.3时说明变量之间的相关性很弱。
Pearson简单相关系数及t统计量 n
? ( xi ? x)( yi ? y)
r?
i?1
n
n
? ? (xi ? x)2 ( yi ? y)2
t ? r n? 2 1? r2
i?1
i ?1
7.1二元变量相关分析
?定序变量的相关性分析 :定序变量又称为有序(ordinal)变
量、顺序变量、等级变量,它取值的大小能够表示观测对象的
7.2二元变量相关分析
(4) SPSS实现举例
【例7-1】为了分析父亲与儿子身高之间的相关性,现抽样了 12对父子的身高,数据如下表。请对其进行相关性分析(显著 性水平取α =0.05)。
父亲身高 65 63 67 64 68 62 70 66 68 67 69 71
儿子身高 68 66 68 65 69 66 68 65 71 67 68 70
第七章
相关分析
主要内容
7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析
7.1相关分析简介
(1) 函数关系与相关关系
变量之间的关系可以分为两种:一种是函数关系,另一种是 相关关系。函数关系是一一对应的确定性关系,比较容易分析 和测度。可是在现实世界中,变量间的关系往往并不是简单的 确定性关系,也就是说,变量之间有着密切的关系,但又不能
12
儿子身高 .703 * .011 40.333 3.667 12 1
38.917 3.538
12
其中包括了叉积离差矩 阵、协方差矩阵、 Pearson相关系数及相 伴概率p值。从表中可 看出,相关系数为 0.703>0,说明呈正相 关,而相伴概率值 Sig.=0.005<0.05,因此 应拒绝零假设(H0:两 变量之间不具相关性), 即说明儿子身高是受父 亲身高显著性正影响的。
相关关系的种类 1 按涉及的变量分:简单相关和复相关 2 按表现形式分: 线性相关和非线性相关 3 按变化方向分: 正相关和负相关 4 按相关程度分:不相关、低度相关、显著
相关、高度相关和完全相关
4
主要内容
7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析
7.1二元变量相关分析
某种顺序关系(等级、方位或大小等)。定序变量的相关系数 用斯皮尔曼(Spearman)相关系数和肯德尔(Kendall's )相 关系数来衡量。
Spearman相关系数及Z统计量
n
?6 Di2
r
?
1?
i?1
n(n2
?
1)
Z ? r n?1
Kendall's等级相关系数 及Z统计量
? ? (U ? V) 2
(1) 基本概念
二元变量的相关分析是指通过计算变量间两两相关的相关 系数,对两个或两个以上变量之间两两相关的程度进行分析。 根据所研究的变量类型不同,又可以分为二元定距变量的相关
分析和二元定序变量的相关分析。
(2) 统计原理
?二元定距变量的相关分析 :定距变量又称为间隔(interval) 变量(即连续属性变量),变量值之间可以比较大小,可以用 加减法计算出差异的大小。
主要内容Fra Baidu bibliotek
7.1 相关分析简介 7.2 两变量相关分析 7.3 偏相关分析 7.4 距离分析
7.3 偏相关分析
(1) 基本概念
偏相关分析的任务就是在研究两个变量之间的线性相关关 系时控制可能对其产生影响的变量,这种相关系数称为偏相关 系数。偏相关系数的数值和简单相关系数的数值常常是不同的, 在计算简单相关系数时,所有其他自变量不予考虑。
? 构造检验统计量:由于不同的相关系数采用不同的检验统计量, 因此在相关分析时,不同的过程需要构造不同的检验统计量;
? 计算检验统计量的观测值及对应的概率 p值; ? 对两总体的相关性进行推断:如果检验统计量的概率 p值小于 给定的显著性水平,应拒绝零假设,即认为两总体之间存在显著性 线性关系;反之,应接受零假设。
7.2二元变量相关分析
?第4步 主要结果及分析。
Pearson 相关性
显著性(双侧)
父亲 身高
平方与叉积的和
协方差
N
Pearson 相关性 显著性(双侧)
儿子 身高
平方与叉积的和 协方差
N
*. 在 0.05 水平(双侧)上显著相关。
父亲身高 1
84.667 7.697
12 .703 * .011 40.333 3.667
?第1步 分析:身高是定距变量,考虑用Pearson相关系数来 衡量。 ?第2步 数据的组织:分成两列,一列是父亲的身高,另一 列是儿子的身高。
7.2二元变量相关分析
?第3步 选择菜单“分析→相关→双变量”,打开如图7-1所 示的对话框,将“father”和“son”两变量移入“变量”框 中;“相关系数”选择Pearson;在“显著性检验”中选择 “双侧检验”;
7.2二元变量相关分析
?第2步 对样本来自的两总体是否存在显著的线性关系进行推断: 由于存在抽样的随机性和样本数量较少等原因,通常样本相关 系数不能直接用来说明样本来自的两总体是否具有显著的线性 相关性,需要通过假设检验的方式对样本的总体进行统计推断。
? 提出零假设 H0:即两总体无显著的线性关系;
由一个或几个变量的值确定另一个变量的值,即当自变量 x取某 一值时,因变量 y的值可能会有多个。这种变量之间的非一一对
应的、不确定性的关系,称之为相关关系。
(2) 相关分析基本概念
衡量事物之间,或称变量之间线性相关程度的强弱并用适 当的统计指标表示出来,这个过程就是相关分析。相关系数是 衡量变量之间相关程度的一个指标,总体的相关系数用ρ表示, 样本的相关系数用r表示。
相关文档
最新文档