spss第九章相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、偏相关分析的SPSS操作应用
研究问题1
例9-2 对例9-1中研究的84名10岁男孩6 项生长发育指标数据,试进行扣除了身 高的影响时坐高、肩宽与肺活量之间的 偏相关分析。
表9-18 偏相关系数Correlations
Control Variables 身高 坐高
Correlation
坐高 1.000
• 【Graphs(图形)】→ • 【Legacy Dialogs(旧对话框)】→
【Scatter/Dot(散点图/点状图)】
• 例9-1 某研究者测得84名10岁男孩的身高、坐高、体 重、胸围、肩宽、肺活量等6项生长发育指标进行研 究,观测数据如表9-3所示。对该研究问题可采用相 关分析的方法进行研究,首先绘制下列散点图。
据的总体分布、样本大小都可以不作要求, 缺点是计算精度不高。
(三)Kendall 相关系数 Kendall 相关系数用于反映分类变量相关性的指
标,适用于两个变量均为有序分类的情形,这种指 标采用非参数检验方法测度变量间的相关关系。
PQ
n(n 1) / 2
P为一致对子数、Q为不一致对子数 一致即行变量等级高列变量等级也高。
• 【Analyze(分析)】→ • 【Correlate(相关)】→ • 【Bivariate(两变量间相关)】
系统会弹出【Bivariate Correlation(两 变量间相关)】主对话框,用于设定进行 相关分析的变量等。
研究问题(Pearson相关系数) 某班级学生数学和化学的期末考
第九章 SPSS的相关分析
9.1 散点图与线性相关
9.2
相关分析
9.3
偏相关分析
任何事物的变化都与其他事物是相互 联系和相互影响的,用于描述事物数量 特征的变量之间自然也存在一定的关系。 变量之间的关系归纳起来可以分为两种 类型,即函数关系和统计关系。
当一个变量x取一定值时,另一变量y 可以按照确定的函数公式取一个确定的 值,记为y = f(x),则称y是x的函数, 也就时说y与x两变量之间存在函数关系。 又如,某种商品在其价格不变的情况下, 销售额和销售量之间的关系就是一种函 数关系:销售额=价格×销售量。
• 在小样本下,Kendall 统计量服从 Kendall分布。
• 在大样本下采用近似服从标准正态分布的Z 检验统计量:
Z 9n(n 1)
2(2n 5)
三、相关分析的SPSS操作
研究问题1(Pearson相关系数)
• 例9-2 对例9-1中所考察的84名10岁男 孩的身高等6项生长发育指标数据<男 孩生长发育指标.sav>,试作相关分析, 考察这些变量指标间是否具有显著的 线性相关关系。
(2)相关系数受变量取值区间大小及样本数 目多少的影响比较大。一般来说,如果变量 取值区间小,样本所含数目较少,受抽样误 差的影响较大,就有可能对本来无关的两种 现象,计算出较大的相关系数,得出错误的 结论。因此,一般计算相关的成对数据的数 目不应少于30对。
(3)来自于不同群体且不同质的事物的 相关系数不能进行比较。
间的线性相关性。其定义为
n
(xi x)( yi y)
r
i1
n
n
(xi x)2 ( yi y)2
i1
i1
由此可进一步得知Pearson相关系数还可以 表示为
r1 n (xi x)(yi y)
n i1 Sx
Sy
Pearson相关系数的显著性检验的统计量是 服从自由度为n-2的t分布的t统计量:
(二)Spearman相关系数
Spearman相关系数(又称等级相关系数)用来度 量定序(等级)变量间的线性相关关系。它是利用 两变量的秩次(rank)大小作线性相关分析。
n
(ui u)(vi v )
rR
i1 n
k
(ui u )2 (vi v )2
i1
i1
该公式还可简化为
n
D
2 i
函数关系是一一对应的确定性关 系,比较容易分析和测度,可是在现 实中,变量之间的关系往往并不那么 简单。
• 在医药研究中我们常常要分析变量间 的关系,如新生儿年龄与体重、血药 浓度与时间关系等。变量之间的关系 一般可分为确定性的和非确定性的两 大类。
• 我们称这种既有关联又不存在确定性 的关系为相关关系(correlation)。
一、 统计学上的定义和计算公式
定义:偏相关分析是指当两个变量同时与 第三个变量相关时,将第三个变量的影响剔除, 只分析另外两个变量之间相关程度的过程。
偏相关分析也称净相关分析 偏相关分析的工具是计算偏相关系数 r12,3。
利用偏相关系数进行变量间净关系分析通 常需要完成以下两大步骤:
第一,计算样本的偏相关系数。
研究问题(
)
某语文老师先后两次对其班级学生同一篇
作文加以评分,两次成绩分别记为变量“作文
1”和“作文2”,数据如表6-2所示。问两次
评分的等级相关有多大,是否达到显著水平?
学生作文两次的得分情况
人名 hxh yaju yu shizg hah smith watet jess wish laly john chen david caber
(3)计算相应的p-值。 (4)统计判断。如果相伴概率值小于或等于指 定的显著性水平,则拒绝H0,认为两总体存在 显著的线性相关关系;如果相伴概率值大于指 定的显著性水平,则不能拒绝H0,认为两总体 不存在显著的线性相关关系。
在使用相关系数时,应该注意下面几个问题:
(1)相关分析之前一般要作散点图以观察可 能的线性趋势以及数据分布条件,从而选挥 恰当的统计量。
化学 90.00 99.00 70.00 78.00 88.00 88.00 75.00 98.00 98.00 99.00 89.00 98.00 88.00 60.00 87.00 87.00 88.00 79.00
实现步骤
结果和讨论
如果对变量之间的相关程 度不需要掌握得那么精确,可 以通过绘制变量的相关散点图 来直接判断。仍以上例来说明。
第二,对样本来自的两总体是否存在显著的 净相关进行检验推断。
净相关显著性检验的基本步骤是: (1)提出零假设H0:两总体的偏相关系数
为0,即相关性不显著。 (2)选择偏相关分析的t检验统计量:
(3)计算检验统计量的观测值和对应的概率 P值。
(4)统计判断。如果概率P值小于给定的显 著性水平,应拒绝零假设,认为两总体的 偏相关系数与0有显著差异,相关性显著; 反之,如果概率P值大于给定的显著性水平 ,则不拒绝零假设,可以认为两总体的偏 相关系数与0无显著差异, 相关性不显著。
df
81
81
肺活量 .087 .434
81 .362 .001
81 1.000
.
0
研究问题2 某农场通过试验取得某农作
物产量与春季降雨量和平均温度 的数据,如表6-3所示。现求降雨 量对产量的偏相关。
早稻产量与降雨量和温度之间的关系
产量
降雨 量
温度
150.00 25.00
6.00
230.00 33.00 300.00 45.00
• (1)绘制身高与体重的简单散点图;
• (2)绘制身高与坐高、身高与肩宽的重叠散点图;
• (3)绘制身高、体重与肺活量的散点图矩阵;
• (4)绘制身高、体重与肺活量的三维(3D)散点图;
• (5)绘制体重的简单点状图。
第二节 线性相关
一、相关分析的基本原理
相关系数的取值范围在−1和+1之间,即 −1≤r≤+1。
rR
1
i1
n(n2
1)
Spearman相关系数适用条件为
(1)两个变量的变量值是以等级次序(秩次) 表示的数据资料;。
(2)一个变量的变量值是等级(定序)数据, 另一个变量的变量值是等距或比率数据, 且其两总体不要求是正态分布,样本容量n 不一定大于30。
• 在小样本时,在零假设成立时Spearman等 级相关系数服从Spearman分布;
描述变量之间线性相关程度的强弱,并用 适当的统计指标表示出来的过程为相关分析。 可根据研究的目的不同,或变量的类型不同, 采用不同的相关分析方法。本章介绍常用的相 关分析方法:二元定距变量的相关分析、二元 定序变量的相关分析、偏相关分析和距离相关 分析。
第一节 散点图和线性相关
一、散点图的制作
其中: • 若0<r≤1,表明变量之间存在正相关
关系,即两个变量的相随变动方向相同; • 若−1≤r<0,表明变量之间存在负相
关关系,即两个变量的相随变动方向相反;
为了判断r对ρ的代表性大小,需要对相关
系数进行假设检验。 (1)首先假设总体相关性为零,即
H0:两总体无显著的线性相关关系。
(2)选择检验统计量。对不同类型的变量应 采用不同的相关系数,对应也应采用不同的检 验统计量。具体内容见后面讨论。
• 在大样本下,Spearman等级相关系数的检 验统计量为近似服从标准正态分布的Z统计 量:
Z r n1
对于定序变量,例如,“最高学历”变量 的 取值是:1—小学及以下、2—初中、3—高中、 中专、技校、4—大学专科、5—大学本科、 6—研究生以上。可以使用Spearman相关系 数来分析。
• 显然,Spearman相关系数的应用范围要比 Pearson相关系数广泛,即使服从Pearson 相关系数的数据也可计算Spearman相关系 数,但统计效能比Pearson相关系数要低 些。Spearman相关系数的突出优点是对数
marry joke jake herry
作文1 86.00 78.00 62.00 75.00 89.00 67.00 96.00 80.00 77.00 59.00 79.00 68.00 85.00 87.00 75.00 73.00 95.00 88.00
作文2 83.00 82.00 70.00 73.00 92.00 65.00 93.00 85.00 75.00 65.00 75.00 70.00 80.00 75.00 80.00 78.00 90.00 90.00
(4)对于不同类型的变量数据,计算相 关系数的方法也不相同。
在二元变量的相关分析过程中比较 常用的几个相关系数是Pearson简单相 关系数、Spearman和Kendall's tua-b 等级相关系数。
二、常用的不同类型相关系数指标
(一)Pearson相关系数
Pearson相关系数用来度量两数值型变量
试成绩如表6-1所示,现要研究该班 学生的数学和化学成绩之间是否具有 相关性。
学生的数学和化学成绩
人名 hxh yaju yu shizg hah smith watet jess wish laly john chen david caber
marry joke jake herry
数学 99.00 88.00 65.00 89.00 94.00 90.00 79.00 95.00 95.00 80.00 70.00 89.00 85.00 50.00 87.00 87.00 86.00 76.00
肩宽 -.022
Significance (2-
.
.845
tailed)
df
0
81
肩宽 Correlation
-.022
1.000
Significance (2-
.845
.
tailed)
df
81
0
肺活源自文库 Correlation
.087
.362
Significance (2-
.434
.001
tailed)
实现步骤
结果和讨论
第三节 偏相关分析
二元变量的相关分析在一些情况下无法较 为真实准确地反映事物之间的相关关系。例如, 在研究某农场春季早稻产量与平均降雨量、平 均温度之间的关系时,产量和平均降雨量之间 的关系中实际还包含了平均温度对产量的影响。 同时平均降雨量对平均温度也会产生影响。在 这种情况下,单纯计算简单相关系数,显然不 能准确地反映事物之间地相关关系,而需要在 剔除其他相关因素影响的条件下计算相关系数。 偏相关分析正是用来解决这个问题的。
rn 2 t
1 r2
SPSS将自动计算Pearson简单相关系数、t检 验统计量的值和对应的概率P值。
Pearson简单相关系数用来衡 量定距变量间的线性关系。例如, “年龄”变量、“收入”变量、 “成绩”变量等都是典型的定距 变量。 如衡量国民收入和居民储蓄存款、 身高和体重、高中成绩和高考成 绩等变量间的线性相关关系可用 Pearson简单相关系数。