相关分析步骤
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关分析步骤
相关分析
双变量相关分析检验是否符合正态分布(K-S检验)
偏相关分析不需检验
距离分析不需检验
X/Y 度量(S)序号(O)名义(N)度量(S)Pearson相关系数Spearman等级相关系数/
序号(O)Spearman等级相关系数Spearman等级相关系数
Kendall ح系数
/
名义(N)/ 卡方值Pearson卡方值(Chi-Square)
Pearson相关系数K-S检验是否必须符合正态分布
Spearman等级相关系数不需检验
Kendall ح系数不需检验
一双变量相关分析(Pearson、Spearma、Kendall )
1 判断使用哪种相关系数,例检验是否满足使用Pearson相关系数的前提要求
2计算样本的相关系数r
按变量类型选择对应的相关系数种类,名义,度量,有序。
一般认为,当相关系数的绝对值大于0.8时,两变量具有较强的线性关系(Linear Relationship);而相关系数的绝对值小于0.3时,两变量间的线性关系较弱。
3 对两个样本来自的总体是否存在显著的线性关系进行判断
显著性检验来证明相关系数的大小是否显著。
1检验是否满足使用Pearson相关系数的前提要求
(1)【分析】——【非参数检验】——【单样本K-S检验】
(2)结果分析
单样本Kolmogorov-Smirnov 检验
年均衣着消费个人年收入家庭年收入
N 50 51 51
正态参数a,,b均值 1.44 1.33 2.25
标准差.733 .816 1.197
最极端差别绝对值.406 .462 .192
正.406 .462 .192
负-.274 -.342 -.147 Kolmogorov-Smirnov Z 2.870 3.302 1.372
渐近显著性(双侧) .000 .000 .046
a. 检验分布为正态分布。
. 根据数据计算得到。
H0:样本服从总体的正态分布。0.046<0.05,拒绝原假设。
单样本检验的结果显示变量不服从正态分布,可以用Pearson相关系数检验变量之间的线性相关程度。
2 双变量相关分析
(1)【分析】→【相关】→【双变量】
(2)结果分析
相关性
年均衣着消费个人年收入家庭年收入年均衣着消费Pearson 相关性 1 .074 .199 显著性(双侧).612 .166
N 50 50 50 个人年收入Pearson 相关性.074 1 .419**显著性(双侧).612 .002
N 50 50 50 家庭年收入Pearson 相关性.199 .419** 1 显著性(双侧).166 .002
N 50 50 50 **. 在.01 水平(双侧)上显著相关。
附有“* *”的相关系数表明在0.01的水平上相关显著。
P值大于显著性水平0.01,则接受原假设,两者相关。
二偏相关分析
1先对各变量进行两两相关分析,计算变量之间的皮尔逊积差相关系数.
2进行偏相关分析,计算在控制其他变量的影响时,两个变量之间的相关程度。
1 【分析】→【相关】→【偏相关】
被试的两个变量选入右侧的变量框中,第三方变量选入右侧的控制变量框中。
2 结果分析
相关性
控制变量打折消费比年龄个人年收入-无-a打折消费比相关性 1.000 -.067 .084
显著性(双侧). .640 .558
df 0 49 49 年龄相关性-.067 1.000 .204
显著性(双侧).640 . .151
df 49 0 49 个人年收入相关性.084 .204 1.000
显著性(双侧).558 .151 .
df 49 49 0 个人年收入打折消费比相关性 1.000 -.086
显著性(双侧). .551
df 0 48
年龄相关性-.086 1.000
显著性(双侧).551 .
df 48 0
a. 单元格包含零阶(Pearson) 相关。
H0:两者不相关。
上表中的上半部分输出的是变量两两之间的简单相关系数,打折消费比与年龄之间相关系数为-0.067;
表下半部分是偏相关分析的输出结果,第一行为偏相关系数,第二行为相伴概率;第三行为统计检验的自由度。剔除个人年收入的影响,打折消费比与年龄之间相关系数为-0.086.所以,在显著性水平下,打折消费比与年龄之间相关性不高。
三距离分析
1 “分析”→“相关”→“距离”
距离分析根据距离测度含义的差异,可以分为两种:相似性测度(Sinilarities)和不相似性测度(Dissimilarities)。
变量间距离是进行不相似性度量,个案间距离是进行相似性度量。
2 结果分析
不相似性测度以距离表示,距离的特征值越小越相似,距离越大差别越大;
相似性测度以相似系数表示,相似系数的特征值越大越相似,值越小差别越大。