相关分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

操作步骤: 单击Analyze Correlate Distances 打开 Distances对话框。

14章
相关分析
本章主要内容:
1、相关分析简介; 2、简单相关分析; 3、偏相关分析; 4、Distance过程
14.1 相关分析简介
一、相关分析的指标体系 1、连续变量的相关指标 2、有序变量的相关指标 3、名义变量的相关指标 4、其他特殊指标
1、连续变量的相关指标 (积差)相关系数(或Pearson相关系数) Spearman相关系数 2、有序变量的相关指标 有序变量的相关性称为一致性。 (1)Gamma统计量 (2)Kendall’s Tau-b (3)Kendall’s Tau-c (4)Somer’s d
操作步骤: 单击Analyze Correlate Partial 打开Partial对话框。
此处,偏相关系数等于-0.203,与前文的相关系数-0.219是 不一样的。
14.4 Distance距离
一、距离测量与相似性指标 在统计学中,距离可以用来表示两个变量的相似程 度。 另一个常用Leabharlann Baidu相似指标是相关关系。 根据变量的不同类型,可以有不同的距离/相似指标。 具体内容参见《多元统计分析》中的判别分析和聚 类分析。
3、单击Options按纽,选择输出项和缺失值的处理方式。本例中选择输 出基本统计描述。

4、单击OK,可以得到相关分析的结果。

秩相关系数
秩相关系数又称Spearman等级相关系数。 秩相关系数是利用两变量的秩次大小进行线性 相关分析。 适用范围:对于连续变量,当积差相关系数不 适用时,可以使用Spearman等级相关系数来 衡量两个变量之间的相关系数。
3、名义变量的相关指标 (1)列联系数 (2)Phi和Crammer’s V (3)系数 (4)Uncertainly Coefficient
4、其他特殊指标 Eta指标:名义变量和连续变量的相关程度。 Kappa OR RR
二、SPSS的相关分析功能 (1)Crosstabs中Statistics子对话框 (2)Correlate子菜单 Bivariate Partial Distances

Kendall相关系数
Kendall相关系数适用于有序分类变量。
14.3 偏相关分析
一、方法原理 简单相关关系只反映两个变量之间的关系,但如果因变量受到 多个因素的影响时,因变量与某一自变量之间的简单相关 关系显然受到其它相关因素的影响,不能真实地反映二者 之间的关系,所以需要考察在其它因素的影响剔除后二者 之间的相关程度,即偏相关分析。 偏相关分析是指在相关的基础上考虑两个因素以外的各种影响 因素,或者说在扣除了其他因素的作用大小以后,重新来 考虑这两个因素间的关联程度。 计算公式:参见《多元统计分析》。

案例:
例:在控制家庭收入对总信心指数影响的前提下,考察总信心 指数值和年龄的相关性。 总信心指数与年龄存在相关关系,即年龄越老,信心指数越小, 年龄越年轻,信心指数越大。同样,总信心指数与家庭收入 也存在负相关关系。那么,总信心指数与年龄之间的负相关 关系受不受家庭收入的影响?这种影响有多大?这就需要考 虑偏相关关系。
14.2 简单相关分析
一、方法原理 1、基本概念 直线相关 曲线相关 正相关与负相关 完全相关 2、系数计算
3、积差相关系数的适用条件 (1)积差相关系数适用于线性相关的情形。 (2)样本中存在的极端值对积差相关系数的计算影 响极大,要慎重考虑和处理,必要时可以对其进行 剔除,或进行变量变换。 (3)积差相关系数要求相应的变量呈双变量正态分 布。 4、散点图的作用 (1)变量间是否存在相关趋势; (2)相关趋势呈现为线性趋势还是曲线趋势; (3)发现明显的异常点,或者强影响点。
1、距离测量指标 (1)欧式距离 (2)频数表距离或卡方值距离 (3)二分类距离 2、相似性测量指标 (1)计量资料:如,相关系数等 (2)二分类变量:如,Russell and Rao等。

案例:基因间距离的计算
例:某实验室制作了一张基因芯片,上面一共检测了 上万个基因,现在从数据库中提取了7个基因的数 据,对其进行距离测量,确定哪些基因的距离比较 接近 。 数据见:distance.sav
二 案例: 考察总信心指数值和年龄的相关性
操作步骤: 1、打开数据库后,绘制总信心指数和年龄的散点图; 2、单击Analyze Correlate Bivariate 打开Bivariate对话框。

2、从左边的变量框中选择需要考察的两个变量进入 Variables 框内,从 Correlation Coefficients 栏内选择相关系数的种类,有Pearson相关系数, Kendall′s一致性系数和Spearman等级相关系数。从检验栏内选择检验 方式,有双尾检验和单尾检验两种。
四个系数都在-1到+1之间取值、其解释与Pearson相关系数相同。值得注意 的是对各自对tie(并列值)的不同处理。 Gamma不考虑并列值,即在计算时,并列值出现的次数不被计入分母之中。 Somers' d将自变量的并列值考虑了进去、但没有考虑因变量的并列值。 Kendall's tau-b则将自变量和因变量的并列值同时考虑了进去;而 Kendall's tau-c 则如同Gamma一样,忽略任何并列值。
相关文档
最新文档