相关分析及检验、相关系数

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在利用样本研究总体的特性时,由于抽样误差的存在,样本中控制 了其他变量的影响,两个变量间偏相关系数不为0,不能说明总体中这 两个变量间的偏相关系数不是0,因此必须进行检验。 检验的零假设 H0:总体中两个变量间的偏相关系数为 0。
零阶相关系数:输出所有变量的相关系数阵 结果分析 描述性统计量表 参与相关分析的两个变量的样本数都是 12,平均气温的均值都是 18.250, 标准差是 8.8149,日照时数的均值是 118.567,标准差是 48.3840. 相关性分析结果表 平均气温和日照时数的 person 相关系数为 0.758,显著性水平为 0.004,小 于 0.01(在.01 水平(双侧)上显著相关) 。所以平均气温和日照对数的相 关关系为正向,且相关性很强。 结果分析

描述性统计量表 参与相关分析的两个变量的样本数都是 12,平均气温的均值都是 18.250, 标准差是 8.8149,日照时数的均值是 118.567,标准差是 48.3840. 相关性分析结果表 平均气温和日照时数的 person 相关系数为 0.758,显著性水平为 0.004,小 于 0.01(在.01 水平(双侧)上显著相关) 。所以平均气温和日照对数的相 关关系为正向,且相关性很强。 结果分析 描述性统计量表 参与相关分析的两个变量的样本数都是 12,平均气温的均值都是 18.250, 标准差是 8.8149,日照时数的均值是 118.567,标准差是 48.3840. 相关性分析结果表 平均气温和日照时数的 person 相关系数为 0.758,显著性水平为 0.004,小 于 0.01(在.01 水平(双侧)上显著相关) 。所以平均气温和日照对数的相 关关系为正向,且相关性很强。
结果分析 描述性统计量表 参与偏相关分析的两个变量的样本数都是 12,语文成绩的均值都是 77.50, 标准差是 19.019,数学成绩的均值是 76.17,标准差是 22.811.IQ 均值是 98.33,标准差是 22.960. 偏相关性分析结果表 不控制 IQ 时语文成绩和数学成绩的相关系数为 0.991, 显著性水平为 0.000, 小于 0.01,控制 IQ 后语文成绩和数学成绩的相关系数为 0.893,显著性水 平为 0.000,所以语文成绩和数学成绩的相关关系为正向且相关性很强。 偏相关分析的检验过程
正态分布的相关检验
对来自正态总体的两个样本进行均值比较常使用 T 检验的方法。 T 检验要求两个被比较的样本来自正态总体。两个样本方差相等与不等时用 的计算 T 值的公式不同。 进行方差齐次性检验使用 F 检验。 对应的零假设是:两组样本方差相等。P 值小于 0.05 说明在该水平上否定原 假设,方差不齐;否则两组方差无显著性差异。 U 检验 时用服从正态分布的检验量去检验总体均值差异情况的方法。在这种情况下 总体方差通常是已知的。 虽然 T 检验法与 U 检验法所解决的问题大体相同,但在小样本(样本数 n) =30 作为大样本)且均方差未知的情况下就不能用 U 检验法 了。 均值检验时不同的数据使用不同的统计量,使用 MEANS 过程求若干组的描 述统计量,目的在于比较。因此必须分组求均值。这是与 Descriptives 过程
不同之处。 检验单个变量的均值是否与给定的常数之间存在差异,用 One-Sample T Test 单样本 T 检验过程。 检验两个不相关的样本是否来自来具有相同均值的总体,用 Independent-Samples T test 独立样本 t 检验过程。 如果分组样本不独立,用 Paired Sample T test 配对 t 检验。 如果分组不止两个,应使用 One-Way ANOVO 一元方差分析(用于检验几个 独立的组,是否来自均值相等的总体)过程进行单变量方差分析。 如果试图比较的变量明显不服从正态分布,则应该考虑使用一种非参数检验 过程 Nonparametric test. 如果用户相比较的变量是分类变量,应该使用 Crosstabs 功能。当样本值不能 为负值时用右侧单边检验。
一、 如何用 SPSS 求相关系数
spearman(斯伯曼/斯皮尔曼)相关系数 斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。 它是依 据两列成对等级的各对等级数之差来进行计算的,所以又称为“等级差数法”斯 皮尔曼等级相关对数据条件的要求没有积差相关系数严格, 只要两个变量的观测 值是成对的等级评定资料, 或者是由连续变量观测资料转化得到的等级资料,不 论两个变量的总体分布形态、 样本容量的大小如何,都可以用斯皮尔曼等级相关 来进行研究 Kendall's 相关系数 肯德尔(Kendall)W 系数又称和谐系数,是表示多列等级变量相关程度的 一种方法。适用这种方法的数据资料一般是采用等级评定的方法收集的,即让 K 个评委(被试)评定 N 件事物,或 1 个评委(被试)先后 K 次评定 N 件事物。 等级评定法每个评价者对 N 件事物排出一个等级顺序,最小的等级序数为 1,最 大的为 N,若并列等级时,则平分共同应该占据的等级,如平时所说的两个并列 第一名,他们应该占据 1,2 名,所以它们的等级应是 1.5,又如一个第一名,两 个并列第二名,三个并列第三名,则它们对应的等级应该是 1,2.5,2.5,5,5,5, 这里 2.5 是 2,3 的平均,5 是 4,5,6 的平均。 肯德尔(Kendall)U 系数 又称一致性系数, 是表示多列等级变量相关程度的一种方法。该方法同样适 用于让 K 个评委(被试)评定 N 件事物,或 1 个评委(被试)先后 K 次评定 N 件事物所得的数据资料, 只不过评定时采用对偶评定的方法,即每一次评定都要 将 N 个事物两两比较,评定结果如下表所示,表格中空白位(阴影部分可以不 管)填入的数据为:若 i 比 j 好记 1,若 i 比 j 差记 0,两者相同则记 0.5。一共 将得到 K 张这样的表格,将这 K 张表格重叠起来,对应位置的数据累加起来作 为最后进行计算的数据,这些数据记为γij 。 在 SPSS 软件相关分析中,pearson(皮尔逊),kendall (肯德尔) 和 spearman (斯伯曼/斯皮尔曼)三种相关分析方法有什么异同 首先看两个变量是否是正态分布 是,则 analyze-correlate-bivariate 中选择 pearson 相关系数, 否,则要选 spearman 相关系数或 Kendall 相关系数。 如果显著相关,输出结果会有*号显示,只要 sig 的 P 值大于 0.05 就是显 著相关。如果是负值则是负相关。
6.继续-确定
结果分析 描述性统计量表 参与相关分析的两个变量的样本数都是 12,平均气温的均值都是 18.250, 标准差是 8.8149,日照时数的均值是 118.567,标准差是 48.3840. 相关性分析结果表 平均气温和日照时数的 person 相关系数为 0.758,显著性水平为 0.004,小 于 0.01(在.01 水平(双侧)上显著相关) 。所以平均气温和日照对数的相 关关系为正向,且相关性很强。
双变量相关分析 Eg:
命令: 分析-相关-双变量 步骤 1.选择进行相关分析的变量: 选中“平均气温”和“日照对数” 2.选择相来自百度文库系数: 因为变量等距变量所以选择 person
3.设定显著性检验类型 选择“双侧检验” 4.选择是否标记显著性相关 选择“标记显著性相关” 5.选择相关统计量的输出和缺失值的处理方法 在“选择”中选择“均值和标准差”即输出均值和标准差,选择“叉积偏差和协 方差” ,在“缺失值”中选择“按对排除个案”即咋分析时遇到缺失值的情况就 将缺失值排除在数据分析之外。
偏相关分析
偏相关分析 是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分 析另外两个变量之间相关程度的过程。 偏相关分析也称净相关分析, 它在控制其他变量的线性影响的条件下分析两 变量间的线性相关性,所采用的工具是偏相关系数(净相关系数)。控制变量个 数为一时,偏相关系数称为一阶偏相关系数;控制变量个数为二时,偏相关系数 称为二阶相关系数;控制变量个数为为零时,偏相关系数称为零阶偏相关系数, 也就是相关系数。 p 值是针对原假设 H0:假设两变量无线性相关而言的。 一般假设检验的显著性水平为 0.05,只需要拿 p 值和 0.05 进行比较: 如果 p 值小于 0.05,就拒绝原假设 H0,说明两变量有线性相关的关系,他 们无线性相关的可能性小于 0.05; 如果大于 0.05,则一般认为无线性相关关系,至于相关的程度则要看相关 系数 R 值,R 越大,说明越相关。越小,则相关程度越低。 命令 分析-相关-偏相关 变量与控制变量
1. 两个连续变量间呈线性相关时,使用 Pearson 积差相关系数,不满足积差相 关分析的适用条件时,使用 Spearman 秩相关系数来描述. 2. Spearman 相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关 分析, 对原始变量的分布不作要求, 属于非参数统计方法, 适用范围要广些。 对于服从 Pearson 相关系数的数据亦可计算 Spearman 相关系数,但统计效 能要低一些。Pearson 相关系数的计算公式可以完全套用 Spearman 相关系数 计算公式,但公式中的 x 和 y 用相应的秩次代替即可。 3. Kendall's tau-b 等级相关系数:用于反映分类变量相关性的指标,适用于两 个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验; 取值范围在-1-1 之间,此检验适合于正方形表格; 4. 计算积距 pearson 相关系数,连续性变量才可采用;计算 Spearman 秩相关系 数,适合于定序变量或不满足正态分布假设的等间隔数据; 计算 Kendall 秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据。 5. 计算相关系数:当资料不服从双变量正态分布或总体分布未知,或原始数据 用等级表示时,宜用 spearman 或 kendall 相关 Pearson 相关复选项积差相关计算连续变量或是等间距测度的变量间的相关分 析 Kendall 复选项等级相关计算分类变量间的秩相关适用于合并等级资料 Spearman 复选项等级相关计算斯皮尔曼相关适用于连续等级资料注: 1. 若非等间距测度的连续变量 因为分布不明-可用等级相关/也可用 Pearson 相关,对于完全等级离散变量必用等级相关 2. 当资料不服从双变量正态分布或总体分布型未知或原始数据是用等级表示 时,宜用 Spearman 或 Kendall 相关。 若不恰当用了 Kendall 等级相关分析则可能得出相关系数偏小的结论。则若 不恰当使用, 可能得相关系数偏小或偏大结论而考察不到不同变量间存在的密切 关系。对一般情况默认数据服从正态分布的,故用 Pearson 分析方法。 在 SPSS 里进入 Correlate-Bivariate,在变量下面 Correlation Coefficients 复选框组 里有 3 个选项:
相关文档
最新文档