常用相关分析方法及其计算

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Fra Baidu bibliotek(2-23)
(2)等级相关
在教育与心理研究实践中,只要条件许可,人们都乐于使用积差相关系数来度量两列变量之间的相关程度,但有时我们得到的数据不能满足积差相关系数的计算条件,此时就应使用其他相关系数。
等级相关也是一种相关分析方法。当测量得到的数据不是等距或等比数据,而是具有等级顺序的测量数据,或者得到的数据是等距或等比的测量数据,但其所来自的总体分布不是正态的,出现上述两种情况中的任何一种,都不能计算积差相关系数。这时要求两列变量或多列变量的相关,就要用等级相关的方法。
1.斯皮尔曼(Spearman)等级相关
斯皮尔曼等级相关系数用 表示,它适用于两列具有等级顺序的测量数据,或总体为非正态的等距、等比数据。
斯皮尔曼等级相关的基本公式如下:
(2-24)
式中:
____________对偶等级之差;
____________对偶数据个数。
如不用对偶等级之差,而使用原始等级序数计算,则可用下式
(2-25)
式中:
___________ 变量的等级;
____________ 变量的等级;
____________对偶数据个数。
(2-25)式要求 , ,从而保证 。在观测变量中没有相同等级出现时可以保证这一条件。但是,在教育与心理研究实践中,搜集到的观测变量经常出现相同等级。在这种情况下, 的条件仍可得到保证,但 的条件则不能得到满足。在有相同等级出现的情况下, 随相同等级数目的逐渐增多而有规律地减少,其减少的规律如下:
点双列相关在教育与心理统计研究中作为选择题的区分度指标。
2.双列相关
双列相关系数适用于两列变量均为来自正态总体的等距(比)变量;而其中一列被认为地划分为两个类别的数据。
双列相关系数的计算公式为
(2-30)
式中:
___________等距(比)变量中与 对应的那部分数据的平均值;
___________等距(比)变量中与 对应的那部分数据的平均值;
(2-20)
式中 、 、 、 、 的意义均同前所述。
若记 , ,则(2-20)式成为
(2-21)
式中 称为协方差, 的绝对值大小直观地反映了两列变量的一致性程度。然而,由于 变量与 变量具有不同测量单位,不能直接用它们的协方差 来表示两列变量的一致性,所以将各变量的离均差分别用各自的标准差除,使之成为没有实际单位的标准分数,然后再求其协方差。即:
___________二分称名变量中取某一值的变量比例;
___________二分称名变量中取另一值的变量比例;
___________标准正态曲线下 与 交界点的 轴高度(可查正态分布表得出)。
双列相关在教育与心理统计研究中常作为问答题或主观题的区分度指标。
___________各列变量相同等级数;
____________对偶等级差数;
2.肯德尔 系数(肯德尔和谐系数)
肯德尔 系数又称肯德尔和谐系数,是表示多列等级变量相关程度的一种方法,它适用于两列以上等级变量。
肯德尔和谐系数用 表示,其公式为
(2-27)
式中:
___________ 的离差平方和;
___________等级变量的列数或评价者数目;
(3)质量相关
在教育与心理研究实践中,我们常将一列变量按事物的某一属性划分种类,而另一列变量则为等比或等距的测量数据,这种情况下求得的相关,称为质量相关。
1.点双列相关
点双列相关适用于双列变量中一列为来自正态总体的等距或等比的测量数据;另一列为二分称名变量,即按事物的某一性质只能分为两类互相独立的变量,如男与女、文盲与非文盲等。
点双列相关的计算公式为
(2-29)
式中:
___________二分称名变量中取某一值的变量比例;
___________二分称名变量中取另一值的变量比例;
___________等距(比)变量中与 对应的那部分数据的平均值;
___________等距(比)变量中与 对应的那部分数据的平均值;
___________全部等距(比)变量的标准差。
(2-22)
这样,两列具有不同测两单位的变量的一致性就可以测量计算。
计算积差相关系数要求变量符合以下条件:(1)两列变量都是等距的或等比的测量数据;(2)两列变量所来自的总体必须是正态的或近似正态的对称单峰分布;(3)两列变量必须具备一一对应关系。
2.积差相关系数的计算
利用公式(2-20)计算相关系数,应先求两列变量各自的平均数与标准差,再求离中差的乘积之和。在统计实践中,为方便使用数据库的数据格式,并利于计算机计算,一般会将(2-20)式改写为利用原始数据直接计算 的公式。即:
其中:
___________差数值(几个相同等级出现的 与没有相同等级出现的 之差);
____________某一等级的相同数。
当一列变量中有多个相同等级出现时,他们的差数值为:
从而,在出现相同等级情况下,计算斯皮尔曼等级相关系数的公式为:
(2-26)
式中:


____________对偶数据个数。
二、常用相关分析方法及其计算
在教育与心理研究实践中,常用的相关分析方法有积差相关法、等级相关法、质量相关法,分述如下。
(1)积差相关系数
1.积差相关系数又称积矩相关系数,是英国统计学家皮尔逊(Pearson)提出的一种计算相关系数的方法,故也称皮尔逊相关。这是一种求直线相关的基本方法。
积差相关系数记作 ,其计算公式为
____________被评价对象数目。
肯德尔 系数基于这么一种思想:当 个评价者对几件事物进行等级评定,如果 个评价者的意见完全一致,则 个 分别为 , , ,···, ,···, ,

此时的 ;若如果 个评价者的意见完全不一致,则 ,此时的 ;如果 个评价者的意见存在一定的关系,但又不是完全一致,则 。因此,肯德尔 系数的变化范围为 ,当我们得到一个不等于 的肯德尔 系数,它仅表明了相关程度,由于 ,对相关的方向尚需从实际资料中分析得出。
相关文档
最新文档