常用相关分析方法及其计算.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、常用相关分析方法及其计算
在教育与心理研究实践中,常用的相关分析方法有积差相关法、等级相关法、质量相关法,分述如下。
(一)积差相关系数
1. 积差相关系数又称积矩相关系数,是英国统计学家皮尔逊(Pearson)提
出的一种计算相关系数的方法,故也称皮尔逊相关。这是一种求直线相关的基本方法。
积差相关系数记作r,其计算公式为
XY
n
( x X
i )( y Y
i
)
r
XY n
i
(
1
x
i
n
2
X )
(
y
i
Y 2 )
(2-20)
i 1 i 1
式中x i 、y i 、X 、Y 、n 的意义均同前所述。
若记x x i X , y y i Y ,则(2-20)式成为
xy
r (2-21)
XY nS S
X Y
式中
xy
n
称为协方差,
xy
n
的绝对值大小直观地反映了两列变量的一致性程
度。然而,由于X 变量与Y 变量具有不同测量单位,不能直接用它们的协方差xy
来表示两列变量的一致性,所以将各变量的离均差分别用各自的标准差n
除,使之成为没有实际单位的标准分数,然后再求其协方差。即:
xy
1 x y
r ( ) (
XY S
nS S n S
X Y X Y
)
1 n Z X Z (2-22) Y
这样,两列具有不同测两单位的变量的一致性就可以测量计算。
计算积差相关系数要求变量符合以下条件:(1)两列变量都是等距的或等比的测量数据;(2)两列变量所来自的总体必须是正态的或近似正态的对称单峰分布;(3)两列变量必须具备一一对应关系。
2. 积差相关系数的计算
利用公式(2-20)计算相关系数,应先求两列变量各自的平均数与标准差,再
1
求离中差的乘积之和。在统计实践中,为方便使用数据库的数据格式,并利
于计算机计算,一般会将(2-20)式改写为利用原始数据直接计算r的公式。
XY 即:
n x y x y
i i i i
r (2-23)
XY
2 ( )2 2 ( )2
n x x n y y
i i i i
(二)等级相关
在教育与心理研究实践中,只要条件许可,人们都乐于使用积差相关系数来度量两列变量之间的相关程度,但有时我们得到的数据不能满足积差相关系数的
计算条件,此时就应使用其他相关系数。
等级相关也是一种相关分析方法。当测量得到的数据不是等距或等比数据,
而是具有等级顺序的测量数据,或者得到的数据是等距或等比的测量数据,但其所来自的总体分布不是正态的,出现上述两种情况中的任何一种,都不能计算积差相关系数。这时要求两列变量或多列变量的相关,就要用等级相关的方法。
1. 斯皮尔曼( Spearman) 等级相关
斯皮尔曼等级相关系数用r R 表示,它适用于两列具有等级顺序的测量数据,
或总体为非正态的等距、等比数据。
斯皮尔曼等级相关的基本公式如下:
2
6 D
r R 1 (2-24)
2
n(n 1)
式中:
D R X R
Y ____________
对偶等级之差;
n ____________ 对偶数据个数。
如不用对偶等级之差,而使用原始等级序数计算,则可用下式
4 R R 3
X Y
r R [ (n 1)] (2-25)
n 1 n(n 1)
式中:
R
X ___________ X
变量的等级;
R Y ____________Y
变量的等级;
n ____________ 对偶数据个数。
(2-25)式要求R X R Y , 2 2
R X R ,从而保证
Y
2 2
S X S 。在观测变量
Y
中没有相同等级出现时可以保证这一条件。但是,在教育与心理研究实践中,搜集到的观测变量经常出现相同等级。在这种情况下,R
X R 的条件仍可得
Y
到保证,但 2 2
R X R 的条件则不能得到满足。在有相同等级出现的情况下,Y
2
2
R 随相同等级数目的逐渐增多而有规律地减少,其减少的规律如下:
2
t(t 1)
c
12
其中:
c ___________差数值(几个相同等级出现的R2 与没有相同等级出现的 2 R 之差);
t ____________某一等级的相同数。
当一列变量中有多个相同等级出现时,他们的差数值为:
2
t (t 1)
c
12
从而,在出现相同等级情况下,计算斯皮尔曼等级相关系数的公式为:
2 2 2
x y D
r Rc (2-26)
2 2
2 x y
式中:
2 2
2 n(n 1) t(t 1)
x ;
12 12
2 2
2 n(n 1) t(t 1)
y ;
12 12
____________
n 对偶数据个数。
___________
t
各列变量相同等级数;
____________
D
对偶等级差数;
2. 肯德尔W 系数(肯德尔和谐系数)
肯德尔W 系数又称肯德尔和谐系数,是表示多列等级变量相关程度的一种
方法,它适用于两列以上等级变量。
肯德尔和谐系数用W 表示,其公式为
W
SS
Ri (2-27) 1 3
n
K (n n)
12
式中: