第五章 相关分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当K个评价者对n件事物进行等级评定, 如果K个评价者的意见完全一 致, 则n个Ri 分别为 K (n + 1) , 2 2 n(n + 1) 2 n( n + 1)(2n+) SS Ri = ∑ ( Ri + R) = K ( − ) 6 4 K2 3 = (n − n), 此时W= ; 1 12 若K个评价者完全不一致, Ri = 0,W=0; SS K ,2K ,3K ,LnK , R = 若K个评价者 存在一定的关系,但又 不完全一致, 则SS Ri ≠ 0, 故0 ≤ W ≤ 1。
适用条件 一列数据来自于正态分布的总体的等比或等距数据 等比或等距数据,另一 等比或等距数据 列变量为二分变量 二分变量(dichotomous variable) ,即按事物的某 二分变量 一性质只能分为两类相互独立的变量。
XP − X q rpb = pq Sx
例题P136
P为二分称名变量取某一值的变量比例 q为二分称名变量中取另一值的变量比例 Xp等距 等距( 变量中与P Xp等距(比)变量中与P对应那部分变量的平均值 Xq等距 等距( 变量中与q Xq等距(比)变量中与q对应那部分变量的平均值 Sx为全部等距或等比变量的标准差 Sx为全部等距或等比变量的标准差
• 计算公式(例题 计算公式(例题P133-134) -
U=
8(∑r −K∑rij )
2 ij
N(N −1)•K(K −1)
+1
rij对偶记录表中某一格 的择优分数
• 如果评价者的态度完全一致,则U=1;若对角线 上下格子中出现的择优分数相同,则一致性为0; 若K为奇数时每格的择优分数为(K+1)/2与(K -1)/2均匀分布在对角线上下,U=-1/K;若K 为偶数时,U=-1/K-1,U的取值正负并不表示 方向的一致性。
例题见书P125
(3)遇到相同等级时的计算公式 )
rRC =
x2 + ∑y2 − ∑D2 ∑ 2
∑x ∑y
2
2
为矫正数,即减 少的差数
N N 2 −1 n n2 −1 x2 = −∑ ∑ 12 12 上式中: 上式中: N N 2 −1 n n2 −1 y2 = −∑ ∑ 12 12
(
)
(
) )
(
计算公式
(1)定义公式(等级差数法) )定义公式(等级差数法)
rR = 1 −
6∑ D
2
n n2 −1
(
)
D=Rx-Ry是 Rx-Ry是 对偶等级之差
(2)原始等级计算公式(等级序数法) )原始等级计算公式(等级序数法)
3 4∑RxRy • −(n+) rR = 1 n −1 n(n+) 1
下列现象属于什么关系? 下列现象属于什么关系?
• • • • • • • • • 数学成绩影响物理成绩 种瓜得瓜,种豆得豆 智力和创造性 小孩和小树的生长 河里的漂浮的两块木头 学习压力和学习焦虑 挫折和攻击行为 环境对人的成长的影响 教师的教学方法和学生的学习成绩
• 2.相关的实质 • 变量之间没有严格确定的依存关系,当一 变量之间没有严格确定的依存关系 个变量(自变量)发生变化时,另一个变 量(因变量)也许 也许会发生相应的变化,但 也许 它们之间没有严格的确定关系,因为事物 的变化发展是受很多因素 很多因素影响的。 很多因素
• 适用条件
①K个评价者对 N 件事物或 N 种作品进行等级评 每个评价者都能对N件事物(或作品)的好坏、 定,每个评价者都能对N件事物(或作品)的好坏、 优劣、喜好、大小、 排出一个等级顺序。 优劣、喜好、大小、高低等 排出一个等级顺序。 最大的为N, K个评价者便 最小的等级序数为 1, 最大的为N, K个评价者便 可得到K 的等级变量资料。 可得到K从1至N的等级变量资料。 件作品, ②一个评价者先后K次评价 N 件事物或 N 件作品, 一个评价者先后K 也是采用等级评定法, 也是采用等级评定法,这样也可得到 K 列从 1 至 的等级变量资料。 N 的等级变量资料。这类 K 列等级变量资料综合 起来求相关, 系数。 起来求相关,就用肯德尔 W 系数。
NS X SY
X
ZY N
(3)用原始数据直接计算的简化公式 (3)用原始数据直接计算的简化公式:
r=
N∑X − ∑X) N∑ −(∑ ) Y Y
2 2 2
N∑XY−∑X∑ Y
(
2
例题P116-118
• (4)计算积差相关系数的差法公式
减差法 r = 加差法 S
2 X + 2 − S X − S Y 2 S X S Y 2 Y
•出现相同等级时的公式 出现相同等级时的公式
Wc =
1 2 3 K N − N − K ∑T 12 3 n −n 式中: T = ∑ ,( n为相同等级数) ∑ 12
例题P132
(
SS Ri
)
• (2)肯德尔U系数 肯德尔U
• 适用条件 • K个评价者对N件事物采用两两配对的方法 进行评价,可配成N(N-1)/2对,然后进行 两两比较,较好的记1分,较差者记0分, 最后整理所有评价者的评价结果是否一致。
)
(
N成对数据数目 n为某一变量的 相同等级数
例题见书P127-128
3.肯德尔等级相关 多列等级变量的相关) 3.肯德尔等级相关(多列等级变量的相关)
• (1)肯德尔和谐系数 肯德尔和谐系数( 肯德尔和谐系数(Kendall coefficient of concordance), 是表示多列等级变量相关 程度的一种方法 , 适用于两列以上的等级 变量。肯德尔和谐系数常用符号 W 表示。 变量。 表示。
∑[(n − 3)Z ] Z= ∑(n − 3)
i i i
• (4)将平均Z分数转换成r
三、等级相关
• 1.等级相关的概念
• 两列变量所对应的数据是等级顺序的测量 数据时,或者两列变量所对应的等距或等 比数据的分布非正态时,求两列变量的相 关,即为等级相关。 • 等级相关也属于线性相关 , 亦为非参数相 等级相关也属于线性相关, 关。
• • • •
5.相关次数 单相关:两个变量之间的相关; 单相关 复相关:多个变量之间的相关 复相关 表现形态:线性相关包括直线 曲线 直线和曲线 表现形态 直线 曲线相关
二、积差相关
• 1.积差相关的概念 1.积差相关的概念 • 积差相关(product-moment (product-
coefficient of corralation)是英国统计学家皮尔逊于20世 corralation)是英国统计学家皮尔逊于20世 纪初提出的计算方法,简称: 纪初提出的计算方法,简称:Pearson 相关 系数(软件中常用此名称)。 )。积差相关又称为 系数(软件中常用此名称)。积差相关又称为 积矩相关。 积矩相关。 • 离均差乘方之和除以N称做“矩”(moment), 离均差乘方之和除以N称做“ (moment), 把X的离均差和Y的离均差两者的积总和除以N, 的离均差和Y的离均差两者的积总和除以N 积矩”表示。 用“积矩”表示。
•基本公式
W= SS Ri 1 2 3 K N −N 12
2 i
(
)
2 i
SS Ri
(∑ R ) = ∑R − N
Ri被评价者的K个等级和, SSRi为Ri的离差平方和, K为评价者数目,N为被 评价的事物的数目。
肯德尔W 肯德尔W系数的变 化范围为0≤W≤1 化范围为0≤W≤1
例题P131
• 肯德尔W系数的设计思想: 肯德尔W系数的设计思想
• 2.二列相关
• (biserail correlation,中科院 中科院2004试题 试题) 中科院 试题 • 适用条件 • 两列变量都来自于正态分布的等比或等距 等比或等距数据,而其 等比或等距 中一列被人为地划分为两个类别的数据
rb =
XP − Xq St
pq • y
y标准正态曲线下p和q交界 标准正态曲线下p 点的y 点的y轴的高度 (例题P138-139)
• 二列相关一般不常用 • 一般用于对项目(题目)的区分度的确定 • 当相关系数越接近1时,项目的区分度越高; 当相关系数越接近0时,其区分度越低。
• 3.多列相关(multiserials correlation) multiserials correlation) • 适用资料 • 多列相关适合处理两列正态变量资料,其中 多列相关适合处理两列正态变量资料, 一列为等距或等比的测量数据, 一列为等距或等比的测量数据,另一列被人 为划分为多个类别的名义变量。 多个类别的名义变量 为划分为多个类别的名义变量。 • 多列相关用于一列正态连续变量与另一列 正态的称名变量之间的一致性分析, 称名变量之间的一致性分析 正态的称名变量之间的一致性分析,在测验 中时常用于效度检验。 中时常用于效度检验。 效度检验
• 3.三种相关关系: 三种相关关系: • 正相关:变量之间变动的方向相同,同增 正相关 同减。 • 负相关 负相关:变量之间变动方向相反,一个增 加而另一个减小。 • 零相关 零相关:变量之间的变动无规律可循。
• 4.相关的程度 • 完全正相关:两个变量变化的速度完全一 完全正相关 致,相关系数为1 • 完全负相关 完全负相关:一个变量增加的同时,另一 个变量以相同的速度减小,相关系数为-1 • 不完全正相关 不完全正相关:相关系数在0--1之间 • 不完全负相关 不完全负相关:相关系数在-1---0间
第五章 变量的相关
• 【教学目标】识记相关、散点图、相关系 数的类别和含义;理解各类相关系数的意 义和适用条件;熟练掌握常用相关系数的 计算方法;恰当应用各类相关系数进行相 关分析。 • 【学习重点】相关的基本类型;各种相关 系数的适用条件和计算方法;积差相关、 等级相关、质量相关、品质相关 。 • 【难点】肯德尔U系数、品质相关
• • • • • •
• 主要内容 一、相关的概念 二、积差相关 三、等级相关 四、质量相关 五、品质相关 品质相关 六、相关系数的选用与解释
一、相关的概念
• 1.事物之间的三种关系 • 因果关系:一种现象是另一现象的因,而另一现 因果关系 象是果。 • 共变关系 共变关系:表面看来有联系的两种事物与第三种 现象现象有关,这是两种事物的关系就是共变关 系。 • 相关关系 相关关系:两种现象在发展变化的方向 大小 方向和大小 方向 大小方 不能确定这两种现象哪是 面存在一定的关系,但不能确定 不能确定 因哪是果;也有理由认为这两者并不同时受第三 因素的影响 。
3.计算公式 (1)基本公式
r=
∑ xy
NS X S y

N
xy
,式中x = X − X ,y = Y − Y
r=
也可写成:
∑ xy ∑x ∑y
2
2
协方差(covariance) 协方差(covariance): 共变方差,反应两列变 量变化的一致性程度
(2)运用标准分数计算相关系数的公式
∑ ( X − X )(Y − Y ) = Z r=
• 2. 斯 皮 尔 曼 等 级 相 关 (
correlation coeficient for ranked
Spearman’s Spearman s data)
• 适用条件 适用条件: • (1)数据是等级顺序 ) 等级顺序的测量数据,不是等 等级顺序 距或等比数据; • (2)非正态分布 非正态分布的等比或等距数据。 非正态分布 • 优点:比积差相关的适用范围广,对数据 总体不作要求; • 缺点:如果将能作积差相关的数据改作等 级相关,其精确度稍差。
• 2.积差相关的适用条件 • (1)两个变量都是由测量获得的等距或等 等距或 等距 比数据; • (2)两个变量都呈正态或接近 正态或 正态 接近正态分布; • (3)两个变量必须是直线 直线关系; 直线 • (4)数据必须是成对 成对数据, 数目 至少 对 数目至少 至少30对 成对 (简述使用积差相关系数的条件,首都师大 简述使用积差相关系数的条件,首都师大2003试题) 试题
S
2 X
+
S 2 S
2 Y X
− S S Y
2 X
− Y
例题P120
• 4.积差相关系数的合并 4.积差相关系数的合并
• 即为求几个样本的相关系数的平均相关系数。由于 相关系数不是等距数据须将其变成等距数据方可合 成。其方法是采用费舍Z-r转化法(见P469附表。 8)(例题P123)
• (1)将r转换成Z • (2)求各样本的Z分数之和 • (3)利用公式求平均Z分数
四、质量相关
• 在研究中,当一列变量按事物的属性 属性划分 属性 种类,而另一列变量为等比 等距 等比或等距 等比 等距的测量 数据时,求得的相关叫质量相关。 • 包括点二列相关、二列相关和多系列相关。
Biblioteka Baidu
1.点二列相关(point-biserial correlation) 点二列相关(point(point
相关文档
最新文档