第五章相关系数

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因果关系 共变关系 相关关系 从数量上考虑事物间的联系 函数关系 相关关系
一、相关关系
两个变量间不确定、不精确的变化关系, 为相关关系 举例两列数据看似有一定关系,但不能确 定,只是模糊的
二、相关的分类
1、相关方向 (1)正相关:变量之间变动方向相同, 同增同减; ↑↑或者↓↓如: (2)负相关:变量之间变动方向相反, 一个增加,另一个则小;↑↓或者↓↑如: (3)零相关:变量之间的变动完全没 有规律可循。如:
6 3 0 -10 -22 -21 -8 -52
108 63
342 46
例题:10名考生一次测验的卷面总分和一道问答题的得 分,试求该问答题的区分度(该问答题满分10分,因此 得6分和6分以上则为该题通过) 考生
注意:①相关系数仅仅是个比率值,不是 由相等单位度量而来(即不等距),也不 是百分比。因此不能直接作加、减、乘、 除运算。如: ②相关系数并不能揭示两者之间的内在 本质联系,只能揭示两个变量之间的变化方 向和密切程度。
第二节 积差相关
一、什么是积差相关? 是计算两个变量线性相关的一种方法, 由英国统计学家皮尔逊提出,因此也称为 皮尔逊(Pearson)相关、积距相关 。
视Y 179 162 153 189 181 220 210 182 178 170
RX 7 2 5 8 1 9 10 6 4 3
RY 5 2 1 8 6 10 9 7 4 3

步骤;
(1)判断是何种资料;
(2)赋予等级 ①两个变量方向要一致 ②如果有相同的等级分数用他们所占等级位置的平均数作 为他们的等级 (3)计算每列等级数之差,并求差的平方和或者计算两 列等级的乘积之和;

55
55
48
361
例2[两列变量都是等级数据]两位评委按9个指标(比如:教材熟 悉程度、概念的准确性、对学生的启发、学生兴趣程度、板书 等等)对同一堂课进行评分,得分如下。 问两位评委对这堂课 的评价的一致程度如何?(-0.317) 教师甲 8.5 8.8 8.7 8.6 8.3 8.2 7.0 7.2 8.0 教师乙 9.0 8.4 8.7 8.6 8.9 9.4 8.5 8.8 9.2
第一种情况举例 4位教师对6个学生作文竞赛名次排列
学生 n=6 1 2 3 4 5 6 评定者K=4
1 3 4 2 6 1 5
2 4 3 1 5 2 6
3 2 1 3 6 4 5
4 1 3 4 5 2 6
R
10 11 10 源自文库2 9 22
总和
84
第二种情况举例 同一位教师对5份研究生入学政治试卷论述题先 后3次等级评定的结果如下表,问这位老师的前 后几次评定是否具有一致性? 学生 n=5 先后评定次数K=3 1 2 3
2、密切程度 (1)完全相关:同增同减或一增一减的幅 度完全一致; (2)不完全相关:同增同减或一增一减的 幅度不完全一致; (3)零相关:变化的方向与大小杂乱无章。
3、变量个数 (1)单相关:两个变量之间的相关(主要 介绍单相关) (2)复相关:多个变量之间的相关。 4、表现形态 (1)线性相关:变量间直线型关系; (2)非线性相关:变量间呈非直线型关系。
2、计算公式
P
二分变量中某一类别所占的比例
q 二分变量中另一类别所占的比例
St 指连续变量的标准差,
测量的连续变量中与p对应的那部分数据的平均值

测量的连续变量中与p对应的那部分数据的平均值
某一测验中10名考生的卷面总分和一道选 择题的得分,试求该选择题的区分度。
考生 A B C D E F 1 1 0 0 G 1 H 0 I 0 J 1
4、有相同等级时W的计算—要求在开卷 的情况下熟练计算
n为每个评价者下有相同等级时,该等级重 复的次数,如果有多个重复等级则有多个n。 参见教材132页例题 注意:观察有无相同等级主要看一个评价 者k对N件被评事物是否有相同等级?
(Kendall)W系数又称和谐系数在心理测量 学中,经常用于求评分者的信度。
二、积差相关的使用条件:** ①两个变量都是由测量获得的连续性数据, 即等距或等比数据。 ②两个变量的总体都呈正态分布,或接近 正态分布,至少是单峰对称分布,当然样 本并不一定要正态。 ③必须是成对的数据,而且每对数据之间 是相互独立的,即各自互不影响,本条件 是难以检验的。 ④两个变量之间呈线性关系。一般用描绘 散点图的方式来观察,最好是先各自转化 为Z分数,单位会统一些。
(4)代公式
2、计算公式 (1)无相同等级时的公式
D:两列变量每对数据等级之差(不是原始数 据之差),N为数据对数。
(2)有相同等级的公式(要求在开卷情况下会计算)
R1 1 2 3 4 1 4 9 16
R2 1 2.5 2.5 4 1 6.25 6.25 16
R3 2 2 2 4 4 4 4 16
计算积差相关的公式
1、定义公式—要求牢固掌握 2、原始数据公式—开卷的情况下
能轻松的计算
3、其他公式—不要求掌握 4、SPSS—按照操作得出结果
四、相关系数的合并 要将来自同一总体的几个样本的相关系数合并 得到一个整体的相关系数 ; 在用相关系数估计测验信度和效度时,要将几 个信度或效度综合成一个总信度或总效度时。 ①ri->Zi,即先将各样本的相关系数r转化为 Fisher Z分数(查附表8); ②求平均的Z分数: ③Z->R,即用附表8再将平均的Z分数转化为 平均的相关系数。
1 2 3 5 5 5 7 8 9 10
2 1 3 5.5 7.5 4 7.5 5.5 10 9
-1 1 0 -0.5 -2.5 1 -0.5 2.5 -1 1
1 1 0 0.25 6.25 1 0.25 6.25 1 1

18
二、肯德尔等级相关
(Kendall)W系数又称和谐系数,是表示多列等级变量 相关程度的一种方法。 1、适用情况 (1)K个评价者对N件事物进行等级评定 ,得到K列 从1到N的等级变量资料 (2)1个评价者先后K次评定N件事物,得到K列从1 到N的等级变量资料
第四章相关系数
本章内容: 第一节 相关的基本概念
第二节 积差相关
第三节 等级相关 第四节 质与量的相关
第五节 品质相关
本章重点: 相关的种类及解释相关系数时应注意的问题;各种相关系 数的应用范围、计算方法及在心理领域中的应用
第一节 相关的基本概念
从性质角度考虑事物间的联系
什么是二分变量?
即按事物的某一性质只能分为二类相互独立的变量
二分变量分为两种:真正的二分变量和人为的二分变量 什么是真正的二分变量和人为的二分变量 一、点二列相关 1、适用条件:
当两个变量其中一个是正态连续性变量,另一个是真正的
二分变量,(如男与女,已婚与未婚,生与死等) 有时一个变量并非真正的二分变量,而是双峰分布的变量, 也可用点二列相关 多用于考察测验中是非题目与总分的一致性
R4 2.5 2.5 2.5 2.5 6.25 6.25 6.25 6.25
R5 1.5 1.5 3 4 2.25 2.25 9 16

30
29.5
28
25
29.5
0.5
2
5
0.5
例1、[两列变量都是连续性数据的]现有10人的视听两种感觉道 的反应时(毫秒),问视听反应是否具有一直性?(r0.71) 被试 1 2 3 4 5 6 7 8 9 10 听X 172 140 152 187 139 195 212 164 149 146 视Y 179 162 153 189 181 220 210 182 178 170 RX 7 2 5 8 1 9 10 6 4 3 RY 5 2 1 8 6 10 9 7 4 3 RX -RY 2 0 4 0 -5 -1 1 -1 0 0 D2 4 0 16 0 25 1 1 1 0 0 RXRY 35 4 5 64 6 90 90 42 16 9
等级甲
等级乙 D
D2

例3[其中一个变量是等级的]10名高三学生学习的潜在能力(简称 学能)与自学能力关系如何?(自能越强等级数越小) 学生 学能 自能 学能等级 自能等级 D D2
1 2 3 4 5 6 7 8 9 10
90 84 76 71 71 71 69 68 66 64
3 2 5 7 8 6 8 7 10 9
1 2 3 4 5
3 1 2 2 2
5 2 1 3 4
3 2 1 2 3
(1)若K个评价者完全一致,每一被评事物得到 的等级之和的变异量,S2最大,相关极高 (2)若K个评价者不完全一致,每一被评事物得 到的等级之和的变异量,S2较小,相关不高 (3)若K个评价者完全不一致,每一被评事物得 到的等级之和的变异量,S2最小 3、计算公式
的学科分数划分为及格与不及格,录取与未录取,健康状 况分为好与坏等等) 多用于测验的中问答题项目区分度指标的确定
思考: 相关的方向?
2、计算公式
St与
是连续变量的标准差与平均数
y标准正态曲线中P与q交界点的Y轴高度(查表得出,代表 从左到右的概率值); P大于0.5,如0.6,查0.6-0.5=0.1概率对应的纵高
选择题得分 1 1
卷面总分
75 57 73 65 67 56 63 61 65 67
N=10,St=6.12,p=0.6,q=0.4, Xp的平均数=66.67,Xq的平均数 =62.25,rpb=0.34
二、二列相关
1、适用条件:
当两个变量都是正态连续性变量,其中一个变量被人为
的划分为二分变量(如按一定标准将属于正态连续变量
由此可见,肯德尔和谐系数求法的基本思想和积 差相关、斯皮尔曼等级相关的基本思想不同,它 的值有如下特点: (1)取值范围在0~1之间; (2)W只能得出密切程度,为正值(因为是方 差的比值),方向应根据实际资料分析; (3)肯德尔和谐系数不是一个标准的相关系数 注意区分什么是K,什么是N? 见课后习题第11题
是否是线性关系可以通过变量间的散点图
三、相关系数
用来描述两列变量之间变化方向与密切程 度的数字特征量称为相关关系。样本相关 系数用r表示,总体相关系数用ρ表示。
对相关系数的理解
r的取值一般介于-1~1之间,即0≤︳r ︳ ≤1 ,或者-1≤ r≤ 1 ①“+”和“—”只表示变化方向,不表示大小。 ②r的绝对值的大小表示两个变量之间密切 程度或者强度
(Kendall)U一致性系数作为自学内容
第四节 质量相关
质与量相关是指一列变量为等比或等距的测量数据,
另一列变量是按性质划分的类别,欲求这两者之间的直线
相关。 量的变量:如智商、学科分数、身高、体重等 质的变量:男与女,优与劣,及格与不及格等 本节要求掌握每个相关所适用的条件,公式不要求死 记硬背,只要能在开卷的情况下熟练地用于计算即可。
P小于0.5,如0.3,查0.5-0.3=0.2概率对应的纵高
二列相关的计算
得分分组 ft 90~ 80~ 70~ 60~ 50~ 40~ 30~ 20~ 10~ 合计 2 5 16 19 23 18 15 8 2 某一题目 fp fq 2 5 13 3 16 3 14 9 8 10 4 11 1 7 2 45 d 4 3 2 1 0 -1 -2 -3 -4 ft d 8 15 32 19 0 -18 -30 -24 -8 -6 ftd2 fpd fqd 32 45 64 19 0 18 60 72 32 8 15 26 16 0 -8 -8 -3
第三节 等级相关
一、斯皮尔曼等级相关

使用条件

(1)两个变量以等级次序排列(包括一个变量是
等级,而另一个变量是连续的)
(2)两个变量虽然是连续性数据,但其总体不是
正态分布(非参数的相关方法)
(3)样本容量不一定大于30
被试 1 2 3 4 5 6 7 8 9 10
听X 172 140 152 187 139 195 212 164 149 146
相关文档
最新文档