教育统计学课件-5 相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
事物之间的相互关系
因果关系:一种现象是另一种现象的原因,而另一种现象是结果。
共变关系:表面上看来有联系的两种事物都与第三种现象有关。这
时两种事物之间的关系,便是共变关系。
相关关系:两类现象在发展变化的方向与大小方面存在一定的关系,
但不是前面两种关系。 不能确定这两类现象之间哪个是因,哪个是果;也有理由认为这两者 并不同时受第三因素的影响,即不存在共变关系。 具有相关关系的两种现象之间的关系是比较复杂的,甚至可能包含有 暂时的尝未认识的因果关系以及共变关系在内。
p, r [1,1] p, r 0 p, r 0 p, r 0 p, r 1 p, r 1
如何理解相关系数?
1. 相关系数的取值在-1.00和+1.00之间;
2. 相关系数的绝对值表示两个变量之间的相关强度,绝对 值越接近1表示相关越强,越接近0表示相关越弱;
3
4 5 6 7
80
75 70 70 70
81
78 74 73 75
X 71
rXY 0.966
Y 73.8
S X 12.2 SY 14.1
8
9 10
60
60 50
66
53 52
等级相关
何时使用等级相关?
1. 当测量得到的数据不是等距或等比数据,而是具有等 级顺序的测量数据, 2. 或者所得数据是等距或等比数据,但来自于非正态分 布的整体,
n 对偶数据个数
例题. (4分) 某个幼儿园老师认为小 幼儿 孩家长的焦虑程度与孩子的调皮程 1 度有关。为了验证自己的这一想法, 2 她调查了10名幼儿及其父母,评估 了幼儿的问题行为水平(X),并 3 让其父母互评焦虑程度并求平均值 4 (Y)。 5 6
X 4 7
Y 5 8
5
2 9 1 6
因果推论—定向性问题 大学生的学习成绩和班级活动 参与程度之间存在正相关
So what?
1.参与更多的班级活动,就可以学到更多的东西, 从而带来更好的学习成绩?
2.好的学习成绩使大学生对某些课程或主题感兴 趣,从而更加乐意参与班级活动? 3.可能存在第三变量同时影响学习成绩和班级活 动参与程度,结果使两者出现相关?
12/27/2018 6
相关的含义
事物之间存在关系,但又不能直接做因果关系解释时, 称事物间的联系为相关。 判断两个因素或变量之间是否有关系,定量地研究这些 关系,称为相关分析。
相关的类别
从变化的方向来看,相关的情况有以下三种:
① 正相关:两列变量的变化方向相同。 ② 负相关:两列变量的变化方向相反。 ③ 零相关:两列变量的变化方向无一定规律。
c
t t 2 1 12
c 差数值(几个相同等级出现时的等级平方和与没有相同等级 出现时的等级平方和之差) t 某一等级的相同数
3.有相同等级时计算等级相关的方法 当一列数据中有多个相同等级出现时,它们的差 数值为:
c
t t 1
2
12
c 差数值(几个相同等级出现时的等级平方和与没有相同等级 出现时的等级平方和之差) t 某一等级的相同数
1. 等级差数法(N < 30)
6 D rR 1 2 n n 1
2
D
RX RY 对偶等级之差
n
对偶数据个数
例题. (5分) 某个心理学教授认为观 学生 看电视节目的暴力程度与小学生的 1 暴力行为水平有关。为了验证自己 2 的这一想法,她调查了10名小学生, 评估了他们观看电视节目的暴力程 3 度(X),并让其老师评估这些学 4 生的暴力行为水平(Y)。 5 6
肯德尔W系数(肯德尔和谐系数)
适用于两列以上的变量,是表示多列等级变量相 关程度的一种方法,其符号为: W
另一种情况是一个评价者先后K次评价N件事物或N件作 品,也是采用等级评定的方法,这样也可得到K列从1至N 的等级变量资料。这类K列等级变量资料综合起来求相关, 也用肯德尔W系数。
这两种情况中的任何一种出现了,就不能用积差相关, 而应该计算两列(斯皮尔曼等级相关)或多列数据(肯 德尔和谐系数)的等级相关。
斯皮尔曼(spearman)等级相关
适用于只有两列变量,具有线性关系的资料。用 rR 表示。其计算公式有下列三种情况: 1. 等级差数法(N < 30) 2. 等级序数法 3. 有相同等级时计算等级相关的方法
n
离均差
积差相关的计算方法
3. 标准分公式
rXY
x y 1 nS X SY n S X SY
xy
1 Z X ZY n
积差相关的计算方法
4. 计算公式
rXY
n xi 2 ( xi )2 . n yi 2 ( yi )2
Different kind of research
Correlational Research
即相关研究,这种研究所要回答的问题一般是这种: 学习动机和学习成绩有关吗? 智商与幸福感有关吗? 考试焦虑与高考成绩有关吗? 年龄与握力有关吗?
Different kind of research
Correlational Research
总体 随机抽样 独立样本;自变量;因变量
统计分析:对从同一组被试中得出的两个变量求相关; 统计结论:两个变量之间是否存在相关,但无法确定两者之间是
否存在因果关系;
心理与教育统计学
第四章 相关分析
本章要点:
1. 相关与相关系数; 2. 常用的几种相关系数计算方法;
肯德尔W系数(肯德尔和谐系数)
适用于两列以上的变量,是表示多列等级变量相 关程度的一种方法,其符号为: W
其计算公式为:
SSRi W 2 3 1 K n n 12
SS Ri Ri R
SS Ri
K 等级变量的列数或评价者数目; n 被评价对象数目;
2 2
2
Ri Ri 2 Ri Ri N N
积差相关的计算方法
1. 基本公式
rXY
( x X )( y Y )
i i
n
i 1 n
2 2 ( x i X ) ( y i Y ) i 1
2. 如果有 x xi X
y yi Y
,那么基本公式可变成:
rXY
xy
nS X SY
xy
3. 相关系数的正负号表示相关的方向,相关系数为正的表 示正相关,相关系数为负的表示负相关; 4. 相关系数可以比较大小,但不能进行加减乘除运算。
查尔斯· 爱德华· 斯皮尔曼 (Charles Edward Spearman) 英国理论和实验心理学家。 作为实验心理学的先驱,斯 皮尔曼对心理统计的发展做 了大量的研究,他对相关系 数概念进行了延伸,导出了 等级相关的计算方法。他还 创立因素分析的方法,这是 他学术上最伟大的成就。
三
四 五
1 1 2 3 4 5
2 1 2 3 4 5
3 1 2 3 4 5
4 1 2 3 4 5
5 1 2 3 4 5
6 1 2 3 4 5
K
2K
3K
4K
5K
肯德尔W系数(肯德尔和谐系数)
当K个评价者对n件事物进行等级评价是,如果他们的意 见完全一致,则n个Ri分别为:K, 2K, 3K, …, nK;
4
3 10 2 7
R
X
RY 377
7
8
9 10
3
8 10
1
6 9
rR 0.903
Baidu Nhomakorabea
3.有相同等级时计算等级相关的方法
在使用等级序数法时要求两列等级变量数据的方差相等, 这样就必须有两列数据的等级和相等且等级平方和相等。 如果任意一个数据列中有相同等级时,则平方和相等的 条件就不能满足。某列数据中的等级平方和会随着相同 等级数目的逐渐增多而有规律地减少,其减少的规律为:
12/27/2018
12
散点图
在直角坐标系中,以 X、Y 二列变量中的一列变量(如X 变量)为横坐标,以另一列变量(如Y 变量)为纵坐标, 把每对数据Xi、Yi当做同一个平面上的个点(Xi、Yi), 一一描绘在直角坐标系中,产生的图形就称为散点图。 散点图通过点的散布形状和疏密程度来显示两个变量的相 关趋势和相关程度,能够对原始数据间的关系做出直观而 有效的预测和解释。 不同形状的散点图显示了两个变量间不同程度的相关关系。 如果所有散点分布呈椭圆状,则说明二变量之间呈线性关 系。
X 4 7
Y 5 8
5
2 9 1 6
4
3 10 2 7
rR 0.903
D
2
16
7
8
9 10
3
8 10
1
6 9
2. 等级序数法
3 4 RX RY rR n 1 n 1 n n 1
RX X 变量的等级 RY Y 变量的等级
包括斯皮尔曼等级相关和肯德尔和谐系数。
3. 质量相关
包括点双列相关和双列相关
积差相关的概念和适用条件
当两列变量都是正态连续变量,而且两者之间呈 线性关系,表示这两列变量之间的相关称为积差 相关。使用积差相关必须满足下列条件:
1. 要求成对的数据,即若干个体中每个个体都有两种不 同的观测值。 2. 计算相关的成对的数据的数目不宜少于30对。 3. 两列变量各自总体的分布都是正态分布,至少两个变 量服从的分布是接近正态的单峰分布。 4. 两个相关的变量是连续变量,也即两列数据都是测量 数据。 5. 两列变量之间的关系应是直线性的。
X 4 7.5
Y 5 8
5
2 7.5 1 7.5
5
2 10 2 7
c D
X
Y 2
4 17
6 7
8
9 10
3
7.5 10
2
5 9
rR 0.891
肯德尔W系数(肯德尔和谐系数)
适用于两列以上的变量,是表示多列等级变量相 关程度的一种方法,其符号为: W
计算肯德尔和谐系数时,原始数据资料的获得一般采用 等级评定的方法,即让K个评价者对N件事物或N件作品 进行等级评定; 每个评价者都能对N件事物(或作品)根据好坏、优劣、 喜好、大小、高低等排出一个等级顺序。最小的等级序 数为1,最大的为N,这样,K个评价者便可得到K列从1 至N的等级变量资料。
相关系数
是两列变量间相关程度的数字表现形式,或者说是用来表 示相关关系强度的指标。作为样本间相互关系程度的统计 特征数,常用r表示,作为总体参数,一般用p表示,并且 是指线性相关而言。 相关系数的取值介于-1.00至+1.00之间,常用小数形式表 示。它只是一个比率,不代表相关的百分数,更不是相关 量的相等单位的度量。
3.有相同等级时计算等级相关的方法 于是,有相同等级时,等级相关的计算公式为:
rRC x2 y2 D2 2 x2 y2
3 n n 2 x cX 12
3 n n 2 y cY 12
例题. (8分) 某个幼儿园老师认为小 幼儿 孩家长的焦虑程度与孩子的调皮程 1 度有关。为了验证自己的这一想法, 2 她调查了10名幼儿及其父母,评估 了幼儿的问题行为水平(X),并 3 让其父母互评焦虑程度并求平均值 4 (Y)。 5 c 5
Ri 的离差平方和;
Ri
每一件被评价事物的K个等级之和;
肯德尔W系数(肯德尔和谐系数)
当K个评价者对n件事物进行等级评价是,如果他们的意 见完全一致,则n个Ri分别为:K, 2K, 3K, …, nK;
n=5
Kn(n 1) R n 2 K (n 1) 2
作文 一 二
评分者k=6
n xi yi ( xi )( yi )
例题. (10分) 某个统计学教授认为 数学知识水平对学生的统计学课程 学习至关重要。为了验证自己的这 一想法,她在统计课程开始前给学 生实施了数学标准化测试(X)。 学期结束后又对学生施测了统计学 期末测试(Y)。
学生 1 2
X 90 85
Y 94 92
如果椭圆长轴的倾斜方向左低右高(以轴为基准),则为正相关,左高右 低则为负相关;如果散点图呈现圆形,就为零相关或弱相关。
正相关
负相关
而害羞和测验焦虑可能有一 定关系,也可能并没有关系。
12/27/2018
16
在教育与心理实践中,常用的相关分析方法有:
1. 积差相关 2. 等级相关