第七章__相关分析剖析讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 2.取值大小:表示双变量相关的强度 │r│→1,则相关越密切 │r│→0,相关越不密切
• 3.正负号:表示双变量相关的方向 是正相关(+)还是负相关(-)
• 4.代表值:r=+1,表完全正相关 r=-1,表完全负相关 r=0,表无相关
注意:
• 一般情况下,通过相关系数r的值来判断双 变量相关是否密切时,要把样本量的大小 和相关系数取值大小综合起来考虑,经统 计检验后方能确定变量之间是否存在显著 相关
主要内容
• 第一节:相关的概念 • 第二节:积差相关分析 • 第三节:等级相关分析 • 第四节:偏相关分析 • 第五节:相关分析的SPSS过程
第一节 相关的概念
一、什么是相关
(一)事物之间的相互关系(有三种):
1.因果关系:一种现象是另一种现象的原因
2.共变关系:表面上有联系的两种事物其实
•
都和第三种现象有关
3.相关关系:两类现象在发展变化的方向和
•Fra Baidu bibliotek
大小方面存在一定联系,但并
•
不是前两种关系,比较复杂
• 一、什么是相关
• (二)相关的类别(三种) • 1.正相关:两列变量变动方向相同 • 2.负相关:两列变量变动方向相反 • 3.零相关:两列变量之间没有相关
关系存在
二、相关系数(coefficient of correlation)
7-1
第七章 相关分析
学习目标
• 理解各种相关系数的含义、性质、作用; • 掌握各种相关系数的计算方法; • 能够区分各种相关系数应用的前提; • 运用相关法解决各类实际问题。
第七章 相关关系
• 问题?
• 通过前面的学习,我们知道,给定 任何一列单变量连续数据,都可以用 平均数和标准差反映数据的总体特征。
变量的取值区间越大,观测值个数越多,相关 系数受抽样误差的影响越小,结果就越可靠,如 果数据较少,本不相关的两列变量,计算的结果 可能相关,如学生的身高与学习成绩。本书所举 例题,数据较少,仅为说明计算方法时较方便。
(4)相关系数在特定情况下使用才具有意义。 如高中生身高与体重的相关系数用在儿童身上 就没有意义。
图7-4(a) 曲线相关
当两变量间呈线性趋势,其相关散布图是椭 圆形,说明两变量之间是线性关系,称为直线相 关,如图7-4(b)。
图7-4(b) 直线相关
2、判断相关密切程度高低 相关散布图的形状和疏密,反映着相关程度 的高低。如图7-5(a),散布图的椭圆形状较狭 长,称为高度相关。
图7-5(a) 高度相关
• 两变量间不是线形关系时,不能用直线相 关计算r值
图7-2
表7-1 五名学生四种测验的分数
学生 A
1
15
2
14
3
13
4
12
5
11
测验分数
B
C
D
53
64
102
52
65
100
51
66
104
50
67
103
49
68
101
比较1
比较2
比较3
A
BA
CA
D
15
53 15
68 15
104
14
52 14
67 14
(5)通过实际观测值计算的相关系数,须经 过显著性检验确定其是否有意义。
表7-2 |r|的取值与相关程度
|r|的取值范围 0.00-0.19 0.20-0.39 0.40-0.69 0.70-0.89 0.90-1.00
|r|的意义 极低相关 低度相关 中度相关 高度相关 极高相关
*如何判断两个变量的相关性 (1)找出两个变量的正确相应数据。 (2)画出它们的散布图(散点图)。 (3)通过散布图判断它们的相关性。 (4)给出相关(r)的解答。 (5)对结果进行评价和检验。
103
13
51 13
66 13
102
12
50 12
65 12
101
11
49 11
64 11
100
三、散点图
• 在相关研究中,常用相关散点图表示两个变量之 间的关系;散点图通过点的散布形状和疏密程度 来显示两个变量的相关趋势和相关程度。
7-3
相关散布图的用途: 1、判断相关是否直线式。 当两变量之间呈曲线趋势,其相关散布 图呈弯月状,说明两变量之间是非线性关 系,如图7-4(a)。
图7-6(b) 负相关
零相关:散布点的变化无一定规律。如 图7-6(c)。
图7-6(c)零相关
附加说明:
(1)两变量间存在相关,仅意味着变量间有 关联,并不一定是因果关系。
(2)相关系数不是等距的测量单位。 r是一个比值,不是由相等单位度量而来,不 能进行加、减、乘、除运算。如 r1=0.25,r2=0.5,r3=0.75,不能认为r1=r3-r2 或r2=2r1。 (3)相关系数受变量取值区间大小及观测值 个数的影响较大。
• 然而在实际的心理和教育测量中, 往往会遇到两种事物,两种现象关系 的描述,此时我们又如何去统计处理 呢?
• 对于双变量数据相互之间的关系可以 用相关系数加以统计分析。
• 何谓双变量?
对于一个变量X的每一个观测值:X1, X 2,, X n 同时有另外的一个变量Y相对应:Y1 , Y2 , , Yn 所推断的是双变量的总体。
如果散布图的椭圆形状比较粗,称为低度相 关。如图7-5(b)。
图7-5b 低度相关
3、判断相关变化方向 正相关:散布点主要位于一、三象限。如图7-6 (a),即一个变量增加(或减少),另一个变量也增加 (或减少)。
图7-6(a) 正相关
负相关:若散布点主要位于二、四象限,如图 7-6(b),即一个变量增加(或减少),另一个变 量也减少(或增加)。
第二节 积差相关分析
一、积差相关的概念与适用资料 (一)概念 当两个变量都是正态、连续变量,而且二者之间呈
线形关系,表示这两个变量之间的相关为积差相 关 由英国统计学家皮尔逊在20世纪初提出,简称: Pearson相关系数(软件中常用此名称) 积差相关又称为积矩相关
离均差乘方之和除以N称做“矩”(moment),把X 的离均差和Y的离均差两者积的总和除以N,用 “积矩”表示。称为协方差covariance,X和Y有
• 相关系数是两列变量间相关程度的数字表 现形式。作为样本间相互关系程度的统计 特征数,常用r表示,作为总体参数,一般用 ρ表示, 是应用比较广泛的一个有代表性 的统计量。
• 相关系数是就线形关系而言的
相关系数的取值 1 r 1
• 内在涵义:
• 1.取值范围:位于-1.00至+1.00之间,是一个比率,常用 小数形式表示
• 3.正负号:表示双变量相关的方向 是正相关(+)还是负相关(-)
• 4.代表值:r=+1,表完全正相关 r=-1,表完全负相关 r=0,表无相关
注意:
• 一般情况下,通过相关系数r的值来判断双 变量相关是否密切时,要把样本量的大小 和相关系数取值大小综合起来考虑,经统 计检验后方能确定变量之间是否存在显著 相关
主要内容
• 第一节:相关的概念 • 第二节:积差相关分析 • 第三节:等级相关分析 • 第四节:偏相关分析 • 第五节:相关分析的SPSS过程
第一节 相关的概念
一、什么是相关
(一)事物之间的相互关系(有三种):
1.因果关系:一种现象是另一种现象的原因
2.共变关系:表面上有联系的两种事物其实
•
都和第三种现象有关
3.相关关系:两类现象在发展变化的方向和
•Fra Baidu bibliotek
大小方面存在一定联系,但并
•
不是前两种关系,比较复杂
• 一、什么是相关
• (二)相关的类别(三种) • 1.正相关:两列变量变动方向相同 • 2.负相关:两列变量变动方向相反 • 3.零相关:两列变量之间没有相关
关系存在
二、相关系数(coefficient of correlation)
7-1
第七章 相关分析
学习目标
• 理解各种相关系数的含义、性质、作用; • 掌握各种相关系数的计算方法; • 能够区分各种相关系数应用的前提; • 运用相关法解决各类实际问题。
第七章 相关关系
• 问题?
• 通过前面的学习,我们知道,给定 任何一列单变量连续数据,都可以用 平均数和标准差反映数据的总体特征。
变量的取值区间越大,观测值个数越多,相关 系数受抽样误差的影响越小,结果就越可靠,如 果数据较少,本不相关的两列变量,计算的结果 可能相关,如学生的身高与学习成绩。本书所举 例题,数据较少,仅为说明计算方法时较方便。
(4)相关系数在特定情况下使用才具有意义。 如高中生身高与体重的相关系数用在儿童身上 就没有意义。
图7-4(a) 曲线相关
当两变量间呈线性趋势,其相关散布图是椭 圆形,说明两变量之间是线性关系,称为直线相 关,如图7-4(b)。
图7-4(b) 直线相关
2、判断相关密切程度高低 相关散布图的形状和疏密,反映着相关程度 的高低。如图7-5(a),散布图的椭圆形状较狭 长,称为高度相关。
图7-5(a) 高度相关
• 两变量间不是线形关系时,不能用直线相 关计算r值
图7-2
表7-1 五名学生四种测验的分数
学生 A
1
15
2
14
3
13
4
12
5
11
测验分数
B
C
D
53
64
102
52
65
100
51
66
104
50
67
103
49
68
101
比较1
比较2
比较3
A
BA
CA
D
15
53 15
68 15
104
14
52 14
67 14
(5)通过实际观测值计算的相关系数,须经 过显著性检验确定其是否有意义。
表7-2 |r|的取值与相关程度
|r|的取值范围 0.00-0.19 0.20-0.39 0.40-0.69 0.70-0.89 0.90-1.00
|r|的意义 极低相关 低度相关 中度相关 高度相关 极高相关
*如何判断两个变量的相关性 (1)找出两个变量的正确相应数据。 (2)画出它们的散布图(散点图)。 (3)通过散布图判断它们的相关性。 (4)给出相关(r)的解答。 (5)对结果进行评价和检验。
103
13
51 13
66 13
102
12
50 12
65 12
101
11
49 11
64 11
100
三、散点图
• 在相关研究中,常用相关散点图表示两个变量之 间的关系;散点图通过点的散布形状和疏密程度 来显示两个变量的相关趋势和相关程度。
7-3
相关散布图的用途: 1、判断相关是否直线式。 当两变量之间呈曲线趋势,其相关散布 图呈弯月状,说明两变量之间是非线性关 系,如图7-4(a)。
图7-6(b) 负相关
零相关:散布点的变化无一定规律。如 图7-6(c)。
图7-6(c)零相关
附加说明:
(1)两变量间存在相关,仅意味着变量间有 关联,并不一定是因果关系。
(2)相关系数不是等距的测量单位。 r是一个比值,不是由相等单位度量而来,不 能进行加、减、乘、除运算。如 r1=0.25,r2=0.5,r3=0.75,不能认为r1=r3-r2 或r2=2r1。 (3)相关系数受变量取值区间大小及观测值 个数的影响较大。
• 然而在实际的心理和教育测量中, 往往会遇到两种事物,两种现象关系 的描述,此时我们又如何去统计处理 呢?
• 对于双变量数据相互之间的关系可以 用相关系数加以统计分析。
• 何谓双变量?
对于一个变量X的每一个观测值:X1, X 2,, X n 同时有另外的一个变量Y相对应:Y1 , Y2 , , Yn 所推断的是双变量的总体。
如果散布图的椭圆形状比较粗,称为低度相 关。如图7-5(b)。
图7-5b 低度相关
3、判断相关变化方向 正相关:散布点主要位于一、三象限。如图7-6 (a),即一个变量增加(或减少),另一个变量也增加 (或减少)。
图7-6(a) 正相关
负相关:若散布点主要位于二、四象限,如图 7-6(b),即一个变量增加(或减少),另一个变 量也减少(或增加)。
第二节 积差相关分析
一、积差相关的概念与适用资料 (一)概念 当两个变量都是正态、连续变量,而且二者之间呈
线形关系,表示这两个变量之间的相关为积差相 关 由英国统计学家皮尔逊在20世纪初提出,简称: Pearson相关系数(软件中常用此名称) 积差相关又称为积矩相关
离均差乘方之和除以N称做“矩”(moment),把X 的离均差和Y的离均差两者积的总和除以N,用 “积矩”表示。称为协方差covariance,X和Y有
• 相关系数是两列变量间相关程度的数字表 现形式。作为样本间相互关系程度的统计 特征数,常用r表示,作为总体参数,一般用 ρ表示, 是应用比较广泛的一个有代表性 的统计量。
• 相关系数是就线形关系而言的
相关系数的取值 1 r 1
• 内在涵义:
• 1.取值范围:位于-1.00至+1.00之间,是一个比率,常用 小数形式表示