相关性分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章相关分析
【教学目的与要求】
通过本章的学习,使学生了解相关关系和相关分析基本概念,掌握相关分析理论。学生必须深刻领会相关关系的概念,弄清相关分析和回归分析之间的关系,掌握相关分析和回归分析的统计分析方法。
【重点和难点】
相关分析的概念
相关系数的含义与计算
回归方程的建立
回归系数的含义
【课堂讲授内容】
前述分析方法如综合分析法、动态分析法、因素分析法、抽样推断法均是对同一现象的数量特征进行描述和分析,而相关分析与之最大区别为相关分析侧重于两个现象之间的数量联系的研究,当然也不排除时间数列的自相关分析。相关分析有广义与狭义之分,广义的相关分析还包括回归分析,本章的相关分析是广义的概念。
第一节相关分析概述
一、变量关系的类型
在大量变量关系中,存在着两种不同的类型:函数关系和相关关系。
函数关系是指变量之间存在的一种完全确定的一一对应的关系,它是一种严格的确定性的关系。
相关关系是指两个变量或者若干变量之间存在着一种不完全确定的关系,它是一种非严格的确定性的关系。
两者之间的联系:
①由于人类的认知水平的限制,有些函数关系可能目前表现为相关关系。
②对具有相关关系的变量进行量上的测定需要借助于函数关系。
二、相关关系的种类
按照相关关系涉及的因素的多少,可分为单相关
复相关
按照相关关系的方向,可分为正相关
负相关
按照相关的表现形式,可分为直线相关
曲线相关
按照相关的程度,可以分为
完全相关
完全不相关 不完全相关
三、相关分析的内容
对于相关关系的分析我们可以借助于若干分析指标(如相关系数或相关指数)对变量之间的密切程度进行测定,这种方法通常被称作相关分析 (狭义概念),广义的相关分析还包括回归分析。对于存在的相关关系的变量,运用相应的函数关系来根据给定的自变量,来估计因变量的值 ,这种统计分析方法通常称为回归分析。相关分析和回归分析都是对现象的之间相关关系的分析。广义相关分析包括的内容有:
确定变量之间是否存在相关关系及其表现形式
狭义相关分析
确定相关关系的密切程度
确定相关关系的数学表达式
回归分析
确定因变量估计值误差的程度
第二节 一元线性相关分析
一、 相关关系密切程度的测定
在判断相关关系密切程度之前,首先确定现象之间有无相关关系。确定方法有:一是根据自己的理论知识和实践经验综合分析判断;二是用相关图表进一步确定现象之间相关的方向和形式。在此基础上通过计算相关系数或相关指数来测定相关关系密切的程度。相关系数是用来说明直线相关的密切程度;相关指数则是用来判断曲线相关的密切程度。这是主要介绍相关系数的计算。
相关系数是用来分析判断直线相关的方向和程度的一种统计分析指标,其计算方法中最简单是最常用的为积差法,是用两个变量的协方差与两变量的标准差的乘积之比来计算的,计算公式如下:
σ
σσy
x
xy r 2
=
∑∑--∑--=
)
)(2
2
))((y y x x y y x x (1)
)()(2
2
2
2
y y x x y x xy -
∙-∙-=
(2)
2
2
2
2
)
()
(∑∑∑∑∑∑∑---
=
y y
n x x
n y x xy n (3)
上述三个公式均可以使用,由于(3)式是通常原始资料计算,所以较为准确,也较为常用。相关系数的取值范围是:-1≤r ≤+1 正的表示正相关,负的表示负相关。
利用相关系数判断相关关系的密切程度,通常认为:
相关系数的值
直线相关程度 r
=0 完全不相关 0 <
r
≤0.3
微弱相关
0.3 <
r ≤0.5 低度相关
0.5 <r ≤0.8 显著相关
0.8 <r
≤1 高度相关
r
=1 完全相关
二、一元线性回归分析
回归分析是对具有相关关系的两个变量之间的数量变化的一般关系确定一个合适的数学表达式,以便进行估计和预测的统计方法。用一条回归直线来表明两个相关变量之间一般数学关系的方程式,成为简单直线回归方程。这种分析方法称为一元线性回归分析。
(一) 一元线性回归分析的特点
1. 在两个变量之间,必须根据研究目的具体确定哪个是自变量(x ),哪个是因变量(y )。
2. 没有明显因果关系的两个变量(x)与(y)可以求得两个方程——y 依x 的回归方程和x 依y 的回归方程.两个方程式相互独立的,不能相互替换。
3. 回归方程的主要作用在于给出自变量的数值来估计因变量的数值。一个回归方程只能做一种推算。
4.计算相关系数时, 要求相关的两个变量都是随机的变量;但是进行回归分析时,尽管两个变量也都是随机变量,但要求自变量是给定的,因变量是随机的。
(二) 一元线性回归模型与参数估计
1.直线方程的模型为:
bx
a y
c
+=
式中,y c 表示因变量的估计理论值;x 为自变量的实际值; a ,b 为待定参数。其几何意义是:a 是直线方程的截距,b 是斜率。其经济意义是:a 当x 等于0时, y 的估计值;b 是当x 每增加一个单位时,y 平均增加或减少的量,b 也叫回归系数。(与相关系数的关系)
求a ,b 两个参数的计算公式为:
2
2
)
(∑∑∑∑∑--=x x n y x xy n b
x b y a -=
2.一元线性回归方程的估计标准误差
估计标准误差是用来说明回归方程代表性大小的统计分析指标,是指示实际观察值和理论值的平均误差。其计算公式为:
2
)
(2
--=
∑n y y S c
yx
然而,估计标准误差根号内的分母部分不是n ,而是n-2,其表示估计回归线失去两个自由度,即样本数据的个数减去自变量的个数(m=1),再减1。在实际应用中,当n 很大时,一般是n ≥30时,计算估计标准误差时就用n 来代替n-2,则计算公式就成为:
n
c y y S yx ∑-=
)
(2
简便公式为:
n
xy
b y a y
S yx
∑∑∑--=
2
第三节 多元线性相关分析*
一、多元线性相关的涵义
在统计中,研究一个变量与多个变量之间相关关系的理论和方法,称为多元相关分析;研究一个因变量和多各自变量的回归分析就是多元回归分析或复回归分析。多元回归可分为两个主要方面:一是线性回归;二是非线性回归。