线性相关与回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十章 相关与回归分析

第一节 简单线性相关分析

一、简单线性相关(直线相关)的概念: 二、相关关系的种类:

(一)按相关程度划分可分为完全相关、不完全相关、和不相关 (二)按相关方向划分可分为正相关和负相关

(三)按相关的形式划分可分为线形相关和非线形相关 (四)按变量多少划分可分为单相关、复相关和偏相关

三、相关分析

相关分析一般可以借助相关系数与相关图来进行相关分析。 (一)相关系数

1.简单相关系数的含义

反映两个变量之间线性相关密切程度和相关方向的统计测定,它是其他相关系数形成的基础。

2.简单相关系数的计算

∑∑∑-⋅---=

2

2

)

()())((y y x x y y x x r (6.17) 或化简为:()()

2

2

2

2

∑∑∑∑∑∑∑-⋅--=

y y n x x n y

x xy n r (6.18)

3.相关系数的性质

(1)相关系数的取值范围在-1和+1之间,即:–1≤r ≤ 1。 (2)计算结果,若r 为正,则表明两变量为正相关;若r 为负,

则表明两变量为负相关。

(3)相关系数r 的数值越接近于1(–1或+1),表示相关系数越强;越接近于0,表示相关系数越弱。如果r=1或–1,则表示两个现象完全直线性相关。如果r=0,则表示两个现象完全不相关(不是直线相关)。

(4)判断两变量线性相关密切程度的具体标准为: 3.00<≤r ,称为微弱相关;5.03.0<≤r ,称为低度相关;

8.05.0<≤r ,称为显著相关;18.0<≤r 称为高度相关。

(二)相关图

相关图又称散点图。它是以直角坐标系的横轴代表标量X ,纵轴代表标量Y ,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的图形。

四.相关系数的假设检验

1.目的:相关系数检验的目的是判断两变量的总体是否有相关关系。检验样本相关系数r 是否总体相关系数为0的总体,如概率p <0.05,认为两变量存在相关关系。

2.方法:有t 检验和查表法。 (1) t 检验法: 统计量计算为:

2

12

--=

n r

r t r ; v = n-2

(2)查表法:是直接查相关系数界值表得到相应的概率p 。统计量r 绝对值越大,p 越小。

第二节 简单线性回归分析

一、回归分析的概念与种类

二、一元线性回归

1.一元线性回归模型

εββ++=x y 10

2.一元线性回归方程

3.回归模型的前提条件

1)线性:是指反应变量Y 的总体平均值与自变量X 呈线性关系; 2)独立性:任意两个观察值之间相互独立;

3)正态性:是指对于给定的X 值,其对应的Y 值的总体和线性模型的误差项ε均服从正态分布;(ε均服从均数为0的正态分布)

4)等方差性:无论X 如何取值,Y 都有相同的方差。

4.回归方程的检验

回归方程的显著性检验

检验自变量和因变量之间的线性关系是否显著。具体方法是将回归离差平方和(SSR )同剩余离差平方和(SSE )加以比较,应用F 检验来分析二者之间的差别是否显著,如果是显著的,两个变量之间存在线性关系;如果不显著,两个变量之间不存在线性关系。 ·SS 总=SS 回+SS 剩

SS 回为回归平方和,它反映在Y 的总变异中,由于X 与Y 的直线关系,而使得Y 变异减小的部分,也即在总平方和中可以用X 解释的部分。SS 回越大,说明回归效果越好。

SS 剩为剩余平方和,它反映X 对Y 的线性影响之外的因素,对Y 的总变异的影响,也即在总平方和中无法用X 解释的部分。SS 剩越小,说明直线回归的估计误差越小。

回归系数的显著性检验

1

b S b

t =

·对于一元线性回归,回归方程的显著性检验与回归系数的显著性检验是等价的。可通过方差分析或t检验进行。

三、相关与回归分析应用注意事项

2.直线相关与回归的区别与联系

(1)区别:

①相关分析要求两个变量均服从正态分布,而回归分析则有两种不同的模型。Ⅰ型回归:定x后对y进行测量,y须服从正态分布;Ⅱ型回归:x,y均须服从正态分布,如体重依身高的变动关系。

②对于同一资料,只能计算一个相关系数,而Ⅱ型回归可以计算由x 推y和由y推x的两个回归方程,但两者不是反函数的关系。

③回归反映两变量间的依存关系,相关反映两变量间的相互关系。有相关联系不一定是因果联系。

(2)联系:

①同一资料r与b符号相同。

②同一资料r与b的假设检验结果是等价的。

③ r与b可以互相换算。

④相关是相互关系,双方向,-1≤r≤+1,无单位,有相关不一定有回归;回归是依存关系,单方向, 无限, 有单位,有回归一定有相关。

第三节 秩相关

秩相关又称等级相关,是一种用等级数据进行直线相关分析的非参数统计方法,适用于双变量不服从正态分布的资料;总体分布型未知;等级资料或无确切数值资料。

秩相关用等级相关系数r s 表示密切程度及方向。其取值范围为-1≤r ≤+1;r >0为正相关,r <0为负相关;r=0,表示无线性相关关系,为零相关。

r s = 1-()

1

622-∑n n d

第十一章 多重线性回归

一.基本概念:

多重线性回归的概念:

1.多重线性回归是研究多个自变量与一个因变量之间线性依存关系的方法。

2.多重线性相关(复相关)是研究多个变量与一个变量线性相关关系的方法。

3.多元线性回归是研究多个自变量与多个因变量线性依存关系的方法。

相关文档
最新文档