第七章相关与回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

有十分显著的线性关系
第 3. 若IrI小于表上=5%相应的值,称变量x与y之间
一 节
没有明显的线性关系
相 4. 根据前例的r=0.9987>=5%(n-2)=0.553,表明人均
关 消费金额与人均国民收入之间有十分显著的线性
基 本
相关关系


第二节 简单线性回归分析
一元线性回归模型 参数的最小二乘估计 回归方程的显著性检验 预测及应用
第 七 章 相 关 与 1. 回 归 分 析
第 2. 二 节
简 单 3. 线 性 回 归 分 析
回归分析与相关分析的区别
相关分析中,变量 x 变量 y 处于平等的地位;回 归分析中,变量 y 称为因变量,处在被解释的地 位,x 称为自变量,用于预测因变量的变化 相关分析中所涉及的变量 x 和 y 都是随机变量; 回归分析中,因变量 y 是随机变量,自变量 x 可 以是随机变量,也可以是非随机的确定变量 相关分析主要是描述两个变量之间线性关系的密 切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制
第 七 章 相 关 与 回 1. 归 分 析 2.
第 二 节
简 单
3.
线





什么是回归分析?
(内容)
从一组样本数据出发,确定变量之间的数学 关系式
对这些关系式的可信程度进行各种统计检验, 并从影响某一特定变量的诸多变量中找出哪 些变量的影响显著,哪些不显著
利用所求的关系式,根据一个或几个变量的 取值来预测或控制另一个特定变量的取值, 并给出这种预测或控制的精确程度

关 1. 检验两个变量之间是否存在线性相关关系
与 回

2. 等价于对回归系数 b1的检验
归 分
3. 采用 t 检验
析 4. 检验的步骤为
第 一
提出假设:H0: ;H1: 0

计算检验的统计量:t r n 2 ~ t(n 2)

1 r2

确定显著性水平,并作出决策
基 本
若t>t,拒绝H0

关 基 本
由于t=64.9809>t(13-2)=2.201,拒绝H0,人均消费金
额与人均国民收入之间的相关关系显著


第 七
相关系数的显著性检验

(相关系数检验表的使用)


与 回
1.

若IrI大于表上的=5%相应的值,小于表上=
1%相应的值,称变量x与y之间有显著的线性关系
分 析 2.
若IrI大于表上=1%相应的值,称变量x与y之间

r =-1 为完全负正相关
析 3. r = 0 不存在线性相关关系
第 一
4. -1 r < 0
为负相关
节 5. 0 < r 1 为正相关

关 基
|r|越趋于1表示关系越密切;

|r|越趋于0表示关系越不密切


第 七
相关关系的测度
章 相
(相关系数取值及其意义)



归 完全负相关
无线性相关
完全正相关
归 分 2.
对两个变量之间线性相关程度的度量称为简
析 单相关系数
第 3. 一 节 相 4. 关 基 本 概 念
若相关系数是根据总体全部数据计算的,称 为总体相关系数,记为
若是根据样本数据计算的,则称为样本相关 系数,记为 r

七 章
相关关系的测度

(相关系数)

与 样本相关系数的计算公式:


分 析
回 归
值,也表示 x 每变动一个单位时, y 的平均变动值


第 七 章


与 回 归 分 析
参数 b0 和 b1 的最小二
乘估计



简 单 线 性 回 归 分 析

七 章
最小二乘法

(概念要点)

与 回 归 分
1.
使因变量的观察值与估计值之间的离差平方和 达到最小来求得 bˆ0 和 bˆ1 的方法。即



回归模型的类型



回 归 分
一个自变量
回归模型
两个及两个以上自变量


一元回归
多元回归


简 单
线性
线
回归





非线性 回归
线性 回归
非线性 回归
第 七 章

关 与 回
回归模型与回归方

分 析

第 二 节
简 单 线 性 回 归 分 析



回归模型

关 与
1. 回答“变量之间是什么样的关系?”

若t<t,接受H0



相关系数的显著性检验(实例)

相 关
1. 对前例计算的相关系数进行显著性检(0.05)
与 回
提出假设:H0: ;H1: 0
归 分
计算检验的统计量:

t 0.9987 13 2 64.9809

1 0.99872

节 2.根据显著性水平=0.05,查t分布表得t(n-2)=2.201



七 章
相关关系的类型




相关关系



线性相关 非线性相关 完全相关 不相关
第 一
节 正负 相 相相 关 关关
基 本 概 念
正负 相相 关关
第 七 章




归 分
相关系数及其计算

第 一 节 相 关 基 本 概 念

七 章
相关关系的测度

(相关系数)

与 回 1.
对变量之间关系密切程度的度量
r
n xy x y
n x2 x2 n y2 y2
13 9156173.99 12827.5 7457
1316073323.77 12827.52 13 5226399 74572
0.9987
人均国民收入与人均消费金额之间的相关系 数为 0.9987

七 章
相关系数的显著性检验(概念要点)

表7-1 我国人均国民收入与人均消费金额数据 单位:元

年份
人均
人均
国民收入 消费金额
年份
人均
人均
国民收入 消费金额
一 节
1981 1982
393.8 419.14
249 267
1988
1068.8
643
1989
1169.2
690

1983
460.86
289
关 基 本 概
1984 1985 1986 1987
第七章 相关与回归 分析
第一节 相关关系基本概念
第二节 简单线性回归分析
第三节 非线性回归分析



第一节 相关基本概念




变量相关的概念



相关系数及其计算
第 一 节
相 关 基 本 概 念
第 七 章




归 分
变量相关的概念

第 一 节 相 关 基 本 概 念

七 章
变量间的关系

(函数关系)
r (x x)( y y)

(x x)2 (y y)2


相 或化简为: r
nxy x y
关 基
n x2 x2 n y2 y2



第 七
相关关系的测度
章 相
(相关系数取值及其意义)
关 与
1. r 的取值范围是 [-1,1]
回 归
2. |r|=1 为完全相关 r =1,为完全正相关
章 相
(函数关系)
关 与
相关关系的例子


商品的消费量(y)与居民收入(x)之间的关系


商品销售额(y)与广告费支出(x)之间的关系


粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系

相 关
收入水平(y)与受教育程度(x)之间的关系


父亲身高(y)与子女身高(x)之间的关系
分 析
性回归
第 2. 对于具有线性关系的两个变量,可以用一条线
二 节
性方程来表示它们之间的关系
简 3. 描述因变量 y 如何依赖于自变量 x 和误差项
单 线
的方程称为回归模型






七 章
一元线性回归模型(概念要点)
相 对于只涉及一个自变量的简单线性回归模型可表示为 关

y = b0 + b1 x + e


第 一
-1.0
-0.5
0
+0.5 +1.0

r


负相关程度增加 正相关程度增加




第 七
相关关系的测度

(相关系数计算例)


与 【例7.1】在研究我国人均消费水平的问题中,把全国人均消费额
回 记为y,把人均国民收入记为x。我们收集到1981~1993年的样本
归 分
数据(xi ,yi),i =1,2,…,13,数据见表8-1,计算相关系数。


n
n
Q(bˆ0 , bˆ1) ( yi yˆ)2 ei2 最小

i 1
i 1
节 2. 用最小二乘法拟合的直线来代表x与y之间的
简 单
关系与实际数据的误差比其他任何直线都小
线





第 七 章


与 回
y



第 二 节
简 单 线 性 回 归 分 析
最小二乘法
(图示)
(x2 , y2)

归 2. 方程中运用
分 析
1 个数字的因变量(响应变量)
第 二
被预测的变量

1 个或多个数字的或分类的自变量 (解释变量)


线
用于预测的变量

回 归
3. 主要用于预测和估计



七 章
一元线性回归模型
相 关
(概念要点)
与 回 1.
当只涉及一个自变量时称为一元回归,若因变
归 量 y 与自变量 x 之间为线性关系时称为一元线
4. 各观测点分布在直线 周围
x




七 章
相关关系的图示



回 归 分 析
完全正线性相关


节 相
关 基

正线性相关


完全负线性相关
负线性相关
非线性相关
不相关

七 章
变量间的关系
相 关
(相关关系)





第 一 节 相 关 基 本 概 念
第 七
变量间的关系
对独于立一性个意特味定着的对x于值一,个它特所定对的应x的值y,值它 所对与应其的他εx与所其对他应x的值y所值对也应不的相ε不关相关
第 七
回归方程


(概念要点)
关 与
1.
描述 y 的平均值或期望值如何依赖于 x
回 的方程称为回归方程

分 析
2.
简单线性回归方程的形式如下

E( y ) = b0+ b1 x
回 归
y 是 x 的线性函数(部分)加上误差项


线性部分反映了由于 x 的变化而引起的 y 的变化


误差项 是随机变量


反映了除 x 和 y 之间的线性关
是不能由 x 和 y 之间的线
单 线
系之外的随机因素对 y 的影响
性关系所解释的变异性



b0 和 b1 称为模型的参数


第 七 章
据去估计
归 分 析
2.
用样本统计量 bˆ0 和 bˆ1代替回归方程中的未知参 数b0和 b1,就得到了估计的回归方程
第 二
3.
简单线性回归中估计的回归方程为
节 简
yˆ bˆ0 bˆ1x
单 线 性
其中:bˆ0是估计的回归直线在 y 轴上的截距,bˆ1是直线 的斜率,它表示对于一个给定的 x 的值,是 y 的估计

与 回 1.
是一一对应的确定关系
归 分
2.

设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完 y
全依赖于 x ,当变量 x 取某
第 一 节 相 关
个数值时, y 依确定的关系
取相应的值,则称 y 是 x 的 函数,记为 y = f (x),其中 x 称为自变量,y 称为因变
基量

x


方程的图示是一条直线,因此也称为直线回归方程


b0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值
线

b1是直线的斜率,称为回归系数,表示当 x 每变动一个单位
回 归
时,y 的平均变动值



七 章
估计(经验)的回归方程


与 回
1.
总体回归参数
b

0
b1是未知的,必需利用样本数
(x1 , y1)
(xn , yn)
} ei = yi^-yi
(xi , yi)
yˆ bˆ0 bˆ1x x

七 章
最小二乘法
相 关
(bˆ0和 bˆ的1 计算公式)
与 回
根据最小二乘法的要求,可得求解
bˆ0 和
归 分
bˆ1 的标准方程如下

第 二 节

原材料价格(x3)之间的关系可表示为y = x1 x2 x3




七 章
变量间的关系
相 关
(相关关系)
与 回 归 分 析 第 一 节
1. 变量间关系不能用函
数关系精确表达
2. 3.
一个变量的取值不能 由另一个变量唯一确 定 当变量 x 取某个值时, 变量 y 的取值可能有
y
几个
相 关 基


与 回
1.



第 2.

节 3.
简 单 线 性 回 归 分 析
一元线性回归模型
(基本假定)
误差项ε是一个期望值为0的随机变量,即 E(ε)=0。对于一个给定的 x 值,y 的期望
值为E ( y ) =b 0+ b 1 x
相关文档
最新文档