第八章 相关分析与回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设3:解释变量 xi是确定性变量,且与随机误差 项之间线性无关。
假设4:随机误差项 i 服从零均值、同方差的正态
分布,即:
i ~ N 0, 2
i 1, 2,L , n
第八章 相关分析和回归分析
二、一元线性回归模型的估计
(一)参数 0 和1 的最小二乘估计 最小二乘法:就是使残差平方和达到最小时
第八章 相关分析和回归分析
第二节 一元线性回归分析
一、一元线性回归模型 (一)回归模型的基本形式 一元线性总体回归模型:
yi 0 1xi i
一元线性回归方程:
E( yi ) yˆi ˆ0 ˆ1xi
ˆ0与ˆ1是参数0 和1 的最小二乘估计。 实际观测值 yi与yˆ i 之间差值称为残差,即:
t
2
n
2
ˆ
1 n
x2 lxx
,
ˆ0
t
2
n
2
ˆ
1 n
x2 lxx
其中: ˆ
n
ei2
i 1
n2
第八章 相关分析和回归分析
三、一元线性回归模型的检验 (一)拟合优度检验 所谓拟合优度,是指模型对样本观测值的 拟合程度,即样本回归直线与观测点之间 的紧密程度。衡量拟合优度的指标通常用 样本可决系数(又称决定系数)
对于给定的显著性水平 ,查表得
,由

,拒绝原假设,认为回归方程是显著的。
2)还可以进行 检验,计算 统计量
t ˆ1 1.305 195823837076 =34.316
ˆ lxx
16828.545
当 0.05 时,查表得 t0.025 15 2.1315,由于 t t0.025 15 ,拒
第八章 相关分析与回归分析
•第一节 相关分析 •第二节 一元线性回归分析 •第三节 多元线性回归分析
第八章 相关分析和回归分析
第一节 相关分析
一、变量之间的两类关系 (一)函数关系 函数关系亦称确定性关系,是指变量(现象)
之间存在的严格确定的依存关系。
(二)相关关系 相关关系,是指变量(现象)之间存在着非
x2 lxx
2
ˆ0
~
N
0,
1 n
x2 lxx
2
ˆ1
~
N
1,
2
lxx
第八章 相关分析和回归分析
(三)总体方差 的估计
n
n
ei2
yi yˆi 2
ˆ 2 i1 i1
n2
n2
回归标准差:
n
ei 2
n
yi yˆi 2
ˆ i1 i1
n2
n2
其简捷公式:
ˆ
n
n
n
yi2 ˆ0 yi ˆ1 xi yi
第八章 相关分析和回归分析
(三)回归系数的显著性检验(t 检验)
t 检验的步骤:
1.提出假设
原假设 H0 : 1 0 ;备择假设H1 : 1 0
2.构造统计量 t ˆ1
ˆ lxx
在原价设H0 : 1 0 成立时,统计量
t ˆ
ˆ1 lxx
~ t n 2
3.给定显著性水平,确定拒绝域:W {t t 2 n 2}
绝原假设,说明 1 显著不为0,即国内生产总值和
固定资产投资额之间具有显著的线性相关关系。
第八章 相关分析和回归分析
四、一元线性回归模型的应用:估计与预测 (一)y 的均值 Ey0 的估计
点估计: Eˆ y0 yˆ0 ˆ0 ˆ1x0
区间估计:
yˆ0
t
2
n

1 n
x0
x lxx
2
,
yˆ0
严格、不确定的依存关系。
第八章 相关分析和回归分析 二、相关关系的种类
(一)按相关的密切程度可分为:完全相关、不完 全相关、不相关 (二)按表现形态可分为:线性相关、非线性相关 (三)按相关的方向可分为:正相关、负相关
(四)按研究变量的多少可分为:单相关、复相关、 偏向关。
第八章 相关分析和回归分析
2.构造统计量
F
SSR
SSE n
1
2
在原价设H0 : 1 0 成立的条件下,上述统计量
F ~ F 1,n 2
3.给定显著性水平,确定拒绝域:F F 1,n2 ,在 附表中可直接查找 F 1,n2的值。
第八章 相关分析和回归分析
4.作出判断 根据样本计算出统计量 F 的数值,然后 与 F 1,n 2的值进行比较,若 F F 1,n2 ,则 拒绝原假设,认为回归方程是显著的, 即 x 与 y 之间有显著的线性关系。 若 F F 1,n2 ,则接受原假设,认为回归方 程不显著。
0 xi 0
第八章 相关分析和回归分析
求解方程组得
的最小二乘估计量 ˆ0 , ˆ1
ˆ1
n
xi yi nx y
i 1 n
xi2 nx 2
i 1
lxy lxx
ˆ0
y
ˆ1x
第八章 相关分析和回归分析
例8-2 根据表8-1中给出的我国国内生产总值和固定资产投资额数 据,建立回归方程。
解:根据例8-1的计算结果可知,国内生产总值和固定资产投资额 之间具有显著的线性相关关系,由此可建立简单直线回归方程:
ei yi yˆi
第八章 相关分析和回归分析
(二)一元线性回归模型的基本假设
假设1:随机误差项具有零均值,同方差性,即
E i 0 Var i 2 i 1, 2,L , n 假设2:随机误差项之间不存在序列相关关系,即
Cov i , j 0,i j,i, j 1, 2,L , n
所求回归方程为: yˆi 60663.768 1.305xi
表明固定资产投资额每增加一亿元,国内生产总值平均增加 1.305亿元
第八章 相关分析和回归分析
(二)最小二乘估计量的性质
最小二乘估计量ˆ0与ˆ1分别是其真值 与 0 ˆ1 的无 偏估计,且都服从正态分布。
E
ˆ1
n xi x E l i1 xx
著;若 ,不能拒绝 ,表明变量间的线性
相关关系不显著;
第八章 相关分析和回归分析
例8-1 根据1996-2012年国内生产总值和固定资产投资额 资料,见书本表8-1,计算国内生产总值和固定资产投资 额之间的相关系数,并对相关系数进行显著性检验。
解:1)计算相关系数
r
n
i 1
xi yi
1 n
n i 1
yi
n xi x l i1 xx
0 1xi
1
E ˆ0 E y ˆ1x 0 1x 1x 0
Var ˆ1
n i1
xi lxx
x
2
Var
yi
n
i1
xi x lxx 2
22 2 lxx
Var
ˆ0
n i1
1
n
xi
x lxx
x
Var
yi
1 n
n
记:总偏差平方和:SST yi y 2 i 1
n
回归平方和: SSR yˆi y 2 i 1
n
残差平方和:SSE yi yˆi 2 i 1
总偏差平方和分解式:SST SSR SSE
第八章 相关分析和回归分析
样本可决系数可定义为回归平方和与总偏差 平方和之比,用来反映回归方程的拟合程 度,记为r 2。用公式表示:
求得参数0 和1的估计值 ˆ0与 ˆ1的方法。
残差平方和公式为:
n
n
Q ei2
n
yi yˆi 2
yi ˆ0 ˆ1xi 2
i 1
i 1
i 1
对 分别求一阶偏导,并令其为0,
得方程组: Q
ˆ0
Q
ˆ1
n
2
i 1
n
2
i 1
yi ˆ0 ˆ1xi yi ˆ0 ˆ1xi
,在附表中可直接查找 t 2 n2的值。
第八章 相关分析和回归分析
4.作出判断
根据样本计算出统计量 t 的数值,然后
与 t 2 n 2 的值进行比较,若 ,则 t t 2 n2
拒绝原假设,认为 1 显著不为0,变量x
与y之间一元线性关系显著成立;
若 t t 2 n2 ,则接受原假设,认为回归方
r2 SSR 1 SSE SST SST
r 2 的取值在0到1之间,其值越接近1,说明回 归方程的拟合程度越高;反之,其值越小, 说明回归方程的拟合效果差。
第八章 相关分析和回归分析
(二)回归方程的显著性检验( F 检验) F 检验的步骤: 1.提出假设
原假设 H0 : 1 0 ;备择假设H1 : 1 0
1.相关系数的计算公式
总体相关系
Cov x, y Var xVar y
样本相关系数
n
r
xi x yi y
i1
lxy
n
n
xi x 2 yi y 2
lxxlyy
i1
i1
第八章 相关分析和回归分析
样本相关系数分子分母的简化计算形式:
n
lxx
i1
xi x
2
n
t
2
n

1
x0
x 2
n
lxx
第八章 相关分析和回归分析 (二) 的预测区间
yˆ0
t
2
n

1
1 n
x0
x lxx
2
,
yˆ0
t
2
n

1
1
x0
x 2
n
lxx
第八章
相关分析和回归分析
第三节 多元线性回归分析
一、多元线性回归模型 (一)多元线性回归模型的一般形式
四、相关关系的测度
(一)相关图 相关图又称散点图。它是将具有相关关系的两 个变量间相对应的变量值,在直角坐标系上用坐 标点的形式描绘出来,根据坐标点的分布状况来 大致判别相关形式、相关方向和相关的密切程度。
(a)正相关
(b)负相关
第八章 相关分析和回归分析
(二)相关系数
相关系数是衡量变量之间线性相关密切程度及 相关方向的统计分析指标。
i 1
i 1
i 1
n2
越小表明实际观测点与所拟合的样本回归线的离差程
度越小,回归线能较好的代表总回归模型。反之, 越
大表明实际观测点与所拟合的样本回归线的离差程度越
大,回归线的代表性越差。
第八章 相关分析和回归分析 (四)回归系数的区间估计
ˆ1
t
2
n
2
ˆ
lxx
, ˆ1
t
2
n
2
ˆ
lxx
ˆ0
(5) r 的取值越接近0,变量间线性相关关系越 弱,越接近1,变量间线性相关关系越强。
第八章 相关分析和回归分析
3.相关系数的检验 对 的 统计量检验法
第一步:提出假设

第二步:计算检验统计量
t r n 2 ~ t n 2
1 r2
第三步:根据给定的显著性水平 ,进行决策。
若 ,拒绝 ,表明变量间线性相关关系显
程不显著。认为
显著为0,变量
1
x与y
之间一元线性关系不成立;
第八章 相关分析和回归分析
例8-3 对例8-2建立的国内生产总值和固定资产投 资额的回归方程进行显著性检验。
解:1)先进行 检验,计算 统计量
F SSR 1 333746725801.644 =1281.953 SSE 15 260342353.207
xi
n i 1
yi
n
i 1
xi 2
1 n
n i 1
xi
2
n i 1
yiБайду номын сангаас2
1 n
n i 1
yi
2
690491611534 2017177.1 3664701.8
17
2017177.12
3664701.82
435176981356
1127654171860
17
17
255647343929
三、相关分析与回归分析 (一)相关分析 相关分析主要研究两个或者两个以上随机变量
之间相互依存关系的方向和密切程度的方法。
(二)回归分析 回归分析是研究某一随机变量关于另一个(或 多个)非随机变量之间数量关系变动趋势的方法。 其目的在于根据已知非随机变量来估计和预测随 机变量的总体均值。
第八章 相关分析和回归分析
n i 1
xi
y
1 n
n i 1
yi
第八章 相关分析和回归分析
2.相关系数的性质 (1) r 1;
(2)当 r 0时,变量间不存在线性相关关系;
(3)当 r 1时,变量间具有完全线性相关关系,
当 r 1 时,称完全正相关,当r 1 时,称完全负
相关。
(4)当 1 r 0 时,变量间存在负相关关系; 当 0 r 1 时,变量之间存在正相关关系
xi2 nx 2
i1
n i1
xi 2
1 n
n i1
xi
2
n
lxy xi x
i1
yi y
n i1
xi yi
nx
y
n i1
xi yi
1 n
n i1
xi
n i1
yi
n
lyy
i1
yi y
2
n i1
yi2 ny 2
n i1
yi 2
1 n
n i1
yi
2
x
1 n
0.9942
442519.872 581078.1885
第八章 相关分析和回归分析
2)对样本相关系数进行t检验 计算t统计量
t r n 2 35.8 1 r2
对给定显著性水平 0.0,5 查表得
t0.025 15 2.1315 ,这里 t t0.025 15, 故在0.05的
显著性水平下,检验通过,说明国内生产总值 和固定资产投资额之间的相关关系显著。
yˆi ˆ0 ˆ1xi
将表8-1中的有关数据代入上式,可得
n
ˆ1
xi yi nx y
i 1
n
xi2 nx 2
255647343929 195823837076
1.305497 1.305
i 1
ˆ0 y ˆ1x 215570.7 1.305497118657.4765 60663.768
相关文档
最新文档