第三章 回归分析预测法讲解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人均可支 恩格尔系 配收入xi 数yi
5160.3 46.6 5425.1 44.7 5854.0 42.1 6280.0 39.4 6859.6 38.2 7702.8 37.7 8472.2 37.1
(3)20
(3)21
(3)22
三、一元线性回归模型的检验
进行预测是建立回归模型的目的, 只有当所建立的回归模型是正确的、显 著有效的时,才可以利用它来进行经济 预测
(3)33
(3)34
(3)35
四、利用线性回归模型进行预测
如果所拟合的样本回归方程通过了 各种检验,则该样本回归方程可用来进 行预测。预测分为点预测和区间预测。
(3)36
(一)点预测
(3)37
(二)区间预测
(3)38
(3)39
3.2多元线性回归分析预测法
一元线性回归分析预测法讨论的是 一个因变量和一个自变量的回归预测问 题,然而在许多情况下,需要考虑一个 因变量与多个自变量之间的回归分析, 及多元回归分析。
u为随机扰动项。比如,供给量与价格之间的关系; 单位面积土地上农 作物施肥量与收获量之间的关系; 产品量与成本之间的关系。
(3)4
变量间的关系
• 确定性关系或函数关系:研究的是确定性 现象非随机变量间的关系。
圆面积 f ,半径 半径2
统计依赖或相关关系:研究的是非确定性现 象随机变量间的关系。
(3)3
经济变量之间的关系
• 确定性关系: y=f(x) 数学上称函数关系。一一对应的关系。
• 不确定性关系:y=f(x)+u 在经济现象中,这种关系大量存在,它不能由一
种(或者几种)经济变量与另一经济变量的函数关系 来表示,这种关系也称相关关系。X为自变量(解释 变量),Y为因变量(被解释变量)
显著T;>t,拒绝H0,即回归系数 T<t,接受H0,即回归系数
不显著。
(3)27
2.回归方程的拟合优度(判别系数)
(3)28
(3)29
(3)30
(3)31
3.对回归方程的显著性检验(F检验)
(3)32
(三) 经济计量检验
经济计量检验主要是用来检验所采 用的计量经济方法是否令人满意,计量 经济方法的假设条件是否得到满足,从 而确定统计检验的可靠性,主要包括随 机误差项的序列相关检验、异方差检验 和解释变量的多重共线性检验等。
(3)46
步骤:
(3)47
(3)48
(3)49
正规方程组的矩阵形式
n
X1i


X ki
X1i
X
2 1i

X ki X 1i

X ki X1i X

X
2 ki
ki

ˆ0 ˆ1 ˆ k

(3)60
3.各回归参数的显著性检验
• 方程的总体线性关系显著不等于每个解 释变量对被解释变量的影响都是显著的。
• 必须对每个解释变量进行显著性检验, 以决定是否作为解释变量被保留在模型 中。(参考)
• 这一检验是由对变量的 t 检验完成的。
(3)61
1、t统计量
Cov(βˆ ) 2 (XX)1
• 回归分析仅对存在因果关系而言。
(3)6
• 回归分析对变量的处理方法存在不对称 性,即区分因变量(被解释变量)和自 变量(解释变量),前者是随机变量, 后者不一定是。
(3)7
• 回归分析(regression analysis)是研究一个变量 关于另一个(些)变量的具体依赖关系的计算 方法和理论。
(3)18
例3-1 以我国城市居民家庭人均可支配 收入和恩格尔系数的关系为例说明回归 模型参数的估计方法,资料见下表
(3)19
年份
1989 1990 1991 1992 1993 1994 1995 1996
人均可支 恩格尔系 年份 配收入xi 数yi
1373.9 54.5 1997 1510.2 54.2 1998 1700.6 53.8 1999 2026.6 53.0 2000 2577.4 50.3 2001 3496.2 50.0 2002 4283.0 50.1 2003 4838.9 48.8


^
^
yi n 0 1 xi
^
^
xi yi 0 xi 1 xi2
(3)17
• 解上述方程组,得出参数估计值:
ˆ0

y

ˆ1x

1 n
yi

ˆ1
1 n
xi

ˆ1

nxi yi xiyi nxi2 (xi )2
(3)24
(二)统计检验
1、对回归参数的检验(t检验)
对回归参数的检验就是对回归参数 是
1
否显著不为0的t检验。只有当 显著地
不为0时,回归模型中因变量和自变量之
间确实存在线性关系,所建立的模型才
有统计意义。
(3)25
对回归模型参数 进行t检验的程序为:
(3)26

(3)查出临界值并做出判断
(3)52
(一)统计检验
1.拟合优度检验 建立在总离差平方和分解基础上的多元 线性回归模型判定系数(复判定系数) 记为 R2 ,以区别于一元线性回归模型判定 系数 r 2 。
(3)53
总离差平方和的分解
证明: 该项等于0
TSS (Yi Y )2
((Yi Yˆi ) (Yˆi Y )) 2
(3)40
一、多元线性回归模型的建立
(3)41
(3)42
(3)43
(3)44
为了进行多元线性回归分析,除了上一 节提出的标准假定以外,还假定多元线 性回归模型所包含的自变量之间不具有 较强的线性相关关系,即不存在多重共 线性
(3)45
二、多元线性回归模型参数的估计 最小二乘原理:根据被解释变量的所有 观测值与估计值之差的平方和最小的原 则求得参数估计量。
H1 : j ( j 1, 2, , k)不全为0
(3)58
F检验的思想来自于总离差平方和的分解式 TSS=ESS+RSS
考虑 ESS/RSS
如果这个比值较大,则X的联合体对Y的解释程度高,可认 为总体存在线性关系,反之总体上可能不存在线性关系。 因此,可通过该比值的大小对总体线性关系进行推断。
• 判断结果合理与否,是基于“小概率事件不易发生” 这一原理的。
(3)57
• 方程的显著性检验,旨在对模型中被解释变量 与解释变量之间的线性关系在总体上是否显著 成立作出推断。
• 在多元模型中,即检验模型中的参数j是否 显著不为0。
Yi 0 1X1i 2 X 2i k X ki i H0 : 1 0, 2 0, , k 0
• 其目的在于通过后者的已知或设定值,去估计 和(或)预测前者的(总体)均值。
• 两类变量;
–被解释变量(Explained Variable)或应变量 (Dependent Variable)。
–解释变量(Explanatory Variable)或自变量 (Independent Variable)。
Y (元)
3000 2500 2000 1500 1000
500 0
500
1000
1500 2000 2500 3000 每月可支配收入X(元)
3500
4000
(3)10
第三章
(二)随机误差项的意义和标准假定
扰动项 包含了丰富的内容,产生的原因主要有 以下几个方面:
• 1、忽略掉的影响因素造成的误差 • 2、模型关系不准确造成的误差 • 3、变量观测值的计量误差 • 4、变量数据难以获得
(Yi Yˆi )2 2(Yi Yˆi )(Yˆi Y ) (Yˆi Y )2
TSS (Yi Yˆi )2
(Yˆi
Y
2
)
ຫໍສະໝຸດ Baidu
RSS

ESS
(3)54
判定系数 R2 的计算公式为:
R 2 ESS 1 RSS
TSS
TSS
该统计量越接近于1,模型的拟合优度越高。 从 R2的表达式中发现,如果在模型中增加解释变量, R2往往增大。 这就给人一个错觉:要使得模型拟合得好,只要 增加解释变量即可。但是,由增加解释变量引起 的R2的增大与拟合好坏无关,所以R2需调整。
(3)59
在原假设H0成立的条件下,统计量
F ESS / k ~ F(k, n k 1) RSS / (n k 1)
给定显著性水平,可得到临界值F(k,n-k-1),由样本求出统 计量F的数值,通过
F F(k,n-k-1) 或 FF(k,n-k-1) 来拒绝或接受原假设H0,以判定原方程总体上的线性关系是否 显著成立。
(3)55
(3)56
2.回归方程的显著性检验
• 所谓假设检验,就是事先对总体参数或总体分布形式 作出一个假设,然后利用样本信息来判断原假设是否 合理,即判断样本信息与原假设是否有显著差异,从 而决定是否接受或否定原假设。
• 假设检验采用的逻辑推理方法是反证法。先假定原假 设正确,然后根据样本信息,观察由此假设而导致的 结果是否合理,从而判断是否接受原假设。
对于给定的一个样本,总体回归模型的近似估计为:
^
^
^
yi 0 1 xi ^
y y 上式称为样本回归方程,又称为经验方程, 是
估计
i
i的
^
yi yi ei
(3)14
二、一元线性回归模型参数的估计
(3)15
(3)16
根据微积分中求极值的原理,对上式中
的,求偏导,并令其为零,得到如下方 程组:
Var(ˆi ) 2cii ˆi ~ N (i , 2cii )
以cii表示矩 阵(X’X)-1 主 对角线上的
第i个元素
ˆ 2
e
2 i

ee
nk 1 nk 1
t ˆj j
(3)23
(一)经济意义检验
经济检验是检验估计出来的参数的符号、 大小是否与经济理论和实际经验相符合,即是 否具有经济意义。
例如,根据实际经验,城市居民家庭的恩 格尔系数是随着人均可支配收入的增加而减少 的,因此,人均可支配收入对恩格尔系数的影 响是负向的,即人均可支配收入前的参数符合 应该是负号。


1 X 11 X k1
1 X 12 X k2

1 Y1
X 1n Y2
X kn

Yn

(XX)βˆ XY
βˆ (XX)1 XY
(3)50
(3)51
三、多元线性回归模型的检验
同一元线性回归模型一样,在利用所建 立的多元线性回归模型进行预测之前, 需要对其进行各种检验。首先进行经济 理论检验,再进行统计检验和计量经济 学检验。
(3)11
第三章
随机扰动项通常满足五个假定条件:
(3)12
第三章 (三)样本回归模型
^^
yi 0 1 xi ei i=1,2….n
^
上式中,0 ,
^
1和
ei 是根据所获得的一个样本对
总体回归参数


0
1

ui
的估计,n为样本容
量, ei 被称为残差。
(3)13
样本回归方程
(3)8
第一章 一、一元线性回归模型的建立 (一)一元线性总体回归模型
yi 0 1xi i i
其中, 0,1是未知参数, i 是随机扰动项。
(3)9
描出散点图发现:随着收入的增加,消费“平均地说” 也在增加,且Y的条件均值均落在一根正斜率的直线上。
3500
每 月 消 费 支 出
农作物产量 f 气温, 降雨量, 阳光, 施肥量
(3)5
• 对变量间统计依赖关系的考察主要是通 过相关分析(correlation analysis)或回归 分析(regression analysis)来完成的。
• 相关分析适用于所有统计关系。
– 相关系数(correlation coefficient) – 正相关(positive correlation) – 负相关(negative correlation) – 不相关(non-correlation)
第三章 回归分析预测法
(3)1
第三章 目录
3.1 一元线性回归分析预测法 3.2 多元线性回归分析预测法 3.3 非线性回归分析预测法 3.4 进行回归分析预测时应注意的问题 3.5 多元回归分析预测案例
(3)2
第三章 3.1 一元线性回归分析预测法 是指成对的两个变量数据分布大体上呈直 线趋势时,运用合适的参数估计方法,求出一 元线性回归模型,然后根据自变量与因变量之 间的关系,预测因变量的趋势。
相关文档
最新文档