计量经济学 线性回归模型概述
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Yi f ( X i ) i
• 后者在总体回归函数(方程)的基础上引入 了随机干扰项i,称为总体回归模型。
样本回归函数(教材P27-28)
• 但是,总体的信息往往无法掌握,所以总体回归函数 是未知的。 • 回归分析的任务就在于,利用对总体的n次观测所得 到的一组样本数据,去近似地估计总体回归函数。
被解释变量Y的总体均值(期望值)可以表示为:
E(Y X i ) f ( X i )
–上式说明了被解释变量Y 平均来说随解释变量X 变化的
规律,一般称为总体回归函数(population regression function,PRF);对应的曲线称为总体回归曲线 (population regression curve),它可以是线性的或非 线性的。
单方程线性回归模型的一般形式
• 总体回归方程
E(Yi X1i ,, X ki ) 0 1 X1i 2 X 2i k X ki
• 总体回归模型 Yi 0 1 X1i 2 X 2i k X ki i • 样本回归方程
ˆ ˆ ˆ ˆ ˆ Yi 0 1 X1i 2 X 2i k X ki
§2.4 一元线性回归分析的应用:预测问题
§2.5 实例及时间序列问题
§2.1
线性回归模型概述
一、回归分析概述 二、线性回归模型的特征 三、线性回归模型的普遍性
四、线性回归模型的基本假设
一、回归分析概述
1.变量间的关系(教材P22)
△ 经济变量之间的关系,大体可分为两类:
• 确定性关系或函数关系:也就是确定性现象之间的 关系。
• 样本回归模型
ˆ ˆ ˆ ˆ Yi 0 1 X1i 2 X 2i k X ki ei
三、线性回归模型的普遍性(第三版教材P82§3.5)
线性回归模型是计量经济学模型的主要形式,许
多实际经济活动中经济变量间的复杂关系都可以通
过一些简单的数学处理,使之化为数学上的线性关
• 记
ˆ ei Yi Yi
则ei被称为残差或剩余项(residual),它代表了 除解释变量外的其他所有因素对Y的影响。
样本回归模型(教材P28)
• 例:若样本回归函数为
ˆ ˆ ˆ Yi 0 1 X i
ˆ ei Yi Yi
则
ˆ Yi Yi ei ˆ ˆ Yi 0 1 X i ei
系。
将非线性关系化为线性关系的常用的数学处理方法
⑴直接置换法(见教材P82) 例如,描述税收s与税率r的关系的拉弗曲线为抛物 线形式: s = a + b r + c r2 + c<0 设X1 = r,X2 = r2,则原方程变换为 s = a + b X1 + c X2 + c<0
• 直接置换法仅用于变量非线性的情况(如倒数 模型、多项式模型)。
它是总体相关系数ρXY 【见P23(2.1.1)式】的一致估计。
偏相关系数(补充)
• 在多变量的情况下,简单相关系数已不能准确反映其中任意 两个变量之间线性关系的真实程度。此时,需要计算偏相关 系数。 • 偏相关系数:是指在控制或消除其他变量影响的情况下,衡
量多个变量中的某两个变量之间线性相关程度的指标。
Y
Yi ei
ˆ ˆ ˆ Yi 0 1 X i
i
ˆ Yi
教材P29有 打印错误
E (Y | X i ) 0 1 X i
E (Y | X i )
Xi 样本与总体回归线
X
5.回归分析——计量经济学的方法论基础
• 回归分析属于数理统计学的内容,但它构成了计 量经济学的方法论基础,其主要内容包括:
第二章 经典单方程计量经济学模型:
一元线性回归模型
– 单方程计量经济学模型是相对于联立方程模型
而言的,它以单一经济现象为研究对象,模型中 只包括一个方程,是应用最为普遍的计量经济学 模型。
本章主要内容
§2.1 线性回归模型概述【相当于教材前两节和§3.5】 §2.2 一元线性回归模型的参数估计
§2.3 一元线性回归模型的统计检验
– 如:圆的面积S和圆的半径r之间的关系,给定圆的半径r, 则圆的面积S随之确定。
• 统计依赖关系或相关关系:也就是非确定性现象间 (随机变量间或随机变量与非随机变量间)的关系。
– 如:消费支出与可支配收入之间的关系。
2.相关分析与回归分析概述
• 对变量间的统计依赖关系进行考察,可以通过 相 关 分 析 (correlation analysis) 或 回 归 分 析 (regression analysis)来完成:
– 设Y与X是两个随机变量,Y1、Y2、…、Yn是Y的样本观测 值,X1、X2、…、Xn是X的样本观测值,则Y与X之间的简 单相关系数(样本相关系数)计算公式为
(Y i i (Y i i
Y )( X X )
i
r
YX
Y )2 ( X X )2
i i
y x i i i 2 2 y x i i i i
随机干扰项i包括了哪些因素的影响?(教材P27)
• 在解释变量中被忽略的因素的影响;
– 如:未知的影响因素、众多细小的影响因素、残缺数据 (变量)的影响 引入随机干扰项的原因
• 变量观测值的观测误差的影响; •
• 模型设定误差的影响;
理论的含糊性; • 数据的欠缺; • 节省原则。
– 设定误差:指设定模型与真实模型有偏差,如遗漏了某 些重要的解释变量,或者模型形式设定有问题。
(3)级数展开法(适用于复杂函数模型,见教材P83)
在高等数学中我们学过,如果函数f(x)在x=x0附近具有任意 阶导数,那么可以将函数f(x)在x=x0处展开成如下的Taylor级 数形式:
f ( x0 ) f ( x0 ) f ( x) f ( x0 ) ( x x0 ) ( x x0 ) 2 1! 2! (n) f ( x0 ) ( x x0 ) n n!
(1)根据样本观测值对计量经济模型(属于回归 模型)的参数进行估计,求得回归方程; (2)对回归方程及其参数的显著性进行检验;
(3)利用回归方程进行分析、评价及预测。
二、线性回归模型的特征
• 一个例子 凯恩斯绝对收入假设消费理论:消费支出 C 由可支 配收入 Y 唯一决定,是可支配收入的函数: C = + Y 但实际上,上述等式不能准确实现。 • 原因 ⑴消费支出除受可支配收入的影响外,还受其他因 素的影响; ⑵线性关系只是一个近似描述; ⑶可支配收入数据的近似性:收入数据有误差,没 有准确地反映收入水平。
–这种利用样本数据,采用适当的方法估计得 到的总体回归函数的近似形式,就叫做样本 回归函数(sample regression function, SRF)。对应的曲线称为样本回归线 (sample regression curves)
• 例:若总体回归函数为如1X i
随机误差项的引入(教材P26)
• 给定解释变量X的某个确定值Xi ,与之统计相关的
被解释变量Y的实际观测值为Yi 。
• 记
i Yi E (Y X i )
则i为Y的观测值Yi与它的期望值E(Y|Xi) 的离差,
它是一个不可观测的随机变量,一般称之为随机
干扰项(stochastic disturbance)或 随机误差项 (stochastic error)。
– 由于回归分析的这一特定功能,所以也被用来进 行变量之间的因果分析。
– 但是,仅仅依靠回归分析还不能对变量之间的因 果关系作出最后判断,必须与经济行为的定性分 析相结合。
图 示
正相关 线性相关 统计依赖关系 不相关 相关系数: 有因果关系 无因果关系 回归分析 相关分析 负相关 1 XY 1 正相关 非线性相关 不相关 负相关
• 前已指出,回归分析是研究一个变量关于另一个
(或另一些)变量的具体依赖关系的计算方法和理论。 其中:
–前一个变量被称为被解释变量(Explained Variable)或 因变量(Dependent Variable)
–后一个(或一些)变量被称为解释变量(Explanatory Variable)或自变量(Independent Variable)
回归分析关心的问题(教材P24)
• 由于变量间关系的随机性,回归分析关心的 是根据解释变量X的给定值,考察被解释变
量Y的总体均值,即当解释变量X取某个确定
值Xi时,与之统计相关的被解释变量Y所有可
能出现的对应值的平均值E(Y|Xi)。
总体回归函数(教材P26)
• 给定解释变量X的某个确定值Xi,与之统计相关的
其中,、是未知参数,称为回归系数。
则对应的样本回归函数一般表示为
ˆ ˆ ˆ Yi 0 1 X i
ˆ 其中, 0是 0的估计值,ˆ1是1的估计值。
残差或剩余项(教材P28)
• 给定解释变量X的某个确定值Xi,根据样本回归
ˆ 函数可以计算出被解释变量Y的估计值 Yi 。
• 当X2保持不变时,Y与X1之间的偏相关系数为
rYX X
1 2
rYX rYX rX X
1 2 1
2
(1 r )(1 r
2 YX
2
2 XX
1
)
2
• 回归分析(regression analysis):也是判断变 量之间是否具有相关关系的一种数学分析方 法,但它着重判断一个随机变量与一个或几 个可控变量之间是否具有相关关系。
后者在样本回归函数的基础上引入了残差项ei, 称为样本回归模型。
4.小结(教材P28-29)
• 回归分析的主要目的:根据样本回归函数(模型) SRF,去尽可能准确地估计总体回归函数(模型) PRF。 • 以一元线性回归为例:
即,根据 估计
ˆ ˆ ˆ Yi Yi ei 0 1 X i ei
⑵ 对数变换法(见教材P82-83)
例如,Cobb-Dauglas生产函数为幂函数形式: Q = AKL e 其中,Q表示产出量,K表示投入的资本,L表示投 入的劳动。 模型两边取对数:
ln Q = ln A + ln K + ln L+
• 对数变换法适用于参数和变量都是非线性的情 况(如幂函数模型、指数函数模型)。
△关于上图,有几点值得注意: • 不线性相关并不意味着不相关; • 有相关关系并不意味着一定有因果关系; • 相关分析对称地对待任何两个变量,两个变量都被看作是随机的; • 回归分析对变量的处理方法存在不对称性,即区分被解释变量和解 释变量:前者是随机变量,后者则往往被假设为非随机变量。
3.回归分析的基本概念(教材P23-28)
• 其它随机因素的影响。
– 如:变量的内在随机性【比如,涉及人们思想行为的变 量,往往难以控制,具有内在的随机性】
总体回归模型(教材P27)
△
若总体回归函数(方程)为 则
E(Y X i ) f ( X i )
i Yi E (Y X i )
Yi E (Y X i ) i
可以变形为
Yi E (Y | X i ) i 0 1 X i i
这就要求:设计出一种“方法”,构造样本回归函 数SRF,以使SRF尽可能“接近”总体回归函数PRF(注 意:这里真实的PRF可能永远无从知道)。
ˆ 就一元线性回归来说, 也就是要使 (j 0, 1 )尽可能接近 (j 0, 1 )。 j j
• 相关分析(correlation analysis) :是研究随机 变量间的相关形式(包括线性相关和非线性 相关)及相关程度的数学分析方法。
– 其中,对于变量间线性相关程度的大小,可以通 过计算相关系数来测量。
简单相关系数(见教材P23)
• 简单相关系数:反映两变量间的线性相关程度,通常
也简称为相关系数。
• 因此,一个更符合实际的数学描述为: C = + Y+ 其中: 是一个随机误差项,是其他影响因素的 “综合体”。
• 这就是一个线性回归模型。 • 可见,线性回归模型具有以下特征: (1)通过引入随机误差项,将变量之间的关系用 一个线性随机方程来描述; (2)在线性回归模型中,被解释变量的特征由解 释变量与随机误差项共同决定。