计量经济学演示课件 教学PPT 作者 庞皓 第二章 简单线性回归模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
◆旅游业的发展与这种决定性因素的数量关系究竟是什么?
◆怎样具体测定旅游业发展与这种决定性因素的数量关系?
2
第二章 简单线性回归模型
本章主要讨论:
●回归分析与回归函数 ●简单线性回归模型参数的估计 ●拟合优度的度量 ●回归系数的区间估计和假设检验 ●回归模型预测
3
第一节 回归分析与回归方程
本节基本内容:
2 X i
变量“线性”,参数”非线
性” 计量经济学中: 线性回归模型主要指就参数而言是“线性”, 因为只要对参数而言是线性的,都可以用类似的方法 18
三、随机扰动项
◆概念: 各个 Y i 值与条件均值
E (Y X i )
u
Y
的偏差 u i 代表
u
排除在模型以外的所有 因素对 Y 的影响。
Xi
每 月 家 庭 消 费 支 出
1489 1538
1600 1702
1712 1778
1841 1886
2078 2179
2298 2316
2289 2313
2398 2423
2487 2513
2538 2567
2853 2934
3110
3142 3274
Y
1900
2012
2387
2498 2589 1900
或者
ˆ ˆ Yi 1 2 X i e i
24
对样本回归的理解
ˆ ˆ Yi 1 2 X i e i
wk.baidu.com
如果能够获得 ●
ˆ1
ˆ1
和 ˆ 2 的数值,显然:
1 和 2 的估计
和 ˆ 2 是对总体回归函数参数
● Yˆi 是对总体条件期望 E (Y X i ) 的估计 ● e i 在概念上类似总体回归函数中的 u i ,可 视为对 u i 的估计。
32
假定5:对随机扰动项分布的正态性假定 2 即假定 u i 服从均值为零、方差为 的正态分布
u i N (0, )
2
(说明:正态性假定不影响对参数的点估计,但对 确定所估计参数的分布性质是需要的。且根据中心 u 极限定理,当样本容量趋于无穷大时,u ii 的分布会 趋近于正态分布。所以正态性假定是合理的)
ˆ ˆ ˆ Yi 1 2 X i
其中: Yˆi 是与 X i 相对应的 Y 的样本条件均值 ˆ 1 和 ˆ 2 分别是样本回归函数的参数 应变量 Y 的实际观测值 Y i 不完全等于样本条件 均值,二者之差用 e i 表示, e i 称为剩余项或残差项:
ˆ e i Yi Y i
(单位:元)
每 月 家 庭 可 支 配 收 入 X
4000 2037 2110 2225 2319 2321 2365 2398 4500 2275 2388 2426 2488 2587 2650 2789 5000 2464 2589 2790 2856 2900 3021 3064 5500 2824 3038 3150 3201 3288 3399
25
样本回归函数与总体回归函数的关系
Y Yi
Yi ui ei
SRF PRF
Yˆi
E (Yi X i )
A
Xi
X
26
回归分析的目的
用样本回归函数SRF去估计总体回归函数PRF。 由于样本对总体总是存在代表性误差,SRF 总会过
高或过低估计PRF。
要解决的问题:
寻求一种规则和方法,使得到的SRF的参数 ˆ1 和 ˆ 2 尽可能“接近”总体回归函数中的参数 1 和2 。 这样的“规则和方法”有多种,最常用的是最小二
●只有具备一定的假定条件,所作出的估计才
具有较好的统计性质。
29
2、基本假定的内容
(1)对模型和变量的假定
如
Yi 1 2 X i u i
假定解释变量 X 是非随机的,或者虽然是随机的,但与扰动
项
u 是不相关的
假定解释变量 X 在重复抽样中为固定值
假定变量和模型无设定误差
30
(2)对随机扰动项 u 的假定
Yi
ui
(2)个别值表现形式
对于一定的 X i , Y 的各个别值 Y i 分布 在
E ( Y X i ) 的周围,若令各个 Y i 与条件
Xi
X
均值 E (Y
或
X i ) 的偏差为
u i , 显然 u i 是随机变量,则有
u i Yi E (Yi X i ) Yi 1 2 X i
Xi
X
回归线。
12
回归线与回归函数
回归函数:应变量 Y 的条件期望 E (Y X i ) 随解 释变量 X 的的变化而有规律的变化,如果把 Y 的条件期望 E (Y X i ) 表现为 X 的某种函数
E(Y X i ) f ( X i )
这个函数称为回归函数。 回归函数分为:总体回归函数和样本回归函数 举例:假如已知100个家庭构成的总体。
X
◆性质:u i 是期望为0有一定分布的随机变量 重要性:随机扰动项的性质决定着计量经济方 法的选择
19
引入随机扰动项的原因
●
● ● ● ● ●
未知影响因素的代表
无法取得数据的已知影响因素的代表 众多细小影响因素的综合代表 模型的设定误差 变量的观测误差 变量内在随机性
20
四、样本回归函数(SRF)
样本回 归线,所以样本回归线随抽样波动而变 化,可以有许多条(SRF不唯一)。
Y
SRF1 SRF2
X
22
●样本回归函数的函数形式应与设定的总体回归 函数的函数形式一致。
●样本回归线还不是总体回归线,至多只是未知 总体回归线的近似表现。
23
样本回归函数的表现形式
样本回归函数如果为线性函数,可表示为
__ 2
(Xi X )
(Yi Y )
__
2
其中: i和 Yi 分别是变量 X 和 Y 的样本观测值 X __ X 和 Y 分别是变量 X 和 Y 样本值的平均值
8
使用相关系数时应注意
● X 和 Y 都是相互对称的随机变量 ● 线性相关系数只反映变量间的线性相关程度,不 能说明非 线性相关关系 ● 样本相关系数是总体相关系数的样本估计值,由 于抽样波动,样本相关系数是个随机变量,其统 计显著性有待检验 ● 相关系数只能反映线性相关程度,不能确定因果 关系,不能说明相关关系具体接近哪条直线 计量经济学关心:变量间的因果关系及隐藏在随 机性后面的统计规律性,这有赖于回归分析方法
E (Y X i ) = f ( X i )
这个函数称为总体回归函数(PRF)
15
2.总体回归函数的表现形式
(1)条件均值表现形式
假如 Y 的条件均值 E (Y X i ) 是解 释变量 X 的线性函数,可表示为:
E (Yi X i ) f ( X i ) 1 2 X i
Y
E (Y X i )
—— Y 的条件均值是 X 的线性函数 就参数而言是线性的 —— Y 的条件均值是参数 的线性函数 17
“线性”的判断
E (Yi X i ) 1 2 X i
变量、参数均为“线性” 参数“线性”,变量”非线
性”
E (Yi X i ) 1 2 X
2 i
E (Yi X i ) 1
样本回归线: 对于 X 的一定值,取得 Y 的样本观测值,可计算其条 件均值,样本观测值条件均值的轨迹称为样本回归线。
样本回归函数: 如果把应变量 Y 的样本条件均值表示为解释变量 的某 种函数,这个函数称为样本回归函数(SRF)。
Y
X
21
SRF 的特点
●每次抽样都能获得一个样本,就可以拟合一条
13
例:100个家庭构成的总体
1000 820 888 932 960 1500 962 1024 1121 1210 1259 1324 2000 1108 1201 1264 1310 1340 1400 1448 2500 1329 1365 1410 1432 1520 1615 1650 3000 1632 1726 1786 1835 1885 1943 2037 3500 1842 1874 1906 1068 2066 2185 2210
Y
X
6
◆相关关系的类型 ● 从涉及的变量数量看
简单相关 多重相关(复相关)
● 从变量相关关系的表现形式看
线性相关——散布图接近一条直线 非线性相关——散布图接近一条曲线
● 从变量相关关系变化的方向看
正相关——变量同方向变化,同增同减 负相关——变量反方向变化,一增一减 不相关
7
3.相关程度的度量—相关系数
总体线性相关系数:
Cov( X , Y ) Var( X )Var(Y )
其中: ar ( X ) ——X 的方差;V ar (Y ) ——Y的方差 V C ov ( X , Y ) ——X和Y的协方差
样本线性相关系数:
XY
(X
__ i
__
X )(Yi Y )
● Y 的条件期望
Y
对于X 的每一个取值,
对 Y 所形成的分布确 定其期望或均值,称 为 Y 的条件期望或条 件均值 E (Y X i )
Xi
11
X
回归线与回归函数
●回归线:
对于每一个 X 的取值,
Y
都有 Y 的条件期望
E (Y X i )
与之对应,
代表这些 Y 的条件期 望的点的轨迹所形成 的直线或曲线,称为
9
4. 回归分析
回归的古典意义: 高尔顿遗传学的回归概念 ( 父母身高与子女身高的关系) 回归的现代意义: 一个应变量对若干解释变量 依存关系 的研究 回归的目的(实质): 由固定的解释变量去 估计应变量的平均值
10
注意几个概念
● Y 的条件分布
当解释变量 X 取某固定值时(条件),Y 的值不 确定,Y 的不同取值形成一定的分布,即 Y 的条 件分布。
●回归与相关 ●总体回归函数 ●随机扰动项 ●样本回归函数
4
一、回归与相关
(对统计学的回顾)
1. 经济变量间的相互关系
◆确定性的函数关系
Y f (X )
◆不确定性的统计关系—相关关系
Y f (X )
(ε为随机变量)
◆没有关系
5
2.相关关系
◆ 相关关系的描述 相关关系最直观的描述方式——坐标图(散布图)
又称高斯假定、古典假定
假定1:零均值假定
在给定 X 的条件下 , u i 的条件期望为零 u
i
E (u i X i ) 0
假定2:同方差假定 在给定 X 的条件下, i 的条件方差为某个常数 u
ui
V ar ( u i X i ) E[ u i E ( u i X i )]
2 2
乘法
27
第二节 简单线性回归模型的最小二乘估计
本节基本内容:
● 简单线性回归的基本假定
● 普通最小二乘法
● OLS回归线的性质
● 参数估计式的统计性质
28
一、简单线性回归的基本假定
1. 为什么要作基本假定?
●模型中有随机扰动,估计的参数是随机变量,
只有对随机扰动的分布作出假定,才能确定 所估计参数的分布性质,也才可能进行假设 检验和区间估计
Yi 1 2 X i u i
16
3.如何理解总体回归函数
●实际的经济研究中总体回归函数通常是未知的, 只能根据经济理论和实践经验去设定。“计量” 的目的就是寻求PRF。 ●总体回归函数中 Y 的关系可是线性的,也可是 与 X 非线性的。 对线性回归模型的“线性”有两种解释
就变量而言是线性的
2
31
假定3:无自相关假定 随机扰动项 u i 的逐次值互不相关
C o v ( u i , u j ) E [ u i E ( u i )][ u j E ( u j )]
E (u iu j ) 0
(i j )
假定4:随机扰动 u i 与解释变量 X 不相关
C ov ( u i , X i ) E [ u i E ( u i )][ X i E ( X i )] 0
2453
2487 2586 2150
2610
2710 2400 2650 2900 3150 14
E(Y X i ) 900
1150
1400
1650
二、总体回归函数(PRF)
1. 总体回归函数的概念
前提:假如已知所研究的经济现象的总体应变 量 Y 和解释变量 X 的每个观测值, 可以计算出总体 应变量 Y 的条件均值 E (Y X i ) ,并将其表现为解释 变量 X 的某种函数
计量经济学
第 二 章 简单线性回归模型
引子: 中国旅游业总收入将超过3000 亿美元吗?
从2004中国国际旅游交易会上获悉,到2020年,中国旅 游业总收入将超过3000亿美元,相当于国内生产总值的 8%至11%。(资料来源:国际金融报2004年11月25日 第二版) ◆是什么决定性的因素能使中国旅游业总收入到2020年达到 3000亿美元?