第三章 多元线性回归的简化模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
释变量是否真的对被解释变量具有重要影 响,或你对某个或某些解释变量的参数有 某种猜想,等。即统计推断中的假设检验 问题的有效性。
• 二.模型的假设
• 1.一个完美多元模型的条件
• (1)回想一下,一元模型的条件有哪几条 假设?
• (2)多元情形的条件
– ①各个解释变量之间不能完全相关(即不能出 现某一个解释变量是另外其他解释变量线性组 合的情形)
• (2)所有的关于无偏、一致、有效的直观 解释与一元的情形完全相同。
• Yi=α+β1X1i+ β2X2i+ β3X3i+…+εi (3)
• 第二,提高预测准确度。
• 如果我们要试图解释被解释变量Y的波动,显然, 引入更多的解释变量可以使解释更准确,即预测 Y更准确。
• 第三,提高假设检验中所用“仪器”的准确度。 比如,有时一个因素虽然与已有的解释变量无关, 但你不将其“揪出来”放到模型中去,而将它看 作随机扰动项的一部分,它就可能造成扰动项的 异方差、自相关等问题。
– ③任何一个解释变量均与扰动项不相关。
即:cov(Xji,εj)=0,i=1…k;j=1…n 注意,这里的不相关,指的是样本意义上的。
—④扰动项服从正态分布。
此条在大样本情形下可以不考虑,实际应用中, 大部分情况下不予考虑。
• 2.满足上述条件的结果 • (1)用OLS法估计出的参数是:无偏、一
第三章 经典单方程计量经济学 模型:多元线性回归模型
第一节 为何要用多元模型
• 考虑下面的例子:
• 某人试图解释一个人的工资水平的决定, 为此,他找到的解释变量为受教育水平,
于是他构造了如下的计量模型:
• wagei=α+βedui+εi
(1)
• 这里:wagei-第i个人的工资水平,edui—第 i个人的受教育水平,εi-随机扰动项。
致和有效的 • (2)所有的常规假设检验也是有效的。
要求:最好能了解一下课本P63页中关于估计参 数性质的推导;但必须对上述两条记住。
• 三.估计参数的一致性问题
• 1.OLS估计的参数满足一致性的条件
• (1)再重复一次:一致性是对估计参数的 最基本与实际应用中最通常的要求,但样 本必须足够大。
个解释变量, εi~N(0,σ2)。 • 2.要估计的参数 • α 、 β1、 β2、 β3 …βk,还有σ2。
• 特别要注意:
• 第一,万不可忘记,我们同时要估计参数 σ2。(回想一下,为什么?)
• 第二,要估计的参数,并不一定是我们实 际应用中所一定关注的参数。
– 比如,实际中,我们可能只关注x1的参数β1, 因而其他参数估计的准确性,我们并不关心。
需思考的问题
• 为什么只要加入另外一些与已有解释变量 相关的新解释变量就可保证我们所关注参 数的一致性呢?
• 由于这些新加入的新解释变量与原解释变 量是相关的,这不会对原解释变量的参数 估计形成影响吗?
• 如果直观的理解上述问题,留待后面章节。
第二节 多元线性回模型的参数估计
• 1.基本模型设定 • Yi=α+β1X1i+ β2X2i+ β3X3i+…βkXki+εi (3) • 这里:Yi-被解释变量,Xji-第j(j=1,2 …k)
• 例如,为了研究一国的吉尼系数,某人在 两部门经济中建立了如下模型:
• jct=α+β1yt+β2ct+ β3It+ εt • 这里:jc是t时期的吉尼系数,y、c、I分别
为产出、消费与投资。
• 试分析一下,这个模型有何问题?
– ②扰动项无条件均值为0、扰动项同方差、扰 动项序列不相关。
• 即:E(εi)=0,D (εi)=σ2,cov(εi,εj)=0 • (I,j=1,2…n)
• 考虑一下,如果要满足最基本的一致性,
这个模型有何缺陷?
• 分析:
• 显然,除受教育水平外,影响工资水平的 还有一个人的工作经历。而工作经历则与 受教育水平又相关。
• 一元线性模型相当于忽视了砖头2 的存在
砖头2 砖头1
如果为了测定砖头1 对桌面的压力,应
如何做呢?
压力仅是砖头1的吗?
• 解决办法:只要在模型(1)中加入新的变 量即可,即模型变成如下形式:
在统计上,垂直即表 示不相关,或相关系 数为0。
Y
e X1
含义:解释变量x1、x2组成 一个向量空间,OLS法实际 是在寻找被解释变量到这个 空间的最短距离。
• 以二元线性回归模型 为例
X2 Y
Yi 1X1i 2 X 2i i
第三节 估计参数的优劣与推断
• 一.模型估计出来后面临的两个问题 • (1)估计出的参数的“精确度”; • (2)从实际应用来看,某一个或某几个解
• 3.估计的方法 • ——普通最小二乘法(OLS) • ——最大似然法(ML) • ——广义矩估计(GMM) • 我们只关注OLS法。
• 4.最小二乘估计结果
( , 1, 2 k )T ( X X )1 X Y ,
2
n
1 k
1
n i 1
ei2
n
1 k
1
n i 1
(Yi
Yi )2
n
X中的第一列全为1,记为向量I,它实际上指 的是常数项α后面的变量,显然无论你哪次调 查,它都取1。
• 5.多元线性回归模型的矩阵样本表达式
• Y=Xβ+ε
(5)
• 这里:ε=(ε1, ε2… εn)T • β=(α,β1,β2…βk)
最小二乘法的几何解释
从图上可见,残差项 e与解释变量、被解 释变量的估计值均是 垂直的。
• wagei=α+β1edui+β2 experi+εi
(2)
• 这里:experi-第i个人的工作经历。
• 应用多元线性回归模型的几个原因: • 第一,提高参数估计的”准确度“。即使我们
所关注的仅是一个解释变量X1对被解释变 量Y的影响,但如果还存在其它解释变量X2、 X3…等也对Y有影响,且同时与X1相关,那 么此时就应将X2、X3…等一并引入模型, 即建立如下新模型:
1 k
1
n i 1
(Yi
1 X1i
2 X 2i
k X ki )2
要求:尽可能看懂课本P58-59页的推导过程; 但必须要记住这个结果。
• 这里
X (I, X1, X2, X3
1 X11
X
k
)
1
X12
1 X1n
Xk1
X
k
2
X kn
Y1
Y
Y2
Fra Baidu bibliotek
Yn
这里,Y1、X11等是你调查所得的样本,我们 即用它们进行估计。
• 二.模型的假设
• 1.一个完美多元模型的条件
• (1)回想一下,一元模型的条件有哪几条 假设?
• (2)多元情形的条件
– ①各个解释变量之间不能完全相关(即不能出 现某一个解释变量是另外其他解释变量线性组 合的情形)
• (2)所有的关于无偏、一致、有效的直观 解释与一元的情形完全相同。
• Yi=α+β1X1i+ β2X2i+ β3X3i+…+εi (3)
• 第二,提高预测准确度。
• 如果我们要试图解释被解释变量Y的波动,显然, 引入更多的解释变量可以使解释更准确,即预测 Y更准确。
• 第三,提高假设检验中所用“仪器”的准确度。 比如,有时一个因素虽然与已有的解释变量无关, 但你不将其“揪出来”放到模型中去,而将它看 作随机扰动项的一部分,它就可能造成扰动项的 异方差、自相关等问题。
– ③任何一个解释变量均与扰动项不相关。
即:cov(Xji,εj)=0,i=1…k;j=1…n 注意,这里的不相关,指的是样本意义上的。
—④扰动项服从正态分布。
此条在大样本情形下可以不考虑,实际应用中, 大部分情况下不予考虑。
• 2.满足上述条件的结果 • (1)用OLS法估计出的参数是:无偏、一
第三章 经典单方程计量经济学 模型:多元线性回归模型
第一节 为何要用多元模型
• 考虑下面的例子:
• 某人试图解释一个人的工资水平的决定, 为此,他找到的解释变量为受教育水平,
于是他构造了如下的计量模型:
• wagei=α+βedui+εi
(1)
• 这里:wagei-第i个人的工资水平,edui—第 i个人的受教育水平,εi-随机扰动项。
致和有效的 • (2)所有的常规假设检验也是有效的。
要求:最好能了解一下课本P63页中关于估计参 数性质的推导;但必须对上述两条记住。
• 三.估计参数的一致性问题
• 1.OLS估计的参数满足一致性的条件
• (1)再重复一次:一致性是对估计参数的 最基本与实际应用中最通常的要求,但样 本必须足够大。
个解释变量, εi~N(0,σ2)。 • 2.要估计的参数 • α 、 β1、 β2、 β3 …βk,还有σ2。
• 特别要注意:
• 第一,万不可忘记,我们同时要估计参数 σ2。(回想一下,为什么?)
• 第二,要估计的参数,并不一定是我们实 际应用中所一定关注的参数。
– 比如,实际中,我们可能只关注x1的参数β1, 因而其他参数估计的准确性,我们并不关心。
需思考的问题
• 为什么只要加入另外一些与已有解释变量 相关的新解释变量就可保证我们所关注参 数的一致性呢?
• 由于这些新加入的新解释变量与原解释变 量是相关的,这不会对原解释变量的参数 估计形成影响吗?
• 如果直观的理解上述问题,留待后面章节。
第二节 多元线性回模型的参数估计
• 1.基本模型设定 • Yi=α+β1X1i+ β2X2i+ β3X3i+…βkXki+εi (3) • 这里:Yi-被解释变量,Xji-第j(j=1,2 …k)
• 例如,为了研究一国的吉尼系数,某人在 两部门经济中建立了如下模型:
• jct=α+β1yt+β2ct+ β3It+ εt • 这里:jc是t时期的吉尼系数,y、c、I分别
为产出、消费与投资。
• 试分析一下,这个模型有何问题?
– ②扰动项无条件均值为0、扰动项同方差、扰 动项序列不相关。
• 即:E(εi)=0,D (εi)=σ2,cov(εi,εj)=0 • (I,j=1,2…n)
• 考虑一下,如果要满足最基本的一致性,
这个模型有何缺陷?
• 分析:
• 显然,除受教育水平外,影响工资水平的 还有一个人的工作经历。而工作经历则与 受教育水平又相关。
• 一元线性模型相当于忽视了砖头2 的存在
砖头2 砖头1
如果为了测定砖头1 对桌面的压力,应
如何做呢?
压力仅是砖头1的吗?
• 解决办法:只要在模型(1)中加入新的变 量即可,即模型变成如下形式:
在统计上,垂直即表 示不相关,或相关系 数为0。
Y
e X1
含义:解释变量x1、x2组成 一个向量空间,OLS法实际 是在寻找被解释变量到这个 空间的最短距离。
• 以二元线性回归模型 为例
X2 Y
Yi 1X1i 2 X 2i i
第三节 估计参数的优劣与推断
• 一.模型估计出来后面临的两个问题 • (1)估计出的参数的“精确度”; • (2)从实际应用来看,某一个或某几个解
• 3.估计的方法 • ——普通最小二乘法(OLS) • ——最大似然法(ML) • ——广义矩估计(GMM) • 我们只关注OLS法。
• 4.最小二乘估计结果
( , 1, 2 k )T ( X X )1 X Y ,
2
n
1 k
1
n i 1
ei2
n
1 k
1
n i 1
(Yi
Yi )2
n
X中的第一列全为1,记为向量I,它实际上指 的是常数项α后面的变量,显然无论你哪次调 查,它都取1。
• 5.多元线性回归模型的矩阵样本表达式
• Y=Xβ+ε
(5)
• 这里:ε=(ε1, ε2… εn)T • β=(α,β1,β2…βk)
最小二乘法的几何解释
从图上可见,残差项 e与解释变量、被解 释变量的估计值均是 垂直的。
• wagei=α+β1edui+β2 experi+εi
(2)
• 这里:experi-第i个人的工作经历。
• 应用多元线性回归模型的几个原因: • 第一,提高参数估计的”准确度“。即使我们
所关注的仅是一个解释变量X1对被解释变 量Y的影响,但如果还存在其它解释变量X2、 X3…等也对Y有影响,且同时与X1相关,那 么此时就应将X2、X3…等一并引入模型, 即建立如下新模型:
1 k
1
n i 1
(Yi
1 X1i
2 X 2i
k X ki )2
要求:尽可能看懂课本P58-59页的推导过程; 但必须要记住这个结果。
• 这里
X (I, X1, X2, X3
1 X11
X
k
)
1
X12
1 X1n
Xk1
X
k
2
X kn
Y1
Y
Y2
Fra Baidu bibliotek
Yn
这里,Y1、X11等是你调查所得的样本,我们 即用它们进行估计。