古扎拉蒂《计量经济学基础》第7章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最大似然估计量 在第4章中曾指出,在总体干扰项ui服从零 均值和常数方差σ2的正态分布的假定下,双变 量模型回归系数的ML估计量和OLS估计量是相等 的。这种关系可推广到包含任意多个变量的模 型中去。
对于σ2
ML估计量为
uˆ
2 i
n
而σ2的OLS估计量则对双变量情形为
uˆi2 (n 2)
Yi=β0+β1Xi+β2Xi2+ui
八、偏相关系数
简单相关系数:r1j(Y与Xj之间的相关), rij 表示Xi与Xj的相关。 偏相关系数: r1j,i(在Xi不变的条件下, Y与Xj之间的偏相关), rij,1 表示在Y不变条件 下,Xi与Xj的偏相关。
具体的偏相关系数的表达式
x2i x3i ]
se(β1)=+ var (β1)
var (β 2 )= (
x22i )(
x32i x32i )-(
2
x2i x3i )2
OLS估计量的方差和标准误
或等价于
var (β 2 )=
2
x22i (1-r232 )
其中,r23是在第三章中定义的X2和X3的样 本相关系数。
关于
2
R
最大化的游戏
有时一些研究者玩最大化的游戏。也就是
说,要选择有最高 R 2 值的模型。但这样做可能是 危险的。因为在回归分析中,的目的并不是为了
得到一个高的
2
R
,而是要得到真实总体回归系数
的可靠估计并作出有关的统计推断。在经验分析
中,得到一个很高的 R 2 同时发现某些回归系数统 计上不显著或与先验预期的符号相反的情形屡见
其次,记住只是在ห้องสมุดไป่ตู้论两个或多个变量之 间的完全线性关系。多重共线性并不排除变量 之间的非线性关系。假设X3i=X2i2,这就不违背 不完全共线性的假定,因为变量之间的关系不 是线性的。
二、偏回归系数的含义
2度量着在保持X3不变的情况下,X2每变化 1个单位时,Y的均值E(Y|X2,X3)的变化。 3度量着在保持X2不变的情况下,X3每变化 1个单位时,Y的均值E(Y|X2,X3)的变化。
数
于是 : R2 1
uˆi2 / (n k ) yˆi2 / (n 1)
R2
1
ˆ 2
sY2
1 (1 R2 )
n 1 nk
读者完全可以把 R 2 当作另一个摘要统计量来看待。
比较两个R2值 根据判定系数,不管是用调整的还是未经调整
的判定系数来评价两个模型,一定要注意样本容量 n和因变量都必须相同,而解释变量则可取任何形 式。因此,对模型:
-r23 2
(1-r223 )
x22i
x32i
OLS估计量的方差和标准误
σ2的一个无偏估计量是: ˆ 2 uˆi2
n3
现在的自由度是n-3,这是因为在估计 β1,β2和β3,从而消耗了3个自由度。 (这种证明很具有一般性,例如在四变量的 情形中,自由度就是n-4)
OLS估计量的性质 ·过均值:三变量回归线通过均值点 ·无偏性:估计Yi的均值等于真实Yi的均值 ·残差的总和为0 ·残差与X2i和X3i都不相关 ·残差与估计的Yi不相关
国内外经典教材名师讲堂
古扎拉蒂《计量经济学基础》
第7章 多元回归分析:估计问题 主讲老师:李庆海
7.1 本章要点
●三变量模型:符号与假定 ●对多元回归方程的解释 ●偏回归系数的含义 ●偏回归系数的OLS与ML估计 ●多元判定系数R2与复相关系数R ●其它知识要点
引 言 前面各章所广泛讨论的双变量模型在实践中 往往是不适宜的。 比如,在的消费一收入一例中,无形地假定 只有收入X影响着消费Y。但经济理论少见有这般 简单的情形,因为除了收入,还有许多其他变量 会影响消费支出。一个显然的变量是消费者的财 富。 作为另一个例子,对某商品的需求很可能不 仅依赖于其价格本身,而且还依赖于其他替代品 或互补品的价格、消费者的收入、社会地位,等 等。
r1 2 . 3 r1 3 . 2 r2 3 .1
r1 2 r1 3 r 2 3
(1
r1
2 3
) (1
r
2 23
)
r1 3 r1 2 r 2 3
(1
r1
2 2
) (1
r
2 23
)
r 2 3 r1 2 r1 3
(1
r1
2 2
) (1
r1
2 3
)
R 2 r122 + r123 + 2 r1 2 r1 3 r2 3 1- r223
参数估计
Y β1+β 2 X 2 +β 3 X 3
Yi X 2i =β1 X 2i +β 2 X 2i2 +β 3 X 2i X 3i Yi X 3i =β1 X 3i +β 2 X 2i X 3i +β 3 X 3i2
ˆ1 Y ˆ2 X 2 ˆ3 X 3
ˆ2 (
三、偏回归系数的OLS估计与ML估计
OLS估计量
样本回归函数 Yi ˆ1 ˆ2 X 2i ˆ3 X 3i uˆi
–各参数的OLS估计
如第3章所看到的,OLS方法是要选择未知
参数的值,以使残差平方和(RSS)
uˆi2
尽可能小。
min uˆi2
Yi ˆ1 ˆ2 X 2i ˆ3 X 3i 2
模型被正确地设定
X 2与X 3之间无精确的线性关系(没有一个解释变量 可以写成其余解释变量的线性组合)
两点说明 首先,无多重共线性的假定是对理论(即 PRF)模型而言。实际上,当为经验分析搜集数 据时,不能保证回归元之间不存在相关。事实 上,在本章稍后的说明性例子中将会发现,在 多数应用研究中,几乎不可能找到两个或多个 在某种程度上不相关的(经济)变量。只是要 求不存在非常精确的线性关系。
R 2 r122 + ( 1 - r122 ) r123 .2 R 2 r123 + ( 1 - r123 ) r122 .3
要点与结论
1.本章介绍最简单的多元(多变量)线性回 归模型,即三变量回归模型。默认“线性”一词 指对参数为线性,对变量不一定为线性。 2.虽然三变量回归模型在多个方面都是双变 量模型的推广,却涉及一些新的概念,诸如偏回 归系数、偏相关系数、多元相关系数、调整与未 调整(对自由度)R2、多重共线性和设定偏误。 3.本章还考虑多元回归模型的函数形式,如 柯布一道格拉斯生产函数和多项式回归模型。
不鲜。故研究者应更关心解释变量对因变量的逻
辑或理论关系及统计显著性。如果在这一研究过
程中,得到了一个高的 R 2 自然很好;另一方面,
如果
2
R
偏低,也未必模型是坏的。
七、多项式回归模型 即多项式回归模型(polynomial regression models)。这类模型在有关成本和 生产函数的计量经济研究中有广泛的用途。 该图描述了生产一种商品的短期边际成本 (Y)与它的产出水平(X)之间的关系。图中 随手画出的、教科书般的U型MC曲线表明了MC和 产出之间的关系是非线性的。如果要把这种得 自给定散点图的关系加以量化,怎么办?换句话 说,什么类型的计量经济模型能给出边际成本 先降后升的性质?
因此,需要把这个简单的双变量模型推广 到包含多于两个变量的模型。加入更多的变量, 就把我们引到多元(多变量)回归模型的讨论中 去。也就是说,要讨论因变量或回归子Y,依赖于 两个或更多个解释变量或回归元的模型。 最为简单的多元回归模型是含有一个因变量 和两个解释变量的三变量回归模型。在本章和下 一章中,将研究这种模型,而在第9章中,将把它 推广到多于三个变量的情形。通观全书,我们考虑 的是多元线性回归模型,即参数的线性模型;对变 量而言,它们可以是线性的,也可以是非线性的。
OLS估计量的方差和标准误 得到了偏回归系数的OLS估计量,就可按照 附录所指示的方法推出这些估计量的方差和标 准误。如同双变量情形,计算标准误有两个主 要目的:建立置信区间和检验统计假设。
var
(β 1 )=[
1
+
X
2 2
n
x32i
+
X
2 3
x22i
x22i +2 X 2 X 3 x32i -( x2i x3i )2
对三变量情形为
uˆ
2 i
(n 3)
对k变量模型 uˆi2 (n k)
总之,σ2的OLS估计量考虑了自由度的个 数,而ML估计量无此考虑。当然,如果n很大, σ2的ML和OLS估计量将趋于一致。
四、 多元判定系数R2与多元相关系数R 在双变量的情形中我们曾看到定义的r2是回 归方程拟合优度的一个指标;即它给出在因变量 y的总变异中由(单个)解释变量X解释的比例或 百分比。 容易把r2这个符号推广应用到含有多于两个 变量的回归模型中去。因此,在三变量模型中, 我们也许想知道Y的变异由变量X2和X3联合解释 的比例。提供这一信息的数量被称为多元判定系 数(multiple coefficient of determination), 记为 R2;概念上R2近似于r2。
ln Yi = 1 + 2 X 2i + 3 X 3i + ui Yi = 1 + 2 X 2i + 3 X 3i + ui
计算的两个R2是不可比较的。理由如下:按定 义,R2度量着因变量的变异被(诸)解释变量解释 的部分(占Y总变异的比例)。因此,前者R2度量着 由X2和 X3解释的lnY的变异部分,而在后者R2则度量 着被解释的Y的变异部分,两者不是同一回事。
7.2 重难点导学 一、三变量模型:符号与假定 将双变量的总体回归模型推广,可得三变 量PRF为:
Yi 1 2 X 2i 3 X 3i ui
E(ui | X 2i , X 3i ) 0
对每一个i
cov(ui , u j ) 0 i j
var(ui ) 2
cov(ui , X 2i ) cov(ui , X 3i ) 0
se(β 2 )=+ var (β 2 )
var (β 3)= (
x22i )(
x22i x32i )-(
2
x2i x3i )2
OLS估计量的方差和标准误
或等价于
var (β 3)=
2
x32i (1-r232 )
se(β 3)=+ var (β 3)
cov (β 2 ,β 3 )=
x2j 1 Rj2
六、 R2及校正R2
R2 1 RSS 1 uˆi2
TSS
yˆi2
这里, yi2就是 (Yi Y )2,与模型中X 变量的个数无关。但RSS
即 uˆi2却与模型中出现的回归个数相关,随着X 变量个数的增
加, uˆi2很可能减小;随之所定义的R2也将增大。应考虑样本个
五、 复判定系数R2与复相关系数R
TSS ESS RSS yˆi2 uˆi2
ESS为回归平方和 yˆi2 ˆ1 yi x2i ˆ2 yi x2i
RSS为残差平方和 uˆi2
R2 ESS ˆ1 TSS
yi x1i ˆ2
yi2
yi x2i
var(ˆj )
2 1
4.虽然R2和调整R2是对所选模型对给定数 据集拟合好坏的总度量,但它们的重要性不可 过分夸大。最为关键的是对进入模型的变量的 系数,应带有什么先验性符号,从而对这个模 型有一个基本的理论预期,以及下章要讲的关 于这些系数的统计显著性。 5.本章所给出的结果,很容易就能推广至 涉及任意多个回归元的多元线性回归模型中, 但代数运算会变得非常烦琐。使用矩阵代数就 可避免这种烦琐性。
yi x2i )( x32i ) ( yi x3i )( x2i x3i ) ( x22i )( x32i ) ( x2i x3i )2
ˆ3 (
yi x3i )( x22i ) ( yi x2i )( x2i x3i ) ( x22i )( x32i ) ( x2i x3i )2