高级计量经济学 广义回归模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
于是
2 2 x x t1 t 2 1
xt1 xt 2
1 r x'x r 1
x x x x
t1 t 2 2 t1
2 t2
r
1 1 r (x'x) 2 1 r r 1 因此 Var(b1)=Var(b2)=2/(1-r2)
第三讲
广义回归模型
基本内容
• 一、回归模型的解释 • 二、多重共线性 • 三、广义最小二乘估计 • 四、异方差性
• 五、自相关性
回归模型的解释
1、边际效应 对模型 Yt=0+1Xt1+…+kXtk+t
如何解释j为“当其他变量保持不变,Xj变化一个 单位时Y的平均变化”? 本质上: j=E(Y|X)/Xj
5.何时需要多重共线性?
多重共线性可能使单个的j不准确,却可使若干 参数的组合更准确。 假设总体回归方程为: E(Y)=0+1X1+2X2
源自文库
记 =1+2,则其样本估计量为 t=b1+b2 于是: Var(t)=Var(b1)+Var(b2)+2Cov(b1,b2) 在离差形式下,记
特别地,取
4.由多重共线性引起的大方差将导致: • 估计量不准确,j的样本估计值可能会远离真值 • 置信区间大,关于j的不同的假设都可能被接受, bj可能不会显著地异于“任何”假设 • t检验值变小,可能将重要的变量排除在模型之外 • 使区间预测的“区间”变大,使预测失去意义。
注意:
除非是完全共线性,多重共线性并不意味着任何 基本假设的违背;因此,OLS估计量仍是最佳线性无 偏估计量(BLUE)。 问题在于,即使OLS法仍是最好的估计方法,它 却不是“完美的”,尤其是在统计推断上无法给出 真正有用的信息。
Var(t)=22 /(1+0.9)=22/1.9=1.052
可见,较强的共线性使得1、2的估计量的方差 较大,从而对它们各自的估计变得不准确;
但却使1、2的组合1+2的估计量的方差变小,
因此使该组合的估计变得更准确。
6.多重共线性的检验 (1)初步观察。当模型的拟合优度(R 2)很高,F 值很高,而每个回归 参数估计值的方差 Var(j) 又非常大(即 t 值很低)时,说明解释变量间可 能存在多重共线性。 (2)Klein 判别法。计算多重可决系数 R2 及解释变量间的简单相关系数 rxi xj。若有某个 rxi xj > R2,则 xi,xj 间的多重共线性是有害的。 (3)此外还有其他一些检验方法,如主成分分析法等。 7.多重共线性的克服方法 7.1 直接合并解释变量 当模型中存在多重共线性时, 在不失去实际意义的前提下, 可以把有关 的解释变量直接合并,从而降低或消除多重共线性。 如果研究的目的是预测全国货运量, 那么可以把重工业总产值和轻工业 总产值合并为工业总产值, 从而使模型中的解释变量个数减少到两个以消除 多重共线性。甚至还可以与农业总产值合并,变为工农业总产值。解释变量 变成了一个,自然消除了多重共线性。
即测度的是“边际效应”(marginal effect)
因此,当一个工资模型为 Y=0+1age+2age2+3education+4gender+ 时,只能测度“年龄”变化的边际效应: E(Y|X)/age=1+22age 解释:“当其他变量不变时,年龄变动1个单位时 工资的平均变化量” 2、弹性: 经济学中时常关心对弹性的测度。
时,弹性为: [E(Y|X)/E(Y|X)]/[Xj/Xj] 即弹性并非常数,而是随着Xj的变化而变化。 3、相对变化 如果模型为 则: lnYt=0+1Xt1+…+kXtk+t j=E(lnY|X)/Xj
解释为:Xj变化1个单位时Y的相对变化量。
多重共线性(multicollinearity)
四个因素共同影响着bj方差的大小。 Rj2为Xj关于其他解释变量这一辅助回归的决定系数 1/(1-Rj2)称为方差膨胀因子(variance inflation factor) 3.多重共线性的经济解释
(1)经济变量在时间上有共同变化的趋势。如在经济上升 时期,收入、消费、就业率等都增长,当经济收缩期,收入、 消费、就业率等又都下降。当这些变量同时进入模型后就会 带来多重共线性问题。 (2)解释变量与其滞后变量同作解释变量。
这时模型常写为: lnYt=0+1lnXt1+…+klnXtk+t 在E(t|lnXt1,lnXt2,,lnXtk)=0的假设下,弹性为
[E(Y|X)/E(Y|X)]/[Xj/Xj]E(lnY|lnXj)/lnXj=j
当原始模型为
Yt=0+1Xt1+…+kXtk+t =j[Xj/(0+1X1+…+kXk)]
=2(X2’M1X2)-1
这里,X2’M1X2恰为如下辅助回归的残差平方和SSR
X2=X1B+v
于是: Var(b2)=2/SSR
表明:第k个解释变量参数估计量的方差,由 模型随机扰动项的方差2 第k个解释变量的样本方差SXk2 第k个解释变量与其他解释变量的相关程度Rk2 样本容量n 四个方面的因素共同决定。
2.估计量的方差 在离差形式的二元线性样本回归模型中: yt=b1xt1+b2xt2+et
一般地,在多元回归中,记 Y=X11+X22+
特别地,假设X2=(X1k, Xnk)’,即为X中的最后一列 由于曾经得到 b2=2+(X2’M1X2)-1X2’M1
因此
Var(b2)= (X2’M1X2)-1X2’M1E(’)M1’X2(X2’M1X2)-1
1.非多重共线性假定
rk (X 'X ) = rk (X ) = k . 解释变量不是完全线性相关的或接近完全线性相关的。 rxi xj 1, rxi xj 不近似等于 1。
就模型中解释变量的关系而言,有三种可能。 (1)rxi xj = 0,解释变量间毫无线性关系,变量间相互正交。这时已不 需要多重回归,每个参数j 都可以通过 y 对 xj 的一元回归来估计。 (2) rxi xj = 1,解释变量间完全共线性。此时模型参数将无法确定。 直观地看,当两变量按同一方式变化时,要区别每个解释变量对被解释变 量的影响程度就非常困难。 (3)0 < rxi xj < 1,解释变量间存在一定程度的线性关系。实际中常遇到 的是这种情形。随着共线性程度的加强,对参数估计值的准确性、稳定性 带来影响。 因此我们关心的不是有无多重共线性, 而是多重共线性的程度。
1
Cov(b1,b2) = -2r/(1-r2)
Var(t)=2[2/(1-r2)-2r/(1-r2)]=22(1-r)/(1-r2)=22/(1+r)
如果r=0,无共线性:Var(b1)=Var(b2)=2 Var(t)=22
如果r = 0.9,有强共线性:
Var(b1)=Var(b2)=2/(1-0.92)=2/0.19=5.32
相关文档
最新文档