广义矩方法33
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 当1个随机解释变量可以找到多个互相独立的工 具变量,人们希望充分利用这些工具变量的信息, 能否利用及如何利用成为了核心问题。广义矩方 法(GMM)为这一问题提供了解决方案。 • 同时,如果存在>k+1个变量的矩条件,应该如 何处理?广义矩方法(GMM)也为矩条件大于待 估参数的数量,提供了解决办法。 • 广义矩方法 广义矩方法(Generalized Method of Moments, GMM)为动态面板模型的提供了稳健的估计值。 • GMM是近 年计量经济学理论方法发展的重要 是近20年计量经济学理论方法发展的重要 是近 方向之一。 方向之一。
广义矩估计方法( GMM)解决了经典矩方法 广义矩估计方法( GMM)解决了经典矩方法 工具变量方法(Instrumental Variables,IV) 和工具变量方法 局限问题,同时,也为动态面板数据的 动态面板数据的估 的局限问题,同时,也为动态面板数据的估 计提供了有效方法。 计提供了有效方法。
一个估计 。
如果向量过程 {h(θ0 , wt )}
∞ t =∞
T ⌢ ⌢ ⌢ ST = (1 / T )∑ [h(θT , wt )][h(θT , wt )]′ 序列不相关, t =1
如果向量过程 {h(θ0 , wt )} T ⌢ ⌢ ⌢ 其中 Γυ ,T = (1 / T )∑ [h(θT , wt )][h(θT , wt −υ )]′
• 如果向量{h(θ , w )} 序列相关,则可以使用 S 的纽 韦—韦斯特(1987)估计
0 t ∞ t =∞
q ⌢ ⌢ ⌢ ⌢ ST =Γ 0,T + ∑ { − [υ /(1 + q)]}{Γυ ,T + Γ′υ ,T } 1
T ⌢ ⌢ ⌢ Γυ ,T = (1 / T )∑ [h(θT , wt )][h(θT , wt −υ )]′ t =1
经典矩方法的局限:经典矩方法一般是参数的 经典矩方法的局限 个数等于方程个数(即可识别的)。当方程的个 数大于待估参数的个数时(不可识别的),可能 无法求出待估参数。
2、工具变量法 、
工具变量法(Instrument variables)通常用来解决模型中随机解 工具变量法 Instrument variables 释变量且与随机误差项相关的情况,因为此时OLS估计量是有偏的。 工具变量法的原理是:选择工具变量 选择工具变量替代模型中与随机误差项相关 选择工具变量 的随机解释变量。 选择为工具变量的变量必须满足以下条件: 选择为工具变量的变量必须满足以下条件 与所替代的随机解释变量高度相关; (1)与所替代的随机解释变量高度相关; 与随机误差项不相关; (2)与随机误差项不相关; 与模型中其它解释变量不相关,以避免出现多重共线性。 (3)与模型中其它解释变量不相关,以避免出现多重共线性。 对每个解释变量与随机项相关,只要能找到1个工具变量,仍然可以 构成一组矩条件。就可以用IV法了 。 工具变量法的局限:如果1 工具变量法的局限:如果1个随机解释变量可以找到多个互相独立的 工具变量,如何充分利用所有工具变量的信息?? 工具变量,如何充分利用所有工具变量的信息??
)
为普通欧氏距离。使Q 取极小而得到 θˆn 的初值 , 1 ˆ ˆ ˆ 将 θˆn(1) 代入ˆn(1) 中可得 ˆ( S = ∑ [h(θ , ω )][h(θ , ω )]′ ,将此 θ S n1)
n
代入
( 2) n
ˆ( S n1)
Q (θ , Yn ) = [ g (θ , Yn )]′S −1 [ g又可得 (θ , Yn )]
υ =1
GMM估计值 θˆ 的性质
定理:令 g (θˆT ; yT ) 对所有的 yT 关于θ 可微,另θˆT ⌢ ∞ 为GMM估计量,有 r≥a 。令 {ST }t =1为正定 ( r × r ) 矩 ⌢ S 阵序列,使得 ST p S , 是正定的。进一步意 → 味着下面各条成立: ⌢ θ T p θ 0 ; → (a) T ⋅ g (θT ; yT ) L N (0, S ); → (b) ∗ ∞ θ (c)对于任意序列 { T }T =1,满足 θT∗ p θ 0 → 它即为
广义矩方法思想的来源
• 把经典矩方法和IV方法的局限总结一下就是 方程比未知数多,一个自然的想法是作回归, 形象说就是折衷一下。 • 但是每个方程起的作用并不一样,我们希望 某些方程对回归影响大一些,最终结果偏向 它多一点。比如在矩估计中,低阶矩稳定一 些,可以偏向低阶矩多一点。这就想到加权 最小二乘,想到广义最小二乘,从函数空间 应用距离。 距离角度,就是要应用距离。 应用距离
∞ t =∞
t =1
q ⌢ ⌢ ⌢ ⌢ ST =Γ 0,T + ∑ { − [υ /(1 + q)]}{Γυ ,T +Γ′υ ,T } 1 序列相关,
υ =1
四、具体场合的GMM(1) 具体场合的 ( )
标准线性回归模型 y t = X 't β + µ t OLS回归的关键假设是回归残差µ t 与解释变量不 E ( χ t u t ) = 0 即 E[ χ t ( y t − χ t ′ β 0 )] = 0 相关: 令 h(θ , wt ) = xt ( yt − x't β ) 正交条件的个数与未知参数的个数相同,标准回 归模型可视作恰可识别的GMM形式。因为它是恰 可识别的, β 的GMM估计是样本均值等于总体均 值。 T T −1 ˆ β T = {∑ xt x't } ∑ xt y t 结果有 它是通常的OLS估计量, t =1 t =1 因此OLS是GMM的一个特例。
(1× r ) (r ×r ) ( r ×1)
E{h( θ , w )} = 0 ,
( a×1)
( a×1)
( a×a )
T ∞ ⌢ 3 且 S T 是 S = Tlim (1 / T )∑ ∑ E{[h( θ 0 , wt )][h( θ 0 , wt −ν )]'} →∞ t =1 ν = −∞ ( r ×1) (1× r )
n n i =1 n i n i
n n
1 S = ∑ [ h (θ , ω i )][ h (θ , ω i )]′ n i =1
* n
三、最优权重矩阵(3) 最优权重矩阵( )
打破这个怪圈的办法是:取权函数矩阵Wn的初值 为单位阵,此时Q( Q(θ ; y
n
T
) = g (θ ; yT ) ′ WT g (θ ; yT )
∞
矩阵序列。 矩阵序列。 这套方法被克拉默(1946)、弗格森(1958) )、弗格森 这套方法被克拉默(1946)、弗格森(1958)和罗滕博 2 1973)称为“ χ 估计量” 汉森(1982) 格(1973)称为“最小 估计量”。汉森(1982)在此基 础上完善和发展了该方法,并将其称为“广义矩方法”估 础上完善和发展了该方法,并将其称为“广义矩方法” 计。
•
例如:最小二乘法则是选欧氏距离 欧氏距离函数: 欧氏距离 m
Q (θ ) = ∑ ( X ( r ) − θ ( r ) ) 2
r =1
θ的最小二乘估计是取使Q(θ)极小:
ˆ Q(θ ) = min Q(θ )
θ
在广义矩方法(GMM) 在广义矩方法(GMM)中使用是马氏距离 由Mahalanobis(1930)提出的m维空间的马氏距离定义 为: −1
三、最优权重矩阵(1) 最优权重矩阵( )
• Hansen证明:GMM目标函数中,最优的权函数矩阵 Hansen证明:GMM目标函数中, 证明 目标函数中 Wn应取样本均值的渐进方差S的逆矩阵S-1 。 S = lim T ⋅ E{[ g ( θ 0 , wt )][ g ( θ 0 , wt −ν )]' 其中 T →∞ ( r ×1) (1×r ) • 可以看出此时的GMM目标函数变为: 可以看出此时的GMM目标函数变为: GMM目标函数变为
Q(θ ) = ( X − Θ)′S ( X − Θ)
X = ( X (1) , ⋯ , X ( m ) ), Θ = (θ (1) , ⋯ ,θ ( m ),S是关于(X-Θ) ) 其中:
的协方差矩阵。 下面来看Hansen(1982)是如何把马氏距离引进GMM的。
二、广义矩方法的原理
• 令 wt 为一个t期观察到的变量向量,令 θ 为未知参数向量, 为一个t期观察到的变量向量, 为未知参数向量, 为向量值函数。 令h(θ 0 , wt ) 为向量值函数。假定当θ为参数真实值 时E {h(θ 0 , wt )} = 0 ,这称为函数h满足正交条件 。 的样本均值。 令向量值函数 g (θ ; yT ) 表示 h(θ 0 , wt ) 的样本均值。 T
广义矩方法
(Generalized Method of Moments, GMM) )
高
原
广义矩方法(GMM) 广义矩方法(GMM)
• • • • • 一、广义矩方法的提出 二、广义矩方法的原理 三、权矩阵的最佳选择 若干具体场合的GMM 四、若干具体场合的 五、广义矩方法案例
一、广义矩方法的提出
GMM的总结 的总结
0 t ( r ×1) 1 统计模型假定有一组r个正交条件如 ( r ×1) θ 2 其中 wt 是时期t观察得到的严格平稳向量, 0 是未知参数向 ⌢ 量的真实值,h(.)是可微r维向量值函数,GMM估计 θ T 是最小 ˆ− [ g (θ ; yt )]' ST 1 [ g (θ ; yt )] ˆ 化 且估计值具有 θˆT ≈ N ( θ 0 ,VT / T )
−1
三、最优权重矩阵(2) 最优权重矩阵( )
• S是理论值,我们并无法得到。实际计算应该取其 估计值 : n • 但是这个里我们还是不知道θ的真实值,于是应 该用θ的估计值去代替。 1 ˆ S = ∑ [ h (θˆ , ω )][ h (θˆ , ω ) ]′ n 并且可以证明当n→∞时,以概率1收敛于S。 收敛于 • 可是仔细一想,还是有问题。它与Q的定义式形成 怪圈。为了求 θˆ 必须知道 Sˆ ,而为了知道 一个怪圈 怪圈 ˆ ˆ S ,又必须知道 θ 。
g (θ ; yT ) = (1/ T )∑ h(θ , wt ) ⌢ 那么GMM GMM的原理就是求 那么GMM的原理就是求 θT 使 t =1
Q(θ ; yT ) = g (θ ; yT ) ′ WT g (θ ; yT )
的估计值。 达到最小 θ 的估计值。其中 {wt }T =1 是一个 (r × r ) 正定权重
∂g (θ ; yT ) ∂g (θ ; yT ) D' = p lim |θ =θ 0 = p lim |θ =θ ∗T ( r ×a ) ∂θ ' ∂θ '
且 D' 各列线性独立 ⌢ T (θT − θ 0 ) wenku.baidu.comL N (0, V ) → 则
其中
V = {D • S −1 • D′}−1
n
i =1
n
i
n
i
,如此
θˆ 迭代下去,直至
ˆ( ˆ 小于预定精度ε为止。 || θ n1) − θ n(i +1) ||
Hansen等人证明这个迭代过程与初值无关。
最优权重矩阵的估计值
• 如果向量过程{h(θ , w )} 序列不相关,可以得到 S 的一致估计
0 t ∞ t =∞
T ⌢ ⌢ ⌢ ST = (1 / T )∑ [h(θT , wt )][h(θT , wt )]′ p S → t =1
1. 经典矩方法(Moment Method, MM) 经典矩方法( )
经典矩方法是用总体矩等于观察到的样本矩建立 方程。得到未知参数的估计值。
E (Yt i ) = µ i (θ )
i
i = i1 , i2 ,..., ia .
i t
E θ 其中: 为待估参数, µ (θ ) 为第 i 阶样本矩, (Y ) 为 总体的第 i 阶矩。
Q (θ , Yn ) = [ g (θ , Yn )]′S −1 [ g (θ , Yn )]
就是一个马氏距离。 就是一个马氏距离。
S类似于广义最小二乘的方差——协方差矩阵 类似于广义最小二乘的方差 协方差矩阵
• 广义最小二乘 µ 的估计是最小化 ( y − µ )′ Ω ( y − µ ) 的估计是最小化 其中 Ω = E ( y − µ )( y − µ )′