第四章__联立方程模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Chapter4 联立方程模型
本章关注的目标Y 不止一个,而是多个。
或者其中关注的某一目标与其它目标有内在联系,如果我们不知道其它的目标,就不可能知道要关注的目标。
例如,我们要知道某一商品的市场价格,我们必须要同时知道该商品的供给曲线和需求曲线。
自然也就存在多因多果的关系问题。
从内生性问题角度看,某一解释变量i X 从另一方面考察可能成为Y 的结果,那么Y 就是原因,因为i X 中有Y 的成分,从而()0i E U X 不成立,产生内生性问题的第3种情形,联立性问题。
在第二章现代观点理念的陈述中,把Y 看成是一个随机向量,所有的语言经过适当的修正,完全可以类似重复。
但由于因变量Y 的个数的增加,也就带来了许多“单方程线性回归模型”不曾有的问题。
本章主要讨论联立的线性系统。
内容有,联立方程模型的表述,各种估计和检验的假设条件,系统的可识别,以及一些专题。
其中GMM 方法是本章的特色。
它把2SLS 的方法又提高了一步。
一、基本概念和模型
系统:多个变量间的相互联系,一般用方程表述。
线性系统则认为它们的联系是线性的。
变量:描述系统状态的基本要素。
变量分成两类。
一类是内生变量,含义是,一旦系统变量间的相互联系确定,这些变量的值就是完全确立的。
内生变量一般是系统要关注的对象。
另一类是先决变量,含义是,它们的值不是由系统直接确定。
它又分成:(1)外生变量,它的值由系统的外部给定;(2)滞后的内生变量,它的值由内生变量的前期确定。
有时,(1)(2)不加区分统称为外生变量。
不过这两种内生变量有实质性区别,后一种滞后变量会带来内生性问题。
线性模型:系统中的变量通过线性方程或加上随机误差项联系,称为联立系统的线性模型。
模型分成简约式(reduced formed )和结构式(structure form )两种:
1、简约式:每个内生变量由系统的先决变量的线性式加随机项构成,先决变量前的系数称为简约系数。
2、结构式:每个方程由内生变量和先决变量的混合线性式或加随机项构成。
结构式有以确定的经济内内涵,它们从理论模型简化而成。
一般把结构式分成四类:
(1) 行为方程 (2) 技术方程 (3) 平衡方程
(4) 定义方程
每个结构方程中,变量前的系数称为结构参数。
系统的描述:
Y 表示内生变量,设共有G 个内生变量:1Y ……G Y X 表示先决变量,设有M 个先决变量:1X ……M X
U 表示随机误差,误差项的个数随行为和技术方程的个数来定。
例:简单的宏观消费-投资模型:
可加随机项 不可加随机项
消费方程:t t t U Y C ++=21αα 投资方程:t t t t Y Y I εββ+-+=--)(2121 平衡方程:t t t t G C I Y ++= 则:内生变量:t C ,t I ,t Y 先决变量: 21,--t t Y Y t G 随机误差:t t U ,ε。
联立方程模型主要分成三类:
(1) 似无关模型(Seemingly Unrelated Regression )(SUR 模型)
1111U X Y +=β 2222U X Y +=β
……
G U X Y G G G +=β
模型中每个方程都是reduced form,且有不同的先决解释变量和因变量,并有各自的参数值1,=g g β……G 。
相关联的仅是不可观测的误差项。
可以理解为系统有一个共同的环境,且系统因果关系由随机项构成。
由此设定:
()1G |X 0g E U X =,g =1…G 。
这是一个很强的假定,意味着任意i U 与j X 不相关,弱一些的假定是:()
0X |g =g U E ,
g =1…G,但不要求1U …G U 不相关。
总体上,g U 可能与其他外生变量j X (g 不等于j )
相关,似无关的含义是指后一种含义。
(2)面板数据模型(Panel Data )( PD 模型)
t t t Y X U β=+,()|0,t t E U X = t =1,2…T。
这里,先决解释变量,因变量和参数值都相同,区别的仅在于t ,一般理解为不同时段,也可以是其它指标如不同地区、城市等,t U 可理解为不同的t 导致不同的随机误差。
故ti U 和tj U 可以不独立,也可以不同分布等,视各种实际情况而定。
注:1、这种简单形式的面板数据模型,可以看成是一类特殊的联立方程。
其他各种特征的面板数据模型将在第五章中介绍。
SUR 和PD 是联立方程的特殊形式,其特点为每个内生变量i Y 都可以写成单方程的多元线性回归形式,且都是正确设定的。
区别是,SUR 模型每个i
Y
第四章 联立方程模型
有自己的外生变量,而PD 则是所有i Y 都有相同的外生变量。
2、另一种介于SUR 和PD 模型的联立式称为跨方程的联立式,含义是:如果某i Y 与j Y 中有相同的先决变量,且参数值相同,那么可将i Y 与j Y 合并成跨方程的联立式,如:
11211121112121
22 0
0 k k k X X X Y Y X X X ββ⎛⎫⎛⎫⎛⎫= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭+⎪⎪⎭
⎫
⎝⎛21U U ,并将其看成是一个整体。
(3)同时性模型(Simultanious Equation )(SEM)
()()()()111111U Z Y Y ++=δχ ……
()()()()G G G G G G Y Y Z U γδ=++
这里,()h Y 是指不包括h 在内的其它变量的部分(()Y Y h ⊂);()h Z 是指先决变量的部分(()X X h ⊂);()h γ和()h δ是变量()h Y 和()h Z 的参数;h U 是随机误差。
即同时性模型是把每个内生变量写成其它部分内生变量和先决变量的线性式。
因为SEM 模型中右边方程中含有其它内生变量,所以内生变量1
G Y Y 是同时确定的。
它不能象模型(1)和(2)那样,单
独就可以确定。
如果我们能够通过线性变换把SEM 中右边的内生变量部分消去,得到它的简约式,那么SEM 也可以象SUR 和PD 那样处理。
我们把SEM 左边的每个h Y 都移到方程的右边,使其得到按行排列的统一的紧凑形式:
0Y X U Γ+∆+=。
这里,1
()G Y Y Y =是1×G矩阵,1()M X X X =是1×M 矩阵,且可以观测抽样;
()ij γΓ=是G ×G 矩阵,()ij δ∆=是M ×G 矩阵,是未知参数; 1
()G U U U =是1×G矩阵,是随机误差。
注:紧凑式也可按列排成按行的转置形式:0Y X U Γ+∆+=。
采取那种方式视方便而定。
假定Γ可逆,否则内生变量Y 中的选择至少有一个是多余的,且()E U U '∑=是随机误差的协方差阵,为G ×G 的非奇异矩阵。
那么模型可以方便地转化成简约式:
()()
11
Y X U X V --=-∆Γ+-Γ=∏+。
但是,将SEM 写成简约式面临一个问题:
当我们从简约式得到∏的估计∏ˆ,在什么条件下,我们可以从∏ˆ得到Γ和∆的估计ˆΓ和∆
ˆ,称为系统的可识别问题。
这个问题不是显然的,甚至有点微妙。
因为Γ与∆是原模型
的未知参数,有其经济含义,如果从∏
ˆ得不到Γ和∆的估计ˆΓ和∆ˆ,∏ˆ的估计就没有意义。
这个问题我们放到后面讨论,先讨论联立方程模型的估计和检验。
二、.联立方程的估计和检验
为要利用单方程的多元回归方法,我们先把联立方程中的三种形式统一处理成
Y X U β=+的矩阵形式。
(1)SUR 模型
1
11122200
00
00
G G G G X U Y X U Y X U Y X U ββββ⎛⎫⎛⎫⎛⎫⎛⎫ ⎪⎪ ⎪ ⎪ ⎪⎪ ⎪
==
+=+ ⎪ ⎪⎪ ⎪ ⎪ ⎪⎪ ⎪⎝⎭ ⎭⎝⎭⎝⎭
⎝。
(2)PD 模型
11T T Y X Y U X U Y X ββ⎛⎫⎛⎫ ⎪ ⎪==+=+ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭。
(3)SEM 模型
(1)(1)
111(2)(2)22()()()0000()0000()G G G G G Y X U Y Y X U Y X U Y Y X U ββββ⎛⎫⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪
⎪ ⎪ ⎪ ⎪==+=+ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎪ ⎝⎭⎝⎭⎭
⎝。
这里X 是G ×K 矩阵,G 、K 视不同联立形式而定。
加上下标i 表示第i 次随机抽样。
类似于单方程模型,对联立式的OLS 估计与检验我们有如下假定:
假定:Sols1: ()0i i E X U '= i ∀成立;
Sols2:()i i E X X A '=非奇异 i ∀成立。
那么,()()1
i i i i E X X E X Y β-''=⎡⎤⎣⎦
i ∀。
从总体中随机N 次抽样,由得到:
1
1111ˆN N
P
i i i i i i SOLS X X X Y N N ββ-==⎛⎫⎛⎫''=−−→ ⎪ ⎪⎝⎭⎝⎭
∑∑ 写成矩阵表达,Sols ()Y X X X ''=-1
ˆβ,与单方程形式上一致,但矩阵Y 、X 的内涵是
不一样的。
这里1(,,)N Y Y Y '=,1()i G Y Y Y '=,1(,,)N X X X '=,1
i N =。
对SUR ,X 是NG ×K 矩阵,对PD ,X 是NT ×K 矩阵。
)
(
)1
1
ˆ0,d
N β
β---−−→A BA ,()i
i
i
i
E X UU X ''B = i ∀。
第四章 联立方程模型
又记,残差ˆˆi i i
U Y X β=-,将i 排成列得,ˆˆU Y X β=-。
那么,ˆˆˆp
X UU X B ''B =−−→。
于是,βˆ的渐近协方差估计()
()()
1
1
ˆˆˆ--''''=X X X U U X X X V ,V
ˆ称为βˆ稳健的协方差估计。
且t 值ˆˆ()j j
NG K se t ββ-。
当N 很大,近似于标准正态分布。
注:1)在联立方程模型中,对误差项协差矩阵Ω=()i i E U U '是没有任何限制的。
故
ΩI 2σ≠仅是一个正定阵,所以SOLS 方法仅能保证β
ˆ是一致的,不一定是有效的。
由于Ω的复杂性,如果未知,一般SOLS 方法估计的效果是很差的,只是作为其他估计方法的
过渡。
2)关于检验,利用Wald 统计量()()()1
2
ˆˆˆQ W c q cVc c q β
βχ
-''=--→,秩
c Q =。
对不同的问题选择适当的c 和q ,q c H =β:0,可进行β的有关线性组合的检验,不再需要任何其它假定。
2、联立方程的GLS 估计与检验
Sols 估计尽管皮实,条件要求少,但毕竟有效性差。
如果对随机误差项U 有更强的假定条件,则可对Sols 估计做进一步的改进,称为广义最小二乘估计SGLS 。
假定:SGLS1:()i i U X E ⊗=0, i ∀。
含义是i U 中每个元素同i X 中每个元素都不相
关。
⊗是Kronecker 乘积:111212122212n n m m mn a a a a a a a a a B B B ⎛⎫
⎪B B
B
⎪
A ⊗
B ⎪
⎪B B B ⎝⎭
,⎪⎪⎪⎭⎫ ⎝⎛=A mn m n a a a a 1111 。
A ⊗
B 的含义是对矩阵的线性变换。
与SGLS1等价的条件是:()0il
k E X U '=, ,l k ∀; 假定SGLS2:()i i E U U 'Ω=正定,且()
1
i i E X X -'Ω非奇异。
那么对i i i i U X Y +=β,用2
1-
Ω
乘两边得,1112
2
2
i i i i Y X β-
-
-
Ω=Ω+Ω即i i i i Y X U β=+。
于是有,()i i G E U U I '=。
随机抽取样本N ,对变换后新的模型i i i i Y X U β=+做SOLS ,得
广义最小二乘估计,记成SGLS *β
ˆ。
*β
ˆ=1
11N
N i i i i i i X X X Y --=⎛⎫⎛⎫
'' ⎪ ⎪⎝⎭⎝⎭
∑∑ =1
1
11111N N p i i i i i i X X X Y N N β----=⎛⎫⎛⎫''ΩΩ−−→ ⎪ ⎪⎝⎭⎝⎭∑∑,是一致估计。
再写成矩阵式:
ˆβ
*=()()()()Y I X X I X N N 11
1---Ω⊗'Ω⊗'。
这里X是NG×K矩阵,Y是NG×1矩阵。
并仍可以证明,SGLS*
βˆ是N渐近正态的。
)()
*11
ˆ0,
d N A BA
ββ--
-−−→,()
1
i i
A E X X
-
'
=Ω,()
11
i i i i
B E X U U X
--
''
=ΩΩi∀。
由于Ω一般未知,用SOLS残差
ˆˆ
ˆ
i i i OLS
U Y Xβ
=-,由向量组的弱大数定律(WLLN),我们有:1
1ˆˆ
ˆˆˆ
N
P
i i
i
U U
N=
'
Ω=−−→Ω
∑。
把ˆΩ作为Ω的一致估计,代入到上述表达式当中,便可得到可行的广义最小二乘估计FGLSβˆ:()
()()
()
1
11
ˆˆ
FGLS N N
X I X X I Y
β-
--
''
=⊗Ω⊗Ω。
当N相对G不是很大,ˆΩ有很差的有限样本性质。
我们需要获取更多关于Ω的信息,才能得到更好的ˆΩ的形式。
如独立性、序列相关性,等等。
获取FGLSβˆ的步骤:
(1)Y on X得残差ˆU和ˆΩ、1
ˆ-
Ω;
(2)再由公式()
()()
()
1
11
ˆˆ
FGLS N N
X I X X I Y
β-
--
''
=⊗Ω⊗Ω立得ˆ
FGLS
β。
)*
ˆˆ(1)
FGLS p
o
ββ
-=,即FGLSβˆ与GLSβ
ˆ
性。
FGLSβˆ与SOLSβˆ相比,在充分信息条件下:()()
i i i i i
E u u X E u u
''
=,含义是
i
u中每一
分量的方差和它们的协方差与
i
X无关。
这是系统同方差假设的一种表示。
直观讲就是如果B A
=,那么FGLSβˆ有更好的有效性。
可得渐近方差估计:
ˆ
var()
FGLS
Aβ=
1
1
1
1
ˆ
ˆ-
=
-
-
⎪
⎭
⎫
⎝
⎛
Ω'
=∑N
i
i
i
X
X
N
A。
一般()()
i i i i i
E u u X E u u
''
=条件太强,减弱为下面的:
假定SGLS3:()()
111
i i i i i i
E X U U X E X X
---
'''
ΩΩ=Ω,()
i i
E U U'
Ω=。
有关FSGLSˆβ的线性组合的假设检验:
一般用Wald检验,与OLS类似。
但当SGLS1—3成立,一种类似单方程基于残差形式的F检验则更方便。
设对β有Q个约束条件,
i
U
~
是带约束条件下的FGLSβˆ的残差,i Uˆ是不带约束下FGLSβˆ的残差,ˆΩ是无约束下的用SOLS残差平方和做的估计。
那么,可以证明:
112
11
ˆˆˆˆ
N N
i i i i Q
i i
U U U Uαχ
--
==
⎛⎫
''
Ω-Ω−−→
⎪
⎝⎭
∑∑
第四章 联立方程模型
进一步,在有限样本条件下有类似残差形式的F 统计量:
()111111ˆˆˆˆˆˆˆ/,N N N
i i i i i i i i i NG K F U U U U U U F Q NG K Q
α---===-⎛⎫⎛⎫'''=Ω-ΩΩ−−→- ⎪ ⎪
⎝⎭⎝⎭∑∑∑ 利用F 统计量可以方便地做β的部分参数为0的检验。
注:SOLS 和SGLS 只能用于单方程是正确设定的联立方程,对SEM 由于内生性基本不能用。
FGLS 本质是解决联立方程估计的有效性问题,但需要有更多的信息条件。
当Ω是对角阵时SOLS 和SGLS 没有区别。
具体到SUR 或PD ,对误差项的设定还要具体分析。
3、联立方程的工具变量估计和GMM 方法
正如单方程模型会遇到内生性问题,联立方程模型更容易遇到内生性问题。
特别对于SEM 模型,内生性是不可避免的。
因为结构式中已包含有其它的内生变量,从而从结构式到简约式的转化中,自然也把误差项带入了其它的结构式中。
由于内生性的存在,我们知道,这使得SOLS 和FGLS 是有偏和不一致的。
SOLS 和FGLS 方法基本不能用。
我们把单方程模型中消除内生性的工具变量法引入到联立方程模型中来,并由此引入更一般的广义矩(GMM )方法。
另外,从联立方程的可识别中,合理安排每个方程的外生变量还可以自己解决工具变量的寻找问题。
把联立模型形式的写成类似SUR 模型的形式:
1111U X Y +=β;2222U X Y +=β;……;G G G G U X Y +=β,1G K K K =++。
对每一个g ,g X 是1×g k 向量,既包含有外生变量,也包含有内生变量。
从而g X 与g U 有相关性。
如同单方程工具变量法一样,对每一结构方程g ,选择工具变量g Z 是1×g L 向量,它们是可观测的外生变量,且g g K L ≥,g Z 中包含单位和其中的外生变量。
满足工具条件:
SIV1:()
0g
g E Z U '=,1g G =;
SIV2:秩()
g
g g i
E Z X k '=,1g G =,i ∀。
对任意的观测i ,用下标包装成矩阵形式:
1i i iG Y Y Y ⎛⎫ ⎪= ⎪ ⎪
⎝⎭
,
1200
0000000i G i
X X X X ⎛⎫
⎪
⎪
= ⎪ ⎪⎝⎭, ⎪⎪⎪⎭⎫ ⎝⎛=iG i i U U U 1;⎪⎪⎪
⎭
⎫ ⎝⎛=G βββ 1, i i i i U X Y +=β。
相应的,12000000000
i G i
Z Z Z Z ⎛⎫
⎪ ⎪
= ⎪
⎪⎝⎭ L =G L L ++ 1。
如果g L =g K ,1
g G =。
由假定SIV2,()g
g E Z X '非奇异,从而,()i i E Z X '是K ×K 非
奇异矩阵。
对i i i i U X Y +=β两边乘上i Z ',取期望得[]()1
i i i i EZ X E Z Y β-''= i ∀。
对i 随机抽样,1
i N =。
仍设Z 和X 是NG ×K 的样本观测矩阵。
那么可得联立方程
模型的工具变量估计,1
1111ˆN N i i i i i i SIV Z X Z Y N N β-==⎡⎤⎛⎫''= ⎪⎢⎥⎣⎦⎝⎭
∑∑=()()Y Z X Z ''-1,并由假定SIV1,知ˆP SIV ββ−−→。
但是,如果K L >,那么()X Z '就不再是一个方阵,我们无法直接得到SIV β
ˆ。
或者说,我们可以在L 中任意选择K 个工具变量,选择哪K 个?回忆2SLS ,对过度识别的工具变量集1
L Z Z ,我们选择的是它们的线性组合1ˆˆK
Z Z 作为新工具变量,这事实上是对1L Z Z 进行了特殊的线性变换。
下面,我们换一种思路,即所谓的广义矩阵估计(GMM 汉森1982)方法。
该方法的基本
思路是,如果我们引入了外生的工具变量替代了原方程的某些内生变量,那么选择原方程残差平方和最小的标准就不一定最合理。
由于工具带来了“信息”,应当选择与工具变量相关的“加权”的残差平方和最小。
讨论如下:
由SIV1,()0i i E Z U '=()[]0=-'⇒βi i i X Y Z E ,i ∀。
再由大数律:()1
10N P i i i i Z Y X N β='-−−→∑。
但固定N ,()110N
i i i i Z Y X N β='-=∑ ,这样的β不一定存在。
退一步,选择β
ˆ使得:以i Z '为“权”的平方和()(
)⎥⎦
⎤⎢⎣⎡-''⎥⎦⎤⎢⎣⎡-'∑∑==ββˆˆ1
1i i N
i i i i N i i X Y Z X Y Z 取最小值。
这种思想是OLS 方
法的自然推广。
特别当I Z i =,就是OLS 方法。
还应当考虑误差方差对估计的不均匀影响,类似于GLS 方法,如果已知Ω的有关信息,找“权”1
2
-Ω
作为工具使得方差影响变得均匀。
为此,一般的定义,找一个与工具变量和
工具变量协方差相关的矩阵作为“权”。
定义:设W ˆ是一个L ×L 的已知正定矩阵,如果ˆGMM β是求解下式二次型的最优解
()()()()11ˆˆmin N N i i i i i i i i Z Y X W Z Y X Z Y X W Z Y X β
ββββ=='⎡⎤⎡⎤'''''--=--⎡⎤⎡⎤⎣⎦⎣⎦⎢⎥⎢⎥⎣⎦⎣⎦
∑∑,则称ˆGMM β是广义矩估计GMM βˆ。
第四章 联立方程模型
因为W
ˆ正定,故有分解W ˆ=2
121
ˆˆW W ⨯,令=Y ~12
ˆW Z Y ',1
2ˆX W Z X '=。
则: ()()()()
ˆmin min Z Y X W Z Y X Y X Y X ββββββ''⎡⎤⎡⎤''--=--⎡⎤⎡⎤⎣⎦⎣⎦⎣
⎦⎣⎦。
故得: ()
(
)1
ˆGMM X X X Y β-''==(
)()Y Z W
Z X X Z W
Z X ''''-ˆˆ1。
可以证明,
ˆGMM
β是一致和渐近正态
的,且)
()
()()
1
1
ˆGMM C WC C W WC C WC ββ--'''-=Λ,其中()i i C E Z X '=,
)()(i i i i i i U Z Var Z U U Z E '=''=Λ,i ∀。
这里W 是一非随机的给定的与工具Z 的方差信息
有关的矩阵。
我们补充假定:
SIV3:ˆ{}N W 是一已知的随机矩阵序列,且有ˆp N
W W −−→。
特别,取ˆN W =()11
1111N
p i i i Z Z Z Z E Z Z W N N ---=⎛⎫⎛⎫'''=−−→=⎡⎤ ⎪ ⎪⎣⎦
⎝⎭⎝⎭∑, 则()()1
11
ˆGMM
X Z Z Z Z X X Z Z Z Z Y β---⎡⎤⎡⎤''''''=⎣⎦⎣⎦。
类似于单方程的2SLS ˆβ
估计,故称联立的S2SLS ˆβ。
S2SLS ˆβ满足SIV1—3的条件,故有一致性和渐近正态性,但不一定是渐近有效的。
下面的问题是,我们需要寻找一个更好的序列ˆp N
W W −−→,使得估计ˆGMM β具有最小方差性,称该W 为最优权矩阵。
最优权矩阵的求法:
1) 设β
ˆˆ是β的一个任意一致估计,大部分情况下,取βˆ
ˆ是联立的S2SLS 最方便; 2) 有了βˆ
ˆ,对每个i ,得到G ×1的残差向量:βˆ
ˆˆˆi
i i X Y U -=; 3) 再得到ˆN Λ=1
1ˆˆˆˆN i i i i i Z U U Z N =''∑,且()ˆ()p N i i i i i i E Z U U Z Var Z U '''Λ−−
→==Λ; 4)选取1W -=Λ;
补充假定SIV4:W =1
-Λ,()i i U Z Var '=Λ,i ∀。
ˆˆN N
W =Λ,则1
ˆˆˆGMM X ZWZ X X ZWZ Y β-⎡⎤⎡⎤''''=⎣⎦⎣⎦为渐近有效的GMM 估计,称为最小“卡方”估计,记成ˆKai
β,或ˆKai β-。
证明:因为满足SIV1—3条件下,ˆGMM β的协差矩阵()()()
1
1
C WC C W WC C WC A --'''Λ=,
而满足SIV1—4条件下,ˆKai
β的协差矩阵简化为()()1
1
1C WC C C B ---''=Λ=。
要说明B 是
渐近有效的,即要证A B -半正定,即要证1
1
B
A ---半正定。
注意到,1
12
2
Λ=ΛΛ正定,
()()
()1
111B A C C C WC C W WC C WC ----''''∴-=Λ-Λ
1
111111112
2
222222C C C WC C W WC C W C -----⎛⎫⎛⎫⎛⎫
''''=ΛΛ-ΛΛΛΛΛΛ ⎪⎪ ⎪⎝⎭⎝⎭⎝⎭
()1
11
2
2()
C I
D D D D C -
-
-'''=Λ
-Λ,12
D =Λ。
1()I D D D D -''-是幂等矩阵,它是半正定的,11B A --∴-半正定。
又,如果我们有关于工具变量与误差项乘积方差可分离的信息,一个条件期望下的充分条件是:()()i i i i E U U Z E U U ''=。
令()i i E U U 'Ω= i ∀。
补充假定SIV5:()()i i i i i i E Z U U Z E Z Z '''=Ω i ∀。
现在用1
1ˆˆˆˆˆN i i i U U N ='Ω=∑,
βˆˆˆˆi i i X Y U -=是S2SLS 残差。
知()i i P U U E '=Ω−→−Ωˆi ∀。
选取ˆN W =()
1
1111ˆˆ[()]N p i i N i i i Z Z Z I Z N W E Z Z N ---=⎛⎫⎡⎤'''Ω=⊗Ω−−→=Ω ⎪⎣⎦⎝⎭
∑。
(注意与11ˆ[()]
i i i i E ZUU Z --''Λ=不同)那么,在SIV1—5条件下: 3ˆSLS
β=()[]
()
Y Z Z I Z Z X X Z Z I Z Z X N N 'Ω⊗'''Ω⊗''---11
1)ˆ()ˆ(。
(不必记忆)
称为β的GMM 三阶段最小二乘估计,记成3ˆsls
β。
3SLS βˆ是无偏、一致、渐近有效的。
注1.当条件SIV5不成立时,3SLS βˆ就不如最小卡方Kai-βˆ来得好。
即使SIV5成立,3SLS βˆ也不一定比最小卡方Kai-β
ˆ表现好。
但现在仍多用3SLS ,部分是历史原因,另外在相对少的样本量情况下,3SLS β
ˆ有效性比最小卡方Kai-βˆ表现好。
2.传统观点下,3SLS βˆ与上述的GMM 方法得到的3SLS βˆ有所不同。
传统的3SLS 方法是: 1.第一阶段X on Z ,得()1
ˆZ Z Z X π
-''=; 2.第二阶段ˆˆi i
X Z π=,和Y on ˆX ,得2SLS 残差ˆˆU 和1
1ˆˆˆˆˆN
i i i U U N
='Ω=∑;
3.第三阶段对ˆ(,)Y X 做GLS ,得βˆ=1
1111ˆˆˆˆˆN N
i i i i i i X X X Y ---==⎡⎤⎡⎤''ΩΩ⎢⎥⎢⎥⎣⎦⎣⎦
∑∑ =(
)1
1
1
ˆˆˆˆˆ[()]N N
X I X X I Y ---''⊗Ω⊗Ω。
第四章 联立方程模型
注意,在SIV1-SIV3假定下,G3SLS β
ˆ是一致的,但传统的3SLS βˆ不一定是一致的。
3. 联立方程模型有多种估计方法,对模型的要求是,估计精度越高,要求越高。
我们
不一定要一味追求高精度。
例如我们仅关注第一个结构式的1
ˆβ,那么我们仅按单方程模型要求011='U Z E 和秩111EZ X k '=就可得1β的2sls 1
ˆβ,而不必对系统的其它方程寻找更多的工具变量。
具体问题要具体分析。
由于某些方程的设定采用了3SLS 方法,会导致问题复杂化。
数据、模型、计算机是为人服务的,在熟练掌握计算机软件的前提条件下,把多种估计方法加以比较,并做出合理解释。
大量的实践经验是必不可少的。
具体举例略。
我们知道,1W -=Λ是在给定工具变量集Z 下的最优权矩阵。
进一步的问题是,选择满足什么条件的工具变量集是最优的。
换句话说,工具变量并不是越多越好,因为太多的工具变量造成过度识别,产生非常差的有限样本性质。
(减少自由度,有效性降低。
)关于最优工具变量集,我们有陈述如下的定理:
最优工具变量定理:如果对某一向量集Z 满足:()0ig i E U Z =,1
g G =i ∀。
即i Z 对每个结构方程都是外生的。
那么,取*i Z =()()1i i i Z E X Z -Ω,其中()()i i i i Z E U U Z 'Ω=,
若秩()*i i E Z X K =,则*i Z 是最优工具变量。
该定理说明,一旦我们得到*i Z ,所有其它有关i Z 的函数作为工具变量加入是多余的。
例如,GLS 方法。
()0i i E U X =,且()i i i E U U X '=Ω。
那么最优工具是*1i i Z X -=Ω。
问题是()i Z Ω和()
i i E X Z 的验证,如果没有更多的信息假定,我们没有更多的手段。
4. 联立方程模型的假设检验
(1)有了Kai-βˆ和渐近方差ˆ()kai Avar β=()()111ˆˆ--=⎥⎥⎦⎤⎢⎢⎣⎡'⎪⎭⎫ ⎝⎛'''∑X Z Z U U Z Z X i i i i i N i 。
这里ˆˆˆi i i kai U Y Z β=-,有时i U ˆ直接用2SLS
i U ˆˆ代替,也不受影响。
又当SIV5成立,有3SLS βˆ和渐近方差3ˆsls Avar β=()()()()1
1ˆ--⎥⎦⎤⎢⎣⎡'Ω⊗''X Z Z I Z Z X N 。
这里=Ωˆi i U U N
'∑ˆˆ1,i U ˆ=sls i i Z Y 3ˆˆβ-。
那么,对一切的线性约束检验问题:r R =β。
可采用Wald 统计量进行检验,其中R 是Q ×K 矩阵,且秩R =Q ,W 2~Q χ。
(2)另一种类似F 检验,用残差表达的统计量。
如果在约束条件下采用GMM 方法,估计
易得,如约束为部分系数为零,那么更为方便。
采用最优权矩阵W ˆ(1W -=Λ)得到无约束的Kai-βˆ估计,残差为ˆˆi i i
U Y X β=-,又β是同样采用最优权矩阵W
ˆ,但是在满足Q 个线性约束条件下得到的估计,残差为i i i U Y X β=-。
可以证明,0:H R r β=为真,那么:
21111ˆˆˆˆ~N N N N i i i i i i i i Q
i i i i Z U W Z U Z U W Z U N χ====⎡⎤''⎛⎫⎛⎫⎛⎫⎛⎫⎢⎥''''- ⎪ ⎪ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎝⎭⎝⎭⎣⎦
∑∑∑∑, 又在SIV5成立的条件下,上式可约化成: ⎪⎭
⎫ ⎝⎛'⎪⎭⎫ ⎝⎛Ω''⎪⎭⎫ ⎝⎛'-⎪⎭⎫ ⎝⎛'⎪⎭⎫ ⎝⎛Ω''⎪⎭⎫ ⎝⎛'∑∑∑∑∑∑-=--=-N i i i N i i i N i i i N i i i N i i i N i i i U Z Z Z U Z U Z Z Z U Z 111111ˆˆˆ~ˆ~2~Q χ, 其中=Ωˆi i U U N
ˆˆˆˆ1'∑,是联立方程的2SLS βˆ的残差。
(3)过度识别的检验
如果工具集i Z 的个数L 大于i X 的个数K ,那么存在过度识别的问题。
用统计量:
211ˆˆˆN N i i i i L K i i Z U W Z U χ-=='⎫⎫''⎪⎪⎭⎭,拒绝原假设表示过度识别。
三、联立方程模型的可识别
回忆在2SLS 的理论中,要求选择工具变量Z 满足秩()L Z Z E =',L K ≥。
否则β就
有可能不能识别,即不一定能得到IV β
ˆ。
这种问题在联立方程模型中,由于内生变量允许在其它方程中出现,存在的可能性几乎肯定,而且表现更复杂。
例:供给方程:t t S t P Q εα+=
需求方程:t t D t P Q ξβ+= 其中,βα≠。
平衡方程:S t Q =D t Q 。
那么t P =()()1/V t t =--βαεξ,t Q =()()2/V t t =--βαβεαξ
由于t ε和t ξ是随机变量,故1V ,2V 不可观测。
我们无法得到内生变量t P ,t Q 的结构参数βα,的任何信息。
现在,在需求方程中引入外生变量收入Y ,且可观测。
考虑:t t t D t Y P Q ξβββ+++=321, 03≠β。
那么可解得:
第四章 联立方程模型
t P =11211V Y t ++ππ, t Q =22221V Y t ++ππ。
得到:()0/22312≠--=αββπ,()0/222322≠--=αβαβπ。
由于t P ,t Q ,t Y 可观测,通过OLS 方法可求得参数估计:11ˆπ
,12ˆπ,21ˆπ,22ˆπ。
又由于112211παπα-=,这意味着供给方程是可识别的。
因为供给方程中不包含有外生变量Y ,它的信息可对供给方程提供帮助,但需求方程仍无法识别,没有系统的外生信息可以利用。
如果再引入外生变量税收t T ,且放到供给方程中:
供给方程:t t t S t T P Q εααα+++=321
需求方程:t t t D t Y P Q ξβββ+++=321;
则可解得:t P =1131211V T Y t t +++πππ,t Q =2232221V T Y t t +++πππ。
同样通过OLS 方法可得:⎪⎪⎭
⎫ ⎝⎛=232221131211ˆπππππππ,并通过πˆ,可等到 结构参数α和β。
但是,不是在供给方程中加入税收t T ,而是在需求方程中再加入新的外生变量,如金融资产t F ,那么供给方程就会多增加一个外生信息来源的选择,而需求方程仍没有外生信息来源可利用。
可见,联立方程模型的结构式的某方程的参数可识别与其它方程引入的外生变量和本方程的内生变量的个数有一定关系。
一般,识别问题的提法如下:
定义:设联立方程结构式为0Y Z U Γ+∆+=,如果能从联立方程模型的简约式
Y Z V =∏+的估计ˆ∏
中得到结构式的参数Γ和∆的估计ˆΓ和ˆ∆,则称联立方程模型是可识别的,否则称为不可识别的。
又如果可识别的结构参数存在唯一的取值,就称模型是恰好识别的,否则称为过度识别的。
注:模型不可识别,指的是联立方程中有某一方程无法从简约式得出该方程的所有结构参数,如例中的需求方程。
过度识别则是得到的结构参数值不唯一。
这就意味着,过度识别的模型有一个取优的问题。
如前述的GMM 方法。
现在,为要使联立方程模型可识别,当且仅当每个结构方程可识别,无妨考察第一个结构方程可识别的必要条件。
从Y 的结构式0=+∆+U Z YP ,把第一个结构方程形式的写为:
()()()()()()()()111111111U X U Z Y Y +=++=βδγ。
这里(1)Y 是1×1G 的,1G 是方程中内生变量的个数,(1)Z 是1×1M 的, 1M 是方程中外生变量的个数。
又记11K G =+1M ;
又从Y 的简约式Y Z V =∏+得到1Y 的关系式为()()111V Z Y +=π, ()01='V Z E 。
这
里Z 是已选择好的M 个所有外生变量作为工具变量。
又定义M ×1M 选择矩阵()1S ,它由0和1两元素构成,使得:()()11ZS Z =成立。
所以,(1)(1)(1)(1)(1)(,)(,)X Y Z Y ZS ==。
对第一个结构方程作为单方程是可识别的,由IV 条件:秩()11()E Z X K '=,()1()0E Z V '=。
()1()E Z X '∴=()()11(,)EZ Z ZS π'=()()()(1)1,E Z Z S π',由秩1()E Z Z M K K '=≥≥,∴秩()()11(,)s π=111K M G =+。
即()()11(,)s π是列满秩的1K M ⨯矩阵。
∴11M G M +≥ ⇒ 11G M M ≥-,于是得到:
定理1:可识别的阶条件(必要条件)
第i 个结构方程中,不包含在方程i 中的外生变量的个数i M M -必须大于等于方程右边内生变量的个数i G ,1i G =。
接下来讨论充分条件。
可识别的阶条件并不充分,可以举出满足阶条件,但不可识别的例子。
问题的提法是,什么条件下能从Y 的简约式能回到结构式?我们先看结构式与简约式的关系:
结构式0Y Z U Γ+∆+=,()
g U U U 1=是1×G 的向量误差项,Γ是G ×G 矩阵,∆ 是M ×G 矩阵。
假定:Γ非奇异,()E U U '∑=。
那么,可解得: ()()V Z P U P Z Y +∏≡-+∆-=--11。
这里∏=()1--∆Γ,V =()
1U --Γ,又令11EV V --''Λ==Γ∑Γ。
如果0='V Z E ,且秩()E Z Z M '=,那么由SOLS 方法和随机抽样,可以得∏和Λ的一致估计。
问题是,从∏和Λ能否回到结构参数矩阵Γ,∆和∑?条件显然不够。
因为结构式乘上任意非奇异G ×G 矩阵F ,得()()0Y F Z F UF Γ+∆+=,即***0Y Z U Γ+∆+=。
它与原结构方程0Y Z U Γ+∆+=它们是同解方程,有等同的简约式。
由F 的任意性,此意味着有2G 个参数是自由的,又由于非奇异限制,加上误差项方差阵∑的有关信息,2
G 个限制还可以减弱。
于是,必须对模型中Γ,∆和∑有所限制,一般归结为以下四种:
1.归一化约束:(normalization restriction )
()()()0=++i i i U Z Y δγ,即11110i i G G i i M M i Y Y Z Z U γγδδ++++++=。
限制第i 个结构式系数1ii γ=-。
将i Y 移到右边,与()()()()()i i i i i i Y Y Z U γδ=++相对应。
称为是归一化的约束。
这共有G 个约束条件,是一个自然约束。
2.同方程参数线性约束(homogeneous liner restriction )
第四章 联立方程模型
令()()()⎪⎪⎭
⎫ ⎝⎛=i i i δγβ是一个
(G+M )×1的向量结构参数,且()i β满足归一化约束条件,从而()i β有G +M -1个未定参数,假定关于()i β的先验知识可以写成线性约束的形式:()()0=i i R β,1i G =。
()i R 是i J ×(G +M )的已知矩阵, i J 是关于()i β的约束数,并假定秩()i R =i J 。
例:一个三方程的联立系统:G =3和M =4。
设第一个结构方程为:
11221331111221331441Y Y Y Z Z Z Z U γγδδδδ=++++++。
那么:()()'-=13121,,1γγγ,
()()'=141312111,,,δδδδδ,()()()()'=111,δγβ。
如果设定一个常数项,那么11=Z ,又假定对()1β的约束有:012=γ和314
13=+δδ,那么i J =2,且()⎪⎪⎭⎫ ⎝⎛=11000030000010i R ,从而()()()03,14131211='-+=δδγβR 为满足对()1β的同方程线性约束条件。
现在令B Γ⎛⎫= ⎪∆⎝⎭是(G +M )×G 矩阵,则()i β就是B 的第i 列,又记()1G F f f =,BF B =*。
则*B 的第i 列()i *β就是i Bf 。
限制()()0=*i i R β⇔()()()()0==i i i i f B R Bf R 。
这是齐次线性方程组。
例如,对第一个结构式方程,如果()11Bf =β可识别,意味()1β的参数是确定的。
因此,齐次方程组()()011=f B R 只有唯一的基础解系()'
=0,0,11 e 。
又由于
()B R 1有G 列,
从而加在B 上的限制()1R 使得()1β可识别的充分必要条件是秩()11R B G =-。
定理2:(可识别的秩条件)
满足归一化条件的结构方程i 的参数()i β是可识别的,当且仅当加在()i β上的同方程线性约束()()0=i i R β满足秩()1i R B G =-。
因为B 有G 列,且秩B G =(列满秩,否则设定B 的某列参数无意义)。
所以,我们必有秩()1-≥G R i ,设秩()i R =i J ,于是,我们得到另一种表述的阶条件。
定理3:(可识别的阶条件)
联立方程第i 个结构式可识别的阶条件是,加在第i 个结构式上参数的约束个数i J 必须大于等于G -1.
从而1i J G <-,则第i 个结构式是不可识别的,1i J G >-,则第i 个结构式是过度识别的。
例:(满足阶条件但不满足秩条件,不可识别的例)
13131113132121U Z Z y y y ++++=δδγγ
21211212U Z y y ++=δγ
33113223333443y Z Z Z Z U δδδδ=++++
其中11=Z (为截距项),0,1,2,3g EU g ==,3G =且4M =。
对第一个结构方程,按归一化约束,设111-=γ和012=δ,014=δ,方程右边的内生变量有两个,但不含的外生变量也有2个,∴第一个结构方程满足阶条件。
再检查秩条件。
()(1)121311141,,,βγγδδ'
=-的限制条件是012=δ和014=δ,于是,()⎪⎪⎭⎫ ⎝⎛=100000000100001R ∴()⎪⎪⎭
⎫ ⎝⎛=342414
3222121δδδδδδB R 又从第二个结构式知:022=δ,024=δ。
∴()⎪⎪⎭⎫ ⎝
⎛=343210000δδB R , ∴秩()11=B R ,不满足秩条件12G -=。
故第一个结构方程不可识别。
又第2个结构方程可识别的条件为013≠δ或013≠γ,3Z 或3y 作为1y 的工具变量。
第3个结构式不含内生变量是自然可识别的。
3. 跨方程的参数约束(Cross equation restriction )
前述讨论结构参数的约束都在同方程中,毫无疑问,如果结构参数的约束是跨方程的,也将为可识别问题提供帮助。
我们不一般讨论跨方程的约束的问题,因为太复杂。
这里只是通过举例说明:
13132121112121U Z Z Z y y ++++=δδδγ (1)
22221211212U Z Z y y +++=δδγ (2)
满足1Z 、2Z 、3Z 与1U 、2U 不相关,1Z 可以是常数项,无任何其它先验信息。
则第一结构式是不可识别的,且第二个结构式当且仅当013≠δ是恰好可识别的。
现在考虑一个跨方程的约束条件:假定1222δδ=。
意味着解释变量对因变量1y 和2y 的
解释作用是等同的。
于是由(2),3Z 作为1y 的工具变量,用2SLS ,可得到22
ˆδ,再对error Z Z y Z y +++=-3
131112122221ˆδδγδ;用2Z 作为2y 的工具变量,只要2212δδ=0≠用2SLS ,可得到12ˆγ,11ˆδ,13
ˆδ,且估计是一致的。
从而(1)可以识别。
但是,用这种单
第四章 联立方程模型
方程方法得到的协方差估计()
ˆcov i β和12ˆγ,11ˆδ,13ˆδ标准差估计12ˆ()se γ,11ˆ()se δ,13ˆ()se δ,由于初始估计22δ的影响,可能不是渐近有效的,这会影响到检验。
解决的办法是:把跨方程约束1222δδ=代入,将原联立方程改写成如下形式:
⎪⎪⎭
⎫ ⎝⎛+⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫ ⎝⎛2111232
1
22100000U U Z y Z Z Z Z y y y β,()'=212113121112δγδδδγβ,参数22δ不再在方程中出现。
选择工具矩阵⎪⎪⎭⎫ ⎝
⎛=⊗3213
2
12000000Z Z Z Z Z Z Z I ,即用所有的外生变量作为每一个方程的工具变量,采用联立方程的GMM 方法或3SLS 方法可得一致、有效的估计。
4、协方差约束(Covarionance Restriction )
联立方程中误差项之间的有关信息也能为系统识别提供帮助,请看两例:
例1:131********U Z Z y y +++=δδγ (1)
23232221211212U Z Z Z y y ++++=δδδγ (2)
如果022≠δ,则(1)是恰好可识别的,(2)是不可识别的。
现在假定对误差项1U 、2U 有协方差限制:),cov(21U U =12()0E U U =,设∑=)(U U E ',
则从限制知∑是对角矩阵。
由于(1)可识别,从而可得到12γ,11δ,13δ的一致估计,并由此可得到1U 的一致估
计1
ˆU 。
由已知1ˆU 与2U 不相关,且1ˆU 与1Y 必定偏相关,因此我们可以用1Z ,2Z ,3Z ,1ˆU 作为1y 的工具变量估计(2)。
所以(2)也是可识别的。
我们可以用2个2SLS 来完成估计。
步骤:1。
用1Z ,2Z ,3Z 为2y 的工具变量对(1)做2SLS ,并得到残差1
ˆU ; 2.用1Z ,2Z ,3Z ,1
ˆU 为1y 的工具变量对(2)做2SLS 。
渐近正态性。
因为1
ˆU 是一个广义工具变量,涉及到非线性的问题,需要加强条件。
(请参阅伍书P194-195)
例2:完全迭代(递归)的系统模型(fully recursive system )
1111U Z y +=δ (1)
221212U Z y y ++=δγ (2)
……
21211111U Z Z y y G G G G y G G +++++=--δδγγ (G)。