工具变量法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
工具变量法
一、工具变量法得主要思想
在无限分布滞后模型中,为了估计回归系数,通常得做法就是对回归系数作一些限制,从而对受限得无限分布滞后模型进行估计。在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好得解决此类问题得思路。经过变换,新得模型中,随机扰动项得表达式为:
考伊克模型: ( ,为衰减率) (1、1);
适应性期望模型:(,为期望系数)(1、2);
部分调整模型:( ,为调整系数) (1、3)。
为原无限分布滞后模型中得扰动项,为变换后得扰动项。
在原模型中得随机扰动项满足经典假设得前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型得随机扰动项由于存在原随机扰动项得滞后项,也就就是说考伊克模型与适应性期望模型得解释变量势必与误差项相关,因此,可能会出现上述两个模型得最小二乘估计甚至就是有偏得这样严重得问题。那么,我们就是否可以找到一个与高度相关但与不相关得变量来替代?在这里,一个可行得估计方法就就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。
一般来说:一个回归模型中得解释变量有得与随机扰动项无关,我们称这样得解释变量为外生变量;而模型中有得解释变量与随机扰动项相关,我们可称这样得解释变量为内生解释变量。内生解释变量得典型情况之一就就是滞后应变量为解释变量得情形,如上述考伊克模型与适应性期望模型中得。
外生解释变量:回归模型中得解释变量与随机扰动项无关;
内生解释变量:回归模型中得解释变量与随机扰动项无关;
了解了内生变量与外生变量得概念,我们接着讨论工具变量法得主要思想:工具变量法与普通最小二乘法就是模型参数估计得两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数得普通最小二乘估计就是非一致得,这时就需要引入工具变量。
工具变量,顾名思义就是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关得随机解释变量(即内生变量)。
满足条件:1)总体无关:工具变量与随机扰动项无关;
2)样本相关:工具变量必须与被它所代替得内生变量高度相关;
3)与模型中其她解释变量不相关,以避免出现多重共线性。
做了替代后,用普通最小二乘法即可得到原回归系数得一致估计量。
二、工具变量法得基本原理
我们分别从简单线性回归模型与多元线性回归模型两方面来具体分析工具变量法得基本原理:
简单线性回归模型
考虑简单线性回归模型(2、1)其中为内生变量。
则其正规方程为:(2、2)
设回归模型中得解释变量与随机扰动项相关,则如前所述,普通最小二乘估计量就是非一致得。现用一个工具变量来代替正规方程中得解释变量,其残差表达式不变。
(2、3)
即:
(2、4)
解上述引入了工具变量后得正规方程可得斜率项系数得估计量为:
(2、5)
(2、5)式中小写字母代表相应大写字母得离差。该市所表示得估计量就就是工具变量估计量,简称IV估计量,用表示。易证IV估计量就是一致估计量。
事实上,(2、6)
若工具变量与解释变量高度相关,则表明(2、6)式中较大;若工具变量与随机扰动项渐近无关,则表明(2、6)式中随着样本容量得增加而趋向于零。
故在工具变量与它相应得解释变量高度相关而与随机扰动项渐近无关得条件下,有
(2、7)
样本估计总体,(2、7)表明IV估计量就是一致估计量。
多元线性回归模型:
工具变量法可直接推广到多元线性回归模型
(2、8)
其中:
在讨论工具变量法在多元线性回归模型中得应用之前,我们先来分析工具变量得个数问题。
为了一般起见,当解释变量与随机扰动项不相关时,我们把解释变量本身也作为就是一个工具变量。这就就是说,在我们得模型中凡事预随机扰动项无关或渐近无关而与解释变量相关得变量都称为就是工具变量。这样与随机扰动项无关得解释变量本身当然就是与解释变量高度相关得变量,故它也就是工具变量。在作了这样得约定之后对多元回归模型(2、8)来说,工具变量得个数一定不会小于解释变量(包括常数项)得个数(但可以大于解释变量得个数)。这就是因为凡就是与随机扰动项相关得解释变量都要有与随机扰动项无关或者渐近无关得工具变量或工具变量得线性组合,而凡与随机扰动项无关得解释变量本身就就是一个工具变量(按我们上述约定)。所以工具变量得个数当然不小于解释变量(包含常数项)得个数。
因此:工具变量得个数可以等于也可以大于(但不能小于)解释变量(包括常数项)得个数。
接下来得分析中,我们重点讨论工具变量得个数与解释变量得个数相等得情形:
对于多元线性回归模型(2、8):设解释变量得工具变量为,其中,而且某些变量可能与变量相同。若多元线性回归模型(2、8)得正规方程为:
(2、9)
则可通过将这个正规方程组中得解释变量换成其相应得工具变量,但残差得形式保持不变。得:
(2、10)
解方程组(2、10)可得回归系数得一致估计量即IV估计量。
将代入(2、10)式中,经整理得:
(2、11)
若令
,,,
则(2、11)式可以表示为:
(2、12)
若就是一个满秩矩阵,则回归系数得IV估计量为:
(2、13)
当解释变量与随机扰动项不相关时,我们把这个解释变量本身也作为就是一个工具变量。
把模型中凡就是与随机扰动项无关或渐进无关而与解释变量相关得变量都称为解释变量。工具变量得个数一定不会小于解释变量(包括常数项)得个数。
三、二阶段最小二乘法(TLS)
IV估计量可以瞧作就是两次运用最小二乘法得结果。
第一阶段:求解释变量X对工具变量Z得回归,得到一个解释变量得拟合值。
(3、1)
第二阶段:求应变量Y对解释变量得拟合值得回归,得到回归系数得估计值。
(3、2)
注意到为一对称得幂等矩阵,所以,
(3、3)
二阶段最小二乘法(TLS)简例
(3、4)
、就是内生变量,、就是外生变量
第一阶段:分别用内生解释变量对所有外生解释变量回归;
(3、5)
(3、6)
得、得拟合值、,也称为工具变量。
第二阶段:用上述拟合值代替实际值。
(3、7)
我们也称,为工具变量。
四、用工具变量法估计自回归模型
由于考伊克模型与适应性期望模型均可化为一阶自回归模型。而自回归模型中由于含有滞后应变量作为解释变量,所以回归系数得最小二乘估计就是非一致得,为了得到一致得估计可用工具变量法,但用什么变量作为工具变量也就是很难作出决断得。例如对模型:
(4、1)
利维亚坦(Liviatan)建议用解释变量得滞后一个时期得值作为随机解释变量得工具变量。但由于大多数经济时间序列在相邻两期之间存在高度相关,从而使Liviatan得方法受到多重共线性得困扰。
在这里我们瞧一个例子:
(4、2)
假定与相关。为了消除这种相关,假定我们采取如下工具变量法:先求对与得回归,并从此回归得到估计值。然后做回归:
(4、3)
其中就是从第一步回归估计处理得。
在这个例子中利用两阶段最小二乘法消除了原模型中与之间得相关性。五、简述工具有效性得萨甘检验
假定我们用一个工具变量来替代与误差项相关得自变量。那么工具变量又会