动态因子模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
DFMs:
• 动态因子模型用方程式表示为:
这里有N个序列,所以 和 为N×1阶;有q个动态因子,所以 和 为q×1阶; L为滞后算子,且滞后多项式矩阵λ (L)和Ψ(L)分别为N×q阶和q×q阶。 第i个滞后多项式 是第i个序列所加载的动态因子, 和 是第i个序列的主 成分。 我们假定(1)和(2)中所有的过程都是固定的(不固定的情况在本章最后部分讨论)。 特殊干扰被假定与前后的创新因素是不相关的,即,对于所有的k, 。 在所谓精确的动态因子模型中,特殊干扰被假定为在前后步中是不相关的,即, 对于所有的s,, ,如果i≠j。
服从于其标准化 。为了解决(11),首次最小化Λ提供的 ,从而得 到 ,然后集中于目标函数,因此(11)变成 。 这个最小化问题等价于 ,它依次等价于 服从于 。这个最后的问题的解决办法是使 等价于 扩展的特 征向量,它与它的r个最大的特征向量相对应。因为 ,这意味着F的最小二乘估计 量是 ,即X的扩展的前r个主成分。
(6)
来自百度文库
• 这个参数的状态空间模型的好处是,它能够处理 数据的不规则性。
• EM算法会用来估计参数的最大似然估计(MLEs)。 不过,参数的数量要与N成比例,所以MLE系数的 直接估计是难处理的。
2.2 第二阶段:非参数平均方法
• 1 横截面平均法为什么起作用 • 2 主成分估计 • 3 广义主成分估计 • 4 动态主成分
• 模型由(4)-(6)给出。
• 动态因子的状态空间模型
• 模型由式(1)(2)和(6)给出。
• 这些被估计参数完全地填充于状态空间模型中,以至于 或 能够运用卡尔曼平滑来更好地估计其估计量,这个估 计量能引起时间序列平均。 运用这些被估计的系数作为系数最大可能估计的一致开始 值也是可能的。 Engle and Watson(1983),Quan and Sargent(1993) and Doz,Giannone, and Reichlin(2006):最大似然估计能够运用 EM算法来估计; Jungbacker and Koopman(2008):解决了如何加快在DFM中卡尔 曼透视的估值,通过把 转换为一个r×1阶向量; Jungbacker,Koopman,and van der Wel(2009):提供了额外的 计算设备,当存在缺失数据时也能够使用。
• 背景:最初由Geweke(1977)提出,作为以前由横截面数据发展而来的因子模
型的一个时间序列扩展。 早期影响力作品中,Sargent and Sims(1977),有两个动态因子能够解释 大部分美国重要的宏观经济季度变量的方差,例如产量,就业和价格。 Giannone,Reichlin,and Sala(2004) and Watson(2004),一个因子能够解释宏 观经济序列的大部分方差,这一主要的经验主义发现已被许多研究所证实。
• 线性状态空间模型通过详细说明对于 和误差 的过程 而完成。典型地,误差项 被假定为遵循单变量的自回 归:
• • 随着更进一步的假设为 服从独立同分布, • ,i=1,...,N, 服从独立同分布, ,j=1,...,q, 和 是 独立的,等式(4)到(6)构成一个完全线性状态空间模型。 • 给出了这些参数,卡尔曼滤波能够用作计算可能性和估计 的 过滤值,进而估计 。
DFMs:
• 前提:
一些潜在的动态因子 ,联动于一个时间序列变量构成的高维向量 ,也被一个均值为零的特殊干扰向量 所影响。 这些特殊干扰是由测量误差和特定于单个序列的特殊性质所引起的(例 如,沙门氏菌恐慌对餐厅就业的影响)。 这些潜在的因子,遵循一定的时间序列过程,一般认为是一个向量自回 归过程(VAR)。
• 目的:在现有的DFMs著作中,所描述的在某种程度上具体足以用于使研究者
创新于此领域,关键的理论结果,应用和经验主义的发现。 Bai and Ng(2008)和Stock and Watson(2006)对这个作品提供了补充性的 调查。Bai and Ng(2008)比这个更有技术性,并且更专注于计量经济学的理论 和条件;Stock and Watson(2006)关注在DFM基础上的预测,它是在许多预测 者使用的其他方法背景下进行的。
另一方面,战后很长时间内,统 计局收集了很多相关数据,包括 宏观经济,金融,有关经济领域 内变量的月度和季度数据。
因此,宏观经济学家面临的数据集:成百上千 个序列,但每个序列观察的数量相当少(例如20 至40年的季度数据)。
DFMs:
在过去几十年得到很大注意力,因为它能够模拟序列数量大于时间观 测数量的数据集的同时性和一致性。
• 把构造的 的估计量看作X的加权平均数,用到了一个权 重为W的非随机N×r矩阵,这里W被标准化以至于 W’W/N= :
(9)
一般来说,对于Λ将会有不足的结构去假定一个权重矩阵W,W 不依靠这些主成分分析所到达的数据。
2
主成分估计
• F的主成分估计量是加权平均估计(9),并且W= ,这里 的 是 的样本方差矩阵的特征向量矩阵, , 关联于 的r个最大的特征向量。主成分估计量能够导 出最小二乘问题的解决办法:
于是,有效总体预测回归的维数不会随着系统变量的增加而增加。
• 计量经济学家将会考虑的第一个问题:估计因子(或更精 确的说,判断因子的跨越空间)和确定有多少因子。 ——第2和第3部分 • 一旦有了这些因子的可靠估计量,不仅仅是用来预测,而 且把它们作为工具变量,估计因子增广向量自回归( FAVARs)和估计动态随机一般均衡模型(DSGEs)。 ——第4部分 • 第5部分会讨论一些拓展。
动态因子模型 DFMs
James H.Stock; Mark W.Watson* 2010年1月; 2010年5月7日修订
目录
一 引言 二 因子的估计 三 因子数量的决定 四 被估计因子的应用 五 选择性拓展
:
宏观计量经济学家面临 一个特有的数据结构:
一方面,可靠和相关数据的年份 数量是有限制的,且不能很容易 地增长。
1
横截面平均法为什么起作用
• 考虑 的横截面平均因子估计的动机为,特殊干扰的加 权平均数将根据弱大数定理收敛到0,以至于只有因子的 线性组合依然存在。横截面平均估计量是在DFM(4)的静态 表示基础上的。
• 横截面平均估计量是非参数的,在某种意义上他们不需要 这样一个参数模型,正如(5)中的因子F或者(6)中的特殊动 态。所取代的是, 被认为是一个由一N维数据向量所估 计的r维参数。取代参数假设,按照Chamberlain and Rothschild(1983)的近似因子模型的较弱的假设是关于因子 结构的。尤其是,考虑到以下条件,
• 第一阶段:低维(N很小)参数模型
运用高斯最大似然估计法(MLE)和卡尔曼滤波。 这种方法提供了在模型假设和参数下f的最佳估计量( 和最佳预测值)。 然而,那些参数的估计必须包括非线性的优化,这种 优化有限制参数数量的作用,从而限制能够被处理,运用 的序列数量。
• 第二阶段:大N的非参数估计
运用横截面平均方法,主要是主成分和相关分析方法 。
• 注意:
这一部分中所有方法都假设数据已消除单位根和其趋 势。代表性地,通过区分所需的序列,然后标准化不同的 序列来完成;例如,一个典型的元素X可能为一个真实活 动预测量的某一阶段增长率,它被标准化为零均值和单位 标准偏差。
2.1 第一阶段:时域最大似然法,通过卡尔曼滤波
• Engle and Watson(1981,1983),Stock and Watson(1989),Sargent(1989),and Quah and Sargent(1993): 早期的动态因子模型的时间域估计用卡尔曼滤波来估算高 斯似然,用最大似然法来估计参数,然后用卡尔曼滤波和 滤波器得到因子有效估计。
•
的主成分估计量的一致性首次被显示为固定的T和 N→∞,被Connor and Korajczyk(1986)在确切的静态因素模型 中表示。Stock and Watson(2002s)在更弱的条件下证明了 因子的统一一致性,允许特殊误差的弱连续和互相关。也 提供了N和T的率条件,在 被当作是第二阶段最小二乘 回归的数据的条件下(即, 的估计误差不能够影响 作 为回归量的OLS的系数的渐进分布)。Bai(2003)提供了估 计因子和一般成分的极限分布。Bai and Ng(2006a)提供了 增长率,尤其是N→∞,T→∞和N2/T→∞,在 是一致的 且在后来的回归中作为数据的条件下;他们也提供了用 估计的一般成分的置信区间结构的结果。
4 动态主成分 • 动态主成分是由Brillinger(1964,1981)发展而来的主成分的 频域模拟。Forni,Hallin,Lippi,and Reichlin(2000,2004)证明了 一般成分的一致性并且提供了其收敛率,这些一般成分是 被动态主成分估计的。通过动态主成分估计f的方法需要 两边平滑,所以样本最后f的估计量是不可得的。结果是 ,动态主成分不能够直接用于预测,工具变量回归, FAVAR或者其他需要用到f的估计量的应用,对于所有样本 来说。在这个调查中我们不再进一步讨论这个方法。
第二阶段的关键结果是因子拓展空间的主成分估计量 是一致的,此外,如果N充分大,因子被精确的估计其精 确度足以使其作为后面回归的数据。
• 第三阶段:
运用因子的一致非参数估计量来估计第一阶 段中状态空间模型的参数,从而解决第一阶段模 型中相关的维度问题。
在状态空间模型中,许多参数未知的问题解决办法是 运用贝叶斯方法,即,用优先和整合取代最大化,一小部 分论文用到这种解决方法,它同时还用到第二和第三阶段 的(传统的)估计量。
二 因子估计
• Geweke(1977)和Sargent and Sims(1977)开创性的工 作是用频域分析方法来寻找动态因子结构的迹象 和预测因子的重要程度。 • 然而,那些方法不能够直接估计 ,因此也不能 用于预测。 • 后来的DFMs工作针对时域分析方法,这时 能 够直接被估计。
DFMs的时域估计研究分为三个阶段
3 广义主成分估计 • 广义主成分对于主成分相当于广义最小二乘法对于最小平 方。如果干扰误差变量矩阵Σ与单位矩阵不成比例,那么 最小二乘回归的类比表明 和Λ解决了(11)的加权版本, 这里的权重矩阵为 :
• 至少有三个可行的广义主成分估计的版本被提名为DFM。 首先, Forni,Hallin,Lippi,and Reichlin(2005)重新整理了这个 分解, ,这里 是一般成分 (这个分解由(4) 而来)的方差来获得 。他们提出通过动态主成 分来估计 (在下面会提到)。第二,Boivin and Ng(2003) 提出运用估计量 ,这里 是 在主成分估计 量 上回归的误差变量的通常估计量;令 的非对角线 位置为0,则它们的权重矩阵只含有N个估计元素。这些解 决办法都没有提出 有可能序列相关。把这个考虑在内 的话,Stock and Watson(2005)提出了一个三步的解决办法 ,近似于Cochrane-Orcutt估计量,当 通过主成分被首次 估计时,N个独立自回归适合在 上 回归的残差,X运 用第i个自回归的系数是拟差分的,然后Boivin-Ng(2003)的Σ 的对角线方法也应用于这些拟差分中。
•
•
把DFM写成一个线性状态空间模型。令p作为滞后多项式矩阵λ(L)的维度 , 表示一个r×1维向量,令 ,这里 为第i个滞后 矩阵λ(L)的N×q维系数矩阵。令Φ(L)为只包含1,0和Ψ(L)中元素的矩阵。 DFM (1)和(2)被改写为:
这里,G为一个只有1和0的矩阵,因此(5)和(2)是等价的。等式(4)和(5) 被称为DFM的静态形式,因为这些因子只能同时出现。
2.3 第三阶段:混合主成分和状态空间方法
• 估计因子方法的第三个阶段是融合状态空间方法的统计效 率和主成分方法的便利性及平稳性。 • 这个合并的估计过程发生在两步: • 首先,这些因子通过主成分或者一般主成分所估计; • 第二步,这些被估计因子 用来估计状态空间表示的未 知参数。
• 静态因子的状态空间模型:
DFMs:
• 考虑DFMs的一个重要的动机是:如果已知因子 ,且 是高斯的,我们 就能对一个单独的变量做出有效的预测,运用到滞后因素和变量滞后性的总 体回归。于是,预测者只运用q个因子就能从所有N变量中得到好处,这里q 远远小于N。 特别地,在方差损失下,第i个变量的最理想的向前一步预测为:
这里第三行根据等式(2),最后一行根据(1)和精确的DFM假设。