中国通货膨胀率预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中国通货膨胀率预测作者:陈彦斌刘玲君陈小亮
来源:《财经问题研究》2021年第06期
摘要:前瞻性預测通货膨胀率有助于央行等政府部门更好地使用货币政策稳定物价,以防范通货膨胀对于市场主体尤其是中低收入群体的冲击,有助于金融机构和投资者更好地进行投资决策,因而具有重要意义。

已有文献主要使用AR和VAR等线性模型对通货膨胀率进行预测,对于变量间非线性关系以及历史数据信息的挖掘相对欠缺,因而已有文献的预测策略及其准确性有待改进。

LSTM模型能够充分挖掘变量之间的非线性关系并且处理复杂的长期时序动态信息,从而弥补已有研究的不足。

为此,本文使用LSTM模型对中国通货膨胀率进行预测,考虑到新常态以来中国的CPI和PPI走势多次背离,只使用CPI很难对一般物价水平进行全面把握,因此,本文使用LSTM模型对CPI和PPI两个指标进行了预测分析。

研究结果表明,LSTM模型在预测中国通货膨胀率时表现出了较好的性能,且其预测效果明显优于BVAR 模型。

有鉴于此,本文建议将LSTM模型更广泛地用于通货膨胀率预测领域。

除了CPI和PPI,未来还应该更加关注对核心CPI指标的预测,从而为货币政策的制度提供更有价值的决策参考。

关键词:通货膨胀率;CPI;PPI;LSTM模型;BVAR模型
中图分类号:F037.2 文献标识码:A
文章编号:1000-176X(2021)06-0018-12
一、引言
通货膨胀率(下文简称“通胀率”)是监测宏观经济运行的重要指标之一,对通胀率进行前瞻性预测具有重要意义。

其一,货币政策的重要目标之一是稳定物价,但货币政策在调控物价过程中存在一定的时滞,因而央行需要较为精确的通货膨胀(下文简称“通胀”)预测作为前提,才能更好地使用货币政策稳定物价水平。

其二,通胀率不仅会影响投资者在投资周期方面的决策,且会影响到投资者在投资产品方面的决策,因而对于金融机构和投资者而言,预测通胀率具有重要的指导意义。

其三,家庭财产差距较大和结构性通胀频发等问题的存在,使通胀对中低收入群体的危害较大,从而进一步凸显了预测通胀率的必要性和重要性。

在当前的中国,中低收入阶层的财产主要以存款的形式存在,而高收入阶层的财产则以房地产等形式存在,通胀会降低实际利率从而导致中低收入家庭的存款缩水,而高收入家庭则可能因为房价上涨而获益。

不仅如此,中国经常发生以食品价格大幅上涨为特征的结构性通胀,而中低收入阶层的食品支出占收入的比重相对较高[1]。

这两方面原因的存在,使中低收入群体难以抵御通胀冲击,哪怕是温和通胀也会对中低收入群体造成较为严重的不利影响。

国内外有大量文献尝试对CPI进行预测,总体而言,相关文献主要使用五大类模型开展研究:其一,菲利普斯曲线模型,相关研究包括Stock和Watson[2]、McAdam和McNelis[3]、Orphanides和Van Norden[4]、郑挺国等[5]与吴锦顺[6]等。

其二,AR、ARMA和ARIMA等时间序列模型,相关研究包括Hubrich[7]、Bos等[8]、Ang等[9]、张卫平[10]与罗忠洲和屈小粲[11]等。

其三,VAR、SVAR和BVAR系列模型,相关研究包括DAgostino和Surio[12]、
Barnett等[13]、Eickmeier等[14]、陈彦斌等[15]、汤丹[16]与郭永济等[17]。

其四,利率期限结构模型,相关研究包括Fama[18]、Mishkin[19-20]、Kotlán[21]、李宏瑾等[22]与贺畅达[23]等。

其五,BP(Back Propogation)等神经网络模型,相关研究包括Nakamura[24]、邵明振等[25]与薛晔等[26]等。

此外,正如陈伟和牛霖琳[27]所指出的,不少文献同时使用多种方法对通胀率进行预测。

在预测通胀率时,已有研究以线性模型为主,非线性模型相关研究相对偏少。

与之不同,近十余年来,国内外文献在预测GDP时逐渐强化了对以神经网络为代表的非线性机器学习方法的使用[28],可以处理的数据类型更为复杂,包括非线性、高频和更高维度的数据。

在为数不多的使用神经网络模型和人工智能方法预测通胀率的文献中,Nakamura[24]使用美国1978—2002年的数据分析发现,NN神经网络模型对美国通胀率的预测效果明显优于AR等传统线性模型,尤其是对未来一个季度到两个季度的通胀率进行预测时,NN神经网络模型能够取得相当大的成功。

邵明振等[25]使用BP神经网络模型和ARMA模型对2005年1月至2011年5月期间中国的月度CPI进行了预测分析,发现BP神经网络模型的预测精度明显高于ARMA模型。

薛晔等[26]选取中国2010年1月至2015年3月的月度数据,利用决策树算法对CPI的影响指标进行筛选和优化,并使用BP神经网络模型预测通胀风险等级,发现决策树—BP神经网络模型比ARIMA模型的预测准确率更高,有望为基于大数据的宏观经济实时预测系统提供新的构建思路。

综合已有文献来看,以神经网络为代表的非线性模型在预测通胀率时的表现要优于AR和ARMA等传统线性模型。

这是因为,货币政策等诸多因素对通胀率的影响很可能是非线性的,从而在很大程度上决定了非线性模型的预测效果优于线性模型。

以数量型货币政策对利率的影响为例,由于存在流动性效应、收入效应、价格效应和通胀预期效应等多种效应,而第一种效应与其他效应的作用方向是相反的,因此,数量型货币政策通过影响利率进而对总需求和通胀率产生复杂的甚至非线性的影响。

BP等传统神经网络模型虽然能够识别变量之间的非线性关系,但无法反映变量之间的时序关系。

在经济领域,变量之间的时序关系及其背后的逻辑关系是很重要的。

深度学习模型中的长短期记忆(Long Short Term Memory,LSTM)模型具有出色的时序数据处理能力,在经济与金融预测领域取得了良好的成效,得到了较为广泛的应用,国内相关研究也逐渐增加。

例如,唐晓彬等[29]基于LSTM模型,结合大数据技术挖掘消费者信心指数相关网络搜索(User Search,US)数据,进而构建了LSTM & US预测模型,并将其应用于对中国消费者信心指数的预测研究,结果发现,LSTM & US模型具有较好的泛化能力和较高的预测精度。

杨青和王晨蔚[30]使用LSTM模型对全球30种重要股票指数进行了预测研究,结果发现,LSTM模型具有很强的泛化能力,结果较为稳健且预测精度优于SVR、MLP和ARIMA三种模型。

肖争艳等[28]同时使用LSTM模型和BVAR模型对中国GDP进行了预测研究,结果发现,LSTM模型能够更好地挖掘相关指标对GDP的非线性影响,从而提升模型的预测性能。

不过,目前国内尚无文献使用LSTM模型对中国通胀率进行预测。

不仅如此,已有文献在预测中国通胀率时往往只关注CPI而忽视了PPI。

近年来,中国的CPI和PPI多次发生较为严重的背离,在CPI同比增速持续为正的情况下,PPI同比增速持续为负。

这在2012—2016年以及2019年下半年至2020年上半年表现得尤为明显。

其中,2012年3月至2016年8月期间,CPI同比增速平均涨幅为2.085%,而PPI同比增速平均涨幅为-2.872%;2019年7月至2020年9月期间,CPI同比增速平均涨幅为3.420%,而PPI同比增速平均涨幅为-1.593%,期间虽然PPI同比增速曾在2020年1月份实现了0.100%的正增长,但在此前后至少半年均为负增长,因此,笔者认为,PPI负增长的整体局面是没有改变的。

CPI和PPI的背离走势使得货币政策的制定陷入两难:要想应对CPI上涨带来的通胀压力,需要紧缩型货币政策,但是这会进一步加重PPI的下行态势;要想应对PPI下行带来的通缩压力,需要适当加大货币政策力度,但是这会进一步加重CPI的上涨态势和通胀压力。

有鉴于此,本文使用LSTM模型对CPI和PPI这两个重要的物价指标分别进行了预测分析。

为了评价LSTM模型预测性能的优劣,本文还借鉴肖争艳等[28]的做法,同时使用LSTM模型和BVAR 模型,对通胀率进行预测。

结合三类预测误差MSE、MAPE和SMAPE的相对大小,笔者发现,LSTM模型的确比BVAR模型更加适用于预测中国的CPI和PPI,从而可以帮助我们前瞻性判断未来通胀率的走势。

与已有研究相比,本文主要有两点边际贡献:其一,本文将LSTM模型应用于中国通胀率预测。

已有文献主要使用AR和VAR系列模型等线性模型对通胀率进行预测,忽视了货币政策等因素对通胀率的非线性影响。

本文使用的LSTM模型能够较好地将非线性影响考虑在内,而且与BP等传统神经网络模型相比,LSTM模型的门控结构使其能够识别出各序列更长时期的非线性关系,从而更充分地利用历史数据所包含的信息进行预测。

本文的研究结果表明,LSTM模型的预测性能的确优于BVAR等传统线性模型,更适用于对通胀率的预测研究。

其二,本文同时将CPI和PPI作为通胀率的测度指标,分别进行预测研究。

已有文献通常仅将CPI作为通胀率的测度指标加以研究,但是新常态以来,中国的CPI和PPI走势多次背离,只考虑CPI很难对整体物价走势进行准确把握。

有鉴于此,本文同时将CPI和PPI作为通胀率的测度指标,从消费和生产两个领域更加全面地把握物价走势,从而更好地为货币政策的制定提供决策参考。

二、LSTM模型的设定与求解
考虑到本文的研究重点是使用LSTM模型对通胀率进行全面预测分析,因而本部分主要对LSTM模型的内涵、设定和求解过程进行详细阐述。

除此之外,本文还将使用BVAR模型预测通胀率,不过其主要目的是作为参照对象,以评判LSTM模型是否能够改善对通胀率的预测准确度,因而不再详述BVAR模型的具体细节。

简言之,BVAR模型就是用贝叶斯方法对动态面板的VAR系统进行分析,建立一个由m 个变量组成、滞后阶数为p、含有常数项的VAR(p)模型,即yt=A1yt-1+A2yt-2+…+Apyt-
p+Ac+ut。

其中,Ac是常数矩阵;yt=(y1,t,y2,t,…,ym,t)T,包含通胀率、M2、股价指数等宏观变量;残差ut~i.i.d.Nm(0,∑),∑為m×mDM=S-N(N+1)4N(N+1)(2N+1)24~N(0,1)正定矩阵;Aj为m×m阶系数矩阵,αi,j,τ为方程i中变量j滞后τ期的系数。

(一)LSTM模型概述
LSTM模型是对循环神经网络(Recurrent Neural Network,RNN)模型的改进,也是深度学习方法
深度学习方法是一类模型结构的统称,主要包括循环神经网络模型、深度神经网络模型、深度卷积神经网络模型等。

其中,LSTM模型是循环神经网络模型的一种,已经得到了较为广泛的应用。

的卓越代表之一[28]。

RNN模型在普通多层BP神经网络基础上,增加了隐藏层各单元间的横向联系,通过一个权重矩阵,可以将上一个时间序列神经元的值传递至当前神经元,从而使神经网络具备记忆功能。

LSTM模型在RNN模型隐藏层各神经元中增加记忆单元,从而使时间序列上的记忆信息可控,每次在隐藏层各单元间传递时通过几个可控门,可以控制之前信息和当前信息的记忆和遗忘程度,从而使RNN模型具备长期记忆功能。

与传统的机器学习方法相比,深度学习方法能够更好地从既有数据中提取出各类指标之间的复杂关系,对各种形式的信息和数据都具有较好的适用性。

不仅如此,深度学习方法能够提取并充分利用更抽象、更复杂的数据特征,从而使得预测结果更加准确可靠[31]。

作为新一代的深度学习方法,LSTM模型与ANN(Artificial Neural Network)、RNN等神经网络模型相比具有明显优势:一方面,经济金融领域的数据普遍存在时序结构,因而时序关系及其背后的逻辑关系对于预测分析是不可或缺的,但是ANN模型无法识别样本之间的时序关系,与之不同,LSTM模型则可以充分挖掘变量之间的长期依赖关系,从而将其背后的时序关系尽可能地应用到预测过程中。

另一方面,LSTM模型还解决了RNN模型的梯度消失、梯度爆炸等问题,从而做出更精准的预测[29]。

正因如此,LSTM模型的应用日益广泛,不仅被应用到语音识别、情感分析、机器翻译和文本分析相关的学术研究之中[29-32],而且已经在谷歌和百度等公司得到了越来越多的应用。

例如,谷歌的神经网络机器翻译系统和百度的汉语语音识别产品均应用了LSTM模型和相关算法。

LSTM模型的预测过程通过神经元的连接实现,具体而言,基本单元模型接收来自其他神经元传递过来的输入信号,输入信号通过带权重的连接进行传递。

因此,可以将LSTM模型视为若干线性和非线性函数相互嵌套的模型。

对于本文重点研究的通胀率预测分析而言,由于不同时期的历史数据都会对通胀率产生影响,但近期历史数据对通胀预测的影响更大,故而本文选择设有三个门控(Gates)的LSTM模型来控制信息传递过程,从而筛选出对预测有用的信息。

每个神经元结构,如图1所示。

其中,xt表示t时期的输入向量,包含通胀率、M2、投资、消费、股价指数、汇率、国际大宗商品等变量的历史数据。

ht-1表示上一时期的输出结果,ct-1表示上一时期的旧记忆。

遗忘门(Forget Gate)决定了上一时期的单元状态有多少记
忆需要遗忘,更新门(Update Gate)则决定了需要更新多少新记忆,并由新记忆和旧记忆相加形成最终记忆,由输出门(Output Gate)从最终记忆中筛选出对预测有用的部分。

不过,目前国内尚无文献使用LSTM模型对中国通胀率进行预测。

不仅如此,已有文献在预测中国通胀率时往往只关注CPI而忽视了PPI。

近年来,中国的CPI和PPI多次发生较为严重的背离,在CPI同比增速持续为正的情况下,PPI同比增速持续为负。

这在2012—2016年以及2019年下半年至2020年上半年表现得尤为明显。

其中,2012年3月至2016年8月期间,CPI同比增速平均涨幅为2.085%,而PPI同比增速平均涨幅为-2.872%;2019年7月至2020年9月期间,CPI同比增速平均涨幅为3.420%,而PPI同比增速平均涨幅为-1.593%,期间虽然PPI同比增速曾在2020年1月份实现了0.100%的正增长,但在此前后至少半年均为负增长,因此,笔者认为,PPI负增长的整体局面是没有改变的。

CPI和PPI的背离走势使得货币政策的制定陷入两难:要想应对CPI上涨带来的通胀压力,需要紧缩型货币政策,但是这会进一步加重PPI的下行态势;要想应对PPI下行带来的通缩压力,需要适当加大货币政策力度,但是这会进一步加重CPI的上涨态势和通胀压力。

有鉴于此,本文使用LSTM模型对CPI和PPI这两个重要的物价指标分别进行了预测分析。

为了评价LSTM模型预测性能的优劣,本文还借鉴肖争艳等[28]的做法,同时使用LSTM模型和BVAR 模型,对通胀率进行预测。

结合三类预测误差MSE、MAPE和SMAPE的相对大小,笔者发现,LSTM模型的确比BVAR模型更加适用于预测中国的CPI和PPI,从而可以帮助我们前瞻性判断未来通胀率的走势。

与已有研究相比,本文主要有两点边际贡献:其一,本文将LSTM模型应用于中国通胀率预测。

已有文献主要使用AR和VAR系列模型等线性模型对通胀率进行预测,忽视了货币政策等因素对通胀率的非线性影响。

本文使用的LSTM模型能够较好地将非线性影响考虑在内,而且与BP等传统神经网络模型相比,LSTM模型的门控结构使其能够识别出各序列更长时期的非线性关系,从而更充分地利用历史数据所包含的信息进行预测。

本文的研究结果表明,LSTM模型的预测性能的确优于BVAR等传统线性模型,更适用于对通胀率的预测研究。

其二,本文同时将CPI和PPI作为通胀率的测度指标,分别进行预测研究。

已有文献通常仅将CPI作为通胀率的测度指标加以研究,但是新常态以来,中国的CPI和PPI走势多次背离,只考虑CPI很难对整体物价走势进行准确把握。

有鉴于此,本文同时将CPI和PPI作为通胀率的测度指标,从消费和生产两个领域更加全面地把握物价走势,从而更好地为货币政策的制定提供决策参考。

二、LSTM模型的设定与求解
考虑到本文的研究重点是使用LSTM模型对通胀率进行全面预测分析,因而本部分主要对LSTM模型的内涵、设定和求解过程进行详细阐述。

除此之外,本文还将使用BVAR模型预测通胀率,不过其主要目的是作为参照对象,以评判LSTM模型是否能够改善对通胀率的预测准确度,因而不再详述BVAR模型的具体细节。

简言之,BVAR模型就是用贝叶斯方法对动态面板的VAR系统进行分析,建立一个由m 个变量组成、滞后阶数为p、含有常数项的VAR(p)模型,即yt=A1yt-1+A2yt-2+…+Apyt-
p+Ac+ut。

其中,Ac是常数矩阵;yt=(y1,t,y2,t,…,ym,t)T,包含通胀率、M2、股价指数等宏观变量;残差ut~i.i.d.Nm(0,∑),∑为m×mDM=S-N(N+1)4N(N+1)(2N+1)24~N(0,1)正定矩阵;Aj为m×m阶系数矩阵,αi,j,τ为方程i中变量j滞后τ期的系数。

(一)LSTM模型概述
LSTM模型是对循环神经网络(Recurrent Neural Network,RNN)模型的改进,也是深度学习方法
深度学习方法是一类模型结构的统称,主要包括循环神经网络模型、深度神经网络模型、深度卷积神经网络模型等。

其中,LSTM模型是循环神经网络模型的一种,已经得到了较为广泛的應用。

的卓越代表之一[28]。

RNN模型在普通多层BP神经网络基础上,增加了隐藏层各单元间的横向联系,通过一个权重矩阵,可以将上一个时间序列神经元的值传递至当前神经元,从而使神经网络具备记忆功能。

LSTM模型在RNN模型隐藏层各神经元中增加记忆单元,从而使时间序列上的记忆信息可控,每次在隐藏层各单元间传递时通过几个可控门,可以控制之前信息和当前信息的记忆和遗忘程度,从而使RNN模型具备长期记忆功能。

与传统的机器学习方法相比,深度学习方法能够更好地从既有数据中提取出各类指标之间的复杂关系,对各种形式的信息和数据都具有较好的适用性。

不仅如此,深度学习方法能够提取并充分利用更抽象、更复杂的数据特征,从而使得预测结果更加准确可靠[31]。

作为新一代的深度学习方法,LSTM模型与ANN(Artificial Neural Network)、RNN等神经网络模型相比具有明显优势:一方面,经济金融领域的数据普遍存在时序结构,因而时序关系及其背后的逻辑关系对于预测分析是不可或缺的,但是ANN模型无法识别样本之间的时序关系,与之不同,LSTM模型则可以充分挖掘变量之间的长期依赖关系,从而将其背后的时序关系尽可能地应用到预测过程中。

另一方面,LSTM模型还解决了RNN模型的梯度消失、梯度爆炸等问题,从而做出更精准的预测[29]。

正因如此,LSTM模型的应用日益广泛,不仅被应用到语音识别、情感分析、机器翻译和文本分析相关的学术研究之中[29-32],而且已经在谷歌和百度等公司得到了越来越多的应用。

例如,谷歌的神经网络机器翻译系统和百度的汉语语音识别产品均应用了LSTM模型和相关算法。

LSTM模型的预测过程通过神经元的连接实现,具体而言,基本单元模型接收来自其他神经元传递过来的输入信号,输入信号通过带权重的连接进行传递。

因此,可以将LSTM模型视为若干线性和非线性函数相互嵌套的模型。

对于本文重点研究的通胀率预测分析而言,由于不同时期的历史数据都会对通胀率产生影响,但近期历史数据对通胀预测的影响更大,故而本文选择设有三个门控(Gates)的LSTM模型来控制信息传递过程,从而筛选出对预测有用的信息。

每个神经元结构,如图1所示。

其中,xt表示t时期的输入向量,包含通胀率、M2、投
资、消费、股价指数、汇率、国际大宗商品等变量的历史数据。

ht-1表示上一时期的输出结果,ct-1表示上一时期的旧记忆。

遗忘门(Forget Gate)决定了上一时期的单元状态有多少记忆需要遗忘,更新门(Update Gate)则决定了需要更新多少新记忆,并由新记忆和旧记忆相加形成最终记忆,由输出门(Output Gate)从最终记忆中筛选出对预测有用的部分。

不过,目前国内尚无文献使用LSTM模型对中国通胀率进行预测。

不仅如此,已有文献在预测中国通胀率时往往只关注CPI而忽视了PPI。

近年来,中国的CPI和PPI多次发生较为严重的背离,在CPI同比增速持续为正的情况下,PPI同比增速持续为负。

这在2012—2016年以及2019年下半年至2020年上半年表现得尤为明显。

其中,2012年3月至2016年8月期间,CPI同比增速平均涨幅为2.085%,而PPI同比增速平均涨幅为-2.872%;2019年7月至2020年9月期间,CPI同比增速平均涨幅为3.420%,而PPI同比增速平均涨幅为-1.593%,期间虽然PPI同比增速曾在2020年1月份实现了0.100%的正增长,但在此前后至少半年均为负增长,因此,笔者认为,PPI负增长的整体局面是没有改变的。

CPI和PPI的背离走势使得货币政策的制定陷入两难:要想应对CPI上涨带来的通胀压力,需要紧缩型货币政策,但是这会进一步加重PPI的下行态势;要想应对PPI下行带来的通缩压力,需要适当加大货币政策力度,但是这会进一步加重CPI的上涨态势和通胀压力。

有鉴于此,本文使用LSTM模型对CPI和PPI这两个重要的物价指标分别进行了预测分析。

为了评价LSTM模型预测性能的优劣,本文还借鉴肖争艳等[28]的做法,同时使用LSTM模型和BVAR 模型,对通胀率进行预测。

结合三类预测误差MSE、MAPE和SMAPE的相對大小,笔者发现,LSTM模型的确比BVAR模型更加适用于预测中国的CPI和PPI,从而可以帮助我们前瞻性判断未来通胀率的走势。

与已有研究相比,本文主要有两点边际贡献:其一,本文将LSTM模型应用于中国通胀率预测。

已有文献主要使用AR和VAR系列模型等线性模型对通胀率进行预测,忽视了货币政策等因素对通胀率的非线性影响。

本文使用的LSTM模型能够较好地将非线性影响考虑在内,而且与BP等传统神经网络模型相比,LSTM模型的门控结构使其能够识别出各序列更长时期的非线性关系,从而更充分地利用历史数据所包含的信息进行预测。

本文的研究结果表明,LSTM模型的预测性能的确优于BVAR等传统线性模型,更适用于对通胀率的预测研究。

其二,本文同时将CPI和PPI作为通胀率的测度指标,分别进行预测研究。

已有文献通常仅将CPI作为通胀率的测度指标加以研究,但是新常态以来,中国的CPI和PPI走势多次背离,只考虑CPI很难对整体物价走势进行准确把握。

有鉴于此,本文同时将CPI和PPI作为通胀率的测度指标,从消费和生产两个领域更加全面地把握物价走势,从而更好地为货币政策的制定提供决策参考。

二、LSTM模型的设定与求解
考虑到本文的研究重点是使用LSTM模型对通胀率进行全面预测分析,因而本部分主要对LSTM模型的内涵、设定和求解过程进行详细阐述。

除此之外,本文还将使用BVAR模型预测
通胀率,不过其主要目的是作为参照对象,以评判LSTM模型是否能够改善对通胀率的预测准确度,因而不再详述BVAR模型的具体细节。

简言之,BVAR模型就是用贝叶斯方法对动态面板的VAR系统进行分析,建立一个由m 个变量组成、滞后阶数为p、含有常数项的VAR(p)模型,即yt=A1yt-1+A2yt-2+…+Apyt-
p+Ac+ut。

其中,Ac是常数矩阵;yt=(y1,t,y2,t,…,ym,t)T,包含通胀率、M2、股价指数等宏观变量;残差ut~i.i.d.Nm(0,∑),∑为m×mDM=S-N(N+1)4N(N+1)(2N+1)24~N(0,1)正定矩阵;Aj为m×m阶系数矩阵,αi,j,τ为方程i中变量j滞后τ期的系数。

(一)LSTM模型概述
LSTM模型是对循环神经网络(Recurrent Neural Network,RNN)模型的改进,也是深度学习方法
深度学习方法是一类模型结构的统称,主要包括循环神经网络模型、深度神经网络模型、深度卷积神经网络模型等。

其中,LSTM模型是循环神经网络模型的一种,已经得到了较为广泛的应用。

的卓越代表之一[28]。

RNN模型在普通多层BP神经网络基础上,增加了隐藏层各单元间的横向联系,通过一个权重矩阵,可以将上一个时间序列神经元的值传递至当前神经元,从而使神经网络具备记忆功能。

LSTM模型在RNN模型隐藏层各神经元中增加记忆单元,从而使时间序列上的记忆信息可控,每次在隐藏层各单元间传递时通过几个可控门,可以控制之前信息和当前信息的记忆和遗忘程度,从而使RNN模型具备长期记忆功能。

与传统的机器学习方法相比,深度学习方法能够更好地从既有数据中提取出各类指标之间的复杂关系,对各种形式的信息和数据都具有较好的适用性。

不仅如此,深度学习方法能够提取并充分利用更抽象、更复杂的数据特征,从而使得预测结果更加准确可靠[31]。

作为新一代的深度学习方法,LSTM模型与ANN(Artificial Neural Network)、RNN等神经网络模型相比具有明显优势:一方面,经济金融领域的数据普遍存在时序结构,因而时序关系及其背后的逻辑关系对于预测分析是不可或缺的,但是ANN模型无法识别样本之间的时序关系,与之不同,LSTM模型则可以充分挖掘变量之间的长期依赖关系,从而将其背后的时序关系尽可能地应用到预测过程中。

另一方面,LSTM模型还解决了RNN模型的梯度消失、梯度爆炸等问题,从而做出更精准的预测[29]。

正因如此,LSTM模型的应用日益广泛,不仅被应用到语音识别、情感分析、机器翻译和文本分析相关的学术研究之中[29-32],而且已经在谷歌和百度等公司得到了越来越多的应用。

例如,谷歌的神经网络机器翻译系统和百度的汉语语音识别产品均应用了LSTM模型和相关算法。

LSTM模型的预测过程通过神经元的连接实现,具体而言,基本单元模型接收来自其他神经元传递过来的输入信号,输入信号通过带权重的连接进行传递。

因此,可以将LSTM模型视为若干线性和非线性函数相互嵌套的模型。

对于本文重点研究的通胀率预测分析而言,由于不。

相关文档
最新文档