ARIMA融合神经网络的人民币汇率预测模型研究_熊志斌
基于ARIMA模型的汇率预测研究
基于ARIMA模型的汇率预测研究作者:魏红燕孟纯军来源:《时代金融》2014年第08期【摘要】本文采用2010年7月1日至2013年11月30日的人民币兑美元汇率周平均值,建立了ARIMA模型,对并汇率序列进行预测和评价。
实证结果表明,ARIMA(2,1,2)模型预测结果比较成功,基本能反映人民币升值的趋势。
【关键词】人民币汇率 ARIMA模型汇率预测一、引言自美国金融危机爆发以来,人民币汇率的走势已成为人们关注的焦点之一。
尤其是近年来中美贸易失衡加剧,美国政府将其对中巨额贸易赤字的根源归咎于人民币币值的低估,并将人民币兑美元汇率视为影响中美双方经贸关系的焦点问题。
因此,正确预测人民币兑美元汇率具有重要的现实意义。
汇率预测的研究很多,现在国内的主要研究有:ARIMA模型,GARCH模型,GARCH_M 模型,PPP模型,神经网络模型,VAR模型及多元回归模型。
戴晓枫和肖庆宪[1](2003)利用ARIMA模型和EGARCH模型并进行预测和评价人民币汇率;张奕韬[2](2009)基于ARIMA模型的外汇汇率时间序列预测研究;闫海峰,谢莉莉[3](2009)基于GARCH-M模型的人民币汇率预测;许少强,李亚敏[4](2007)则利用参考“一篮子”货币的人民币汇率预测—基于ARMA模型的实证方法;等等。
本文通过运用时间序列ARIMA模型的理论与方法,对非平稳时间序列差分后建立平稳的时间序列,从而进行模型参数的选取和预测。
最后,对模型的预测结果进行评价分析,认为该模型在汇率的走势较平稳时,能够很好的拟合汇率的即时走势,对其预测所得结果在误差允许的范围内。
二、模型知识概述(一)ARIMA模型[5]ARIMA模型,是将非平稳时间序列转化为平稳时间序列,再将因变量对它的滞后值及随机误差项的现值和滞后值进行回归所建立的模型。
ARIMA模型根据原序列是否平稳及回归中所含部分的不同,包含移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。
小波包与神经网络相结合的人民币汇率预测
、
E Z
=
素所引起 的汇率价格 波动特征也是不 同的, 分散反映在相应 的 不 同时 间尺度上 。 小波变换 由于其独特的多尺度分析能力而成 为提取这类序列变化特征 的有力工具 。 它的最大的优点是能将
( t ) = ∑h k W ( 2 t 一 )
) = ( 2 t — k ) ( 3 ) l( 时 间序 列按不 同尺度分 解成不 同的层次 ,这就使 问题变得 简 k EZ 单, 便于分析和预测 。然而 , 缺憾 的是 , 小波变换 只能在 固定 的 n = l , 2 , … , Ⅳ 频率 空间上分解 , 缺 乏灵活性 , 存 在着在 时间分辨率 高时频 率 则 称 由( 3 ) 式 所 确 定 的 函数 序列 ( H = 0 , 1 , 2 , …, Ⅳ) 为 由 分 辨率 低的缺陷 , 这就可能丢失某些频率空 间中的重要 价格波 w 0 = ( p 确定 的小波包 。 动特征 的信息 ; 而小波包 能够克服上述 缺陷。 据此 , 本文应用小 ( 二) 人工神经 网络简介 波包变换对 人民币汇率预测进行研究 , 以期提高人 民币汇率预 人工 神经 网络 , 通常简称神 经 网络 , 是模 拟生物 神经 网络 报 的精度 。
【 收稿 日期 】 2 0 1 3 ~ 0 7 — 3 1 【 基 金项 目】 辽宁省教育厅人文社会科学研究项 目( W2 0 1 0 3 1 2 ) 【 作 者简 介 】 殷 光伟(ቤተ መጻሕፍቲ ባይዱ1 9 6 3 - ) , 女, 辽宁沈 阳人, 博士, 沈 阳工业大学经济学院副教授, 天津大学博士后出站人员, 研 究方 向: 金融工程 与风 险管理 ;
【 关 键 词 】 小波包变换; 汇率 ; 神经 网络; 预测 【 中图分类号 】 F 8 2 2 【 文献标 识码 】 A 【 文章编号 】 1 0 0 4 — 2 7 6 8 ( 2 0 1 3 ) 1 0 — 0 0 4 0 — 0 3
基于ARIMA模型对人民币汇率的预测分析
龙源期刊网
基于ARIMA模型对人民币汇率的预测分析作者:陈全
来源:《时代经贸》2013年第06期
【摘要】人民币汇率波动较为复杂,不确定性影响因素较多。
本文利用ARIMA模型对人民币兑美元汇率中间价的历史数据进行拟合,建立了二阶差分的时间序列方程,最后检验表明短期预测结果模拟值与实际值十分接近,预测效果良好。
【关键词】预测;ARIMA模型;人民币兑美元汇率中间价
自2005年汇改以来,人民币对美元汇率中间价屡创新高,人民币汇率形成了持续地小幅单向升值的特征。
但前年年底开始,人民币对美元中间价却开始涨涨跌跌,而不仅仅是单向升值。
这表明双向浮动的弹性不断增强,将是未来人民币汇率变动的特征。
很多专家学者都对人民币汇率变动规律进行了研究。
翟爱梅(2010)利用GARCH模型对人民币汇率波动进行实证研究,孙音(2010)通过多元回归分析考察了人民币汇率的影响因素。
ARIMA模型是一种比较适用且预测精度较高的预测方法,该模型假定事物的变迁符合渐进特征,影响事物的因素在过去、当前和将来基本不变或变化较小,即事物的变迁遵循稳定与类推的法则,因此可根据序列的现有信息和确定趋势以预测未来信息。
本文根据人民币兑美元汇率过去的变化规律来建立ARIMA模型,然后利用这个模型来预测人民币汇率未来的变化趋势。
基于ARIMA模型的汇率预测
《高级数量分析方法》课程作业基于MATLAB软件与ARIMA模型的预测——以人民币对美元的即期汇率为例院系:管理学院会计系指导老师:孟力教授小组成员:张嘉珉 17520121151118卢梦杉 17520121151097周姣 17520121151123目录1研究背景 (1)1.1人民币对美元的国际化进程 (1)1.2人民币对美元现状分析 (1)2ARMA模型与ARIMA介绍 (2)2.1AR(p)模型 (3)2.2MA(q)模型 (3)2.3ARMA(p,q)模型 (4)2.4ARIMA(p,d,q)模型 (4)3自相关系数和偏自相关系数 (4)3.1 p阶自回归AR(p) (4)3.2平稳时间序列自协方差与自相关系数 (4)3.3偏相关系数 (5)4模型的选择 (5)4.1自回归AR(p)模型 (5)4.2移动平均MA(q)模型 (5)4.3自回归移动平均ARMA(p,q)模型 (5)4.4ARIMA(p,d,q)模型 (6)4.5模型的选择 (6)5数据来源及选择 (6)6模型的建立与预测 (7)6.1数据的预处理 (7)6.2模型的识别 (8)6.3ARIMA模型的建立与检验 (9)6.4模型预测 (13)7模型预测结果与分析 (14)7.1模型预测结果描述 (14)7.2模型预测存在的不足 (15)7.3不足的原因的分析 (15)8结语及展望 (16)【摘要】本文以2012年1月——2012年11月人民币对美元的即期汇率中间价数据为基础,运用ARMA模型进行汇率的拟合,经过多次对程序的调用试运行,发现采用观察偏自相关系数与自相关系数的方法定出阶数建立的模型,与实际拟合效果不理想。
最终我们决定根据AIC准则,选择使得AIC值最小的模型阶数进一步操作,得出的ARIMA(2,1,2)模型能更好地模拟人民币汇价的走势。
文中运用此模型进行预测, 结果具有精度高、稳定性好等特点。
通过对未来汇率的预测,为有效制定外汇投资或外汇避险等相关决策提供建议。
基于ARIMA与神经网络集成的GDP时间序列预测研究
基于ARIMA与神经网络集成的GDP时间序列预测研究一、概述随着全球经济的不断发展,GDP(国内生产总值)时间序列预测成为经济学、金融学等领域的研究热点。
准确的GDP预测对于政策制定、投资决策、市场预测等方面具有重要意义。
GDP时间序列受到多种因素的影响,如政策调整、市场需求、自然灾害等,呈现出高度的非线性和不确定性。
单一的预测方法往往难以准确捕捉GDP时间序列的复杂特征。
近年来,随着人工智能技术的发展,神经网络在时间序列预测领域展现出强大的潜力。
神经网络通过模拟人脑神经元的连接方式,能够自适应地学习数据的内在规律,从而实现复杂非线性系统的建模和预测。
另一方面,ARIMA(自回归移动平均模型)作为一种经典的统计预测方法,在时间序列分析中具有广泛的应用。
ARIMA模型通过拟合数据的自回归和移动平均过程,能够捕捉时间序列的线性特征。
为了克服单一预测方法的局限性,提高GDP时间序列预测的准确性,本文提出了一种基于ARIMA与神经网络集成的预测方法。
该方法将ARIMA模型和神经网络相结合,充分利用两者的优势,以实现对GDP时间序列的准确预测。
具体而言,首先利用ARIMA模型对GDP时间序列进行线性拟合,提取出线性特征将ARIMA模型的残差作为神经网络的输入,利用神经网络学习非线性特征。
通过集成ARIMA模型和神经网络的预测结果,可以综合利用线性和非线性信息,提高预测精度。
本文将对基于ARIMA与神经网络集成的GDP时间序列预测方法进行详细的研究和探讨。
介绍ARIMA模型和神经网络的基本原理和优缺点阐述基于ARIMA与神经网络集成的预测方法的构建过程通过实验验证该方法的预测性能,并与其他常见的预测方法进行比较分析。
本文的研究旨在为GDP时间序列预测提供一种新的思路和方法,为相关领域的研究和实践提供参考和借鉴。
_______时间序列预测的重要性时间序列预测,特别是GDP时间序列预测,在现代经济分析和政策制定中占据着至关重要的地位。
时间序列模型的人民币汇率行为描述与预测
时间序列模型的人民币汇率行为描述与预测人民币汇率是国际金融市场上的重要指标之一,其变动对中国经济和全球经济都有重要影响。
时间序列模型可以用来描述和预测人民币汇率的行为。
人民币汇率受到许多因素的影响,包括国际金融市场的波动,经济基本面的变化,政府干预等。
时间序列模型主要基于历史汇率数据来建立模型,通过分析过去汇率的走势和规律,来预测未来的汇率变动。
在时间序列模型中,常用的模型包括自回归移动平均模型(ARMA)、自回归积分移动平均模型(ARIMA)、指数平滑模型等。
这些模型可以分析人民币汇率的趋势、季节性和周期性。
人民币汇率的趋势可以用ARIMA模型来描述和预测。
该模型基于时间序列的自相关和移动平均性质,可以捕捉到长期趋势的变化。
通过对汇率时间序列数据进行差分,可以得到平稳序列,然后通过自相关和偏自相关函数来确定ARIMA模型的阶数。
最后,可以利用估计的参数来预测未来的汇率变动。
人民币汇率的季节性和周期性可以通过指数平滑模型来描述和预测。
该模型基于历史数据的加权平均值,可以捕捉到季节性和周期性的变化。
通过对汇率时间序列数据进行加权平均,可以得到预测值,并根据历史数据的权重来调整预测值,以提高预测的准确性。
除了以上两种模型,还可以使用更复杂的模型,如GARCH模型,来描述和预测人民币汇率的波动性。
GARCH模型基于汇率的波动性的自相关和移动平均性质,可以捕捉到波动性的变化。
通过对波动性时间序列数据进行估计,可以得到未来波动性的预测。
总之,时间序列模型可以用来描述和预测人民币汇率的行为。
通过对汇率时间序列数据进行分析和建模,可以得到对未来汇率变动的预测,为决策者和投资者提供参考。
然而,需要注意的是,时间序列模型仅基于历史数据来进行预测,不考虑其他因素的影响,因此预测结果可能存在一定的误差。
时间序列模型是一种基于历史数据的分析方法,用于描述和预测数据随时间推移的特征和趋势。
在人民币汇率行为的描述与预测中,时间序列模型可以帮助我们理解人民币汇率的变动规律,并提供一定程度的预测能力。
一种基于ARIMASVR混合方法的汇率预测模型
智库时代·22·财经智库一种基于ARIMA-SVR 混合方法的汇率预测模型徐 超(武汉大学经济与管理学院,湖北武汉 430072)摘要:本文采用了一种基于ARIMA 和SVR 的混合方法对四种货币对美元的汇率进行了预测。
本文的主要思路在于将汇率序列分解为线性和非线性两个部分,利用ARIMA 模型去估计汇率的线性部分,使用SVR 方法去预测汇率的非线性部分。
实证结果表明混合模型的预测精度高于ARIMA 模型、SVR 方法以及随机游走模型。
关键词:汇率预测;ARIMA 模型;SVR 模型中图分类号:TU205文献标识码:A 文章编号:2096-4609(2019)01-0022-002一、引言汇率作为维系各国之间经贸往来的桥梁和纽带,在国际经济研究中一直享有极高的关注度。
汇率不单纯是两国货币间的折算比例,亦是各国政治经济博弈中的常用手段。
随着我国经济社会的发展以及全球化进程不断的深入,特别是人民币加入特别提款权后,外汇风险成为了一个不可回避的问题。
因此,有效分析和预测人民币汇率对各类经济政策制定和投资决策的实施具有重要的意义。
二、文献综述刘柏等(2008)认为汇率是市场博弈和出清的结果,时间序列的分析方法不受限制于汇率制度,因此汇率自身变化传递的信息对于汇率预测具有显著价值。
熊志斌(2011)利用ARIMA-NN 混合模型对人民币汇率进行预测,结果表明混合模型的预测精度高于随机游走模型和ARIMA、NN 单一模型。
Anastasakis and Mort(2009)建立了两阶段预测模型:第一阶段采用参数化方法,例如ARIMA、VAR 以及协整技术;第二阶段采用非参数方法,例如SVR 和ANN。
实证表明:SVR 对于非参数部分的预测效果要优于ANN。
三、模型设定鉴于时间序列数据一般具有线性和非线性的复合特点,单一线性或者非线性模型都无法有效地反映这种复合特征。
本文将ARIMA 和SVR 这两类模型结合,以求更高的汇率预测精度。
基于arima模型我国近年来外汇储备的分析及预测
摘要随着近年来我国经济迅猛发展,人民币持续升值,我国外汇储备规模不断增大,日益受到重视。
本文简单介绍了外汇储备的相关概念,并分析了我国外汇储备现状。
随后用1981年-2010年我国外汇储备数据用arima模型做了时间序列分析及预测,并对预测结果进行检验和解释。
我国外汇储备由于经济惯性原因,受前期储备只影响较大,预测结果显示正处于稳定快速增长状态。
模型运用过程中,根据数据的特点,涉及到对原始数据的处理,其中包括取对数,差分等。
关键词:我国外汇储备arima模型时间序列AbstractAlong with the rapid development of our country's economy in recent years,the RMB keep appreciating and the scale of our country's foreign exchange reserve become bigger and bigger.As a result,this condition draws more and more attention.This paper briefly introduces the concepts related to foreign exchange reserves and analyzes the current situation of foreign exchange reserves of China. Then, on the basis of China's foreign exchange reserves data from 1981 to 2010 ,I made the applied time series analysis and made a prediction by the arima model in this paper.What’s more ,This paper tested and explaine d the result of prediction. Due to the economy of inertia,our country's foreign exchange reserves are greatly influenced by previous reserve.And the result of prediction show that the foreign exchange reserves are in a state of steady and fast growth. According to the characteristics of the data, this paper handled the raw data in the process of using model, including taking the logarithm, difference, etc.Keywords: foreign exchange reserves of China, arima model, applied time series基于arima模型我国年度外汇储备的分析及预测绪论外汇储备外汇储备(Foreign Exchange Reserve),又称为外汇存底,指一国政府所持有的国际储备资产中的外汇部分,即一国政府保有的以外币表示的债权。
基于ARIMA和BP神经网络对人民币汇率预测的比较分析——以美元人民
Abstract:WiththecontinuousmarketizationofChina’sexchangeratesystem,itisofgreatpractical significancetopredictthefluctuationtrendofexchangerate.ThispaperusesARIMAandBPneural networkmethods,SPSS,EVIEWS10andMATLABtools,respectively,toforecastandanalyzethe exchangerateofRMB,andcomparethepredictioneffectofthetwomodelsontheexchangerate trend.TheresultsshowthattheARIMAandBPneuralnetworkmodelsareeffectiveandfeasiblefor RMBexchangerateforecasting,andthepredictionaccuracydecreaseswiththepredictiontime,测效果。结果表明:ARIMA和 BP神经网络模型
对人民币汇率的预测是有效可行的,预测精度随着预测时间的推移而下降,更适用于短期预测。
且 ARIMA对人民币汇率的预测效果优于 BP神经网络。
关 键 词:人民币汇率;ARIMA;BP神经网络;预测
中图分类号:F832.6 文献标识码:A
基于 ARIMA和 BP神经网络对人民币汇率 预测的比较分析
基于一类综合人工神经网络模型的汇率预测研究
基于一类综合人工神经网络模型的汇率预测研究基于一类综合人工神经网络模型的汇率预测研究人工神经网络模型(Artificial Neural Network,ANN)是一种借鉴生物神经系统结构和功能,利用大量并行处理单元进行信息处理的计算模型。
在金融领域,ANN被广泛应用于汇率预测,通过学习历史数据的模式和趋势,以预测未来汇率的变化,对投资决策提供参考。
本文将介绍一类综合人工神经网络模型,并应用于汇率预测研究中。
一类综合人工神经网络模型的结构包括输入层、隐含层和输出层。
输入层接收外部数据,如货币政策、经济数据等,将它们转换成ANN能够处理的数值形式。
隐含层是ANN模型的核心部分,通过学习输入层的模式和趋势,提取并建立数据的内在特征。
输出层则根据隐含层的结果,预测未来汇率的变化。
汇率预测模型的建立主要分为两个步骤:训练和测试。
在训练阶段,ANN模型通过反向传播算法进行学习,不断调整权重和阈值,以减小输出误差。
训练过程中,需要提供历史汇率数据作为模型的输入,并将实际汇率数据作为期望输出。
通过多次迭代学习,模型逐渐优化,提高预测准确性。
在测试阶段,将新的输入数据输入到经过训练的模型中,得到预测的汇率变化,与实际汇率进行比较,评估模型的预测能力。
综合人工神经网络模型的优点之一是可以处理非线性关系和噪声数据。
在汇率预测中,汇率受多种因素的影响,如经济政策、国际贸易等,这些因素之间存在复杂的非线性关系。
传统的经济模型往往无法准确捕捉这些关系,而ANN模型可以通过大量数据的学习,发现和利用这些非线性特征,提高预测精度。
此外,市场波动和噪声对汇率变化有着重要影响,ANN模型具有良好的抗噪声性能,能够有效捕捉这些特征。
然而,综合人工神经网络模型也存在一些挑战和限制。
首先,模型的训练需要大量的历史数据,如果数据不充足或质量较差,将影响模型的准确性。
其次,ANN模型的参数调整和网络结构的选择,对模型的性能有着重要影响。
不同的参数和结构选择可能导致模型的预测结果不同,需要进行进一步的优化和调整。
基于ARIMA和BP神经网络对人民币汇率预测的比较分析——以美元人民币汇率为例
基于ARIMA和BP神经网络对人民币汇率预测的比较分析——以美元人民币汇率为例朱家明;胡玲燕【摘要】随着我国汇率制度不断市场化发展,预测汇率的波动趋势具有重要的现实意义.采用ARIMA和BP神经网络方法,利用SPSS、EVIEWS10和MATLAB工具,分别对人民币汇率进行预测分析,并比较两模型对汇率走势的预测效果.结果表明:ARIMA和BP神经网络模型对人民币汇率的预测是有效可行的,预测精度随着预测时间的推移而下降,更适用于短期预测.且ARIMA对人民币汇率的预测效果优于BP神经网络.【期刊名称】《重庆理工大学学报(自然科学版)》【年(卷),期】2019(033)005【总页数】6页(P207-212)【关键词】人民币汇率;ARIMA;BP神经网络;预测【作者】朱家明;胡玲燕【作者单位】安徽财经大学统计与应用数学学院,安徽蚌埠233000;安徽财经大学金融学院,安徽蚌埠233000【正文语种】中文【中图分类】F832.62005年,我国进行了汇率改革,宣布采用浮动汇率制度,参考一篮子货币进行调节,这使我国汇率受到市场供求关系的影响,波动范围进一步扩大,人民币出现较大幅度升值[1]。
2015年,我国又开展了新一轮汇率改革,宣布当日人民币中间价需要参考上个工作日人民币的收盘汇率和一篮子货币汇率的变化[2],这意味着我国汇率制度不断完善,且不断向汇率市场化发展。
而汇率的波动对个人投资、企业进出口、国家国际收支等来说都有密切关系,因此对汇率走势进行预测具有重要意义[3]。
国内外学者对汇率预测也进行了相关研究。
在国外,Refenes等利用神经网络和平滑法进行汇率预测,发现神经网络预测效果更优[4]。
而Svitlana则发现神经网络更适用于对汇率进行短期预测[5]。
国内戴晓枫等发现EGARCH对人民币汇率的预测效果优于ARIMA模型[6]。
刘潭秋利用线性和非线性时间序列研究发现LSTAR-GARCH对人民币汇率的拟合效果更好[7]。
随机游走
比较金融市场预测绩效的基础就是随机游走方法。
随机游走模型是由英国统计学家Kendall创立的。
Bachelier Fama和Samuelson在他们的研究中提出随机游走的假设已经在描述金融价格序列的研究中扮演很重要的角色。
在本模型中,时间序列上每一个点都会随机地游离现在的位置,产生的模型为Yt=Yt-1+et, 其中Yt为t时间的预测值,et为预测误差。
随机游走从它的初始值开始游离但是却没表现出特定的方向或趋势。
已有很多研究表明外汇汇率包含单位根,支持随机游走假设。
此时,随机游走模型可以表示为St=St-1+et或者为Claudia Lawrence指出外汇汇率存在一个基础汇率,未来的汇率在基础汇率水平上下游离,在模拟实验中通过了单位根检验。
Richard Meese, Kenneth Rogoff表明即期汇率的对数形式近似服从随机游走,而且外汇时间序列中的任何序列相关在长期会消失。
这篇文章同时指出无论是短期还是长期预测随机游走都战胜了结构模型。
很多研究也如将随机游走模型作为汇率预测绩效的参照。
唐小我指出短期外汇市场是有效的,从而随机游走模型是最佳的短期汇率预测模型,而随着期限增加外汇市场效率降低,随机游走模型效率下降,组合模型的优势渐渐体现。
Lutz Kilian, Mark Taylor (2002)指出传统理论建立的模型不能战胜随机游走的原因有两个:一个是理论非线性和模型线性之间的冲突,另一个是理论符合的情形只在长期或短期内成立,理论模型不能在长期和短期都战胜随机游走。
他们利用ESTAR模型(非线性)与随机游走比较,发现对2-3年的预测理论模型表现更好,而在更短的时间内随机游走预测得更好。
近几年也有很多研究将主要研究的预测模型与随机游走模型进行比较,且出现了不同的比较结果。
张一,惠晓峰(2012)将奇异谱分析和随机游走模型进行比较,结果表明该方法由于随机游走模型。
熊志斌(2011)建立了ARIMA融合NN(神经网络)模型的人民币汇率时间序列预测模型,并且通过仿真实验表明融合模型的预测准确率显著高于随机游走模型。
基于时频融合卷积神经网络的股票指数预测
㊀第54卷第2期郑州大学学报(理学版)Vol.54No.2㊀2022年3月J.Zhengzhou Univ.(Nat.Sci.Ed.)Mar.2022收稿日期:2021-05-31基金项目:教育部人文社会科学青年基金项目(21YJCZH045);中央高校基本科研业务专项资金项目(JBK2101001)㊂第一作者:姜振宇(1998 ),女,硕士研究生,主要从事数据挖掘与分析研究,E-mail:jiangzhenyu@㊂通信作者:蔡福旭(1972 ),男,副主任医师,主要从事时序数据挖掘和医学统计研究,E-mail:caifuxu20@㊂基于时频融合卷积神经网络的股票指数预测姜振宇1,㊀黄雁勇1,㊀李天瑞2,㊀蔡福旭3(1.西南财经大学统计学院㊀四川成都611130;2.西南交通大学计算机与人工智能学院㊀四川成都611756;3.莆田学院附属医院㊀福建莆田351100)摘要:传统的股票指数预测方法是在含噪声㊁非平稳以及非线性的原始股指序列数据上实施的,这将导致预测精度的下降㊂为了解决这个问题,提出了一种基于时频融合卷积神经网络的股指预测方法㊂首先通过引入变分模态分解(VMD)将原始序列数据分解到频域特征上,使得分解后的股指数据具有低信噪比,同时具有更明显的趋势性和平稳性㊂进一步结合时序卷积神经网络(TCN),构建了时频融合的卷积神经网络模型㊂最后在6个实际数据集上与8个基准方法进行比较,实验结果表明该方法具有更高的预测精度和更好的解释性㊂关键词:股票指数预测;时频融合;变分模态分解;时序卷积网络中图分类号:TP311㊀㊀㊀㊀㊀文献标志码:A㊀㊀㊀㊀㊀文章编号:1671-6841(2022)02-0081-08DOI :10.13705/j.issn.1671-6841.2021225Fusion of Time-frequency-based Convolutional Neural Network inFinancial Time Series ForecastingJIANG Zhenyu 1,HUANG Yanyong 1,LI Tianrui 2,CAI Fuxu 3(1.School of Statistics ,Southwestern University of Finance and Economics ,Chengdu 611130,China ;2.School of Computing and Artificial Intelligence ,Southwest Jiaotong Univeristy ,Chengdu 611756,China ;3.Putian College Affiliated Hospital ,Putian 351100,China )Abstract :The traditional stock index forecasting methods were conducted on the noisy,non-stationary andnon-linear original stock index time series data,which would degrade the prediction accuracy.In order to deal with this issue,a novel stock index prediction method was proposed by incorporating the time-frequen-cy features and the convolutional neural network.Firstly,the original time series data were decomposed in-to time-frequency features by employing the variational mode decomposition (VMD).The decomposed se-ries data had a low signal-to-noise ratio and also stationarity with a clear trend.Then,by combining with temporal convolutional network (TCN ),a fusion of time-frequency-based convolutional neural network model was proposed.Finally,compared with eight baseline methods on six real-world datasets,the experi-mental results showed that our method had higher prediction accuracy and better interpretability.Key words :stock market index prediction;fusion of time-frequency;variational mode decomposition;temporal convolutional network0㊀引言股票是社会生产力发展的产物,顺势而生的股票市场为企业主体进行融资提供了平台,并促进了资金的供求平衡㊂通过股票市场,个人投资者以及金融机构可以进行金融投资以期获得预期收益,市场上的变动密切关系到相关投资者的切身利益㊂同郑州大学学报(理学版)第54卷时,随着经济市场化的进程不断推进,股票已然成为我国国民经济的重要组成部分,与国家的宏观经济息息相关,它的运行情况反映了个体企业的运营境况㊁国民经济的发展态势和宏观经济的健康状况㊂因此,股票市场分析一直以来都备受学术界和业界的广泛关注㊂为了避免对多只股票分别建模的冗余操作,许多金融机构或证券交易所编制了由多只代表性股票汇总得到的股票指数㊂对股票指数的建模不仅可以同时对多只股票进行分析,而且可以观察某个股票市场的整体情况㊂尽管如此,原始的股指数据往往是只包含历史信息的单一时间序列,这使得建模可用的信息有限㊂同时,原始股指序列具有非线性和非平稳性的特点,而且往往还包含大量的噪声和无用信息㊂这使得传统时序预测的方法无法得到较高的预测精度㊂针对这一问题,本文提出了一种基于时频融合卷积神经网络的预测方法㊂首先通过使用变分模态分解(variational mode decomposition, VMD)将原始序列分解为多个不同时间尺度的本征模态子序列(intrinsic mode function,IMF),其中的低频序列较原序列有着更明显的趋势㊂这保证了提取的历史信息更有效,也降低了原序列的噪声和非平稳性㊂然后,利用时序卷积网络(temporal convo-lutional network,TCN)分别对这些时频特征子序列进行建模并预测㊂进一步,通过VMD的逆分解操作,将子序列融合为股指序列的预测结果㊂最后在多个实际数据集上进行了实验,实验结果表明我们的模型比其他一些基准模型具有更高的预测精度㊂本文的主要贡献包括:1)首次将变分模态分解(VMD)方法引入到股指预测模型中,利用VMD将噪声多㊁不平稳㊁非线性的原始股指序列数据分解成多个更具有规律性的模态子序列,降低了直接使用预测模型提取原序列有效信息的难度,提高了预测的精度;2)提出了一种基于时频融合卷积神经网络的股指预测方法㊂将原始股指数据通过VMD分解后得到的多条时频信号数据分别输入到TCN中,然后对输出的结果进行有效融合,得到股指序列的预测值㊂在几个真实数据集上的实验结果表明我们的方法具有更高的预测精度,同时具有更好的解释性㊂1 相关工作时间序列分析具有相对完整的理论体系,发展至今产生了许多经典的预测模型㊂差分整合移动平均自回归模型(autoregressive integrated moving aver-age model,ARIMA)被应用于股价的预测,短期预测取得了较好的结果[1-2]㊂由于金融时间序列具有异方差等特点,自回归条件异方差模型(autoregressive conditional heteroskedasticity,ARCH)及其广义变体(generalized autoregressive conditional heteroskedastic-ity,GARCH)也被广泛运用在金融时序分析中㊂魏宇将GARCH运用在沪深300指数上,对其波动率进行了预测[3];Hassan则使用隐马尔科夫(hidden markov model,HMM)模型对股票市场建模,并得到了较为准确的预测结果[4];朱永明结合粗糙集理论,使用不同指标对股市进行建模分析[5]㊂上述单一的传统统计学模型具有形式简单㊁可解释性强等特点,但其模型系数的规模通常不大,函数的形式也相对简单,所以其拟合能力较为有限㊂除了传统统计学模型,机器学习中的一些模型也常用于时间序列预测㊂支持向量回归(support vector regression,SVR)是机器学习模型中经典的回归模型㊂Meesad等使用SVR结合了不同窗口设置方法对股票数据进行建模,验证了这一模型的有效性[6]㊂随着建模的数据量越来越大,涉及的数据类型也更加灵活多变㊂深层神经网络(deep neural network,DNN)在处理大数据问题上具有独特优势,其在金融时间序列预测上的有效性也被证明[7];姚宏亮等结合贝叶斯神经网络和均线滞后特征,提出了DSMA模型,并对模型效果进行了实验证明[8]㊂DNN的发展衍生出不同结构的模型,如循环神经网络(recurrent neural network,RNN)及其变体㊁卷积神经网络(convolutional neural networks,CNN)[9]及其变体㊂杨青等使用长短期记忆(long short-term memory,LSTM)对全球共30个股票指数进行不同期限研究,验证了LSTM的良好表现[10];文献[11]使用粒子群优化算法(particle swarm optimization, PSO)优化的分位数回归神经网络(quantile regres-sion neural network,QRNN)对8个金融数据进行建模,都取得了较好的结果㊂上述模型在解决数据非线性㊁不连续和高维的问题上具有一定的优势,但是它们都是直接对原始单时间序列进行建模,模型精度往往受到噪声㊁非平稳以及有限信息等因素的影响㊂真实世界的原始序列往往包含多重信息,其中还掺杂部分噪声与冗余无用的内容㊂为了解决这种问题,熊志斌结合神经网络,使用ARIMA对美元等三种汇率进行建模,并使用PSO对神经网络进行优化[12];Du通过对ARIMA和BPNN的复合模型证实28㊀第2期姜振宇,等:基于时频融合卷积神经网络的股票指数预测了股票数据的非线性,同时预测的结果更加精确[13]㊂针对金融时间序列的非平稳㊁噪声多等特点,Hsieh等结合Haar小波分解与人工蜂群算法优化的RNN对DJIA等四只股票指数进行建模,验证了模型的预测精度[14];Cao等使用自适应白噪声完整经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)与LSTM对SPX等四只股票指数进行建模,并以SVR等模型作为基准方法进行对比实验,验证了所提出模型的优越性[15]㊂上述模型具有一定的效果,然而在实际应用中容易产生模态混叠,同时预测效果不够高㊂综上所述,尽管以上的方法已经取得了一些较好的结果,然而在处理噪声多㊁非线性以及非平稳的股指序列数据时仍然存在一定的局限性㊂本文通过提取股指序列数据的时频特征,同时结合TCN和VMD给出了基于时频融合卷积网络的股指序列预测模型,并通过对比实验及可视化分析进行验证㊂2㊀基础理论介绍本节主要介绍与所提出模型有关的基础理论知识㊂2.1㊀变分模态分解(VMD)VMD是2014年提出的一种完全非递归的变分模式分解方法[16],它与经验模态分解(empiricalmode decomposition,EMD)[17]㊁CEEMDAN[18]等同属于自适应信号分解方法,旨在根据数据自身时间尺度特征进行信号分解㊂同时,VMD避免了模态混叠等问题,并具有更坚实的数学基础㊂在VMD算法中,每个模态都是由调幅-调频信号来表示的,定义为uk(t)=A k(t)cos(Φk(t)),(1)式中:A k(t)是u k(t)的幅值;Φk(t)是相位;u k(t)的瞬时频率为ωk(t)ȡ0㊂在足够长的区间[t-δ,t+δ],δʈ2π/ωk(t)上,可以将模态视为谐波信号㊂先通过希尔伯特变换,获得u k(t)的解析信号的单边频谱;进一步,对于每种模式,与各自估计的中心频率的指数混合,将每个模式的频谱移至 基带 ;最后,通过解析信号的高斯平滑度,即其导数的二范数的平方,来估计各模态的带宽㊂上述步骤产生的约束变分问题为min {u k},{ωk}{ðK k=1 ∂t[(δ(t)+jπt)∗u k(t)]e-jωk t 22}s.t.ðK k=1u k(t)=f(t),(2)其中:f是原始信号;u k(k=1,2, ,K)是所有的模态的集合;ωk(k=1,2, ,K)是对应中心频率的集;j是虚数单位㊂对上式进行递归求解,就可以得到想要的模态分量㊂2.2㊀时序卷积网络(TCN)CNN是被广泛运用的一种神经网络,其核心是通过卷积计算来提取局部的数据特征㊂为了使得模型更加适合序列学习,并避免梯度问题,TCN在CNN的基础上加入了如下特殊结构[19]㊂1)因果卷积:因果卷积在WaveNet中第一次被提出[20],它将层之间的信息传递方向限制成单一方向,这符合时序任务只能获取历史信息的要求㊂2)膨胀卷积:CNN难以处理序列学习问题,这主要是因为它不具备抓取长时依赖信息的能力㊂受限于卷积核大小,CNN需要不断叠加卷积层来获得更长期的感受野,这会导致参数体量庞大等问题㊂膨胀卷积则采用了间隔采样的方法,在层数较少的情况下网络可以获得更大的感受野㊂3)残差连接:神经网络的表达能力一定程度上随着网络层数的增加而提升,但训练难度也随之增加,容易出现梯度消失等问题㊂残差连接的输出被表述成输入与输入的非线性函数的线性求和,这实现了信息的跨层传递㊂同时,若网络通过链式法则进行反向传播,整个输出项的梯度经过多次连乘后不会接近消失㊂3㊀本文的方法上一节我们介绍了VMD和TCN的背景知识,以此为基础,详细介绍基于时频融合卷积神经网络的股指预测模型:首先,介绍模型的整体框架;然后,给出模型学习的具体过程㊂3.1㊀模型框架原始的股指序列数据包含噪声,而且是非平稳和非线性的㊂为此,本文用VMD将原始股指序列数据进行有效分解,得到多条具有时频信息的子序列㊂进而通过结合TCN,构建了基于时频融合的卷积神经网络模型㊂图1是我们所提出模型的框架图,每个模块描述如下㊂1)时频特征获取模块㊂设置VMD分解所需的模态数K,对原始股指序列数据FT进行VMD分解㊂获得原股指序列数据的K个基本模态分量,记为IMF1, ,IMF K,分别代表原序列从高频到低频38郑州大学学报(理学版)第54卷㊀㊀图1㊀所提出模型的框架Figure 1㊀General framework of the proposed model的震荡成分㊂根据VMD 的重构原理,用t 代表时间序列中的时间戳,可得到ðKk =1IMF k(t )=FT (t )㊂(3)㊀㊀使用max-min 归一化,IMF _S k (t )=IMF k (t )-min(IMF k (t ))max(IMF k (t ))-min(IMF k (t )),其中:min(IMF k (t ))㊁max(IMF k (t ))代表的是计算序列中的最小值和最大值,标准化操作后得到IMF _S k ㊂为了进行向前一步预测,本文构造了滑动窗口,并确定时间窗口的长度t =L ㊂按照时间窗口构建输入特征和输出特征,得到X k ㊁Y k ,再按照训练测试比将其划分为X k _train ㊁Y k _train 和X k _test ㊁Y k _test ㊂2)时序卷积神经网络模块㊂使用X k _train ㊁Y k _train对模型进行训练,为了避免过长训练时间,并减少过拟合的风险,引入早停机制㊂针对输入了不同时频特征数据的TCN 网络,本文设定了不同的参数使其更具有针对性㊂通过训练集的参数优化得到网络参数,再使用训练好的模型对X k _test 进行预测,得到预测结果为Yᶄk _test ,对其进行反标准化,得到IMFᶄk _test ㊂3)预测值融合模块㊀根据公式(3),将每个TCN 网络得到的子序列预测进行重构,最终得到的时间序列预测结果为FTᶄtest ㊂3.2㊀模型学习过程这一部分将着重对模型的学习过程进行介绍㊂分解过程中,单一的股指序列数据被对应分解成K 个模态子序列,优化的目标函数如式(2)所示㊂记原始股指序列数据为FT ɪR T,其对应子序列为IMF 1, ,IMF K ㊂利用二次惩罚项与拉格朗日乘数法将式(2)变成如下的无约束优化问题,L ({IMF k },{ωk },λ)ʒ=αðKk =1 ∂t [(δ(t )+jπt )∗IMF k (t )]e-j ωkt22+ FT (t )-ðKk =1IMF k(t )22+λ(t ),FT (t )-ðK k =1IMF k(t )⓪,其中:α为二次惩罚因子,作用是在有噪声时保证重构的精度;λ(t )是拉格朗日乘子㊂用交替方向乘子法(alternating direction methodof multipliers,ADMM)对IMF n +1k ㊁ωn +1k和λn+1进行更新,优化过程如算法1中的1)~6)㊂预测过程中,TCN 的输入为IMF _S k ㊂膨胀卷积使得网络的感受野更大,针对一维的输入向量C ɪR n 和过滤器f :{0, ,k -1}ңR ,膨胀卷积可以表示为F (t )=(C ㊃f d )(t )=ðk -1i =0f (i )㊃Xt -di,其中:d 是膨胀系数;k 是滤波器大小;t -di 表明了历史信息的方向㊂同时,TCN 模型中还使用残差连接:z (i )为残差块输出;z (i-1)为残差块的输入;m ()为非线性映射,则残差连接为z (i )=m (z (i -1))+z (i -1)㊂㊀㊀将上述的膨胀卷积和残差连接合并记为tcn (),其中给定超参数μk ,需要学习的参数记做θk ㊂对所提出的基于时频融合卷积神经网络使用BP 反向传播进行参数优化,优化方法为梯度下降法㊂假设时间窗口长度为L ,预测期长τ,那么输入㊁输出对数量为N =T -L -τ+1,且X k ɪR N ㊃T ,Y k ɪR N ㊃τ㊂我们将很容易得到,Yᶄk =tcn (X k ;θk )㊂训练过程中,使用均方误差MSE 作为损失函数,记X k _train 的第n 行为x kn ,Y k _train 的第n 行为y kn ,得到训练的目标函数为MSE k =1N ðNn =1(y kn -tcn (x kn ;θk ))2㊂㊀㊀原始序列共分解成K 个子序列,需要同时进行K 个上述优化,算法1给出了这一过程㊂算法1㊀基于时频融合卷积神经网络模型的优化算法输入:原始时间序列FT ;相关参数K ㊁L ㊁T ㊁τ㊁κ;神经网络超参数μk ;早停参数patience ㊂输出:训练期的预测值FTᶄtest ㊂48㊀第2期姜振宇,等:基于时频融合卷积神经网络的股票指数预测初始化:{IMF 1k },{ω1k },λᶄ1,n ѳ0;TCN 中所有的可学习参数θk ㊂1)repeat n ѳn +1㊀㊀㊀ʊ数据预处理2)㊀for k =1ʒK ,执行3)㊀㊀针对ωȡ0,更新IMF k 和ωkIMF n +1k(ω)ѳ11+2α(ω-ωn k )2㊃{FT (ω)-ði <kIMFn +1i (ω)-ði >k IMF n i(ω)+λᶄn(ω)2}ωn +1kѳʏɕ0ωIMF n +1k(ω)2d ωʏɕ0IMFn +1k(ω)2d ω4)End for5)针对ωȡ0,采用对偶上升法λᶄn +1(ω)ѳλᶄn (ω)+κ(FT (ω)-ðkIMFn +1k(ω))6)until:ðkIMFn +1k-IMF nk22IMF n k 22<ε,输出IMF k =IMF n +1k7)for k =1ʒK ,使用min-max 标准化,得到IMF _S k ,构造得到X k _train ㊁Y k _train 和X k _test ㊁Y k _test8)㊀for n =1ʒN 执行㊀㊀ʊ参数优化9)㊀㊀repeat㊀㊀㊀㊀针对(X k _train ,Y k _train )使用BP 最小化MSE k ,更新参数θk10)㊀㊀until 满足早停条件,记录θᶄk ,tcn k11)㊀end forYᶄk _test =tcn k (X k _test ;θk ),反标准化得到IMFᶄk _test ,从而FTᶄtest=ðKk =1IMFᶄk _test12)end for4㊀时频融合卷积神经网络的股指预测实验分析4.1㊀数据集和实验环境本文选取了国内外6只股票指数的每日收盘指数,数据均来自国泰君安数据库CSMAR 的股票市场分析模块(https:ʊ /)㊂选取的指数分别是标准普尔500指数(Standard and Poor 500Index,SPX)㊁纳斯达克综合指数(IXIC)㊁日经指数225(Nikkei 225,N225)㊁阿姆斯特丹泛欧指数(Am-sterdam Stock Exchange,AEX )㊁香港恒生指数(Hang Seng Index,HSI)和上证综合指数(Shanghai Securities Composite Index,SSE ),其范围涵盖了多个国家和地区,兼具代表性和地区特点㊂选择的时间跨度为2010年1月4日 2019年12月4日,由于不同市场上节假日等因素的影响,不同股票数据在序列长度上略有差异㊂实验中使用80%的数据作为训练集,剩下20%作为测试集㊂实验所使用的设备搭载主频为2.1GHz 的CPU,程序编程环境是Anaconda3㊁Python3.7和Tensorflow-CPU㊂4.2㊀对比实验与参数设置为了验证所提出模型的有效性,本文使用统计模型中的ARIMA [1]㊁GARCH [21]㊁HMM [22]机器学习中的SVR [23]和神经网络中的LSTM [10]㊁TCN [24]模型以及C-LSTM [15]㊁C-TCN [25]模型(C 表示CEEM-DAN)作为基准模型,它们都曾被应用于股票指数等时间序列的预测问题㊂引入常用的三种评价指标:均方根误差(RMSE )㊁平均绝对误差(MAE )和平均绝对百分比误差(MAPE )㊂设n 是测试集的长度,三者的基本计算公式分别为MAE =1n ðni =1FTᶄtest (i )-FT test (i ),RMSE =1n ðni =1(FTᶄtest (i )-FT test (i ))2,MAPE =100%n ðn i =1FTᶄtest (i )-FT test (i )FT test (i )㊂㊀㊀我们对模型进行了30次重复实验来避免偶然性,并计算平均指标作为最终对比的准则㊂所有预测模型都采用了网格调参的方法,其中TCN 的主要参数及调节范围如表1所示㊂表1㊀TCN 的参数表Table 1㊀The parameters table of TCN参数取值范围kernel _size2,3,5,10dilations 2,3,4,5nb _filters 10,16,32activationrelu,linear ,sigmoidkernel _initializer VarianceScaling ,orthogonal batch _size 16,32,64,128,256patience10,20,30,40,504.3㊀实验结果分析表2㊁3㊁4分别是9个模型对6个数据集重复30次建模后计算的RMSE ㊁MAE 和MAPE 指标平均值,小括号内为标准差,黑体为最优值㊂SVR 等模型由于重复实验结果不变,因此标准差为0㊂不同模型在三个指标上的表现基本一致,仅考虑指标RMSE ,最优模型为本文提出的模型,其在数据集HSI 上较58郑州大学学报(理学版)第54卷C-TCN 提升34%,在SPX 上较C-LSTM 提升31%㊂实证结果表明基于时频融合的方法有利于提升预测模型的性能:首先,将原始时序分解成相对平稳的时频特征子序列,可以进一步提取出趋势和噪声项;其次,使用TCN 对子序列进行建模,发挥其高效的学习能力,实现了对序列的高精度预测㊂表2㊀对比实验的RMSETable 2㊀RMSE of the comparative experiments股票指数本文C-TCN C-LSTM LSTM TCN SVR ARIMA GARCH HMM SPX 10.31(0.52)15.45(4.22)14.95(1.61)35.61(3.59)28.97(2.99)26.61(0)25.75(0)25.76(0)25.57(0)IXIC 39.69(6.00)54.50(9.98)56.14(11.93)123.83(8.39)110.43(30.53)86.86(0)85.79(0)86.00(0)85.98(0)N22588.72(4.77)115.17(4.64)108.08(1.88)261.85(40.27)274.99(53.31)229.73(0)230.08(0)229.81(0)229.92(0)AEX 1.84(0.12)1.99(0.14)2.03(0.14) 4.54(0.33) 5.00(0.73)4.26(0)4.27(0)4.26(0)4.26(0)HSI108.98(12.77)167.14(7.66)220.90(86.59)331.54(9.54)359.43(41.13)318.41(0)320.04(0)318.35(0)318.27(0)SSE13.13(1.22)16.57(1.43)18.39(1.45)35.81(1.51)39.18(4.71)34.98(0)34.83(0)34.86(0)35.27(0)表3㊀对比实验的MAETable 3㊀MAE of the comparative experiments股票指数本文C-TCN C-LSTM LSTM TCN SVR ARIMA GARCH HMM SPX 7.38(0.53)11.10(4.66)11.76(1.70)27.61(3.67)21.95(3.59)18.95(0)18.22(0)18.13(0)18.01(0)IXIC 30.07(6.00)39.15(10.84)44.67(11.97)99.68(10.46)88.91(31.73)63.40(0)62.55(0)62.44(0)62.42(0)N22566.89(3.61)84.53(4.87)81.71(1.52)196.93(38.97)213.60(55.23)167.93(0)166.84(0)166.22(0)165.99(0)AEX 1.38(0.10) 1.51(0.13) 1.57(0.13) 3.46(0.35) 3.91(0.77) 3.20(0)3.21(0)3.19(0)3.19(0)HSI87.41(10.49)130.51(7.82)172.20(86.51)253.94(9.00)279.74(38.64)239.87(0)246.44(0)239.58(0)239.50(0)SSE10.04(1.21)12.82(1.42)14.27(1.24)26.18(1.56)29.61(4.95)25.13(0)25.42(0)25.15(0)25.50(0)表4㊀对比实验的MAPETable 4㊀MAPE of the comparative experiments股票指数本文C-TCN C-LSTM LSTM TCN SVR ARIMA GARCH HMM SPX 0.27(0.018)0.40(0.171)0.42(0.059)0.99(0.137)0.79(0.132)0.68(0)0.66(0)0.66(0)0.65(0)IXIC 0.40(0.076)0.52(0.144)0.59(0.155) 1.33(0.147) 1.18(0.403)0.68(0)0.83(0)0.84(0)0.83(0)N2250.31(0.016)0.37(0.022)0.37(0.007)0.90(0.178)0.97(0.245)0.77(0)0.76(0)0.77(0)0.76(0)AEX 0.25(0.019)0.28(0.024)0.28(0.024)0.64(0.065)0.72(0.140)0.59(0)0.59(0)0.59(0)0.58(0)HSI0.31(0.037)0.46(0.029)0.62(0.322)0.90(0.033)0.99(0.135)0.85(0)0.87(0)0.85(0)0.84(0)SSE0.34(0.039)0.44(0.049)0.49(0.043)0.90(0.052)1.01(0.170)0.86(0)0.87(0)0.86(0)0.87(0)4.4㊀模型有效性的可视化呈现本小节以SPX 收盘指数序列作为一个实例,对模型的不同阶段进行可视化㊂首先,对原始序列进行可视化,如图2(a)所示㊂图2㊀VMD 分解前后序列Figure 2㊀Sequences before and after VMD68㊀第2期姜振宇,等:基于时频融合卷积神经网络的股票指数预测㊀㊀该序列呈现出整体上的长期趋势,这为使用模型进行预测提供了一定的依据㊂此外,序列具有波动性大㊁噪声多和非线性等特点,对它构建传统的线性预测模型将难以获得高精度的预测结果㊂神经网络模型更适合用来处理这类数据,这与上一节的实验结果相一致㊂对原始序列进行VMD,得到的部分IMF序列如图2(b)所示㊂图中从上至下,子序列的频率递增,其中频率最低的为IMF1,代表了股指序列的整体走向,其明显比原始SPX序列更加平滑㊂整体来看,图2(b)中的低频序列具有明显的变化趋势,它们具有波动相对小㊁噪声相对少的特点㊂针对得到的每个IMF序列,设置时间窗口长度为4,构造TCN对未来一期的数据进行预测㊂得到每个IMF序列的预测结果后,将预测结果融合得到SPX股指预测值,如图3所示㊂图3㊀模型预测结果Figure3㊀The forecast result of the model其中:橙线是本文方法预测值;蓝线为真实序列;虚线是其他基准模型㊂两条实曲线重合度较高,这表明本文提出的模型的预测结果与真实数据基本一致,模型可以获得很好的预测结果㊂5㊀总结与展望本文提出了基于时频融合卷积神经网络的股票指数预测模型㊂实验中选取实际股票市场中具有代表性的6只股票指数,以常用于股票指数预测的8个模型作为对比基准,计算了每个模型预测结果的3个评价指标,实验证明本文提出的模型相对于其他基准模型获得了更好的预测效果,RMSE较其他模型提升最高达到34%㊂不仅如此,此模型也可以扩展到其他的应用领域㊂我们研究的仅仅是基于单时间序列历史信息的预测问题,但在实际的研究中,许多宏㊁微观指标,如汇率㊁利率等,以及其他一些股指的技术指标都被证明对股票指数的变化有影响,后续工作将考虑引入这些信息来有效融合模型的输入特征㊂此外,文本挖掘和自然语言处理通过对金融新闻进行情感分析,可以掌握投资者和市场的需求动向,将它们考虑进模型也为未来的工作提供了思路㊂参考文献:[1]㊀ARIYO A A,ADEWUMI A O,AYO C K.Stock priceprediction using the ARIMA model[C]ʊThe16th Inter-national Conference on Computer Modelling and Simula-tion.Piscataway:IEEE Press,2014:106-112. [2]㊀WICHAIDIT S,KITTITORNKUN S.Predicting SET50stock prices using CARIMA(cross correlation ARIMA)[C]ʊInternational Computer Science and EngineeringConference.Piscataway:IEEE Press,2015:1-4. [3]㊀魏宇.沪深300股指期货的波动率预测模型研究[J].管理科学学报,2010,13(2):66-76.WEI Y.Volatility forecasting models for CSI300index fu-tures[J].Journal of management sciences in China,2010,13(2):66-76.[4]㊀HASSAN M R,NATH B.Stock market forecasting usinghidden Markov model:a new approach[C]ʊThe5th In-ternational Conference on Intelligent Systems Design andApplications.Piscataway:IEEE Press,2005:192-196.[5]㊀朱永明.基于粗糙集理论的股市预测研究[J].郑州大学学报(理学版),2009,41(4):40-44.ZHU Y M.Study on prediction of stocking market basedon rough set theory[J].Journal of Zhengzhou university(natural science edition),2009,41(4):40-44. [6]㊀MEESAD P,RASEL R I.Predicting stock market priceusing support vector regression[C]ʊ2013InternationalConference on Informatics,Electronics and Vision.Pis-cataway:IEEE Press,2013:1-6.[7]㊀HEATON J B,POLSON N G,WITTE J H.Deep learn-ing in finance[EB/OL].(2018-01-04)[2021-05-03].https:ʊ/pdf/1602.06561.pdf. [8]㊀姚宏亮,艾刘可,王浩,等.均线滞后的时序自回归股市态势预测算法[J].郑州大学学报(理学版),2018,50(3):60-66.YAO H L,AI L K,WANG H,et al.Time series autore-gressive stock market forecasting algorithm based on mov-ing average hysteresis[J].Journal of Zhengzhou universi-ty(natural science edition),2018,50(3):60-66.[9]㊀李艳灵,杨志鹏,王莎莎,等.基于卷积神经网络进行电影院人群分布统计[J].信阳师范学院学报(自然科学版),2020,33(4):675-680.78郑州大学学报(理学版)第54卷LI Y L,YANG Z P,WANG S S,et al.The distributionof cinema population based on convolutional neural net-work[J].Journal of Xinyang normal university(naturalscience edition),2020,33(4):675-680. [10]杨青,王晨蔚.基于深度学习LSTM神经网络的全球股票指数预测研究[J].统计研究,2019,36(3):65-77.YANG Q,WANG C W.A study on forecast of globalstock indices based on deep LSTM neural network[J].Statistical research,2019,36(3):65-77. [11]PRADEEPKUMAR D,RAVI V.Forecasting financialtime series volatility using particle swarm optimizationtrained quantile regression neural network[J].Appliedsoft computing,2017,58:35-52.[12]熊志斌.ARIMA融合神经网络的人民币汇率预测模型研究[J].数量经济技术经济研究,2011,28(6):64-76.XIONG Z B.Research on RMB exchange rate forecastingmodel based on combining ARIMA with neural networks[J].The journal of quantitative&technical economics,2011,28(6):64-76.[13]DU Y L.Application and analysis of forecasting stockprice index based on combination of ARIMA model andBP neural network[C]ʊChinese Control and DecisionConference.Piscataway:IEEE Press,2018:2854-2857.[14]HSIEH T J,HSIAO H F,YEH W C.Forecasting stockmarkets using wavelet transforms and recurrent neural net-works:an integrated system based on artificial bee colonyalgorithm[J].Applied soft computing,2011,11(2):2510-2525.[15]CAO J,LI Z,LI J.Financial time series forecastingmodel based on CEEMDAN and LSTM[J].Physica A:statistical mechanics and its applications,2019,519:127-139.[16]DRAGOMIRETSKIY K,ZOSSO D.Variational mode de-composition[J].IEEE transactions on signal processing,2014,62(3):531-544.[17]RILLING G,FLANDRIN P,GONCALVES P.On empir-ical mode decomposition and its algorithms[C]ʊThe6thIEEE-EURASIP Workshop on Nonlinear Signal and ImageProcessingP Workshop on Nonlinear Signal and ImageProcessing.Piscataway:IEEE Press,2003:8-11. [18]TORRES M E,COLOMINAS M A,SCHLOTTHAUERG,et al.A complete ensemble empirical mode decompo-sition with adaptive noise[C]ʊ2011IEEE InternationalConference on Acoustics,Speech and Signal Processing.Piscataway:IEEE Press,2011:4144-4147. [19]CHUNG J,GULCEHRE C,CHO K,et al.Empirical e-valuation of gated recurrent neural networks on sequencemodeling[EB/OL].(2014-12-11)[2021-04-15].https:ʊ/pdf/1412.3555.pdf.[20]OORD A V D,DIELEMAN S,ZEN H,et al.WaveNet:a generative model for raw audio[EB/OL].(2016-09-19)[2021-03-28].https:ʊ/pdf/1609.03499.pdf.[21]LIN Z.Modelling and forecasting the stock market volatil-ity of SSE composite index using GARCH models[J].Future generation computer systems,2018,79:960-972.[22]ZHANG X,LI Y X,WANG S Z,et al.Enhancing stockmarket prediction with extended coupled hidden Markovmodel over multi-sourced data[J].Knowledge and infor-mation systems,2019,61(2):1071-1090. [23]LAHMIRI S.Minute-ahead stock price forecasting basedon singular spectrum analysis and support vector regres-sion[J].Applied mathematics and computation,2018,320:444-451.[24]WANG X,WANG Y J,WENG B,et al.Stock2Vec:ahybrid deep learning framework for stock market predic-tion with representation learning and temporal convolu-tional network[EB/OL].(2020-09-29)[2021-05-03].https:ʊ/pdf/2010.01197.pdf. [25]WANG J,LUO Y Y,TANG L Y,et al.A new weightedCEEMDAN-based prediction model:an experimental in-vestigation of decomposition and non-decomposition ap-proaches[J].Knowledge-based systems,2018,160:188-199.88。
ARIMA融合神经网络的人民币汇率预测模型研究
ARIMA融合神经网络的人民币汇率预测模型研究熊志斌(华南师范大学数学科学学院)摘要 本文在深入分析了单整自回归移动平均(ARIMA)模型与神经网络(NN)模型特点的基础上,建立了ARIM A融合NN的人民币汇率时间序列预测模型。
其基本思想是充分发挥两种模型在线性空间和非线性空间的预测优势,即将汇率时间序列的数据结构分解为线性自相关主体和非线性残差两部分,首先用ARI-M A模型预测序列的线性主体,然后用NN模型对其非线性残差进行估计,最终合成为整个序列的预测结果。
通过对三种人民币汇率序列的仿真实验表明,融合模型的预测准确率显著高于包括随机游走模型在内的单一模型的预测准确率,从而证实了融合模型用于汇率预测的有效性。
这一结果也表明,人民币汇率市场并不符合有效市场假设,可以通过模型对汇率未来走势做出较准确预测。
关键词 单整自回归移动平均 神经网络 融合模型 汇率预测中图分类号 F224 9 文献标识码 AResearch on RMB Exchange Rate Forecasting Model Based on Combining ARIMA with Neural NetworksAbstract:Based o n analy sis of the auto regressive integr ated mov ing average (ARIM A)and neural netw orks(NN)mo dels,this paper presents an ensemble ap-proach to RMB exchange rate time series forecasting w hich co mbining ARIM A w ith NN T he RMB ex chang e rate time series ar e considered to be co mposed of a linear autocorrelation str ucture and nonlinear structure ARIMA is used to m odel the line-ar co mpo nent of exchang e rate time series and the NN model is applied to the non-linear residuals component pr edictio n The r esults of RMB ex change rate forecasting show that the pr opo sed mo del,w hich integ rates the unique strength o f the tw o models in linear and nonlinear m odeling,has the more fo recasting accuracy than that of sing le mo del(including random w alk m odel) It provides ev idence against the efficient market hypothesis and sugg ests that there ex ists a po ssibility of predic-ting it into the futureKey words:ARIM A;Neural Netw or ks;Integr ated M odel;Exchange Rate For ecasting资助项目:广东省哲社科 十一五 规划项目(项目号:090-18)。
基于ARIMA模型的汇率预测研究——以美元人民币汇率为例
作者: 孙鹏[1];程春梅[2]
作者机构: [1]辽宁工业大学研究生学院,辽宁锦州121001 [2]辽宁工业大学经济学院,辽宁锦州121001
出版物刊名: 辽宁工业大学学报:社会科学版
页码: 20-23页
年卷期: 2016年 第6期
主题词: 时间序列 ARIMA模型 汇率
摘要:本文运用时间序列相关理论,以2014年1月3日至2016年6月8日美元兑人民币的中间价作为研究样本,将数据一阶差分后建立ARIMA模型,对美元兑人民币汇率进行短期预测。
实证研究表明IMA(1,1)模型较为准确地预测了美元兑人民币汇率、人民币有小幅度贬值,最后针对我国进出口企业和投资者提出一定的建议。
基于ARIMA与神经网络集成的GDP时间序列预测研究
Research on GDP Time Series Forecasting Based on Integrating ARIMA with Neural Networks 作者: 熊志斌
作者机构: 华南师范大学数学科学学院,广东广州510631
出版物刊名: 数理统计与管理
页码: 306-314页
年卷期: 2011年 第2期
主题词: 单整自回归移动平均 神经网络 集成模型 GDP预测
摘要:本文深入分析了单整自回归移动平均(ARIMA)模型与神经网络(NN)模型的预
测特性和优劣,并在此基础上建立了由ARIMA模型和NN模型集成的GDP时间序列预测模型与算法。
其基本思想是充分发挥两种模型在线性空间和非线性空间的预测优势,据此将GDP时间序列的数据结构分解为线性自相关主体和非线性残差两部分,首先用ARIMA模型预测序列的线性主体,然后用NN模型对其非线性残差进行估计,最终集成为整个序列的预测结果。
仿真实验表明:集成模型的预测准确率显著高于单一模型的预测准确率,从而证实了集成模型用于GDP预测的有效性。
ARIMA时间序列分析在人民币汇率市场中的应用
ARIMA时间序列分析在人民币汇率市场中的应用毕业设计ARIMA时刻序列分析在人民币汇率市场中的应用摘要2005年7月21日人民币汇率形成机制改革以后,人民币汇率机制不再是有治理的、单一的、盯住美元的汇率机制,而是参考一揽子货币的有治理的浮动汇率机制。
新机制形成后的人民币汇率不管是在民生经济,依旧国家建设和政治计策各方面都对中国产生了庞大阻碍。
在各国贸易往来中,结算货币要紧以美元和欧元为主,而在我国的对外贸易中,结算货币也以美元和欧元为主。
因此在研究人民币汇率时选取这两种强势货币专门有针对性。
本文在利用平稳时刻序列ARMA族模型推测汇率时时结果显示其有专门好的成效,一方面为了达到推测的目的,因此专门选取了推测能力较强的ARMA族模型而非金融中常用的GARCH模型。
另一方面为了推测汇率走势,我们也在结合实际的走势判定出模型好坏。
应用中我们选取了人民币/美元和人民币/欧元日汇率数据进行分析。
结果发觉汇率改革后,人民币短期内将相对美元一直升值,而相对欧元则会成趋势性贬值。
这在外贸方面,中国相对美国的贸易顺差与对欧洲贸易额增长的实际状况不谋而合。
本文在第一部分要紧介绍汇率问题研究的意义及其研究状况,在第二部分中我们介绍了时刻序列方法及差不多模型,包括AR模型,MA模型,ARMA模型,第三部分给出模型选取,包括模型中相关的参数估量的结果和模型的检验;第四部分给出的是汇率推测以及其准确性;第五部分包含了我们整个研究的总结。
关键词:时刻序列分析汇率推测 AR模型 MA模型 ARMA 模型1. 前言1.1 问题提出及研究意义自 1973 年布雷顿森林体系崩溃以后,国际货币体系进入了一个新的时期-牙买加体系。
在牙买加体系下,浮动汇率制度成为世界上要紧的汇率制度,大多数发达国家如美国、德国、日本等都选择了浮动汇率制度,国际外汇市场汇率变动反复无常,汇率波动的频率和幅度也越来越大。
汇率波动的加剧增加了从事国际业务的企业和机构的外汇风险治理的难度,许多从事跨国经营的企业和机构因汇率的波动屡遭缺失。
基于神经网络模型的人民币汇率预测研究的开题报告
基于神经网络模型的人民币汇率预测研究的开题报
告
一、研究背景和意义
人民币是全球重要的货币之一,其汇率变动对全球经济和金融市场
都有着重要的影响。
因此,人民币汇率预测一直是金融市场研究的重点。
传统的预测方法多基于统计模型,但其预测精度和鲁棒性有待提高,而
基于神经网络模型的预测方法在预测精度和鲁棒性上有较大优势。
二、研究内容和方法
本研究计划采用基于神经网络模型的人民币汇率预测方法,采用现
代计算机技术进行模拟分析,并对预测结果的精度和可靠性进行统计分析。
具体的研究步骤包括:
1. 收集人民币汇率、经济、金融等相关数据,并进行预处理和分析。
2. 选择适当的神经网络模型和特征提取方法,进行数据预测。
3. 分析和比较不同模型的预测精度和鲁棒性,并进行参数优化。
4. 对预测结果进行可视化展示和统计分析。
三、研究预期成果和影响
通过本研究,可以提高人民币汇率预测的精度和鲁棒性,为投资者、决策者提供更可靠的参考依据,帮助企业和个人规避汇率风险。
同时,
本研究也将推动神经网络在预测领域的应用和发展,为相关学科的研究
提供新的思路和方法。
ARIMA和RBF神经网络相融合的股票价格预测研究
ARIMA和RBF神经网络相融合的股票价格预测研究俞国红;杨德志;丛佩丽【期刊名称】《计算机工程与应用》【年(卷),期】2013(000)018【摘要】针对股票价格的突变性、非线性和随机性,单一预测方法仅能描述股票价格片断信息等缺陷,提出一种股票价格组合预测模型。
采用自回归移动平均模型(ARIMA)对股票价格进行预测,捕捉股票价格线性变化趋势。
采用RBF神经网络对非线性、随机变化规律进行预测。
将两者结果组合得到股票价格预测结果。
采用组合模型对包钢股份(600010)股票收盘价进行仿真实验,结果表明,相对于单一预测模型,组合预测模型更加全面、准确刻画了股票价格的变化规律,提高了股票价格预测精度。
%The stock price is mutant, nonlinear and random. Single prediction methods can only describe the stock price segment information defect. This paper proposes a stock price combination forecasting model. Autoregressive moving average is used to forecast the stock price’s linear trend, and then the RBF neural network is used to capture the nonlinear part. The two results are combined to form the stock price forecasting results. The simulation experiment is carried out on Baotou Steel shares (600010). The results show that, compared with single forecast model, the proposed combination forecasting model can describe stock price change rules more comprehensively and accurately. It improves the forecasting precision of stock price.【总页数】5页(P245-248,259)【作者】俞国红;杨德志;丛佩丽【作者单位】健雄职业技术学院软件与服务外包学院,江苏太仓,215411;辽东学院经济学院,辽宁丹东,118001;辽宁机电职业技术学院信息工程系,辽宁丹东,118009【正文语种】中文【中图分类】TP311【相关文献】1.基于最优小波包变换、ARIMA与SVR的股票价格预测研究 [J], 高天;2.基于最优小波包变换、ARIMA与 SVR 的股票价格预测研究 [J], 高天3.基于ARIMA-GARCH模型的股票价格预测研究 [J], 许舒雅; 梁晓莹4.基于灰色模型与ARIMA模型的股票价格预测 [J], 齐天铧5.基于ARIMA-GARCH模型的股票价格预测 [J], 尹路因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ARIMA融合神经网络的人民币汇率预测模型研究①熊志斌(华南师范大学数学科学学院)【摘要】本文在深入分析了单整自回归移动平均(A RIMA)模型与神经网络(NN)模型特点的基础上,建立了A RIM A融合NN的人民币汇率时间序列预测模型。
其基本思想是充分发挥两种模型在线性空间和非线性空间的预测优势,即将汇率时间序列的数据结构分解为线性自相关主体和非线性残差两部分,首先用ARI-M A模型预测序列的线性主体,然后用NN模型对其非线性残差进行估计,最终合成为整个序列的预测结果。
通过对三种人民币汇率序列的仿真实验表明,融合模型的预测准确率显著高于包括随机游走模型在内的单一模型的预测准确率,从而证实了融合模型用于汇率预测的有效性。
这一结果也表明,人民币汇率市场并不符合有效市场假设,可以通过模型对汇率未来走势做出较准确预测。
关键词 单整自回归移动平均 神经网络 融合模型 汇率预测中图分类号 F224.9 文献标识码 AResearch on RMB Exchange Rate Forecasting Model Based on Combining ARIMA with Neural Networks Abstract:Based o n analy sis of the auto regressive integ rated moving average (A RIM A)and neural netw orks(NN)mo dels,this paper presents an ensemble ap-proach to RMB exchange rate time series forecasting w hich co mbining ARIM A with NN.T he RMB ex chang e rate time series are considered to be co mposed of a linear autocorrelatio n structure and nonlinear structure.ARIMA is used to m odel the line-a r co mpo nent of exchange rate time series and the NN model is applied to the non-linear residuals component predictio n.The results of RMB exchange rate forecasting show that the propo sed mo del,w hich integ rates the unique strength o f the tw o models in linear and nonlinear m odeling,has the more fo recasting accuracy than that of sing le mo del(including random w alk m odel).It provides evidence against the efficient market hypo thesis and sugg ests that there exists a po ssibility of predic-ting it into the future.Key words:ARIM A;Neural Netw o rks;Integ rated M odel;Exchange Rate Fo recasting①资助项目:广东省哲社科“十一五”规划项目(项目号:090-18)。
一、相关文献评述近二十年来,我国汇率制度几经调整,特别是自2005年7月21日,我国央行宣布开始实行以市场供求为基础、参考“一篮子”货币进行调节、有管理的浮动汇率制度,使得汇率制度改革朝着市场化方向迈出了关键一步。
2008年8月,为了应对金融危机,我国采取了临时性的盯住美元的汇率政策,适当减少了人民币汇率波动范围。
但在2010年6月19日,央行又重启汇改,并决定进一步推进人民币汇率形成机制改革,增强人民币汇率弹性。
可以预见,今后我国汇率调整将更加市场化,汇率的波动幅度也会有所加剧。
显然,如何准确的估计汇率变动趋势,为未来货币政策的制定提供依据,以达到实现控制通胀,抵御外部经济的干扰,保持经济稳定增长的目标,将是摆在央行面前的一个重要课题。
另外,对汇率未来变动趋势判断的正确与否,也是影响企业风险控制能力和国际竞争能力的一个重要因素;同时,投资者机构和个人也希望通过预测汇率的走势变化为自身资产比例的分配及风险管理提供有益的决策。
因此,结合我国实际情况,通过构造合理的预测模型,正确预测人民币汇率走势,对于相关政策管理机构,经营企业及投资者具有十分重要的现实意义。
汇率预测的研究方法很多,通常有以下三类:购买力平价理论、汇率决定因素的结构性方程以及汇率自身历史数据的时间序列分析方法。
由于我国加入WTO时间较短,不能从时间上满足一价定律的自由贸易前提假设,因此基于购买力平价理论的汇率研究方法不一定适合我国目前的实际状况;另外,我国是2005年7月实行新的汇率制度,代表各宏观经济变量数据与相对应的汇率数据比较少,很难利用结构性方程来体现出它们之间的关系;而采用时间序列分析方法,无论汇率制度怎样,由于汇率必然是向市场出清的均衡点调整,因此利用汇率自身变化传递的时间序列信息进行研究更能体现汇率的预测价值(刘柏等,2008)。
时间序列分析方法当中最常见的是Box-Jenkins模型,在该类模型中,单整自回归移动平均(ARIM A)模型由于其简单性、可行性和灵活性,为目前应用最广泛的时间序列预测模型之一(范剑青等,2005)。
利用这类模型对人民币汇率进行预测的文献并不少,例如戴晓枫、肖庆宪(2005)利用ARIMA模型对人民币兑美元汇率进行了预测;许少强、李亚敏(2007)通过ARM A模型对欧元、日元汇率进行预测,然后根据人民币汇率改革确定的参考“一篮子”货币原则,结合美元汇率加权计算,对人民币汇率的中长期走势进行了预测;郭琨、汪寿阳(2008)则采用周期-A RMA模型对人民币汇率进行了短期预测。
然而,这类模型的最大缺陷是,序列变量的未来值被假定满足变量过去观测值和随机误差值的线性函数关系,但是,许多研究文献表明,金融时间序列(包括汇率)大多数都是非线性的,或者说是一个包含有非线性关系的复杂系统(Santos等,2006;Broo ks,1996;谢赤等,2008)。
因此,利用Bo x-Jenkins方法构建的汇率时间序列模型在实际运用中具有极大的局限性(Zhang,2003;Panda等,2003)。
由于汇率等金融系统的复杂非线性特征,而传统的时间序列模型是建立在线性关系的假设上,因此很难有效地捕捉到并解释非线性关系。
为改善非线性时间序列预测的效果,许多非线性方法的研究日益受到关注,如双线性(Bilinear)模型(G ranger等,1978)、门限自回归(TAR)模型(Tong,1983)、自回归条件异方差(A RCH)模型(Eng le,1982)以及广义自回归条件异方差(GARCH)模型(Bollerslev,1982)等等。
然而,上述模型也存在两个缺陷:首先,模型都要求数据和模型参数须满足一定的假设前提(如假设收益率序列分布要满足特定的分布,而金融时间序列的复杂性使得所作出的假设要与实际情况相符是很困难的);其次,这些模型使用的都是显性表达式来描述数据间相互关系。
然而,非线性数据间的关系一般都很复杂,数据间的非线性模式也是多种多样的,因此,利用任何一个特定的非线性模型都不可能完全刻画出这种非线性关系。
这些缺陷极大地影响了模型的预测效果(Annstasakis等,2009;孙延风等,2004),Kilian等(2003)研究发现这些模型还不如简单的随机游走(RW)模型,而王佳妮等(2005)甚至认为这类模型并不适合对汇率数据的拟合。
近年来,由于神经网络(Neural Netw o rks,NN)模型具有较强的学习和数据处理能力,是一种自然非线性建模过程,能够挖掘数据背后复杂的甚至很难用数学式描述的非线性特征,且不需要事先假设数据之间具有何种具体函数形式或满足哪种分布条件,因此在汇率的非线性时间序列预测领域中受到越来越多的重视(Panda等,2007;孙延风等,2004;惠晓峰等,2002)。
从上述分析可以看出,A RIM A方法是基于线性技术来进行时序预测,而对非线性数据的处理不尽合理,且效果欠佳;相反,在挖掘数据背后隐含的非线性关系方面,NN模型则具有其他非线性模型所不可比拟的优越性。
然而,神经网络在处理具有线性特征的数据方面,其效果往往不如ARIMA模型这类传统的线性技术方法(M aia等,2008; Plasmans等,1998)。
在现实中,绝大多数金融时间序列,通常都既包含了线性时序的成分,又包含了非线性时序的成分,呈现出线性和非线性的复合特征,故单一的线性或非线性预测模型都不能很好地捕捉时间序列的这种复合特征(Maia等,2008;Zhang, 2003)。
鉴于此,许多研究者开始将这两类方法结合起来,通过不同方法之间的相互促进与补充,达到提高模型预测效果的目的。
如Yu等(2005)提出了一个将广义线性自回归(GLA R)模型与NN模型相结合对汇率时间序列进行预测的混合模型;Wedding等(1996)提出了一种将传统的ARM A模型与径向基神经网络相结合的集成模型对时间序列进行预测;Tseng等(2002)利用季节A RIMA模型与BP神经网络组合构成的SA-RIM ABP模型预测季节性时间序列。
此外,Michele Hibon等(2005)以3003种不同类型的序列数据为基础进行了比较研究,结果表明,组合模型的总体预测效果显著优于单一模型的预测效果,而且在实际应用中,组合模型的使用风险远小于单一模型的使用风险。
还有许多文献研究也都表明,不同模型在一起的确能改善单一模型的预测性能(Khashei 等,2009;Zhang,2003;Palm等;1992)。
目前,采用组合模型对人民币汇率时间序列进行预测的研究还不多见,且现有组合模型的主要形式是对单个预测方法进行加权平均,其研究重点为加权系数的确定。
加权系数直接影响集成模型的使用效果,但如何确定加权系数是一件非常困难的事情,在实际应用中带有强烈的随意性和主观性。
Zhang(2003)通过研究认为,一个时间序列过程可以看成是由一个线性结构和一个非线性结构两部分组成。