隔夜风险可以预测吗_——基于HAR-CJ-M模型的高频数据分析
电子商务师高级工理论复习题及答案
电子商务师高级工理论复习题及答案1.信息的()是将原始资料汇总、归纳、比教,使其更加系统化、条理化和科学化。
A、储存B、归纳C、整理(正确答案)D、汇总2.”实事求是是毛泽东思想的精髓。
”这是由()提出的。
A、毛泽东B、邓小平(正确答案)C、周恩来D、胡锦涛3.网上售后服务的特点有方便快捷、直接、()o A、模式化B、个性化(正确答案)C、标准化D、程序化.下列关于ROM的叙述中,错误的是()oA、ROM中的信息只能被CPU读取B、ROM主要用来存放计算机系统的程序和数据C、不能随时对ROM改写D、ROM一旦断电信息就会丢失(正确答案)4. POS是指以()为中心的进货、销货、存货和内部调配货物的信息管理系统。
A、电子商务应用层(正确答案)B、管理层C、硬件层D、电子商务服务层42.于动态网页的特点,以下说法正确的是()o A、动态网页一般以数据库技术为基础,增加网站维护的工作量B、动态网页实际上不是独立存在于服务器上的网页文件(正确答案)C、动态网页实际上是独立存在于服务器上的网页文件D、动态网页的网站在进行搜索引擎推广时不需要做技术处理.数据库管理系统中能实现对数据库中的数据进行查询、插入、修改和删除,这类功能称为()。
A、数据定义功能B、数据管理功能C、数据操纵功能(正确答案)D、数据控制功能43.处理客户反馈信息的一般方法不包括()o A、认真阅读B、准确记录C、及时反馈D、上门回访(正确答案).计算机病毒可以使整个计算机系统瘫痪,计算机病毒是()oA、一条命令B、一段程序(正确答案)C、一种生物病毒D、一种芯片44.以下关于CSS设置字体类型的用法正确的是()。
A、font-family: myFirstFont :确答案)B、fontfamily: myFirstFontC> font: myFirstFont;D、font-familymyFirstFont;45.网上市场调研的主要方法不包括()o A、E-mail问卷B、座谈会(正确答案)C、网上间接调研法E-mail问卷B、座谈会C、网上间接调研法E-mail问卷B、座谈会C、网上间接调研法D、在线调研46.回归分析法指利用(),对大量统计数据进行数学处理,并确定因变量与某些自变量的相关关系,建立一个相关性较好的回归方程(函数表达式),并加以外推,用于预测今后的因变量的变化的分析方法。
《统计学习要素:机器学习中的数据挖掘、推断与预测》随笔
《统计学习要素:机器学习中的数据挖掘、推断与预测》阅读札记目录一、内容概括 (2)1.1 机器学习的发展与应用 (2)1.2 统计学习的概念与重要性 (4)二、数据挖掘 (5)2.1 数据挖掘的定义与过程 (6)2.2 常用数据挖掘方法与技术 (8)2.2.1 分类与聚类 (10)2.2.2 关联规则挖掘 (11)2.2.3 回归与异常检测 (13)2.3 数据挖掘的应用领域 (13)2.3.1 市场营销 (15)2.3.2 医疗诊断 (16)2.3.3 金融风险预测 (17)三、推断 (18)3.1 推断的基本概念与原理 (19)3.2 常用推断方法与技术 (20)3.2.1 参数估计 (22)3.2.2 置信区间 (22)3.2.3 假设检验 (23)3.3 推断的应用领域 (24)3.3.1 经济学研究 (26)3.3.2 社会科学研究 (27)3.3.3 工程质量控制 (28)四、预测 (30)4.1 预测的基本概念与原理 (31)4.2 常用预测方法与技术 (33)4.2.1 时间序列分析 (34)4.2.2 机器学习中的预测模型 (35)4.3 预测的应用领域 (37)4.3.1 金融市场预测 (38)4.3.2 医疗健康预测 (40)4.3.3 交通流量预测 (41)五、总结与展望 (43)5.1 本书内容总结 (44)5.2 未来发展趋势与挑战 (45)一、内容概括《统计学习要素:机器学习中的数据挖掘、推断与预测》是一本介绍统计学习基础概念和方法的书籍,旨在帮助读者理解机器学习的基本原理和应用。
本书共分为四个部分,分别是监督学习、无监督学习、半监督学习和强化学习。
在监督学习部分,作者首先介绍了基本的回归和分类问题,然后讨论了核方法、决策树、支持向量机等常用算法。
在无监督学习部分,作者介绍了聚类、降维等基本概念和算法。
在半监督学习部分,作者讨论了半监督学习的基本思想和应用场景,并介绍了一些常用的半监督学习算法。
计量经济学_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年
计量经济学_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年1.如果解释变量中存在被解释变量的滞后项,那么检验是否存在自相关应当用答案:BG检验2.DW统计量值接近2时,随机误差项为()答案:无自相关3.如果回归模型中的随机误差项存在异方差,则模型参数的普通最小二乘估计量()答案:无偏但非有效4.在由n=30的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定系数为0.8500,则调整后的多重决定系数为()。
答案:0.83275.对于模型【图片】,如果在异方差检验中发现【图片】,则用加权最小二乘法估计模型参数时,权数应为()答案:6.若回归模型中的随机误差项存在异方差性,则估计模型参数应采用()答案:加权最小二乘法7.总体回归线是指答案:解释变量X取给定值时,被解释变量Y的条件均值或期望值的轨迹8.下列关于可决系数的陈述哪个是正确的。
答案:可决系数是指回归平方和(SSR)在总离差平方和(SST)中所占的比重9.在二元线性回归模型【图片】中,【图片】表示()。
答案:当X2不变时,X1每变动一个单位Y的平均变动。
10.在二元线性回归模型中,回归系数的显著性t检验的自由度为答案:n-311.面板模型中丢失若干观测值,可以说该面板数据是非平衡面板数据。
答案:错误12.面板数据模型有助于减少解释变量之间的共线性,得到更有效的估计量。
答案:正确13.面板数据模型可以解决样本量不足的问题,可以增加样本容量和自由度。
答案:正确14.固定效应模型和随机效应模型的选择性检验,通常采用的是答案:Hausman检验15.面板数据是指答案:不同时点上不同统计单位相同统计指标组成的数据16.当存在序列相关时,OLS估计量是有偏的并且也是无效的答案:错误17.两个模型,一个是一阶差分形式,一个是水平形式,这两个模型的是不可以直接比较的。
答案:正确18.关于BG检验,下列说法正确的是答案:适用于解释变量中包含被解释变量滞后项的回归_适用于检验自相关性19.DW统计量值接近2时,随机误差项为( )答案:无自相关20.BP检验的结果可以帮助我们为加权最小二乘法寻找合适的权重答案:正确21.存在异方差情况下,普通最小二乘估计量依然是无偏和有效的。
金融风控中的异常交易检测技术应用教程
金融风控中的异常交易检测技术应用教程随着金融科技的不断发展,金融风险管理变得越来越重要。
异常交易检测作为金融风控的关键环节之一,其应用技术在金融领域扮演着重要的角色。
本文将介绍金融风控中的异常交易检测技术应用教程,帮助读者了解和应用这一关键技术。
一、异常交易检测的意义和挑战异常交易检测是金融风险管理中的重要环节,旨在发现和阻止潜在的异常交易行为,如欺诈、洗钱和其他非法活动。
异常交易检测可以帮助金融机构及时识别风险,减少潜在损失,并确保金融市场的稳定和安全。
然而,异常交易检测面临着一些挑战。
首先,金融市场复杂多变,交易数据量庞大,常规的人工检测方法无法满足快速、准确的需求。
其次,欺诈和洗钱行为日益隐蔽,采用多种手段进行伪装和遮蔽,使得异常交易的检测变得更加困难。
因此,金融机构需要借助先进的技术和方法来提高异常交易检测的准确性和效率。
二、异常交易检测的技术原理1. 数据预处理数据预处理是异常交易检测的首要步骤。
金融交易数据往往包含大量的噪声和冗余信息,需要进行数据清洗和特征提取。
数据清洗主要包括去除异常值、修复缺失值、处理重复数据等操作;特征提取则是从原始数据中提取与异常交易相关的特征,用于后续的建模和分析。
2. 异常交易模型建立异常交易模型是异常交易检测的核心步骤。
常用的建模方法包括基于规则的方法、统计学方法和机器学习方法。
基于规则的方法通过事先定义一系列规则来判断交易是否异常,例如设置交易金额阈值、频率限制等。
统计学方法则是利用统计分析和假设检验来推断交易数据的异常性。
机器学习方法则是通过训练模型来学习交易正常模式,并利用模型对新交易数据进行分类判断。
3. 异常交易检测异常交易检测是将异常交易模型应用于实际交易数据并进行判断的过程。
根据异常交易模型的类型和特点,可以采用不同的检测算法和技术。
常见的异常交易检测算法包括离群点分析、聚类分析、决策树等。
具体选择何种算法取决于数据特征及检测需求。
三、常见的异常交易检测技术1. 离群点分析离群点分析是一种常用的异常交易检测技术。
隐马尔科夫模型在金融领域的使用方法
隐马尔科夫模型在金融领域的使用方法隐马尔科夫模型(Hidden Markov Model,HMM)是一种用于建模时序数据的概率模型。
它在金融领域的应用得到了广泛的关注和研究。
在金融市场中,隐马尔科夫模型可以用于预测股票价格走势、进行风险管理、识别市场潜在的投资机会等方面。
本文将从隐马尔科夫模型的基本原理开始,深入探讨其在金融领域的使用方法。
隐马尔科夫模型是一种双重随机过程模型,它由两个随机过程组成:一个隐状态序列和一个可观察的输出序列。
在金融市场中,隐状态可以被理解为市场的真实状态,而可观察的输出则是市场上的行情数据。
隐马尔科夫模型的基本假设是,可观察序列的生成过程依赖于对应的隐状态序列,而隐状态序列则是一个马尔科夫链的输出。
通过对这两个过程进行建模,可以帮助我们理解市场的内在规律和未来走势。
在金融领域,隐马尔科夫模型主要用于时间序列数据的建模和分析。
例如,我们可以使用隐马尔科夫模型来预测股票价格的走势。
通过将股票价格的历史数据作为可观察序列,我们可以利用隐马尔科夫模型来推断出隐藏在股票价格背后的隐含状态,从而预测未来的价格走势。
这种方法在一定程度上可以帮助投资者制定更为准确的交易策略,提高投资收益。
另外,隐马尔科夫模型在金融风险管理方面也有着重要的应用。
金融市场的波动性是非常复杂和难以预测的,而隐马尔科夫模型可以帮助我们对市场波动进行建模和预测。
通过对市场波动性的分析,我们可以更好地识别和管理风险,从而降低投资组合的波动性和损失。
此外,隐马尔科夫模型还可以用于识别市场潜在的投资机会。
在金融市场中,市场的不确定性和复杂性使得投资者很难准确地判断市场的变化和机会。
而隐马尔科夫模型可以帮助我们从海量的市场数据中挖掘出潜在的投资机会,为投资决策提供更为准确和可靠的参考。
在实际应用中,隐马尔科夫模型的使用方法需要结合金融市场的特点和需求。
首先,我们需要收集和整理大量的市场数据,包括股票价格、成交量、市场情绪指标等。
试分析美国股市隔夜走势对国内股指的影响
对 L H和 L P 0 ( 1进 行 一 阶 差 分 , 到 D S S S 50 一 ) 得 L H和 L P 0 S50
两个统计量的 P 值都显著小于 0 0 , . 5 可以说上述模 型残差
() 3 构建 G R H模 型 。根 据 上述 A M (,) 型 建 立 G  ̄ H AC R A2 3 模 A C ( ,) 型 , 果 如 下 : 1 1模 结 模 型输 出如 下 :
(1 , 一 ) 即上证指数对 数收益率序列 , 和标 准普尔 50对 数收益 序 列 存在 A C 0 RH性 。可 以建立 A C 族 模 型 。 RH 率 的一阶滞后序列 。 D S 将 LH对 L P 0 (1 进行 回归 , S 50 一 ) 得到 以下
结果 ( 括号 中为 t统 计 量) :
在稳定的回归关系 ,r n e G a g r因果检验则证 明了美 国昨 日的收
检验结果Байду номын сангаас示 t统计量 为 一2 5 0 0 2 . 1 7 ,概率值为 0 0 0 , 益率波动对解释中国股市 当天的波动有所帮助。由此可见美 国 . 0 0
可 残差序列在 1 的显著性水平 ( % t统计量为 一 .4 6 5 下拒绝原 股 市 的 走 势对 中 国股 市 的走 势 会 产 生 显 著 的 影 响 , 或者 说 , 3433)
明这个模型 已 经基本消除了残差 自 相关现象。
这 里 使用 E g e G a gr(9 7 的协 整 检 验 方 法 , 前 n l 和 r n e 1 8) 对
二 、 论 结
对 数 据 的协 整 检 验 证 明 了 中美 股 票 市 场 的 隔 夜 收 益 率 存
文回归的残差序列进行 A F D 检验 。
隔夜风险可以预测吗_——基于HAR-CJ-M模型的高频数据分析
2 dq( t) = 0, 1 ① ; 在研究隔夜风险的动态特征、 κ( t) dq( t) , ε t ~ N( 0, σt ) , 影响因素以及可预测性时, 同模和预期的影响。 由于隔夜风险并不具有日内波动的长记忆特征, 刻画日内波动的 HARHARCJ 和 LHARCJ 模型都不完全适合用于研究隔夜风险的动态特征, CJ 模型的基础 RV、 因而本文在 HARCJM 模型。 上提出了新的 HAR下文首先构造反映日内波动率信息的指标和反映投资者预期的意外性指标, 然后结合隔夜风险的动态特 CJM 模型, 征, 给出改进的 HAR进一步利用 OLS 和分位数回归( Quantile Regression ) 方法估计各因素对隔夜风 CJM 模型的样本外预测能力, CJM 模型预测大的隔夜风险的能力。 险的影响, 最后检验 HAR重点考察 HAR-
1 2
引
言
金融市场上, 投资者的投资风格各异, 持有头寸的时间长短不一, 如果收市前持有头寸未平仓, 投资者就 可能面临隔夜损益, 这种潜在隔夜损益的不确定称为隔夜风险 。由于期货的高杠杆化交易 ( 股指期货 5 倍以 上杠杆, 商品期货 10 倍左右杠杆) 和休市期间停止交易, 持有隔夜头寸, 可能会给投资者带来巨大损失, 所以 对隔夜风险的深入研究就显得尤为重要 。 由于交易数据的缺乏, 对隔夜风险的研究受到了很大的限制。 文献中对日波动率 ( Daily Volatility ) 特征 [1 ] [2, 3 ] , , 的研究 一般忽略了隔夜风险的影响 , 而将隔夜风险视为日内波动( Intraday Volatility) 的调整项 缺乏对 [4 ] 。 Andersen , , 隔夜风险动态特征与影响因素的研究 等 认为 虽然收市期间没有交易数据 但是隔夜收益所包 含的信息是不容忽视的。他们利用标准普尔 500 指数 15 年的高频数据, 分别讨论了日内收益和隔夜收益对 日波动率的影响, 发现日内收益和隔夜收益的区别处理可以提高对日波动率的预测精度 。 Corsi 首次提出了 HARRV 模型, 为了刻画日波动率的动态特征, 由于模型形式简单且很好地刻画了波 HARRV 模型得到广泛的应用。 HARRV 模型考虑了波动率的异质 动率的特征( 长记忆、 厚尾和自相似 ) , 性, 但它没有区分连续波动和跳跃波动的不同影响 , 忽略了波动率的杠杆效应, 也没有考虑投资者心理、 市场 [6 ] 交易机制和宏观政策干预等其他典型异质市场驱动成分的影响 , 而 Andersen 等 将日内波动分解成连续性 CJ 模型的框架下研究了不同的日内波动信息对日波动的影响, 波动和跳跃性波动, 在 HAR发现所有的日波 Corsi[7] 在改 动、 周波动和月波动的可预测性几乎都来自于连续性波动部分 , 而跳跃性波动的可预测性很差,
预测性研究
预测性研究预测性研究是指基于已有的数据和分析技术,试图预测未来可能发生的事件或趋势的研究方法。
它旨在通过分析已有的数据和关联的因素,提供一种合理的预测未来可能出现的情况。
预测性研究可以应用于各个领域,如经济、金融、市场、人口统计等。
预测性研究的基本原理是,未来的趋势和事件是受过去的经验和因素的影响的。
通过分析已有的数据和相关的因素,可以揭示出趋势和规律,从而为未来的决策和计划提供依据。
预测性研究通常使用统计学、数学模型、经济学理论等方法,通过建立各种模型和算法来预测未来可能的情况。
预测性研究的应用范围非常广泛。
在经济领域,预测性研究可以用于预测国内生产总值、通货膨胀率、失业率等经济指标的走势,从而为政府和企业的决策提供依据。
在金融领域,预测性研究可以用于预测股票、外汇、利率等金融市场的价格波动,帮助投资者进行投资决策。
在市场营销领域,预测性研究可以用于预测消费者需求、市场规模、产品销售量等,为企业的市场策略和产品设计提供指导。
在人口统计领域,预测性研究可以用于预测人口数量、人口结构等变化趋势,对城市规划、社会政策等方面提供支持。
预测性研究的重要性在于提供对未来可能发生的情况的洞察和预警。
通过预测性研究,可以帮助决策者提前做出相应的准备和调整,避免潜在的风险和损失。
预测性研究也可以帮助企业和个人做出更明智的决策,提高效率和竞争力。
然而,预测性研究也面临一些挑战和限制。
首先,未来的情况往往受到多种不确定的因素的影响,包括政治、自然、社会等方面的因素,这些因素很难通过已有的数据和模型进行完全预测。
其次,预测性研究依赖于已有的数据,如果数据不准确或不完整,那么预测结果可能存在偏差和误导。
此外,人们在制定决策和计划时,往往不仅仅依赖于预测结果,还考虑其他的因素和判断,因此,预测性研究的结果并不是唯一的决策依据。
综上所述,预测性研究是一种重要的研究方法,可以帮助我们提前洞察和预测未来可能的情况,为决策和计划提供指导和支持。
基于贝叶斯因子模型金融高频波动率预测研究
基于贝叶斯因子模型金融高频波动率预测研究罗嘉雯;陈浪南【摘要】构建了包含时变系数和动态方差的贝叶斯HAR潜在因子模型(DMA(DMS)-FAHAR),并对我国金融期货(主要是股指期货和国债期货)的高频已实现波动率进行预测.通过构建贝叶斯动态潜在因子模型提取包含波动率变量、跳跃变量和考虑杠杆效应的符号跳跃变量等预测变量的重要信息.同时,在模型中加入了投机活动变量,以考察市场投机活动对中国金融期货市场波动率预测的影响.预测结果表明,时变贝叶斯潜在因子模型在所有参与比较的预测模型当中具有最优的短期、中期和长期预测效果.同时,具有时变参数和时变预测变量的贝叶斯HAR族模型在很大程度上提高了固定参数HAR族模型的预测能力.在股指期货和国债期货的预测模型中加入投机活动变量可以获得更好的预测效果.%The realized volatilities of China's financial futures is forecasted by constructing a Bayesian factor augmented heterogeneous autoregressive model (DMA (DMS)-FAHAR) with time-varying parameters and stochastic volatility.The Bayesian inference is employed to obtain the latent factors of the daily,weekly,and monthly predictor sets including the lagged volatility variables,jump variables,and signed jump variables.Speculation variables are used to investigate the impact of speculation activities on the volatilityforecast.The results suggest that the Bayesian factor augmented HAR model performs best for short-term,mid-term,and long-term forecasts among all candidate forecast models.Meanwhile,the time-varying Bayesian HAR models have superior forecast performances compared with the fixed parameter HAR models.In addition,better forecast performances areachieved after incorporating the speculation variables into the forecast models for both the stock index futures and the Treasury futures.【期刊名称】《管理科学学报》【年(卷),期】2017(020)008【总页数】14页(P13-26)【关键词】已实现波动率的预测;HAR模型;金融期货;时变性;潜在因子【作者】罗嘉雯;陈浪南【作者单位】华南理工大学工商管理学院,广州510006;中山大学岭南学院,广州510275【正文语种】中文【中图分类】F833-5中国的金融期货起步较晚. 2010年4月16日,中国首次推出融资融券业务和沪深300股指期货,双向交易在沪深股票市场成为可能. 2013年9月6日,停牌近18年的国债期货合约的上市交易宣告了中国国债市场重新进入双边市场时代. 金融期货市场的建立为投资者提供了规避市场风险的有效对冲场所. 然而,金融期货本身的稳定是其能够作为对冲场所的前提条件. 因此,准确预测金融期货的波动性(率)对于投资者从事资产定价、构建资产组合和进行风险管理是至关重要的.传统文献通常运用低频GARCH模型对低频波动率进行预测[1]. 随着金融高频/超高频数据的可获得程度的提高,利用基于日内高频金融数据估计的已实现波动率(realized volatility 或RV)进行建模逐步成为该领域研究的主导并得到广泛认可. 在RV的基础上,Corsi[2]提出异质自回归(heterogeneous autoregressive,HAR)模型,即在已实现波动率的自回归方程中引入日、周、月已实现波动率变量作为预测变量,对已实现波动率进行预测. 由于HAR模型具有灵活的线性模型结构,估计方法简单且获得更好的预测效果,不少学者在HAR模型的基础上作进一步的拓展. 例如, Corsi 等 [3,4]分别在HAR-CJ模型中考虑门限效应和波动率的杠杆效应,构建HAR-TCJ和LHAR-CJ模型对已实现波动率进行预测. Huang 等[5]结合已实现GARCH模型和HAR模型构建已实现HAR-GARCH模型. 部分国内学者也应用最新发展的HAR模型对我国金融市场的高频已实现波动率进行预测,如文凤华等[6]考虑波动率的杠杆效应和量价关系,建立了LHAR-RV-V模型并对波动率进行预测. 陈浪南等[7]在HAR-GARCH模型和HAR-CJ模型基础上建立了自适应的不对称的HAR-CJ-D-FIGARCH模型并对我国股票市场波动率进行预测. 吴恒煜等[8]构建包含跳跃和马尔可夫机制转换结构的HAR模型,并认为区分跳跃和结构转换特征的模型可以显著提高HAR模型预测能力. 从以上文献来看,大部分文献都假定系数和预测变量集不随时间变化, Liu等[9]及Choi 等[10]均认为假定预测模型的系数和预测变量集不随时间而变,不仅损失了模型的灵活性,也容易造成预测偏误. 尽管部分文献[8]在建模中加入马尔科夫机制转换结构消除结构断点的影响,但他们并未考虑不同预测变量的预测能力有可能会随着时间的变化而变化. 近年来发展的贝叶斯时变预测模型为解决此类问题提供了很好的思路和方法,如,Cogley等[11]及Primiceri[12]提出的基于状态空间模型建立参数随时间逐步演化的时变参数(time-varying parameter, TVP)模型. Raftery 等 [13]在TVP模型框架基础上提出运用动态模型平均(dynamic model averaging, DMA)和动态模型选择(dynamic model selection, DMS)的方法筛选有效的预测变量,并应用于工程学预测. Koop等[14]将DMA和DMS方法应用于宏观经济预测领域,并实证证明了DMA/DMS估计方法相对于TVP模型的优势. Groen 等[15]通过引入隐变量对模型的不确定性进行建模,即基于该隐变量对每一时期的预测变量进行筛选,并运用该模型对多个宏观变量进行预测. Koop等 [16]通过贝叶斯因子模型提取多个金融变量中的重要信息,并用以预测宏观经济变量. Kalli等 [17]提出贝叶斯时变稀疏性(TVS)模型,通过模型参数先验分布设定使得不重要的预测变量可以衰减为0. Audrino等[18]提出运用套索方法预测变量进行筛选. 从以上文献来看,大部分的贝叶斯时变模型方法均运用于宏观经济变量如通货膨胀率、GDP等的预测,但较少的文献将其运用于金融资产的高频波动率的预测当中.从现有文献来看,大部分基于HAR建模的已实现波动率模型均假定系数和预测变量集不随时间变化,然而,由于政策变动以及外部冲击等诸多因素的影响,金融市场收益的波动率在不同时期通常会呈现不同的特征,即存在结构断点. 运用定参数模型对已实现波动率进行预测容易造成预测偏误. 而从现有的贝叶斯时变方法来看,DMA方法和DMS方法基于最初的TVP方法进行建模,通过包含概率对预测变量进行筛选,并可以灵活嵌套于线性和非线性模型之中. 此外,相对于其他贝叶斯时变方法(如TVS和Lasso方法),DMA方法和DMS方法可以通过设置遗忘因子,结合卡尔曼滤波方法对时变参数进行估计,降低在贝叶斯MCMC推导中高维参数模型的运算量.因此,结合DMA方法和DMS方法建立具有时变参数和随机方差的贝叶斯动态潜在因子HAR模型(DMA-FAHAR模型和DMS-FAHAR模型),其中DMA方法是在每个时点根据不同预测模型的预测效果并计算不同模型的权重,再进一步通过加权平均获得预测结果,而DMS方法在每个时点选出最优的预测模型作为该时点的预测模型. 此外,市场的投机活动也是影响市场波动的主要要素,其中Lucia等[19]提出投机活动对期货市场波动率有重要影响,陈海强等[20]提出期货市场的投机活动活跃程度会对市场跳跃有影响. 因此,考虑市场的投机活动会对市场的未来波动行为产生影响,因此,首次在波动率预测模型中加入投机活动变量,以考察市场投机活动变量对高频波动率预测的影响.运用以上模型对中国期货市场(主要是股指期货和国债期货)的高频已实现波动率进行预测.主要贡献如下, 1)首次结合贝叶斯时变模型方法和高频波动率预测模型——HAR模型构建参数和预测变量均可时变的已实现波动率预测模型,模型具有更大的灵活性并可以消除潜在截断点对预测的影响,并可以获得更好的预测效果. 2)构建多个包含门限效应和杠杆效应的高频波动率和跳跃变量,并通过构建贝叶斯潜在动态因子模型提取预测变量集的主要信息,并引入预测模型,从而获取更好的预测效果并不会带来过度参数化的问题. 3)首次考虑市场投机活动对期货市场波动率预测的影响,以交易量和持仓量的比例作为投机活动的代理变量,利用时变包含概率和预测效果比较分析投机活动对期货市场高频波动率预测效果的影响.采用已实现波动率作为股指期货波动率的代理变量. 假设日内价格Pt的观测频率为δ,δ等于观测间隔(如5 min)与每日交易时间之比,1/δ表示每日价格的观测次数,可得日内收益率为rt=100×(ln Pt-ln Pt-δ),通过计算日内收益率的平方和即可得到每日的已实现波动率Barndorff-Nielsen等[21]通过建立已实现二次幂变差(realized bi-power variation)得到对跳跃稳健(jump-robust)的波动率变量,并获得跳跃的估计,已实现二次幂变差可以表示为当等[3]在BPV的基础上进一步提出门限二次幂变差 (threshold bipower variation,TBPV),从而消除小样本观测值在不连续状态下存在的正向误差对BPV收敛性的影响. TBPV的计算公式为ϑjδ}其中其中cϑ是校准门阀常数,是用于计算局部方差的非参迭代滤子. 依据Corsi等 [3]的论述,设定通过Barndorff-Nielsen等[21]和Corsi等 [3]提出的C_Zt和C_TZt统计量*其中,和ϑ(j-1+k)δ}.可以得到跳跃的一致估计,并计算出波动率的连续成分.C_Zt=C_TZt=从而可以分离出波动率的连续成分和跳跃连续成分Barndorff-Nielsen等 [22]提出的已实现半变差,将已实现波动率分解成正的收益波动成分和负的收益波动成分,从而在波动率预测中可以考虑到杠杆效应的影响. 已实现半变差的计算过程如下并有RV=RS-+RS+,且ΔJ=RS+-RS-表示符号跳跃变差(signed jump variation) 假设RM是已实现波动率的估计量,定义其中RMt,5表示已实现波动率的周估计量,RMt,22表示已实现波动率的月估计量. 主要采用Corsi[2]的标准HAR模型,Andersen 等 [23], Corsi 等 [3]提出的带跳跃成分HAR-CJ模型和门阀跳跃成分的和HAR-TCJ模型以及Patton等[24]的提出的加入符号跳跃变量和已实现半变差的HAR-ΔJ模型这四种具有代表性的HAR族模型对波动率进行预测(见式(6)).基于这四种模型,结合Raftery 等 [13]提出的DMA和DMS方法,Koop等 [16]提出的时变动态潜在因子模型,建立贝叶斯HAR潜在因子模型. 潜在因子根据贝叶斯推导确定,具体模型如下上述模型可以定义为DMA(DMS)-FAHAR模型,其中Xt为n×1维向量,包含了HAR模型,HAR-CJ模型,HAR-TCJ模型,以及HAR-ΔJ模型中所有可能的预测变量,即,Xt=(BPVt,TBPVt,Ct,TCt,Jt,TJt,ΔJt). Ft 为潜在因子变量,通过估计Ft 可以提取预测变量集中的主要信息.和为对应的滞后潜在因子.此外,考虑投机活动对期货市场波动率有重要影响. 根据Lucia等 [19],加入基于未平仓合约和交易量建立的投机活动衡量指标,即Xspec=.Xspec的值越大,说明市场的投机交易活动越活跃. 进一步构建包含投机活动变量的贝叶斯动态潜在因子模型DMA-FAHAR-spec,其中Xt=(BPVt,TBPVt,Ct,TCt,Jt,TJt,ΔJt,Xspec).假设为Xt包含不同预测变量情况下所有可能的子集,对于包含m个预测变量的模型,预测变量的子集个数有K=2m个(定义为M1,…,MK).是潜在因子模型中的因子载荷. ct为常数, B1,t,B5,t和B22,t分别对应日、周、月预测元(预测元包含滞后的RV和潜在因子)向量的系数矩阵,为因子模型方程的时变扰动项方差,为预测方程扰动项的时变方差.定义系数向量βt=(,vec(B1,t)′,vec(B5,t)′,vec(B22,t)′)′ ,根据状态空间模型定义系数的时变性,则有其中为因子载荷迭代方程中的扰动项方差,为系数向量迭代方程中的扰动项方差. 运用MCMC推导方法对模型参数和潜在因子进行估计,待估的时变参数为θt={βt,λt,Vt,Qt,Wt,Rt} . 具体的估计步骤为,1)设置所有模型参数的初始值,各参数的初始值设置如下.f0~N(0,4),λ0~N(0,4×IN),β0~N(0,Vmin),V0≡1×InQ0≡1×In, π0≡其中Vmin服从Minnesota先验分布,对于常数项,Vmin=4,对于日、周、月的变量,Vmin=4/r2, r=1, 5 or 22.2)在给定情况下,抽取时变参数θt.①根据指数加权平减法(EWMA)估计出时变方差矩阵Vt,Qt,Wt,Rt;②根据卡尔曼滤波方法估计时变系数βt,λt;③在给定时变参数θt情况下,抽取动态因子Ft.基于不同的预测变量集Xt的子集,可以建立不同的预测模型. 进一步运用DMA和DMS方法对不同预测模型进行筛选,其中DMA方法是在每个时点根据不同预测模型的预测效果并计算不同模型的权重,再进一步通过加权平均获得预测结果,而DMS方法在每个时点选出最优的预测模型作为该时点的预测模型.给定初始权重值等 [13]提出运用遗忘因子α推导出权重值的预测方程.概率的迭代更新方程为其中 pl(RVt|RVt-1)为第l个子模型的似然函数值. 因此,通过式(10)和式(11)的更新迭代方法可以计算出每个时期包含模型k的概率在DMA方法下,通过运用概率对不同预测模型的预测值进行加权平均获得已实现波动率的预测值,而在DMS方法下则通过选择在t时期时具有最大的概率的单个模型作为t时期的预测模型. 定义则已实现波动率在这两种方法下的h期预测值分别为where,{k∶πt|t-h,k=max{πt|t-h,1,…,πt|t-h,l,l=1,…,K}}采用中国沪深300股指期货和中国国债期货每5分钟的高频数据. 沪深300股指期货样本期包括从股指期货第一天上市交易(2010年4月16日)到2015年6月30日一共1 263个交易日,而中国国债期货的样本期包括从国债期货第一天上市交易(2013年9月6日)到2015年6月30日一共440个交易日. 数据来源为万得数据库. 股指期货和国债期货的日交易区间为9:15到15:15,每五分钟的日内数据为54个.表1列出所有变量的统计分析. 如表1所示,股指期货的波动率均值和标准差均比国债期货大,说明股指期货市场的交易波动比国债期货市场大. 同时根据投机活动指标来看,股指期货的投机活动更为活跃. JB统计量和峰度偏度统计量表示所有变量都不服从正态分布,显现出金融时间序列普遍的尖峰厚尾的特征. 同时Ljung-Box指数表示收益和波动率以及跳跃变量都有着较强的自相关性,显示出长记忆性的特征. 同时ADF统计量表示所有变量均是平稳序列.由于已实现波动率RV的估计是无模型形式,所以无法根据传统的数据生成过程(DGP)生成已实现波动率RV的模拟序列. 根据Audrino等 [18],根据以下数据生成过程进行蒙特卡罗模拟,从而对模型估计方法的稳健性进行验证. 运用最基本的HAR模型(Corsi[3])进行数据模拟,验证DMA方法和DMS估计方法对HAR族模型的参数估计的有效性. 以股指期货样本为例,蒙特卡罗模拟的步骤具体如下.1)基于股指期货全样本数据估计HAR模型(见式(6)的第一个模型)的参数.①运用OLS估计方法估计HAR模型得到估计系数模型可以写成带约束的VAR(22)模型,根据系数写成VAR(22)模型的系数②计算模型的非条件均值和非条件方差是滞后i阶的自方差2)利用HAR模型生成模特卡罗模拟样本.①从正态分布中抽取x1, (x22)②根据模型(6)通过迭代运算得到x23,…,x2 000,取后1 000个模拟数据进行模拟运算;③运用DMA方法估计出HAR模型中各预测变量的时变包含概率.通过对第二步重复1 000次,并获得1 000个蒙特卡罗模拟结果.图1显示蒙特卡罗模拟下HAR模型的滞后日、周和月波动率的时变包含概率. 其中中间的线是1 000次蒙特卡罗模拟的中位数值,而上下两条实线分别是75%和25%的区间线. 从结果来看,1 000次蒙特卡罗模拟下HAR模型的日、周和月滞后波动率变量的包含概率均在较小范围内浮动,证明运用DMA方法可以有效估计HAR模型的时变参数并筛选出合适的预测变量. 而DMS方法与DMA方法运用相同的包含概率,所以同理也可以证明DMS方法是有效的.对于DMA和DMS模型,对应m维的预测变量集的子集总个数为K = 2m. 根据模型设定,模型中的预测变量集为Xt=(BPVt,TBPVt,Ct,TCt,Jt,TJt,ΔJt,Xspec),因此,子模型的总个数为28=256. 结合两种贝叶斯时变模型方法(动态模型平均(DMA)和动态模型选择(DMS)),建立DMA-FAHAR-spec模型和DMS-FAHAR-spec模型. 根据模型设定,模型系数和预测变量集可以随着模型结构的变化而变化,从而消除未知截断点对预测效果的影响. 根据全样本分析预测变量集的时变规模和不同预测变量的时变包含概率. 计算DMA和DMS模型的时变包含概率是贝叶斯HAR族模型估计的关键,其中DMS模型与DMA模型具有相同的包含概率. 对于DMS模型,根据DMA模型计算的包含概率在每个时点选出最大包含概率的子模型进行预测. 对于DMA模型,第k个预测变量的包含概率(PIP)可以定义为其中为第k个子模型sub_Mk被包含在预测模型中的贝叶斯概率,可以根据第1部分中式(10)~式(11)的迭代计算得到,而I(·)是示性函数,当括号内的条件被满足时候取值为1,其余情况取值为0.图2显示股指期货(图2(a))和国债期货(图2(b))DMA-FAHAR-spec模型中不同预测变量的时变包含概率. 更大的包含概率值表示该变量具有更好的预测能力,即该变量包含了更有用的预测信息. 根据Koop等[14]的论述,当包含概率值大于0.5时,该预测变量可以认为是好的预测变量. 因此,可以根据每个预测变量的包含概率大于0.5的时期来判断好的预测变量. 如图2(a)所示,对于股指期货样本,各预测变量在不同时期表现出不同的预测能力,其中带门限效应的波动率变量和跳跃变量(包括TBPV、TC和TJ)在大部分时期内的包含概率大于0.5,表现出较强的预测能力,投机活动变量Xspec在股指期货推出初期以及2011年至2013年期间较长一段时期内的包含概率大于0.5,表现出较强的预测能力. 如图2(b)所示,对于国债期货样本,在国债期货推出后的初期,各预测变量的预测能力均衡,稳定在0.5. 而在随后的样本期内,各预测变量的包含概率的时变趋势表现出较大的起伏. 从整体来看,波动率变量(BPV和TC),跳跃变量(J和TJ)在较长一段时间内具有较大的包含概率,表现出较强的预测能力. 而投机活动变量在样本期末期表现出较强的预测能力.基于DMA和DMS方法构建了具有时变参数和时变预测变量集的贝叶斯HAR潜在因子模型,并利用贝叶斯潜在因子方法减少模型参数维度. 为了评价新创建模型的预测效果,同时建立了一系列的比较模型,如结合DMA和DMS方法和包含式(6)中的所有模型预测变量构建的贝叶斯HAR模型(DMA(DMS)-HAR模型)以及结合TVP方法的TVP-FAHAR族和TVP-HAR族模型. 同时,为了证明投机活动对期货市场波动率预测的影响,去除投机活动变量建立DMA(DMS)-FAHAR模型以及在基础的DMA(DMS)-HAR模型中加入日、周和月投机活动变量构建DMA(DMS)-HAR-spec模型. 此外,以经典文献中提到的标准HAR模型[2],HAR-CJ模型 [23]和HAR-TCJ模型 [3]以及HAR-ΔJ模型 [24]作为基准参考模型. 运用以上模型对我国股指期货和国债期货的已实现波动率进行短期、中期和长期预测,预测期包括向前1期(h=1),向前5期(h=5)和向前22期(h=22),分别对应一天、一周和一个月.把股指期货和国债期货的样本期分成两个部分,分别约占整个样本期的2/3和1/3. 其中股指期货的样本内时期(定义为T1)从2010 年4月16日~2013年10月14日一共863个样本值,样本外时期从2013年10月15日~2015年6月30日包含最后的400个样本值. 与之类似,国债期货的样本内时期(定义为T2)从2013 年9月6日~2014年11月24日一共290个样本数,样本外时期从2014年11月25日~2015年6月30日一共150个样本值. 先利用Patton[25]提出的稳健损失函数对不同预测模型的样本外预测表现进行比较. 根据Patton[25]的设定,选取四种不同的损失参数b=0,b=-2,b=-1和b=1,其中b=0,b=-2,分别代表传统的MSE和QLIKE损失函数,b=-1代表齐次损失函数,b=1代表正向损失函数. 表2和表3分别显示基于不同损失函数股指期货波动率的样本外预测结果和国债期货波动率的样本外预测结果,损失函数值越小表示模型的样本外精度越高. 本文对最优预测模型的结果进行加粗显示. 根据表2中损失函数的比较结果,从大部分的损失函数来看,对于股指期货波动率的预测, DMS-FAHAR-spec模型具有最优的短期、中期和长期预测效果. 根据表3中损失函数的比较结果,对于国债期货,所有损失函数显示DMA-FAHAR-spec模型具有最优的短期和中期预测效果,而DMS-FAHAR-spec具有最优的长期预测效果. 对比包含投机活动变量的贝叶斯潜在因子模型和不包含投机活动变量的贝叶斯潜在因子模型,投机活动变量的引入明显改善了股指期货和国债期货贝叶斯HAR潜在因子模型的短期、中期和长期的样本外预测效果. 进一步对比包含投机活动的贝叶斯HAR模型和不包含投机活动的贝叶斯HAR模型,发现投机活动变量的引入改善了股指期货贝叶斯HAR模型的短期样本外预测能力,并且改善了国债期货贝叶斯HAR模型的短期、中期和长期样本外预测能力. 因此,从整体来说,投机活动变量的引入改善了贝叶斯HAR时变模型的预测能力. 从结合DMA/DMS方法的HAR族模型和结合TVP方法的HAR族模型的比较来看,DMA(DMS)-HAR族模型比TVP-HAR族模型具有更优的样本外预测效果. 此外,比较贝叶斯时变模型和基础HAR模型的预测精度,发现结合贝叶斯时变参数方法建模在很大程度上提高了基础HAR模型的样本外预测精度.由于Patton[25]提出的损失函数法是基于样本外时期的所有损失函数值的平均值对不同预测模型进行预测精度比较,因此,该方法的缺陷是容易受到某些异常值的影响. Hansen 等[26]提出的模型置信区间法(MCS)通过假设检验方法选取最优模型集,并被广泛运用于波动率预测的检验之中[27]. 选取MSE和QLIKE损失函数作为MCS检验的损失函数,通过10 000次bootstrap抽样计算出拒绝原假设的p值,p值越大,代表该预测模型包含于最优预测模型集的概率越大. 表4和表5分别显示股指期货和国债期货基于TR 和TSQ统计量的MCS结果. 设立两种置信区间α=0.5和α=0.25,代表预测模型被包含于和之中,分别用**和*进行标记.如表4所示,对于股指期货,基于MSE和QLIKE损失函数的MCS检验结果均显示DMS-FAHAR-spec模型具有最优的短期和中期预测效果,对于长期预测模型,基于MSE损失函数的MCS检验结果显示DMA-FAHAR-spec模型具有最优的预测精度,而基于QLIKE损失函数的DMS-FAHAR模型具有最优的预测精度. 此外,从MSE损失函数的MCS检验结果来看,贝叶斯潜在因子模型模型基本都在50%或75%的置信区间内被包含入最优预测模型集. 从QLKE损失函数的MCS检验结果来看,短期预测模型中只有DMS-FAHAR族模型和DMS-HAR族模型被包含入最优预测模型集,而在中期预测模型和长期预测模型中,只有DMS-FAHAR族模型被包含入最优预测模型集. 因此,贝叶斯潜在因子模型在股指期货的中期和长期的预测显示出较大的比较优势.如表5所示,对于国债期货,基于MSE损失函数和QLIKE损失函数的MCS检验结果均显示DMA-FAHAR-spec模型具有最优的短期预测效果和DMS-FAHAR-spec最优的长期预测效果,而基于MSE损失函数的MCS检验结果显示DMA-FAHAR-spec模型具有最优的中期预测效果,而基于QLKE损失函数的MCS检验结果分别认为DMA-FAHAR模型具有最优的中期预测效果. 对于长期预测模型,只有贝叶斯因子模型在50%或25%的置信区间内被包含入MCS,这显示,贝叶斯因子模型具有较大的预测优势,而对于短期和中期模型,大部分的预测模型都被包含入MCS,显示这些模型具有较为相似的预测能力. 因此,贝叶斯潜在因子模型在国债期货的长期预测中显示出较大的比较优势.综上所述,根据四种稳健的损失函数判断和MCS方法判断,对于股指期货波动率,DMS-FAHAR-spec模型具有最优的短期、中期和长期样本外预测能力,而对于国。
基于隔夜信息的股市波动率建模与预测
近年来,越来越多的研究者开始尝试使用机器学习方法来预测股市波动率。例如,支持向 量机、神经网络、决策树等算法被应用于股市波动率的预测。这些方法能够自动提取数据 中的特征并进行分类或回归预测,具有较高的预测精度。
大数据分析方法
大数据分析方法通过分析大量数据来挖掘市场走势和波动率的关联。例如,利用社交媒体 的情绪分析、新闻事件的分析等方法来预测市场波动率的变化。这种方法能够提供更全面 的市场信息,但需要处理大量的数据并具备相关技术能力。
05
结论与展望
研究结论
本文通过实证分析,发现隔夜信息对股市波动率 具有显著影响,表明市场对隔夜信息存在反应。
采用GARCH模型对隔夜信息引起的波动率进行建 模,能够较好地拟合数据,提高预测精度。
引入外部变量能有效改进GARCH模型的预测性能 ,尤其是在波动率大幅波动时。
研究不足与展望
本文主要关注了隔夜信息对股市波动率的影响 ,未考虑其他可能影响波动率的变量,如市场 情绪、投资者行为等。
基于隔夜信息的股市波动率 建模与预测
汇报人: 2023-12-30
目录
• 引言 • 股市波动率理论基础 • 基于隔夜信息的股市波动率建
模 • 预测模型的实证分析 • 结论与展望
01
引言
研究背景与意义
随着全球金融市场的快速发展, 股市波动率成为投资者和研究者
关注的重点。
股市波动率是衡量市场不稳定性 和风险的重要指标,对投资者决
04
预测模型的实证分析
数据来源与处理
数据来源
本研究采用了某证券交易所的股票交易数据,包括每日的开盘价、最高价、最 低价和收盘价等。
数据处理
对原始数据进行了清洗和预处理,包括数据缺失值处理、异常值剔除以及数据 格式转换等。
金融风险管理中的时间序列预测模型
金融风险管理中的时间序列预测模型金融风险管理是金融机构和市场参与者日常运营中的重要环节。
为了更好地应对金融市场的不确定性和波动性,金融机构采用了各种风险管理方法和工具。
其中,时间序列预测模型是一种常用的方法,用于预测未来的金融变量和风险指标。
时间序列预测模型是一种基于历史数据的统计模型,通过对过去的观测值和模式进行分析,来预测未来的数值。
在金融风险管理中,时间序列预测模型可以用于预测股价、市场指数、汇率、利率、信用违约等金融变量和风险指标。
它的核心思想是基于时间序列的趋势、周期性和随机性等特征,来推断未来的走势和风险。
在金融领域,常用的时间序列预测模型包括移动平均模型(MA)、自回归模型(AR)、自回归滑动平均模型(ARMA)、自回归积分滑动平均模型(ARIMA)、指数平滑模型(ES)等。
这些模型都是基于统计学原理和数学算法构建而成的,具有不同的适用范围和预测性能。
移动平均模型是一种简单的时间序列预测模型,它仅基于观测值的平均数来进行预测。
自回归模型则将未来的观测值与过去的观测值进行相关联,通过对过去的观测值进行分析,来预测未来的观测值。
自回归滑动平均模型则是综合了MA和AR的特点,既考虑了过去的观测值,又考虑了过去的预测误差。
自回归积分滑动平均模型则增加了对时间序列的差分运算,用于处理非平稳时间序列。
指数平滑模型则是一种适用于快速变化的时间序列预测模型,通过加权平均的方式对观测值进行预测。
在实际应用中,选择合适的时间序列预测模型是十分重要的。
对于不同类型的金融变量和风险指标,需要选择适用的模型。
例如,对于平稳时间序列,可以选择AR、MA、ARMA等模型;对于非平稳时间序列,可以选择ARIMA模型;对于快速变化的时间序列,可以选择指数平滑模型。
此外,在选择时间序列预测模型时,还需要考虑模型的参数估计和模型诊断。
参数估计是指通过对历史数据的拟合来确定模型的参数,一般采用最大似然估计、最小二乘估计等方法。
金融风险预测中的时间序列模型选择与优化
金融风险预测中的时间序列模型选择与优化在金融领域,风险预测对于决策者而言至关重要。
时间序列模型是一种常用的预测工具,它基于历史数据和时间的关系来预测未来的事件。
然而,在金融风险预测中,选择合适的时间序列模型并对其进行优化是一个复杂的过程。
首先,为了选择合适的时间序列模型,需要考虑数据的性质和特点。
金融数据通常具有非线性、非平稳、异方差等特征。
为了克服这些问题,可以使用不同类型的时间序列模型,如ARIMA、GARCH、VAR等。
ARIMA模型适用于平稳时间序列数据,可以捕捉到数据的长期和短期依赖性。
GARCH模型则适用于捕捉金融数据的波动性,并能够处理异方差性。
VAR模型则可以同时考虑多个相关变量的影响。
根据数据的性质选择合适的模型是时间序列模型选择的第一步。
其次,对选择的时间序列模型进行优化是为了提高模型的预测准确性。
常见的优化方法包括参数估计、模型检验、模型选择和模型组合。
参数估计是指估计模型中的参数值,常用的方法有最大似然估计和贝叶斯估计。
模型检验是为了评估选择的模型在训练数据上的拟合优度,常用的方法有残差分析、白噪声检验和单位根检验等。
模型选择是为了在多个候选模型中选择最优的模型,常用的方法有信息准则、交叉验证和贝叶斯模型平均等。
模型组合是为了将多个模型结合起来,提高预测准确性。
常用的方法有加权平均和集成模型(如随机森林和梯度提升树)等。
除了模型的选择和优化,还需要考虑时间序列数据的预处理和特征工程。
预处理包括去除异常值、平滑和变换等,以减少噪声对模型的影响。
特征工程是为了提取与预测目标相关的特征变量,可以通过滞后变量、趋势指标和技术指标等方法来构建特征。
通过预处理和特征工程,可以提高模型的预测能力。
对于金融风险预测中的时间序列模型选择与优化,还有一些注意事项需要考虑。
首先,需要注意模型的过拟合问题。
过拟合是指模型在训练数据上的拟合效果较好,但在测试数据上的泛化能力较差。
为了避免过拟合,可以使用交叉验证和正则化等方法。
基于数据挖掘的风险事件检测与预警研究
基于数据挖掘的风险事件检测与预警研究在当今日益复杂和不稳定的全球经济环境下,企业和组织面临着各种风险事件的潜在威胁。
这些风险事件可能对企业造成财务损失、声誉损害,甚至对整个市场产生严重冲击。
因此,基于数据挖掘技术的风险事件检测与预警研究变得尤为重要。
数据挖掘是一种通过发掘、分析大量数据中的潜在信息和模式的技术。
利用数据挖掘技术,可以从大规模数据中发现隐含的关联规则、分类模式和异常模式,从而揭示隐藏的风险事件。
基于数据挖掘的风险事件检测与预警研究主要包括以下几个方面的内容。
首先,要建立一个完整的数据收集和存储系统。
这个系统应该能够实时收集各种与企业风险相关的数据,包括财务数据、供应链数据、市场数据等。
同时,还需要建立一个可靠的数据存储和管理机制,以确保数据的完整性和准确性。
其次,利用合适的数据挖掘算法进行模式挖掘。
通过对大规模数据进行挖掘,可以找到潜在的模式和规律,辅助风险事件的检测和预警。
常用的数据挖掘算法包括关联规则挖掘、聚类分析、分类算法和异常检测等。
这些算法可以帮助企业找到相关的风险事件,并提供预警信息。
第三,构建一个综合的风险评估模型。
通过综合考虑不同维度和指标,构建一个多因素的风险评估模型,可以更加全面地评估风险事件的潜在影响和可能性。
这个模型可以结合企业的具体情况进行调整和优化,以提高预警的准确性和及时性。
接下来,要建立一个有效的风险事件预警系统。
根据风险评估结果和挖掘出的模式,建立一个实时的风险事件预警系统,能够及时向企业决策者提供预警信息。
这个系统应该具备高可靠性、高效性和灵活性,能够根据实际情况进行实时调整和优化。
最后,要进行风险事件的后续处理和分析。
一旦发生风险事件,企业需要及时做出反应,并采取相应措施进行处理。
此外,还需要对风险事件进行细致的分析和总结,以提高对未来风险的识别和预测能力。
基于数据挖掘的风险事件检测与预警研究的意义在于帮助企业准确识别和预测潜在的风险事件,以便及时采取相应措施进行应对。
金融风险控制中的高频交易监测与异常检测技术
金融风险控制中的高频交易监测与异常检测技术在金融风险控制中,高频交易监测与异常检测技术扮演着至关重要的角色。
随着金融市场的快速发展和金融工具的不断创新,交易活动呈现出高频、复杂和多变的特点,这给金融风险管理带来了新的挑战。
为了应对这些挑战,金融机构需要采用先进的高频交易监测与异常检测技术,以实时监测和识别交易活动中存在的潜在风险。
高频交易是指以高速电子交易系统为基础,以毫秒级别的速度进行交易的活动。
由于高频交易的特殊性,传统的监测与检测方法已经不再适用。
高频交易监测与异常检测技术的目标是通过分析和挖掘交易数据,发现并识别潜在的异常和风险行为,以便及时采取相应的措施。
高频交易监测与异常检测技术包括两个主要方面:一是高频交易监测,用于实时跟踪和监测交易活动;二是异常检测,用于发现交易活动中可能存在的异常行为。
在高频交易监测方面,金融机构可以使用实时数据流处理技术来监测交易活动。
实时数据流处理技术可以实时地处理大量的交易数据,并通过数据聚合和分析,提供准确和及时的交易监测结果。
通过实时监测,金融机构可以迅速发现潜在的交易风险,并及时采取相应的风险控制措施。
另一方面,异常检测技术可以帮助金融机构发现交易活动中的异常行为。
异常行为可能是交易过程中的技术故障、市场操纵、内幕交易等非正常交易行为。
通过对交易数据的分析和挖掘,异常检测技术可以识别出这些异常行为,从而帮助金融机构及时采取相应的措施,防范潜在的风险。
高频交易监测与异常检测技术的实现离不开先进的数据分析和挖掘算法。
数据分析和挖掘算法可以帮助金融机构从大量的交易数据中提取有用的信息和模式,发现潜在的风险和异常行为。
例如,机器学习算法可以通过训练模型对交易数据进行分类和预测,以判断是否存在潜在的异常和风险行为。
数据挖掘算法可以通过挖掘交易数据的关联规则和频繁模式,发现交易活动中的规律和模式,并识别出不符合这些规律和模式的异常行为。
在实际应用中,金融机构可以结合多种高频交易监测与异常检测技术,构建多层次的风险控制系统。
金融风险模型中的异常检测与预测算法
金融风险模型中的异常检测与预测算法金融风险模型是金融机构用来预测和评估潜在风险的重要工具。
随着金融市场的不断发展和变化,金融风险也在不断演变,因此设计准确且高效的异常检测与预测算法显得尤为重要。
异常检测是金融风险模型中的一项关键任务。
金融市场中存在着各种各样的异常事件,如欺诈、市场崩盘等,这些异常事件可能对金融机构造成巨大的损失。
因此,通过异常检测算法及时识别这些异常事件对于风险管理至关重要。
在金融风险模型中,常用的异常检测算法包括统计学方法、机器学习方法和时间序列分析方法。
统计学方法是最常见且广泛应用于金融风险模型的一种方法。
它基于对金融数据的统计分析,通过计算均值、方差、协方差等指标来识别异常数据。
常用的统计学方法包括均值方差法、离群点检测法和箱线图法等。
这些方法简单易用,但是在处理大规模数据和非线性关系时效果欠佳。
机器学习方法是一种基于数据驱动的方法,它通过学习大量数据样本的特征和模式,来预测和识别异常事件。
常用的机器学习方法有支持向量机(SVM)、随机森林和神经网络等。
这些方法能够处理大规模的数据、非线性关系和高维特征,具有较强的预测能力和泛化能力。
时间序列分析方法是一种基于时间序列数据进行建模和分析的方法。
它在金融领域中被广泛应用于预测金融市场的变动趋势和风险。
时间序列分析方法包括ARIMA模型、ARCH模型和GARCH模型等。
这些方法通过对金融数据的历史走势进行建模和拟合,可以预测未来的风险水平。
除了异常检测,金融风险模型中的预测算法也是十分重要的。
预测算法可以帮助金融机构提前识别和评估潜在风险,从而采取相应的避险策略和措施。
在金融风险模型中,常用的预测算法包括时间序列预测、回归分析和机器学习方法。
时间序列预测是一种基于时间序列数据进行未来数值预测的方法。
常用的时间序列预测方法包括移动平均法、指数平滑法和ARIMA模型等。
这些方法在金融市场中广泛应用,可以预测金融市场的变动趋势和波动情况。
信息不对称对股指期现货市场流动性不稳定的预警研究
信息不对称对股指期现货市场流动性不稳定的预警研究作者:李延军贺佳宁来源:《金融发展研究》2020年第10期摘要:本文构建TVAR模型并将知情交易概率作为门限变量,研究得出知情交易概率存在双门限值,据此将信息不对称划分为三个区制,发现在低区制流动性溢出效应不显著,在中间区制流动性溢出效应开始变得显著,在高区制流动性溢出效应明显增强。
此外,在不同信息不对称区制下,随着区制转换,知情交易概率对现货市场流动性的影响由正向变为负向,对期货市场流动性的影响由负向变为正向。
区制分析表明,知情交易概率门限值可以作为市场流动性匮乏、流动性关联异化和市场不稳定的预警指标,通过建立知情交易概率分级预警制度,监管者可以尽早监测到市场的异常变化,尽早防范和化解风险。
关键词:流动性溢出;知情交易概率;TVAR模型;预警中图分类号:F830.91 文献标识码:A 文章编号:1674-2265(2020)10-0065-10DOI:10.19647/ki.37-1462/f.2020.10.011一、引言股指期货于20世纪80年代诞生于美国,随后全球主要发达国家和地区纷纷推出股指期货。
历经长期筹备,我国股指期货于2010年4月16日在中金所正式推出。
股指期货自诞生以来就伴随着质疑。
1987年股灾之后,美国发布《布雷迪报告》将股灾原因归咎于组合保险和指数套利,然而事后学者分析指出这个结论并不准确,因为组合保险和指数套利的交易额占比相对较小,报告对期货维持市場稳定的机制认识不清。
在中国2015年股灾中,从 6月15日开始,不到一个月的时间内,沪深300指数从5221点狂泻到3663点,后续一路下跌到3025点,有些投资者将此次股灾归结于股指期货市场的恶意做空,随后中金所出台了限制股指期货交易的严格措施,两市场一度处于深度贴水的状态,股指期货价量齐跌,流动性匮乏,市场功能的发挥受到了影响。
事实上,2015年股灾并不能完全归因于股指期货,投资者羊群行为导致的股市泡沫和流动性踩踏是股市下跌的重要原因。
金融数据分析中的异常检测与预测研究
金融数据分析中的异常检测与预测研究随着金融市场的发展和金融活动的复杂性增加,金融数据分析在决策制定和风险管理中的重要性日益凸显。
在金融数据分析过程中,异常检测与预测成为关键任务,能够帮助机构和个人识别潜在风险、捕捉潜在机会以及优化决策。
异常检测是金融数据分析中的重要工具,用于识别与市场正常行为模式有所不同的异常事件。
异常事件可能涉及金融市场中的非法交易、欺诈行为或其他异常情况。
通过监测和检测异常,金融机构和投资者能够即时采取措施,避免和减少潜在损失。
通过建立模型和算法,异常检测能够基于历史数据来识别未来可能发生的异常事件。
金融数据预测是基于历史数据和趋势的分析,旨在预测未来的金融市场走向和趋势。
在金融数据分析中,预测模型通常使用统计学方法和机器学习算法,帮助分析师和投资者做出更准确的决策。
预测模型可以对股票价格、汇率、商品价格等金融指标进行预测,以指导投资和风险管理。
在金融数据分析中,异常检测和预测相互关联,可以相互增强。
异常检测可以提供数据质量评估和过滤,确保用于预测的数据是准确可靠的。
另一方面,通过结合异常检测和预测,可以提高对未来异常情况的识别和预测准确性。
这种结合可以用于制定合理的风险措施、捕捉潜在机会和优化投资组合。
金融数据异常检测的方法和技术有很多,包括统计学方法、机器学习方法和深度学习方法等。
统计学方法包括基于常态分布和异常程度的离群点检测方法,如Z-Score方法和箱型图方法。
机器学习方法包括聚类、分类和异常值检测算法,如K均值聚类、支持向量机和孤立森林算法。
深度学习方法包括基于神经网络的异常检测算法,如自编码器和变分自编码器。
金融数据预测的方法和技术也有很多,包括时间序列预测、回归分析和机器学习算法等。
时间序列预测方法基于历史数据的时间相关性,如ARIMA模型和指数平滑方法。
回归分析方法基于自变量与因变量之间的关系,如线性回归和多项式回归。
机器学习方法包括决策树、随机森林和神经网络等,可以从复杂的非线性关系中提取模式和规律。
基于符号收益和跳跃变差的高频波动率模型
基于符号收益和跳跃变差的高频波动率模型马锋;魏宇;黄登仕【摘要】This paper decomposes the HAR-RV model and its various extensions based on the signed return and signed jumpvariation.Furthermore, new HAR-type models including the signed jump variation are pro-posed, which are constructed by the different jump tests.The forecasting accuracies of the existing and new HAR-type models are evaluated according to the rolling window method and MCS test.The empirical results show that the new signed jump variation including theC_TZ test is a significant improvement in the model' s short horizon forecasting performance.However, in forecasting the medium and long horizons, the signed jump variation shows no substantial improvement in forecasting accuracies.Finally, our newly proposed models, HAR-S-RV-TJ-TSJV and HAR-S-RV-TJ, are the best forecasting models in short and medium and long hori-zons than others models discussed in this paper.%基于符号收益率的视角,对现有的HAR-RV类及其跳跃扩展模型进行相应分解,构建新型的HAR-RV类波动率模型.进一步,结合符号收益和不同的跳跃识别检验方法,提出了包含符号跳跃变差的HAR-RV类模型,并利用样本外滚动窗预测技术和"模型信度设定"(MCS)检验法评价了各种新旧HAR-RV模型对我国沪深300股价指数波动的预测能力.结果表明:基于C_TZ跳跃识别检验的符号跳跃变差能显著改善波动率模型的短期预测能力,但在中长期波动预测时,符号跳跃变差未能明显提升HAR-RV类模型的预测精度;新提出的HAR-S-RV-TJ-TSJV模型和HAR-S-RV-TJ模型分别在对短期(未来1天)和中长期(未来5天和20天)的波动预测检验中,展现出了最高的预测精度.【期刊名称】《管理科学学报》【年(卷),期】2017(020)010【总页数】13页(P31-43)【关键词】高频波动率模型;跳跃;已实现半变差;符号跳跃变差【作者】马锋;魏宇;黄登仕【作者单位】西南交通大学经济管理学院,成都610031;西南交通大学经济管理学院,成都610031;西南交通大学经济管理学院,成都610031【正文语种】中文【中图分类】F830.9对金融资产波动率的描述和预测是现代金融学理论和实务界研究的热点和难点问题.近十多年,随着计算机技术的飞速发展和金融高频数据获取性逐渐增强,基于日内高频数据的波动率测度和预测受到了国内外学者的广泛关注.其中,具有代表性的是Andersen和Bollerslev[1-2]提出的已实现波动率(realized volatility,RV)测度方法,它不仅计算简便、无模型,而且具有无偏性和较好的稳健性等优点.已有学者(例如,Andersen等[3],Koopman等[4],魏宇[5])利用分整自回归移动平均(ARFIMA)模型对RV的动力学特征进行了描述,所构建的ARFIMA-RV模型在预测方面具有一定的优势.然而,Corsi[6]指出分整模型(如ARFIMA)仅是个便利的数学技巧,缺乏明确的经济含义.另外,由于分整模型需要构建分数差分算子,这样会损失相应的市场交易信息.在异质市场假说(heterogeneous markethypothesis)的基础上,Corsi[6]提出了简单的异质自回归——已实现波动率模型(heterogeneous autoregressive model of realized volatility, HAR-RV).与ARFIMA模型相比,HAR-RV不仅避免了ARFIMA模型的复杂估计,而且还能成功复制出金融收益率序列的“长记忆性”和“胖尾分布”等“典型事实”(stylized facts).鉴于上述优势,HAR-RV模型逐渐成为了学术界推崇的高频波动率模型之一. 虽然高频波动率模型得到了学者们的广泛认可,但在测度高频波动率(如RV)时,不可避免地会遇到两个重要问题:噪声和跳跃.首先,对于噪声问题,以RV的计算为例,理论上要求抽样频率越高才能使计算的RV越接近二次变差(quadratic variation,QV),然而抽样频率的增加势必伴随测度噪声增大.因此,两者间难以取得平衡.值得注意的是,Andersen and Bollerslev[1]发现,外汇交易波动能很好地用每5 min抽样的数据变化平方和来估计,并进一步指出5 min的取样频率可以在兼顾精确性和减少微观噪声之间取得平衡.另外,我国学者唐勇[7]以上证综指高频数据为例,实证发现了5 min抽样频率数据的合理性.最近,Liu等[8]研究了超过400种不同的波动率估计量,实证发现至少在统计意义上很难显著地击败以5 min抽样数据所估计的RV.鉴于以上分析,本文也选取5 min间隔作为实证数据的抽样频率.其次,资产价格的跳跃(jump)现象同样引起了国内外学者的关注.举例来说,Andersen等[9]将跳跃成分作为解释变量加入到简单的HAR-RV模型中,构建了HAR-RV-J模型,并利用Huang和Tanchen[10]提出的Z跳跃统计检验法,进一步构建了HAR-RV-CJ模型,实证发现了跳跃对未来波动率的预测具有影响.另外,Corsi等[11]发现当高频数据中连续跳跃出现的频率很高时,Huang和Tauchen[10]提出的基于多次幂变差的Z统计量有可能无法识别,使得一部分跳跃包含在波动率的连续估计成分中,从而会影响已实现波动率对未来波动率的预测能力.随后,Corsi等[11]利用修正的门限多次幂变差(corrected realizedthreshold multi-power variation),提出了基于C_TZ统计量的HAR-RV-TJ模型.最近,Barndorff-Nielsen等[12]提出了“已实现半变差”(realized semi-variance,RS)的波动率测度方法,他们将已实现波动率按照高频收益率的正负性分解为:已实现正半变差(positive realized semi-variance,RS+)和已实现负半变差(negative realized semi-variance,RS-).基于Barndorff-Nielsen等[12]的研究,Chen和Ghysels[13]提出了新的HAR-S-RV-J波动率模型,其实质是按照正负半变差的做法,将HAR-RV-J模型中的RV进行分解得到.然而,就目前所掌握的国内外文献来看,鲜有文献对HAR-RV-CJ和HAR-RV-TJ模型按照符号收益率的思想进行进一步的挖掘和拓展.而HAR-RV-CJ和HAR-RV-TJ不论是在模型的拟合还是预测方面均有较好的表现.鉴于此,借鉴Barndorff-Nielsen等[12]和Chen和Ghysels[13]的研究思路,对HAR-RV,HAR-RV-CJ和HAR-RV-TJ模型进行了类似的分解,构建了新的波动率模型,然后对比各种新旧HAR-RV类模型对我国股票市场波动率的预测能力.另外,Patton和 Sheppard[14]在已实现正负变差的基础上,提出了“符号跳跃变差”(signed jump variation,SJV)的概念,并将其作为解释变量加入到HAR-RV模型中,实证发现了SJV与未来波动率存在显著的负向关系.同理,借鉴Barndorff-Nielsen等[12]和Patton和Sheppard[14]的方法,本文分别结合Z 和C_TZ跳跃识别检验提出了两种新的含跳跃的符号变差,研究它们对未来不同未来期限波动率的影响,并进一步评价它们对新旧波动率模型预测能力的影响.基于以上认识,本文的研究目的及特色在于:1)基于收益率的符号性和Chen和Ghysels[13]的思想,首次将HAR-RV,HAR-RV-CJ和HAR-RV-TJ模型进行类似的分解,构建新的HAR-RV类波动率模型;2)借鉴Barndorff-Nielsen 等[12]和Patton和 Sheppard[14]的方法以及Z和C_TZ跳跃识别检验,本文提出了两个含跳跃识别检验的符号跳跃变差,并实证研究它们对现有波动率模型预测能力的影响.一方面,本文新提出的符号跳跃变差扩充了现有符号跳跃变差的视角,另一方面,也为提升波动率模型的预测能力找到了新的解释变量;3)运用样本外滚动时间窗预测技术和“模型信度设定”(MCS)检验法[15]评价新旧波动率模型在不同期限(未来1天、5天和20天)上的市场波动预测精度.主要实证结果表明,基于C_TZ跳跃识别检验的符号跳跃变差能够显著改善波动率模型的短期预测能力,然而在中长期波动预测时,新旧符号跳跃变差则表现欠佳;本文新提出的HAR-S-RV-TJ-TSJV模型和HAR-S-RV-TJ模型分别在对短期和中长期的波动预测检验中,展现出了最高的预测精度.1.1 HAR-RV模型根据二次变差理论,可以得到收益率的二次变差过程为其中r是收益率.当抽样间隔Δ无限趋近于0时,则有其中RVt表示为第t天的已实现波动率(realized volatility,RV),定义为金融资产日内高频收益率的平方和.如果将1天的交易时间表示为1,即有在异质市场假说的基础上,Corsi[6]构建了异质自回归已实现波动率模型(heterogeneous autoregressive model of realized volatility,HAR-RV),该模型的表达式为RVt+h= c+βdRVt+βwRVWt+βmRVMt+ωt+h其中h表示不同的预测区间(常用的有未来1天、5天和20天等);ωt+h表示随机扰动项;RVt,RVWt 及RVMt分别表示日,周及月已实现累积平均波动率.值得注意的是,本文选用过去20天已实现波动率的平均数作为计算月累积平均已实现波动率(RVM),而非国外学者采用的22天,主要是因为上海证券交易所的总交易天数大概在240天左右,即平均每月的交易日约20天.1.2 带跳跃的高频波动率模型在抽样间隔Δ无限趋近0时,式(2)中的(integrated variance)可以用已实现二次幂变差(realized bi-power variance,BPV)测度,其定义为σ2(s)ds其中u1 =(2/π)0.5 ≃ 0.797 9.根据式(2),式(3)和式(5)有由式(6)得到的跳跃成分可能出现负值,为了保证跳跃的非负性,最终定义跳跃成分为Jt=max(RVt-BPVt, 0)Andersen等[9]将跳跃成分作为解释变量加入HAR-RV模型中,构建的HAR-RV-J模型表示为RVt+h= c+βdRVt+βwRVWt+βmRVMt+βjJt+ωt+h进一步,由于在非参数的已实现波动率研究中对跳跃相对关注较少,因此,Andersen等[9]在Huang和Tauchen[10]提出的Z跳跃识别检验和HAR-RV-J 的基础上,构建了HAR-RV-CJ模型RVt+h= c+βdCRVt+βwCRVWt+βmCRVMt+βjCJt+ωt+h其中CRVt和CJt计算方法如下CRVt,α= I(Zt≤Φα)RVt+I(Zt>Φα)BPVtCJt≡I(Zt>Φα)[RVt-BPVt]式(10)和式(11)中的Φα表示标准正态分布的上1-α分位数;I(·)为指示函数,即当满足条件时,I(·)取值为1,否则取值为0.CRVWt和CRVMt分别表示为累积平均周和月的CRVt.Z统计量的计算方法可参阅文献[10].然而,Corsi等[11]的研究指出,当高频数据中跳跃连续出现的频率很高时,Huang和 Tauchen[10]的Z统计量有可能检测不出一些跳跃.因此,他们基于修正的已实现门限多次幂次C_TMPV构建了修正的Zt统计量,记为C_TZt.进一步,Corsi等[11]通过蒙特卡洛模拟发现,当不发生跳跃时,Zt和C_TZt统计量具有相同的检测能力;而当存在跳跃时,尤其是出现连续跳跃时,C_TZt统计量的检测能力显著高于Z统计量.这里C_TMPV定义为C_TMPVt[γ1,…,γM]=式中γ1,…,γM是任意正数;ϑt为随机的门限函数,且有其中的为标度常数(通常取值为3),为波动率的辅助估计量;Zγk的具体函数形式可参阅文献[11].基于修正的已实现门限多次幂C_TZt的统计量为其中由式(12)的定义有,修正的已实现门槛二次幂变差修正的已实现门槛三次幂变差等[11]还证明了当抽样间隔Δ→0,C_TZt统计量渐进服从标准正态分布.根据C_TZt跳跃识别检验,重新定义显著性跳跃成分(TJt)为TJt≡ I(C_TZt>Φα)×[RVt-C_TBPVt]同样,定义连续样本路径成分为TCRVt,α= I(C_TZt≤Φα)RVt+I(C_TZt>Φα)C_TBRVt借鉴Andersen等[9]的思想,Corsi等[11]构建的新的高频波动率模型(HAR-RV-TJ)为RVt+h= c+βdTCRVt+βwTCRVWt+βmTCRVMt+βjTJt+ωt+h1.3 拓展的高频波动率模型Barndorff-Nielsen等[12]基于日内收益率的正负性(符号收益率,signed return)提出了新的波动率估计量—“已实现半变差”(realized semi-variance,RS).进一步,根据收益率的正负号可以将RS区分为“已实现正半变差”(RS+)和“已实现负半变差”(RS-),其相应的计算公式为式中I(·)为指示函数.由式(17)和式(18)可以看出,已实现波动率(RV)可以表示为已实现正半变差(RS+)和已实现负半变差(RS-)之和,即有RV= RS-+ RS+.进一步,Barndorff-Nielsen等[12]证明了当抽样间隔Δ→0时,满足从式(19)和式(20)可以看出,已实现正半变差(RS+)包含了连续性方差和正向的跳跃变差,而已实现负半变差(RS-)包含了连续性方差和负向的跳跃变差.Chen和Ghysels[13]利用已实现正负变差的思想,构建了新的波动率模型—HAR-S-RV-J,表示为βjJt+ωt+h式中RSW+,RSM+,RSW-及 RSM-分别表示正向周,正向月,负向周及负向月累积平均已实现波动率;Jt为式(7)表示的跳跃成分.有意思的是,如果按照正负变差的思想分解HAR-RV-J模型,即为HAR-S-RV-J模型.因此,本文按照这个思路将HAR-RV,HAR-RV-CJ和HAR-RV-TJ模型进行类似的分解,从而构建新的基于符号收益的HAR类波动率模型.具体为:首先,按照正负变差的思想,将HAR-RV中右边的解释变量(RV,RVW和RVM)进行分解,得到了如下新的HAR-S-RV模型βm+ωt+h进一步,就国内外已有文献来看,还没有研究结合正负变差的思想将HAR-RV-CJ 和HAR-RV-TJ模型进行相应的分解或者拓展.然而现有很多实证研究发现,在模型的拟合优度和预测精度方面,HAR-RV-CJ和HAR-RV-TJ要明显优于HAR-RV 和HAR-RV-J模型.因此,本文按照构建HAR-S-RV-J模型的方法,构建新的HAR-S-RV-CJ和HAR-S-RV-TJ模型.需要注意的是,HAR-RV-CJ和HAR-RV-TJ模型中的解释变量(如CRV和TCRV等)绝非仅仅是涉及符号收益率,而还涉及到跳跃检验和已实现二次幂变差等的差异,因此,可以借鉴Barndorff-Nielsen等[12]的思想,将CRV进行如下分解I(Zt>Φα)BPVtI(Zt>Φα)BPVt不难得到因此,本文构建的新HAR-S-RV-CJ模型如下βjCJt+ωt+h同理,将TCRV进行类似分解I(C_TZt>Φα)C_TBPVtI(C_TZt>Φα)C_TBPVt由此可以构建名为HAR-S-RV-TJ的新的波动率模型βjTJt+ωt+h值得注意的是,Patton和Sheppard[14]在已实现正负变差的基础上,提出了符号跳跃变差(signed jump variation,SJV)的概念,其定义如下基于上述思想,根据式(23)至式(27),构建以下2种新的符号跳跃变差,分别记为CSJV和TSJV基于以上分析,不但可以比较基于符号收益率的新波动率模型(HAR-S-RV,HAR-S-RV-CJ和HAR-S-RV-TJ)与传统HAR-RV类模型的优劣,而且还能研究新旧符号跳跃变差(SJV,CSJV和TSJV)对不同高频波动率模型的估计和预测能力影响.2.1 基准波动率确定和滚动预测方法Andersen和Bollerslev[1]发现传统研究中多采用日收益率的平方作为日波动率的代理变量,这种做法将面临严重的测量误差和噪声.而基于高频数据的已实现波动率(RV)则可以有效地降低这些误差和噪声对真实潜在波动率的影响.因此,本文也采用已实现波动率作为评价各种高频波动率模型预测表现的基准,另外,其他我国学者也采取类似的做法,比方说,魏宇等[16],杨科和陈浪南[17].对第1节中探讨的各种高频波动率模型的预测方法,本文选择采用向前一步(或者多步)的样本外(out-of-sample)滚动时间窗(rolling time windows)技术.一方面,有学者发现样本内拟合优度的检验往往会受到数据挖掘偏误的影响,而样本外的滚动预测方法则可以规避此类偏误所造成的问题;另一方面,Egorov等[18]指出对计量模型优劣的判断不是看其在样本内对数据拟合的好坏,而是要看其样本外的预测能力.滚动预测的具体步骤如下:第1步,将数据样本总体划分为“估计样本”(sample for estimation)和“预测样本”(sample for forecasting)两部分;第2步,选取某一固定长度的数据作为第1次的估计样本,分别对上述各种波动率模型的参数进行估计,然后在此估计基础之上,运用递推法获得未来h(=1、5和20)天的波动率预测值;第3步,保持估计样本的时间区间长度不变,将估计时间区间向后平行移动1天,然后重复第2步的内容.以此类推,直到得到预测样本中最后一天的波动率预测值.本文选择滚动的固定时间窗长度为1 000天*选择不同长度的滚动时间窗的实证结果基本一致,如果需要,作者可以提供不同样本长度上的模型检验结果,如预测样本长度为482天,582天以及882天等..2.2 样本外波动率预测评价方法到目前为止,学术界还不清楚用哪一种损失函数(loss function) 作为衡量预测偏差的标准最为合理.最近,Patton[19]的研究表明QLIKE函数相比其他损失函数更具有稳健性.类似结论还可参见Corsi等[11],Patton 和Sheppard[14]及Rossi 和Fantazzini[20]的相关研究.因此,本文也选择QLIKE函数作为衡量各类HAR 模型预测精度的检验标准式中RVt是t时刻的真实市场波动率;为各模型对t时刻的波动率预测值;M是预测样本的总长度.需要指出的是,如果在一次实证中发现采用某种损失函数作为判断标准,得到了模型甲比模型乙的预测误差值小的话,那么只能判断:“在这样一个特定的数据样本中,采用这一特定的损失函数时,模型甲比模型乙的预测精确度高”.很明显,这一判断是不稳健的,且无法推广到其它类似的数据样本或者其它的损失函数判断标准.为了解决波动率模型优劣的错误判断问题,增强论文结论的稳健性,本文采用“模型可信集”(model confidence set,MCS)方法[15]来评价各种HAR类模型的预测表现.MCS检验是在一组预测模型组成的集合M0中进行一系列的显著性检验,剔除集合M0中预测能力较差的模型.因此,在每一次检验中,零假设都是M0中的某两个模型具有相同的预测能力,即为H0,M: E(di,uv)=0,所有u,v∈M⊂M0式中di,uv是模型u和v在损失函数i下的差值,利用等价检验(equivalence test,δM)和剔除准则(elimination rule,eM),对模型集中的模型进行持续检验,直到没有模型被剔除出该集合为止.本文采用较为常用的范围统计量(range Statistic)和半二次方统计量(semi-quadratic Statistic)作为实证检验准则,其定义分别为如果统计量TR,TSQ大于给定的临界值,表明拒绝零假设.由于统计量TR和TSQ 的渐近分布依赖于“厌恶参数”(nuisance parameters),因此它们的真实分布非常复杂.实证中,统计量TR,TSQ及相应的p值可以通过“自举法”(bootstrap)获得3.1 样本数据及其描述性统本文研究的数据样本为沪深300股价指数从2008年1月1日~2014年12月31日的每5 min高频数据(剔除节假日等,N=1 702个交易日),数据来源于“国泰安CSMAR股票市场高频数据库”. 如前所述,本文选择滚动的固定时间窗长度为1 000天,以未来h=1天的波动率预测为例,则每个模型可得到682个样本外预测值*本文实证样本总长度为1 702天,在模型进行估计时,剔除了前20天的数据,因为前20天累积平均月已实现波动率缺失.从表1可以看出:无论是已实现波动率,还是跳跃及符号变差序列,普遍表现出了显著的“有偏”(skewed)和“尖峰”(leptokurtic)形态;另外,Jarque-Bera 统计量表明各序列都不符合正态分布;在滞后5、10和20期内,大多数相关序列都具有显著的自相关特征.即已实现波动率、跳跃及符号变差等都存在较为显著的长记忆特征;进一步,ADF单位根检验结果表明,各序列都显著拒绝了存在单位根的原假设,表明各序列都是平稳时间序列,进而可以直接作下一步的计量建模.3.2 样本外预测表现评价3.2.1 基于符号收益视角的HAR类波动率模型对比各类高频波动率模型对未来h天(h=1,5和20)的市场波动率预测方法如2.2节所示.首先,图1展示了HAR-RV,HAR-RV-J,HAR-RV-CJ和HAR-RV-TJ这4种传统模型在预测样本区间内(n=1,2,…,682)未来1天的市场波动率预测结果.其次,图2是在考虑符号收益率的基础上,本文新提出HAR-S-RV、HAR-S-RV-CJ、HAR-S-RV-TJ与Chen和Ghysels[13]的HAR-S-RV-J模型对样本外未来1天的波动率的预测结果*为了节省篇幅,文中没有给出未来5天和20天的波动率预测图形.如有需要,可以联系作者索取..图中的实际市场波动率(RV)用小圆圈表示. 从图1和图2可以看到:新旧波动率模型都具有较强的预测能力,即使市场发生大幅波动时,仍能较好地预测出该时段内的市场波动状况.需要强调的是,本文采用的是滚动时间窗的“样本外预测能力检验”,即每次滚动样本估计的各类波动率模型的参数值是时变的.因此,这种方法不仅可规避数据挖掘偏误的影响,还可以进一步保证结论的稳健性.接下来,本文运用更为严谨科学的MCS统计检验方法来评价各类新旧HAR类模型的预测表现.表2是4种传统HAR类模型和4种考虑符号收益性的新HAR类模型在不同样本外预测期限(h=1,5和20)的损失函数值.表中加粗的数值表示的是在某一损失函数下,得到的最小预测误差值.从表2的实证结果发现,新构建的HAR-S-RV-TJ模型相比其他波动率模型不仅在预测短期(1天)波动率方面具有更好的预测表现,而且在预测中长期亦是如此.因此,HAR-S-RV-TJ模型的预测能力不仅具有较为明显的优势,而且具有稳健性.但正如在2.2节中所讨论的那样,如果要得到更加稳健和适用范围更广的结论,则必须对这一预测结果进行进一步的MCS检验.为了得到MCS检验的p值,参照Hansen 和Lunde[15]、Rossi和Fantazzini[20] 以及Martens等[21]的做法,这里采用模拟次数10 000次作为Bootstrap过程的控制参数.同时,MCS检验的显著性水平α取值为0.1,则p值小于0.1的波动率预测模型是样本外预测能力较差的模型,将在MCS检验过程中被剔除;而p值大于0.1的波动率预测模型则是样本外预测能力较好的模型,在MCS检验中能幸存下来.显然,如果p值等于1,则表明该模型是比较模型集合中最优的波动率模型.从表3的实证结果可以看出:1)在短期波动率(h=1天)预测时,不论是现有的HAR波动率模型还是本文新构建的考虑符号收益特征的波动率模型,基本上都通过了MCS检验(p>0.1),即表明它们都具有较好的短期波动预测能力.但在预测中长期(h=5天和20天)波动率时,各模型的表现出现了明显分化:其中,在中期波动率预测时,只有本文新提出的HAR-S-RV-TJ模型在MCS检验中得以幸存,而在长期波动率预测时,HAR-RV、HAR-S-RV、HAR-RV-CJ、HAR-S-RV-CJ、HAR-RV-TJ模型均未通过检验.上述实证结果表明,本节考虑的传统HAR-RV类模型和基于符号收益的新HAR-RV类模型的预测能力在不同预测期限上存在显著差异.在对不同期限的波动率进行预测研究时,必须审慎考察所选取的模型表现,避免经验主义的干扰.2)综合3个不同预测期限的检验结果来看,本文提出的HAR-S-RV-TJ模型具有更高的预测精度(所有预测区间上的p检验值均为1).这也说明了考虑符号收益特性的HAR-RV类模型在理论上和实证上确实比现有传统HAR-RV类模型具有更好的预测能力.3.2.2 基于符号跳跃变差(SJV)视角的HAR类波动率模型对比探讨基于不同跳跃检验构建的新旧符号跳跃变差(SJV)对波动率模型预测精度的影响.Patton和Sheppard[14] 在已实现半变差(realized semi-variance)的基础上,提出了符号跳跃变差(SJV,如式(29)所示)的概念,并将其作为解释变量加入到HAR-RV模型中,实证发现了SJV对未来波动率的预测精度具有显著影响.进一步,Sevi[22]用SJV替换显著性跳跃成分(CJ,如式(11)所示),也考察了SJV对未来波动率预测的影响.在上述研究基础上,本文利用Z和C_TZ跳跃识别检验分别构建新的符号跳跃变差(CSJV和TSJV,如式(30)和式(31)所示),并进一步将其分别加入与之对应的HAR类模型.举例来说,对于HAR-RV-CJ模型,本文将按照Patton和 Sheppard[14]以及Sevi[22]的思路,用已实现二次幂变差BPV和符号跳跃变差CSJV替代原模型中的连续样本路径(CRV,如式(10)所示)和跳跃成分(CJ,如式(11)所示),构建新的HAR-RV-CJ-CSJV波动率模型,如下所示RVt+h= c+βCSJVCSJVt+βBPVBPVt+βwCRVWt+βmCRVMt+ωt+h同理,这里运用SJV、CSJV和TSJV对3.2.1节中讨论的8类不带符号跳跃变差的HAR-RV类模型进行了如式(35)所示的模型扩展.限于篇幅,这里没有一一展示各类扩展模型的具体设定形式.表4给出了8种对应的加入符号跳跃变差的波动率模型在总体样本内的估计结果(h=1).从表4的实证结果可以看出,βSJV,βCSJV和βTSJV的参数估计结果都显著小于零,这也表明无论是Patton和Sheppard[14]的符号跳跃变差(SJV)还是本文新提出的符号跳跃变差(CSJV和TSJV),对下一期的已实现波动率都具有显著的负向影响* 对于h=5和h=20,模型估计结果大致相似,尤其是符号跳跃变差部分,也对未来已实现波动率存在显著的负向影响.如果需要,作者可以提供估计结果..表5给出了基于符号跳跃变差的HAR-RV类模型在不同预测区间的MCS检验结果.从表5可以看出:在预测短期(h=1天)已实现波动率时,HAR-S-RV-TJ-TSJV模型具有更好的预测精度;然而,在中长期波动率(h=5天和20天)预测时,HAR-RV-J-SJV模型的表现最优.值得注意的是,上述两个最优预测模型中都含有符号跳跃变差成分(TSJV和SJV).因此,这也表明无论是在预测短期还是中长期市场波动时,符号跳跃变差都有助于提升模型的预测精度.进一步,结合表3和表5(共16种HAR类模型)的实证结果,在不同的预期期间上,选取其中通过MCS检验的模型再进行进一步的预测精度对比.结果如表6所示.首先,在预测未来1天的市场波动时,HAR-S-RV-TJ-TSJV模型具有最好的预测表现.由于该模型是由本文新提出的符号跳跃变差(TSJV)和新构建的HAR-S-RV-TJ 模型组合而成,因此表明本文提出的符号跳跃变差(TSJV)有助于提高对我国股票市场短期波动率的预测精度;其次,对于中长期(h=5天和20天)的波动率预测而言,本文提出的基于符号收益特性的HAR-S-RV-TJ模型也表现出了更高的预测精度.因此可以认为,考虑符号收益率(signed return)和显著连续跳跃(TJ)的组合模型更加适合对我国股市中长期的波动刻画;最后,可以看到3个不同预测区间的幸存模型数量和种类都表现出明显差异,这也表明了对我国股市不同期限的最优波动预测模型并非一成不变.因此,在波动预测理论研究和市场实务操作中,需要谨慎选取不同类型的波动率模型,避免经验主义和主观臆断对预测结果的不利影响.如何提高波动率的预测精度一直是金融学术界和实务界亟待攻克的难点问题.近十多年来,基于高频交易数据的各种波动率模型在此领域取得了令人瞩目的进展.其中,HAR-RV类模型凭借其简单的模型设定形式和更优的实证预测精度,更是引起了学术界和实务界的广泛关注和应用(Andersen等[9],Corsi等[11],Sévi[22],文凤华等[23],陈浪南和杨科[24],Wang等[25],Bollerslev等[26]).因此,本文。
基于QR-m-GARCH(1,1)-GED模型的人民币汇率隔夜风险测度
基于QR-m-GARCH(1,1)-GED模型的人民币汇率隔夜风险测度张建文;唐国强;杨静凌【期刊名称】《桂林理工大学学报》【年(卷),期】2021(41)4【摘要】将GARCH类模型与分位数回归(QR)模型的组合模型应用于人民币汇率隔夜风险的研究,同时考虑美元指数对其产生的影响。
首先,进行格兰杰Granger因果关系检验,发现美元指数是人民币汇率隔夜收益率的Granger原因;其次,将美元指数作为人民币汇率隔夜收益率的解释变量加入GARCH类模型的均值方程中,根据信息准则从中选出最优的模型;最后,将选出的m-GARCH模型与分位数回归模型进行组合,建立QR-m-GARCH(1,1)-GED模型对人民币汇率隔夜收益率序列进行风险测度。
实证结果表明:美元指数价格走势对人民币汇率有引导作用;模型中加入美元指数,数据拟合效果更优;在高显著性水平下,QR-m-GARCH(1,1)-GED模型度量风险的准确率更高。
因此,投资者在规避人民币汇率风险时,要注意美元指数的价格走势。
【总页数】8页(P918-925)【关键词】隔夜风险;美元指数;分位数回归;VAR【作者】张建文;唐国强;杨静凌【作者单位】桂林理工大学理学院【正文语种】中文【中图分类】F224;F832.5【相关文献】1.基于GARCH-EVT模型的人民币汇率风险测度研究2.人民币即期汇率与NDF汇率之间的溢出效应——基于MA(1)-TARCH(1,1)模型的实证研究3.基于分位数回归模型的人民币汇率风险测度方法研究4.基于VaR-EGARCH(1,1)-GED的商业银行汇率风险度量研究5.基于双线性GARCH-VaR模型的人民币汇率风险测度因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
DR t = ( max{ r t, j } - min { r t, j} )
2
本文选取 2005 年 4 月 16 日至 2011 年 8 月 23 日沪深 300 指数 5 分钟高频数据( 剔除掉数据不完整的交 易日, 最后得到 1553 个交易日数据, 每个交易日 48 个观测数据, 总共 74544 个观测数据) 作为研究样本, 利用 ( 3) 、 ( 4 ) 和( 5 ) 式, 分别估计了日内连续性波动、 跳跃性波动、 日内最大变差、 收市前 5 分钟的已实现波动和最 大变差( 抽样频率 M = 48, 控制参数 珚 ω = 0. 49) ( 所有数据来源于 wind 数据库) 。估计结果见图 1 和表 1。
DOI:10.14120/11-5057/f.2014.02.005
经济与金融
隔夜风险可以预测吗 ? — — — 基于 HAR-CJ-M 模型的高频数据分析
李彩云 ( 1. 华中科技大学经济学院, 武汉 430074; 2. 大连商品交易所研究中心, 大连 116023) CJM 模型框架下研究了沪深 300 指数隔夜风险的动态特征、 摘要: 本文在新的 HAR影响因素 , BNS , ACH 以及可预测性 利用 方法将日内波动分解为连续性波动和跳跃性波动 并运用 模型 估计发生跳跃的意外性程度, 进而采用最小二乘和分位数回归方法估计日内波动率指标和跳跃 的意外性程度对隔夜风险的影响。研究结果表明, 日内连续性波动、 跳跃性波动和隔夜风险的 滞后项都会显著地影响隔夜风险, 且存在不对称效应; 日内跳跃 对 大的隔夜风险的影响 非常显 CJM 模型很好地预测大的隔夜风险。 著, 且可以利用 HARS 方法; 跳跃性波动 关键词: 隔夜风险; 意外性程度; BN简志宏
经济与金融
CJ 模型框架下研究连续性波动和跳跃性波动的杠杆效应时发现 , 进的 HAR连续性波动和跳跃性波动的杠杆 [8 ] RV 模型 且跳跃性波动可以显著地影响未来的日内波动。 张小斐和田金方 在 HAR效应都是显著存在的, LM 模型, 中引入投资者心理和市场交易机制 , 构造了新的 HAR并利用该模型讨论了不同市场的异质性程 度, 从不对称效应的这一角度考虑了投资者心理对未来波动率的影响 , 但他们没有考虑资产价格大幅波动的 情形, 忽略了资产价格过程中的跳跃对未来波动率的持续影响 。 由于过去和现在发生跳跃的频率和规模都可能会影响投资者对未来交易日中发生跳跃的预期 , 且在不同 “意外性” , 可能不同。为了构造跳跃的“意外性指标 ” 需要估计投资者对下一期发生跳跃 预期下跳跃产生的
1 2
引
言
金融市场上, 投资者的投资风格各异, 持有头寸的时间长短不一, 如果收市前持有头寸未平仓, 投资者就 可能面临隔夜损益, 这种潜在隔夜损益的不确定称为隔夜风险 。由于期货的高杠杆化交易 ( 股指期货 5 倍以 上杠杆, 商品期货 10 倍左右杠杆) 和休市期间停止交易, 持有隔夜头寸, 可能会给投资者带来巨大损失, 所以 对隔夜风险的深入研究就显得尤为重要 。 由于交易数据的缺乏, 对隔夜风险的研究受到了很大的限制。 文献中对日波动率 ( Daily Volatility ) 特征 [1 ] [2, 3 ] , , 的研究 一般忽略了隔夜风险的影响 , 而将隔夜风险视为日内波动( Intraday Volatility) 的调整项 缺乏对 [4 ] 。 Andersen , , 隔夜风险动态特征与影响因素的研究 等 认为 虽然收市期间没有交易数据 但是隔夜收益所包 含的信息是不容忽视的。他们利用标准普尔 500 指数 15 年的高频数据, 分别讨论了日内收益和隔夜收益对 日波动率的影响, 发现日内收益和隔夜收益的区别处理可以提高对日波动率的预测精度 。 Corsi 首次提出了 HARRV 模型, 为了刻画日波动率的动态特征, 由于模型形式简单且很好地刻画了波 HARRV 模型得到广泛的应用。 HARRV 模型考虑了波动率的异质 动率的特征( 长记忆、 厚尾和自相似 ) , 性, 但它没有区分连续波动和跳跃波动的不同影响 , 忽略了波动率的杠杆效应, 也没有考虑投资者心理、 市场 [6 ] 交易机制和宏观政策干预等其他典型异质市场驱动成分的影响 , 而 Andersen 等 将日内波动分解成连续性 CJ 模型的框架下研究了不同的日内波动信息对日波动的影响, 波动和跳跃性波动, 在 HAR发现所有的日波 Corsi[7] 在改 动、 周波动和月波动的可预测性几乎都来自于连续性波动部分 , 而跳跃性波动的可预测性很差,
经济与金融
RV t → QV t =
Ρ Ρ
∫
t t-1
Nt
σ ( s) ds +
2
2 κ ( t) , ∑ = j 1
BV t → IV t =
∫
t+1 t
2 σ( s) ds
N t 表示在有限时间区间[ 0, T] 其中, 内发生跳跃的总次数。 由于 BV t 统计量在有限样本情况下会高估连续性波动 , 低估了跳跃性波动, 低估了跳跃性贡献, 所以 Mancini[13]利用阈值修正的统计量 CV t 来估计连续性波动 ② , 连续性波动 CV t 定义为:
日内波动率与跳跃意外性的度量
1、 日内波动率指标构造 为了研究日内 波 动 对 隔 夜 风 险 的 影 响 , 需 要 选 取 一 些 能 够 从 不 同 角 度 反 映 日 内 波 动 的 指 标。 按 照 [6 ] [7 ] Andersen 等 和 Corsi 等的研究思路, 我们首先构造了日内连续性波动 CV t 和跳跃性波动 JV t 这两个最常用 “上影线” “下影线” 的指标; 由于技术分析中, 例如 K 线理论, 经常使用 和 来预测资产价格的未来走势, 所以本 文进一步考虑了日内最大变差 DR t 的影响; 如果将隔夜风险看成收市前 5 分钟波动率的延续, 那么收市前 5 分钟已实现波动 FRV t 和极差 FRRV t 对隔夜风险的影响就不容忽视。 为了构造日内波动率指标, 我们需要对资产价格过程进行适当的假设 。 经典金融计量理论认为, 在满足 无套利假设的情况下, 股票价格路径轨道应该是连续的 , 所以一般将其假设为一个连续时间半鞅过程 。然而, 大量实证研究表明, 金融资产价格中普遍存在跳跃成分 , 所以假设资产对数价格服从如下过程 : dp( t) = μ( t) dt + σ( t) dw ( t) + κ( t) dq( t) ( 1) 其中 μ( t) 表示漂移项, 是一个有界变差过程; σ( t ) 表示瞬时波动率, 是一个 cadlag 过程; w ( t ) 表示标准布朗 = 运动; κ( t) dq( t) 表示纯跳过程, 如果跳跃发生 dq( t) 1, 否则等于零, κ( t) 表示跳跃规模。 = - + - - + - p( t 1 j / M ) p ( t 1 ( j 1 ) / M ) , j = 1, 2, ... , M, M 表示观测次数。 已实现 第 t 日离散化收益表示为: r t, j 波动 RV t 和二幂次变差 BV t 可以分别定义为:
MANAGEMENT ( 2014 ) 5 MANAGEMENTREVIEW REVIEW Vol.26 Vol.25 No.02 No.02 ( 2013)
经济与金融
图 1 的估计结果显示, 日内跳跃性波动与隔夜风险具有非常一致的动态特征 , 特别是当日内发生较大跳 跃时, 一般都伴随着较大的隔夜风险; 当隔夜风险较小时, 连续性波动与隔夜风险具有一定的一致性 。而其它 的日内波动率指标的动态特征与隔夜风险基本不具有一致性 。表 1 的估计结果显示,1553 个交易日中总共 发生了 728 次跳跃, 日内最大跳跃次数为 3 次, 期间有 700 个交易日发生了跳跃, 且有 27 个交易日发生了多 发生正的跳跃次数为 340 次, 发生负的跳跃次数为 360 次, 总的跳跃贡献为 23. 17% ③。 以上数据表 次跳跃, 明, 虽然沪深 300 指数发生跳跃的频率不到 1% ( 728 /74544 = 0. 98% ) , 但是这种跳跃现象是普遍存在的 ( 大约 有 45% 的交易日发生了跳跃) , 且对日内波动率波动的贡献远大于 1% 。 2、 跳跃意外性指标的构造 跳跃作为一种极端事件, 其发生的规模可能影响隔夜风险 , 同样, 其发生的频率和时间可以影响投资者的 ④ 可以直接估计沪深 300 指数发生跳跃的规模 , “已实现方法 ” 进而影响隔夜风险。通过上文的 却 心理预期, 无法估计跳跃对投资者心理预期的影响 , 所以本文需要构造一个反映投资者预期变化的指标 。 t1 , …, tn , …} 表示发生跳跃的交易日, 假设{ t 0 , 那么两次跳跃的间隔天数可以定义为 d i = t i - t i-1 。 我们将 N( t - 1) 定义为第 t 个交易日之前发生跳跃的次数, N( t) ≠N( t - 1) | 那么第 t 个交易日发生跳跃的概率 h t = p[
2 dq( t) = 0, 1 ① ; 在研究隔夜风险的动态特征、 κ( t) dq( t) , ε t ~ N( 0, σt ) , 影响因素以及可预测性时, 同时考虑了
[10 ]
日内波动率的规模和预期的影响。 由于隔夜风险并不具有日内波动的长记忆特征, 刻画日内波动的 HARHARCJ 和 LHARCJ 模型都不完全适合用于研究隔夜风险的动态特征, CJ 模型的基础 RV、 因而本文在 HARCJM 模型。 上提出了新的 HAR下文首先构造反映日内波动率信息的指标和反映投资者预期的意外性指标, 然后结合隔夜风险的动态特 CJM 模型, 征, 给出改进的 HAR进一步利用 OLS 和分位数回归( Quantile Regression ) 方法估计各因素对隔夜风 CJM 模型的样本外预测能力, CJM 模型预测大的隔夜风险的能力。 险的影响, 最后检验 HAR重点考察 HAR-