金融高频时间序列分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、“已实现”双幂次变差的概率极限 、 已实现”
Barndorff-Nielsen和Neil Shephard指出在不存在跳跃和存在有限 次跳跃的条件下,当s=2-r时,都有下式成立 :
M →∞
lim µ µ
−1 r
−1 2−r
RBV t
[r , 2 − r ]
→
∫
ht
h ( t −1)
σ u2 du
4、“已实现”波动的应用 、 已实现” “已实现”波动无模型、计算方便、并且是金融波动 率的一致估计量,“已实现”波动在多变量的情形 下还可以扩展为“已实现”协方差矩阵(Realized Covariance Matrix,RCM),它不仅包括各变量自 身的“已实现”波动率,也包括变量之间的“已实 现”协方差。因此,“已实现”波动近年来被广泛 应用于金融高频数据的应用研究中。 如:VaR的计算;资产定价研究;运用“已实现” 波动理论构建“已实现”Beta并对“已实现”Beta 的持续性和预测进行研究;进行动态投资组合研究 等。
5、“已实现”波动估计量形式的改进及扩展 、 已实现”
赋权 偏差校正
(二)“已实现”双幂次变差(Realized Bipower Variation,RBV)
1、“已实现”双幂次变差的概念 、 已实现” 2、“已实现”双幂次变差的概率极限 、 已实现” 3、“已实现”双幂次变差统计性质的实证研 、 已实现” 究
3、“已实现”波动的性质 、 已实现”
根据Andersen和Bollerslev等(2000,2001,2001,2003)对西方国家 发达金融市场的高频金融时间序列的研究,“已实现”波动通常具有下 列性质: (1)由于日内高频收益率之间存在序列相关和异方差性,所以“已实 现”方差(Realized Variance)与“已实现”标准差(Realized Standard Deviation)的无条件分布都是极端右偏,而且具有极高的峰度。 但是“已实现”标准差的偏度要比“已实现”方差的低; (2)虽然“已实现”标准差的无条件分布都是极端右偏,而且具有极 高的峰度,但是“已实现”标准差取对数后的无条件分布却很近似正态 分布; (3)虽然日间收益率的无条件分布并非正态分布,具有明显的“高峰 厚尾”性,但是日间收益率除以“已实现”标准差后的条件分布却近似 是正态分布; (4)以上三条性质都是针对每日的“已实现”波动而言的,然而对 “已实现”波动的时间聚合性质的研究,即对每周,每两周,每三周及 h 2 d +1 每月的“已实现”波动的研究中发现:在时间聚合下,“已实现”波动 的方差按 的尺度增长,其中表示时间跨度,d是常数; (5)“已实现”波动的自相关系数按双曲线的速率缓慢下降; (6)“已实现”波动取对数后的无条件分布是正态分布,具有显著的 分数维单整的性质。
1、“已实现”双幂次变差的概念 、 已实现”
Barndorff-Nielsen和Neil Shephard 提出“已实现”双幂次变差 (RBV)的定义为:
RBV
[r , s ]
t
h ≡ M
1− ( r + s ) 2
∑
M −1 j =1
r
y j ,t
y j +1 ,t
s
r, s ≥ 0
表3-3 r=s=1时深证成指在各个抽样频率下的统计量特征
r=s=1 RBV
RBV
ln
RBV
yt/
RBV
偏度 1分钟 峰度 J-B统计量 偏度 5分钟 峰度 J-B统计量 偏度 10分钟 峰度 J-B统计量 偏度 30分钟 峰度 J-B统计量 偏度 J-B统计量
5.3672 42.942 17022 5.7225 49.585 22900 3.4994 21.033 3719.7 4.3444 31.562 8865.5 2.8838 1399.9
通过对中国股市的深证成指和上证综指的高 频金融时间序列的研究,从图3-1至3-30和表 3-1至3-8中得到的“已实现”双幂次变差的 统计性质,同Andersen和Bollerslev等对西方 国家发达金融市场的高频金融时间序列的研 究得到的“已实现”波动的性质是基本一致 的。
(三)RV与RBiblioteka V的比较研究 与 的比较研究2.6652 14.504 1596.5 2.3983 13.334 1288.6 1.6067 7.2891 284.36 1.5312 7.9326 333.68 1.3386 116.76
0.99577 4.7518 69.367 0.50058 3.7223 14.868 0.26669 3.1843 3.0983 -0.1571 3.395 2.3514 0.00569 2.5718
“已实现”波动(Realized Volatility,RV)是Anderson和Bollerslev等人 基于金融高频时间序列提出的一种全新的波动率度量方法,该方法由于 具有无模型、计算方便、并且在一定条件下是波动率的一致估计量等优 点,近年来已被广泛应用于高频金融数据的研究中。“已实现”波动的 概念和方法,近年来也获得不断的改进和发展。“已实现”双幂次变差 (Realized Bipower Variation,RBV)是Barndorff-Nielsen和Neil Shephard提出的另一类似于“已实现”波动的波动率度量方法,该估计 量同样是波动率的一致估计量。 针对这两种文献中常被提及和讨论的有代表性的波动率估计方法,本节 在定义形式、估计量的稳健性、有效性 定义形式、 定义形式 估计量的稳健性、有效性等方面对这两个估计量进行了比 较,发现“已实现”双幂次变差的定义形式更广泛,除了具有稳健性, 本节还证明了“已实现”双幂次变差比“已实现”波动更有效。 通过对深证成指和上证综指的实证研究 实证研究,我们可以看出“已实现”双幂 实证研究 次变差的稳健性,同时也证实了“已实现”双幂次变差能更准确的估计 金融股市收益率的波动。
(二)金融数据 1、低频数据 、 二十世纪九十年代以前,人们对金融时间序列的研究都是针对日、 周、月、季度或者年度数据进行的,这种金融数据在金融计量学研究 领域通常称为低频数据。 2、高频数据 、 近年来,随着计算工具和计算方法的发展,极大地降低了数据记录和 存储的成本,使得对更高频率的金融数据进行研究成为可能。 在金融市场中,高频率采集的数据可以分为两类:高频数据(high frequency data)和超高频数据(ultra high frequency data)。 高频数据是指以小时、分钟或秒为采集频率的数据。高频数据即日内 数据,是指在开盘时间和收盘时间之间进行抽样的交易数据,主要是 以小时、分钟、甚至秒为抽样频率的、按时间顺序排列的时间序列。 3、超高频数据 、 超高频数据则是指交易过程中实时采集的数据。 高频数据和超高频数据两者之间的最大区别是:前者是等时间间隔的, 后者的时间间隔是时变的。 一般而言,金融市场上的信息是连续的影响证券市场价格运动过程的。 数据的离散采集必然会造成信息不同程度的缺失。采集数据频率越高, 信息丢失越少;反之,信息丢失越多。
(一)“已实现”波动(Realized Volatility,RV)
1、“已实现”波动的定义 、 已实现” 2、“已实现”波动的理论基础 、 已实现” 3、“已实现”波动的性质 、 已实现” 4、“已实现”波动的应用 、 已实现” 5、“已实现”波动估计量形式的改进及扩展 、 已实现”
1、RV的定义
金融高频时间序列分析
李胜歌
一、金融计量学 二、金融高频时间序列分析 三、基于高频数据的金融波动率
一、金融计量学
(一)金融定量分析 金融计量学,是经济计量学的一个重要分支, 金融计量学 主要是研究如何将经济计量学的基本原理与 方法运用于金融领域,针对金融数据的特殊 性,构造相应模型,以便实证检验金融理论 和假设或者提提供金融预测。
-0.0397 2.4683 3.1482 -0.001 2.4955 2.7909 -0.1021 2.6063 2.162 -0.165 2.3623 5.461 -0.129 3.3542
从表3-3至3-8中可以看出,无论r、s取何值,都可以得出 “已实现”双幂次变差具有如下的统计特性: (1)“已实现”双幂次变差与标准差的无条件分布都是极 端右偏,而且具有极高的峰度,但是标准差的偏度要比“已 实现”双幂次变差的低; (2)虽然“已实现”双幂次变差的标准差的无条件分布都 是极端右偏,而且具有极高的峰度,但是“已实现”标准差 取对数后的无条件分布在抽样频率不是很高时(10分钟以 上),却为正态分布; (3)虽然国内外的实证研究表明日间收益率的无条件分布 并非正态分布,具有明显的“高峰厚尾”性,但是日间收益 率除以“已实现”双幂次变差的标准差后的条件分布却近似 是正态分布(由J-B统计量)。
Andersen和Bollerslev提出 “已实现”波动(RV)的 定义为:
RV
t
≡
∑
M j =1
y 2 ,t j
t=1,2,…,T
2、“已实现”波动的理论基础 、 已实现”
基本条件就是金融市场中不存在风险套利的机会,这样金融 资产的对数收益率就是一个特殊半鞅过程。 由特殊半鞅的性质,又可以将其进一步分解为可料有限变差 过程和局部鞅过程,从经济意义上来讲,可料有限变差过程 和局部鞅过程分别代表均值过程(Mean Process)和新息 过程(Innovation Process)。 由二次变差的性质,收益率平方和的极限为金融资产对数价 格收益的二次变差; 再由伊藤定理,可以得到二次变差与积分波动(Integrated Volatility, IV)的对应关系。 “已实现”波动就是收益率的平方和,这样就可以得出“已 实现”波动的概率极限为积分波动。
图3-2 r=s=1时的深证成指的5分 图3-1 r=s=1时的深证成指的1分 钟 钟 “已实现”双幂次变差的自相关函 “已实现”双幂次变差的自相关函 数图 数图
当r=s=1时,从图3-1至3-5和图3-6至3-10中可以看到,深证 成指和上证综指在抽样频率分别为1分钟、5分钟、10分钟、 30分钟和60分钟的“已实现”双幂次变差时间序列的 “已实现”双幂次变差时间序列的150阶 阶 自相关函数,都是随着滞后阶数的增大而缓慢下降。 自相关函数,都是随着滞后阶数的增大而缓慢下降。当 r=1/2且s=3/2时,从图3-11至3-15和图3-16至3-20中,以及 当r=7/4且s=1/4时,从图21-25和图26-30中,可以看到深证 成指和上证综指在抽样频率分别为1分钟、5分钟、10分钟、 30分钟和60分钟的“已实现”双幂次变差时间序列的自相关 函数,也都是随着滞后阶数的增大而缓慢下降的。 同时,表3-1与表3-2中深证成指和上证综指分维数d的估计 值也都显著不为零。这说明“已实现”双幂次变差时间序列 这说明“已实现” 这说明 为长记忆时间序列,并且具有分数维特性。 为长记忆时间序列,并且具有分数维特性。
表3-3至3-5分别给出了当r=s=1时,当r=1/2且s=3/2 时,以及当r=7/4且s=1/4时,深证成指在1分钟、5 分钟、10分钟、30分钟和60分钟的抽样时间间隔下, “已实现”双幂次变差RBV、标准差、标准差取对 数以及用标准差将收益率标准化后的各个统计量的 偏度、峰度和J-B统计量。 表3-6至3-8则分别给出了当r=s=1时,当r=1/2且 s=3/2时,以及当r=7/4且s=1/4时,上证综指在1分 钟、5分钟、10分钟、30分钟和60分钟的抽样时间 间隔下,“已实现”双幂次变差RBV、标准差、标 准差取对数以及用标准差将收益率标准化后的各个 统计量的偏度、峰度和J-B统计量。
二、金融高频时间序列分析
对金融高频数据统计特征的研究 基于金融高频时间序列的波动性研究 微观结构噪声研究 最优抽样频率研究 基于高频数据的金融管理方面的应用研究
三、基于高频数据的金融波动率
(一)“已实现”波动(Realized Volatility,RV) (二)“已实现”双幂次变差(Realized Bipower Variation,RBV) (三)RV与RBV的比较研究 与 的比较研究
r ∈ ( 0, 2 )
µr = 2r 2
1 Γ ( ( r + 1)) 2 1 Γ( ) 2
Γ ( p ) 表示伽玛函数
3、“已实现”双幂次变差统计性质的实证研 、 已实现” 究
本节使用深证成指和上证综指两个市场的金融高频 数据来构建“已实现”双幂次变差,然后对该估计 量的特性进行实证研究。该高频数据是从2005.4.14 至2006.4.14深证成指和上证综指的1分钟间隔时段 内的收盘价,这期间共有243个交易日,共有 241×243=58563个数据。 “已实现”双幂次变差的参数r、s的取值只要满足 r+s=2,那么估计量的概率极限即为积分波动。因 此,不失一般性的,本文选取了r=s=1、r=1/2且 s=3/2、r=7/4且s=1/4时的“已实现”双幂次变差来 研究估计量的统计特性。