基于FIGARCH模型的证券波动率预测概要
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于FIGARCH模型的证券波动率预测
摘要
对波动率的研究一直是证券市场研究的重点之一,波动率作为衡量证券市场的风险典型的度量标准之一,对投资组合的选取、资产定价等方面起着决定性的影响。
这些年来,诸多学者运用ARCH、GARCH(广义自回归条件异方差)等模型对证券市场的波动率进行探究,得出了许多重要的结论。
然而,波动率实际上是具有持续性和长记忆性的特性的。
这种特性的存留对波动率的研究和预测产生着重大的作用。
本文将采用FIGARCH模型(分整GARCH 模型),并以证券市场典型的两个交易所—上海证券交易所和深圳证券交易所的指数收益率序列作为研究样本,在此基础之上估计波动率,并对其进行建模预测,并与GARCH模型对波动率的预测结果进行比较分析。
样本数据建模预测的结果呈现出长记忆的FIGARCH模型的预测能力优于短记忆的GARCH模型。
本文的正文部分主要由四个章节组成
第一章为引言部分。
主要介绍了波动率研究的背景、意义以及现在对波动率研究的现状,提出了本文的核心模型。
第二章为本文涉及的理论基础。
这一章节由四个小节组成:第一小节主要陈述了证券市场价格理论,股票价格是随机游走的以及证券市场的有效性;第二小节阐述了波动率的定义;第三小节详细的列出了金融时间序列的长记忆的概念和短记忆的概念;第四小节是本文涉及到的两个主要模型,GARCH(广义自回归条件异方差)模型和FIGARCH(分整GARCH)模型的定义、结构公式以及分别特性。
第三章为证券市场波动率的预测。
此章节为本文的核心章节,首先对数据进行了说明,本文选取了1997年1月1日至2007年12月31日上海和深圳两市每日的收盘指数作为样本;然后分别运用短记忆的GARCH模型和长记忆的FIGARCH模型对数据进行建模分析,通过R 软件编程得出波动率预测的结果;最后对两种模型预测的结果进行分析得出结论。
第四章为全文总结。
关键词:波动率;预测;GARCH模型;FIGARCH模型;
Abstact
Research on volatility has been one of focus in the study of the securities market, the volatility as a measure of the risk of the securities market, one of the typical metrics for portfolio selection and asset pricing plays a decisive influence. Over the years, many scholars use the ARCH and GARCH (generalized auto regressive conditional heteroscedasticity) model to explore the volatility in the securities market, a number of important conclusions are drawn. However, continuity and long memory of volatility is actually features. This feature of remaining on the research of the volatility and forecasting have a significant role. FIGARCH model is adopted in this
paper the GARCH model (points), and two typical in the securities market exchange, Shanghai stock exchange and Shenzhen stock exchange index yield sequence as the research sample, on this basis to estimate volatility, modeling and prediction, the prediction results of volatility with GARCH model for comparative analysis. Sample data modeling prediction results present a long memory of FIGARCH model's prediction ability is superior to the GARCH model of short memory. The text of this article is mainly composed of four chapters
I plase the introduction section on the first chapter. Mainly introduces the research background, significance and volatility is now the current situation of the research on volatility, in this paper, the core of the model is put forward.
The second chapter for this article involves the theoretical basis. This section is composed of four sections:the first section mainly stated the stock market price theory,the stock price is a random walk,and the effectiveness of the securities market;the second section expounds the definition of volatility-refers to the possibility of future prices deviate from the expectation;the third section of the detailed lists of long memory of financial time series and short memory;the fourth section is the paper involves two main model,GARCH model and FIGARCH model formula in the definition,structure and features.
The third chapter for the prediction of stock market volatility. The core section of this chapter for this article firstly illustrates the data,this article selects the January 1,1997 to December 31,2007,Shanghai and shenzhen two securities market closing index as sample; then respectively using GARCH model of short memory and FIGARCH model of long memory for data modeling analysis,through the Rand S-PLUS software programming of volatility forecasting results. Finally analyze the result of two kinds of models to predict the conclusion.
The fourth chapter for the full text summary.
第一章引言
对于资产选择以及资产定价的研究是当代金融理论的最重要内容之一,在有资产定价理论的前提之下,资产价格的关键因素为资产风险,在金融资产风险中,波动率为其典型度量。
在近现代的金融板块研究中,风险通常情况下用波动率来代表,由δ来进行拟合,即收益序列的方差。
在各种金融理论中如期权定价理论,马克维茨资产组合选择理论,VAER理论等,波动率都是这些理论研究中极其重要的环节。
研究波动率主要分为三步:
第一步,波动率的估计,即用什么方法来估计波动率。
第二步,波动率的特征,波动率有持续性、杠杆效应、自相关性、长记忆性等。
怎样来检验波动率的这些特征,这些特征的强弱程度,以及在不同的模型中如何捕捉这些特征,都是研究波动率的重要步骤。
第三步,构造波动率模型,怎样来估计模型的参数,怎么来评价各个模型,是在研究波动率过程中最重要的问题。
假定波动率有持续性的特征,并且波动率是可以估计的,也就是说风险也是能够被估计的,因此通过对波动率的研究,我们可以更准确地对金融产品进行定价;通过对资产收益率序列的波动率建立模型并对其进行研究,证券市场中的投资者就能够更有效地,更精确地对资产进行投资以及风险管理。
总的来说,建立波动率模型不但能够帮助证券市场的投资者选择资产组合,还能够帮助投资者进行投资分析,预测该资产组合的风险高低。
在近现代波动率研究的历程中,不得不提该领域的开山鼻祖——Engle,在1982年,他提出了ARCH模型(自回归条件异方差模型)。
在对金融时间序列长期效应的描述中,经典的GARCH模型并不能达到预期的效果,所以Granger和Ding提出了长记忆GARCH模型,在这之后,1996年Baillie、Mikkelson和Bollerslve提出了FIGARCH模型,现在我们通常以FIGARCH (p,d,q)模型来反映金融时间序列的长记忆性。
实际上,扰动项ARFIMA(p,d,q)模型就是FIGARCH(p,d,q)模型,模型中参数d反映了长记忆性,它是作用在远距离观测值之间的一种效果,具有以双曲率缓慢下降的特性。
目前,国内的学者对于证券市场波动率的研究大多数还是采用的适用能力不强的ARCH模型、GARCH模型和EGARCH模型等,研究的准确性合理性都受到很大的局限。
理论研究显示FIGARCH模型具有很强的适用性,对波动率的研究更准确更合理。
第二章相关概念
第一节证券市场价格波动理论
1、随机游走
在1950年以前,在经济学中,大多数的学者一致认为:证券市场中股票的价格的决定因素是其“内在价值”,而且股票的价格是可以预测的,也就是说,股票价格的波动是有规律可循的,价格以内在价值作为平衡位置上下做规律性的波动运动。
然而,在1953年,Maurice Kendall(肯德尔)是英国著名的统计学家,他在一次对股价波动的统计中得到:股票价格实际上是没有任何规律的,今天的价格与昨天的价格无关,明天的价格与今天的价格无关,股票的价格就如同“醉汉走步”一般,股票的波动每一天都是新的,也就是说,股票价格是随机游走的。
证券市场价格波动的随机性反映了理性且功能良好的有效市场,即股票的价格是市场中已知信息的反映,而且股价的波动又受制于相关信息。
首先,股价的决定因素是供求,而投资者对股票的买和卖才实现了市场中的供求关系,投资者对股票的心理预期决定了投资者买卖股票的实际操作,心理预期则是投资者在对相关信息的收集和处理中形成的。
其次,随时都有可能产生的“新信息”直接导致了股票价格的随机游走。
在一定的时间点上,股票价格是对“旧”的相关信息的反映,而在下一个时点,“新”的相关信息直接影响股票的价格。
由于“新”信息出现的不确定性,所以股票价格是随机游走的。
2、有效证券市场
满足上面两个条件的证券市场则为有效证券市场。
这里所说的有效,指价格对信息反映的速度快,而且价格对信息反映的准确性和充分性高,即对信息的反映具有高效率性。
美国芝加哥大学Fame教授在1965年定义了影响证券价格随机波动的三类相关信息:内部信息、公开信息和历史信息,并基于这三种信息提出了不同程度的市场有效性假说,即弱有效市场、半强有效市场和强有效市场。
第二节波动率的定义及其特征
1、波动率的定义
对一个金融时间序列{yt}而言,价格波动的绝对数值可以用下列两种方法进行估计:
(1)价格时间序列的标准差,计算公式为
(2)价格变动绝对数值的平均值,计算公式为
描述价格波动幅度的大小的估计方法有:
(1)价格的最大波动除以价格的中值,计算公式。
其中为最高价,为最低价。
(2)价格时间序列的标准差除以时间序列的均值,计算公式为。
(3)价格收益率的标准差,计算公式,其中在简单收益条件下,,连续复利条件下,。
由以上几种波动率的估计方法可以得到波动率的定义是和标准差(或方差)联系在一起的,在实际运用中常用方差(或标准差)来衡量波动率。
实际操作中我们也通常把波动率
与标准差()这两个概念划等号。
通常情况下我们不采用价格的标准差来度量波动率。
第三节金融时间序列的长记忆性和短记忆性
1、金融时间序列的短记忆性
有关金融时间序列记忆性的研究,Rosenblatt提出了短范围相依过程的概念。
简单的讲,对于离散金融时间序列{xt},t=1,2,3....,T,其和表示为
如果存在且不等于零,并且有
其中,W(r)为标准维纳过程。
则称{xt},t=1,2,3....,T为短范围相依过程。
短范围相依过程描述了相依性随着时间间隔的增加而变小的特点,它反映了金融时间序列短记忆的特点,大多数金融时间序列模型的研究对象都是短记忆时间序列。
在本文中GARCH模型、EGARCH模型均是以短记忆金融时间序列为研究对象的。
2、金融时间序列的长记忆性
金融时间序列的长记忆过程是以长记忆性为研究对象,体现了时间序列相隔较远的观测值之间仍具有一定的相关性的特征,即历史事件在较长时期内仍会对未来产生影响。
有关长记忆性的定义可以从不同角度进行阐述。
金融时间序列的长记忆性可以从时域和频域进行定义,其中时域角度的主要两种常用定义都是从金融时间序列的自相关函数出发从而完成对长记忆性金融时间序列的定义。
Mcleaod和Hipel于1978年给出定义:假设离散金融时间序列{xt}具有自相关函数(其中为滞后阶数),如果其自相关函数的绝对值满足条件
则称{xt}为长记忆金融时间序列。
相比较而言,Brockwell和Davis的定义因为给出了自相关函数的具体收敛速度而利于分析从而获得广泛地应用。
如果满足
其中c为常数,d<0.5,则称{xt}为长记忆金融时间序列。
以上两个定义都是从时域的角度对长记忆金融时间序列的刻画,而Granger和Ding则是从谱密度的角度对时间序列的长记忆进行了定义:
如果金融时间序列{xt}的谱密度f()随频率而趋于无穷,且f()再除去至多有限个值外的所有其他值上有界,则称金融时间序列{xt}为长记忆过程。
第四节相关模型介绍
1、GARCH模型
广义自回归条件异方差GARCH模型在1986年由Bollerslev提出。
一般地,GARCH(p,q)模型可以用公式表示为如下形式:
公式中,p≥0,q>0;>0,,i=1,...,q;,i=1,...,p。
显而易见的,当p=0时,GARCH(p,q)模型就与ARCH(q)模型一样。
如果我们令,GARCH(p,q)模型就可以得到一个与ARMA模型类似的结构:
在上式中,为一个鞅差序列,满足如下条件:
(1);
(2)
(3)不一定独立同分布
我们可以利用ARMA模型的无条件均值推导得出的无条件方差:
GARCH(p,q)模型不仅能够揭示金融市场的“波动聚集”特征,而且能够揭示“厚尾”特征。
考虑一个GARCH(1,1)模型的波动方程:
公式中,保证条件方差的正定性;保证该模型为平稳的GARCH模型。
第一,显而易见的,由于,大的会引起大的,呈现出“波动聚集”;第二,可以证明,若,容易得到模型表示的无条件峰度满足:
从而可以刻画那些比正态分布更厚尾部的金融时间序列。
2、FIGARCH模型
可以将GARCH(p,q)模型(Bollerslev(1986)提出)重新表示成如下形式:
其中,,L为滞后算子。
令:
则GARCH(p,q)模型可表示为如下:
其中,.
受ARFIMA(k,d,l)模型的启发,FIGARCH(p,d,q)模型定义为如下:
其中,0<d<1,和的所有根都位于单位圆,有如下展开式:
其中,代表伽玛函数;高斯超几何函数F(m,n,s;x)的解析式定义如下:
F(m,n,s;x)=
在FIGARCH(p,d,q)(分整GARCH)模型中,条件方差作为过去新息平方项的线性函数,为了预测未来最优条件方差,条件方差的可持续性可由作为当前新息函数的脉冲响应系数来刻画。
脉冲响应系数的表达式如下
累积脉冲响应权重为它反应了当前“震荡”对未来k时期内的累积影响:
一般来讲,脉冲响应系数是关于时间t的函数,但是在FIGARCH(p,d,q)(分整GARCH)模型中,脉冲响应系数与时间t无关。
脉冲响应系数可用误差平方项的一阶差分来刻画:
其中,。
把FIGARCH(p,d,q)写成上述公式形式,得到如下公式
如果,则,所以:
历史“震荡”对波动过程的长期影响可用累积脉冲响应权重的极限来估计:
当0≤d<1时,F(d-1,1,1;1)=0,表明对协方差平稳的GARCH(p,q)和FIGARCH(p,q)模型而言,“震荡”对未来波动率的影响最终将消失。
但是d的不同取值,对消失的速度有着重要的影
响。
当d=0时,FIGARCH(p,q)模型即是GARCH(p,q)模型,“震荡”对未来波动率的影响以指数速率迅速消失;当0<d<1时FIGARCH(p,q)模型表现出波动率的持续性,“震荡”对未来波动率的影响按双曲率衰减;当d=1时,FIGARCH(p,q)模型演变为IGARCH(p,q)模型,此时F(d-1,1,1;1)=1,累积脉冲响应权重收敛于常数,这意味着历史“震荡”对未来波动率的影响永不消失。
第三章波动率预测实证研究
第一节数据的相关说明
1、数据的选取
目前证券市场中存在两个大型的交易市场,上海证券交易所以及深圳证券交易所,本文也将采取这两个具有代表意义的市场中来代表这两个交易市场的总体收益情况。
在1997年前夕,人为因素对证券市场的波动产生很大的影响:在1994年,交易制度从T+0变为T+1;在1996年,证券市场发布了涨停板限价交易制度。
这些都对证券市场的波动造成了不可磨灭的后果。
为了避开这些制度变化而对波动率产生的影响,本文选取了1997年之后的数据;2008年,众所周知,世界金融危机,08年也发生了一次影响深重的股灾,这是中国证券市场趋于成熟后的影响重大的股灾之一,因此,在时间节点上,本文选择了08年以前的数据。
综上所述,本文所选取的数据为,1997年1月1日至2007年12月31日前后跨度十年的数据,数据为两个证券市场当天的收盘指数。
2、数据的初步处理
(1)数据的导入
>da<-read.delim('clipboard')#导入数据
>r<-log(da[,3]/da[,2])#计算对数收益率
>time1<-da[,1]
>x1<-r
(2)数据的相关性检验
我们用White Noise()来表示白噪声序列且具有如下性质:
(对任意的i)
(对任意的i)
(对任意的i≠j)
这说明了白噪声序列中的每一项之间不存在着相关关系,纯随机序列即这种完全“没有记忆”的序列。
如果某种显著的相关关系在序列值之体现出来,即
此序列不是纯随机序列得以体现,在序列值中每间隔k期序列值中的各项都或多或少的存在着相互影响的关系,这种关系即统计学上所称谓的相关信息。
由于相关信息的存在造就了我们研究的目的,即把这种相关信息通过各种方法从序列值中提取出来。
Box 和Ljung推导出适用于小样本场合纯随机性检验的统计量——LB统计量:
上式中,n为样本序列所观测的期数;m为指定的延迟期数。
>Box.test(x1,type="Ljung")#对对数收益率序列做Ljung-Box检验
Box-Ljung test
data: x1
X-squared = 0.025364, df = 1, p-value = 0.8735
程序运行结果中p-value = 0.8735大于=0.05说明拒绝原假设,即上证综指日收益率序列为纯随机序列。
Box.test(y1,type="Ljung")
Box-Ljung test
data: y1
X-squared = 2.1137, df = 1, p-value = 0.146
程序运行结果中p-value = 0.146大于=0.05说明拒绝原假设,即深圳成指日收益率序列为纯随机序列。
接下来,通过收益率序列的自相关图和偏自相关图进一步检验数据的相关性。
>acf(x1)
>pacf(x1)
acf(y1)
pacf(y1)
由上日对数收益率的自相关图和偏自相关图可以明显地得到样本没有显著的相关性。
综合上面所做的白噪声检验,可以得到日收益率序列基本上是序列无关的。
因此,在本课题的研究中我们会采用平方日收益率序列作为观测的样本。
>x2<-x1^2
>Box.test(x2,type="Ljung")
Box-Ljung test
data: x2
X-squared = 61.231, df = 1, p-value = 5.107e-15
程序运行结果中p-value = 5.107e-15小于=0.05说明接受原假设,平方日收益率序列为非白噪声序列。
> y2<-y1^2
> Box.test(y2,type="Ljung")
Box-Ljung test
data: y2
X-squared = 79.465, df = 1, p-value < 2.2e-16
> acf(x2)
> pacf(x2)
平方日收益率序列的自相关图和偏自相关图显示存在显著的自相关模式。
综上两种验证方法,平方日收益率序列存在相关性。
(3)日收益率序列的平稳性
根据限制条件的严格程度,我们将平稳时间序列分为严平稳时间序列和宽平稳时间序列。
由于在实际运用中,要获得随机序列的联合分布是一件很困难的事情,通常情况下,严平稳时间序列只具有理论意义,所以我们一般所说的平稳即比较宽松的宽平稳时间序列。
宽平稳是指时间序列{Xt}满足如下三个条件:
①任取,有;
任取,有为常数;
任取;
>plot(time1,x1,xlab=”时间”,ylab=”相对收益率”,main=”上证综指相对收益”,type=’1’)#绘制相对收益率时序图
根据日收益率时序图,我们可以基本判定上证综指相对收益时序图基本平稳。
plot(time1,y1,xlab=”时间”,ylab=”相对收益率”,main=”深圳成指相对收益”,type=’1’)
第二节基于GARCH模型的波动率预测
条件方差(波动率)预测是GARCH模型预测中最为核心的预测。
对于GARCH(p,q)模型的定义公式:
为了得到GARCH(p,q)模型向前l步的预测,可以将GARCH(p,q)模型的方差方程向前递推l步,得到:
在公式中,。
因此,对方程两边同时取条件期望,上述公式变为如下:
这样,我们可以通过递归方式对条件方差进行求解,从而得到波动率向前l步预测的结果。
1、ARCH效应检验
LM检验(Lagrange multiplier检验)是对ARCH效应最为经典的方法。
对GARCH模型中的E (εt),即它的均值方程,若随机变量为独立的白噪声序列,且,这时在广义自回归条件异方差(GARCH(p,q))模型定义公式中,,而。
如果随机变量服从广义自回归条件异方差过程,那么中至少有一个(i=1,2,...,q)不为零。
因此,ARCH效应检验的H0和H1分别为:
(不存在ARCH效应)
不全为零
并取
利用LM(拉格朗日乘子)来检验。
LM检验方法的检验统计量LM用公式表示为如下:
这里,L(θ)为GARCH(p,q)模型定义公式中第一个式子的对数似然函数,为在似然函数最大时计算的信息阵。
在H0成立时,统计量LM的极限分布为。
利用对数似然函数L(θ)对所讨论的参数向量求取一阶和二阶偏微分,在样本数充分大时给出LM的算式为
公式中,T为样本数,取残差是对进行回归所得到的拟合优度,。
> library(FinTS)
载入需要的程辑包:zoo
载入程辑包:‘zoo’
as.Date, as.Date.numeric
> ArchTest(x=x1)#ARCH效应检验
ARCH LM-test; Null hypothesis: no ARCH effects
data: x1
Chi-squared = 157.62, df = 12, p-value < 2.2e-16
检验结果中p-value < 2.2e-16,P值远小于=0.05,拒绝原假设,即日收益率序列明显的存在ARCH效应。
(2)模型定阶
对于GARCH(p,q)模型的模型定阶有两种方法。
GARCH(p,q)模型确定模型的阶数即确定参数p值和q值。
第一步,确定GARCH(p,q)模型中的q参数,即滞后阶数q。
对于模型的残差序列,的无偏估计,所以可以用的偏自相关函数来确定滞后阶数q值。
第二步,确定GARCH(p,q)模型中的p参数,即滞后阶数p。
在已经知道q的情况下,可以使用AIC准则和BIC准则确定滞后阶数p值。
另外一种方法即通过自相关图和偏自相关图来确定模型的阶数。
这也是本文所采用的方法。
> epst<-x1-mean(x1)#均值调整对数收益
> acf(as.numeric(epst)^2)
> pacf(as.numeric(epst)^2)
通过均值平方数据的自相关图和偏自相关图,p值和q值均为1。
(3)建立GARCH类模型
> library(fGarch)
载入需要的程辑包:timeDate
载入需要的程辑包:timeSeries
载入程辑包:‘timeSeries’
time<-
载入需要的程辑包:fBasics
Rmetrics Package fBasics
Analysing Markets and calculating Basic Statistics
Copyright (C) 2005-2014 Rmetrics Association Zurich
Educational Software for Financial Engineering and Computational Science Rmetrics is free software and comes with ABSOLUTELY NO WARRANTY.
https:// --- Mail to: info@
> GARCH.model_1<-garchFit(~garch(1,1),data=x1,trace=FALSE)
> GARCH.model_2<-garchFit(~garch(1,1),data=x1,cond.dist='std',trace=FALSE)
> summary(GARCH.model_1)
Title:
GARCH Modelling
Call:
garchFit(formula = ~garch(1, 1), data = x1, trace = FALSE)
data ~ garch(1, 1)
<environment: 0x0000000006702de8>
[data = x1]
Coefficient(s):
mu omega alpha1 beta1
2.1569e-04 7.0123e-06 1.2417e-01 8.5661e-01
Std. Errors:
based on Hessian
Error Analysis:
Estimate Std. Error t value Pr(>|t|)
mu 2.157e-04 2.463e-04 0.876 0.381
omega 7.012e-06 1.655e-06 4.237 2.27e-05 ***
alpha1 1.242e-01 1.635e-02 7.594 3.11e-14 ***
beta1 8.566e-01 1.797e-02 47.666 < 2e-16 ***
---
Signif. codes: 0 ‘***’0.001 ‘**’0.01 ‘*’0.05 ‘.’0.1 ‘’1
Log Likelihood:
7476.797 normalized: 2.818242
Description:
Wed Apr 13 13:22:58 2016 by user: logo
Statistic p-Value
Jarque-Bera Test R Chi^2 1600.306 0
Shapiro-Wilk Test R W 0.966879 0
Ljung-Box Test R Q(10) 22.25229 0.01386967
Ljung-Box Test R Q(15) 38.29166 0.0008169182
Ljung-Box Test R Q(20) 43.08807 0.001990235
Ljung-Box Test R^2 Q(10) 6.022688 0.8133535
Ljung-Box Test R^2 Q(15) 8.490598 0.9026132
Ljung-Box Test R^2 Q(20) 10.90398 0.9486748
LM Arch Test R TR^2 6.476831 0.8901662
Information Criterion Statistics:
AIC BIC SIC HQIC
-5.633469 -5.624598 -5.633473 -5.630258
> summary(GARCH.model_2)
Title:
GARCH Modelling
Call:
garchFit(formula = ~garch(1, 1), data = x1, cond.dist = "std",
trace = FALSE)
data ~ garch(1, 1)
<environment: 0x00000000066a6d20>
[data = x1]
std
Coefficient(s):
mu omega alpha1 beta1 shape
4.7697e-04 7.1010e-06 1.1254e-01 8.6642e-01 4.8003e+00
Std. Errors:
based on Hessian
Error Analysis:
Estimate Std. Error t value Pr(>|t|)
mu 4.770e-04 2.304e-04 2.070 0.03841 *
omega 7.101e-06 1.903e-06 3.731 0.00019 ***
alpha1 1.125e-01 1.750e-02 6.430 1.27e-10 ***
beta1 8.664e-01 1.904e-02 45.506 < 2e-16 ***
shape 4.800e+00 4.609e-01 10.415 < 2e-16 ***
---
Signif. codes: 0 ‘***’0.001 ‘**’0.01 ‘*’0.05 ‘.’0.1 ‘’1
Log Likelihood:
7600.125 normalized: 2.864728
Description:
Wed Apr 13 13:24:20 2016 by user: logo
Statistic p-Value
Jarque-Bera Test R Chi^2 1628.595 0
Shapiro-Wilk Test R W 0.966626 0
Ljung-Box Test R Q(10) 22.47602 0.01285496
Ljung-Box Test R Q(15) 39.06859 0.0006259038
Ljung-Box Test R Q(20) 43.82147 0.001589996
Ljung-Box Test R^2 Q(10) 5.712678 0.8387975
Ljung-Box Test R^2 Q(15) 7.910234 0.927331
Ljung-Box Test R^2 Q(20) 10.17277 0.9649299
LM Arch Test R TR^2 6.052142 0.9134308
Information Criterion Statistics:
AIC BIC SIC HQIC
-5.725688 -5.714599 -5.725695 -5.721674
(4)提取残差数列并做性质检验
由于波动率不是一个可以实际算出的值,在本文中,用收益率序列的残差序列在拟合波动率。
sres<-residuals(GARCH.model_1)
acf(sres)
pacf(sres)
(5)模型预测
>pred.model_1<-predict(GARCH.model_1,n.ahead=20,trace=FALSE,mse='cond',plot=FALSE)
> pred.model_2<-predict(GARCH.model_2,n.ahead=20,trace=FALSE,mse='cond',plot=FALSE)
> predVol_1<-pred.model_1$standardDeviation
> predVol_2<-pred.model_2$standardDeviation
> print(predVol_1)
[1] 0.01618564 0.01624591 0.01630481 0.01636238 0.01641866 0.01647368
[7] 0.01652748 0.01658009 0.01663153 0.01668184 0.01673104 0.01677917
[13] 0.01682624 0.01687230 0.01691735 0.01696143 0.01700457 0.01704677
[19] 0.01708807 0.01712849 0.01716804 0.01720676 0.01724465 0.01728174
[25] 0.01731805 0.01735359 0.01738838 0.01742245 0.01745580 0.01748846
[31] 0.01752043 0.01755174 0.01758240 0.01761243 0.01764183 0.01767063
[37] 0.01769883 0.01772645 0.01775351 0.01778001 0.01780597 0.01783139
[43] 0.01785630 0.01788070 0.01790460 0.01792802 0.01795096 0.01797344
[49] 0.01799546 0.01801703 0.01803817 0.01805889 0.01807918 0.01809907
[55] 0.01811856 0.01813766 0.01815637 0.01817471 0.01819268 0.01821030
[61] 0.01822756 0.01824447 0.01826105 0.01827730 0.01829323 0.01830884
[67] 0.01832414 0.01833913 0.01835383 0.01836824 0.01838236 0.01839620
[73] 0.01840977 0.01842307 0.01843611 0.01844889 0.01846142 0.01847370
[79] 0.01848575 0.01849755 0.01850912 0.01852047 0.01853159 0.01854249
[85] 0.01855318 0.01856367 0.01857394 0.01858402 0.01859389 0.01860358
[91] 0.01861307 0.01862238 0.01863151 0.01864046 0.01864924 0.01865784
[97] 0.01866628 0.01867455 0.01868266 0.01869062
> print(predVol_2)
[1] 0.01625440 0.01630104 0.01634657 0.01639101 0.01643439 0.01647674
[7] 0.01651809 0.01655846 0.01659788 0.01663638 0.01667397 0.01671069
[13] 0.01674655 0.01678157 0.01681578 0.01684920 0.01688185 0.01691374
[19] 0.01694490 0.01697534 0.01700509 0.01703415 0.01706255 0.01709030
[25] 0.01711742 0.01714393 0.01716983 0.01719515 0.01721989 0.01724408
[31] 0.01726772 0.01729082 0.01731341 0.01733549 0.01735707 0.01737818
[37] 0.01739880 0.01741897 0.01743869 0.01745797 0.01747682 0.01749525
[43] 0.01751327 0.01753089 0.01754812 0.01756497 0.01758145 0.01759756
[49] 0.01761331 0.01762872 0.01764379 0.01765853 0.01767294 0.01768704
[55] 0.01770082 0.01771431 0.01772749 0.01774039 0.01775301 0.01776535
[61] 0.01777742 0.01778923 0.01780077 0.01781207 0.01782312 0.01783393
[67] 0.01784450 0.01785485 0.01786497 0.01787487 0.01788455 0.01789402
[73] 0.01790329 0.01791236 0.01792123 0.01792990 0.01793839 0.01794670
[79] 0.01795482 0.01796278 0.01797055 0.01797816 0.01798561 0.01799289
[85] 0.01800002 0.01800700 0.01801382 0.01802050 0.01802703 0.01803342
[91] 0.01803967 0.01804579 0.01805178 0.01805764 0.01806337 0.01806898
[97] 0.01807447 0.01807984 0.01808510 0.01809024
plot(predVol_1)
plot(predVol_2)
第三节基于FIGARCH模型的波动率预测
1、金融时间序列长记忆性检验
(1)KPSS检验
KPSS检验法由四个人的名字的首字母组合命名,两个S分别代表Schmidt和Shin,K代表Kwiathowski,P代表Phillips。
最开始,他们在1992年提出的KPSS检验是用来区分序列是单整序列还是平稳序列的。
后来,Lee和Schmidt将这个检验进行推广,用来检验金融时间序列是长记忆序列还是短记忆序列。
KPSS检验的H0和H1如下:
原假设:为短记忆序列;
备择假设为长记忆序列。
KPSS检验的统计量为
式子中
在1992年,Kwiathowski、Phillips、Schmidt和Shin已经证明了
(是二阶布朗桥)。
install.packages(“urca”)
library(urca)
library(tseries)
kpss.test(x)
KPSS Test for Level Stationarity
data: x
KPSS Level = 0.44398, Truncation lag parameter = 11, p-value =
0.0582
由程序运行结果KPSS Level=0.44398,p-value=0.0582说明拒绝原假设。
(2)ADF检验
Dickey和Fuller在1980年提出ADF检验(也称增广DF检验),检验的模型如下所示:
公式中,表示截距项,表示趋势项。
ADF检验的H0和H1如下:
;。
检验统计量,将其进行修正后为。
adft.out = unitroot(da,trend="nc",statistic="t",lags=1)
adft.out
Test for Unit Root: Augmented DF Test
Null Hypothesis: there is a unit root
Type of Test: t-test
Test Statistic: -51.56
P-value: 1
Coefficients:
lag1
-1.0014
Degrees of freedom: 2652 total; 2651 residual
Residual standard error: 0.01591
在这里,序列da的检验统计量值为-51.56,小于临界值,在=0.01的显著水平下拒绝原假设,因此认为序列是平稳的,不存在单位根。
很多情况下,会采用ADF检验和KPSS检验一起来判定金融时间序列是否为长记忆序列。
由于这两种检验的原假设和备择假设均不相同,所以检验会出现四种结果:第一,两个检验都接受原假设,则显示序列是非信息性低频数据;第二,拒绝KPSS检验原假设而接受ADF检
验原假设;第三,接受KPSS检验原假设而拒绝ADF检验原假设;第四,两个检验均拒绝原假设,则说明该序列为长记忆序列。
由上(1)中KPSS检验和(2)中的ADF检验,两个检验均拒绝原假设,说明上证综指的收益率序列具有长记忆性。
(3)R/S检验
在金融时间序列的长记忆性检验的各种方法中,除了(1)、(2)中所提到的ADF检验和KPSS检验的结合检验方法,还有一种比较常用的方法—R/S分析,这种方法是英国的水文专家Hurst在1951年研究水位控制的基础之上创建的。
R/S检验的统计量为:
公式中,;。
我们可以证明:收敛于一个常数C,在公式中,H即为Hurst指数,H=d+1/2,H的取值范围为(0.5,1)。
由于H(0.5,1),所以当T趋于无穷时,有,对公式两边分别取对数有,由于H 和d的关系以及对该式进行线性回归后得到的参数H的估计值,d的估计值能够很容易的推导出来。
rosTest(abs(da))
Test for Long Memory: Modified R/S Test
Null Hypothesis: no long-term dependence
Test Statistics:
3.2104**
* : significant at 5% level
** : significant at 1% level
Total Observ.: 2653
Bandwidth : 9
程序运行结果在1%的显著水平下,检验统计量T=3.2104,说明上证综指日收益率序列具有长记忆性。
rosTest(abs(y))
Test for Long Memory: Modified R/S Test
Null Hypothesis: no long-term dependence
Test Statistics:
3.1862**
* : significant at 5% level
** : significant at 1% level
Total Observ.: 2116
Bandwidth : 8
程序运行结果在1%的显著水平下,检验统计量T=3.1862,说明深圳成指日收益率序列具有。