上证50指数的统计套利模型(doc 11)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
上证50指数的统计套利模型(doc 11)
上证50指数的统计套利模型1
韩广哲陈守东张炳辉
吉林大学数量经济研究中心,吉林大学商学院,吉林,长春,130012
摘要:本文使用逐步回归方法来确定合适的定价子空间,探讨上证50指数成分股之间的统计套利模型。检验可预测性的方差比分析表明随机去势后的股票价格序列明显偏离随机游走,存在着可预测的成分。联立方程模型表明股票的“错误定价(mispricing)”趋于在短期内形成趋势(trend),在更长时间内回复(revert)。统计套利模型的样本外绩效通过使用一个简单的交易原则(构造并持有复合组合)就可以是盈利的,当交易费用水平是0.5%时,复合组合的年夏普比为1.8。本文的研究有助于发现股票市场的统计套利机会并改善组合绩效。
关键词:统计套利模型错误定价方差比分析
一、引言
资产收益的波动在许多情形下是由其所在市
1本文得到2002年教育部重大项目(02JAZJD790007)、吉林大学经济分析与预测哲学社会科学创新基地资助
场甚至是国际市场的“趋势、变动”引起的,而不是某一特别资产的某个特殊性质。这样就会存在着遮蔽资产收益的任何可预测成分的风险,许多学者提出建议,通过适当转换金融时间序列来减少这一遮蔽效应。Lo和MacKinlay(1996)就一个特别的信息集构造“最大可预测”的资产组合。Burgess和Refenes(1996)使用协整框架,由国际股票指数的一个组合来计算FTSE收益,组合权重是由协整回归系数给出的。Steurer 和Hann(1996)也采用协整框架对汇率建模,将汇率作为货币和金融基本因素控制的“均衡”水平周围的短期波动。Burgess(1996)使用主成分分析方法来建立欧洲美元投资组合,使用神经网络方法而不是线性技术,发现这一投资组合的收益是部分可预测的。寻求收益的可预测成分的方法可以被刻画为“统计套利”。Burgess (1999)在研究FTSE100指数及其成分股时,使用了逐步回归方法和ECM方法,他定义统计套利为传统的“零风险”套利的一个扩展。零风险套利包括构造两组有着相同现金流的资产组合,充分利用这两个等价资产的任何价差。多头(资产组合1)+空头(资产组合2)可以视为一个复合资产,零以外的价格偏离都代表一个
“错误定价”和一个潜在的无风险利润(受到筹资成本、交易费用和买卖价格限制)。统计套利与零风险套利的区别在于:构造复合资产组合,组合的非零价格偏离仍被视为“错误定价”,但在统计套利的意义下,动态价格存在着可预测成分。
本文以上证50指数50只成分股的收盘价格时间序列为研究对象,以样本内方差比曲线的信息和时间序列性质,探索动态价格时间序列的可预测成分,研究建立统计套利模型。统计套利方法的使用包括三个阶段:构造复合资产组合,检验动态价格或收益的预测能力;构造协整回归,建立误差修正机制;实施交易系统,开发资产收益可预测的成分。
本文采用的统计套利方法,本质上是协整概念的一个推广。我们在两个方面修改了标准协整方法:以检验可预测性的方差比(Variance Ratio,简记为:VR)方法来代替检验平稳性的协整方法;使用逐步回归法构造协整回归,而不是文献中常见的标准回归或者主成分方法。这两个改进是有根据的:方差比检验相比于检验平稳性和长期均衡关系的协整方法来说,限制性少,更适合确定统计套利机会;问题空间(上证50
又称为协整向量。最常用的协整形式是(1,1)CI 。但在我们的研究中,数据由上证50指数及其50个成分股组成,考虑到维数是51,大大高于普通的协整分析,样本大小320也相对很较小(数据描述见第3节)。为了减小问题的维数,我们要确定相对较小的各变量子集,这就有了确定合适的子集来建立统计套利模型的问题。为了保证取得整个变量空间的一个合理子集,我们采用逐个使用每一资产作为协整回归因变量的方法。为了确定协整向量合适的子空间,我们使用向前逐步回归方法来代替标准“输入所有变量”的方法。对上证50指数及其成分股进行单位根检验,发现大多数价格序列都是一阶单整的,少数几个价格序列不存在单位根,为平稳的,但这不影响我们的研究。
我们采用方差比来检验潜在的价格预测能力。方差比检验遵循的事实是:随机游走的新息的方差随着时期线性增长,这些期间内增量是可以度量的。这样,在τ期内计算的新息的方差应该近似等于τ倍的单期新息的方差。基本的VR()τ统计量是:
VR()τ=2
2()()t t t t d d d d τττ∆-∆∆-∆∑∑ (1)
方差比是 的函数。对于随机游走来说,方差比将会接近于1,且这一性质被很多人(Lo 和McKinley(1998)和Cochrane(1988))用作统计检验偏离随机游走行为的基础。
2.基于方差比分析检验预测能力
我们不检验单独的VR统计量,而是从整体上检验方差比曲线,这能够总结时间序列的动态性质:方差比曲线正的斜率说明正的自相关,因此有趋势行为;方差比曲线负的斜率说明负自相关和均值回复或者周期行为。计算方差比的时候,没有一个“很好的”区间来比较各个股票的方差比,基期的选择对方差比的计算也有着很大的影响,我们分析上证50指数的走势,分别计算下跌(2004年3月23日—2004年6月4日:50—100)和涨跌变化比较剧烈(2004年8月31日—2004年11月16日:160—210)两个区间(每个区间有51个样本)的方差比曲线。下面给出了上证50指数及其成分股收益(为对数收益)的方差比曲线。(图中:蓝色为下跌区间,红色为涨跌变化比较剧烈区间。)
我们给出了下跌区间与涨跌变化比较剧烈区间上证50指数收益的方差比曲线和50只成分股的平均方差比曲线(包括50只股票平均收益的
方差比曲线和50只股票收益的平均方差比曲线),个股的方差比曲线不在此给出。下跌区间的方差比曲线都要大过涨跌变化比较剧烈区间的方差比曲线;方差比曲线都在20天内有着显著变化,曲线在20天后趋于平稳。所有股票都有着统一的特征:方差比曲线显著的偏离1,表明一定程度的可预测性。除了下跌区间50只股票收益的平均方差比曲线表现为先上升再下降且显著大于1,其他方差比曲线的走势为下降且显著小于1,斜率为负。各个成分股收益的方差比曲线的表现差异较大,下跌区间50只股票收益的平均方差比曲线,由于一部分股票的方差比
1上方,而涨跌
图2 图3 指数收益的方差比曲线图4