基于高频数据的成对交易统计套利策略实证研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于高频数据的成对交易统计套利策略实证研究*
杨怀东1;伍娟2;盛虎
(1.中南大学商学院,长沙410083;2.中南大学商学院,长沙410083)
摘要:本文采用日数据和5种日内高频数据对基于成对交易的统计套利策略进行了实证研究。

研究结果表明,在文章采用的各频率数据下,统计套利策略运用于我国股票市场均是有效的,且随着数据频率的提高,套利机会随之增多,但由于微小价差而频繁发出交易信号,交易成本将消耗掉大部分利润,甚至造成亏损。

因此采用高频数据进行统计套利时,提高交易触发点是提高绩效的一个有效途径,同时要加强交易成本控制。

关键词:统计套利;成对交易;协整;高频数据
中图分类号:F830文献标识码:A
Empirical s tudy on a pplying a statistical arbitrage technique of pairs trading to
high-frequency equity data
Yang Huaidong1;Wu Juan2
(1.Business School,Central South University,Changsha410083,China2.Business School,Central South
University,Changsha,410083,China)
Abstract:The thesis makes an empirical study on applying a statistical arbitrage technique of pairs trading to high-frequency equity data.The result shows statistical arbitrage strategy is efficient in China stock market when using all datas of different frequencies adopted by this thesis.With the data frequency raising,the arbitrage opportunities increase,however,because of too frequent signals for small spread,trading costs exhaust most of the profits,or even result in losses.Therefore,raising the threshold of trading signals is an effective way to increase the profit,at the same time,transaction cost control is very important for statistical arbitrage when using high-frequency datas.
Key words:Statistical Arbitrage;Pairs Trading;High-frequency Data;Cointegration
1作者简介:杨怀东(1968-),男,辽宁沈阳人,
中南大学商学院,讲师,博士,研究方向:证券与期货投资;
2伍娟(1985-),女,湖南永州人,中南大学商学院,
硕士研究生,研究方向:证券与期货投资。

0前言
统计套利,即基于统计方法挖掘套利机会,通过建立金融资产价格时间序列模型,拟合资产价格变化规律,识别资产组合内部统计错误定价关系,发现两个或者两个以上资产之间存在的套利机会,设定交易阈值,通过计算机自动发出交易信号并执行的投资过程。

成对交易是最常用的统计套利策略之一,投资者根据个股的相对估值或者基本面的差异,通过维持市场中性头寸,可以捕捉到两只股票或者股票组合之间相互关系的异象捕捉交易机会。

统计套利策略需要做空交易机制。

由于我国资本市场之前长期缺乏做空机制及股票指数期货等衍生产品,使得统计套利策略不具备实施条件。

随着我国融资融券的启动以及股指期货上市交易,统计套利策略以及在此基础上的程序化交易日益受到众多机构投资者的关注,统计套利策略理论方法以及相关实证研究正逐步成为广大专家学者以及机构研发部门广泛关注的热点研究问题。

统计套利策略的技术关键在于构建能发现更多、更普遍及更持续套利机会的统计模型,近期关于统计套利策略研究多集中于此方面。

Bolgun等(2009)[1]采用2002~2008年间伊斯坦布尔股票交易所ISE30指数成分股日收盘价进行动态统计套利实证分析。

实证结果表明,成对股票组合产生的日平均收益率相对于单纯的购买并持有策略高3.36%,但交易限制和交易佣金却消耗了大部分超额收益率。

作为一种市场中性套利策略,其实施成对交易通常是选取流动性最强的股票,并通过程序化交易手段进行。

Low(2009)[2]的实证表明,在牛市中股票市场中性策略并不能完全获得市场收益率,但在熊市中却可以完全避免市场下跌的风险,获得稳定的低风险收益率。

Bertram(2009)[3]推导出证券价格服从伊藤扩散过程时,基于预期收益率最大化条件下的最优统计套利策略解析式,并运用一只在澳大利亚和新西兰股票交易所同时上市的银行股进行了实证检验,数据为2004年至2007年间的该股票日收盘价。

国内关于统计套利策略研究尚处于起步阶段,主要研究内容集中在局部理论问题讨论与套利策略实证分析。

方昊(2005)[4]认为统计套利对象首先在经济意义上应当具有一定的趋同性,其次具有相当好的流动性,最后价格比序列必须是平稳的,并将统计套利模型应用在封闭式基金市场,结果表明统计套利策略是有效的。

韩广哲,陈守东(2007)[5]运用方差比分析法将统计套利运用于上证50指数成分股之间的套利,考虑了三种交易成本及费用水平对统计套利策略绩效的影响,即不考虑交易成本、针对机构投资者的0.2%的交易成本水平及针对个人投资者的0.4%的交易成本。

发现统计套利在样本外的绩效对交易成本相当敏感,针对机构投资者的样本外年化夏普比率为1.3,符合市场中的投资要求,说明统计套利策略是有效的。

常宗琪(2008)[6]运用基于协整方法的统计套利策略对郑州期货交易所的白糖期货合约的跨期套利机会进行实证检验。

采用2008年5月19日至2008年10月9日的日内收盘数据。

两合约价格相关系数为0.992。

将交易进场点为1σ,出场点为2σ,止损点为0.9σ,并进行了简单演示,并提出可采用日内小时数据来进行统计套利研究。

仇中群,程希骏(2008)[7]将基于协整的统计套利策略模型运用在沪深300股指期货的仿真交易上。

数据采用IF0806与IT0807合约在2008年5月19日至2008年5月21日的一分钟的数据。

由交易时机图发现,价差序列长时间处于无套利带外,并一直没有回归到均值附近。

说明股指期货仿真交易市场存在一定的跨期套利空间,统计套利策略是有效的。

王粹萃,徐光梅(2008)[8]运用协整模型将浦发银行和招商银行进行成对交易的实证研究,运用GARCH模型来估计时变标准差,用于交易触发点的设置,并根据固定交易触发点与时变交易触发点将统计套利策略分成两种策略,实证表明采用时变交易触发点的策略绩效更高。

刘华(2008)[9]对将统计套利策略中的成对交易运用在上证50ETF与沪深300股指期货的期现套利上,采用协整模型,样本内数据分别采用2007年1月4日至2007年12月28日的上证50ETF的日收盘价和沪深300现货指数的日收盘价,样本外数据则采用2008年1月2日至2008年6月30日的收盘价。

实证研究表明,统计套利策略在样本内外均取得了较好的效果,其受市场的影响较小,在各个市场环境中均获得了比较稳定的收益,同时指出提高数据频率是以后研究的一个方向。

综上所述,协整模型是国内外统计套利策略的传统模型,采用日数据是传统统计套利的惯例。

随着高频数据运用的兴起,日内套利机会已引起投资者与学者的广泛高度关注。

但是,对于基于高频数据下的统计套利策略的有效性、配对股票的选取及数据频率对套利绩效的影响等诸多问题,目前尚缺少实证分析。

因此,本文选取日数据和5种日内高频
数据,实证分析数据频率对我国股票市场的统计套利机会及其收益性的影响。

1成对交易套利原理及操作流程
1.1成对交易套利原理
当两只股票价差偏离长期均值时,我们相信其一定会出现均值回复。

由于两只股票属于同行业或者是同板块,很可能存在同涨同跌现象,价差回复均值有可能是因为当价格都下跌时,相对高估股票的价格下跌程度大于相对低估股票的价格下跌程度;也有可能是当价格都上涨时,相对低估股票的价格上涨程度大于相对高估股票的上涨程度;或者两股票的价格的出现一涨一跌时,价差回复均值是由于相对低估股票的上涨和相对高估股票的下跌。

而采用货币中性策略,我们事先并不知道统计套利的获利是来源于空头,还是由于多头盈利,或者空头和多头都盈利。

本文采用货币中性策略,即买入相对低估股票的同时,卖出相同金额的相对高估的股票,待到两只股票的价差回复到均值时,将两只股票分别进行平仓。

在运用相同金额进行买卖股票时,假设可以将一股股票进行分割。

这不影响本文的结论,这是由于只要将投入金额进行倍数扩大,则可以进行现实操作中的手数买卖。

1.2成对交易套利操作流程
第一,关于运用日数据进行统计套利的国内的具体操作流程如下:
t日,买入相对低估的股票A,同时向证券公司融券卖出相对高估的股票B;
t+1日,卖出股票A,同时买入股票B以买券还券的方式将股票B归还给证券公司。

第二,关于运用日内高频进行统计套利时,很可能涉及到日内操作,国内的具体操作流程如下:t时,买入相对低估的股票A,同时向证券公司融券卖出相对高估的股票B;
t+1时,向证券公司融券卖出股票A,并与证券公司约定以直接还券的方式,将t时买入的股票A直接归还给证券公司,同时买入股票B以买券还券的方式将股票B归还给证券公司。

2数据选取与处理
2.1数据选取与预处理
本文按照上市公司的证券会行业分类标准(CSRC),将成分股按门类进行分类配对,这样既有利于选取的配对股票之间存在经济意义上的相关性,使得统计套利机制存在一定稳定性,又可以避免按大类或中类使得套利机会过少的情况。

这里选取上证超级大盘指数的20只成分股进行实证研究。

为保证数据有效性,剔除了于2009年7月29日上市的中国建筑,并以其余的19只股票中最晚上市的资金矿业的上市日期——2008年4月25日作为数据起始点,截止日期为2010年6月3日,每个序列有516个样本。

为消除股票价格除权除息的影响,对股票价格进行复权处理。

本文采用前复权收盘价,日数据实际收盘价由万得金融数据库导出,而日内高频数据由同花顺行情软件逐一导出,高频数据频率包括:60分钟、30分钟、15分钟、5分钟及1分钟。

日数据的向前复权价格由万得金融数据库自动导出,而日内高频数据的前复权价根据以下方式手工计算得出:将日数据股权登记日的前复权价除以该日的实际收盘价得出前复权系数,再将该前复权系数从股权登记日开始乘以日内高频数据直至样本起始点。

2.2数据相关性分析与配对股票初步筛选
在进行成对交易时,两只股票价格的相关系数越高越好,因为两只股票价格间的相关性越高,套利机制越稳健,虽然错误定价率会比较低,会导致单次收益率较低,但交易机会出现更多。

相反,如果配对股票相关性相关性较低,虽然可能单次收益会高,但由于交易机会会大幅下降,并且很可能由于价差长时间不出现均值回复,从而无法实现利润,甚至会被强制平仓。

此外,由于机构投资者在运用程序化交易进行统计套利时,通常是成百上千对股票,相关性越高,越能保证其获利的可能性,而且由于大规模操作,可以获得巨额收益。

因此,本文在初步筛选配对股票时,要求两只股票价格的相关系数大于0.8,即两只股票价格高度相关,就可以成为统计套利策略的潜在对象。

本文选取了日数据相关系数在0.8以上的配对股票的高频数据进行相关性分析,其中,1分钟数据的样本期间2010年5月4日至2010年6月3日,每个序列有4345个样本;5分钟和15分钟数
据的样本期间为2010年3月15日至2010年6月3日,每个序列的样本数量分别为2303个样本、751个样本;30分钟、60分钟数据的样本期间为2009年12月1日至2010年6月3日,每个序列的样本数分别为832个样本和420个样本;并以日数据相关系数排序,其结果如表1所示。

表1所示结果表明,同一成对股票间的价格相关性,运用不同频率的数据是不同的。

两股票价格的日数据具有高的相关性并不能保证其日内高频数据也具有高的相关性,日数据相关性较低的股票,其日内高频数据却有可能具有较高相关性。

在所计算的结果中,中国神华与中煤能源两股票价格的相关性在6个频率数据上综合最高,且在各频率数据上最接近,其日数据、60分钟、30分钟、15分钟、5分钟及1分钟数据的相关系数分别为0.9838、0.9961、0.9961、0.9937、0.9937及0.9517。

因此,本文选取中国神华与中煤能源这两只股票运用日数据和5种日内高频数据进行统计套利策略研究。

2.3协整分析
为保证套利股票股票间的相关性长期稳定,需要进一步进行协整检验分析。

协整分析的数据选取如表2所示。

表1配对股票价格在各频率数据上的相关系数
Tab.1The correlation coefficients of pair stocks’prices among all datas
配对股票日数据60分钟30分钟15分钟5分钟1分钟中国神华——中煤能源0.98380.99610.99610.99370.99370.9517
中国石油——中煤能源0.94620.93200.93100.98970.98880.9709
工商银行——招商银行0.94370.93150.93170.98730.98750.7880
中国石油——中国神华0.93070.92140.92100.98610.98530.9139
浦发银行——中国平安0.92930.63560.62730.66730.65690.7375
中国远洋——大秦铁路0.91650.95410.95220.93160.92900.8136
工商银行——中国平安0.91070.75870.75720.53280.51780.3994
中国铝业——宝钢股份0.90600.92060.92060.85490.84840.5307
武钢股份——宝钢股份0.89440.95430.95490.93400.93330.4278
招商银行——中国平安0.87490.78760.78600.59240.57930.6542
中国铝业——武钢股份0.86430.97390.97300.96820.96590.8579
浦发银行——工商银行0.85030.61910.61010.95950.95880.6157
中国石化——中国神华0.83840.93300.93170.97480.97420.8954
中国石化——中煤能源0.80890.93100.92900.97410.97340.9718
中国石化——中国石油0.80580.94970.94790.98500.98530.9530
表2统计套利数据选取
Tab.2The data selections of the statistical arbitrage strategy
样本内样本外
数据频率时间段每序列样本数覆盖交易日数时间段每序列样本数覆盖交易日数日数据2008.4.25-2009.12.314144142010.1.4-6.3102102
60分钟2009.12.1-2010.4.304041012010.5.4-6.39223
30分钟2010.3.15-5.14344432010.5.17-6.311214
15分钟2010.5.4-5.28304192010.5.31-6.3644
5分钟2010.5.24-5.3128862010.6.1-6.31443
1分钟2010.6.1-6.248422010.6.32431
首先,对各频率样本内数据进行ADF单位根检验,结果表明,12个原价格序列在99%的置信水平下均未通过平稳性检验,但其一阶差分序列则均通过了检验,说明12个价格序列均为一阶单整序列,可能存在协整关系。

进一步采用恩格尔协整分析两步法对价格序列进行协整分析。

首先进行OLS回归分析,接下来对回归方程的残差进行平稳性检验。

回归分析与平
稳性检验采用Eviews 6.0分析软件,描述统计分析采用SPSS 13.0分析软件。

根据样本内日数据和5种日内高频数据分别建立回归方程:t t t u zmny zgsh +=*β。

其中zgsh t 和zmny t 分别表示中国神华和中煤能源在t 日(时刻)的前复权日收盘价,u t 为随机干扰项。

价差平稳性检验结果和其描述统计分析结果如表3所示。

表3结果表明,回归方程残差的平稳性如下:在1%的置信水平下,5分钟和1分钟数据的回归方程的残差为平稳性的(“***”表示);日数据、60
分钟及30分钟数据的回归方程的残差则在5%的置信水平下为平稳的(“**”表示);15分钟数据的回归方程残差在10%的置信水平下为平稳的(“*”表示)。

可见,中国神华与中煤能源的价格在日数据和5个日内高频数据上均存在长期的协整关系,均具备统计套利的条件。

对5个频率的价差Spread 序列分别去均值进行去中心化处理,60分钟、30分钟、15分钟、5分钟及1分钟数据序列分别为:即Spread+0.0236、Spread+0.0108、Spread-0.0057、Spread+0.0002、Spread-0.0004分别得到Mspread 序列。

表3
日数据和日内高频数据协整分析及描述统计分析结果
Tab.3The rusults of the descriptive statistics and cointegration analysis
数据频率β系数ADF 检验值临界值(1%)临界值(5%)临界值(10%)残差均值残差标准差日数据 2.4542-2.5700**-2.5706-1.9416-1.61620.1057 1.572360分钟 2.4796-2.2988**-2.5707-1.9416-1.6162-0.02360.419230分钟 2.4473-2.4716**-2.5717-1.9418-1.6161-0.01080.278115分钟 2.4304-1.7463*-2.5727-1.9419-1.61600.00570.28625分钟 2.4565-2.7760***-2.5731-1.9419-1.6160-0.00020.09891分钟
2.4483
-4.3364***
-2.5698
-1.9415
-1.6163
0.0004
0.0760
3成对交易策略实证分析
3.1
交易信号的发出规则
(1)进场点
当Mspread>0时,说明回归方程左边的股票相对于右边的股票高估了,而当Mspread 大到一定程度时,可以覆盖双边交易成本时,便可以卖出方程左边的高估股票,买入方程右边的低估股票,当Mspread 回归到0时便将两只股票分别平仓获得利润。

当Mspread<0时,说明回归方程左边的股票相对于右边的股票低估了,而当Mspread 小到一定程度时,可以覆盖双边交易成本时,便可以买入方程左边的低估股票,卖出右边的低估股票,当Mspread 回归到0时便将两只股票分别平仓获得利润。

多数文献将进场点为0.75倍标准差时,即可以覆盖交易成本,则可以进场套利,本文将采用该进场触发点。

(2)止损点
由于统计套利是有风险的,并不像无风险套利那样会在某时刻出现绝对的均值回归,因此有必要设定止损点。

而止损点的设定则根据VaR 思想,当变量服从正态分布时,95%的把握保证其不会偏离均值的程度超过1.96倍标准差,而价差序列是近似服从正态分布的,因此认为当价差偏离均值的程度超过2倍标准差时,则5%的小概率事件发生了,可能价差会继续偏离,而不会像均值回归,因此要及时止损。

而考虑到样本外数据变动较大,进场点设置为价差偏离标准差2倍标准差时,为了减少交易次数带来的交易成本及获得最大收益,这是由于在95%的概率下,这已是最大获得利润,而止损点则设置为价差偏离均值3被标准差时,这是由于1%的小概率事件发生,则价差可能不会向均值回复,而会继续偏离,因此要及时止损。

因此,运用日数据和5种日内高频数据的交易信号根据表4规则发出。

表4
交易信号的发出规则
Tab.4The rules of triggering trading signals
数据频率样本内进场信号样本内止损信号样本外进场信号样本外止损信号平仓信号日数据
1.1792≤Mspread<3.1445
Mspread≥3.1445
3.1445≤Mspread<
4.7168Mspread≥4.7168Mspread≤0-3.1445<Mspread ≤-1.1792
Mspread≤3.1445
-4.7168<Mspread ≤-3.1445
Mspread≤-4.7168
Mspread≥0
60分钟
0.3144≤Mspread<0.8384Mspread≥0.83840.8384≤Mspread<1.2577Mspread≥1.2577Mspread≤0
-0.8384<Mspread≤-0.3144Mspread≤-0.8384-1.2577<Mspread≤-0.8384Mspread≤-1.2577Mspread≥0 30分钟
0.2086≤Mspread<0.5562Mspread≥0.55620.5562≤Mspread<0.8343Mspread≥0.8343Mspread≤0
-0.5562<Mspread≤-0.2086Mspread≤-0.5562-0.8343<Mspread≤-0.5562Mspread≤-0.8343Mspread≥0 15分钟
0.2147≤Mspread<0.5724Mspread≥0.57240.5724≤Mspread<0.8586Mspread≥0.8586Mspread≤0
-0.5724<Mspread≤-0.2147Mspread≤-0.5724-0.8586<Mspread≤-0.5724Mspread≤-0.8586Mspread≥0 5分钟
0.0742≤Mspread<0.1978Mspread≥0.19780.1978≤Mspread<0.2966Mspread≥0.2966Mspread≤0
-0.1978<Mspread≤-0.0742Mspread≤-0.1978-0.2966<Mspread≤-0.1978Mspread≤-0.2966Mspread≥0 1分钟
0.0570≤Mspread<0.1520Mspread≥0.15200.1520≤Mspread<0.2281Mspread≥0.2281Mspread≤0
-0.1520<Mspread≤-0.0570Mspread≤-0.1520-0.2281<Mspread≤-0.1520Mspread≤-0.2281Mspread≥0
3.2交易成本及费用说明
机构投资者通常可以享受0.03%的优惠佣金率,单边单只股票的佣金率为0.03%,印花税率单边卖出单只股票0.1%,则完成一次套利所需交易成本为0.32%,再考虑0.1%的流动性成本,则总成本为0.42%。

此外,还需考虑融券费用,大多券商的融券费率为9.86%一年,则每天的融券费率为0.027%,按实际使用天数计算。

本文研究中,由于运用日数据和60分钟数据单次套利持续时间较长,因此融券费率按实际天数计算,而运用30分钟、15分钟数据进行单次套利的持续时间短,运用5分钟及1分钟进行套利则由于同日操作较多而单次套利可能涉及两只股票的融券,所以这4个频率的单次统计套利的融券费率简化计算为0.05%。

因此,运用日数据和60分钟数据进行统计的单次成本与费用为0.42%再加实际融券费用,而运用30分钟、15分钟、5分钟及1分钟数据进行统计套利的单次成本与融券费用和为0.47%。

3.3统计套利机会及损益分析
样本内外采用6种频率数据对中国神华和中煤能源进行统计套利的具体绩效如表5所示,其中单次收益率为不考虑成本及费用情况下计算的。

表5运用日数据和5种日内高频数据进行套利的具体绩效
Tab.5The specific performance of applying all datas to the statistical arbitrage strategy
数据频率样本内外单次收益率(不计成本费用)总套利次数套利成功次数止损次数日
数据样本内
0.0361、-0.0265、-0.0426、0.0649、0.0657、0.0672、
0.0699、0.0839、-0.0980、0.0049、0.1083、0.0294、
-0.0655
1385样本外价差在均值附近波动,未出现交易机会
60
分钟样本内
0.0246、-0.0211、-0.0033、-0.0092、0.0261、0.0094、
-0.0117、0.0228、0.0192、0.0146、0.0157、0.0140
1284样本外0.03137110
30
分钟样本内
0.0129、-0.011、-0.0051、0.0194、0.0086、0.0099、
0.0100、-0.0137、-0.0037、0.0217、0.0119
1174样本外0.0302110
15
分钟样本内
-0.0106、-0.0025、-0.0058、-0.0056、-0.0021、0.0196、
0.0130、0.0135
835样本外价差在均值附近波动,未出现交易机会
5
分钟样本内
-0.0028、-0.0026、-0.0006、-0.0038、-0.0036、0.0066、
0.0068、0.0042、0.0085、-0.0034、0.0073、0.0041、
0.0051、-0.0041、-0.0019、0.0068、0.0052
1798样本外0.012585110
1
分样本内
0.0117、0.0046、0.0034、0.0061、-0.0047、-0.0022、
-0.0004、-0.0017、-0.0013、-0.0020、-0.0013、
433310
钟-0.0017、0.0068、0.0078、0.0038、0.0032、0.0036、
0.0040、0.0035、-0.0044、0.0048、0.0137、0.0063、
4.69E-05、0.0058、0.0042、0.0045、0.0046、0.0051、
0.0066、0.0064、0.0033、0.0026、0.0043、0.0044、
0.0043、0.0026、0.0030、0.0067、0.0043、-0.0026、
0.0089、0.0046
样本外0.0079、0.0095、-0.0036321
不考虑交易成本及费用的情况下,在样本内外运用日数据和5种日内高频数据对中国神华与中煤能源进行套利的绩效比较如表6所示,考虑交易成本及费用的情况下运用各频率数据进行套利的绩效比较如表7所示。

表6样本内外运用6种频率数据进行套利的绩效比较(不计成本费用) Tab.6The in and out-of-sample arbitrage performance comparison among all datas(ex TC)
数据频率样本内外持有期收益率平均单次收益率年化收益率总套利次数套利次数/交易日日数据
样本内29.79% 2.29%17.99%1313/414=0.03
样本外00000/102=0
60分钟
样本内10.12%0.84%25.04%1212/101=0.19
样本外 3.14% 3.14%34.1%11/23=0.04
30分钟
样本内 6.08%0.55%35.36%1111/43=0.26
样本外 3.02% 3.02%53.87%11/14=0.07
15分钟
样本内 1.97%0.25%25.9%88/19=0.42
样本外00000/4=0
5分钟
样本内 3.18%0.19%132.57%1717/6=2.83
样本外 1.26% 1.26%104.87%11/3=0.33
1分钟
样本内15.32%0.36%1915.22%4343/2=21.5
样本外 1.39%0.46%346.49%33/1=3
从表6可以看出,在样本内,随着数据频率的提高,平均每天的套利次数显著增加,其中运用1分钟进行统计套利,平均每天出现21.5次套利交易机会,是运用日数据的717倍,可见套利机会更加密集。

同时随着数据频率的提高,在不考虑交易成本与费用的情况下,年化收益率也逐渐增加,运用1分钟的进行统计套利的年化收益率是运用日数据进行统计套利的年化收益率的106倍,高达1915.22%。

然而,随着数据频率的增加,平均单次收益率是逐渐降低的,在运用15分钟、5分钟及1分钟数据进行统计套利时,其平均单次收益率均小于0.47%的交易成本与费用,即不能覆盖交易成本,则进行套利结果是收益小于成本费用,发生亏损。

在样本外,随着数据频率的提高,平均每交易日的套利次数逐渐增加,在有交易机会的数据频率上,其样本外平均单次收益率均显著高于样本内的平均单次收益率。

表7样本内外运用6种频率数据进行套利的损益比较(计成本费用) Tab.7The in and out-of-sample profit comparison among all datas(incl.TC)数据频率样本内外持有期收益率平均单次收益率年化收益率
日数据
样本内12.47%0.96%7.53%
样本外000
60分钟
样本内 2.83%0.24%7.02%
样本外 2.18% 2.18%23.66%
30分钟
样本内0.91%0.08% 5.31%
样本外 2.55% 2.55%45.47% 15分钟样本内-1.79%-0.22%-23.58%
样本外000
5分钟
样本内-4.81%-0.28%-200.35%
样本外0.79%0.79%65.7% 1分钟
样本内-4.89%-0.11%-611.03%
样本外-0.02%-8.0132E-05-6.01%
表7结果表明,在样本内,随着数据频率的提高,交易成本及费用占平均单次收益率比重越高,收益率对交易成本及费用越敏感。

运用15分钟、5分钟及1分钟数据进行套利均出现亏损,运用1分钟数据进行套利的年化收益率更达到了-611.03%。

可见,并不是数据频率越高越好,因为数据频率越高时,会因为价差的微小偏差而频繁发出交易信号,套利机会显著增加了,但是为了追求微小利润而频繁操作,其结果是随着操作次数的增加,亏损也随之增加。

当数据频率适中时,单次收益率与机会出现的频率达到比较好的均衡,此时会因为适当的单次利润发出更多的交易信号,收益随套利次数的增加而增加。

在样本外,由于更高的进场点和止损点的设置,考虑了交易成本与费用后,在有交易机会的60分钟、30分钟、5分钟及1分钟的数据频率上,分别获得了23.66%、45.47%、65.7%及-6.01%的年化收益率。

通过样本内外绩效比较说明,运用高频数据进行统计套利时,提高交易触发点是增加收益的一个有效途径,并且交易成本的控制变得尤为重要。

4结论
本文采用日数据和5种日内高频数据对中国神华和中煤能源股票组合进行统计套利的实证研究发现,在各频率数据下统计套利策略在我国股票市场均是有效的,且数据频率对该策略绩效影响显著。

样本内,对于该策略,随着数据频率的提高,每交易日的套利次数显著增加,在不计成本与费用时,年化收益率也随着增加,但平均单次收益率显著降低,净收益率对交易成本与费用敏感性增强。

因此,并非采用数据频率越高越好。

样本外,随着数据频率的提高,平均每交易日的套利次数逐渐增加,在有交易机会的数据频率上,由于更高进场点和止损点的设置,其平均单次收益率均显著高于样本内的平均单次收益率,考虑了交易成本与费用后,统计套利策略可获得可观的年化收益率。

表明,在高频数据下,提高交易触发点是增加收益率的一个有效途径,成本控制相当重要,在实际交易中,可采用专门的算法交易对交易成本进行精细化控制。

参考文献
[1]Bolgun,Evren,Kurun,Engin and Guven,Serhat.Dynamic
Pairs Trading Strategy For The Companies Listed In The
Istanbul Stock Exchange[J].Working papers,2009.
[2]Low.Equity Market Neutral:Diversifier Across Market Cycles[J].CREDIT SUISSE ASSET MANAGEMENT, 2009.
[3]Bertram.Optimal trading strategies for Itôdiffusion processes[J].Physica A,2009(388):2865~2873
[4]方昊,统计套利的理论模式及应用分析——基于中国封闭式基金市场的检验[J].统计与决策,2005:14~16. [5]韩广哲,陈守东.统计套利模型研究——基于上证50指数成份股的检验[J].数理统计与管
理,2007,26(5):908~916.
[6]常宗琪.白糖统计套利理论模式研究及实例分析[J].经济师,2008(11):30~31.
[7]仇中群,程希骏.基于协整的股指期货跨期套利策略模型[J].系统工程,2008,26(12):26~29.
[8]王粹萃.基于协整方法的统计套利策略实证检验:[硕士学位论文].吉林:吉林大学,2007
[9]徐光梅.从成对交易到动量检验——统计套利的学习与应用:[硕士学位论文].浙江:浙江大学,2008
[10]刘华.基于统计套利ETF期现套利方法应用研究:[硕士学位论文].大连:大连理工大学,2008
[11]A Burgess.A Computational Methodology for Modelling the Dynamics of Statistical Arbitrage.A thesis submitted to the University of London for the degree of Doctor of Philosophy.1999
[12]E Larsson,L Larsson,J Aberg.A Market Neutral Statistical Arbitrage Trading Model.Development,2003-safvenblad.se [13]J Wang.Pairs Trading with Robust Correlation.
iam.ubc.ca.2009。

相关文档
最新文档