中国股市弱有效吗_来自数据挖掘的实证研究_兰秋军
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文章编号:1003-207(2005)04-0017-07
中国股市弱有效吗?)))来自数据挖掘的实证研究
兰秋军1,马超群1,甘国君2,吴建宏2
(11湖南大学工商管理学院,长沙 410082;21约克大学数学与统计系,加拿大多伦多M 3J 1P3)
摘 要:已有的有效性检验方法大都基于某个全局性的数学模型,忽略了序列中某些局部模式的预测作用,由此得出/市场有效0的结论有失偏颇。本文采用一种新的时间序列数据挖掘方法T SEOPM ,寻找时间序列中具有预测作用的局部征兆模式,并用其实证我国沪、深A 股市场近年来收益的短期可预测性,结果表明基于局部征兆模式获得的收益显著好于非征兆模式,通过历史价格分析可以带来一定的短期超额收益,因而说明我国股市还没有达到弱有效。
关键词:股票;有效市场;数据挖掘;时间序列中图分类号:F830 文献标识码:A
收稿日期:2004-11-24;修订日期:2005-07-16
基金编号:国家自然科学基金资助项目(70371028);教育部优秀
青年教师资助计划(教人司[2003]355号)
作者简介:兰秋军(1972-),男(汉族),湖南大学工商管理学院
博士,讲师,研究方向:金融信息处理、数据挖掘、管理
决策支持系统1
1 引言
金融市场的有效性问题是现代金融理论的一个基本问题,与投资决策、风险管理、资产定价等理论有着重要联系。1965年美国芝加哥大学Fama 教授根据市场信息的层次,将有效市场划分为三种形式:弱有效、半强有效和完全有效
[1]
。弱有效市场的表
现是所有历史价格信息已完全反映在现行价格当中,半强有效市场则体现为所有公开信息都已经反映到现行价格当中,而强有效市场则不管公开还是内部信息都已反映到当前价格中。弱有效市场假说认为股票当前价格已包含了所有历史价格信息,从而无法基于历史价格信息对未来进行预测而获得超额收益,这直接否定了技术分析方法的有效性,因此历来备受人们关注。
为应对/数据丰富,但信息贫乏0的现象,近10年来数据挖掘技术迅速崛起,它/是一门能对观测到的数据集(经常是很庞大的)进行分析,目的是发现未知的关系和以数据拥有者可以理解并对其有价值的新颖方式来总结数据的技术0[2]。或者说/是从数据集中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的高级处理过程。0
[3]
股价、利率、
汇率等金融数据,是一类常见而重要的数据,从中挖
掘出有效信息已引起人们的极大兴趣。如Kovaler -chuk 和Vity aev 就一种基于混合方法的关系数据挖掘进行了研究,并将其应用于S&P500、汇率、股市
大秀方向等的预测[4]
;William Leigh 等基于序列的相似性识别技术,提出了一种根据技术图表启发发现NYSE 综合指数交易规则的方法[5]
;杨虎等将金融时间序列模型转化为线性模型以构造挖掘金融序列中隐含异常信息的方法[6];易东云等利用高阶相关性提出了一种金融数据中的时变非线性相关特性的挖掘方法[7]等。
本文采用作者所提出的一种挖掘方法)))TSEOPM (Time Series Event Omen Pattern M ining,时间序列事件征兆模式挖掘)对深、沪股市近年来的股票价格序列数据进行挖掘,利用挖掘出的局部预测模式(征兆模式)检验我国股市收益率的短期可预测性,以此分析探讨我国股市的有效性问题。
2 中国股市的弱有效性研究概述
我国股票市场是否已经达到弱有效,很多研究者采用不同的模型以及不同的样本股票、样本时期从不同的角度进行了检验研究,结论很不统一,有的认为已经达到弱有效,而有的则认为还未达到弱有效。例如,吴世农(1994年)对沪市199216~1993112期间的12种股票及综合指数的日数据,采用AR 模型,检验自相关系数是否为0,结果认为我国股市尚没达到弱有效[8]
;俞乔(1994年)对1994年4月28日以前沪、深两市综合指数的日收益率进行研究,采用随机游走模型,以Box-Pierce 检验、游程检验和Corrado -Schatzberg 非参量检验拒绝了
第13卷 第4期2005年 8月 中国管理科学Chinese Journal of Management Science
Vol.13,No.4
Aug., 2005
随机游走假设,说明了中国股市的非有效性质[9]
;而宋颂兴(1995年)采用沪市199311~1994110的29种股票的周收益率,进行游程检验和序列相关性检验,认为沪市已经达到弱有效[10]
;高鸿桢(1996年)则将1990112~1994112期间全样本区间划分为6个阶段,检验上证指数日收益率的自相关情况、保持涨跌的延续性及对新信息的反应速度,认为沪市的效率性不断提高,处于从无效市场向弱有效市场过渡的一种中间状态[11];闫冀楠,张维(1997年)选取1990年12月21日至1996年4月12日沪市综指数据,将有效性检验工作分成价格的单位根据检验和收益率的独立性检验两部分,结果表明上海股市不具弱有效[12];陈小悦等(1997年)对沪、深两市52种股票及20种指数199111~1996111的日收益率和周收益率进行研究,采用随机游走模型和Dick -ey Fuller 检验,认为沪市从1993年以后逐渐达到弱有效,深市则较早达到弱有效
[13]
;张思奇等(2000
年)将上证A 股指数分为两个阶段(199211~199513)和(199513~199816),采用ARMA-ARCH
-M 模型研究其日收益率序列,结果发现在GARCH 条件假定下,基本满足白噪声性质(尤其在第二阶段);但他认为这只说明当前收益与过去信息之间不存在简单的线性关系,并没有排除其它非线性关系,仅此推断市场弱有效过于主观
[14]
。张亦
春、周颖刚(2001年)选用1993年后的上证A 股综合指数作为样本,运用广义谱域分析进行弱有效检验,认为我国股市不具弱有效[15];程希骏等从沪市ST 板块中随机抽出选取14支股票,从深市的ST 板块中随机抽出选取8支股票采用单位根、方差比和BDS 检验方法研究了200017~2001112期间ST 板块的有效性问题,结果表明ST 板块的组合符合市场弱有效性,而个别ST 股票未能通过检验[16]。邱宜干(2001年)曾对1993年~2000年8月发表于国内一些主要杂志的、关于我国股市有效性实证研究的文章进行了统计。其中认为我国股市已经达到或接近弱有效的文献占52%,认为尚未达到弱有效的占40%,其它占8%[17]。
需要指出的是,以往这些研究一般都是建立在某个统计模型基础上,比如随机游走模型、AR 模型、ARCH 模型等。因而对有效市场的检验,与模型的正确与否有很大关系。/坏模型0问题会严重影响检验结果的正确性。模型法隐含了一种全局的观点,比如,以日数据为例,第t 天适应该模型,第t +1天、t +2天,第n 天也适应。而事实上,金融时间
序列具有非平稳、非线性特征,其随机性非常强,采
用一个全局模型来概括其运动特征显然很牵强。另外,模型方法常以模型对序列中的所有数据的适应为准则来确定实际参数,比如最小均方误差估计和极大似然估计,对淹没在大量随机数据中的局部模式而言,由于起决定作用的是无规律的随机数据,局部模式在全局模型中影响较小,很难被探测出来。这样一些局部具有预测作用的模式,在全局统计检验中有可能被忽略。从而即使序列中存在一些具有预测价值的局部模式,但全局性统计检验的结果仍然会认为市场是有效的,这必然造成结论的偏颇。
图1 某股票收益率时间序列(横轴为时间,纵轴为收益率)
3 挖掘序列局部预测模式的方法)))T SE O PM
为了从时间序列中获取具有预测作用的局部序列模式。我们研究了一种时间序列事件征兆模式挖掘方法(T ime Series Event Omen Pattern Mining ),简称TSEOPM 。限于篇幅,本文在此仅对其基本思想做简单介绍。详细阐述可参见文献[18]。TSEOMP 的目的是从时间序列中寻找对所感兴趣的事件具有预测作用的序列模式)))称为征兆模式。为了表征事件对挖掘者的有趣程度,引入事件兴趣函数,它是关于时间序列的子序列元素的函数。例如,图1是某只股票收益率时间序列X ={x 1,x 2,,,x n },若挖掘者对高于01015的收益率(称为事件标志条件值,图中模线所示)感兴趣,则可定义兴趣函数:f (t)=x t 。当f (t )>01015时即表示发生了感兴趣的事件,函数值越高,挖掘者越有兴趣。又例如分析者对连续三天出现的最大值感兴趣,并且该值越大越感兴趣。则可定义兴趣函数为:f (t)=max (x t-2,x t-1,x t )。通过事件兴趣函数,可以找出序列中事件发生前指定时间范围T 内、指定长度L 的所有子序列,对这些子序列进行特征提取,获得事件的征兆模式。征兆模式由征兆中心序列(即一个长为L 的子序列)和与该序列的相似程度范围来表
#18#中国管理科学 2005年