基于模式识别技术的股票市场技术分析研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为此 ,我们设计了一种基于样本和核的相似性度量的模糊主
轴核聚类算法 。该算法在样本分类数目未知的情况下 , 不仅
能对类的自然分布为球状或接近球状的样本作有效聚类 , 对 一些类的自然分布为非球状的样本也能作出较有效聚类 。该 算法具体步骤如下 :
步骤一 、对 n 个样本 yl 采用最近距离 、最远距离 、均值距 离三种相似性度量分别进行分级聚类 , 得到各自的分类数目 Ci ,并通过 K—L 变换得到主轴核函数 Kij 。其中 i = 1 ,2 ,3 j = 1 , . . . , Ci l = 1 , . . . , n 。
ABSTRACT :This paper presents a new method for intelligently using technical indexes to analyse stock market by pattern recognition. The method is based on the character space of some technical indexes disposed , uses clustering technique to find the order of stocks. And the clustering arithmetic , designed by the characters of stocks , is a rather feasible arithmetic of fuzzy principal axis clustering. We had analysed Shanghai Stock Exchange (SSE) and the stock“Wu Niang Ye”. The re2 sults show the method can not only reduce the difficulty and potential subjectivity in the traditional technical analysis , but al2 so efficiently utilize the annal data to predict the tendency of the stock objectively. KEYWORDS :Stock ; Technical analysis ; Pattern recognition ; Clustering
函数 Ji
∑∑ Ji =
( uj ( yi) ) bΔ( yl , Kij)
ji
若 Ji 改变低于某一阈值θ, 继续进行下一步运算 , 否则 转回到 ②。
end 步骤三 、判断最优聚类 。 按下列规则 : 若 Ji = min ( Ji) 则 Γij 为最优聚类 。 算法中 Δ为欧氏距离 。
4 实例分析一
Technical Analysis Based on Pattern Recognition
SONG Heng1 ,ZHANG Yang2
(1. School of Engineering , The Air Force University of Engineering , Xi’an Shanxi 710038 , China ; 2. School of Economics , fu dan University , Shanghai 200433 , China)
1 概述
股票市场是由投资者群体行为构成的 ,领先了众多投资 者也就领先了市场 。在信息技术充分发达的今天 ,投资者所 能获得的咨询信息在时间和内容上几乎没有差别 。谁能首 先对信息进行正确分析和判断 ,谁就能抢占一步先机 。技术 分析是股票市场中广泛运用的一种经典分析方法 ,主要特点 是具有较强的理性和客观性 。但传统技术分析方法众多 ,其 技术指标数目繁多 ,研判法则也是仁者见仁 、智者见智 ,更不 用说个别指标偶尔还会发出骗信号 ,这些都潜在地增加了技 术分析的主观性和困难性 。
第 21 卷 第 7 期 文章编号 :1006 - 9348 (2004) 07 - 0142 - 04
计 算 机 仿 真
2004 年 7 月
基于模式识别技术的股票市场技术分析研究
宋恒1 ,张杨2
(1. 空军工程大学工程学院 ,陕西 西安 710038 ;2. 复旦大学经济学院 ,上海 200433) 摘要 :研究从统计模式识别的角度出发 ,智能的利用技术指标作股市技术分析 。利用处理后的一些技术指标形成特征空间 , 在特征空间上用聚类技术寻找股市规律 。所用聚类算法是根据股市特点设计的一种较适宜的模糊主轴核聚类算法 。通过 大盘和个股实例分析 ,该方法能降低传统技术分析的难度和潜在主观性 ,并能较充分利用历史数据包含的信息 ,对市场趋势 作出客观分析 。 关键词 :股票 ;技术分析 ;模式识别 ;聚类 中图分类号 :TP391 文献标识码 :B
近年来 ,基于数据的机器学习理论[1] 在股市分析中得到 广泛应用 ,主要是从函数拟合的角度作时间序列预测 。神经 网络作为一种具有自学习能力的高度非线性系统 ,理论上能 在任意精度上逼近任一定义在致密集上的非线性函数 ,因此 在时间序列预测问题上表现出非凡的优越性 。但由于神经 网络缺乏统计意义 ,在对股市这样一个样本数据 (历史数据)
图中 ,系统 S 是我们研究的对象 , 它在一定的输入 x 下
得到一定的输出 y , LM 是我们所求的学习机 ,输出为 。
有三类基本的机器学习问题 :模式识别 、函数逼近 、概率
密度估计 。当把要研究的规律抽象成分类关系时 , 这种机器
学习问题就是模式识别[8] 。
2) 模糊主轴核聚类算法
对股市分析问题 , 采用非监督模式识别方法较为适宜 。
步骤二 、进行模糊聚类 。 for i = 1 ,2 ,3 ①初始划分选为 Ci ,初始核为 Kij 。 ②按下列规则 :
∑ uj ( yl) =
(Δ( yl , Kij) ) - 1/ ( b- 1) (Δ( yl , Kij) ) - 1/ ( b- 1)
,b
>Βιβλιοθήκη Baidu
1
若 uj ( yl) = max ( uj ( yl) ) 则 yl ∈Γij (将每个样本 yl 分到相应聚类Γij 中) 。 ③按 K—L 变换重新修正主轴核函数 Kij ,计算聚类损失
指数分析是技术分析的一种 ,是以技术指标为对象进行 的分析 。从二十世纪八十年代以来 ,驰骋在证券市场的技术 分析大师们将自己的聪明才智与实战经验融汇成了多种技 术指标 。这些指标均能在一定时期 、一定程度上反映市场某 一方面的特性 ,而这一特性又往往不易被人们察觉到 。从模 式识别的角度 ,我们可以认为技术指标是一种特征提取方 式 。因此 ,我们可以根据不同的分析对象适当选取技术指 标 ,经过一定处理后建立特征空间 。这样 ,就可以通过聚类 的方法来分析股票市场 。
— 143 —
数在深层特征空间的聚类结果也开始出现下跌趋势信号 (见 图 3 中 ⑥) 。这告诉我们 ,上升趋势已告结束 ,下跌趋势接踵 而来 。
可见 ,该聚类分析法对大盘趋势的分析 、预测是较为成 功的 。
图 2 沪市牛市行情聚类分析图
道氏理论指出 ,市场的上升趋势主要可分三个阶段 :第 一阶段是建仓 (或积累) ,第二阶段是价格稳定上涨 ,第三阶 段是市场高峰 ,随后进入市场下跌趋势 。由图 2 可见 ,道氏 理论所指出的牛市行情的各个阶段在聚类分析下被识别得 十分清楚 。同时我们看到 ,不管是表面特征还是深层特征 , 两段行情的演化过程都表现得非常吻合 ,因此我们有理由认 为 ,这是一个典型的历史重演事例 。在历史还会重演的假设 前提下 ,我们提取出两段牛市行情的特征 ,做后市分析与预 测。
收稿日期 :2003 - 07 - 03
— 142 —
有限且存在大量噪声的系统进行分析时 ,必然陷入难以解决 的过学习和欠学习问题 。有文献[2 ,3 ,4] 利用小波变换在拟合 前对数据进行过滤 ,取得了一定效果 ,但因为噪声源的未知 , 也不 易 掌 握 过 滤 分 寸 。1989 年 美 国 学 者 Schinkman 和 LeBaron 发现了股票日收益序列与周收益序列中存在混沌现 象[5] 。股市中混沌现象的发现 ,从动力学的角度证明了对股 市数据进行时间序列预测的科学性 ,但同时也说明了时间序 列预测在股市中只能具有短期效应 。
在本文中 ,我们研究从统计模式识别的角度出发 ,智能 地利用技术指标作技术分析 ,以期在有效解决欠学习和过学 习问题的基础上 ,降低传统技术分析的主观性和困难性 。本 文采用的模式识别核心技术是针对股市特点设计的一种模 糊主轴核聚类算法 。该算法能在分类数目未知的情况下 ,对 类的自然分布为球状 、近球状 、甚至非球状的样本均作出较 有效的聚类 。我们选取上证指数和五粮液分别作为大盘和 个股实例 ,用一定的技术处理方法分别建立特征空间 (表面 特征空间 、深层特征空间) ,在特征空间上进行聚类分析 ,并 作寻找最佳建仓区和平仓区的预测试验 。结果表明 ,该方法
首先 ,我们以上证指数作大盘实例分析 。 1) 确定大盘特征空间 经研究 ,我们为大盘选取了两种特征空间 : ①将上证指 数的五个基本数据 (开盘 、收盘 、最高 、最低点数和成交量) 经 30 日指数平滑后作为表面特征 , ②将上证指数六个技术指标 (迪马克尔指标 DMKI、聚散指标 A/ D、离差平均值 DEA、移动 平均摆动量 MAOSC、资金流动指数 MFI、量相对强弱指标 VR2 SI) 经处理后作为深层特征 。 2) 提取典型上涨行情 (牛市) 特征 我们研究了上证指数从 1997 年以来的历史数据 ,发现 在 1998 年 3 月 10 日 ———1998 年 8 月 27 日 、2001 年 2 月 16 日 ———2001 年 8 月 13 日沪市出现了两次形态相仿的牛市行 情 。用聚类技术对以上两段牛市行情对应的特征空间进行 聚类分析 ,结果如图 2 。其中 ①、②分别为前后两次牛市在表 面特征空间的聚类分析图 , ③、④为在深层特征空间的聚类 分析图 。(图 2 —图 3 中粗曲线为收盘点数的 30 日指数平滑 均线 ,细曲线为收盘点数原始曲线 。横轴表示交易日 ,单位 : 日 ;纵轴表示价格 ,单位 :元 。)
3 模式识别技术
1) 机器学习
基于数据的机器学
习是现代智能技术中十
分重要的一个方面 ,主
要研究如何从一些观察 数据 (样本) 出发得出目
图 1 机器学习的基本模型
前尚不能通过原理分析得到的规律 ,利用这些规律去分析客
观对象 ,对未来数据或无法观察的数据进行预测 。机器学习
问题的基本模型如图 1 。
能在很大程度上充分利用历史资料包含的信息 ,提供较客观 的市场趋势分析指导 。
2 技术分析
在股票市场中 ,通过对反映市场状况的基本数据资料 (开盘价 、收盘价 、最高价 、最低价 、成交量等) 进行分析 ,判断 整个股市或个别股价未来的变化趋势 ,以探讨股市里投资行 为的可能轨迹 ,就叫做技术分析 。技术分析是一种完全根据 市场行情变化来进行分析的分析方法 ,其理论前提有三 :市 场行为涵盖一切 ( Everything Is Discounted And Reflected In Mar2 ket Prices) 、价 格 依 据 趋 势 移 动 ( Prices Move In Trends And Trends Persist) 、历史往往重演 (Market Action Is Repetitive) [6] 。 相信“历史往往重演”是通过过去预测未来市场走向的前提 , 是数学外推法的应用基础 。纵观国内外的股票市场 ,我们一 方面认识到股价并不像随机行走论[7] 所言在毫无规律的变 动 ,而是重演着某种可识别的形态 ;另一方面 ,历史也并非简 单的重复 。如何准确地把握住历史重演的时机 ,是技术分析 研究的重要任务 。