BP神经网络在股票预测中的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最高价 5 . 38 5 . 03 5 . 27 5 . 50 4 . 94 4 . 78 4 . 72 5 . 03 5 . 04
最低价 5 . 15 4 . 78 4 . 62 4 . Fra Baidu bibliotek0 4 . 75 4 . 49 4 . 58 4 . 53 4 . 80
收盘价 5 . 18 4 . 79 5 . 27 4 . 91 4 . 87 4 . 55 4 . 67 4 . 96 4 . 84
准 确 率 /% 66 . 7 80 50
由表 2 可知,3 日交叉时间序列样本,预测准确率最 高 , 达 到 80% 。 而 5 日 交 叉 时 间 序 列 样 本 预 测 准 确 率 最 低 , 只 有 50% 。 对 于 股 票 短 期 的 走 势 可 能 受 到 国 家 政 策 因 素 (比 如 降 息 、经 济 振 兴 规 划 等 ),外 围 股 票 市 场 多 方 面的影响, 5 日交叉时间序列数据可能存在一定的噪 声,使最终预测的结果偏低。 比较 3 日交叉时间序列和 1 日时间序列预测的结果,发现 3 日预测的正确率远高 于 1 日的正确率,从中可以看出,第(m+1)天的股价不仅 受第 m 天股价的影响还受(m-1)天股价的影响 ,只是影 响股价的程度不一样而已。 由此可以看出时间序列数据 之间存在相互依赖性,选择好时间周期对预测结果的准 确率起到关键作用。
(1)正 向 传 播 过 程 中 隐 层 的 输 出 可 表 示 为 :
n
Σ yi= f ( vij xi) j = 1 ,2 , … ,m i=0
其 中 x0=-1 是 隐 层 神 经 元 引 入 阈 值 而 设 定 的 。 输出层的输出可表示为:
m
Σ ok= f ( wij yi) k= 1 ,2 , … ,l j=0
2009 年 1 月 5 日 共 60 天 数 据 ,2009 年 1 月 6 日 ~2009
年 1 月 21 日 共 12 天 数 据 ) , 预 测 结 果 如 表 2 所 示 。
表 2 1 日、3 日和 5 日交叉时间序列预测结果
m 日交叉时间序列 1 3 5
样本数/个 60 58 56
测试样本数/个 12 10 8
基 础 上 运 用 BP 算 法 对 股 票 时 间 序 列 短 期 的 走 势 进 行 预 测 分 析 。 实 验 结 果 表 明 此 方 法 效 果 良 好 , 识 别
率高,具有一定的实用价值。
关 键 词 : 时 间 序 列 ;BP 算 法 ; 股 票 预 测
中 图 分 类 号 : TP183
文献标识码: B
其 中 y0=-1 是 输 出 层 神 经 元 引 入 阈 值 而 设 定 的 。 (2)反向传播过程中输出层的权值修改可表示为: △wjk= η ( dk- ok) ok( 1- ok) yi k = 1 , 2 , … , l ; j = 0 , 1 , … , m 隐层的权值修改可表示为:
l
Σ0
定义:若第 m 日的收盘价小于第(m+1)日的收盘价, 令期望值为 0,表示股价下跌;反之若第 m 日的收盘价 大于第 m+1 日的收盘价,令期望值为 1,表示股价上涨。 部分样本信息如表 1 所示。
为了更好地反映时间序列数据内部之间的关联性, 引 入 m 日 交 叉 时 间 序 列 。 样 本 集 X={x(t1),x(t2), … ,x(tn)}, 其 中 x(ti)为 第 i 个 交 易 日 样 本 数 据 , 令 x(ti)= ( vi1, vi2, vi3,vi4) i = 1 , 2 , … , n , 其 中 vi1, vi2, vi3,vi4 分 别 代 表 第 i 天 的 开 盘 价、最高价、最低价和收盘价。 于是可得 m 日交叉时间 序列样本为:
Key words : time series ; BP algorithm ; stock prediction
股票是证券市场的重要组成部分,股票的发行和交 易促进了市场经济的发展。 而股票市场是一个高度复杂 的非线性动态系统,其变化规律由于受经济、政治、公司 经营状况和市场人气等多方面的影响,使股票价格走势 呈现不规律性。 为了能够预测其变化趋势,人们研究出 了 一 些 股 票 分 析 方 法 [1-2], 如 : 技 术 分 析 法 ( 移 动 平 均 法 MA 、 成 交 量 图 法 VOL 等 ) 、 基 本 面 分 析 ( 宏 观 经 济 、 国 际 政治、公司经营状况等)和心理分析(股票市场中的羊群 效应)等。 而这些方法大部分是线性模型,对股票短期走 势 预 测 效 果 不 是 很 理 想 。 而 BP 神 经 网 络 [3] 能 够 把 输 入 输出问题转化为非线性映射问题,即完成由 n 维输入空 间到 m 维输出空间的非线性映射, 能很好地解决非线 性问题。 本文利用时间序列对股票价格的原始数据进行 预 处 理 , 然 后 利 用 BP 神 经 网 络 对 上 证 A 股 皖 维 高 新 近 期股价涨跌走势进行了预测。
△vjk= η ( δ k wik) yi( 1 - yj) xi k=1 0
其 中 δ k =(dk-ok)ok(1 - ok) k =1 ,2 , … ,l ;i =0 ,1 , … ,n ;η 为 学习速率。 3 使 用 BP 神 经 网 络 对 股 票 进 行 预 测 3.1 数据处理
文中皖维高新股票数据是从华林证券软件上证 A 股 日线报表中整理而得, 每个样本数据包括开盘价、 最高 价、 最低价和收盘价 4 个特征属性以及第 m 日的收盘价 和第(m+1)日的收盘价比较结果的样本,即目标期望值。
应用奇葩 Example of Application
BP 神经网络在股票预测中的应用
王爱平,陶嗣干,王占凤 ( 安 徽 大 学 计 算 智 能 与 信 号 处 理 教 育 部 重 点 实 验 室 , 安 徽 合 肥 230039)
摘 要 : 介 绍 了 时 间 序 列 和 BP 神 经 网 络 算 法 , 并 给 出 信 号 正 向 传 播 和 误 差 反 向 传 播 的 公 式 , 在 此
78
部分构成,即长期或趋势变化、循环变化、季节性变化 和随机变化。 本文研究时间序列短期趋势变化,来获取 所 需 要 的 知 识 。 对 于 样 本 集 X ={ x (t1) ,x (t2) , … ,x (tn)} , 每 一 个 训 练 样 本 x (ti) 由 一 些 重 要 的 特 征 属 性 组 成 , 令 Y = {y (t1) ,y (t2) , … ,y (tn)} 为 目 标 期 望 , 即 由 特 征 属 性 所 决 定 的决策属性值。 例如在股票涨跌预测中,一只股票每天 的开盘价、最高价、最低价和收盘价等特征属性影响次 日股票的走势。 由此可以按日时间序列来构造样本向 量, 但这种方式没有考虑到时间序列数据前后相互影 响,割裂了时序特性。 为了更好地反映时间序列数据之 间的关系, 将前 N 天的股票特征属性对当日股票的影 响也考虑进来,从而可以得到 N 天时间序列,这时得到 的 样 本 中 特 征 属 性 增 加 了 许 多 , 给 BP 网 络 训 练 增 加 了 难度。 由于股票的涨跌是依据昨日与今日收盘价的高低 比较得到的, 这时可以约去前 N-1 天的开盘价、 最高 价、最低价,得到前 N-1 天的收盘价和第 N 天开盘价、 最高价、最低价和收盘价样本,从而使网络得到进一步 简化。
期望值 0 1 0 0 0 1 1 0 0
其 中 oi 为 第 (m+1) 日 股 价 的 期 望 值 。
3.2 网络参数的确定
由于股价涨跌期望值是由 1 或 0 组成,故网络的传
递函数选择单极性
Sigmoid
函数,即
f(x)=
1 1+e-x
,用测试
样本预测时 ,设网络输出向量 为 O,若分 量值 大于 0.5,
2 BP 算 法 BP 神 经 网 络 是 人 工 神 经 网 络 的 重 要 模 型 之 一 , 也
《 微 型 机 与 应 用 》 2010 年 第 6 期
应用奇葩 Example of Application
是目前应用最广泛的一种多层前馈神经网络,可以解决 大 多 数 神 经 网 络 面 临 的 问 题 。 BP 算 法 [3,5] 的 思 想 是 学 习 过程由信号的正向传播与误差的反向传播两个过程组 成,若输出层的实际输出与目标期望不符,则转入误差 的反向传播,调整各层神经元的权值,此过程一直进行 到训练网络预先设定好的学习次数或小于网络输出的 误 差 值 。 目 前 使 用 最 多 的 是 三 层 BP 网 络 , 包 括 输 入 层 、 隐 层 和 输 出 层 。 设 三 层 BP 网 络 , 输 入 向 量 为 X=(x1, … , xi , … , xn) T , 隐 层 输 出 向 量 为 Y = ( y1, … , yj , … , ym) T , 输 出 层 输 出 向 量 为 O = ( o1,o2, … ,ok, … ,ol)T, 期 望 输 出 向 量 为 d = ( d1,d2, … ,dk, … ,dl)T, 输 入 层 到 隐 层 之 间 的 权 值 为 V =( V1,V2, … ,Vj , … ,Vm) , 隐 层 到 输 出 层 之 间 的 权 值 为 W =( W1,W2, … ,Wk, … ,Wl) 。
New stock forecast based on BP neural network
WANG Ai Ping ,TAO Si Gan ,WANG Zhan Feng
(Ministry of Education Key Laboratory of Intelligent Computing & Signal Processing, Anhui University, Hefei 230039 , China)
Abstract : The concept of time series and BP neural network algorithm are introduced in this paper. The signal forward propagation and error back propagation formula are proposed through studying the BP neural network algorithm. According to this, the short - term trend prediction and analysis of the stock time series are completed by using BP algorithm. Experimental results show that the result is excellent, the recognition rate is high.
y1= {x(t1),x(t2),… ,x(tm),om+1} y2= {x(t2),x(t3),… ,x(tm+1),om+2}… yn-m+1= { x(tn-m+1),x(tn-m+2),… ,x(tn),on+1}
《 微 型 机 与 应 用 》 2010 年 第 6 期
表 1 皖维高新股票部分训练样本和期望值
时间 2008 - 10 - 09 2008 - 10 - 10 2008 - 10 - 13 2008 - 10 - 14 2008 - 10 - 15 2008 - 10 - 16 2008 - 10 - 17 2008 - 10 - 20 2008 - 10 - 21
开盘价 5 . 36 4 . 81 4 . 80 5 . 42 4 . 88 4 . 53 4 . 61 4 . 61 5 . 00
1 时间序列 对某一 个或 一组变 量 x(t)进 行观 察测量 ,将在 一系
列 时 刻 t1,t2, … , tn( t 为 自 变 量 且 t1< t2< … < tn) 所 得 到 的 离 散 数 据 组 成 的 序 列 集 合 {x (t1) ,x (t2) , … ,x (tn)} 称 之 为 时 间 序 列 [4] , 记 为 X={ x (t1) ,x (t2) , … ,x (tn)} 。 一 般 时 间 序 列 由 4
判 为 1 ; 反 之 , 判 为 0 。 使 用 Matlab 工 具 箱 提 供 的 自 适 应
lr 的 BP 算 法 训 练 函 数 , 网 络 训 练 要 求 输 出 误 差 E≤1e-3。
3.3 实验结果
以皖维高新为例,对该股票信息按照 1 日、3 日和 5 日
交 叉 时 间 序 列 进 行 数 据 整 理 ( 时 间 从 2008 年 10 月 9 日 ~