基于BP网络的股票数据预测模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于BP网络的股票数据
预测模型
姓名:江政
班级:控制2015级
学号:2015028081100015
2016 年6月 26日
需求分析和网络结构设计
根据我们对自然神经系统的构造和机理的认识,神经系统是由大量的神经细胞(神经元)构成的复杂的网络,人们对这一网络建立一定的数学模型和算法,设法使它能够实现诸如基于数据的模式识别,函数映射等带有“智能”的功能,这种网络就是神经网络。其中,BP (Back Propagation )神经网络是1986年由Rumelhart 和McCelland 为首的科学家小组提出,是一种按误差反向传播算法训练的多层前馈网络。BP 网络能学习和存贮大量的输入—输出模式映射关系,而
其他神经网络具有重要作用。
针对150组股票数据进行拟合(详细数据请见《附件1》),选取其中的开盘、最高、最低、收盘和成交次数五组数据,用当日的这五组数据来预测次日的收盘数据,从而等效建立一个股票数据预测模型。采用包括输入层、隐含层和输出层的三层BP 网络结构,如图1所示,输入层包含五个神经元,隐含层包含三个神经元,输出层为一个神经元。其中,隐含层神经元的激活函数采用非对称型Sigmoid 函数,函数表达式为:))exp(1/(1)(x x f -+=,输出层神经元的激活函数采用线性函数,表达式为:x x f =)(。将150组数据分为三等份,其中两份作为训练样本,用来对网络进行训练学习;另外一份作为测试样本,用来检验所训练出的网络的泛化能力。采用BP 算法对隐含层和输出层权值进行修正,以达到计算输出和实际样本输出相差最小,最终实现较精确预测的目的。
图1 预测模型的网络结构
MATLAB源程序(版本不限)
clear all
clc
clf
%采用三层BP网络结构
%输入层神经元数为5,隐含层神经元数为3,输出层神经元数为1
%最大迭代次数
maxcishu=5000;
%e为计算输出和样本实际输出差
%在内存中开辟maxcishu个存储空间
e=zeros(maxcishu,1);
% 输入数据维度5,输入节点数5
% maxp当日最高价序列
% minp当日最低价序列
% sp当日开盘价
% ep当日收盘价
% tnum当日成交量
% 调用数据
%shuju=xlsread('dm.xlsx', 'B1:K151');
shuju=importdata('dm.xlsx');
sp=shuju.data(:,1)';
maxp=shuju.data(:,2)';
minp=shuju.data(:,3)';
tnum=shuju.data(:,10)';
ep=shuju.data(:,4)';
%将数据集按照2:1分为训练样本集,和测试样本集
jishu=length(ep);
jishu=ceil(jishu/3*2) ;
%测试样本集是2/3处到最后一个
spt=sp(jishu+1:end);
maxpt=maxp(jishu+1:end);
minpt=minp(jishu+1:end);
tnumt=tnum(jishu+1:end);
ept=ep(jishu+1:end);
%训练样本集
sp=sp(1:jishu);
maxp=maxp(1:jishu);
minp=minp(1:jishu);
tnum=tnum(1:jishu);
ep=ep(1:jishu);
%记录下每组的最大值最小值,为训练样本集的归一化准备
maxp_max=max(maxp);
maxp_min=min(maxp);
minp_max=max(minp);
minp_min=min(minp);
ep_max=max(ep);
ep_min=min(ep);
sp_max=max(sp);
sp_min=min(sp);
tnum_max=max(tnum);
tnum_min=min(tnum);
% 目标数据为次日的收盘价,相当于把当日收盘价时间序列向前挪动一个单位goalp=ep(2:jishu);
%数据归一化,将所有数据归一化到(0 1)
guiyi=@(A)((A-min(A))/(max(A)-min(A)));
maxp=guiyi(maxp);
minp=guiyi(minp);
sp=guiyi(sp);
ep=guiyi(ep);
tnum=guiyi(tnum);
% 后面的目标数据goalp个数是ep向前移动一位得到,所以最后一组的目标数据缺失
% 所以,要把除了目标数据goalp以外的所有数据序列删除最后一个
maxp=maxp(1:jishu-1);
minp=minp(1:jishu-1);
sp=sp(1:jishu-1);
ep=ep(1:jishu-1);
tnum=tnum(1:jishu-1);
%需要循环学习次数loopn,即训练样本的个数
loopn=length(maxp);
%为了方便表示将5个行向量放到一个5*loopn的矩阵中simp中,每一列是一个样本向量
simp=[maxp;minp;sp;ep;tnum];