完整word版,bp神经网络算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
BP 神经网络算法 三层BP 神经网络如图:
设网络的输入模式为T
n x x x x ),...,(21=,隐含层有h 个单元,隐含层的输出为
T h y y y y ),...,(21=,输出层有m 个单元,他们的输出为T m z z z z ),...,(21=,目标输出为T m t t t t ),...,,(21=设隐含层到输出层的传递函数为f ,输出层的传递函数为g
于是:)()(
1
∑∑===-=n
i i ij n
i i
ij j x w f x
w f y θ:隐含层第j 个神经元的输出;其中
1,
00=-=x w j θ
)(0
∑==h
j j jk k y w g z :输出层第k 个神经元的输出
此时网络输出与目标输出的误差为∑=-=m k k k z t 1
2
)(21ε,显然,它是jk ij w w 和的函数。
下面的步骤就是想办法调整权值,使ε减小。
由高等数学的知识知道:负梯度方向是函数值减小最快的方向
因此,可以设定一个步长η,每次沿负梯度方向调整η个单位,即每次权值的调整为:
1x 3x 2x n x
隐含层,隐含层输出向量
ij w
传递函数
输入层,输入向量
目标输出向量
pq
pq w w ∂∂-=∆ε
η
,η在神经网络中称为学习速率 可以证明:按这个方法调整,误差会逐渐减小。 BP 神经网络(反向传播)的调整顺序为: 1)先调整隐含层到输出层的权值 设k v 为输出层第k 个神经元的输入∑==
h
j j jk
k y w
v 0
j k k k jk
k k k k m k k k jk m k k k jk y v g z t w v v z z z t w z t w )(')()(21)(211212
--=∂∂∂∂∂-=∂-=∂∂∑∑==ε -------复合函数偏导公式
若取x e x f x g -+==11)()(,则)1()111(11)1()('2k k v v v v k z z e
e e e u g k
k k k -=+-+=+=---- 于是隐含层到输出层的权值调整迭代公式为:
j k k jk jk y z z t w t w )1()()1(-+=+η
2)从输入层到隐含层的权值调整迭代公式为:
其中j u 为隐含层第j 个神经元的输入:∑==
n
i i
ij j x
w u 0
注意:隐含层第j 个神经元与输出层的各个神经元都有连接,即
j
y ∂∂ε
涉及所有的权值ij w ,因此
∑∑==--=∂∂∂∂∂-∂=∂∂m k jk k k k j k k k m k k k k j w u f z t y u u z z z t y 0
02)(')()(ε
于是:
因此从输入层到隐含层的权值调整迭代为公式为:
i j ij ij x t w t w ηδ+=+)()1(
ij
j j j j m k k k ij m k k k ij w u u y y z t w z t w ∂∂∂∂∂-=∂-=∂∂∑∑==1
212
)(21)(21εi j i j m k jk k k k ij m
k k k ij x x u f w u f z t w z t w δε-=--=∂-=∂∂∆==∑∑)('})('){()(2101
2
例:
下表给出了某地区公路运力的历史统计数据,请建立相应的预测模型,并对给出的2010和
73.3900 3.9635 0.9880
2011 75.5500 4.0975 1.0268
function main()
clc % 清屏
clear all; %清除内存以便加快运算速度
close all; %关闭当前所有figure图像
SamNum=20; %输入样本数量为20
TestSamNum=20; %测试样本数量也是20
ForcastSamNum=2; %预测样本数量为2
HiddenUnitNum=8; %中间层隐节点数量取8,比工具箱程序多了1个
InDim=3; %网络输入维度为3
OutDim=2; %网络输出维度为2
%原始数据
%人数(单位:万人)
sqrs=[20.55 22.44 25.37 27.13 29.45 30.10 30.96 34.06 36.42 38.09 39.13 39.99 ...
41.93 44.59 47.30 52.89 55.73 56.76 59.17 60.63];
%机动车数(单位:万辆)
sqjdcs=[0.6 0.75 0.85 0.9 1.05 1.35 1.45 1.6 1.7 1.85 2.15 2.2 2.25 2.35 2.5 2.6...
2.7 2.85 2.95
3.1];
%公路面积(单位:万平方公里)
sqglmj=[0.09 0.11 0.11 0.14 0.20 0.23 0.23 0.32 0.32 0.34 0.36 0.36 0.38 0.49 ...
0.56 0.59 0.59 0.67 0.69 0.79];
%公路客运量(单位:万人)
glkyl=[5126 6217 7730 9145 10460 11387 12353 15750 18304 19836 21024 19490 20433 ...
22598 25107 33442 36836 40548 42927 43462];
%公路货运量(单位:万吨)
glhyl=[1237 1379 1385 1399 1663 1714 1834 4322 8132 8936 11099 11203 10524 11115 ...
13320 16762 18673 20724 20803 21804];
p=[sqrs;sqjdcs;sqglmj]; %输入数据矩阵
t=[glkyl;glhyl]; %目标数据矩阵
[SamIn,minp,maxp,tn,mint,maxt]=premnmx(p,t); %原始样本对(输入和输出)初始化
rand('state',sum(100*clock)) %依据系统时钟种子产生随机数rand是产生0到1的均匀分布,randn是产生均值为0,方差为1的正态分布rand(n)或randn(n)产生n*n阶矩阵,rand(m,n)或randn(n)产生m*n的随机数矩阵
NoiseVar=0.01; %噪声强度为0.01(添加噪声的目的是为了防止网络过度拟合)
Noise=NoiseVar*randn(2,SamNum); %生成噪声
SamOut=tn + Noise; %将噪声添加到输出样本上
TestSamIn=SamIn; %这里取输入样本与测试样本相同因为样本容量偏少
TestSamOut=SamOut; %也取输出样本与测试样本相同
MaxEpochs=50000; %最多训练次数为50000
lr=0.035; %学习速率为0.035
E0=0.65*10^(-3); %目标误差为0.65*10^(-3)
W1=0.5*rand(HiddenUnitNum,InDim)-0.1; %初始化输入层与隐含层之间的权值
B1=0.5*rand(HiddenUnitNum,1)-0.1; %初始化输入层与隐含层之间的阈值
W2=0.5*rand(OutDim,HiddenUnitNum)-0.1; %初始化输出层与隐含层之间的权值
B2=0.5*rand(OutDim,1)-0.1; %初始化输出层与隐含层之间的阈值
ErrHistory=[]; %给中间变量预先占据内存
for i=1:MaxEpochs
HiddenOut=logsig(W1*SamIn+repmat(B1,1,SamNum)); % 隐含层网络输出
NetworkOut=W2*HiddenOut+repmat(B2,1,SamNum); % 输出层网络输出
Error=SamOut-NetworkOut; % 实际输出与网络输出之差SSE=sumsqr(Error) %能量函数(误差平方和)