完整word版,bp神经网络算法

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

BP 神经网络算法三层BP 神经网络如图：

设网络的输入模式为T

n x x x x ),...,(21=，隐含层有h 个单元，隐含层的输出为

T h y y y y ),...,(21=，输出层有m 个单元，他们的输出为T m z z z z ),...,(21=，目标输出为T m t t t t ),...,,(21=设隐含层到输出层的传递函数为f ，输出层的传递函数为g

于是：)()(

1

∑∑===-=n

i i ij n

i i

ij j x w f x

w f y θ：隐含层第j 个神经元的输出；其中

1,

00=-=x w j θ

)(0

∑==h

j j jk k y w g z ：输出层第k 个神经元的输出

此时网络输出与目标输出的误差为∑=-=m k k k z t 1

2

)(21ε，显然，它是jk ij w w 和的函数。

下面的步骤就是想办法调整权值，使ε减小。

由高等数学的知识知道：负梯度方向是函数值减小最快的方向

因此，可以设定一个步长η，每次沿负梯度方向调整η个单位，即每次权值的调整为：

1x 3x 2x n x

隐含层，隐含层输出向量

ij w

传递函数

输入层，输入向量

目标输出向量

pq

pq w w ∂∂-=∆ε

η

，η在神经网络中称为学习速率可以证明：按这个方法调整，误差会逐渐减小。 BP 神经网络（反向传播）的调整顺序为： 1）先调整隐含层到输出层的权值设k v 为输出层第k 个神经元的输入∑==

h

j j jk

k y w

v 0

j k k k jk

k k k k m k k k jk m k k k jk y v g z t w v v z z z t w z t w )(')()(21)(211212

--=∂∂∂∂∂-=∂-=∂∂∑∑==ε -------复合函数偏导公式

若取x e x f x g -+==11)()(，则)1()111(11)1()('2k k v v v v k z z e

e e e u g k

k k k -=+-+=+=---- 于是隐含层到输出层的权值调整迭代公式为：

j k k jk jk y z z t w t w )1()()1(-+=+η

2）从输入层到隐含层的权值调整迭代公式为：

其中j u 为隐含层第j 个神经元的输入：∑==

n

i i

ij j x

w u 0

注意：隐含层第j 个神经元与输出层的各个神经元都有连接，即

j

y ∂∂ε

涉及所有的权值ij w ，因此

∑∑==--=∂∂∂∂∂-∂=∂∂m k jk k k k j k k k m k k k k j w u f z t y u u z z z t y 0

02)(')()(ε

于是：

因此从输入层到隐含层的权值调整迭代为公式为：

i j ij ij x t w t w ηδ+=+)()1(

ij

j j j j m k k k ij m k k k ij w u u y y z t w z t w ∂∂∂∂∂-=∂-=∂∂∑∑==1

212

)(21)(21εi j i j m k jk k k k ij m

k k k ij x x u f w u f z t w z t w δε-=--=∂-=∂∂∆==∑∑)('})('){()(2101

2

例：

下表给出了某地区公路运力的历史统计数据，请建立相应的预测模型，并对给出的2010和

73.3900 3.9635 0.9880

2011 75.5500 4.0975 1.0268

function main()

clc % 清屏

clear all; %清除内存以便加快运算速度

close all; %关闭当前所有figure图像

SamNum=20; %输入样本数量为20

TestSamNum=20; %测试样本数量也是20

ForcastSamNum=2; %预测样本数量为2

HiddenUnitNum=8; %中间层隐节点数量取8,比工具箱程序多了1个

InDim=3; %网络输入维度为3

OutDim=2; %网络输出维度为2

%原始数据

%人数(单位：万人)

sqrs=[20.55 22.44 25.37 27.13 29.45 30.10 30.96 34.06 36.42 38.09 39.13 39.99 ...

41.93 44.59 47.30 52.89 55.73 56.76 59.17 60.63];

%机动车数(单位：万辆)

sqjdcs=[0.6 0.75 0.85 0.9 1.05 1.35 1.45 1.6 1.7 1.85 2.15 2.2 2.25 2.35 2.5 2.6...

2.7 2.85 2.95

3.1];

%公路面积(单位：万平方公里)

sqglmj=[0.09 0.11 0.11 0.14 0.20 0.23 0.23 0.32 0.32 0.34 0.36 0.36 0.38 0.49 ...

0.56 0.59 0.59 0.67 0.69 0.79];

%公路客运量(单位：万人)

glkyl=[5126 6217 7730 9145 10460 11387 12353 15750 18304 19836 21024 19490 20433 ...

22598 25107 33442 36836 40548 42927 43462];

%公路货运量(单位：万吨)

glhyl=[1237 1379 1385 1399 1663 1714 1834 4322 8132 8936 11099 11203 10524 11115 ...

13320 16762 18673 20724 20803 21804];

p=[sqrs;sqjdcs;sqglmj]; %输入数据矩阵

t=[glkyl;glhyl]; %目标数据矩阵

[SamIn,minp,maxp,tn,mint,maxt]=premnmx(p,t); %原始样本对（输入和输出）初始化

rand('state',sum(100*clock)) %依据系统时钟种子产生随机数rand是产生0到1的均匀分布，randn是产生均值为0，方差为1的正态分布rand(n)或randn(n)产生n*n阶矩阵，rand(m,n)或randn(n)产生m*n的随机数矩阵

NoiseVar=0.01; %噪声强度为0.01（添加噪声的目的是为了防止网络过度拟合）

Noise=NoiseVar*randn(2,SamNum); %生成噪声

SamOut=tn + Noise; %将噪声添加到输出样本上

TestSamIn=SamIn; %这里取输入样本与测试样本相同因为样本容量偏少

TestSamOut=SamOut; %也取输出样本与测试样本相同

MaxEpochs=50000; %最多训练次数为50000

lr=0.035; %学习速率为0.035

E0=0.65*10^(-3); %目标误差为0.65*10^(-3)

W1=0.5*rand(HiddenUnitNum,InDim)-0.1; %初始化输入层与隐含层之间的权值

B1=0.5*rand(HiddenUnitNum,1)-0.1; %初始化输入层与隐含层之间的阈值

W2=0.5*rand(OutDim,HiddenUnitNum)-0.1; %初始化输出层与隐含层之间的权值

B2=0.5*rand(OutDim,1)-0.1; %初始化输出层与隐含层之间的阈值

ErrHistory=[]; %给中间变量预先占据内存

for i=1:MaxEpochs

HiddenOut=logsig(W1*SamIn+repmat(B1,1,SamNum)); % 隐含层网络输出

NetworkOut=W2*HiddenOut+repmat(B2,1,SamNum); % 输出层网络输出

Error=SamOut-NetworkOut; % 实际输出与网络输出之差SSE=sumsqr(Error) %能量函数（误差平方和）