智能控制之神经网络系统辨识的设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

四、神经网络系统辨识分析(25分)

用BP 神经网络进行系统在线逼近的原理框图如图3所示

)

(k y n (k u (k y

图3 图4

假设某控制对象的模型为2

3

)1(1)

1()()(-+-+

=k y k y k u k y ,采样时间取t=1ms ,输入信号

t)sin(650.)u(π=k 。采用的BP 神经网络结构如图4所示,权值ij w 和2j w 的初值取 [-1,+1]

之间的随机值,权值采用δ学习算法,学习速率η取0.50,动量因子α取0.05。试分析神经网络在线逼近的运行过程,并作Matlab 仿真。

题目四、需要阐述清楚BP 网络逼近控制对象的工作原理和学习过程

BP 算法的基本思想是:对于一个输入样本,经过权值、阈值和激励函数运算后,得到一个输出y n (k),然后让它与期望的样本y(k)进行比较,若有偏差,则从输出开始反向传播该偏差,进行权值、阈值调整,使网络输出逐渐与希望输出一致。

BP 算法由四个过程组成:输入模式由输入层经过中间层向输出层的“模式顺传播”过程,网络的希望输出与网络的实际输出之间的误差信号由输出层经过中间层向输入层逐层修正连接权的“误差逆传播”过程,由“模式顺传播”与“误差逆传播”的反复交替进行的网络“记忆训练”过程,网络趋向于收敛即网络的全局误差趋向极小值的 “学习收敛”过程。

BP 网络(Back Propagation ),该网络是一种单向传播的多层前向网络。误差

反向传播的BP 算法简称BP 算法,其基本思想是梯度下降法。它采用梯度搜索技术,以期使网络的实际输出值与期望输出值的误差均方值为最小。

BP 网络特点:

(1)是一种多层网络,包括输入层、隐含层和输出层; (2)层与层之间采用全互连方式,同一层神经元之间不连接; (3)权值通过δ学习算法进行调节;

(4)神经元激发函数为S 函数;

(5)学习算法由正向传播和反向传播组成; (6)层与层的连接是单向的,信息的传播是双向的。 BP 网络结构:

含一个隐含层的BP 网络结构如图4-1所示,图中i 为输入层神经元,j 为隐层神经元,k 为输出层神经元。

)

(k y n )

(k u )

(k y

图4-1 BP 神经网络结构

BP 网络的逼近:

BP 网络逼近的结构如图4-2所示,图中变量k 为网络的迭代步骤。BP 为网络逼近器,y(k)为被控对象实际输出,y n (k)为BP 的输出。将系统输出y(k)及输入u(k)的值作为逼近器BP 的输入,将系统输出与网络输出的误差作为逼近器的调整信号。

图4-2 BP 神经网络逼近

BP 算法的学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐层逐层处理,并传向输出层,每层神经元(节点)的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出,则转至反向传播,将误差信号(理想输出与实际输出之差)按联接通路反向计算,由梯度下降法调整各层神经元的权值,使误差信号减小。

(1)前向传播:计算网络的输出。

隐层神经元的输入为所有输入的加权之和: (都是向量形式 比如i=1,2,3 j=1,2,3 x 3=w 13x 1+w 23x 2+w 33x 3) 隐层神经元的输出采用S 函数激发:

输出层神经元的输出: 网络输出与理想输出误差为:

误差性能指标函数为:

(2)反向传播:采用δ学习算法,调整各层间的权值。

根据梯度下降法,权值的学习算法如下: 输出层及隐层的连接权值学习算法为:

k+1时刻网络的权值为: 隐层及输入层连接权值学习算法为:

其中

=i

i

ij j

x w x j

x j j e x f x -+==11)('

2'

'')1()1(xj xj j j j j e e x x x x --+=-=∂∂∑

=j

j

j k x w x '

2)()()(k y k y k e n -=2

)(k e E 21

='222)()(j

j k j j x k e w x k e w E w ⋅⋅-=∂∂⋅⋅-=∂∂-=∆ηηη222)()1(j j j w t w t w ∆+=+ij n ij ij w y k e w E

w ∂∂⋅

⋅-=∂∂-=∆)(ηηi

j j j i j j j ij j j j j n ij n x x x w x x x w w x x x x y w y ⋅-⋅=⋅∂∂⋅=∂∂⋅∂∂⋅∂∂=∂∂)1(''2'

2''

k+1时刻网络的权值为:

如果考虑上次权值对本次权值变化的影响,需要加入动量因子

,此时的权值为:

其中, 为学习速率, 为动量因子。

仿真图如示:

ij

ij ij w k w k w ∆+=+)()1())

1()(()()1(22222--+∆+=+k w k w w k w k w j j j j j α))

1()(()()1(--+∆+=+k w k w w k w k w ij ij ij ij ij α[]

1,0∈η

[]

1,0∈α

ηαα

程序如示:

%BP identification

clear all;

close all;

xite=0.50;

alfa=0.05;

w2=rands(3,1);

w2_1=w2;w2_2=w2_1;

w1=rands(2,3);

w1_1=w1;w1_2=w1;

dw1=0*w1;

x=[0,0]';

u_1=0;

y_1=0;

I=[0,0,0]';

Iout=[0,0,0]';

FI=[0,0,0]';

ts=0.001;

for k=1:1:1000

time(k)=k*ts;

u(k)=0.50*sin(3*2*pi*k*ts);

y(k)=u_1^3+y_1/(1+y_1^2);

for j=1:1:3

I(j)=x'*w1(:,j);

Iout(j)=1/(1+exp(-I(j)));

end

yn(k)=w2'*Iout; % Output of NNI networks e(k)=y(k)-yn(k); % Error calculation

w2=w2_1+(xite*e(k))*Iout+alfa*(w2_1-w2_2);

for j=1:1:3

相关文档
最新文档