关于学习神经网络监督(学习)控制的一点心得
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于学习神经网络监督(学习)控制的一点心得
神经网络控制是一种基本上不依赖于精确数学模型的先进控制方法,比较适用于那些具有不确定性或高度非线性的控制对象,并具有较强的适应和学习能力。[1]
人工神经元网络是在生物神经元模型基础上发展而来的。生物神经元模型的基本组成单元是单个的神经元,它有着接受、传导信息的功能。其中最重要的一点是生物神经元能接受多个神经元传递的信息,并能将其往下传递给多个神经元。根据其特点抽象出的最典型的人工神经元模型如下图所示:
从图中易知其数学模型为:
∑∑===-=n
i i ji j n i i ji j x w f x w f y 01)()(θ ,( 100-==j j w x ,θ)
式中,j θ是阈值, ji w 是连接权系数;f (·)为输出变换函数。
人工神经网络是由多个人工神经元组成,每个神经元有多个输入连接通路,但只有一个单一的输出,但是它可以连接到很多其他的神经元。经过多个神经元的串、并连接,就可以构成神经网络。依据神经元的图形模型和数学模型可以知道神经网络具有如下性质:
1) 对于每个节点有一个状态变量j x ;
2) 节点i 到节点 j 有一个连接权系数ji w ;
3) 对于每一个节点有一个阈值j θ;
4) 对于每个节点定义一个变换函数f j [x i ,w ji ,j θ( i ≠j )]。[1]
单个神经元的输出乘以连接权系数即是下一个神经元的输入。对于一个神经网络,当确定了各节点的输出变换函数后,连接权值将作为变量,神经网络的学习功能旨在通过调整连接权值以达到给定输入下得到目标输出的目的,但实际情况只能是接近目标输出。
神经网络的学习基本方式如下:通过给定的输入得到实际输出值,然后记录到目标输出与实际输出的差值,想减小综合差值的方向调整连接权值,这样依次进行下去,最后得到一组最优的连接权集合。当神经网络的节点越多,其能识别的模式也越多,但训练的运算量也相应的增加,这就对训练样本的选择提出更高的要求。
神经元网络监督控制系统的基本系统框图如下:
神经网络监督控制系统在传统的控制器的基础上,增加了神经网络控制器,采用的是前馈。
设控制器的传递函数为C(s)(已知),被控对象的传递函数为F(s)(未知),神经网络控制器的传递函数为N(s)(动态变化)。根据框图可建立如下数学关系式:
E(s)=R(s)·Y(s), U 1(s)= E(s)·C(s),
U 2(s)=R(s)·N(s),U(s)=U 1(s)+U 2(s),
Y(s)=U(s)·F(s),
通过以上等式可得)
()(1)]()(1)[()(s F s C s F s N s R s E ⋅+⋅-=,要使)(s E 趋近于零,则0)()(1=⋅-s F s N ,得)()(1s F s N -=,故神经网络控制器建立的是被控对象的逆模型。若反馈通道的传递函数是)(s H ,则易得)()()(11s H s F s N --⋅=。
神经网络控制器通过向传统控制器的输出u 1(t)进行学习,不断地调整连接权值使u 1(t)趋向于零,然后接替传统控制器起到主导作用,即u(t )≈u 1(t)。对于PID 参数不容易整定的情况,用神经网络监督控制会得到较好的控制效果。虽然此时神经网络控制器起主导作用,但是反馈通道和传统控制器不能移除,在系统出现干扰时,需要反馈控制器进行调节,以减小误差。神经网络监督控制即采用这种前馈加反馈的监督控制方法,一是由于传统反馈控制器的作用可以确保系统的稳定性和鲁棒性,二是由于神经网络监督控制器的作用可以有效地提高系统的精度和自适应能力。
[1]. 于海生,计算机控制技术, 机械工业出版社,2007
[2]. 百度百科
2009年12月31日