单神经元自适应控制

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
单神经元自适应控制器的设计
研究目的:
神经网络具有自适应和自学习能力,单神经元的权值系数可以进行在 线的修正,通过不断的调整权值系数从使其达到最优值,以达到改善控制 系统的控制性能的目的。 本文通过对单神经元自适应PID控制器作了仿真研究,观其神经网络 对PID控制的优点和神经网络控制的自适应特点。
单神经元自适应PID控制器的仿真与研究
10 G ( s) 选取传递函数: 0.5s 2 2s 20
采样时间ts=1s,采用Z变换经过离散化,经过z变换后的离散化对象为:
y(k ) 1.26y(k 1) 0.3963y(k 2) 0.1179 u(k 4) 0.0866 u(k 5)
error(k)=rin(k)-yout(k); %输出信号误差 error(k)=rin(k)-yout(k); 无监督学习规律% wkp(k)=wkp_1+xiteP*u_1*x(1);%P权值阈值的更新 wki(k)=wki_1+xiteI*u_1*x(2);%I wkd(k)=wkd_1+xiteD*u_1*x(3);%D 有监督学习规律% wkp(k)=wkp_1+xiteP*error(k)*u_1*x(1);%P wki(k)=wki_1+xiteI*error(k)*u_1*x(2);%1 wkd(k)=wkd_1+xiteD*error(k)*u_1*x(3);%D
式中,t:第t次调整权值,η学习速率,0<η<=1,用于控制权值调整速度 5)若 y p (t ) d p ,学习结束,否则返回(3)。
学习结束后网络将样本模式以连接权和阈值的形式分布记忆储存于网络中。
神经网络的学习规则
学习规则是修正神经元之间的连接强度或加权系数的算法,使获得的知识结构适应 周围环境的变化,学习过程由学习期和工作期两部分组成。学习规则可以分为:无 监督学习和有监督学习。 有监督学习就是要求同时给出输入和正确的期望输出模式对,通过外部教师信号进 行学习,当实际输出结果与期望输出有误差时,网络通过自动调节机制调节相应的 连接强度,使之向减少误差的方向改变,经过多次重复训练,最后与正确的结果相 符合。 无监督学习,则不需要外部教师信号,因此不能确切知道正确的反响是什么,学习 表现为自适应于输入空间的检测规则。
无监督hebb学习规律的阶跃跟踪曲线
有监督hebb学习规律的阶跃跟踪曲线
常用的阶跃响应跟随性能指标有上升时间、超调量、调节时间、下面将从 这三方面来分析各种不同学习规律的控制下系统的跟随性能指标,见下表:
由以上的各种算法对阶跃信号跟踪的仿真结果和仿真分析可以看出,单 神经网络自适应PID控制器的控制性能得到明显的改善,在上升时间、超调 量、调节时间方面都表现出较好的控制性能。
比较增量式算法和单神经元控制算法,两者的不同之处是,单神经元的控 制算法中的权系数 wi (k ) 可以通过自学习功能进行自适应调整,而增量式PID K D 系数都是预先确定好的,并且不会改变。 的 K p 、K I 、 单神经元自适应PID控制器正是通过对加权系数的调整来实现自适应、自学 习功能的。加权系数的调整可以采用不同的学习规则,从而构成不同的控 制算法。
u p (u0 p , u1 p ,unp )
d p 1(u p A)
d p 1(u p B)
其中的 百度文库0 p 1
3)则感知器的输出为:
y p (t ) f ( w j (t )u jp )
j 0 n
4)权值调整
wj (t 1) wj (t ) [d p y p (t )]u jp
有监督的Hebb学习规则: 将无规则的Hebb的学习与有监督的Delta学习规则两者结合起来就构成有监督 学习的Hebb学习规则。其式如下:
wij (d j (k ) o j (k ))o j (k )oi (k )
采用Hebb学习和监督学习相结合的策略,使神经元通过关联搜索对未知的外 界作出反应,即在教师信号 (d j (k ) o j (k )) 的指导下对环境信息进行相关 的学习好自组织。是相应的输出增强或减弱。
神经网络的理论基础:
单层感知器如左图:
感知器的输出:
y f ( w j u j ) f ( w j u j )
j 0 j 1 n n
式中的 u j 是感知器的第j个输入, u0 0, w0 (阈值) 单层感知的值权可以通过学习进行调整,学习采用有教师的算法,算法步骤如下: 1)设定权系初值 wj (0)( j 0,1,2n)为较小的随机非零值。 2)给定输入/输出样本对,即教师信号up/dp(p=1,2,...L)。
仿真结果:
在对普通的PID仿真中,取kp=0.08,ki=0.001,kd=0.10,采样时间ts=1ms。
普通PID对阶跃信号的追踪
在对单神经元自适应PID控制器的仿真中,初始权值取wp=wi=wd=0.10,学习率ηP=0.40, ηI=0.35,ηD=0.40,K= 0.06,采样时间ts=1ms。
选用单神经元自适应PID控制器的三种不同权值学习规则,用Matlab语言 编写单神经元自适应PID的控制算法,并进行matlab仿真,观察单神经元 自适应PID控制器对阶跃信号的跟踪情况以及对外部对象发生变化时的适 应性。
主要程序代码: xiteP=0.40; %学习率 xiteI=0.35; xiteD=0.40; wkp_1=0.10; %控制器的加权系数 wki_1=0.10; wkd_1=0.10; error_1=0; error_2=0; y_1=0;y_2=0;y_3=0; u_1=0;u_2=0;u_3=0;u_4=0;u_5=0; ts=0.001; for k=1:1:500 time(k)=k*ts; rin(k)=1.2; yout(k)=1.26*y_1-0.3963*y_2+0.1179*u_4+0.086*u_5;
相关文档
最新文档