一个神经网络控制系统的稳定性判据的方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

摘要:本文讨论了基于李雅普诺夫方法分析神经网络控制系统的稳定性。首先,文章指出神经网络系统的动态可以由视为线性微分包含(LDI)的一类非线性系统表示。其次,对于这类非线性系统的稳定条件是推导并利用单神经系统和反馈神经网络控制系统的稳定性分析。此外,用图形方式显示非线性系统参数位置的这种参数区域表示方法(PR)提出了通过引入新的顶点和最小值的概念。从这些概念上可以推导出一个能有效地找到李雅普诺夫函数的重要理论。单个神经的神经系统的稳定性标准时由参数区域来决定的。最后,分析了包括神经网络设备和神经网络控制器为代表的神经网络控制系统的稳定性。

1.介绍

最近,已经有很多关于神经网络的自适应控制的研究,例如:在机器人领域,川户提出了一种使用的学习控制系统,控制系统的一项关键指标就是他的稳定性,然而分析像基于神经网络的控制系统这样的非线性系统的稳定性是非常难的。

Nguyen和Widrow 设计了一种在电脑上模拟卡车拖车的神经网络控制器。这个设计主要分为两大部分。第一部分是通过神经网络来学习设备的动态,这一部分被称为“仿真器”。第二部分是通过最小化的性能函数来计算出神经网络网络控制器的参数(权值)。但是,他们没有分析神经网络控制系统的稳定性。一项稳定性分析标准工具讲有利于神经网络控制应用到许多实际问题中。

最近,这类可被视为线性微分包含(LDI)的非线性系统的稳定条件已经被作者推导出来,再引用的[7][8]中讨论了。其中一项保证LDI稳定的充分条件与李雅普诺夫稳定性定理是相一致的。本文应用LDI的稳定条件和Nguyen与Widrow的方法来分析神经网络系统的稳定性。文中选取了一种代表神经网络状态的方法。此外,我们表明包含由近似于神经网络设备和神经网络控制器组成的神经网络反馈控制系统也可以分析神经网络是否能稳定。这意味着,本文提出的稳定条件可以分析神经网络反馈控制系统。本文的构成如下:第二节展示了一种文中的神经网络系统。第三节给出了LDI的稳定条件。第四节提出了一个以图形方式显示LDI参数的参数区域表示方法(PR)并推导出一个有效导出李雅普诺夫函数的重要定理。第五节阐述了神经网络系统的LDI表示方法。第六节介绍了用PR方法表示单神经系统和神经网络反馈系统的稳定标准。

2.神经控制系统

假设一个神经网络函数是

x(k + I) =P( x ( k )u, (k)),

他的神经网络反馈控制系统的函数是:x(k + 1) = P(x(k),u(k)) 和

u(k) = C(x(k)),其中x(k)是实属范围内的状态向量,u(k)是实属范围内的输入向量。P和C分别表示神经网络设备和神经网络控制器的非线性传递函数。如图1,显示了一个单一的神经网络系统和神经网络反馈控制系统。假设每个神经元的输出函数f ( u )都是可微分的,在k > 0的情况下,我们可以得到:f ( 0 ) = 0,

f(v)∈[-k,k],对于所有的v都成立

此外,假设所有的传递权重都已经被学习方法所确定了,例如反向传播神经网络在神经网络控制稳定性分析之前。在一个单一的神经网络系统中,因为我们分析神经网络系统的动态平衡稳定性,所以设定. u(k) = 0。

图1.神经网络:(a )单一神经网络,(b )反馈神经网络

3.一类非线性系统的稳定条件

让我们分析以下这类非线性系统

1x(k + 1) = ((k))x(k),

((k))=(())r

i i i h k =∑A z A z z A (1)

其中r 是一个正实数,在z (k )是一个向量,同时:

T

12()[n x k x k x k x k =(),(),…,()],

1()~()n x k x k 是状态变量。 1

(())((k))=1.r

i i i h z k h z =≥0, ∑

注3.1:像公式(1)代表的这类非线性系统我们可以把它看做LDI 。大多数情况,对于

LDI 的特性,我们可以用代替(())i h z k ,因此我们后面用()i h k ()i h k 来表示。这类系统还包含了在模糊控制领域中流行的Takagi 和Sugeno 的模型,所以下面的稳定性条件 讨论也适用于模糊控制。

下面给出了一个满足公示(1)的稳定条件。 定理3.1:公式(1)描述的LDI 的稳定平衡在大范围内渐进稳定的条件是存在一个通用正定矩阵满足:

A P T i i -

对于i=1,2,···,r 成立。

这个定理简化了李雅普诺夫稳定性定理对于r=1是的线性离散系统的情况。当然,定理3.1给出了一个是公式(1)的系统稳定的

充分条件。我们可以直观的认为当所有的

i A 都是稳定矩阵,公式(1)的系统是全局

稳定的。但是,一般情况下这是不正确的,因为公式(1)的系统不总是大范围渐进稳定的,即使所有的i A 都是稳定矩阵。 为了使公式(1)代表的系统稳定,我们必须找到一个通用矩阵P 满足

A P T

i

i -

对于所有的 i 都成立。通过研究我们已经可以找到这样的通用正定

矩阵P 。接下来,我们就要给出这个满足公式(2)的正定矩阵P 存在的必要条件。 定理3.2;假设存在一个稳定矩阵矩阵i A ,其中i=1,2,···,r 。存在一个正定矩阵P 使得

A P T i i -

i A A j为稳定矩阵,其中i ,j=1,2,···,r ,。

反过来,这个定理说明:只要i A A j中存一个不是稳定矩阵,就不存在满足公示(2)的矩阵P 。

4. 参数区域表示方法(PR )

我们提出对于公示(1)系统的PR 的概念。PR 可以通过图表显示出LDI 的参数。下面是两个例子。

例4.1: 让我们分析下面的LDI (LDI-1)

3

1

(1)()()

i i i k h k x k =+=∑x A

其中:

3

1T 123()1,

0.10.10.30.10.10.3101010()()[()(1)],

,,i i i h h k k k x k x k ==≥0,=-⎛⎫⎛⎫⎛⎫=== ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭∑x A A A .

这个LDI 系统也可以表示为:

∑=-+=+3

1

)}1()(){()1(i i i i k x b k x a k h k x

其中:a1 = 0.1,bl = 0.1, a2 = 0.3,b2 = 0.1, a3 = 0.1,b3 = 0.3.

图2显示了LDI 的参数区域数值,其中其中点1,2,3分别代表了321A A A ,, 例4.2:让我们假设另一个LDI 系统LDI-2,

∑==+5

1

)()()1(x i i k k h k x A i ,其中:

,0115.015.0,012.02.0,013.01.0,011.03.0,011.01.0)],

1()([)(,

1)(,0)(54325

1

⎥⎦

⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=⎥⎦

⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=-==≥∑=A A A A A x 1T k x k x k k h k h i i i

相似的,LSI 可以等效为:

∑=-+=+5

1

)}1()(){()1(i i i i k x b k x a k h k x ,

此时:a1= 0.1, bl = 0.1, a2 = 0.3, b2 = 0.1, a3 = 0.1, b3 = 0.3, a4 = 0.2, b4 = 0.2, a5 = 0.15, b5 = 0.15.

这个LDI 系统的区域参数表示如图3所示。 我们发现,尽管图2和图3中区域参数的区域是相同的的,但是LDI-1和LDI-2区域参数是不同的。在图2中,每个点正好对应一个顶点。但是在图3中,点1,2,3构成了参数区域,而点4,5包含在区域内。 注解4.1: 在2*2的矩阵A 中,PR 一般是四维的,因为在每个这样的矩阵中都有四个要素,例如:

⎥⎦

⎤⎢

⎣⎡=i i i i

d c b a i A

相关文档
最新文档