标准粒子群优化算法收敛性能分析与参数选择

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

标准粒子群优化算法收敛性能分析与参数选择1

林川,冯全源

西南交通大学信息科学与技术学院,成都(610031)

E-mail :lin_langai@

摘 要:基于离散时间线性动态系统理论,推导了确定性标准粒子群优化(PSO )算法收敛,临界稳定与发散的充分必要条件,并用若干个粒子运动轨迹的仿真结果对理论结果进行了验证。根据理论分析结果,给出了参数选择的指导方法,讨论了随机参数对PSO 算法性能的影响,分析了不同收敛阶段PSO 算法探索与开发能力的平衡问题。同时本文指出,目前较普遍认为的:PSO 算法的惯性权越小则局部搜索能力越强这一观点严格说来并不够准确,在实际中应小心使用。

关键词:粒子群,随机优化,收敛性,参数选择

中图分类号:TP18

粒子群优化(PSO )算法是J. Kennedy 与Eberhart 提出的一种基于群体智能的随机优化方法,它模拟了鸟类或鱼群觅食过程的社会行为[1],已在许多领域获得了广泛应用[2]。PSO 算法的参数设置对算法性能有很大的影响,而这些参数设置又常与待优化问题密切相关。虽然目前已有许多学者通过大量仿真实验对PSO 算法的参数选择进行了研究,但为了更深入地理解PSO 算法并提供参数选择的指导方法,近年来,一些学者开始对PSO 算法的粒子运

动轨迹及其稳定性进行深入的理论分析[3~7],

这些理论研究大部分集中在PSO 算法稳定收敛的充分条件方面。本文利用离散时间线性动态系统理论,从理论上推导了确定性PSO 算法收敛,临界稳定与发散的充分必要条件。根据理论分析结果,给出了PSO 算法参数选择的指导方法,讨论了随机参数对算法性能的影响,分析了PSO 算法获得成功的一些关键因素。本文指出目前较普遍认为的:惯性权越小则PSO 算法的局部搜索能力越强这一观点严格说来并不够准确,它只在一定条件下成立。同时,本文还给出了若干个粒子运动轨迹的仿真结果,对理论分析结果进行了验证。

1.PSO 算法

PSO 算法中的每个粒子代表D 维搜索空间中的一个潜在解,它在搜索空间以一定的速度飞行,这个速度根据它先前的飞行速度,本身及同伴的飞行经验进行动态调整。具体说来,标准PSO 算法中第i 个粒子第d 维的速度与位置按如下的表达式进行更新[8]:

()()()()()()()1(21t x p t t x p t t wv t v id gd d id id d id id −+−+=+φφ (1) )1()()1(++=+t v t x t x id id id (2)

其中,i =1,…, m , d =1,…., D ,m 为种群规模,D 维向量x i (t )与v i (t )分别为粒子i 在t 时刻的位置与速度,p i 为粒子i 曾经历过的个体最优位置,p g 为粒子i 的所有邻域个体曾经历过的全

局历史最优位置。w 为惯性权,)()(111t r c t d d =φ, )

()(222t r c t d d =φ,c 1,c 2为加速系数,r 1d ,r 2d 为在[0, 1]内均匀分布的随机数。

由于本文主要分析确定性PSO 算法的收敛性能,因此我们将随机变量)(1t d φ,)(2t d φ简化为常数1φ,2φ。为了便于分析,不失一般性,我们将粒子位置与速度的维数从D 维简化为1维[4]。这样,式(1)与式(2)可简化为: 1本课题得到国家自然科学基金(基金号:60371017)的资助。

))(())(()()1(21t x p t x p t wv t v g i −+−+=+φφ (3)

)1()()1(++=+t v t x t x (4)

令21φφφ+=,)/()(2121φφφφ++=g i p p p ,p t x t y −=)()(,并假设p 保持不变,则式(3)与(4)可化为:

)()()1(t y t wv t v φ−=+ (5)

)()1()()1(t y t wv t y φ−+=+ (6)

2.PSO 算法的收敛性能分析

令⎥⎦⎤⎢⎣⎡=)()()(t y t v t R ,⎥⎦

⎤⎢⎣⎡−−= 1 φφw w G 则式(5),(6)可表示成如下的向量形式: )(*)1(t R G t R =+ (7)

定义(平衡点[7]):*ξ定义为动态系统)),(()1(t t f t ξξ=+的平衡点,如果*ξ满足:对于所有0≥t ,都有)*,(*t f ξξ=。

注意到矩阵I G −对应的行列式值det (I G −)=φ,其中I 为单位矩阵。如果0≠φ,则式(7)表示的系统有唯一平衡点R *= [0, 0]T ,即v *=0, x *=p ,其中上标T 代表转置。如果φ=0,则式(7)具有无数个平衡点,其形式为[0, c ]T ,即v *=0, x *=c +p ,其中c 为任意常数。矩阵G 的特征方程为:0)1(2=+−+−w w λφλ (8)

解特征方程(8)可得到矩阵G 的特征值:

211∆+−+=φλw ,2

12∆−−+=φλw (9) 其中,w w 4)1(2−−+=∆φ。当0≠∆时,矩阵G 可对角化。定义酉矩阵U ,使得:

I U U UU H H ==,且Λ=GU U H ,其中⎥⎦⎤⎢⎣

⎡=Λ21 00 λλ。令)()(t UQ t R = (10) 则:||)(||||)(||t Q t R = (11)

其中,|| ||为范数符号,代表向量的长度。将式(10)代入式(7)可得:)()1(t Q t Q Λ=+ (12)

于是:)0( 00 )0()(2t 1Q Q t Q t t

⎥⎥⎦⎤⎢⎢⎣⎡=Λ=λλ (13) 如果∆=0,则λ1=λ2。我们可以证明在这种情况下矩阵G 无法对角化。此时,我们可定义

可逆矩阵T ,使得:J GT T =−1= ⎥⎦⎤⎢⎣

⎡11 01 λλ (14) 类似地,令R (t )=TS (t ) (15)

则:||S (t )||/|| T -1||≤||R (t )||≤|| T || ||S (t )|| (16)

将式(15)代入式(7)可得:S (t +1)=JS (t ) (17)

于是:)0( 0 t )0()(11-t 1t 1S S J t S t t

⎥⎥⎦⎤⎢⎢⎣⎡==λλλ (18) 由式(10~18),我们可以得到如下结论:

定理1:式(7)中的R (t )收敛到平衡点R*=[0, 0]T ,即v *=0, x *=p 的充分必要条件是

相关文档
最新文档